ich habe hier schon etwas über unsere Probleme geschrieben.
http://vmware-forum.de/viewtopic.php?p=160567#160567
Es gibt folgendes Konstrukt.
- vSphere 5.1 Cluster mit 16 Hosts und ~300 VMs (ein Cl mit 8 Hosts, der andere mit 4)
- 2 TB Datastores
- SIOC war aktiv, wurde jetzt aber deaktiviert
- DiskMaxIOSize wurde vom Default 128KB auf 32KB verkleinert -> kein Unterschied
- IBM Flex System mit x240 Nodes, 2 Chassis verteilt auf 2 RZs. Aktuell ~400m Abstand auf dem gleichen Campus, später ca. 10 Km.
- FC Anbindung an SAN Directoren
- EMC VPLEX als syn. Spiegel, 2 HP EVA HSV360 mit jeweils 150 x 900GB SAS
- fixed path policy, die Pfade wurden mit einen Skript von EMC gesetzt, so dass die Hosts auf einer Seite über die lokalen Controller gehen (Ergebnis wurde überprüft und passt)
- uniform access der Hosts auf die VPLEX distributed vVOLs
- wegen uniform access kein gesonderten DRS / Affinity Regeln, welche die VMs an eine Seite binden (aktuell stehen die beiden Cluster Seiten ja fast nebeneinander)
Wir sehen immer wieder hohe Latenzen, bzw. nicht die IOPS die wir erwarten würden. Teilweise scheint auf dem Storage kaum etwas los zu sein, trotzdem zeigen VMs deutlich schlechtere Performance als VMs in anderen Clustern.
Ein einfacher Test mit bei dem man die Probleme sieht, ist eine W2K8 Installation über das Windows Deployment Toolkit. Dabei werden Daten vom Deployment Server auf die VM kopiert. Dies dauert in allen anderen Clustern ohne VPLEX um die 2 Min. Wenn die VPLEX dazwischen hängt, geht die Zeit für diesen Vorgang auf ~10Min. hoch. Teste ich das gleiche auf LUNs die direkt von den EVAs kommen die der VPLEX als backend storage dienen, sehe ich das Verhalten nicht. Mit unterschiedlichen Iometer Tests kann ich den Unterschied aber nicht reproduzieren.
Die Tests wurden auf LUNs hinter der VPLEX, nur EVA LUNs und P9000 LUNs + VPLEX gemacht. Man sieht natürlich deutlich, dass die P9000 eine ganz andere Liga ist und die Werte der EVA mit oder ohne VPLEX deutlich darunter liegen.
Ich werde versuchen einige Daten mit vscsistats zu sammeln, wobei ich das Tool bisher nicht so gut kenne und mir die Auswertung der Daten noch nicht klar ist. Ich hoffe https://communities.vmware.com/docs/DOC-10095 bringt da etwas Licht rein.

