Hi,
wir hatten kürzlich einige VMs mit jeweils 5-10 Snapshots, die auf einem Datastore zu I/O-Latenzen im Sekunden-Bereich geführt hatten. Nach Konsolidieren der Snapshots war alles wieder gut. An der Aktion war ein einziger ESX beteiligt, dedizierter Datastore, kein Cluster.
Jetzt stellt sich mir die Frage: Gibt ESX irgendwelche Metriken her, die auf Snapshot-verursachte Probleme hindeuten koennten? Also z.B. I/O Time %, die mit Warten auf SCSI-Locks verbracht wird? Oder auch schon sowas wie SCSI-Locks / s? Oder Aehnliches, was durch Snapshots an I/O-Overhead generiert wird? Mir fiels schwer zu glauben, das ein paar wenige Snapshots zu solch massiven Problemen fuehrten und wuerde in Zukunft gerne besser den Finger auf die Fehler-Ursache legen koennen, wenn mir I/O-Latenz-Zeiten jenseits von Gut und Boese entgegenlaecheln.
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
Snapshot-induzierte Latenzen beziffern?
-
irix
- King of the Hill
- Beiträge: 13063
- Registriert: 02.08.2008, 15:06
- Wohnort: Hannover/Wuerzburg
- Kontaktdaten:
Die Frage ob die gesteigerten Latenzen nicht mit SCSI Reserverations zutun hatten. Wenn eine VM aktive Snaps hat dann wachsen die ja unter umstaenden kontinuierlich. Immer wenn sich eine VMDK aber vergroessert wird auch der Metadatenblock aktualisiert und das darf dann auch nur immer ein ESX Host zu gleichen Zeit und alle anderen muessen halt warten.
Gruss
Joerg
Gruss
Joerg
Naja, jetzt wo du es sagst: Im konkreten Fall ging es um einen einzigen ESX Host, also sollten die SCSI-Reservations ja nicht mal das eigentliche Problem gewesen sein. Hab die eigentliche Frage mal umbetitelt (Snapshot-induzierte Latenzen beziffern?) und in Richtung Fragestellung "Snapshot I/O-Overhead" ergaenzt.
-
Dayworker
- King of the Hill
- Beiträge: 13657
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
Wenn du eine VM mit vielen Snapshots hast, steigt der Verwaltungsaufwand dafür logischerweise auch an, das Delta-Log will halt auch geschrieben werden und je nach IO-Leistung von SAN oder Raid-Adapter macht sich das vielleicht in einem kleinen Hickup bemerkbar.
Deshalb lautet der allgemeine Rat zu Snapshots auch immer gleich. Sie sind nur ein Mittel um ein Backup ziehen zu können, ersetzen dabei jedoch keinesfalls ein Backup und sollten in jedem Fall immer nur kurzzeitig zum Einsatz kommen. Sie bremsen die IO-Leistung in der VM und viel schwerwiegender, Größenänderung einer vDisk mit Snapshots war/ist immer mit jeder Menge Ärger verbunden.
Deshalb lautet der allgemeine Rat zu Snapshots auch immer gleich. Sie sind nur ein Mittel um ein Backup ziehen zu können, ersetzen dabei jedoch keinesfalls ein Backup und sollten in jedem Fall immer nur kurzzeitig zum Einsatz kommen. Sie bremsen die IO-Leistung in der VM und viel schwerwiegender, Größenänderung einer vDisk mit Snapshots war/ist immer mit jeder Menge Ärger verbunden.
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste