Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Server bei Snapshot nicht erreichbar

Hilfe bei Problemen mit Installation & Benutzung des VMware ESX/ESXi Server 3.

Moderatoren: Dayworker, irix

Member
Beiträge: 12
Registriert: 19.01.2010, 13:37

Server bei Snapshot nicht erreichbar

Beitragvon DerMatze » 19.01.2010, 13:44

Hallo zusammen!

Ich habe die Suchfunktion bemüht, die konnte mir aber nicht helfen :-(

Mein Problem: Wenn ich ein Snapshot einer virtuellen Maschine erstelle ist alles prima und die Umgebung arbeitet wie gewollt. Wenn ich diesen Snapshot aber später entferne, ist diese virtuelle Maschine während des Snapshot-entfernens weder im Netzwerk noch per Konsole erreichbar.
Dies dauert etwa 10 Sekunden bis zu mehrere Minuten, sobald im Statusfenster steht: "Snapshot entfernen 100%" ist der Rechner wieder verfügbar.

Umgebung: Aktuelle Hardware mit ESX 3.5 U4 Server und SAN. Die virtuelle Maschine ist Windows 2003 mit etwa 300GB an Daten.

Hat wer eine Idee woran das liegen könnte? Danke euch!

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 19.01.2010, 22:44

wie groß ist denn der Snapshot bzw. wie viele Daten ändern sich während des Snapshot commitens?

Denn ist ist by-design so, dass die VM einfriert, wenn der letzte Snapshot committet wird. Das lässt sich nicht verändern, geht nur bei ESX 4 etwas schneller.... Darum solltest Du darauf achten, dass die Snapshots nicht zu groß werden, und die VM beim committen möglichst wenig unter Last steht.

viele grüße,
jörg

Member
Beiträge: 12
Registriert: 19.01.2010, 13:37

Beitragvon DerMatze » 20.01.2010, 16:43

Jaaaa.... Zwischen Snapshot und Snapshot entfernen liegen schon einige Gigabytes zwischen. Z.B. wird der Server während dieser Zeit durch Arcserve gesichert, und der ändert ja das Archiv-Bit....

Ich wusste nicht, dass das by-design ist. Aber das erklärts. Vielen Dank!

ich werde den Prozess dann mal in die Nacht verlegen.

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 21.01.2010, 00:04

Ah, wunderbar! Endlich mal ein Beispiel aus der Praxis, das dieses (sonst eher theoretische) Verhalten zeigt.
Könntest Du bitte für die Zukunft nochmal kurz beschreiben, welche Aktionen und Prozesse wann genau bei Dir ablaufen (oder abliefen), die zu dem Verhalten geführt haben?

Dann haben wir einen schönen "Referenz"-Thread für solche Probleme :-)

Viele Grüße,
Jörg

Member
Beiträge: 12
Registriert: 19.01.2010, 13:37

Beitragvon DerMatze » 21.01.2010, 09:52

Mach ich doch gerne.

Ich schreib einfach mal alles etwas planlos zusammen, sortieren für die Nachwelt kannst Du bei Bedarf gerne machen:

Host System: Dell, 3x ESX Server 3.5 voll gepatcht mit aktueller Hardware und jeweils 64GB Ram und per LWL angeschlossenem SAN

Gäste: etwa 40 Windows Server 2003, davon 3 Server mit mehr als 100 GB Nutzdaten.

Sicherung: Arcserve und VRanger.

Nun der Ablauf:
Die virtuellen Rechner werden per VRanger täglich gesichert. Dies geschieht über den Tag verteilt von etwa 05:00 bis 23:00 und dauert zwischen 5 Minuten und 4 Stunden.

Die Datensicherung per Arcserve fängt um 20:00 an. Bis vor kurzem war alles i.o., dann wurde aber die Arcserve-Datensicherung umgestellt, und ein Server, der etwa 300 GB an Nutzdaten hat, wurde nun zeitgleich per VRanger (Start 19:00) und zusätzlich per Arcserve (Start etwa 20:00) gesichert.

Nun erstellt VRanger zur Sicherung dieses Server standardmäßig um 19:00 einen Snapshot und sichert seine Containerdatei dann auf einen physikalischen Server. Dann wird der Server aber gegen 20:00 zusätzlich per Arcserve-Agenten gesichert, welcher bei allen gesicherten Dateien (300GB) das Archivbit ändert.
Diese Änderungen wandern natürlich alle in das durch VRanger erstellte Snapshot und bläht dieses auf über 100 GB auf.
Irgendwann gegen Morgen (das dauert so lange weil VRanger und Arcserve sich wohl gegenseitig ausbremsen) ist die Datensicherung von VRanger dann zu Ende und der Snapshot wird entfernt. Dieser Vorgang dauert je nach Tagesform zwischen 15 Minuten und (Spitzenwert) 45 Minuten. Während dieser Zeit ist der Server weder im Netzwerk noch auf der Konsole zu erreichen.

Nachdem ich hier erfahren habe, dass das by-design so ist und die Ausfallzeit auf die Größe des Snapshots zurückzuführen ist, habe ich die Datensicherung nochmals umgestellt, so dass VRanger und Arcserve sich nicht beharken und nun scheint die Ausfallzeit des Servers wieder in einem Maß zu liegen, dass die Windowsclients das nicht anmeckern oder bemerken.

Mit ein wenig Nachdenken kann man auch drauf kommen, dass zwei gleichzeitige Sicherungen nicht gut laufen, aber da es für VRanger und Datensicherung verschiedene Admins gibt....... :grin:

PS: Mein Ursprungspost war etwas vereinfacht, damit man ihn besser versteht. In der Sache aber gleich.
PPS: Ich habe in diesem Zuge auch den Zeitpunkt der Volumenschattenkopie-Zeit aus der Zeit der Sicherung verlegt. Ob das was hilft kann ich aber nicht sagen.

Danke nochmal und Gruß
Matthias

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 21.01.2010, 19:06

Na, das ist doch mal eine super Beschreibung, um das Verhalten nachvollziehen zu können!
Vielen Dank dafür, hoffentlich hilfts einigen Leuten in der Zukunft :-)!
Viele grüße,
Jörg


Zurück zu „ESX 3 & ESXi 3“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste