Hallo alle!
Ich habe ein Projekt, wo die Verfügbarkeit von VM's erhöht werden soll. 2 Server (mit Win2003) exisitieren bereits, jeder Server ist in kapazitätsmässig in der Lage, alle benötigten VM's zu hosten. Ein kurze Downtime von VM's ist zulässig, bei längeren geplanten oder ungeplanten Serverausfällen sollen die VM's auf dem anderen Server gestartet werden können. "Single Points of Failure" sollen weitestgehend vermieden werden.
1. Ansatz: Mirroring über's Netz
Dazu fällt mir DoubleTake oder Legato Replistor ein. Damit könnte man die VM-Dateien im laufenden Betrieb auf den 2. Server duplizieren. Bei Ausfall oder Abschaltung des 1. Servers könnten die VM's sofort auf dem 2. Server gestartet werden. Unklar ist:
- Was passiert nach Wiedereinschaltung des 2. Servers?
- Was passiert, wenn die beiden Server normal arbeiten, aber das Netz eine zeitlang ausfällt?
- Ist der Start der VM's auf dem 2. Server automatisierbar?
- Ist die Geschwindigkeit über's Netz auch bei hoher Plattenaktivität ausreichend?
2. Ansatz: verteiltes Raid
Die Idee ist ein Hardware-Raid, wobei sich die gespiegelte Festplatte im 2. Server befindet. Bei Ausfall des 1. Servers wird die Spiegelplatte im 2. Server in Betrieb genommen und die darauf befindlichen VM's gestartet. Mit NAS wäre so etwas machbar, aber mir ist keine Hardware für die von mir angedachte "kleine Lösung" bekannt, wo die in den Servern eingebauten Festplatten verwendet werden sollen.
Manche Raidcontroller können zwar auch mit "fremden" Festplatten aus anderen Raid-Sets umgehen, und auch hot swap gibt es, was fehlt wäre ein Festplattenumschalter und die nötige Software dazu...
Bleibt noch zu erwähnen, dass das ganze "symmetrisch" werden soll, d.h. beide Server sollen gleichwertig sein, ein Übergang soll in beide Richtungen möglich sein.
Gibt es irgendwelche weiterführenden Ideen dazu? Oder auch ganz andere Lösungen?
fragt
GuBo
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
Erhöhte Verfügbarkeit, verteiltes Raid?
Hallo gerhardg!
Du hast natürlich recht, aber dann sind wir wieder bei einer "grossen Lösung" mit grossem Geld, grossem Lärm und grossem Stromverbrauch....
Was ich noch nicht erwähnt habe: Die beiden vorhandenen Server sind auf low Power getrimmt (je 2 Xeon LV + je 2 Festplatten) und kommen mit je 80W (gemessene Leistungsaufnahme) aus. Daran sollte sich nicht viel ändern!
viele Grüsse
GuBo
Du hast natürlich recht, aber dann sind wir wieder bei einer "grossen Lösung" mit grossem Geld, grossem Lärm und grossem Stromverbrauch....
Was ich noch nicht erwähnt habe: Die beiden vorhandenen Server sind auf low Power getrimmt (je 2 Xeon LV + je 2 Festplatten) und kommen mit je 80W (gemessene Leistungsaufnahme) aus. Daran sollte sich nicht viel ändern!
viele Grüsse
GuBo
- Tschoergez
- Moderator
- Beiträge: 3476
- Registriert: 23.02.2005, 09:14
- Wohnort: Burgberg im Allgäu
- Kontaktdaten:
Hi,
zum den Fragen zum 1. Ansatz gibts von VMwaretechnisch nicht viel zu sagen, denn das wird eigentlich alles von den jeweiligen Produkten geregelt. Evtl. da mal Whitepaper bzw. Doku suchen.
Achja, das gilt natürlich, wenn die Replikationssoftware innerhalb der VMs installiert werden soll.
Wenn die Repl.SW auf dem Host installiert wird, muss sie dafür sorgen, dass die VMs gestartet werden, das geht auch über Kommandozeilenbefehle (die man dann wahrscheinlich irgendwo in die Failover-Konfig einträgt).
Failback muss auch die Repl.Software verwalten.
Anstatt des 2. Ansatzes gibts noch ne andere Variante:
Ein Shared Storage zu verwenden, z.B. also eine NAS-Kiste, die per NFS oder iSCSI oder ähnlichem angebunden ist.
Dann liegen die VMs im NAS unabhängig von den Servern, und man kann sie flexibel auf beiden Servern starten. Geht halt nur in einer Lokation und erfordert einiges an Skripting-Aufwand.
Viele Grüße,
Jörg
zum den Fragen zum 1. Ansatz gibts von VMwaretechnisch nicht viel zu sagen, denn das wird eigentlich alles von den jeweiligen Produkten geregelt. Evtl. da mal Whitepaper bzw. Doku suchen.
Achja, das gilt natürlich, wenn die Replikationssoftware innerhalb der VMs installiert werden soll.
Wenn die Repl.SW auf dem Host installiert wird, muss sie dafür sorgen, dass die VMs gestartet werden, das geht auch über Kommandozeilenbefehle (die man dann wahrscheinlich irgendwo in die Failover-Konfig einträgt).
Failback muss auch die Repl.Software verwalten.
Anstatt des 2. Ansatzes gibts noch ne andere Variante:
Ein Shared Storage zu verwenden, z.B. also eine NAS-Kiste, die per NFS oder iSCSI oder ähnlichem angebunden ist.
Dann liegen die VMs im NAS unabhängig von den Servern, und man kann sie flexibel auf beiden Servern starten. Geht halt nur in einer Lokation und erfordert einiges an Skripting-Aufwand.
Viele Grüße,
Jörg
ich habe den einsatz von legato mit vmware probiert. eines der größten probleme liegt im cache verhalten beider produkte. vmware lagert viele i/o infos erstmal in den ram, diese landen also nicht in der vmdk am 2ten server.
schon bei den tests kam es bei einfachen problemen (strom weg,..) zu totalausfällen einzelner vm´s.
mit 2 platten pro system wirst du auf jeden fall nicht glücklich werden. die mirror software muss für jede aktion warten bis der andere knoten sein ok gibt, ohne ein wirklich schnelles raid mit +4 platten bricht die performance komplett ein.
schon bei den tests kam es bei einfachen problemen (strom weg,..) zu totalausfällen einzelner vm´s.
mit 2 platten pro system wirst du auf jeden fall nicht glücklich werden. die mirror software muss für jede aktion warten bis der andere knoten sein ok gibt, ohne ein wirklich schnelles raid mit +4 platten bricht die performance komplett ein.
Hallo gerhardg!
Das ist sicher so, das ist aber dann auch ein grundsätzliches Problem in VMware, denn wenn zu viel gecached wird und noch nicht alles geschrieben ist, wenn der Strom ausfällt, dann ist ja die VM auch am gleichen Server u.U. beschädigt!
Nach meinen Erfahrungen sind die VM's nach Stromausfall oder Server-Crash fast immer weiterhin startbar und einsatzfähig, aber genau aus diesem Grund gehe ich lieber auf Nummer sicher und gehe in solchen (seltenen) Fällen immer auf den letzten Snapshot zurück oder spiele eine Sicherungskopie der VM's ein.
Ja, das könnte ein Problem werden, daran habe ich auch schon gedacht. Es gäbe auch noch die Möglichkeit der asynchronen Replikation, wo im Crash-Fall aber noch mehr Schreibvorgänge fehlen könnten.
Man muss aber auch bedenken, dass ungeplante Ausfälle (HW-Fehler, Crash, Stromausfall) nur sehr selten vorkommen, nach meinen Erfahrungen handelt es sich in den allermeisten Fällen um Abschaltungen wegen HW- oder SW-Wartung! Und beim geordneten Niederfahren sollte es ja keine Probleme mit Caching geben.
viele Grüsse
GuBo
PS an Tschoergez:
Ich habe an Replikation am Host gedacht, denn im Bedarfsfall soll die VMDK am 2. Server sofort zur Verfügung stehen!
ich habe den einsatz von legato mit vmware probiert. eines der größten probleme liegt im cache verhalten beider produkte. vmware lagert viele i/o infos erstmal in den ram, diese landen also nicht in der vmdk am 2ten server.
Das ist sicher so, das ist aber dann auch ein grundsätzliches Problem in VMware, denn wenn zu viel gecached wird und noch nicht alles geschrieben ist, wenn der Strom ausfällt, dann ist ja die VM auch am gleichen Server u.U. beschädigt!
Nach meinen Erfahrungen sind die VM's nach Stromausfall oder Server-Crash fast immer weiterhin startbar und einsatzfähig, aber genau aus diesem Grund gehe ich lieber auf Nummer sicher und gehe in solchen (seltenen) Fällen immer auf den letzten Snapshot zurück oder spiele eine Sicherungskopie der VM's ein.
mit 2 platten pro system wirst du auf jeden fall nicht glücklich werden. die mirror software muss für jede aktion warten bis der andere knoten sein ok gibt, ohne ein wirklich schnelles raid mit +4 platten bricht die performance komplett ein.
Ja, das könnte ein Problem werden, daran habe ich auch schon gedacht. Es gäbe auch noch die Möglichkeit der asynchronen Replikation, wo im Crash-Fall aber noch mehr Schreibvorgänge fehlen könnten.
Man muss aber auch bedenken, dass ungeplante Ausfälle (HW-Fehler, Crash, Stromausfall) nur sehr selten vorkommen, nach meinen Erfahrungen handelt es sich in den allermeisten Fällen um Abschaltungen wegen HW- oder SW-Wartung! Und beim geordneten Niederfahren sollte es ja keine Probleme mit Caching geben.
viele Grüsse
GuBo
PS an Tschoergez:
Ich habe an Replikation am Host gedacht, denn im Bedarfsfall soll die VMDK am 2. Server sofort zur Verfügung stehen!
Zurück zu „VMserver 1 und GSX“
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste