Seite 1 von 1

unfreiwilliger Crashtest

Verfasst: 15.10.2013, 21:05
von weigeltchen
Heute morgen der worst case eingetreten. Fehler in der Stromversorgung, trotz USV und nachgeschaltetem Notstromdiesel, führte zum harten abschalten zweier Host im Cluster inklusive SAN und Switche. Das neben der VMare-Umgebung noch diverse physische Server, das gesamte Netzwerk, die TKA und unser Midrangesystem ebenfalls down waren, sei nur am Rande erwähnt. Damit nicht genug. Die Fehlfunktion in der Stromversorgung hatte zur Folge, dass die Server starten wollten, nach ca. 1 Minute jedoch die Versorgung wieder abbrach, wieder Neustart. Es dauerte eine Weile, bis alle Netzstecker gezogen waren.
Nun, irgendwann war die Stromversorgung stabil und die Umgebung wurde sukzessive hochgefahren, Switches, SAN, Hosts, Backupserver. Alle wieder hochgekommen. Sämtliche VM, um die 40 Server, ohne Ausfälle durchgestartet. Schwein gehabt.
Gibt es eine einfache Möglichkeit festzustellen, ob das VMFS doch eventuell etwas abbekommen haben könnte?

Verfasst: 15.10.2013, 22:00
von irix
Nicht ganz zum Thema aber. Bei Standard USVs kann man einstellen das die Ausgangsleistung nur zeitverzoegert erfolgt. Gleiches bei Servern welcher erstn nach XX Sekunden starten.

Somit verhindern wir das alles aufeinmal anlaeuft bzw. das Switche zuerst da sind.

Gruss
Joerg