Seite 1 von 1

Fehler auf ESX Sys-HDD, VMs laufen, kein Login auf Konsole

Verfasst: 16.08.2010, 17:50
von dropskoffer
hallo,

ich hab auf einer esx 3.5 (HP dl360 G6) das problem, daß ich die servicekonsole nicht mehr erreichen kann. wenn ich mich über das ILO anmelde bekomme ich von der esx die meldung vmhba0:C0:T0:L0 nicht verfügbar. wenn ich mich mit root einloggen will, komm ich nicht über die eingabe des users.

die maschinen, die sich im storage befinden laufen noch, sobald ich eine maschine mit einer terminal session verbinden möchte ist diese dann auch down.

gibt es eine möglichkeit, an den server heranzukommen. kann es sein, daß ein timeout vom lokalen controller das lokale storage deaktiviert hat?

danke, cheers...

Verfasst: 17.08.2010, 12:29
von kastlr
Hallo,

das hört sich nicht wirklich gut an.
Ich vermute mal, das der ESX Server noch auf ein Ping antwortet, allerdings kommst du per putty (oder iLO) nicht mehr ans System.
Trifft dies zu, hängt der ESX Server und du wirst um einen Reboot nicht drum herum kommen.
Die VM's laufen auch nicht mehr wirklich, es sind einfach noch die Prozesse, die vermeintlich verfügbar sind.
Aber sobald du z.B. versuchst, auf ein Share zuzugreifen, kriegst du Probleme.

Du solltest daher dringend deinen Storage Controller/deine interne Festplatte überprüfen, die Meldung deutet auf ein kritisches Problem hin.
Weiterhin ist es durchaus möglich, das du beim Booten Meldungen erhältst, das er einzelne Partitionen nicht mehr einlesen kannst.

Viel Glück,
Ralf

Verfasst: 17.08.2010, 12:37
von dropskoffer
@kastlr: ein Ping auf die ESX ging noch nur kein Login. merkwürdig is nur, daß die VMs weiter im Produktivbetrieb liefen bis ich versuchte eine Terminal Session auf zwei der Windows Kisten zu machen dann sind die abgestürzt.

hab erst mal die maschinen noch per psexec shutdown korrekt runterfahren, bei den Linux Kisten war ein Login per SSH noch möglich, so daß ich diese auch herunterfahren konnte.

Das ADU hatte vor dem FW Update ein Warning bei Battery Bit des P400i gelistet. Diese Warnung war nach dem FW Update jedoch weg. Danach hab ich noch ein Update auf den Platten gemacht.

Möglicherweise war in Verbindung mit einer temporär auf dem lokalen Storage abgelegten VM und den daraus folgenden höherem I/O ein Fehler auf dem Controller entstanden und hat den Pfad zum lokalen Storage getrennt so daß die ESX in diesen undefinierten zustand gerasselt ist.

Ich kann den Fehler jedoch nicht so eingrenzen, um auszuschließen, daß dieser nach dem Update nicht mehr auftritt.