Seite 1 von 1

VM verliert Verbindung zum Storage

Verfasst: 20.06.2011, 08:06
von alesphere
Hallo zusammen,

Ich hoffe dies ist das richtige Unterforum - wenn nicht tut es mir leid.

Folgende Situation: Eine VM von unserem Cluster hat an diesem Wochende für genau 1 Minute die Verbindung zum Storage verloren, und ich weiss nicht, an was das liegen könnte...
Ich habe im Event Log von der VM nichts gefunden, ebenfalls nicht im Event Log vom Storage.
Wie kann ich nun herausfinden, wo das Problem war?

Eingesetzte Hard- und Software:
3x Dell PowerEdge R710 (je mit 2x Intel Xeon E5506 und 48GB Ram, keine HDDs, PCIe-SAS-HBA, ESXi 4.1, neustes Update)
1x Dell PowerVault MD3200 mit 12x 600GB SAS-15k (Raid5+Hot Spare), jeweils pro Controller 1 SAS-Kabel an die Server
1x Dell PowerVault MD1200 mit 12x 2000GB SAS-7.2k (Raid5+Hot Spare), Erweiterung des MD3200

Ich hoffe ihr könnt mir helfen die Ursache zu finden.

Bin für jede Hilfe dankbar.

Verfasst: 20.06.2011, 08:16
von irix
Eine VM hat die Verbindung verloren oder hat ein Host seinen Datastore verloren? Wie kann man 3 Hosts an ein Storage anschliessen welches nur max. 2 in einer redundaten Konfig realisieren kann?

Gruss
Joerg

Verfasst: 20.06.2011, 08:56
von alesphere
Eine VM - der Host hat die Verbindung nie verloren.

Wie kommst du auf 2? Das MD3200 hat mit 2 Controller 8 SAS-Anschlüsse für 8 Geräte oder 4 HA-Geräte. Das MD1200 ist dann eine Erweiterung vom MD3200 - da sind es dann nur noch 2 SAS-Kabel.
Vielleicht hast du da etwas durcheinander gebracht. :)

Verfasst: 20.06.2011, 09:33
von Supi
Ich denke mal Irix liegt richtig.

Du hast zwar pro Controller 4 SAS Anschlüsse, jedoch je Host nur 1 Kabel verlegt.
Im Fehlerfall des Controlles springt zwar der andere Controller ein und damit bist zu seiten des Controllers Redundant, jedoch nicht was den Pfad Host zu Controller angeht.

Und wenn bei diesem einen Pfad Vmware meckert, kann es nicht umschalten. Und der andere Controller springt nicht ein, weil der andere wohl keinen Fehler meldet.

Verfasst: 20.06.2011, 09:35
von irix
Ich hatte MD3000 gelesen. Evtl. lags daran das ich vorgestern eine Ausserbetrieb genommen hab :)

Kannst du garantieren das im vCenter alle Alarm Benachrichtungen aktiviert und konfiguriert sind? Was fuer ein Guest OS ist es und wiehoch sind sind Werte fuer SYSTEM\CurrentControlSet\Services\disk\TimeOutValue ?

Ansonsten... das stochern in den Logs ist ohne Erfahrung nicht sehr zielführend. Ich wuerde ein Ticket bei VMware aufmachen und die gesammelten Logs hochladen.

@Supi
Seine neue MD3200 hat 2x4 SAS und kann 4 Hosts redundant anschliessen. Das ist also erstmal alles i.O so.

Gruss
Joerg

Verfasst: 20.06.2011, 10:26
von alesphere
Supi: Nein, es sind 2 Kabel pro Host verlegt - 1 an Controller 0 und 1 an Controller 1. Dies wurde während der Installation auch erfolgreich getestet.

irix: Ja, im vCenter sind alle Alarme aktiviert. Guest OS ist Windows Server 2008 R2. Der Wert für den von dir gefragten Eintrag ist 0x0000003c (60).

Verfasst: 21.06.2011, 11:19
von kastlr
Hallo,

woran machst du es denn eigentlich fest, das deine VM den Zugriff auf den Storage verloren hat?
Ist das vielleicht "nur" eine Meldung in deinem vCenter Server?
Denn wenn weder der ESX Server noch die VM irgendwelche Auffälligkeiten zeigt, handelt es sich wahrscheinlich um eine "Hoax" Meldung.

Gruß
Ralf