Seite 1 von 1

ESX nicht mehr erreichbar, VMs laufen aber

Verfasst: 15.06.2009, 18:12
von Login
Wir hatten heute in der Umgebung große Stromprobleme. Der Anbieter hat bestätigt, dass es 3 Stromausfälle in sehr kurzem Abstand zueinander gab.

Das hatte zur Folge dass der ESX danach weder per Webbrowser, noch per putty, noch per Infratructureclient erreichbar war, ping geht.

Zwar hat die USV auch 3 Mal was zu tun gehabt, jedoch war jemand so schlau und hat das SCSI-Storage nicht an der USV angeschlossen :-(

Komischerweise laufen die VMs, außer einer Exchangedatenbank hat es auch nichts verrissen. Den Fehler konnte ich per eseutil beheben.

Eine Reparaturinstallation des ESX hat der Kollege vor Ort bereits durchgeführt.

Was kann hier passiert sein? Bzw, was bleibt zu tun, um den ESX wieder erreichen zu können?

Greetz

Verfasst: 15.06.2009, 20:49
von PatrickW
Hallo,

boote der ESX von dem SCSI-Storage?

Verfasst: 16.06.2009, 08:14
von Login
Hallo PatrickW,

nein:

- ESX-Installation ist auf internem Raid1
- 2 kleinere VMs laufen auf einem weiteren internen Raid5
- 1 großer Fileserver/Exchangeserver läuft auf dem externen Storage

Gruß!

Verfasst: 16.06.2009, 14:23
von deathrow
Kommst Du noch direkt an die Konsole? Dann mal Management-Dienste neu starten.

Verfasst: 17.06.2009, 17:35
von Login
OK.

... habe nun gehört, dass der Autostart für die VMs deaktiviert sein sollte, wenn dieser Befehl ausgeführt wird!?

Am Freitag findet eine geplante Downtime statt, der Reboot wirds vielleicht auch tun...

Dank euch!

Verfasst: 20.06.2009, 21:35
von Login
Hallo,

die Situation ist nach dem Reboot die selbe!

Auch nach mehrmatigem neustart des mgmt-Diensts.

Ich schaffe es kurz mit dem Infrastruktueclient eine Verbindungaufzubauen, bis dann zuverlässig nach ein paar Sekunden die Meldung erscheint, dass die Verbindung abgebrochen sei.

Netzwerkprobleme ansich habe nicht festgestellt.

Was mich auch wundert ist, dass ich keinen Zugriff per Browser bekomme.

Hat jemand von euch Ideen?

Gruß!

Verfasst: 21.06.2009, 00:30
von Saturnous
Könnte es sein das irgend ne partition einfach voll ist. Ein Storageausfall bringt immer ein rapides volllaufen der Logs mit sich. Räum mal etwas auf. Vllt hast du auch authentifizierung auf LDAP umgestellt und dort ist was baden gegangen.

Geht noch lokales anmelden ?

Verfasst: 22.06.2009, 08:53
von Login
hallo Saturnous,

leider ist es mir nciht möglich, diese Dinge über die Gui nachzusehen. ICh kann mich zwar an der Konsole direkt am Server anmelden, aber der Befehlszeilen-King bin ich einfach noch nicht ;-(

Falls Partitionen vollgelaufen wären, würden die VMs doch auch nicht sauber laufen, oder?

- Der Server auf dem Storage läuft stabil.
- Die anderen 2 Server auf der 2. internen Partition laufen auch gut.
- Der ESX ist auf der 1. internen Partition installiert, beim booten bekomme ich keine Meldungen, dass Platte voll ist, o.Ä.

Gruß!

Verfasst: 22.06.2009, 21:32
von GTMK
Es könnte sein, dass die root-Partition der Service Console voll ist, entweder durch die Logs (unter /var/log) oder durch Core-Dumps (unter /var/core). Letzteres ist mir schon zweimal passiert, allerdings konnte ich mich immer noch mit ssh anmelden.

Was sagt denn df? Ich weiß jetzt gerade nicht, ob ich beim Booten ein "Voll"-Meldung bekäme.

Grüße, Georg.

Verfasst: 02.07.2009, 18:38
von Login
GELÖST:

Ich musste mit dem netten Herrn vom Support eine Datei löschen, die bei den Stromausfällen wohl defekt gegangen ist.

Danach Neustart des MGMT-Diensts. Fetsch.

Gruß!