Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

vSphere 5.5 - Ursachenforschung nach Absturz

Moderatoren: irix, Dayworker

Member
Beiträge: 165
Registriert: 01.10.2007, 17:58
Wohnort: Hamburg

vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon ohhmille » 30.08.2017, 10:30

Hallo Leute

Letzte Nacht ist uns ein 5.5 (build 1881737) HOST abgestürzt und ist neu gestartet. Jetzt versuche ich gerade herauszufinden, was der Grund dafür sein könnte.
Habe mir die Logs gezogen und versuche die jetzt durchzugehen. Allerdings sind das auch eine Menge Einträge. Ich konnte sehen wann die VMs wieder gestartet wurden und so weiter.

Aber so richtig habe ich nichts darüber gefunden, was der Grund für den Absturz war. Gibt es bestimmte Wörter oder Events, nach denen ich suchen kann um den Grund für den Absturz zu finden?!?

Besten Dank und viele Grüße
Mille

Experte
Beiträge: 1337
Registriert: 25.04.2009, 11:17
Wohnort: Thüringen

Re: vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon Supi » 30.08.2017, 11:54

Hallo Mille,

basierend der ESXI Build Nummer aus 2014 würde wohl jeder erstmal sagen... Updaten.

Dazu ist wohl auch der Rest des Servers auf ähnlichen Patchstand ( sprich FW Raid, Bios) etc.
Der Fehler kann ja auch daher rühren. Steht da vielleicht was im Log?
Angaben zum Server sind also auch nicht gerade uninteressant.

Member
Beiträge: 165
Registriert: 01.10.2007, 17:58
Wohnort: Hamburg

Re: vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon ohhmille » 30.08.2017, 12:28

Ich weiß, die Kiste sollte mal ein Update bekommen. Aber das lohnt leider nicht mehr (und wurde auch von oben abgelehnt), da wir bis Jahresende eh die Türen hier abschließen... ;-)
Aber bis dahin muss ich halt noch eine Erklärung finden, warum die Kiste gestern Abend einfach neu gestartet ist... :cry:

Der Server lief jetzt aber auch knapp 2 Jahre durchgehend ohne Probleme. Vielleicht war es einfach mal an der Zeit seinen Speicher zu leeren. ;-)

Es ist ein DELL R410 mit local storage, vier Platten RAID5 mit Spare. Darauf laufen vier VMs, die z.B. das Firewall logging machen. Alles Systeme die 24/7 laufen müssen und gleichzeitig auf einem isolierten HOST, also nicht in unserem Cluster oder so!

Ich hab auf der Hardware gesehen, dass es Probleme mit einem der Netzteile gibt. Mehrmals am Tag verliert das Netzteil die Stromzufuhr, keine Ahnung warum. Aktuell vermuten wir, dass es schlicht ein Stromausfall war.

Experte
Beiträge: 1823
Registriert: 04.10.2011, 14:06

Re: vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon JustMe » 30.08.2017, 12:44

Im vmksummary.log und vmkernel.log kann man vielleicht erst einmal schauen, ob der Reboot "unerwartet" war.

Falls es ein PSoD war, dann wurde auch ein Dump geschrieben, der im Logbundle mit enthalten ist. In dieser Binaerdatei (ist halt ein Speicherauszug) kann man nach "Releasebuild" suchen; dort beginnt der Text, der auf dem PSoD-Bildschirm ausgegeben wird, bevor der Host rebootet ist.

Wenn es wirklich "nur" ein Stromausfall war, wird man dazu leider nix im ESXi-Logbundle finden, fuerchte ich.

Member
Beiträge: 165
Registriert: 01.10.2007, 17:58
Wohnort: Hamburg

Re: vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon ohhmille » 01.09.2017, 11:58

Also, eine DUMP-Datei habe ich nicht geschrieben. Auch bei den anderen LOGs habe ich nichts weiter finden können. Nur halt die Einträge, dass der HOST wieder gestartet ist.
Einen Eintrag, das der HOST "unerwartet" heruntergefahren wurde, hab ich allerdings auch nicht gefunden. :-(

Schade, dass man da nichts weiter findet. Aber lässt sihc nicht ändern! ;--)

Experte
Beiträge: 1823
Registriert: 04.10.2011, 14:06

Re: vSphere 5.5 - Ursachenforschung nach Absturz

Beitragvon JustMe » 01.09.2017, 13:48

Sorry, das war missverstaendlich, wenn auch in "Anfuehrungszeichen" :-).

Eine Meldung identisch wie bei M-soft findet sich im ESXi leider nicht.

"Unerwartet" ist der Reboot dann, wenn im vmksummary nur "Host has booted" (oder so, glaube ich; hab gerade kein entsprechendes Log zur Hand) zu finden ist. Bei einem "geordneten Rueckzug" gibt's da noch direkt davor eine Meldungszeile zum Herunterfahren: "Host is rebooting" (oder so).

Wenn /var/core (oder var/log/core?) im Logbundle nix enthaelt, und auch Extracting a core dump file from the diagnostic partition following a purple diagnostic screen error nichts bringt, dann bleibt's leider wirklich eher Kaffeesatzleserei, und man kann eventuelle Meldungen nur mit entsprechender Erfahrung in die eine oder andere Richtung deuten.

Waere deshalb vielleicht auch was fuer den (bezahlten) VMware-Support...


Zurück zu „vSphere 5.5 / ESXi 5.5“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste