Seite 1 von 1
3 ESXi-Hosts nicht mehr Erreichbar - warum?
Verfasst: 11.03.2011, 08:55
von Furgy
Hallo ESX-Profis,
Ich habe eine Frage bzgl Alarmdefinitionen, genauer gesagt, wie lange das etwas down sein muss, damit eine EMail-Benachrichtigung versendet wird.
Grund ist folgender:
Wir haben hier 3 ESXi-Hosts, welche gestern Abend um die selbe Zeit einen Fehler meldeten, und zwar der folgende:
Code: Alles auswählen
Ziel: srv-esx01.Domain
Alarm eines statusfreien Ereignisses
Alarmdefinition:
([Alarmausdruck für Ereignis: Keine Verbindung zum Host - falscher Ccagent] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Netzwerkfehler] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Zeitüberschreitung] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Zeitüberschreitung] ODER [Alarmausdruck für Ereignis: Verbindung zum Host unterbrochen])
Ereignisdetails:
Der Host srv-esx01.Domain in Elesta Bad Ragaz reagiert nicht.
Nun Frage ich mich natürlich, was das sein könnte, was die 3 ESXi-Hosts gleichzeitig offline macht...
Vielen Dank für eure Hilfe.
Verfasst: 11.03.2011, 09:13
von PeterDA
Hi,
würde hier mal auf ein Problem im Netzwerktippen. Ausfall einer Switch oder ....
Oder sidn die ESXe wirklich ausgefallen?
Gruß Peter
Verfasst: 11.03.2011, 09:17
von Furgy
Also Netzwerk wäre schon gewaltig, dann wären 4 Switches ausgefallen, denn die ESXi-Hosts hängen mit jeweils 4 Kablen an 4 Switches...
Lässt sich nachvollziehen, seit wann ein ESXi-Host läuft?
Verfasst: 11.03.2011, 09:45
von ideFix
Furgy hat geschrieben:Also Netzwerk wäre schon gewaltig, dann wären 4 Switches ausgefallen, denn die ESXi-Hosts hängen mit jeweils 4 Kablen an 4 Switches...
Alle 4 pNics einem vSwitch zugeordnet wo auch die ServiceConsole (Managementport) dran hängt?
Furgy hat geschrieben:Lässt sich nachvollziehen, seit wann ein ESXi-Host läuft?
Gib mal in die Console den Befehl
ein

Verfasst: 11.03.2011, 10:10
von Furgy
ideFix hat geschrieben:Alle 4 pNics einem vSwitch zugeordnet wo auch die ServiceConsole (Managementport) dran hängt?
Nein, 2 vSwitches mit jeweils 2 von den 4 Uplinks.
ideFix hat geschrieben:Gib mal in die Console den Befehl
ein

Geht das auch über das vCenter? Ansonsten müsste ich ja SSH auf dem ESXi aktivieren, oder?
Verfasst: 11.03.2011, 10:15
von ideFix
Entweder per ssh, oder direkt an der Console.
Hast du noch nix freigeschaltet (Troubleshootingmode), musst du ja eh an das System direkt. Klingt ja nicht so das du Remote auf das System kommst. (via IP-KVM, ILO, iRMC...)
Wenn der ESXi vom vCenter disconnected war, kann bekommt der nix mit. Da musst du schon direkt gucken

Verfasst: 11.03.2011, 10:32
von Furgy
Und was ist, wenn die Meldung "Tech Support has been disabled by the administrator" erscheint?
Verfasst: 11.03.2011, 10:36
von ideFix
Dann ist es nicht freigeschaltet.
F2
enter Password
Troubleshooting Options (4. Absatz)
Enable Local Tech Support
oder für ssh -> enable Remote Tech Support
Verfasst: 11.03.2011, 10:58
von Furgy
Perfekt.
Habe jetzt auf den 3 Hosts die Uptime überprüft. Die ESXi hatten definitiv Strom, die USV ebenfalls, also müsste es wohl doch der Switch (bzw. Switches) gewesen sein, richtig?
Verfasst: 11.03.2011, 11:42
von PeterDA
Hi,
dann würde ich die Logs der Switchs die Swichen den ESXen und den vCenter Hängen auch mal checken.
Gruß Peter
Verfasst: 11.03.2011, 11:43
von ideFix
Nicht unbedingt. Das der ESX nicht gerebootet hat, heißt nicht das dort nicht die Fehlerquelle ist.
Am besten schaltest du dir den ssh- Zugang frei und schaust dir mal folgende Log- Dateien an:
The VMkernel, vmkwarning, and hostd logs are located at /var/log/messages.
The Host Management service (hostd = Host daemon) log is located at /var/log/vmware/hostd.log\.
The VirtualCenter Agent log is located at /var/log/vmware/vpx/vpxa.log.
The System boot log is located at /var/log/sysboot.log.
http://kb.vmware.com/kb/1021801
Oder kopierst dir diese vom Server (mit SCP - zB WinSCP) und uploadest diese bei ifile.it
Verfasst: 11.03.2011, 13:38
von Furgy
PeterDA: Werde ich am Montag weitergeben, ich habe leider keinen Zugriff auf die Switches...
Im vCenter-LOG steht, dass die Server nicht auf SNMP-Traps reagieren und er Mails an die eingetragenen Adressen verschickt hat.
ideFix: Komischerweise stehen in allen LOGs nur Daten von 11:15 Uhr heute und später, warum das?