Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

3 ESXi-Hosts nicht mehr Erreichbar - warum?

Moderatoren: Dayworker, irix

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

3 ESXi-Hosts nicht mehr Erreichbar - warum?

Beitragvon Furgy » 11.03.2011, 08:55

Hallo ESX-Profis,

Ich habe eine Frage bzgl Alarmdefinitionen, genauer gesagt, wie lange das etwas down sein muss, damit eine EMail-Benachrichtigung versendet wird.

Grund ist folgender:
Wir haben hier 3 ESXi-Hosts, welche gestern Abend um die selbe Zeit einen Fehler meldeten, und zwar der folgende:

Code: Alles auswählen

Ziel: srv-esx01.Domain
Alarm eines statusfreien Ereignisses
 
Alarmdefinition:
([Alarmausdruck für Ereignis: Keine Verbindung zum Host -  falscher Ccagent] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Netzwerkfehler] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Zeitüberschreitung] ODER [Alarmausdruck für Ereignis: Keine Verbindung zum Host - Zeitüberschreitung] ODER [Alarmausdruck für Ereignis: Verbindung zum Host unterbrochen])
 
Ereignisdetails:
Der Host srv-esx01.Domain in Elesta Bad Ragaz reagiert nicht.


Nun Frage ich mich natürlich, was das sein könnte, was die 3 ESXi-Hosts gleichzeitig offline macht...

Vielen Dank für eure Hilfe.

Benutzeravatar
Guru
Beiträge: 3138
Registriert: 22.02.2008, 20:01
Wohnort: Hessen

Beitragvon PeterDA » 11.03.2011, 09:13

Hi,
würde hier mal auf ein Problem im Netzwerktippen. Ausfall einer Switch oder ....

Oder sidn die ESXe wirklich ausgefallen?


Gruß Peter

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

Beitragvon Furgy » 11.03.2011, 09:17

Also Netzwerk wäre schon gewaltig, dann wären 4 Switches ausgefallen, denn die ESXi-Hosts hängen mit jeweils 4 Kablen an 4 Switches...

Lässt sich nachvollziehen, seit wann ein ESXi-Host läuft?

Profi
Beiträge: 871
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 11.03.2011, 09:45

Furgy hat geschrieben:Also Netzwerk wäre schon gewaltig, dann wären 4 Switches ausgefallen, denn die ESXi-Hosts hängen mit jeweils 4 Kablen an 4 Switches...


Alle 4 pNics einem vSwitch zugeordnet wo auch die ServiceConsole (Managementport) dran hängt?

Furgy hat geschrieben:Lässt sich nachvollziehen, seit wann ein ESXi-Host läuft?


Gib mal in die Console den Befehl

Code: Alles auswählen

uptime
ein :D

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

Beitragvon Furgy » 11.03.2011, 10:10

ideFix hat geschrieben:Alle 4 pNics einem vSwitch zugeordnet wo auch die ServiceConsole (Managementport) dran hängt?


Nein, 2 vSwitches mit jeweils 2 von den 4 Uplinks.

ideFix hat geschrieben:Gib mal in die Console den Befehl

Code: Alles auswählen

uptime
ein :D


Geht das auch über das vCenter? Ansonsten müsste ich ja SSH auf dem ESXi aktivieren, oder?

Profi
Beiträge: 871
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 11.03.2011, 10:15

Entweder per ssh, oder direkt an der Console.
Hast du noch nix freigeschaltet (Troubleshootingmode), musst du ja eh an das System direkt. Klingt ja nicht so das du Remote auf das System kommst. (via IP-KVM, ILO, iRMC...)

Wenn der ESXi vom vCenter disconnected war, kann bekommt der nix mit. Da musst du schon direkt gucken :grin:

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

Beitragvon Furgy » 11.03.2011, 10:32

Und was ist, wenn die Meldung "Tech Support has been disabled by the administrator" erscheint?

Profi
Beiträge: 871
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 11.03.2011, 10:36

Dann ist es nicht freigeschaltet.

F2
enter Password
Troubleshooting Options (4. Absatz)
Enable Local Tech Support
oder für ssh -> enable Remote Tech Support

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

Beitragvon Furgy » 11.03.2011, 10:58

Perfekt.
Habe jetzt auf den 3 Hosts die Uptime überprüft. Die ESXi hatten definitiv Strom, die USV ebenfalls, also müsste es wohl doch der Switch (bzw. Switches) gewesen sein, richtig?

Benutzeravatar
Guru
Beiträge: 3138
Registriert: 22.02.2008, 20:01
Wohnort: Hessen

Beitragvon PeterDA » 11.03.2011, 11:42

Hi,
dann würde ich die Logs der Switchs die Swichen den ESXen und den vCenter Hängen auch mal checken.

Gruß Peter

Profi
Beiträge: 871
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 11.03.2011, 11:43

Nicht unbedingt. Das der ESX nicht gerebootet hat, heißt nicht das dort nicht die Fehlerquelle ist. ;)
Am besten schaltest du dir den ssh- Zugang frei und schaust dir mal folgende Log- Dateien an:

The VMkernel, vmkwarning, and hostd logs are located at /var/log/messages.

The Host Management service (hostd = Host daemon) log is located at /var/log/vmware/hostd.log\.

The VirtualCenter Agent log is located at /var/log/vmware/vpx/vpxa.log.

The System boot log is located at /var/log/sysboot.log.

http://kb.vmware.com/kb/1021801


Oder kopierst dir diese vom Server (mit SCP - zB WinSCP) und uploadest diese bei ifile.it

Member
Beiträge: 24
Registriert: 23.09.2010, 09:46

Beitragvon Furgy » 11.03.2011, 13:38

PeterDA: Werde ich am Montag weitergeben, ich habe leider keinen Zugriff auf die Switches...

Im vCenter-LOG steht, dass die Server nicht auf SNMP-Traps reagieren und er Mails an die eingetragenen Adressen verschickt hat.

ideFix: Komischerweise stehen in allen LOGs nur Daten von 11:15 Uhr heute und später, warum das?


Zurück zu „ESXi 4“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste