Ich habe hier 2 ESX Server beide auf IBM Hardware laufen (ca. 4 Monate alt). Heute ist beim ESX1 auf einmal kein Zugriff mehr möglich gewesen, da die Kisten nicht in der Nähe stehen, konnte ich auch nicht sofort drauf zugreifen bzw. als ich vor Ort war, war die Büchse wieder online, die VMs natürlich aus. Dies hat sich dann nach ca. 4,5 Stunden wiederholt.
Der andere ESX läuft hingehen ohne Probleme. Ein Blick in die Logs hat nicht wirklich Error Meldungen angezeigt nur unter vmkwarnings wurde nach den beiden Neustarts eine Fehlermeldung angezeigt:
May 28 11:56:29 esx1 vmkernel: 0:00:00:02.447 cpu0:1024)WARNING: Host: 2499: irq 0 is not valid
May 28 11:56:29 esx1 vmkernel: 0:00:00:02.447 cpu0:1024)WARNING: Host: 2499: irq 0 is not valid
May 28 11:56:37 esx1 vmkernel: 0:00:00:02.451 cpu0:1024)WARNING: Host: 2499: irq 21 is not valid
May 28 16:42:32 esx1 vmkernel: 0:00:00:02.445 cpu0:1024)WARNING: Host: 2499: irq 0 is not valid
May 28 16:42:33 esx1 vmkernel: 0:00:00:02.445 cpu0:1024)WARNING: Host: 2499: irq 0 is not valid
May 28 16:42:39 esx1 vmkernel: 0:00:00:02.450 cpu0:1024)WARNING: Host: 2499: irq 21 is not valid
Diese Meldung hab ich auch nur auf dem esx1 auf dem esx taucht diese Fehlermeldung nicht auf. Wie gesagt Hardware ist komplett gleich, ESX Version ist ebenfalls gleich.
Ich vermute das die Hardware einen Weg hat (Speicher oder CPU). Kann jemand das bestätigen oder hat jemand ähnliches erlebt? Einen Hardware Test kann ich frühestens morgen durchführen, langes WE sei Dank.. Im Moment läuft das ganze ohne Probleme, fragt sich nur wie lange...
Die anderen Log Dateien haben keine Anzeichen auf Fehler gemacht, zu den Zeiten wo der ESX1 nicht erreichbar war, gibt es auch keine Einträge nur kurz danach, das der Server neugestartet ist, kurz vorher gibt es auch keine Fehler.
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
ESX Server "schmiert ab"
-
irix
- King of the Hill
- Beiträge: 13059
- Registriert: 02.08.2008, 15:06
- Wohnort: Hannover/Wuerzburg
- Kontaktdaten:
SR bei VMware aufmachen und denen die Logs zukommen lassen. Hast du keine DRAC/ILO bzw. wie heist das Gegenstueck bei IBM um zu gucken obs nen PSOD gab?
Wann immer hier nen ESX komplett abschmiert war immer die Hardware das Problem. Beim letzten mal hatte in einer DUAL SMP Kiste die 2. CPU nen Schuss.
Gruss
Joerg
Wann immer hier nen ESX komplett abschmiert war immer die Hardware das Problem. Beim letzten mal hatte in einer DUAL SMP Kiste die 2. CPU nen Schuss.
Gruss
Joerg
Vielen Dank für die Rückinfo. Ticket ist geöffnet, mal schauen was die Herren so sagen, vorsichtshalber hab ich mal neue CPUs und Speicher besorgt, heute Abend mal umbauen.. Mittlerweile läuft das Teil nach ein paar CPU Einstellungen innerhalb der VMs wieder seit gestern 17 Uhr... Aber du denkst das es durchaus an der Hardware liegen kann?
Ich kann es mir nur so erklären das zu den Zeitpunkten wo die Maschine abgeraucht ist, irgendein Bereich der CPU bzw. RAM adressiert wurde und dann die ganze Kiste abgeschmiert ist...
Klingt das für dich logisch oder eher unlogisch, ich kann mir da sonst keinen Reim draus machen
Ich kann es mir nur so erklären das zu den Zeitpunkten wo die Maschine abgeraucht ist, irgendein Bereich der CPU bzw. RAM adressiert wurde und dann die ganze Kiste abgeschmiert ist...
Klingt das für dich logisch oder eher unlogisch, ich kann mir da sonst keinen Reim draus machen
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 56 Gäste