Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

ESXi hängt regelmässig am Samstag

Moderatoren: Dayworker, irix

Member
Beiträge: 3
Registriert: 22.07.2010, 11:21

ESXi hängt regelmässig am Samstag

Beitragvon Maubrau » 22.07.2010, 11:33

Hallo,

ich habe ein 'lustiges' Problem mit einer ESXi 4.0 installation (Builld 208167)

Die Maschine läuft ansich problemlos, ausser dass sie regelmässig an Samstagen zwischen 15:00 - 19:00 abstürzt. Meistens alle 14 Tage, kann aber auch an zwei aufeinanderfolgenden Samstagen sein. Aber immer an einem Samstag, und immer zwischen 15:00 - 19:00 (= natürlich genau dann wenn niemand im Office ist...)

Wenn ich von der Arbeitsstation bereits vor dem Crash eingeloggt war (vSphere Client), seh ich bei Konfiguration/Systemstatus ein Ausrufezeichen bei Speicher, aber keine Geräte mehr darunter. Logs werden auch nicht mehr geschrieben. Ebenfalls kann ich nichts mehr auf den Datastore schreiben oder davon lesen - hilft nur Strom weg und wieder dran.

Als Controller ist ein MegaRAID SAS8704EM2 im Einsatz (2 Platten mirror + 1 Spare). ESXi bootet auch davon.

Am Samstag zu den genannten Zeiten laufen bei uns keine besonderen Scripts, und der Server (Core i7) ist nur minimal ausgelastet (5 VMs, 4 x Linux, 1 x XP).

Hat jemand ne Idee was das sein könnte?

Besten Dank :)

Maubrau

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 22.07.2010, 12:31

Wenns nicht sommerpause wäre, würd ich sagen, der ESX is beim Fußball-kucken :grin:

NE, im Ernst: Check mal z.B. mit memtest und nem cpu-stress-test, ob Deine ganze Hardware funktionstüchtig ist.

Steht in den logfiles VOR dem Crash was auffälliges drin?

viele grüße,
jörg

Member
Beiträge: 3
Registriert: 22.07.2010, 11:21

Beitragvon Maubrau » 22.07.2010, 15:08

Fussball kucken dürfe er ja, sofern nach dem Spiel wieder alles gehen würde ;)

Die Hardware müsste 100% i.O. sein - das Ding läuft ja sonst immer absolut tadellos - und die VMWare ist während der Woche um einiges stärker belastet als am Samstag.

Logs sind schon weg - werd mal nächsten Samstag schauen was ich noch bieten kann...

Hab gerade noch einen Screenshot vom Kollegen zugespielt bekommen. So freezed die VMWare selber wenn Sie am hängen ist...

Bild

Profi
Beiträge: 871
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 22.07.2010, 15:31

BIOS und andere FW ist aber up to date?
Was für Hardware?

Hast ja gar nicht erzählt das du ein PSOD bekommst ;-)

Les dir mal diese beiden KB Artikel durch:

Setting up a VMKcore partition to capture purple screen output
Manually regenerating core dump file in VMware ESX

Member
Beiträge: 3
Registriert: 22.07.2010, 11:21

Beitragvon Maubrau » 22.07.2010, 15:54

Das mit dem PSOD wusste ich selber nicht ;) Wir sind zu zweit hier jeweils am Rebooten - ich zieh nur immer den Stecker und schalt den Monitor gar nicht an. Der PSOD kommt auch nicht bei jedem Crash! Teilweise bleibt einfach der normale ESXi-Screen stehen.

Einen Dump habe ich noch nicht - wird dann hoffentlich beim nächsten Crash geschrieben (war nicht konfiguriert...).

BIOS etc. waren zum Zeitpunkt der Installation (vor ca. 5 Monaten) aktuell.

Hardware ist ein Intel Board DX58SO mit einem Core i7 CPU, 6GB (3 x 2 GB) Ram und einem MegaRAID SAS8704EM2 mit 3 Platten à 1TB (2 davon gespiegelt, eine als Spare)

Netzwerk läuft 1 Port mit dem internen Anschluss vom Board, und zusätzlich ist noch eine Intel Pro1000 PCI eingebaut.

Controller und NW-Karte sind offiziell von VMWare supported....

Das ganze in nem grossen Tower mit genug Wärmeabführung (im Tower ist aktuell kühler als bei meinem Arbeitsplatz...schwitz) & ein 550W Netzteil.

Als Uebergangslösung haben wir jetzt ne IP-Steckdose montiert - d.h. Strom wird kurz abgestellt sobald kein Ping mehr von einem Virtuellen Server kommt. Nicht sauber, aber spart mir 30km Autofahrt.

King of the Hill
Beiträge: 13657
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 22.07.2010, 18:35

...und du meinst allen Ernstes, daß die Stromweg-Geschichte eine gute Lösung ist :?:
Damit streßt du sämtliche Rechnerkomponenten mehr als dir bewußt sein dürfte und aus diesem Grund haben Server auch eine Management-Engine, damit kannst du selbst ein Bios-Update aus der Ferne machen.
Deine Notlösung taugt also garnichts. Wenn du Pech hast, sterben dir damit sogar deine Disks auch weg.

Im Screenshot ganz oben wird doch die pCPU 1 bemängelt. Ich würde sagen, daß der CPU-Lüfter entweder ein Ding weg hat oder die Klimaanlage am WE auf Sparbetrieb geht. Dazu würde auch der Kauderwelsch passen, bevor die Lausch-Meldung zum Debugger am Serialport kommt.


Zurück zu „ESXi 4“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast