Seite 1 von 1

HP Server G7 crashed und crashed

Verfasst: 30.01.2013, 11:38
von sammy2ooo
Hallo Leute

Habe hier mit einem immer wiederkehrenden Coredump zu kämpfen und bin mit meinem Latein am Ende. Es handelt sich um ein ProLiant DL360 G7

Folgendes wurde bereits durch den HP Support ausgetauscht:

- Neues Mainboard
- 2 neue RAM Riegel (gesammter Speicher wurde durchgetestet => OK)
- Neue Netzteile
- HBA gewechselt
- Beide (alle) CPU's neu

ESXi Installation wurde nach jedem Hardware Wechsel frisch aufgesetzt (5.1.0)

Hier der Coredump

http://s14.directupload.net/file/d/3151/ec3strj8_png.htm

Kann mir jemand von euch weiterhelfen? Solange keine virtuellen Maschinen auf dem Host laufen, treten auch die Coredumps nicht auf. Sobald 4-5 Maschinen unter voller Last laufen geht das core gedumpe wieder los... Naheliegend wäre RAM, aber wie gesagt wurde getestet... Auch die vServer sind neu installiert um evtl. Konflikte mit VMware Tools ausschliessen zu können (Windows Server 2008 R2 Standard)....

Verfasst: 30.01.2013, 13:10
von sammy2ooo
Bin ein Stück weiter:

Machine Check Exception: Internal Unclassified Error. PCPU1 in world....

Hm defekte CPU? Wurde aber gewechselt...

http://s7.directupload.net/file/d/3151/wzr2ut7l_png.htm

Der relevante Fehlercode scheint folgender zu sein:

MC:PCPU2 B:5 S:0xba00000000400405 M:0x4500 A:0x0 4

Leider erschliesst sich mir noch nicht ganz, wie ich den anhand unten stehendem KB Artikel interpretieren kann...

http://kb.vmware.com/selfservice/micros ... Id=1005184

Verfasst: 30.01.2013, 17:11
von Dayworker
Hast du den Server mal mit einem anderen OS bespielt und dort unter Last gesetzt?
Tritt der Fehler auch dort auf? Falls ja, dürfte eine Inkompatibilität mit dem ESXi5.1 fast vom Haken sein. Möglicherweise brauchst du aber auch nur ein neues Bios/Firmware.

Wenn das MB getauscht wurde, hattest du hoffentlich mal deren Seriennummern verglichen. Denn bei fortlaufenden Nummern dürften die auch aus derselben Charge stammen und könnten einen Chargenfehler (Socket, Stromversorgung etc) haben.

Wie du siehst können wir hier nur raten. Sichere daher alle Logs und Screenshots und wirf sie mal deinem Systemhaus vor die Füss.