Seite 1 von 1

Hardware (Machine) Error: Memory Controller Read Error

Verfasst: 27.09.2011, 09:43
von maticko
Hallo Forumsteilnehmer,

mittlerweile zum zweiten Mal ist es mir passiert, dass unser Host (ESXi 4.1) einen purple screen mit obiger Fehlermeldung anzeigt.
Zusätzlicher Text der Meldung:

PCPU2 in world 4098:idle 2
// Dann folgt die Anzeige diverserSpeicheradressen (0xff8d... usw.)//
*PCPU2:4098/idle2
PCPU 0: IIIIIIIIIIIIIII (großes Ida)

Es handelt sich bei der Hardware um einen IBM Bladeserver HS22 mit

- 32 GB RAM
- 2 x Intel Xeon 2,4 GHz

Die VMs liegen auf einer per iSCSI angebundenen QNAP 459U.
Es handelt sich rein um Test-Maschinen.

Handelt es sich hier eher um einen RAM- oder um einen CPU-Fehler?

Bevor das Problem zum ersten Mal auftrat, lief die Maschine mehrere Monate absolut ok,
nach einem Neustart ebenfalls. Bis zum zweiten Vorfall ist nun allerdings nur knapp 1 Monat vergangen...


Vielen Dank für alle Hinweise!


Matthias

Verfasst: 27.09.2011, 10:02
von ideFix
KB: Interpreting an ESX host purple diagnostic screen

Mit Auszügen aus den Logs, kann keiner was anfangen :roll:

Lad mal die /var/log/vmkernel und die /var/log/vmwarning hoch. ;)

Verfasst: 27.09.2011, 10:55
von maticko
Hallo ideFix,

danke für den Hinweis auf die KB, leider bin ich dort nicht fündig geworden.

Unter

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1026321

wird zwar ein ziemlich ähnlicher Fall beschrieben, die Voraussetzungen (Domäneneinbindung) treffen bei uns aber nicht zu.

Unter /var/log existieren die von dir beschriebenen Logfiles leider nicht.

Vielen Dank trotzdem!

Verfasst: 27.09.2011, 11:35
von ideFix
Sorry, hatte ESX gelesen :D
beim ESXi reicht die /var/log/messages 8)

Verfasst: 27.09.2011, 12:47
von maticko
Ok, das beruhigt mich :grin:

Habs auf ifile.it hochgeladen http://ifile.it/cjunelo/messages.zip

Bin gespannt, ob man da was erkennen kann.

Danke!