Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Purple Screen Diagnose

Moderatoren: irix, Dayworker

Member
Beiträge: 165
Registriert: 01.10.2007, 17:58
Wohnort: Hamburg

Purple Screen Diagnose

Beitragvon ohhmille » 05.12.2017, 12:29

Hallo Leute

Wir haben einen alten, nicht mehr produktiven ESXi 4.1 HOST, der von Zeit zu Zeit mit einem Purple Screen abstürzt. Wir haben auf den Arbeitsspeicher getippt, dass dieser kaputt ist. Allerdings finden die Diagnose-Tools vom Hersteller keine Fehler.


ESXi_41-purple-screen.jpg



Hat jemand einen Hinweis?!

Danke und Grüße
Mille

Experte
Beiträge: 1823
Registriert: 04.10.2011, 14:06

Re: Purple Screen Diagnose

Beitragvon JustMe » 05.12.2017, 13:13

Bei Memory Controller Error (und diesem CPU-Typ) wuerde ich persoenlich eher auf CPU tippen...
Auch die Recursive Panic deutet in meinen Augen dahin.

Liegen denn trotz 26 Tagen (mehr oder weniger...) Uptime zwischen Fehlern noch "ein paar" der alten PSODs vor? Ist immer dieselbe PCPU/derselbe PCPU-Block betroffen?

Experte
Beiträge: 1337
Registriert: 25.04.2009, 11:17
Wohnort: Thüringen

Re: Purple Screen Diagnose

Beitragvon Supi » 05.12.2017, 19:59

Grundsätzlich würde ich bei dem alten ESXi Stand ( 4.1 GA Build aus 2010!) erst mal updaten.

Gilt dann wohl meist auch für alle anderen Komponenten wie z.B. Bios des Servers. Eventuell kommt damit schon ein Microkernel Update, das die Speicherkompatibilität erhöht.
Aber vielleicht läuft das Netzteil auch nicht mehr, die das Board/CPU und dessen Spannungsreglern nicht mehr kompensieren können.

King of the Hill
Beiträge: 13560
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Re: Purple Screen Diagnose

Beitragvon Dayworker » 05.12.2017, 20:27

Wie schon richtig erkannt wurde, sitzt der Speichercontroller ab der Nehalem-Generation mit in der CPU. Wenn die CPU nie übertaktet oder es ihr zu warm wurde, halte ich es fast für ausgeschlossen, daß die CPU fehlerhaft ist. Dem Gedanken mit dem Einspielen der letzten ESXi-Updates für deine GA-Version würde ich zuerst befrieden und bei der Gelegenheit solltest du auch gleich die komplette Firmware updaten. Das wird jedoch dein Problem sicherlich nicht vollständig lösen, weil neben den korrigierten Fehler zumindest auch ein nicht korrigierbarer im PSOD gelistet ist und das deutet eindeutig auf ein Problem hin. Wenn du Glück hast, mußt du nur die Wollmäuse rausschippen. Falls nicht, wirst du um neue RAM-Riegel nicht herumkommen.

Die meisten Hersteller-Tools beruhen auf Memtest und das war, seitdem es keine deaktivierbaren Caches mehr gibt, noch nie der Hit. Es spielt beispielsweise absolut keine Rolle, ob das Tools ein Datum ins RAM laden und hernach 100x auslesen kann, weil die CPU-Caches aktiv sind. Von daher schnapp dir eine Linux-CD, boote davon und mach den sogenannten Streßtest in Prime95. Primzahlen werden schnell sehr groß und passen dann in keinen Cache mehr. Entscheidend ist, ob eine Zahl Prim oder auch nicht ist und alle Abweichungen sind immer ein Fehler. Mit Prime95 sind RAM-Fehler auch reproduzierbar, das sieht bei Memtest bekanntlich ganz anders aus.


Zurück zu „ESXi 4“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast