Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Seit ESXi 5.1 Update Purple Screens

Moderatoren: Dayworker, irix

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Seit ESXi 5.1 Update Purple Screens

Beitragvon MarroniJohny » 16.03.2013, 07:25

Hi

Seit Ich auf meinem unsupported ESXi Home Server Build 5.1 (799733) eingespielt habe, kommt alle 1, 2 Tage mal ein Purple Screen:

Bild

Wie kann ich das beheben?

Gruss

Martin

Guru
Beiträge: 3114
Registriert: 27.12.2004, 22:17

Re: Seit ESXi 5.1 Update Purple Screens

Beitragvon rprengel » 16.03.2013, 08:05

MarroniJohny hat geschrieben:Hi

Seit Ich auf meinem unsupported ESXi Home Server Build 5.1 (799733) eingespielt habe, kommt alle 1, 2 Tage mal ein Purple Screen:

Bild

Wie kann ich das beheben?

Gruss

Martin

Erst mal alle Patches einspielen und schauen was passiert. Hast du im Bios spezielle Einstellungen gemacht. Gibt es ein Biosupdate?
Dann ggf. auf die alte Version zurück gehen um zu klären ob du nicht ein frisches Hardwareproblem hast.
Wenn die alte Version stabil läuft und die neue nicht wirst du auf der aten Version bleiben müssen.
Tlb unvalidate wirft bei google Treffer in der KB von vmware.
Gruss

King of the Hill
Beiträge: 13658
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 16.03.2013, 14:51

Da ich solche dem zugrunde liegende Microcode-Meldungen auch schon mal unter dem eingestellten VMserver2 mit Windows als Host und in neuerem Linux als Gast gesehen hatte, hast du eigentlich drei Lösungsmöglichkeiten:
  • Du installierst oder vielleicht reicht auch das Booten einer Live-CD auf dem Host, die einen passenden Microcode-Patch bereits mitbringt und hoffentlich auch einspielen kann.
  • Ausgehend von Derek Seaman's Blog spielst du mindestens die Buildnumber 821926 ein, damit diese Meldung unterbleibt.
  • Du versuchst dein Glück mit einem BIOS-Update.


Ich hatte den Microcode-Patch damals über eine Testinstallation von Dotsch/UX - A USB/Diskless/Harddisk BOINC Ubuntu Linux Distribution based on Ubuntu Intepid eingespielt, als ich noch der Meinung war, Linux ohne jedwede Linux-Kenntnisse als Host-OS wäre ein guter und praktikabler Gedanke. Als ich danach auf demselben Rechner wieder Windows als Host-OS und denselben Linux-Gast neu als VM aufgesetzt hatte, habe ich keine Microcode-Meldungen mehr im System-Log des Gastes gefunden. Den Microcode kannst du übrigens auch nicht über eine VM mit aktiviertem Hardware-VT einspielen, da VMware bzw die CPU diesen Zugriff blockiert.

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 17.03.2013, 06:22

Hi

Also, ich habe nun die Patches 799733, 838463 und 914609 sowie die BIOS Updates eingespielt. Hoffe jetzt bleiben die Purple Screens aus!

Da stellen sich mir zwei Fragen:
    Kann ich den jeweils letzten Patch einspielen, oder muss ich da immer alle Patches installieren?
    Was meinst Du mit den Microcodes? Keine Ahnung, wovon Du sprichst,...


Aber danke für die Hilfe von Euch beiden!

Guru
Beiträge: 3114
Registriert: 27.12.2004, 22:17

Beitragvon rprengel » 17.03.2013, 06:47

MarroniJohny hat geschrieben:Hi

Also, ich habe nun die Patches 799733, 838463 und 914609 sowie die BIOS Updates eingespielt. Hoffe jetzt bleiben die Purple Screens aus!

Da stellen sich mir zwei Fragen:
    Kann ich den jeweils letzten Patch einspielen, oder muss ich da immer alle Patches installieren?
    Was meinst Du mit den Microcodes? Keine Ahnung, wovon Du sprichst,...

Aber danke für die Hilfe von Euch beiden!

Zu 1
http://blogs.vmware.com/vsphere/2012/02 ... tches.html
der Begriff ist kumulativ
Zu 2
googel ist dein Freund

Ich persöhnlich patche meine Systeme immer schrittweise hoch um eventuelle Probleme mitzubekommen.
Hast du geklärt ob es für deine Hardware auch ein Biosupdate gibt?

Gruss

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 17.03.2013, 07:03

Hi

Ja, habe BIOS Update gemacht. Hatte zuerst BIOS B in Betrieb, weil der ESXi mit BIOS A nicht mehr starten wollte, nachdem ich zwei Netzwerkkarten sowie GPU eingebaut/getauscht hatte. Jetzt läufts aber mit beiden BIOS wieder (habe beide aktualisiert),...

Über die Microcodes der CPU habe ich mich jetzt auch schlau gemacht, hoffe, das BIOS Update hat diese eingespielt! (wohin genau ist mir allerdings immer noch ein Rätsel).

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 22.03.2013, 13:29

Hi

Seit den BIOS sowie ESXi Updates ists wesentlich besser. Trotzdem ist mein Server letzte Nacht wieder abgeschmiert! Obs einen PSOD gab oder nicht, weiss ich nicht, als ich nachschaute war er bereits neu am booten und war am POST Test. Leider habe ich keinen Coredump Server konfiguriert, wo man das nachsehen könnte. Als der ESXi wieder da war, war der Wartungsmodus aktiviert.

Kann es irgendwie sein, dass ich am PCIe zuviel Strom ziehe, mit 2 Quad Port NICs sowie einer passiven GPU, die ihre Versorgungsspannung ebenfalls aus dem PCIe Bus zieht?

Bild

Die PSU ist mit 700W eigentlich überdimensioniert, aber ob die Karten das direkt am Board ziehen können?

Ich habe beim Umbau die ursprüngliche Intel Quad Port Karte gegen zwei HP Karten getauscht, und ausserdem, wegen der Abwärme, die GPU vom obersten zum untersten Slot verpflanzt. Vielleicht hat es ja auch damit zu tun?

Wäre es vielleicht ratsam, den ESXi komplett neu aufzusetzen mit der neuen Config? Ist der Aufwand gross bei einer Neuinstallation die Gäste wieder zum laufen zu bringen?

Danke und Gruss

Guru
Beiträge: 2771
Registriert: 23.02.2012, 12:26

Beitragvon ~thc » 22.03.2013, 14:20

700 W Netzteil, flüssigkeitsgekühlte CPU, RAM-Riegel mit Metallgehäuse...

Wieso werde ich das Gefühl nicht los, dass ich ein Overclocker-Experimentalsystem hineinschaue und nicht in einen ESX-Server?

Ist das dein ausrangierter Gaming-PC?

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 22.03.2013, 14:27

Ist das dein ausrangierter Gaming-PC?


Nein, der steht in der anderen Ecke.

Aber Experimentalsystem stimmt schon. Trotzdem wäre es schon, wenn der wieder durchlaufen würde.

Guru
Beiträge: 2771
Registriert: 23.02.2012, 12:26

Beitragvon ~thc » 22.03.2013, 14:31

Bei spontanen Neustarts würde ich die beiden häufigsten Kandidaten unter die Lupe nehmen: Netzteil und RAM. Netzteil tauschen und RAM mal drei oder vier Tage mit einem Testprogramm stressen.

King of the Hill
Beiträge: 13658
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 23.03.2013, 10:13

Also über PCIe sind für normal hohe Karten 25W und für halbhohe (Low-Profile) magere 10W spezifiert. Lediglich der PEG- bzw PCIe_x16-Slot liefert 75 Watt.

Bei spontanen Neustarts oder Lahmheit würde ich auch die Kühlung nicht ausser Acht lassen. Wasserkühlung mag ja ganz schick und leise sein, diese entbindet aber trotzdem nicht vom Einsatz eines Miefquirls. Denn irgend etwas muß die um den CPU-Sockel liegenden Spannungsregler kühlen und das wird bei Wasserkühlkonzepten fast immer vergessen.

RAM-Tests fahre ich nur noch per Primezahl-Programm, da Memtest & Co bisher alles und nichts bewiesen haben. Memtest war beispielsweise mal der Meinung, daß ein DIMM in Ordnung wäre und das, obwohl deutlich sichtbar ein Pufferkondensator abgerissen war. Den entgegen gesetzten Fall habe ich mit Memtest auch schon mehrfach erlebt, also Memtest meldet Fehler obwohl keine da sind. Falls jemand das mal austesten will, nimmt die Linux-App für 32bit oder 64bit und verifiziert dann spaßeshalber mal die Primzahl über

Code: Alles auswählen

app -q"353159*2^4331116-1"

Wer es etwas ausführlicher mag, kann sich nachfolgend bedienen. Aber Obacht, alle Zeiten wurden auf einer nVidia GTX460 über Cuda ermittelt. Die Rechenzeiten auf einer CPU können sich davon deutlich unterscheiden:

Code: Alles auswählen

3*2^801978+1 is prime!  Time : 632.848 sec.
7*2^804534+1 is prime!  Time : 629.690 sec.
7*2^811230+1 is prime!  Time : 632.561 sec.
5*2^819739+1 is prime!  Time : 652.200 sec.
11*2^886071+1 is prime!  Time : 741.778 sec.
3*2^916773+1 is prime!  Time : 762.308 sec.
11*2^960901+1 is prime!  Time : 806.248 sec.
15*2^1276177+1 is prime!  Time : 1374.568 sec.
5*2^1282755+1 is prime!  Time : 1324.679 sec.
5*2^1320487+1 is prime!  Time : 1363.227 sec.
11*2^1343347+1 is prime!  Time : 1382.576 sec.
15*2^1344313-1 is prime!  Time : 1326.759 sec.
15*2^1368428+1 is prime!  Time : 1479.531 sec.
17*2^1388355+1 is prime!  Time : 1545.304 sec.
29*2^1416873+1 is prime!  Time : 1535.590 sec.
9*2^1419855-1 is prime!  Time : 1437.712 sec.
19*2^1434165-1 is prime!  Time : 1525.868 sec.
23*2^1448461+1 is prime!  Time : 1590.892 sec.
21*2^1452771-1 is prime!  Time : 1537.713 sec.
29*2^1478344-1 is prime!  Time : 1544.951 sec.
9*2^1481821-1 is prime!  Time : 1501.381 sec.
7*2^1491852+1 is prime!  Time : 1616.987 sec.
13*2^1499876+1 is prime!  Time : 1636.221 sec.
31*2^1611311-1 is prime!  Time : 1679.418 sec.
19*2^1684813-1 is prime!  Time : 1794.008 sec.
5*2^1777515+1 is prime!  Time : 2107.728 sec.
9*2^1807574+1 is prime!  Time : 2158.488 sec.
3*2^1832496+1 is prime!  Time : 2156.915 sec.
15*2^1837873-1 is prime!  Time : 2062.095 sec.
13*2^1861732+1 is prime!  Time : 2561.197 sec.
21*2^1872923-1 is prime!  Time : 2135.671 sec.
27*2^1902689-1 is prime!  Time : 2491.387 sec.
25*2^1977369-1 is prime!  Time : 2596.007 sec.
9*2^2060941-1 is prime!  Time : 2367.415 sec.
7*2^2139912+1 is prime!  Time : 2944.294 sec.
23*2^2141626-1 is prime!  Time : 2825.276 sec.
3*2^2145353+1 is prime!  Time : 2959.759 sec.
7*2^2167800+1 is prime!  Time : 2979.570 sec.
19*2^2206266+1 is prime!  Time : 3485.973 sec.
11*2^2230369+1 is prime!  Time : 3508.391 sec.

Experte
Beiträge: 1006
Registriert: 30.10.2004, 12:41

Beitragvon mbreidenbach » 23.03.2013, 10:18

Es gibt da übrigens einen neuen ESXi 5.1 Patch auf Build 1021289 der ein bestimmtes purple screen Problem fixen soll.

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 23.03.2013, 12:17

Hi

Ja, hab Memtest mal 16h laufen gelassen, bislang keine Fehler. Den Build 1021289 habe ich drauf.

Stellt sich die Frage, ob es beim neulichen Neustart auch einen PSOD gab, oder ob der Server einfach abgewürgt wurde! Vor einiger Zeit wollte der Server gar nicht mehr starten. Auch der sonst beleuchtete Powerbutton war dunkel. Das spricht meiner Meinung nach für die PSU. Hätte noch ein Ersatz Netzteil hier, aber es ist alles so schön verkabelt. Ich warte mal einige Tage ab, und schau, ob sich der Server nochmals aufhängt. Sonst komme ich wohl nicht um einen Wechsel des NT herum. :cry:

Die Karten stecken alle in PCIe 16x Slots. Aber der Temperatur her zu urteilen, saugen die ganz schön Strom, vor allem die NC375T.

Gehäuselüfter sind 6 Stück verbaut, die Spawas sind gerade mal Handwarm im Moment.

King of the Hill
Beiträge: 13658
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 23.03.2013, 15:02

Zum Einsatz von Memtest verliere ich nur noch wenige Worte, Memtest = reine Zeitverschwendung.

Bezüglich der NC375T. Diese Karte wird laut http://h18004.www1.hp.com/products/servers/networking/nc375t/index.html mit 12 Watts @ 3.3v angegeben und ohne vernüftige Gehäusedurchlüftung werden umliegende Teile zart mitgegrillt.
Es hat daher schon seinen Grund, weshalb die meisten 10GB-Nics über Lüfter verfügen, zumindest wenn der Kühlkörper nicht die gesamte Vorderseite bedecken soll. Weshalb die Lüfter dann aber ausgerechnet vom nervigen, weil notwendigerweise schnelldrehenden 40er Maß sein müssen, wissen wohl nur die Hersteller. Bild

Benutzeravatar
Profi
Beiträge: 682
Registriert: 20.10.2011, 17:55

Beitragvon MarroniJohny » 23.03.2013, 17:09

Ups. Auf der HP Seite sah ich, dass die NC364T auch noch mal 15 W verbraucht, die aber wenigstens mit 12V gespiesen wird. Kann gut sein, dass die NC375T bei 3.3V mit 3.6A relativ viel zieht, NT sollte 28A liefern. Allerdings für 3.3V und 5V zusammen nur 160W.

und ohne vernüftige Gehäusedurchlüftung werden umliegende Teile zart mitgegrillt.


Ja, das ist so! Wieso konnten die die nicht auch mit 12V speisen, wie die NC364T,...!

Glaube, ich komm da um einen Tausch des NT nicht herum.

Noch was anderes:

Da steht, Cabling Category 5, 5E, and 6. Ich habe aber Cat 7 Kabel dran. Ist das ein Problem?

King of the Hill
Beiträge: 13658
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 23.03.2013, 17:50

Da steht, Cabling Category 5, 5E, and 6. Ich habe aber Cat 7 Kabel dran. Ist das ein Problem?
Nö. CAT 7 ist höherwertiger, daher auch teurer und dürfte für 10GB-E Voraussetzung sein.


Zurück zu „vSphere 5 / ESXi 5 und 5.1“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste