Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

ESXi 5 auf HP ProLiant ML370 G6 - Fehler beim Starten

Moderatoren: Dayworker, irix

Member
Beiträge: 5
Registriert: 22.04.2012, 17:33
Wohnort: Marchtrenk
Kontaktdaten:

ESXi 5 auf HP ProLiant ML370 G6 - Fehler beim Starten

Beitragvon komdat » 22.04.2012, 17:43

Hallo Leute

Ich habe einen HP ProLiant ML370 G6 mit 2x Xeon E5530 und 64GB RAM. Auf dieser Maschine läuft VMWare ESX4.0.
Nun möchte ich auf ESXi 5 upgraden. Habe zu diesem Zweck ESXi 5 auf einen USB Stick installiert. Die Installation läßt sich auf unterschiedlichen Test-Maschinen starten. Auf meinem Produktivserver bleibt das System allerdings beim Start hängen.

LINT1 motherborad interrupt

CPU0: 2064 WARNING IOMMUIntel: 2267 IOMMU Unit#0 R/W -1, Device 027:00.0 Faulting PA=0x82b3600
IOMMU context entry dump for

Habe mir die ProLiant BIOS P63 Einstellungen der Maschine angesehen.
CPU hyperthreading enabled
CPU virtualizing enabled
no execute memory protection enabled
Intel VT-D enabled

Kann mir hier jemand sagen:
a) was die Fehlermeldung zu bedeuten hat
b) wie ich ESXi5 auf der Maschine zum Laufen bekomme

Danke im Voraus
RK

Member
Beiträge: 5
Registriert: 22.04.2012, 17:33
Wohnort: Marchtrenk
Kontaktdaten:

keine Ideen??????

Beitragvon komdat » 23.04.2012, 17:17

kann mir denn hier wirklich niemand weiter helfen??

Profi
Beiträge: 993
Registriert: 31.03.2008, 17:26
Wohnort: Einzugsbereich des FC Schalke 04
Kontaktdaten:

Beitragvon kastlr » 23.04.2012, 18:12

Hallo,

laut VMware Kompatibilitäts Matrix wird das System unterstützt, du braucht demnach das BIOS HP P63.
Ansonsten würde ich mich mal an HP wenden, da das Systemja VMware 5.x unterstützt müßten die dir eventuell weiterhelfen können.

Viel Erfolg,
Ralf

King of the Hill
Beiträge: 13657
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 23.04.2012, 18:18

Check mal RAM und die CPUs mit einem Primzahlprogramm wie "Prime95" oder "Orthos Multiprime" unter Windows oder "prime" unter Linux.
Memtest86 ist in meinen Augen für verläßliche RAM-Test ....überholt und keine Händler tauscht dir aufgrund eines Memtest-Fehlers die HW.

Was sagt HP zu diesem Problem?
Könnte neben dem RAM auch an der CPU oder Bios liegen. Das sind einfach zuviele Unbekannte.

Member
Beiträge: 5
Registriert: 22.04.2012, 17:33
Wohnort: Marchtrenk
Kontaktdaten:

Beitragvon komdat » 23.04.2012, 19:23

@kastir
BIOS P63 ist installiert

@dayworker
kann ich diese Test unter Windows auch im Gast laufen lassen?

King of the Hill
Beiträge: 13657
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 24.04.2012, 14:57

komdat hat geschrieben:kann ich diese Test unter Windows auch im Gast laufen lassen?
Nein, ansonsten wären zwei Speicherverwaltungen hintereinander geschaltet. Virtuelle Systeme belegen den ihn zugwiesen Speicher nicht starr sondern dynamisch und springen zur Laufzeit im kompletten verfügbaren Host-RAM umher. Daher ist der Einsatz von ECC-RAM eine Pflichtveranstaltung für virtualisierte oder dauerlaufende Systeme, da ein Bit-Fehler hier gleich mehrere OS betreffen würde.
Mit etwas Glück schmiert dir dann Host oder Gast mit einem PSOD oder BSOD ab. Wenn du Pech hast, bleibt eine Speicherfehler längere Zeit unentdeckt und korrumpiert so sämtliche Daten.

Hast du den Host-RAM eigentlich synchron aufgebaut oder hat eine CPU mehr Speicher unter ihre Fittiche?

Member
Beiträge: 5
Registriert: 22.04.2012, 17:33
Wohnort: Marchtrenk
Kontaktdaten:

Beitragvon komdat » 24.04.2012, 16:39

Die RAM's sind alle ECC und gleichmäßig aufgeteilt.

Ich habe jedoch das Problem, dass zeitweilig - ohne erkennbaren Grund - der ganze HOST steht. Die Maschine muss dann kalt neu gestartet werden. Kann dies mit einer def. CPU zusammen hängen oder reden wir hier von einem Speicherfehler.
Die ESX5 Installroutine schreibt nur eine CPU0 Fehlermeldung.

Wie kann ich diese Stresstestprogramm am besten laufen lassen?

King of the Hill
Beiträge: 13657
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 24.04.2012, 18:31

Warum schreibst du erst jetzt, daß der gesamte Host stehenbleibt? :roll:
Entweder ist wirklich eine CPU defekt, soll auch schon mal vorgekommen sein, obwohl ich eher an einen verbogenen Kontakt im CPU0-Sockel oder, da viel wahrscheinlicher, einen defekten RAM-Riegel im Bereich der CPU0 vermute.

Die Anwendung von Prime95 - Stresstest für CPU und Speicher ist unter anderem bei tecchannel beschrieben worden. Prime95 unterstützt inzwischen auch AVX (so die CPU damit umgehen kann) und damit ziehen sämtliche Intel-CPUs unter Volllast nochmal zwischen 15 bis 30W (Quad- bis Hexacore) mehr aus der Steckdose als üblich im Volllastfall. Die Lüfter rauschen also eine Stufe schneller als vorher.
Orthos Multiprime ist zwar schon etwas älter, enthält aber auch Prime95 in einer älteren Version und vereinfacht solche Tests mit einer auf die Tests reduzierten GUI. Die Tests lassen sich dabei auf CPU, RAM oder beides inklu Virtuellen RAM sprich HDD auszudehnen. In Prime95 finde ich die GUI etwas verwirrend, die Tests ansich laufen aber gleich ab.
Das Team Core2MaxPerf und CPUTempWatch leistet auch gute Dienste für den CPU-Test unter Windows, wobei Core2MaxPerf seit längerem auch auf AMD lauffähig ist.

Member
Beiträge: 5
Registriert: 22.04.2012, 17:33
Wohnort: Marchtrenk
Kontaktdaten:

Beitragvon komdat » 24.04.2012, 21:04

In dieser Angelegenheit sind in den letzten 2 Jahren mehrere Support-Cases gelaufen. HP hat mehrere Teile (Ausnahme Mainboard, CPU und SPeicher) getauscht. Des weiteren hat HP es laufend auf VMWare und VMWare auf HP geschoben. Wir sind in der Mitte gestanden. Jetzt ergeben manche Vorfälle einen Sinn.

Danke für die informativen Hinweise.


Zurück zu „vSphere 5 / ESXi 5 und 5.1“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste