Hallo zusammen,
ich hoffe es kann mit jemand helfen die Ursache für einen PSOD zu finden.
Wir haben hier einen Server (von 7 gleicher Hardware) der nach 23 Tagen plötzlich abstürzt.
System: ICO (Intel S5000PSL)
CPU: Dual Intel Xeon E5410 @2.33 Ghz
RAM: 16 GB
VMs: 6 (alle mit Windows 2003 R2 32bit)
Hier das vmware-log dazu und einen Screenshot. Vllt. kann einer was mit diesen Infos anfangen:
http://rapidshare.com/files/441763102/IMAG0028.jpg
http://rapidshare.com/files/441763315/v ... dump.1.zip
Ich habe jetzt 72h Memtest86+ laufen lassen: Kein Fehler.
Jetzt bin ich noch auf der Suche nach einen CPU Stresstest Tool.
Danke für eure Hilfe.
Klaus
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
ESXi 4 PSOD Wo liegt der Fehler
- Tschoergez
- Moderator
- Beiträge: 3476
- Registriert: 23.02.2005, 09:14
- Wohnort: Burgberg im Allgäu
- Kontaktdaten:
Hi!
Hilft Dir das weiter:?
http://kb.vmware.co/m/selfservice/micro ... Id=1005184
http://vmware-forum.de/viewtopic.php?t=21713
Hier findest Du auch noch ein paar andere Stresstools im letzten Post.
Und bei PSOD: Support-Call bei VMware aufmachen...
Viele Grüße,
Jörg
Hilft Dir das weiter:?
http://kb.vmware.co/m/selfservice/micro ... Id=1005184
http://vmware-forum.de/viewtopic.php?t=21713
Hier findest Du auch noch ein paar andere Stresstools im letzten Post.
Und bei PSOD: Support-Call bei VMware aufmachen...
Viele Grüße,
Jörg
-
Dayworker
- King of the Hill
- Beiträge: 13657
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
In meinen Augen ist Memtest nur als Anhaltspunkt zu verstehen und mehr auch nicht. Dazu dauert das auch noch extrem lange. Um halbwegs verläßliche Aussagen zu bekommen, müßtest du dazu auch sämtliche Caches abgeschaltet haben und sowas ist inzwischen bei aktuellen CPUs nicht mehr möglich.
Ich empfehle daher für solche Tests immer "Orthos Multiprime" oder direkt "Prime". Wenn man dort den Test "Blend - stress CPU and RAM" laufen läßt, erhält man wesentlich verläßlichere Angaben. Dabei spielt nachher der Cache auch keine Rolle und wenn ein Fehler vorliegt, steht das innerhalb von Minuten fest. Die Primzahlen stehen ja bis zu einer fast unendlichen Größe fest und jede Abweichung davon ist automatisch ein Fehler.
Ich empfehle daher für solche Tests immer "Orthos Multiprime" oder direkt "Prime". Wenn man dort den Test "Blend - stress CPU and RAM" laufen läßt, erhält man wesentlich verläßlichere Angaben. Dabei spielt nachher der Cache auch keine Rolle und wenn ein Fehler vorliegt, steht das innerhalb von Minuten fest. Die Primzahlen stehen ja bis zu einer fast unendlichen Größe fest und jede Abweichung davon ist automatisch ein Fehler.
Tschoergez hat geschrieben:Hi!
Hilft Dir das weiter:?
http://kb.vmware.co/m/selfservice/micro ... Id=1005184
http://vmware-forum.de/viewtopic.php?t=21713
Hier findest Du auch noch ein paar andere Stresstools im letzten Post.
Und bei PSOD: Support-Call bei VMware aufmachen...
Viele Grüße,
Jörg
Den oberen Beitag kenne schon, aber wirklich geholfen hat er mir nicht.
Support-Call bei VM ware geht wohl bei der freien Version nicht, oder?
Ich probiers dann mal mit "Orthos Multiprime". Gibts das auch als Live CD?
Klaus
-
Dayworker
- King of the Hill
- Beiträge: 13657
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
kroerig hat geschrieben:Ich probiers dann mal mit "Orthos Multiprime". Gibts das auch als Live CD?
Leider nicht. Das ist eine normale Windowsanwendung. Entweder du stellst dir mal schnell eine BartPE-CD zusammen oder du probierst irgendeine Linux-Live-CD aus. Da sollte dann "Prime" auch mit bei sein.
Ich hab ne BartPE genommen.
Der Blend-Test scheitert mit "Cannot initialize FFT code, errcode=1005".
Google sagt mir, das läge daran, dass Windows kein Pagefile hat.
Der StressCPU Test läuft jetzt seit 5 Min, aber da steht immer "Using CPU #0". Der Server selber hat 8 Cores. Müsste das nicht hochzählen?
Klaus
Der Blend-Test scheitert mit "Cannot initialize FFT code, errcode=1005".
Google sagt mir, das läge daran, dass Windows kein Pagefile hat.
Der StressCPU Test läuft jetzt seit 5 Min, aber da steht immer "Using CPU #0". Der Server selber hat 8 Cores. Müsste das nicht hochzählen?
Klaus
-
Dayworker
- King of the Hill
- Beiträge: 13657
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
Das Proggi lastet immer nur 2 Kerne aus. Da du aber hauptsächlich deinen Speicher testen wolltest, ist das ja kein Problem oder du startest es einfach 4mal und änderst dann im Taskmanager die Affinität auf die Kerne 1, 3, 5 und 7. Damit hättest du dann auch gleich einen Volllasttest und der Server dürfte seine Lüfter mal wieder auf volle Leistung bringen. Also fröhliches Rauschen und Ohrstöpsel könnten dein bester Freund werden.
Ärgerlich ist antürlich, daß ich nicht dran gedacht hatte, daß du für einige weitergehende Tests auch Plattenplatz brauchst. Kannst du da vielleicht was mit einer leeren Platte am Chipsatz-Kontroller machen?
Ärgerlich ist antürlich, daß ich nicht dran gedacht hatte, daß du für einige weitergehende Tests auch Plattenplatz brauchst. Kannst du da vielleicht was mit einer leeren Platte am Chipsatz-Kontroller machen?
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste