Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

[PSOD] PCPU 0 didn't have a heartbeat for 181 seconds

Hilfe bei Problemen mit Installation & Benutzung des VMware ESX/ESXi Server 3.

Moderatoren: Dayworker, irix

Member
Beiträge: 8
Registriert: 23.12.2007, 19:37

[PSOD] PCPU 0 didn't have a heartbeat for 181 seconds

Beitragvon reg » 09.09.2008, 21:11

Ich bekomme zur Laufzeit (nicht direkt reproduzierbar) einen Purple Screen Of Death (PSOD). -> siehe Attachment.

2x Intel Xeon Quadcore 5405
Tyan Tempest i5100X (S5375)
4x 2GB ECC Reg Kingston RAM
Adaptec 3405 SAS Controller

Neuestes Bios-Update ist appliziert.

Hat jemand eine Idee, woran dies liegen könnte oder ob evtl. bestimmte Bios-Einstellungen dafür verantwortlich sind?
Dateianhänge
psod.JPG
psod
psod.JPG (53.29 KiB) 2049 mal betrachtet

Benutzeravatar
Member
Beiträge: 268
Registriert: 19.11.2006, 21:24
Wohnort: Hannover, Germany
Kontaktdaten:

Beitragvon storageguru » 09.09.2008, 23:17

Hallo,

ich würde auf kaputte CPU.

Mfg Marco

Member
Beiträge: 8
Registriert: 23.12.2007, 19:37

Beitragvon reg » 10.09.2008, 03:41

Habe für ca. 60 Minuten einen Stresstest auf allen 8 cores laufen lassen, so dass quasi 0% idle waren. Kein Absturz.
Einen CPU-Defekt schließe ich damit weitesgehend aus. :?

Benutzeravatar
Member
Beiträge: 268
Registriert: 19.11.2006, 21:24
Wohnort: Hannover, Germany
Kontaktdaten:

Beitragvon storageguru » 10.09.2008, 07:17

Dann mach doch nen Case bei VMware auf, du müsstest doch
eigentlich support haben. Oder?

Die Jungs können das wensentlich besser denke ich interpretieren.

Benutzeravatar
Profi
Beiträge: 743
Registriert: 23.07.2008, 14:09
Wohnort: Usa
Kontaktdaten:

Beitragvon mangold » 10.09.2008, 08:19

wir hatten das auch mal, haben aber einen Call beim HW Hersteller aufgemacht, der dann u.A. eine CPU gewechselt hatte. Hat aber lange gedauert, die mussten sogar die Maschine mitnehmen zum Testen, weil Sie nicht dahinter kamen was es war. Wir hatten aber das Glück, damals drei identische Maschinen gekauft zu haben und nur bei einer trat es regelmäßig auf.

Benutzeravatar
Member
Beiträge: 446
Registriert: 11.03.2008, 12:28
Wohnort: Seligenstadt

Habt ihr den Adaptec Storage Manager installiert?

Beitragvon sirrossi » 10.09.2008, 11:56

Moin, moin,

wurde auf dem ESX der Adaptec Storage Manager (asm_linux_x86.....) installiert?

Wenn ja, schau Dir einmal das hier an:
http://vmware-forum.de/viewtopic.php?p=55536#55536

Member
Beiträge: 8
Registriert: 23.12.2007, 19:37

Beitragvon reg » 15.09.2008, 23:11

Vielen Dank für die Antworten!

@sirrossi:
Das hat mir in der Tat weitergeholfen.
Hatte den asm v5.30 installiert. Nach Upgrade auf v6.00 stürzt es zumindest nicht mehr einfach so zur Laufzeit ab. Ich hatte heute allerdings ein Raid5 mit Quick-Init erstellt und habe dann während ESX gebooted war ein "Verify with fix" laufen lassen. Gleichzeitige I/O Zugriffe hat das System dann nicht so gut vertragen. -> erneut PSOD

Lasse nun nochmal von Grund auf neu einen "Clear" Raid Build laufen und hoffe, dass es dann stabil funktioniert.

Benutzeravatar
Member
Beiträge: 446
Registriert: 11.03.2008, 12:28
Wohnort: Seligenstadt

Nee, das ist nicht das Problem!

Beitragvon sirrossi » 16.09.2008, 09:43

Leider wird bereits bei wiederholtem Aufruf von "arcconf" das System in den Zustand des PSOD versetzt. Dies passierte sowohl mit der ASM Version 5.3x wie auch der 6.xx. Dies wurde auch so von Adaptec bestätigt.
Erst mit ESX Update 4 soll ein von VMware zertifizierter Treiber kommen. Also in 4-6 Monaten :x

Wollen hoffen, das bis dahin die Platten halten.

Member
Beiträge: 8
Registriert: 23.12.2007, 19:37

Beitragvon reg » 16.09.2008, 16:29

Danke Dir für die Information.
Lasse den ASM dann erstmal runter und hoffe einfach mal, dass in den nächsten Monaten nicht mehr als eine Platte ausfällt.

Member
Beiträge: 188
Registriert: 05.02.2007, 13:16

Re: Nee, das ist nicht das Problem!

Beitragvon StevensDE » 16.09.2008, 17:10

sirrossi hat geschrieben:Leider wird bereits bei wiederholtem Aufruf von "arcconf" das System in den Zustand des PSOD versetzt. Dies passierte sowohl mit der ASM Version 5.3x wie auch der 6.xx. Dies wurde auch so von Adaptec bestätigt.
Erst mit ESX Update 4 soll ein von VMware zertifizierter Treiber kommen. Also in 4-6 Monaten :x

Wollen hoffen, das bis dahin die Platten halten.


Das ist natürlich nicht die optimale Lösung...

Benutzeravatar
Member
Beiträge: 446
Registriert: 11.03.2008, 12:28
Wohnort: Seligenstadt

Re: Nee, das ist nicht das Problem!

Beitragvon sirrossi » 17.09.2008, 10:13

StevensDE hat geschrieben:Das ist natürlich nicht die optimale Lösung...


Da gebe ich Dir gerne Recht, welchen Vorschlag hast Du?

Member
Beiträge: 188
Registriert: 05.02.2007, 13:16

Re: Nee, das ist nicht das Problem!

Beitragvon StevensDE » 17.09.2008, 12:13

sirrossi hat geschrieben:Da gebe ich Dir gerne Recht, welchen Vorschlag hast Du?


Wenn ihr wisst, dass das Problem in ESX Update 4 behoben wird, dann würde ich bei VMWare Anfragen ob man den Adaptec zertifizierten ESX Treiber bereits vorher in Form eines Patches erhalten kann.

Die Systeme mit einen instabilen Treiber laufen zu lassen wo es jeden Moment einen "PSOD" geben kann wäre mir auf jeden Fall zu riskant.. Und dann noch bei so einer enorm wichtigen Sache wie Storage / Daten.

Member
Beiträge: 12
Registriert: 17.03.2007, 20:35

Beitragvon JimBeam128 » 17.03.2009, 15:32

Hallo Sirrossi,

habe den Thread bezüglich Adaptec Controller ESX und Adaptec Storage Manager gelesen:

ICH HABE GENAU DAS SELBE PROBELM.

Ohne den Storage Manager Agent läuft der Host ohne Probleme. Sobald ich aber den Agent installiere, dauert es nicht lange bis ich auch n PSOD bekomme.

Habe heute auch bei Adaptec einen Call aufgemacht und dieses Problem beschrieben.

Hast du vielleicht schon eine Lösung zu dem Problem gefunden?

Ich benutze ESX 3.5 U3, leider keine Besserung....

Member
Beiträge: 12
Registriert: 17.03.2007, 20:35

Beitragvon JimBeam128 » 18.03.2009, 08:58

So,

ich werde jetzt mal alle meine weiteren Beiträge auf diesen

http://vmware-forum.de/viewtopic.php?p=55536#55536


Thread posten.

Wir sehn uns da.

Benutzeravatar
Member
Beiträge: 302
Registriert: 20.03.2009, 15:00
Wohnort: Sofia / BG

Beitragvon Saturnous » 28.03.2009, 12:01

Hmm .. soweit ich mich erinner war die proc node der Adaptectreiber recht aussagekräftig. Reicht es zur Überwachung nicht ein cronjob der ein trap sended wenn seine vorletzte Kopie der Procnode sich von der letzten unterscheided ?

So hatte ich das mal unter Debian potato auf einem HP Netserver mit NR4m gelöst, der war ein Adaptec.


Zurück zu „ESX 3 & ESXi 3“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste