Seite 1 von 1

ESX 3.5 friert ein

Verfasst: 27.07.2009, 11:45
von fcmarc
Hallo zusammen,

wir haben ein Problem mit unserem ESX Server und wissen nicht woran es liegt.
Circa 1 x pro Woche friert der ESX Server ein. Man kann ihn nicht mehr pingen und muss ihn folglich hart ausschalten. Danach läuft der ESX wieder eine Woche ohne Probleme, bevor er wieder abstürzt. Die Abstürze treten sporadisch auf. Ich vermute fast, dass es ein Hardwareproblem ist, da der ESX Server vorher einwandfrei lief und wir nichts verändert haben in der Konf.

Anbei das vmkwarning.log, dort habe ich folgende Einträge gefunden:

Cpu: 1321: BSP variable MTRR #0 mask too small; resetting from fc0000800 to 3fc0000800 to match PCPU phys addr size (38)

Host: 2499: irq 0 is not valid

VMKAcpi: 566: duplicate entries for bus 10:0, INTA, ioapicID = 8, INTIn = 16

Habt ihr eine Vermutung, woran die Abstürze liegen könnten? Oder benötigt ihr von mir noch andere Logs, um den Fehler einzugrenzen? Für Hilfe wäre ich sehr dankbar, da ich nicht genau weiß, was ich noch überprüfen soll.

Viele Grüße

Verfasst: 27.07.2009, 12:54
von Tschoergez
hast Du nen gültigen support-vertrag bei VMware?

wen ja, ticket eröffnen, denen die logs schicken, dann können die spezifisch helfen, die kaputte komponente zu finden.

Ansonsten musst Du halt ganz klassich händisch ausprobieren.. Ich würd mal mit memtest anfangen.

viele grüße,
Jörg

Verfasst: 27.07.2009, 13:29
von deathrow
Da es ja doch auch diesen Sommer ab und zu warm wird:

Hitzeprobleme im Serverraum?

Verfasst: 29.07.2009, 15:41
von fcmarc
So wie es aussieht, ist der RAM defekt (ich muss nur rausfinden, welcher der 16 Riegel a 4GB defekt ist :D). Bei diversen RAM Test (Hardanalyzer, Memtest) steigt die VMWARE komplett aus, CPU Tests usw. rennen einwandfrei durch. Ich hoffe, dass dies wirklich am Speicher liegt und nicht an einer defekten RAM Bank.

Vielen Dank für eure Hilfe, ich werdev ersuchen beim Distributor 16 neue Riegel zu bekommen :D