Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Ausfall und Reboot 3 mal am Tag trotz Hardware Tausch

Moderatoren: irix, Dayworker

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Ausfall und Reboot 3 mal am Tag trotz Hardware Tausch

Beitragvon torstenv » 14.09.2012, 08:08

Hi!

Mein ESXi4 rebootet selbstständig häufig, wobei die Hardware angeblich nicht die Ursache sein soll. Und ich finde keinen Ansatz, woran das liegen könnte.

Details:
Ich habe bei HostEurope eine Hardware gemietet, auf der ich einen VMWare ESXi4.1.0 800380 nebst einigen VMs laufen habe.

Seit ca. 10 Tagen passiert es immer wieder, dass der ESXi4 Server ausfällt. Von außen sieht das aus wie Power Down. Zunächst blieb die Maschine dann einige Zeit (bis zu 3h) nicht erreichbar, dann bootete sie von alleine. In den Logs im VSphere Client unter Ereignisse) kann ich dann nur noch den Bootvorgang sehen, der dem Ausfall folgt. Ich finde bisher keine Logs, die mir sagen, warum das Ding ausgegangen ist.

Damit habe ich mich an HostEurope gewandt und die haben dann (angeblich) die gesamte Hardware außer der HD getauscht. Ich konnte aber an den veränderten BIOS Einstellungen feststellen, dass das Motherboard auf jeden Fall wirklich getauscht wurde.

Seit Tausch der Hardware ist die Downtime kürzer, also nach Ausfall dauert es nicht mehr, sondern der ESXi bootet sofort wieder hoch und schaltet die VMs ein.

Dennoch ist die Downtime genau so häufig.

Ich habe gerade in meinem Nagios nachgeschaut und sehe, dass eine der überwachten VMs offenbar mehrfach täglich nicht erreichbar ist: in den letzten Tagen z.B.: 08:50, 21:40, 01:30 Also 3 Reboots in unregelmäßigen Abständen innerhalb 24h. Den ESXi selbst habe ich nicht im Nagios.

Wenn HostEurope behauptet die Hardware bis auf die HD getauscht zu haben, ist es dann realistisch, dass die einzige Komponente, die noch nicht getauscht wurde (die HD) die Ursache sein könnte? Ganz ohne sichtbare Meldungen in den Logs?

HostEurope meinte, nach Hardware Tausch sei von nun an die Ursache in der Software zu suchen. Das kann ich mir irgendwie nicht vorstellen.

Tipps?

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 14.09.2012, 08:18

schau mal auf dem server im vmkernel.log, ob Du da evtl. den Grund für die Crashs findest....
Die Hardware ist für ESX supported?
Viele Grüße,
Jörg

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Beitragvon torstenv » 14.09.2012, 08:26

Tschoergez hat geschrieben:schau mal auf dem server im vmkernel.log

Du meinst /var/log/messages?
/var/log/messages enthält (hier) nur die Daten seit dem Start. Also ich sehe da toll, wie das Ding gebootet hat, sehe aber nichts, was zeitlich VOR dem Boot liegt, somit also nicht den Grund für den Reboot.

Die Hardware ist für ESX supported?

Ob offiziell weiß ich nicht, jedenfalls lief das ja schon mehr als ein Jahr lang problemlos.

Experte
Beiträge: 1006
Registriert: 30.10.2004, 12:41

Beitragvon mbreidenbach » 14.09.2012, 09:11

Nein - die ESXi logfiles. Speichern der Logfiles auf einem Datastore kann man unter software advanced settings syslog konfigurieren.

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Beitragvon torstenv » 14.09.2012, 09:48

mbreidenbach hat geschrieben:Nein - die ESXi logfiles. Speichern der Logfiles auf einem Datastore kann man unter software advanced settings syslog konfigurieren.


Danke.

Daran hatte ich noch nicht gefummelt. Ich habe das jetzt mal so eingestellt, dass die Syslog Meldungen lokal im Datastore und auch remote auf unserem Syslog Server abgelegt werden. Vielleicht kann ich ja was sehen, wenn das Ding das nächste mal grätscht.

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Beitragvon torstenv » 14.09.2012, 14:59

Ich habe jetzt die Logs vor dem Reboot. Sagt das jemandem was? Ich finde, das sagt nichts, denn diese Art Einträge sehe ich auch sonst den ganzen Tag über (ohne zu wissen, was das soll).
Um 13:29:07 beginnen die Einträge des neuen Boots. Ist demnach der Schluss zulässig, das die Ursache des Reboots nicht in den Logs zu finden ist?

Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.131 432A3B90 verbose 'Proxysvc Req00440'] New proxy client TCP(local=127.0.0.1:54597, peer=127.0.0.1:80)
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.132 FFAA8F40 info 'Vmomi'] Activation [N5Vmomi10ActivationE:0xe4198b8] : Invoke done [waitForUpdates] on [vmodl.query.PropertyCollector:ha-property-collector]
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.132 FFAA8F40 verbose 'Vmomi'] Arg version:
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: "50"
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.133 FFAA8F40 info 'Vmomi'] Throw vmodl.fault.RequestCanceled
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.133 FFAA8F40 info 'Vmomi'] Result:
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: (vmodl.fault.RequestCanceled) {
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: dynamicType = <unset>,
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: faultCause = (vmodl.MethodFault) null,
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: msg = "",
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: }
Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.134 43BD9B90 error 'App'] Failed to read header on stream TCP(local=127.0.0.1:56261, peer=127.0.0.1:0): N7Vmacore15SystemExceptionE(Connection reset by peer)
Sep 14 13:20:57 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:57.789 432E4B90 verbose 'DvsManager'] PersistAllDvsInfo called
Sep 14 13:21:19 myESXi4.hosteurope.de Hostd: [2012-09-14 11:21:19.949 432E4B90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Sep 14 13:22:50 myESXi4.hosteurope.de Hostd: [2012-09-14 11:22:50.102 FFD9FB90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Sep 14 13:22:53 myESXi4.hosteurope.de Hostd: [2012-09-14 11:22:53.124 43B98B90 verbose 'ResourcePool ha-root-pool'] Root pool capacity changed from 2985MHz/6091MB to 2985MHz/6089MB
Sep 14 13:23:53 myESXi4.hosteurope.de Hostd: [2012-09-14 11:23:53.125 43BD9B90 verbose 'ResourcePool ha-root-pool'] Root pool capacity changed from 2985MHz/6089MB to 2985MHz/6090MB
Sep 14 13:24:20 myESXi4.hosteurope.de Hostd: [2012-09-14 11:24:20.242 FFD9FB90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Sep 14 13:29:07 myESXi4.hosteurope.de vmklogger: Successfully daemonized.
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 0 cpu0:0)Init: 245: cpu 0: early measured tsc speed is 2133408898 Hz
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 23296 cpu0:0)Cpu: 316: id1.version 6f2
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 30496 cpu0:0)APIC: 153: X2APIC disabled
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 43504 cpu0:0)CPUIntel: 349: Intel Enhanced SpeedStep is supported but disabled in BIOS
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 47552 cpu0:0)CPUIntel: 430: C1E feature enabled by the BIOS
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 52592 cpu0:0)Cpu: 1139: initial APICID=0x0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 57200 cpu0:0)MicrocodeIntel: 516: Update signature 5600000000, Platform ID 8a048828.
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 62320 cpu0:0)Cpu: 1391: 36 physical bits, 48 virtual bits
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 66200 cpu0:0)Cpu: 1923: MTRR: cap=0x508 with 8 variable MTRRs on BSP 0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 70648 cpu0:0)Cpu: 1959: MTRR: deftype=0xc00, enabled bit=1 and default type=0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 76312 cpu0:0)Cpu: 1678: Variable MTRR 0: start=0x0 mask=0xe00000800 end=0x0 type=0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 82560 cpu0:0)Cpu: 1678: Variable MTRR 1: start=0x0 mask=0xfc0000800 end=0x0 type=0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 87848 cpu0:0)Cpu: 1678: Variable MTRR 2: start=0x0 mask=0xfc0000800 end=0x0 type=0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 95360 cpu0:0)Cpu: 1831: start=0x0 type=0x606060606060606
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 100760 cpu0:0)Cpu: 1831: start=0x80000 type=0x606060606060606
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 105392 cpu0:0)Cpu: 1831: start=0xa0000 type=0x0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 109168 cpu0:0)Cpu: 1831: start=0xc0000 type=0x505050505050505
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 113616 cpu0:0)Cpu: 1831: start=0xc8000 type=0x505050505050505
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 118048 cpu0:0)Cpu: 1831: start=0xd0000 type=0x5050505
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 121960 cpu0:0)Cpu: 1831: start=0xd8000 type=0x0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 125768 cpu0:0)Cpu: 1831: start=0xe0000 type=0x0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 129464 cpu0:0)Cpu: 1831: start=0xe8000 type=0x505050500000000
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 133840 cpu0:0)Cpu: 1831: start=0xf0000 type=0x505050505050505
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 138352 cpu0:0)Cpu: 1831: start=0xf8000 type=0x505050505050505
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 757768 cpu0:0)Cpu: 197: type 2
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 765608 cpu0:0)Cpu: 198: numCores 2, numHT 1
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 768808 cpu0:0)Cpu: 200: L2 cache : size 2097152, assoc. 8
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 772432 cpu0:0)Cpu: 202: L3 cache : size -1, assoc. -1
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 777688 cpu0:0)Init: 252: BSP Apic ID: 0
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 38914560 cpu0:0)ACPI: 1914: found RSDP @ 0xffff8100000f9ea0 RSDT @ 0x000f9ec4 XSDT @ 0x00000000000f9f14
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 38943312 cpu0:0)ACPI: 1774: valid XSDT @ 0xf9f14
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 38953784 cpu0:0)ACPI: 1978: Couldn't find DMAR
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 38991392 cpu0:0)ACPI: 1774: valid APIC @ 0xfa0f8
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39010960 cpu0:0)ACPI: 1774: valid HPET @ 0xfa1cc
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39077040 cpu0:0)ACPI: 1774: valid FACP @ 0xfa004
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39080496 cpu0:0)ACPI: 2012: RTC Century Byte NVRAM offset: 0x32
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39319048 cpu0:0)VGAConsole: 394: start b8000 end c0000
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39322928 cpu0:0)VGAConsole: 406: 0xffff8100000b8000
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 39326832 cpu0:0)VGAConsole: 281: 16 pixels high
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 43176072 cpu0:0)VGAConsole: 586: Sucess: 8 screens
Sep 14 13:29:07 myESXi4.hosteurope.de vmkernel: TSC: 43179968 cpu0:0)ACPI: 2478: iapcBootArch = 0x0013


Ansonsten bleibt die Frage, ob eine HD die Ursache des Problems sein kann. Weil das eben die Komponente ist, die noch nicht getauscht wurde.

King of the Hill
Beiträge: 13560
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 14.09.2012, 20:05

Sep 14 13:20:46 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:46.134 43BD9B90 error 'App'] Failed to read header on stream TCP(local=127.0.0.1:56261, peer=127.0.0.1:0): N7Vmacore15SystemExceptionE(Connection reset by peer)
Sep 14 13:20:57 myESXi4.hosteurope.de Hostd: [2012-09-14 11:20:57.789 432E4B90 verbose 'DvsManager'] PersistAllDvsInfo called
Sep 14 13:21:19 myESXi4.hosteurope.de Hostd: [2012-09-14 11:21:19.949 432E4B90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Sep 14 13:22:50 myESXi4.hosteurope.de Hostd: [2012-09-14 11:22:50.102 FFD9FB90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Sep 14 13:22:53 myESXi4.hosteurope.de Hostd: [2012-09-14 11:22:53.124 43B98B90 verbose 'ResourcePool ha-root-pool'] Root pool capacity changed from 2985MHz/6091MB to 2985MHz/6089MB
Sep 14 13:23:53 myESXi4.hosteurope.de Hostd: [2012-09-14 11:23:53.125 43BD9B90 verbose 'ResourcePool ha-root-pool'] Root pool capacity changed from 2985MHz/6089MB to 2985MHz/6090MB
Sep 14 13:24:20 myESXi4.hosteurope.de Hostd: [2012-09-14 11:24:20.242 FFD9FB90 verbose 'Cimsvc'] Ticket issued for CIMOM version 1.0, user root
Die Einträge finde ich sehr merkwürdig. Für mich bedeutet das, daß irgendetwas mit dem Root-User Einstellungen vornimmt.
Was versteckt sich eigentlich hinter CIMOM version 1.0? Dazu sollte HostEurope Antworten liefern können.

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Beitragvon torstenv » 15.09.2012, 11:16

Die Einträge finde ich sehr merkwürdig. Für mich bedeutet das, daß irgendetwas mit dem Root-User Einstellungen vornimmt.
Was versteckt sich eigentlich hinter CIMOM version 1.0? Dazu sollte HostEurope Antworten liefern können.

Nee, ne schnelle Google Sucher ergab das hier:
http://communities.vmware.com/thread/333647
Also das ist offenbar nichts HostEurope Spezifisches. Aber in dem Thread haben die Leute ein ähnliches Problem, das möglicherweilse mit den HDs zusammen hängt. Ich lasse jetzt die HDs tauschen und wechsle dabei auf ESXi5 in der Hoffnung, dass das Problem dann weg ist.

Member
Beiträge: 33
Registriert: 19.12.2005, 19:25

Gelöst: Neue Platte und Update auf ESXI5.1

Beitragvon torstenv » 17.09.2012, 15:59

HostEurope hat eine neue Platte installiert und ESXi5.1 installiert. Das Problem scheint seither nicht mehr aufzutreten.


Zurück zu „ESXi 4“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste