Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

ESX VM einfrieren

Moderatoren: Dayworker, irix

Member
Beiträge: 237
Registriert: 08.05.2008, 15:36

ESX VM einfrieren

Beitragvon nadsas » 29.06.2015, 09:05

Hallo zusammen

In unserer ESX5.5 Farm haben wir ab und zu das Phänomen, dass ein ESX Server Probleme macht und dann mehrere VMs einfrieren. Aber nicht alle VMs auf dem Server.
Jegliche INteraktionen mit dem server schlagen dann fehl, VMotion, Maintenance Mode etc. geht alles nicht mehr. Erst ein Hardreset bringt Heilung. Aber die restlichen 15 VMs die drauf sind laufen Problemlos bis zum Hardreset. was ja logisch ist.
Warum aber können nur ein paar VMs sich aufhängen und andere weiterlaufen ? Memory Probleme ?

:?:

Danke
Gruss
Nadsas

Guru
Beiträge: 2761
Registriert: 23.02.2012, 12:26

Beitragvon ~thc » 29.06.2015, 09:15

Ich hatte einen ähnlichen Effekt bisher nur einmal:

Ich wurde benachrichtigt, dass die Server (VMs) nach einem Wechsel einer durchgereichten USB-Platte nicht mehr erreichbar sind. Nach 25 Minuten ohne Eingriff waren sie dann plötzlich wieder "da" und alles lief normal. Die VMs waren laut ihren Ereignisanzeigen/Logdateien unbeeindruckt weitergelaufen, aber die Logs des ESXi sahen wie nach einem Neustart der Management-Dienste oder des Host aus.

Im Prinzip hatten sich nur die Mgmt-Prozesse und vermutlich die vSwitche aufgehängt, während die VMs weiterliefen.

Member
Beiträge: 237
Registriert: 08.05.2008, 15:36

Beitragvon nadsas » 30.06.2015, 12:44

heute schon wieder 3 von 20 VMs eingefroren.
Rest ist erreichbar..... Ist heute aber ein anderer ESX Server...

Ideen ?

Danke
Nadsas

Experte
Beiträge: 1845
Registriert: 04.10.2011, 14:06

Beitragvon JustMe » 30.06.2015, 12:57

Kann man sich am Direct Console User Interface anmelden?
Kann man an der ESXi-Konsole noch mit Alt-F12 auf das Live-vmkernel.log umschalten?
Lassen sich die noch nicht eingefrorenen VMs aus dem Gast-OS heraus (z.B. per RDP) herunterfahren?
Was findet sich nach dem ESXi-Neustart in den /var/(run/)log/vmkernel.log und vmkwarning.log Dateien?

Member
Beiträge: 237
Registriert: 08.05.2008, 15:36

Beitragvon nadsas » 30.06.2015, 13:52

Hallo

Die ersten beiden Punkte mus sich noch prüfen.
Die VMS die noch erreichbar sind lassen sich auch herunterfahren.

hier auszug aus dem log:


2015-06-29T06:08:19.130Z cpu24:11580004)WARNING: NetDVS: 547: portAlias is NULL
TSC: 842440 cpu0:1)WARNING: ACPI: 1386: SPCR: Detected unsupported reg bit width (0); will assume 8 bits.
0:00:00:00.000 cpu0:1)WARNING: Serial: 646: Invalid serial port config: mem-mapped to addr 0x0.
0:00:00:03.635 cpu0:1)WARNING: Vmkperf: 3928: 2 perf counters in use by BIOS
0:00:00:08.900 cpu0:32768)WARNING: Cpu: 2143: Cache latency measurement may be inaccurate min= 185 max= 1041 avg= 228
0:00:00:09.067 cpu0:32768)WARNING: PCI: 994: 0000:20:00.0 bind to PCI bus driver failed with Bad parameter.
2015-06-29T06:15:08.127Z cpu15:33506)WARNING: hpnmi: NMI module is not supported on this HP Server. NMI module will not load.
2015-06-29T06:15:08.128Z cpu15:33506)WARNING: Elf: 2822: Kernel based module load of hpnmi failed: Failure <Mod_LoadDone failed>
2015-06-29T06:15:08.171Z cpu4:33507)WARNING: LinuxSignal: 538: ignored unexpected signal flags 0x2 (sig 17)
2015-06-29T06:15:09.410Z cpu4:33507)WARNING: qlnativefc: (b:0.0): scsi(0): num_io_queue for CPU affinity use: 2
2015-06-29T06:15:12.192Z cpu4:33507)WARNING: qlnativefc: (27:0.0): scsi(1): num_io_queue for CPU affinity use: 2
2015-06-29T06:15:15.170Z cpu8:33374)WARNING: Team.etherswitch: TeamES_Activate:668: Failed to initialize beaconing on portset 'pps': Not implemented.
2015-06-29T06:15:24.100Z cpu29:33528)WARNING: IT: 346: Removing vector 92 while it's being controlled by 2 36
2015-06-29T06:15:24.191Z cpu29:33528)WARNING: IT: 346: Removing vector 82 while it's being controlled by 2 25
2015-06-29T06:15:33.880Z cpu0:33374)WARNING: NetDVS: 547: portAlias is NULL
2015-06-29T06:15:33.892Z cpu0:33374)WARNING: NetDVS: 547: portAlias is NULL

Experte
Beiträge: 1845
Registriert: 04.10.2011, 14:06

Beitragvon JustMe » 30.06.2015, 14:25

Tja, ich schaetze mal, dass von diesem Logauszug allerhoechstens die erste Zeile von VOR dem Reboot stammt....
Interessanter duerften die Informationen von VOR diesem Neustart sein. Unter der Voraussaetzung, dass ueberhaupt noch was geloggt wird, natuerlich.

Wenn die heruntergefahrenen VMs auf einem anderen Host wieder gestartet werden, laufen die dann ganz normal hoch, oder meinen die, unerwartet heruntergefahren worden zu sein?

Ist mit HP schon geklaert worden, ob die Server HW-technisch auf dem neuesten Stand (und ggfs. supported) sind?

Gibt's in den Logs vielleicht Meldungen à la "hostd detected to be non-responsive"?

Profi
Beiträge: 993
Registriert: 31.03.2008, 17:26
Wohnort: Einzugsbereich des FC Schalke 04
Kontaktdaten:

Beitragvon kastlr » 30.06.2015, 14:43

Hallo zusammen,

unter /var/run/log/ liegen sowohl aktuelle als auch archivierte Logfiles, vielleicht hilft das ja weiter.

Gruß,
Ralf

King of the Hill
Beiträge: 13656
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 01.07.2015, 15:50

2015-06-29T06:08:19.130Z cpu24:11580004)WARNING: NetDVS: 547: portAlias is NULL
TSC: 842440 cpu0:1)WARNING: ACPI: 1386: SPCR: Detected unsupported reg bit width (0); will assume 8 bits.
Beide Meldungen finde ich immer wieder auch im Zusammenhang mit unzureichender Kühlung. Dazu paßt in meinen Augen dann auch die Fehlermeldung zum hpnmi-Modul, aber ohne vollständige Log's können wir größtenteils nur raten.


Zurück zu „vSphere 5.5 / ESXi 5.5“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste