ESX 6.0 U2 friert quasi ein wenn eine disk beschädigt ist
Verfasst: 01.05.2016, 20:36
Hallo zusammen,
ich hab ein äusserst seltsames phänomän mit dem neuesten ESXi.
zuerst dachte ich das die iSCSI anbindung schuld ist (das log hat nur so gewütet) jedoch nach verschieben der disks und entfernen des software initiators besteht das problem immer noch, jedoch nun von der internen disk.
Auf dieser Disk dürfe es einen defekten Block geben, denn sobald ich die virtuelle maschine kopiere (Download im Storage Explorer, oder Veeam Zip) friert der vmKernel ein.
Einfrieren heißt:
PING auf das interface geht noch
per IPMI Console kann ich mit ALT und F1 - F2 - F11 und F12 zwischen den einzelnen screens umschalten
auf F12 (dem vmkernel) log geht die hölle ab
auf F2 komm ich bis zum einloggen, dannach ist finster
SSH ist finster
vCenter ist finster
direkter mit dem client drauf ist´s ebenfalls finster
einzige möglichkeit den Reset knopf drücken!
Der Host ist wie üblich auf einem USB Stöpsel, bzw. bei diesen Maschinen auf einem DOM (16GB Disk on Module).
Es gibt ne main und eine backup maschine die baugleich sind.
In beiden steckt eine einzelne 1TB SSD die die OS Laufwerke der Guest systeme beinhaltet (diese wird einmal täglich repliziert).
Die Daten liegen zum größtenteil auf Iscsi Targets die jetzt direkt in den Gast Systemen verbunden sind (wie eingangs erwähnt waren die ersten log errors vom ISCSI initiator).
Jetzt hab ich beide SSD´s in einem Host weil ich die system Disk noch rausziehen wollte und im zuge dessen jetzt die gewissheit habe das diese hinüber ist.
Was mich jetzt nur anfuxt ist, das bei dem ausfall der vmkernel komplett ausfällt und bei einer virtualisierungslösung der ausfall eines storrages ja keine so großen probleme bereitet (ausser den dauf befindlichen gästen).
In dem log wird der AHCI Controller soft, hard und geforced resettet und das im 2 sekunden tackt.
Und schlussendlich ist der Host stehend KO weil er mit sich selbst beschäftigt ist.
Solche Probleme hate ich mit 5.5 noch nie und hier sind auch schon mal ab und an storrages ausgefallen, vorallem die ADAPTEC (Microsemi) Controller haben die Hosts täglich gekillt.
ich hab ein äusserst seltsames phänomän mit dem neuesten ESXi.
zuerst dachte ich das die iSCSI anbindung schuld ist (das log hat nur so gewütet) jedoch nach verschieben der disks und entfernen des software initiators besteht das problem immer noch, jedoch nun von der internen disk.
Auf dieser Disk dürfe es einen defekten Block geben, denn sobald ich die virtuelle maschine kopiere (Download im Storage Explorer, oder Veeam Zip) friert der vmKernel ein.
Einfrieren heißt:
PING auf das interface geht noch
per IPMI Console kann ich mit ALT und F1 - F2 - F11 und F12 zwischen den einzelnen screens umschalten
auf F12 (dem vmkernel) log geht die hölle ab
auf F2 komm ich bis zum einloggen, dannach ist finster
SSH ist finster
vCenter ist finster
direkter mit dem client drauf ist´s ebenfalls finster
einzige möglichkeit den Reset knopf drücken!
Der Host ist wie üblich auf einem USB Stöpsel, bzw. bei diesen Maschinen auf einem DOM (16GB Disk on Module).
Es gibt ne main und eine backup maschine die baugleich sind.
In beiden steckt eine einzelne 1TB SSD die die OS Laufwerke der Guest systeme beinhaltet (diese wird einmal täglich repliziert).
Die Daten liegen zum größtenteil auf Iscsi Targets die jetzt direkt in den Gast Systemen verbunden sind (wie eingangs erwähnt waren die ersten log errors vom ISCSI initiator).
Jetzt hab ich beide SSD´s in einem Host weil ich die system Disk noch rausziehen wollte und im zuge dessen jetzt die gewissheit habe das diese hinüber ist.
Was mich jetzt nur anfuxt ist, das bei dem ausfall der vmkernel komplett ausfällt und bei einer virtualisierungslösung der ausfall eines storrages ja keine so großen probleme bereitet (ausser den dauf befindlichen gästen).
In dem log wird der AHCI Controller soft, hard und geforced resettet und das im 2 sekunden tackt.
Und schlussendlich ist der Host stehend KO weil er mit sich selbst beschäftigt ist.
Solche Probleme hate ich mit 5.5 noch nie und hier sind auch schon mal ab und an storrages ausgefallen, vorallem die ADAPTEC (Microsemi) Controller haben die Hosts täglich gekillt.