ich grüße euch. Ich komme mit einem Problem zu euch, dass mir Kopfzerbrechen bereitet, vielleicht ist jemand von euch schonmal darüber gestolpert.
Folgende Situation. Upgrade von vCenter 6.7 auf 7.0.3.01100 durchgeführt. Eigentlich auch alles tutti.
Nun gab es allerdings seit dem Update bereits zwei VM's (einmal linux, einmal windows) die das gleiche Fehlerbild aufgewiesen haben, die Linux Kiste ist zum 4ten mal davon betroffen.
Fehlerbeschreibung
Die VM reagiert nicht mehr. Komplett tot. Über die vCenter Konsole sieht man noch den command prompt aber tippen ist nicht mehr möglich. VM kann nicht heruntergefahren oder hart ausgeschalten werden; faktisch ist gar kein management der VM mehr möglich.
Fehler tritt scheinbar zufällig auf. Mal 4 Wochen nicht, dann zwei mal innerhalb von 3 Tagen.
Bisherige Fehlerbehebungsversuche
Ich bin also über SSH auf dem ESX Host und habe mir über esxcli die VM rausgesucht:
Code: Alles auswählen
[root@servername:~] esxcli vm process list | grep 9665414 -C3
VMName
World ID: 9665419
Process ID: 0
VMX Cartel ID: 9665414
UUID: 42 37 3c d3 cc c2 59 20-ee 99 73 4d c8 f9 f3 11
Display Name: VMName
Config File: /vmfs/volumes/5e35fd2e-ca4e3096-0e2c-98f2b32ab622/VMName/VMName.vmx
Da nichts mehr ging wollte ich das Teil abschießen:
Code: Alles auswählen
esxcli vm process kill -t=hard -w=9665419
Nach dem abfeuern des Befehls kommt kein Fehler. Alles ok - allerdings ist das Ding im selben Zustand wie zuvor auch. Also nochmal die process liste geholt, teil immer noch da. Nochmal versucht zu killen, keine Chance:
Code: Alles auswählen
Unable to kill Virtual Machine. Error was : Unable to kill virtual machine. Error returned was No such process
Ich habe daraufhin das vCenter neu gestartet, und beiden für das Cluster zuständige ESX-Server haben von mir einen "services.sh restart" bekommen - das Teil ist immer noch da.
Offene Fragen
1. Was kann ich noch versuchen um diesen Zustand zu beheben? Aktuell stelle ich die VM aus dem Backup wieder her und vergebe eine neue MAC-Adresse damit die alte VM nicht mehr stört. Das Teil ist knapp 800gb groß und der Prozess dauert daher einige Zeit und ist natürlich nicht Sinn der Sache
2. Irgendwelche Ideen, wodurch das Verhalten auftritt und wie ich es zukünftig verhindern kann?
Vielen Dank und viele Grüße