Virtuelle Maschine auf einem von zwei ESXi im HA-Cluster plötzlich unerreichbar
Verfasst: 20.09.2018, 10:53
Wir nutzen einen HA-Cluster mit zwei ESXi , 6.0.0 , 6921384
"Plötzlich", am 2018-08-03 verloren mehr und mehr physische Netzendgeräte den Kontakt zum Netzwerk, nachdem dieser einmal unterbrochen war. Schlussendlich fand ich heraus, dass unser Radius-Server auf ESXi (Nr1) nicht mehr erreichbar war. Der Radiusserver ist ein Debian GNU/Linux 5 (64-bit), keine VMware-Tools. Lief bis dahin ohne jedes Problem.
Von einem zum anderen Tag war er nicht mehr erreichbar. Möglicherweise interessant: am 2018-07-25 wurde von einem mittlerweile abgegangenen Kollegen nach Updates für die ESXi gescannt und möglicherweise auch etwas installiert. Habe ich noch nicht nachvollziehen können, ein Hinweis auf den korrekten Log wäre hilfreich.
Am physischen, wie auch am VM-Netzwerk ist nichts verändert worden.
Offenbar sind andere virtuelle Maschinen auf dem selben Host auch nicht betroffen von diesem seltsamen Verhalten.
Ich beschreibe die Situation kurz am Beispiel der...
...ESXi(Nr1) und ESXi(Nr2)
...der virtuellen Server DC01, DC01 und Radius
--> alle 3 vServer befinden sich auf ESXi(NR1), jeder kann jeden pingen
--> DC01 computing-ressource wird migriert auf ESXi(Nr1), DC01 & DC02 können einander weiterhin pingen. DC02 & Radius ebenfalls, DC01 & Radius können einander nicht mehr erreichen
Nun laufen zu Sicherheit erst einmal alle virtuellen Server auf ESXi(Nr2) und alles funktioniert. Die Konfigurationen scheinen prinzipiell auf beiden Hosts gleich zu sein. Ich finde keine Erklärung, warum ein vServer auf einem ESXi(Nr1) Probleme macht, andere nicht, und auf ESXi(Nr2) alles läuft.
Irgendeine Idee, vielleicht soagar Lösungen..?
"Plötzlich", am 2018-08-03 verloren mehr und mehr physische Netzendgeräte den Kontakt zum Netzwerk, nachdem dieser einmal unterbrochen war. Schlussendlich fand ich heraus, dass unser Radius-Server auf ESXi (Nr1) nicht mehr erreichbar war. Der Radiusserver ist ein Debian GNU/Linux 5 (64-bit), keine VMware-Tools. Lief bis dahin ohne jedes Problem.
Von einem zum anderen Tag war er nicht mehr erreichbar. Möglicherweise interessant: am 2018-07-25 wurde von einem mittlerweile abgegangenen Kollegen nach Updates für die ESXi gescannt und möglicherweise auch etwas installiert. Habe ich noch nicht nachvollziehen können, ein Hinweis auf den korrekten Log wäre hilfreich.
Am physischen, wie auch am VM-Netzwerk ist nichts verändert worden.
Offenbar sind andere virtuelle Maschinen auf dem selben Host auch nicht betroffen von diesem seltsamen Verhalten.
Ich beschreibe die Situation kurz am Beispiel der...
...ESXi(Nr1) und ESXi(Nr2)
...der virtuellen Server DC01, DC01 und Radius
--> alle 3 vServer befinden sich auf ESXi(NR1), jeder kann jeden pingen
--> DC01 computing-ressource wird migriert auf ESXi(Nr1), DC01 & DC02 können einander weiterhin pingen. DC02 & Radius ebenfalls, DC01 & Radius können einander nicht mehr erreichen
Nun laufen zu Sicherheit erst einmal alle virtuellen Server auf ESXi(Nr2) und alles funktioniert. Die Konfigurationen scheinen prinzipiell auf beiden Hosts gleich zu sein. Ich finde keine Erklärung, warum ein vServer auf einem ESXi(Nr1) Probleme macht, andere nicht, und auf ESXi(Nr2) alles läuft.
Irgendeine Idee, vielleicht soagar Lösungen..?