Hallo!
Bereits zweimal in den letzten 4 Wochen hatte ich folgendes Problem:
VC schreibt:
An error occured during configuration of the HA Agent on the host.
... HA agent on SSS in cluster CCC in DDD has an error
... Unable to contact a primary HA agent in cluster CCC in DDD
... HA agent disabled on SSS in cluster CCC in DDD
... HA is being disabled on SSS in cluster CCC in datacenter DDD
wobei:
... steht für Datum und Uhrzeit
SSS = Servername
CCC = Clustername
DDD = Datacentername
Alle virtuellen Maschinen sind dann ausgeschaltet.
Abhilfe erfolgt durch Anwahl von "Reconfigure for HA" im VC.
Danach starte ich alle VM's von Hand.
Versionen:
VirtualCenter 2.0.2 Build 50618
1 mal ESX-Server 3.0.2 build-52542
1 mal ESX-Server 3.0.1 build-37303
Hierzu verschiedene Fragen:
1. Wurden die VM's hart abgeschaltet oder ordentlich herunter gefahren?
2. Kann das Problem an den verschiedenen Versionen der ESX-Server liegen?
3. Kann das Problem an zu wenig Memory liegen (wir müssen ohnehin aufrüsten)?
Olaf
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
Fehler beim HA Agent - alle VM's aus
- angoletti1
- Experte
- Beiträge: 1323
- Registriert: 08.07.2005, 16:41
- Wohnort: bei Trier
Hi Olaf,
als erste bring mal die ESX auf die selbe Version. Das wird wohl auch der erste Schritt sein, wenn du den Support bemühst.
An zu wenig Memory kann es eigentlich nicht liegen, das macht dem ESX nichts aus, nur die VMs laufen dann nicht ganz so performant.
Wie sind denn deine Einstellungen bezüglich HA? Entweder bleiben die VMs im HA-Szenario an oder werden hart abgeschaltet.
Grüße
Chris
als erste bring mal die ESX auf die selbe Version. Das wird wohl auch der erste Schritt sein, wenn du den Support bemühst.
An zu wenig Memory kann es eigentlich nicht liegen, das macht dem ESX nichts aus, nur die VMs laufen dann nicht ganz so performant.
Wie sind denn deine Einstellungen bezüglich HA? Entweder bleiben die VMs im HA-Szenario an oder werden hart abgeschaltet.
Grüße
Chris
Hi Chris,
danke für die schnelle Antwort.
Upgrade auf die selbe Version mach ich.
Einstellungen in HA sind auf "Power off". Sorry, hatte ich nicht überprüft. Das sind aber wohl die Standard-Einstellungen, und das hat wohl sicher einen Grund, oder?
Kann es Probleme geben, wenn ich die VM's auf "Leave powered on" stelle?
Falls nicht, würde ich das jetzt machen.
HA steht bei mir auf Standardeinstellungen.
Welcher Wert ist sinnvoll für "Number of host failures allowed"?
Und was macht unter "Admission Control" mehr Sinn:
"Do not power on virtual machines ..."
oder
"Allow virtual machines to be powered on ..." ?
Olaf
danke für die schnelle Antwort.
Upgrade auf die selbe Version mach ich.
Einstellungen in HA sind auf "Power off". Sorry, hatte ich nicht überprüft. Das sind aber wohl die Standard-Einstellungen, und das hat wohl sicher einen Grund, oder?
Kann es Probleme geben, wenn ich die VM's auf "Leave powered on" stelle?
Falls nicht, würde ich das jetzt machen.
HA steht bei mir auf Standardeinstellungen.
Welcher Wert ist sinnvoll für "Number of host failures allowed"?
Und was macht unter "Admission Control" mehr Sinn:
"Do not power on virtual machines ..."
oder
"Allow virtual machines to be powered on ..." ?
Olaf
- angoletti1
- Experte
- Beiträge: 1323
- Registriert: 08.07.2005, 16:41
- Wohnort: bei Trier
Hi,
was das "leave powerd on" bzw. "power off" angeht:
Damit HA funktionieren kann, müssen die VMs ausgeschaltet werden. Ist ja auch klar, da sonst der "ausgefallene" ESX Server ja noch auf die Dateien zugreifen könnte, denn ein HA-Szenario kann ja auch sein, dass der Hosts die Netzwerkverbindung verliert, aber der Server und HBA noch sauber arbeiten. Genau für dieses Szenario gibt es aber auch die "leave powerd on" - Funktion. Wenn die VMs dann anbleiben, starten sie zwar nicht - wie mit HA gedacht - auf einem anderen Host, aber so hast du noch die Möglichkeit die VM soft herunterzufahren.
Was "Number of host failures allowed" angeht muss man je nach Umgebung entscheiden. Bei einem Cluster von 10 Hosts setze ich den Wert gerne auf 2. Somit habe ich immer einen Host, den ich warten kann und zusätzlich kann einer ausfallen. Der Wert macht eigentlich nur Sinn, wenn du HA auch so eingestellt hast, das keine VMs mehr gestartet werden können, wenn die HA-settings nicht mehr erfüllt werden. Das kann event. sehr nervig werden...
Dies kannst du mit "Do not power on virtual machines ..." bzw. "Allow virtual machines to be powered on ..." einstellen.
Grüße
Chris
was das "leave powerd on" bzw. "power off" angeht:
Damit HA funktionieren kann, müssen die VMs ausgeschaltet werden. Ist ja auch klar, da sonst der "ausgefallene" ESX Server ja noch auf die Dateien zugreifen könnte, denn ein HA-Szenario kann ja auch sein, dass der Hosts die Netzwerkverbindung verliert, aber der Server und HBA noch sauber arbeiten. Genau für dieses Szenario gibt es aber auch die "leave powerd on" - Funktion. Wenn die VMs dann anbleiben, starten sie zwar nicht - wie mit HA gedacht - auf einem anderen Host, aber so hast du noch die Möglichkeit die VM soft herunterzufahren.
Was "Number of host failures allowed" angeht muss man je nach Umgebung entscheiden. Bei einem Cluster von 10 Hosts setze ich den Wert gerne auf 2. Somit habe ich immer einen Host, den ich warten kann und zusätzlich kann einer ausfallen. Der Wert macht eigentlich nur Sinn, wenn du HA auch so eingestellt hast, das keine VMs mehr gestartet werden können, wenn die HA-settings nicht mehr erfüllt werden. Das kann event. sehr nervig werden...
Dies kannst du mit "Do not power on virtual machines ..." bzw. "Allow virtual machines to be powered on ..." einstellen.
Grüße
Chris
- angoletti1
- Experte
- Beiträge: 1323
- Registriert: 08.07.2005, 16:41
- Wohnort: bei Trier
- Tschoergez
- Moderator
- Beiträge: 3476
- Registriert: 23.02.2005, 09:14
- Wohnort: Burgberg im Allgäu
- Kontaktdaten:
Hi,
der Vollständigkeit 1/2er :
Die HA-Isolation-Response-Einstellung greift nur, wenn einer der ESX-Server vom Netzwerk isoliert ist (genauer gesagt dessen Service Console). Dazu üerprüft der ESX nicht nur die anderen ESX auf Erreichbarkeit, sondern auch das Default Gateway der Service Console (per Default, "das.isolationaddress" in den HA-advanced settings). Und nur wenn der ESX vom Netzwerk isoliert ist, werden die VMs bei "Power off" har ausgeschaltet, damit sie auf einem anderen ESX neu gestartet werden können.
Mit einem echten ESX-Ausfall (also wenn z.B. eine CPU durchbrennt), hat die Isolation Response nix zu tun.
Weitere Anmerkung: Bei Verwendung von IP-Storage (also iSCSI oder NFS) als Datastores für VMs sollten für diese VMs die isolation response auf Power off gestellt werden!! (Weil da auch der locking-Mechanismus natürlich übers Netz funktioniert...)
Viele Grüße,
Jörg
der Vollständigkeit 1/2er :
Die HA-Isolation-Response-Einstellung greift nur, wenn einer der ESX-Server vom Netzwerk isoliert ist (genauer gesagt dessen Service Console). Dazu üerprüft der ESX nicht nur die anderen ESX auf Erreichbarkeit, sondern auch das Default Gateway der Service Console (per Default, "das.isolationaddress" in den HA-advanced settings). Und nur wenn der ESX vom Netzwerk isoliert ist, werden die VMs bei "Power off" har ausgeschaltet, damit sie auf einem anderen ESX neu gestartet werden können.
Mit einem echten ESX-Ausfall (also wenn z.B. eine CPU durchbrennt), hat die Isolation Response nix zu tun.
Weitere Anmerkung: Bei Verwendung von IP-Storage (also iSCSI oder NFS) als Datastores für VMs sollten für diese VMs die isolation response auf Power off gestellt werden!! (Weil da auch der locking-Mechanismus natürlich übers Netz funktioniert...)
Viele Grüße,
Jörg
Zurück zu „vCenter / VMware VirtualCenter“
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste