Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Fehler beim HA Agent - alle VM's aus

Virtualisierungsmanagement, Servermanagement.

Moderatoren: irix, continuum, Dayworker

Member
Beiträge: 195
Registriert: 23.01.2006, 15:52
Wohnort: Mainz

Fehler beim HA Agent - alle VM's aus

Beitragvon bolder » 13.11.2007, 09:00

Hallo!

Bereits zweimal in den letzten 4 Wochen hatte ich folgendes Problem:

VC schreibt:

An error occured during configuration of the HA Agent on the host.
... HA agent on SSS in cluster CCC in DDD has an error
... Unable to contact a primary HA agent in cluster CCC in DDD
... HA agent disabled on SSS in cluster CCC in DDD
... HA is being disabled on SSS in cluster CCC in datacenter DDD

wobei:
... steht für Datum und Uhrzeit
SSS = Servername
CCC = Clustername
DDD = Datacentername

Alle virtuellen Maschinen sind dann ausgeschaltet.

Abhilfe erfolgt durch Anwahl von "Reconfigure for HA" im VC.
Danach starte ich alle VM's von Hand.

Versionen:
VirtualCenter 2.0.2 Build 50618
1 mal ESX-Server 3.0.2 build-52542
1 mal ESX-Server 3.0.1 build-37303

Hierzu verschiedene Fragen:
1. Wurden die VM's hart abgeschaltet oder ordentlich herunter gefahren?
2. Kann das Problem an den verschiedenen Versionen der ESX-Server liegen?
3. Kann das Problem an zu wenig Memory liegen (wir müssen ohnehin aufrüsten)?

Olaf

Benutzeravatar
Experte
Beiträge: 1323
Registriert: 08.07.2005, 16:41
Wohnort: bei Trier

Beitragvon angoletti1 » 13.11.2007, 09:17

Hi Olaf,

als erste bring mal die ESX auf die selbe Version. Das wird wohl auch der erste Schritt sein, wenn du den Support bemühst.
An zu wenig Memory kann es eigentlich nicht liegen, das macht dem ESX nichts aus, nur die VMs laufen dann nicht ganz so performant.
Wie sind denn deine Einstellungen bezüglich HA? Entweder bleiben die VMs im HA-Szenario an oder werden hart abgeschaltet.

Grüße
Chris

Member
Beiträge: 195
Registriert: 23.01.2006, 15:52
Wohnort: Mainz

Beitragvon bolder » 13.11.2007, 10:24

Hi Chris,

danke für die schnelle Antwort.
Upgrade auf die selbe Version mach ich.
Einstellungen in HA sind auf "Power off". Sorry, hatte ich nicht überprüft. Das sind aber wohl die Standard-Einstellungen, und das hat wohl sicher einen Grund, oder?
Kann es Probleme geben, wenn ich die VM's auf "Leave powered on" stelle?
Falls nicht, würde ich das jetzt machen.
HA steht bei mir auf Standardeinstellungen.
Welcher Wert ist sinnvoll für "Number of host failures allowed"?
Und was macht unter "Admission Control" mehr Sinn:
"Do not power on virtual machines ..."
oder
"Allow virtual machines to be powered on ..." ?

Olaf

Benutzeravatar
Experte
Beiträge: 1323
Registriert: 08.07.2005, 16:41
Wohnort: bei Trier

Beitragvon angoletti1 » 13.11.2007, 10:39

Hi,

was das "leave powerd on" bzw. "power off" angeht:
Damit HA funktionieren kann, müssen die VMs ausgeschaltet werden. Ist ja auch klar, da sonst der "ausgefallene" ESX Server ja noch auf die Dateien zugreifen könnte, denn ein HA-Szenario kann ja auch sein, dass der Hosts die Netzwerkverbindung verliert, aber der Server und HBA noch sauber arbeiten. Genau für dieses Szenario gibt es aber auch die "leave powerd on" - Funktion. Wenn die VMs dann anbleiben, starten sie zwar nicht - wie mit HA gedacht - auf einem anderen Host, aber so hast du noch die Möglichkeit die VM soft herunterzufahren.

Was "Number of host failures allowed" angeht muss man je nach Umgebung entscheiden. Bei einem Cluster von 10 Hosts setze ich den Wert gerne auf 2. Somit habe ich immer einen Host, den ich warten kann und zusätzlich kann einer ausfallen. Der Wert macht eigentlich nur Sinn, wenn du HA auch so eingestellt hast, das keine VMs mehr gestartet werden können, wenn die HA-settings nicht mehr erfüllt werden. Das kann event. sehr nervig werden...
Dies kannst du mit "Do not power on virtual machines ..." bzw. "Allow virtual machines to be powered on ..." einstellen.

Grüße
Chris

Member
Beiträge: 195
Registriert: 23.01.2006, 15:52
Wohnort: Mainz

Beitragvon bolder » 13.11.2007, 10:50

Super - vielen Dank!
Das hilft mir schon weiter.
Noch eine (hoffentlich letzte) Frage:
Wenn die VM's hart ausgeschaltet werden: wird da vorher noch ein Snapshot gezogen oder wie ist sicher gestellt, dass da keine korrupten Filesysteme entstehen?

Olaf

Benutzeravatar
Experte
Beiträge: 1323
Registriert: 08.07.2005, 16:41
Wohnort: bei Trier

Beitragvon angoletti1 » 13.11.2007, 10:57

Hi,

hart ausschalten ist wie das virtuelle Powerkabel ziehen. Einen Snapshot gibts da vorher nicht.
Was korrupte Files angeht kann man nicht sicher sein, aber was ist heute schon sicher? :D
Bei mir gabs bisher aber nie Probleme :grin:

Grüße
Chris

Member
Beiträge: 195
Registriert: 23.01.2006, 15:52
Wohnort: Mainz

Beitragvon bolder » 13.11.2007, 11:07

OK - Danke für die Auskünfte !

Gruß
Olaf

Benutzeravatar
Moderator
Beiträge: 3476
Registriert: 23.02.2005, 09:14
Wohnort: Burgberg im Allgäu
Kontaktdaten:

Beitragvon Tschoergez » 13.11.2007, 14:54

Hi,

der Vollständigkeit 1/2er :-) :
Die HA-Isolation-Response-Einstellung greift nur, wenn einer der ESX-Server vom Netzwerk isoliert ist (genauer gesagt dessen Service Console). Dazu üerprüft der ESX nicht nur die anderen ESX auf Erreichbarkeit, sondern auch das Default Gateway der Service Console (per Default, "das.isolationaddress" in den HA-advanced settings). Und nur wenn der ESX vom Netzwerk isoliert ist, werden die VMs bei "Power off" har ausgeschaltet, damit sie auf einem anderen ESX neu gestartet werden können.

Mit einem echten ESX-Ausfall (also wenn z.B. eine CPU durchbrennt), hat die Isolation Response nix zu tun.

Weitere Anmerkung: Bei Verwendung von IP-Storage (also iSCSI oder NFS) als Datastores für VMs sollten für diese VMs die isolation response auf Power off gestellt werden!! (Weil da auch der locking-Mechanismus natürlich übers Netz funktioniert...)

Viele Grüße,
Jörg


Zurück zu „vCenter / VMware VirtualCenter“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste