Das Forum wurde aktualisiert. Wurde höchste Zeit. Wenn etwas nicht funktioniert, bitte gerne hier jederzeit melden.

Probleme mit HA (Insufficient resources...)

Virtualisierungsmanagement, Servermanagement.

Moderatoren: Dayworker, continuum, Tschoergez, irix, stefan.becker

Member
Beiträge: 475
Registriert: 08.08.2008, 10:45

Probleme mit HA (Insufficient resources...)

Beitragvon pirx » 08.08.2008, 11:13

Hallo,

in den letzten Wochen habe ich zwei ESX Server installiert (mit Update aud 3.5 U2). Mit etwas Verspätung kam nun die VC Lizenz an und ich habe begonnen die beiden ESX in VC zu integrieren (VC U2). Beim Thema HA komme ich momentan nicht weiter.

Im VC steht unter der Summary des Clusters:

Configuration Issues
Insufficient resources to satisfy HA failover level on Cluster foo in bar
Unable to contact a primary HA agent in cluster foo in bar

Und in der Summary der beiden ESX Hosts:

Configuration Issue
HA agent disabled on vumev001 in cluster foo in bar

bzw.

HA agent disabled on vumev002 in cluster foo in bar

Alles Hosts können sich gegenseitig pingen. DNS funktioniert für alle Hosts vor und rückwärts.

Ich habe schon probiert die Hosts wieder aus dem Cluster herauszunehmen und wieder hinzuzufügen, den Cluster entfernt und neu angelegt, HA gestoppt und wieder gestartet, VC Service gestoppt/gestartet.

Eine etwas ausführlichere Fehlermeldung wäre wirklich nicht schlecht.

Auf den beiden ESX Hosts hab ich die Logs unter /var/log/vmware/aam angesehen (leider liegen da relativ viele Logdateien).

vmware_vumev001.log
[...]
===================================
Info RULE Fri Aug 8 00:20:00 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule RuleMonitor submitted to run on node vumev002.
===================================
Error FT Fri Aug 8 00:20:01 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule Interpreter failed. Being restarted.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Manager on Node: vumev002
MESSAGE: Rule RuleMonitor is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule VMWareClusterManager submitted to run on node vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Manager on Node: vumev002
MESSAGE: Rule VMWareClusterManager is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Interpreter on Node: vumev002
MESSAGE: Rule RuleMonitor is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Interpreter on Node: vumev002
MESSAGE: Rule VMWareClusterManager is enabled on vumev002.



vmware_vumev002.log
[...]
===================================
Info RULE Fri Aug 8 00:20:00 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule RuleMonitor submitted to run on node vumev002.
===================================
Error FT Fri Aug 8 00:20:01 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule Interpreter failed. Being restarted.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Manager on Node: vumev002
MESSAGE: Rule RuleMonitor is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Agent on Node: vumev001
MESSAGE: Rule VMWareClusterManager submitted to run on node vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Manager on Node: vumev002
MESSAGE: Rule VMWareClusterManager is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Interpreter on Node: vumev002
MESSAGE: Rule RuleMonitor is enabled on vumev002.
===================================
Info RULE Fri Aug 8 00:20:01 2008
By: FT/Rule Interpreter on Node: vumev002
MESSAGE: Rule VMWareClusterManager is enabled on vumev002.

Was mich etwas wundert ist diese Fehlermeldung:

# cat vumev002_agent.err
sh: line 1: pkill: command not found
sh: line 1: pkill: command not found

Dann gibt es noch

VUMEV002:
# cat aam_config_util_listnodes.log
KEY: domain VAL: vmware
KEY: cmd VAL: listnodes
KEY: -z VAL: 1
CMD: Fri Aug 8 11:07:06 2008 hostname -s
RESULT:
-------------
VUMEV002

main::verify_network_configuration:86: cmd status was 0
CMD: Fri Aug 8 11:07:06 2008 /opt/vmware/aam/bin/ft_gethostbyname VUMEV002 |grep FAILED
RESULT:
-------------

main::verify_network_configuration:86: cmd status was 1
CMD: Fri Aug 8 11:07:06 2008 /usr/sbin/esxcfg-vswif -l
RESULT:
-------------
Name Port Group IP Address Netmask Broadcast Enabled DHCP
vswif0 Service Console xx..60.11.168 255.255.255.0 xx.60.11.255 true false

main::verify_network_configuration:86: cmd status was 0
list_nodes
issue_cli_cmd: command is '/opt/vmware/aam/bin/ftcli -domain vmware -connect vumev001 -port 8042 -timeout 60 -cmd listnodes'
CMD: Fri Aug 8 11:07:07 2008 /opt/vmware/aam/bin/ftcli -domain vmware -connect vumev001 -port 8042 -timeout 60 -cmd listnodes
RESULT:
-------------
Node Type State
----------------------- ------------ --------------
vumev001 Primary Agent Running
vumev002 Primary Agent Running

main::issue_cli_cmd:1488: cmd status was 0
VMwareresult=success
Total time for script to complete: 0 minute(s) and 1 second(s)


VUMEV001:

# cat aam_config_util_listnodes.log
KEY: domain VAL: vmware
KEY: cmd VAL: listnodes
KEY: -z VAL: 1
CMD: Fri Aug 8 11:08:59 2008 hostname -s
RESULT:
-------------
VUMEV001

main::verify_network_configuration:86: cmd status was 0
CMD: Fri Aug 8 11:08:59 2008 /opt/vmware/aam/bin/ft_gethostbyname VUMEV001 |grep FAILED
RESULT:
-------------

main::verify_network_configuration:86: cmd status was 1
CMD: Fri Aug 8 11:08:59 2008 /usr/sbin/esxcfg-vswif -l
RESULT:
-------------
Name Port Group IP Address Netmask Broadcast Enabled DHCP
vswif0 Service Console xx.60.11.167 255.255.255.0 xx.60.11.255 true false

main::verify_network_configuration:86: cmd status was 0
list_nodes
issue_cli_cmd: command is '/opt/vmware/aam/bin/ftcli -domain vmware -connect vumev001 -port 8042 -timeout 60 -cmd listnodes'
CMD: Fri Aug 8 11:08:59 2008 /opt/vmware/aam/bin/ftcli -domain vmware -connect vumev001 -port 8042 -timeout 60 -cmd listnodes
RESULT:
-------------
Node Type State
----------------------- ------------ --------------
vumev001 Primary Agent Running
vumev002 Primary Agent Running

main::issue_cli_cmd:1488: cmd status was 0
VMwareresult=success
Total time for script to complete: 0 minute(s) and 0 second(s)




Kann mich bitte jemand erleuchten, wo das Problem liegen könnte, bzw. wie ich VMware dazu bringen könnte mir etwas mehr Infos zu geben.

Member
Beiträge: 475
Registriert: 08.08.2008, 10:45

Beitragvon pirx » 08.08.2008, 11:51

Ok, nachdem ich gestern sicher 5-6 Stunden in das Problem gesteckt haben, bin ich nun auf http://www.vmwarewolf.com/ha-problem-wi ... -update-2/ gestossen.

The key is that all of your hostnames are in lower case only.


Nach dem ich den Schritten in dem Artikel gefolgt bin, sieht nun alles ok aus.

Das kann doch einfach nicht wahr sein *kopfschüttel*

Benutzeravatar
Member
Beiträge: 268
Registriert: 19.11.2006, 21:24
Wohnort: Hannover, Germany
Kontaktdaten:

Beitragvon storageguru » 08.08.2008, 12:08

Stimmt wo du es sagt, Großschreibung ist uncool.

Da habe ich schonmal Ärger mit gehabt.

Member
Beiträge: 3
Registriert: 20.04.2010, 14:25

Beitragvon bomml » 20.04.2010, 14:50

Hallo ich hoffe das ich bei meinem ersten Post nichts falsch mache, aber das ist der passendste Thread den ich gefunden habe.

Ich bin noch ziemlich neu im vCenter Bereich.

ESXi haben wir schon seit Ewigkeiten in Betrieb, nur möchten wir jetzt für Kunden von uns eine FT Umgebung mit 2x Hosts anbieten + vCenter auf einer physischen Maschine

Schön und gut ich habe alles nach dem Handbuch von vmware education services nachgemacht und komme einfach auf keinen grünen Zweig.

Die erste Frage?
Ist mit ESXi Hosts überhaupt FTund HA möglich, oder nur mit ESX?

Zum Zweiten, egal was ich mache ich bekomme immer diese Meldungen, obwohl ich laut Handbuch vorgehe
Insufficient ressources to satisfy HA failover level on cluster <name> in <datacenter>
Unable to contact a primary HA agent in cluster <name> in <datacenter>


Hardware Intel Modular Server mit 3 Blades (2x ESXi, 1x Win2003 für vCenter)
Jeweils Intel S5000SI Blade mit Xeon E5405 mit 8GB RAM

Irgendwelche Vorschläge?
Danke

Benutzeravatar
Profi
Beiträge: 870
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 20.04.2010, 15:07

bomml hat geschrieben:Die erste Frage?
Ist mit ESXi Hosts überhaupt FTund HA möglich, oder nur mit ESX?


Ja ESXi kann FT, passende Lizenz vorrausgesetzt (Advanced, Enterprise oder Enterprise Plus)


bomml hat geschrieben:Zum Zweiten, egal was ich mache ich bekomme immer diese Meldungen, obwohl ich laut Handbuch vorgehe
Insufficient ressources to satisfy HA failover level on cluster <name> in <datacenter>
Unable to contact a primary HA agent in cluster <name> in <datacenter>


Namensauflösung ist im HA Bereich da A und O.
Wenn es da schon hapert, dann klappt HA meistens nicht.
FT habe ich selber noch nicht probieren können. Aber schon so einige HA und DRS Cluster.

Member
Beiträge: 3
Registriert: 20.04.2010, 14:25

Beitragvon bomml » 20.04.2010, 16:01

Na klar :grin:
An das habe ich natürlich nicht gedacht.

Hab zwar die DNS Server im ESXi eingetragen, jedoch keine Host (A) Einträge für ESX1 ESX2 und vCenter am DNS vergeben.

Jetzt hat HA auf Anhieb geklappt und die einzige noch vorhandene Meldung ist diese hier, aber logisch, hab ja nur eine Service Console

Host 192.168.1.51 currently has no management network redundancy
Host 192.168.1.52 currently has no management network redundancy


Bin jetzt gespannt ob FT hinhaut laut VMware WhitePaper müsste meine Hardware passen.

THX erstmal


Zurück zu „vCenter / VMware VirtualCenter“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast