Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

mgmt-vmware startet nicht

Hilfe bei Problemen mit Installation & Benutzung des VMware ESX/ESXi Server 3.

Moderatoren: irix, Dayworker

Member
Beiträge: 5
Registriert: 21.10.2011, 16:18

mgmt-vmware startet nicht

Beitragvon foobar303 » 21.10.2011, 16:44

Hi Leute,

nach ewigem Suchen und Probieren und anschließendem Verzweifeln hoffe ich, dass mir einer von Euch vielleicht nen Tip geben kann ...

Ich habe ein ESX 3.0.3, der gefühlte 300 Jahre ohne Unterbrechung lief.
Nun wurde er einmal neugestartet - nach Neustart läuft der hostd nicht an.

Der Prozess ist beim Starten abgekackt und hat seine PID hinterlassen:

Code: Alles auswählen

# ls -al /var/run/vmware/
-rw-r--r--    1 root     root            4 Oct 21 18:11 vmware-hostd.PID
-rw-r--r--    1 root     root            5 Oct 21 18:11 watchdog-cimserver.PID
-rw-r--r--    1 root     root            5 Oct 21 18:11 watchdog-webAccess.PID

# rm /var/run/vmware/vmware-hostd.PID     

# service mgmt-vmware start
Starting VMware ESX Server Management services:
starting vmware_start_hostd
   VMware ESX Server Host Agent (background)               [  OK  ]
   Availability report startup (background)                [  OK  ]


Der Schein trügt...

Code: Alles auswählen

# service mgmt-vmware status
vmware-hostd is stopped


Da ist wieder die PID (/var/run/vmware) und der Prozess ist wieder weg.
Ein Tail auf's /var/log/messages liefert:

Code: Alles auswählen

Oct 21 18:26:48 itjanus watchdog-hostd: Executing cleanup command '/usr/sbin/hostd-support'
Oct 21 18:26:48 itjanus VMware[init]: HOSTINFO: This machine has 4 physical CPUS, 4 total cores, and 8 logical CPUs.
Oct 21 18:26:49 itjanus VMware[init]:
Oct 21 18:26:49 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:49 itjanus watchdog-hostd: Executing cleanup command '/usr/sbin/hostd-support'
Oct 21 18:26:50 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:50 itjanus VMware[init]: HOSTINFO: Seeing Intel CPU, numCoresPerCPU 1 numThreadsPerCore 2.
Oct 21 18:26:50 itjanus VMware[init]:
Oct 21 18:26:50 itjanus VMware[init]: HOSTINFO: This machine has 4 physical CPUS, 4 total cores, and 8 logical CPUs.
Oct 21 18:26:50 itjanus VMware[init]:
Oct 21 18:26:50 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:53 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:53 itjanus VMware[init]: HOSTINFO: Seeing Intel CPU, numCoresPerCPU 1 numThreadsPerCore 2.
Oct 21 18:26:53 itjanus VMware[init]:
Oct 21 18:26:53 itjanus VMware[init]: HOSTINFO: This machine has 4 physical CPUS, 4 total cores, and 8 logical CPUs.
Oct 21 18:26:53 itjanus VMware[init]:
Oct 21 18:26:53 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:53 itjanus watchdog-hostd: Executing cleanup command '/usr/sbin/hostd-support'
Oct 21 18:26:55 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:55 itjanus VMware[init]: HOSTINFO: Seeing Intel CPU, numCoresPerCPU 1 numThreadsPerCore 2.
Oct 21 18:26:55 itjanus VMware[init]:
Oct 21 18:26:55 itjanus VMware[init]: HOSTINFO: This machine has 4 physical CPUS, 4 total cores, and 8 logical CPUs.
Oct 21 18:26:55 itjanus VMware[init]:
Oct 21 18:26:56 itjanus VMware[init]: connect: No such file or directory.
Oct 21 18:26:55 itjanus watchdog-hostd: Executing cleanup command '/usr/sbin/hostd-support'
Oct 21 18:26:57 itjanus VMware[init]: connect: No such file or directory.


Jetzt ist mein Problem, dass "No such file or directory" nicht sehr aussagekräftig ist. Anhand des "connect" könnte ich mir vorstellen, dass er damit evtl. auch einen Socket meinen könnte. Sozusagen ein weiterer Dienst als Voraussetzung nötig ist...

Der Vollständigkeit halber, falls es interessiert:

Code: Alles auswählen

Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address               Foreign Address             State       User       Inode      PID/Program name   
tcp        0      0 127.0.0.1:32770             0.0.0.0:*                   LISTEN      0          6140       1250/cimserver     
tcp        0      0 0.0.0.0:5988                0.0.0.0:*                   LISTEN      0          6305       1250/cimserver     
tcp        0      0 127.0.0.1:8005              0.0.0.0:*                   LISTEN      0          6318       1148/webAccess     
tcp        0      0 0.0.0.0:5989                0.0.0.0:*                   LISTEN      0          6306       1250/cimserver     
tcp        0      0 0.0.0.0:902                 0.0.0.0:*                   LISTEN      0          3108       1113/xinetd         
tcp        0      0 0.0.0.0:8009                0.0.0.0:*                   LISTEN      0          6317       1148/webAccess     
tcp        0      0 0.0.0.0:34571               0.0.0.0:*                   LISTEN      0          6346       1266/java           
tcp        0      0 0.0.0.0:34572               0.0.0.0:*                   LISTEN      0          8124       1266/java           
tcp        0      0 0.0.0.0:8080                0.0.0.0:*                   LISTEN      0          3490       1148/webAccess     
tcp        0      0 0.0.0.0:22                  0.0.0.0:*                   LISTEN      0          2291       1037/sshd 

Code: Alles auswählen

# ps aux | grep vmware
root      1142  0.0  0.4  4260 1208 ?        S    18:11   0:00 /bin/sh /usr/bin/vmware-watchdog -s webAccess -u 30 -q 5 /usr/lib/vmware/webAccess/java/jre1.5.0_15/bin/webAccess -server -Xincgc -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.endorsed.dirs=/usr/lib/vmware/webAccess/tomcat/apache-
root      1148  0.8 20.3 299924 54532 ?      S    18:11   0:11 /usr/lib/vmware/webAccess/java/jre1.5.0_15/bin/webAccess -server -Xincgc -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.endorsed.dirs=/usr/lib/vmware/webAccess/tomcat/apache-tomcat-5.5.26/common/endorsed -classpath /usr/lib/vmware/
root      1180  0.0  0.2  1720  572 ?        S<   18:11   0:00 /usr/lib/vmware/bin/vmkload_app --setsid --sched.group=host/system/vmkauthd --sched.mem.min=4 --sched.mem.max=12 /usr/lib/vmware/bin/vmware-vmkauthd
root      1234  0.0  0.4  4260 1208 ?        S    18:11   0:00 /bin/sh /usr/bin/vmware-watchdog -s cimserver -u 60 -q 5 /var/pegasus/bin/cimserver daemon=false


Die /etc/vmware/hostd/config.xml sieht ok aus (zumindest keine Syntaxfehler). Mit einer alten esx.conf hab ich es auch erfolglos probiert.

Bin für jegliche Hinweise dankbar ;-)

Benutzeravatar
Profi
Beiträge: 870
Registriert: 26.09.2007, 13:09
Wohnort: NRW

Beitragvon ideFix » 21.10.2011, 17:03

Hallo!

Filesystem ist aber nicht voll gelaufen, oder?

Ansonsten *.PID löschen, und mgmt-vmware neustarten.

Steht alles auch in diesem KB: Service mgmt-vmware restart may not restart hostd

Viel Erfolg ;)

PS: Lad mal das hostd.log bei ifile.it hoch - dann kann man sehen wo es hängt. Generell sind komplette Logs besser, als Auszüge. :P

Member
Beiträge: 5
Registriert: 21.10.2011, 16:18

Beitragvon foobar303 » 22.10.2011, 13:09

Hi,

danke für deine Antwort!
Alle Filesysteme bieten noch ausreichend(!) Platz.

Den KB-Artikel habe ich natürlich gelesen. Und wie du in meinem Post liest, habe ich genau das auch schon (mehrmals) getan:

PID löschen, mgmt-vmware neustarten - PID wieder da - Prozess aber nicht, "hostd stopped". Der Prozess startet kurz, meint dass er irgendwas nicht findet, und beendet wieder.
Kein Eintrag im hostd.log, weil hostd garnicht soweit kommt, dort etwas hineinschreiben zu können. Der Prozess stirbt schon vorher.

Das ist ja mein Problem ;-)
Noch irgendwelche Ideen ?

King of the Hill
Beiträge: 13561
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 22.10.2011, 14:01

Code: Alles auswählen

tcp        0      0 0.0.0.0:902                 0.0.0.0:*                   LISTEN      0          3108       1113/xinetd     
Wenn der ESX nicht alles gnadenlos anders als der ESXi macht, sollte der VMware-Port 902 eigentlich frei bzw von Localhost und nicht durch "xinetd" auf IP-Adresse 0.0.0.0 belegt sein.
Kann es sein, daß irgend eine VM diesen Port für sich belegt?

Member
Beiträge: 5
Registriert: 21.10.2011, 16:18

Beitragvon foobar303 » 24.10.2011, 09:57

Hi,

danke auch für deine Beteiligung und vor allem den Hinweis auf Port 902, der ist mir garnicht aufgefallen - dass den eine VM belegt, ist denke ich ausgeschlossen, da keine VM gestartet ist.
Der Prozess wird durch /etc/xinet.d/vmware-auth gestartet:

Code: Alles auswählen

# default: on
# description: The VMware remote access authentification daemon
service vmware-authd
{
    disable         = no
    port            = 902
    socket_type     = stream
    protocol        = tcp
    wait            = no
    user            = root
    server          = /usr/sbin/vmware-authd
}


Die Frage ist, ob das nun legitim ist ...
Ich habe den Prozess gekillt (kill -9 1113), doch ´service mgmt-vmware start´ ist immernoch erfolglos.

Code: Alles auswählen

# vm-support -x

VMware ESX Server Support Script 1.29

Couldn't find any running VMs

Code: Alles auswählen

11:41:08am  up 2 days, 17:31, 36 worlds; CPU load average: 0.01, 0.01, 0.01
PCPU(%):   8.00,   0.12,   0.45,   0.10 ;   used total:   2.17
LCPU(%):   7.97,   0.02,   0.09,   0.02,   0.02,   0.43,   0.08,   0.03
CCPU(%):   2 us,   1 sy,  97 id,   0 wa ;       cs/sec:    280

     ID    GID NAME             NMEM   %USED    %SYS  %OVRLP    %RUN   %WAIT  %BWAIT  %TWAIT   %CRUN   %CSTP   %IDLE    %RDY  %EXTRA  %MLMTD
      1      1 idle                8  392.39    0.00    0.56  400.00    0.00    0.00    0.00    0.00    0.00    0.00  100.42    0.00    0.00
      2      2 system              5    0.00    0.00    0.00    0.00  500.00    0.00  500.00    0.00    0.00    0.00    0.00    0.00    0.00
      6      6 console             1    7.49    0.01    0.02    8.23    0.00   92.00   92.00    0.00    0.00   91.84    0.00    1.74    0.00
      7      7 helper             13    0.13    0.00    0.00    0.18 1300.00    0.00 1300.00    0.00    0.00    0.00    0.07    0.13    0.00
      8      8 drivers             8    0.00    0.00    0.00    0.00  800.00    0.00  800.00    0.00    0.00    0.00    0.00    0.00    0.00
     15     15 vmware-vmkauthd     1    0.00    0.00    0.00    0.00  100.00    0.00  100.00    0.00    0.00    0.00    0.00    0.00    0.00


Ich mache gerade über's Netz ein Vollbackup (192.168.100.123 ist der Backupserver), was extrem ungewöhnlich lange dauert.
Hat folgendes im /var/log/messages eine Bewandtnis, wenn das x-Mal hintereinander (so ziemlich jede Sekunde) kommt? (offensichtlich stimmt was mit NFS nicht, aber ich weiß nicht wie ich das überprüfen soll):

Oct 23 05:01:15 esx303 kernel: nfs: server 192.168.100.123 not responding, still trying
Oct 23 05:01:16 esx303 kernel: nfs: server 192.168.100.123 OK


Zurück zu „ESX 3 & ESXi 3“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste