vsphere-client erreicht ESXi4.1 host nicht
Verfasst: 11.02.2013, 17:37
Hallo,
ich habe seit ein paar Wochen das Problem ein ESXi4.1 host immer mal wieder in einen Zustand verfällt in dem er nicht über den vsphere-client erreichbar ist. Über ssh und über die lokale Konsole komme ich auf den Host. Die Vm´s laufen. Es läuft ein GhettoVCB-script das eine vm über Nacht sichert. Ein Neustart der Management-Agents hilt nicht. Ich kann mir nur durch einen Neustart des Hosts behelfen.
Irgendwann meldet das GhettoVCB-script per Mailbenachrichtigung dann "failed to locate and extract VM_ID for xxx" und dann ist der host wieder in diesem Zustand.
Ich kenne mich mit den Logs nicht so gut aus.
Nach ./sbin/services.sh restart
finde ich in den System Logs unter Management Agent:
....... panic 'httpNfcSvc'] Another process is listening on port 12001.
....... panic 'httpNfcSvc'] Please make sure other instances of hostd are not running.
....... panic 'httpNfcSvc'] Failed to initialize httpnfc service
Aufgefallen sind mir aber folgende Zeilen in der shell nachdem ich ./sbin/services.sh restart ausgeführt habe:
Running hostd stop
**** VSI_GetInstanceListAlloc : No cartel by that name
VSI_GetInstanceListAlloc : No cartel by that name
watchdog-hostd: PID file /var/run/vmware/watchdog-hostd.PID not found
watchdog-hostd: Unable to terminate watchdog: Can't find process
sh: cannot kill pid 3176073: No such process
Hat jemand eine Rat für mich wie ich herausfinden kann was da los ist? Ein neustart des Hosts ist ja nicht so schön.
ich habe seit ein paar Wochen das Problem ein ESXi4.1 host immer mal wieder in einen Zustand verfällt in dem er nicht über den vsphere-client erreichbar ist. Über ssh und über die lokale Konsole komme ich auf den Host. Die Vm´s laufen. Es läuft ein GhettoVCB-script das eine vm über Nacht sichert. Ein Neustart der Management-Agents hilt nicht. Ich kann mir nur durch einen Neustart des Hosts behelfen.
Irgendwann meldet das GhettoVCB-script per Mailbenachrichtigung dann "failed to locate and extract VM_ID for xxx" und dann ist der host wieder in diesem Zustand.
Ich kenne mich mit den Logs nicht so gut aus.
Nach ./sbin/services.sh restart
finde ich in den System Logs unter Management Agent:
....... panic 'httpNfcSvc'] Another process is listening on port 12001.
....... panic 'httpNfcSvc'] Please make sure other instances of hostd are not running.
....... panic 'httpNfcSvc'] Failed to initialize httpnfc service
Aufgefallen sind mir aber folgende Zeilen in der shell nachdem ich ./sbin/services.sh restart ausgeführt habe:
Running hostd stop
**** VSI_GetInstanceListAlloc : No cartel by that name
VSI_GetInstanceListAlloc : No cartel by that name
watchdog-hostd: PID file /var/run/vmware/watchdog-hostd.PID not found
watchdog-hostd: Unable to terminate watchdog: Can't find process
sh: cannot kill pid 3176073: No such process
Hat jemand eine Rat für mich wie ich herausfinden kann was da los ist? Ein neustart des Hosts ist ja nicht so schön.