ich habe gestern Mittag eine weitere LUN auf unserer EQL erstellt. Dies hatte zur Folge, dass sich auf den ESXi-Hosts der hostd Prozess komplett verabschiedet hat und auch nicht mehr starten wollte.
Nach dem wir alle VMs wie RDP, Remote Shutdown usw. endlich aus hatten und das View-Cluster deaktivieren konnten, kam heraus, dass unser aktuelles iSCSI Setup, welches nun drei Jahre lang lief, an der Misere schuld war.
Durch das Hinzufügen einer weitern LUN gab es beim HBA-Scan wohl zuviele Timeouts, sodass der Dienst auf den Hosts einfach nicht mehr wollte.
2016-04-07T10:40:43.074Z cpu44:33633)WARNING: iscsi_vmk: iscsivmk_ConnReceiveAtomic: vmhba45:CH:0 T:19 CN:0: Failed to receive data: Connection closed by peer
2016-04-07T10:40:43.078Z cpu44:33633)WARNING: iscsi_vmk: iscsivmk_ConnReceiveAtomic: Sess [ISID: TARGET: (null) TPGT: 0 TSIH: 0]
2016-04-07T10:40:43.078Z cpu44:33633)WARNING: iscsi_vmk: iscsivmk_ConnReceiveAtomic: Conn [CID: 0 L: 10.10.14.17:38283 R: 10.10.14.100:3260]
2016-04-07T10:40:43.078Z cpu44:33633)iscsi_vmk: iscsivmk_ConnRxNotifyFailure: vmhba45:CH:3 T:19 CN:0: Connection rx notifying failure: Failed to Receive. State=Bound
2016-04-07T10:40:43.078Z cpu44:33633)iscsi_vmk: iscsivmk_ConnRxNotifyFailure: Sess [ISID: TARGET: (null) TPGT: 0 TSIH: 0]
Bekommt keine Antwort ueber den Pfad zurueck / Storage hat die Verbindung geschlossen.
Dann das Resultat:
2016-04-07T12:00:01.877Z cpu37:2981041)ALERT: hostd detected to be non-responsive
Uns ist auch in der Vergangenheit aufgefallen, dass der iSCSI Scan beim booten der ESXi sehr lange dauert - bis zu 30 Minuten. Ich denke das rührt wohl auch daher.
Wir haben zwei Arrays im Einsatz:
1x MSA P2000 G3 (active/active) < Raid 10 Exchange & SQL
1x EQL PS6100XS (active/passive) < Raid 6 Accelerated VMWare View Cluster + File-Server
Diese beiden sind via 4 pSwitches (2x HP ProCurve 2848 2x Dell 6224) an die ESXi angebunden. Auf den ESXi sind 8 vmk an 8 vSwitches wie via Port-Bonding an 8 Nics.

Beißt sich komplett mit den aktuellen Anforderungen von VMWare:
https://kb.vmware.com/selfservice/micro ... Id=2038869
Dort steht:
Port Binding
Port binding is used in iSCSI when multiple VMkernel ports for iSCSI reside in the same broadcast domain and IP subnet to allow multiple paths to an iSCSI array that broadcasts a single IP address. When using port binding, you must remember that:
-Array Target iSCSI ports must reside in the same broadcast domain and IP subnet as the VMkernel port. < FAIL
-All VMkernel ports used for iSCSI connectivity must reside in the same broadcast domain and IP subnet. < FAIL
-All VMkernel ports used for iSCSI connectivity must reside in the same vSwitch. < FAIL
-Currently, port binding does not support network routing. < CHECK
Jetzt habe ich das Problem, dass wir ein active/active und ein active/passive Array haben. Kann ich (wegen der Switch Config usw.) die HP direkt ohne Switches an die ESXi anbinden?
Hat jemand vielleicht eine andere Idee, wie man das ganze jetzt VMWare-Konform bekommt?
VG
Alex