Ich habe sporadisch immer wieder mal für kurze Zeit kein Zugriff die LUNs. Ich sehe momentan nicht ganz, wo ich mit dem Suchen des Fehlers beginnen soll.
Die Umgebung sieht wie folgt aus:
2 x ESX 3.5 U5 (Dell R900) Hosts
jeweils über zwei HBA an SAN Storage IBM DS4800 angeschlossen.
Der Fehler wirkt sich folgendermassen aus. Die Zugriffe auf sämtliche LUNs sind für eine kurze Zeit nicht mehr möglich, dies meldet dann auch Windows im Eventlog, dass ein Controller Error auf Harddisk0 auftrat und das device "not ready for access" ist... Dies tritt willkürlich auf. Der selbe Fehler kann mehr oder weniger nachvollzogen werden, wenn Storageseitig der preffered path geändert wird. Dies funktioniert mal und ein ander mal treten I/O Fehler auf und der Zugriff in die LUNs ist nicht mehr möglich.
Im vmkwarning log entstehen dann folgende Fehlermeldungen
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.653 cpu2:6980)WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.653 cpu2:6980)WARNING: FS3: 2504: Couldn't verify lost lock: SCSI reservation conflict
Jun 1 01:17:23 HostXY vmkernel: 114:14:16:40.047 cpu6:6976)WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts
Jun 1 01:17:23 HostXY vmkernel: 114:14:16:40.047 cpu6:6976)WARNING: FS3: 2504: Couldn't verify lost lock: SCSI reservation conflict
Jun 1 01:17:28 HostXY vmkernel: 114:14:16:44.152 cpu2:6875)WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts
Im selben Zeitpunkt im vmkernel log:
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.155 cpu2:2133)StorageMonitor: 196: vmhba0:0:13:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.357 cpu2:6938)StorageMonitor: 196: vmhba0:0:13:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.458 cpu2:1190)StorageMonitor: 196: vmhba0:1:14:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.653 cpu2:6980)SCSI: vm 6980: 109: Sync CR at 0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.653 cpu2:6980)WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.653 cpu2:6980)WARNING: FS3: 2504: Couldn't verify lost lock: SCSI reservation conflict
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.659 cpu2:6980)StorageMonitor: 196: vmhba0:0:15:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.659 cpu2:6980)StorageMonitor: 196: vmhba0:0:15:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.663 cpu5:6889)StorageMonitor: 196: vmhba0:0:11:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY last message repeated 2 times
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.861 cpu2:1190)StorageMonitor: 196: vmhba0:0:15:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY last message repeated 3 times
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.961 cpu2:6938)StorageMonitor: 196: vmhba0:0:15:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.961 cpu2:6938)StorageMonitor: 196: vmhba0:1:10:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Jun 1 01:17:19 HostXY vmkernel: 114:14:16:35.961 cpu2:6938)StorageMonitor: 196: vmhba0:0:13:0 status = D:0x0/H:0x2 0x0 0x0 0x0
Eine Überlast im Storage ist auszuschliessen. Bin für jegliche Inputs dankbar
