Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
Storagefehler im VMkernel
Hallo,
wenn Ihr die Verkabelung ( LWL ) verändert haben solltet, bitte Steckverbindungen und ggf. Geschwindigkeitseinstellungen überprüfen.
Wir haben einmal versehendlich eine LWL Leitung mit 8 GB/s FC betrieben obwohl diese nur für 4 GB/s ausgelegt war. Dadurch sind letzendlich unter Last CRC Fehler aufgetreten die zu den merkwürdigsten Fehlern führten. ( Sichtbar waren die bei uns dann im Datacore Log ).
Gruß
Jürgen
wenn Ihr die Verkabelung ( LWL ) verändert haben solltet, bitte Steckverbindungen und ggf. Geschwindigkeitseinstellungen überprüfen.
Wir haben einmal versehendlich eine LWL Leitung mit 8 GB/s FC betrieben obwohl diese nur für 4 GB/s ausgelegt war. Dadurch sind letzendlich unter Last CRC Fehler aufgetreten die zu den merkwürdigsten Fehlern führten. ( Sichtbar waren die bei uns dann im Datacore Log ).
Gruß
Jürgen
Ich bin mir mittlerweile fast sicher das es am FC Switch liegt, da die Fehler nur auftreten wenn richtig Last von mehreren gleichzeitigen Backups draufkommt. Ansonsten läuft das System bis auf den SCSI Fehlercode 0x28 wunderbar.
Da IBM sich den Storage angeschaut hat und nichts feststellen konnte tippe ich eher auf die Switche.
Dafür brauch ich aber wieder jemand der mit den Logfiles etwas anfangen kann
Da IBM sich den Storage angeschaut hat und nichts feststellen konnte tippe ich eher auf die Switche.
Dafür brauch ich aber wieder jemand der mit den Logfiles etwas anfangen kann
-
mbreidenbach
- Experte
- Beiträge: 1006
- Registriert: 30.10.2004, 12:41
Hallo,
ja, es sind Brocade Switche. Einen supportsave habe ich schon gemacht und an das Systemhaus geschickt. Da warte ich noch auf eine Antwort.
Selber auslesen kann ich die Daten leider nicht bzw. haben wir auch niemand im Haus der damit was anfangen kann.
Was ist portershow? Ist das nur ein Befehl für den Switch?
ja, es sind Brocade Switche. Einen supportsave habe ich schon gemacht und an das Systemhaus geschickt. Da warte ich noch auf eine Antwort.
Selber auslesen kann ich die Daten leider nicht bzw. haben wir auch niemand im Haus der damit was anfangen kann.
Was ist portershow? Ist das nur ein Befehl für den Switch?
ok,
Damit wären wir dann beim Thema Backend.
als nächstes würde ich jetzt folgende Dinge überprüfen :
Verkabelung zwischen den Räumen. Dafür benötigen wir dann weitere Infos
Ist zwischen den Räumen ein separates LWL Kabel verlegt?
Wenn ja :
- welcher Typ
- wie lang ist es
- mit welcher Geschwindigkeit wird es mit FC betrieben
- sind mechanische Beschädigungen, Qutschungen oder scharfe Knicke vorhanden ( ggf. von einer Fachfirma überprüfen lassen )
- Sind die verlegten Patchkabel von Port 15 Switch2 OK , ist der Steckkontakt frei von Schmutz oder Staub ?
- Sind die SFP OK?
- Ist die richtige Geschwindigkeit für Port 15 eingestellt ?
Solltest du mit diesen Fragen überfordert sein so rate ich dir dringend dazu einen kompetenten Dienstleister mit der Fehlersuche zu beauftragen !
Damit wären wir dann beim Thema Backend.
als nächstes würde ich jetzt folgende Dinge überprüfen :
Verkabelung zwischen den Räumen. Dafür benötigen wir dann weitere Infos
Ist zwischen den Räumen ein separates LWL Kabel verlegt?
Wenn ja :
- welcher Typ
- wie lang ist es
- mit welcher Geschwindigkeit wird es mit FC betrieben
- sind mechanische Beschädigungen, Qutschungen oder scharfe Knicke vorhanden ( ggf. von einer Fachfirma überprüfen lassen )
- Sind die verlegten Patchkabel von Port 15 Switch2 OK , ist der Steckkontakt frei von Schmutz oder Staub ?
- Sind die SFP OK?
- Ist die richtige Geschwindigkeit für Port 15 eingestellt ?
Solltest du mit diesen Fragen überfordert sein so rate ich dir dringend dazu einen kompetenten Dienstleister mit der Fehlersuche zu beauftragen !
Also loss sig , loss sync und enc out treten jedes Mal auf, wenn der Port aktiviert, deaktiviert, oder ein angeschlossenes System neu gestartet wird. Enc out Fehler deuten auf Kabelprobleme hin, da die CRC Fehler Fehlen, würde ich SFPs ausschließen. Enc Out sind Encoding Errors, die außerhalb des FC Frames aufgetreten sind. Daher treten die z.B. bei der Initialisierung auf.
Hallo,
vielen Dank für die zahlreichen Tipps.
Ich habe nochmal mit IBM telefoniert und die haben sich die Switche auch nochmal angeschaut.
Da jetzt am Wochenende wieder das Fullbackup ansteht werde ich einmal jetzt die Counter zurücksetzen und schauen wie es sich verhält.
Was ich noch bei sfpshow -all gesehen habe ist folgendes.
Switch 2:
=============
Port 15:
=============
Identifier: 3 SFP
Connector: 7 LC
Transceiver: 150c402001000000 100,200,400_MB/s M5,M6 sw Inter_dist
Encoding: 1 8B10B
Baud Rate: 42 (units 100 megabaud)
Length 9u: 0 (units km)
Length 9u: 0 (units 100 meters)
Length 50u: 15 (units 10 meters)
Length 62.5u:7 (units 10 meters)
Length Cu: 0 (units 1 meter)
Vendor Name: FINISAR CORP.
Vendor OUI: 00:90:65
Vendor PN: FTLF8524P2BNV
Vendor Rev: A
Wavelength: 850 (units nm)
Options: 003a Loss_of_Sig,Tx_Fault,Tx_Disable
BR Max: 0
BR Min: 0
Serial No: PK21CK0
Date Code: 110104
Temperature: 28 Centigrade
Current: 7.798 mAmps
Voltage: 3340.5 mVolts
RX Power: -18.9 dBm (13.0 uWatts)
TX Power: -4.0 dBm (395.2 uWatts)
Switch 4:
=============
Port 15:
=============
Identifier: 3 SFP
Connector: 7 LC
Transceiver: 150c402001000000 100,200,400_MB/s M5,M6 sw Inter_dist
Encoding: 1 8B10B
Baud Rate: 42 (units 100 megabaud)
Length 9u: 0 (units km)
Length 9u: 0 (units 100 meters)
Length 50u: 15 (units 10 meters)
Length 62.5u:7 (units 10 meters)
Length Cu: 0 (units 1 meter)
Vendor Name: FINISAR CORP.
Vendor OUI: 00:90:65
Vendor PN: FTLF8524P2BNV
Vendor Rev: A
Wavelength: 850 (units nm)
Options: 003a Loss_of_Sig,Tx_Fault,Tx_Disable
BR Max: 0
BR Min: 0
Serial No: PK235M9
Date Code: 110105
Temperature: 33 Centigrade
Current: 7.532 mAmps
Voltage: 3283.1 mVolts
RX Power: -4.4 dBm (360.1 uWatts)
TX Power: -4.1 dBm (391.6 uWatts)
Was mich entwas verwundert ist, das der letztere Switch einen Transmit von -4.1 dBm hat aber der erste Switch nur einen Receive von -18.9.
Das deutet ebenfalls auf Verkabelung hin, oder?
vielen Dank für die zahlreichen Tipps.
Ich habe nochmal mit IBM telefoniert und die haben sich die Switche auch nochmal angeschaut.
Da jetzt am Wochenende wieder das Fullbackup ansteht werde ich einmal jetzt die Counter zurücksetzen und schauen wie es sich verhält.
Was ich noch bei sfpshow -all gesehen habe ist folgendes.
Switch 2:
=============
Port 15:
=============
Identifier: 3 SFP
Connector: 7 LC
Transceiver: 150c402001000000 100,200,400_MB/s M5,M6 sw Inter_dist
Encoding: 1 8B10B
Baud Rate: 42 (units 100 megabaud)
Length 9u: 0 (units km)
Length 9u: 0 (units 100 meters)
Length 50u: 15 (units 10 meters)
Length 62.5u:7 (units 10 meters)
Length Cu: 0 (units 1 meter)
Vendor Name: FINISAR CORP.
Vendor OUI: 00:90:65
Vendor PN: FTLF8524P2BNV
Vendor Rev: A
Wavelength: 850 (units nm)
Options: 003a Loss_of_Sig,Tx_Fault,Tx_Disable
BR Max: 0
BR Min: 0
Serial No: PK21CK0
Date Code: 110104
Temperature: 28 Centigrade
Current: 7.798 mAmps
Voltage: 3340.5 mVolts
RX Power: -18.9 dBm (13.0 uWatts)
TX Power: -4.0 dBm (395.2 uWatts)
Switch 4:
=============
Port 15:
=============
Identifier: 3 SFP
Connector: 7 LC
Transceiver: 150c402001000000 100,200,400_MB/s M5,M6 sw Inter_dist
Encoding: 1 8B10B
Baud Rate: 42 (units 100 megabaud)
Length 9u: 0 (units km)
Length 9u: 0 (units 100 meters)
Length 50u: 15 (units 10 meters)
Length 62.5u:7 (units 10 meters)
Length Cu: 0 (units 1 meter)
Vendor Name: FINISAR CORP.
Vendor OUI: 00:90:65
Vendor PN: FTLF8524P2BNV
Vendor Rev: A
Wavelength: 850 (units nm)
Options: 003a Loss_of_Sig,Tx_Fault,Tx_Disable
BR Max: 0
BR Min: 0
Serial No: PK235M9
Date Code: 110105
Temperature: 33 Centigrade
Current: 7.532 mAmps
Voltage: 3283.1 mVolts
RX Power: -4.4 dBm (360.1 uWatts)
TX Power: -4.1 dBm (391.6 uWatts)
Was mich entwas verwundert ist, das der letztere Switch einen Transmit von -4.1 dBm hat aber der erste Switch nur einen Receive von -18.9.
Das deutet ebenfalls auf Verkabelung hin, oder?
bla!zilla hat geschrieben: Enc Out sind Encoding Errors, die außerhalb des FC Frames aufgetreten sind. Daher treten die z.B. bei der Initialisierung auf.
Die Frage ist nur in welcher Menge.
die Enc Out werte haben sich in den letzten Tagen wie folgt verhalten:
21.04.: 650m
24.04.: 2.8g
26.04.: 3.5g
So ein schneller Anstieg ist sicher nicht mehr innerhalb der Norm
Okay, ich werde erst nächste Woche wieder an den besagtem Standort vorbeifahren können. Da werde ich in erster Linie mal das Kabel gegen ein neues austauschen und schauen wie es sich verhält.
Nur nebenbei. Ich habe vor 20 Minuten die Statistiken zurückgesetzt und schon wieder einen Wert von 305k bei enc out.
Gruß
Martin
Nur nebenbei. Ich habe vor 20 Minuten die Statistiken zurückgesetzt und schon wieder einen Wert von 305k bei enc out.
Gruß
Martin
-
MarcelMertens
- Member
- Beiträge: 360
- Registriert: 13.07.2011, 15:33
Hallo Leute,
also Kabel wurde getauscht und promt gibt es keine ENC_OUT mehr. Problem besteht leider trotzdem weiterhin.
Jetzt habe ich einen VMWare KB gefunden der besagt das es bei bestimmten Firmwareständen von Emulex HBAs + VSphere (ab Version 3.5) zu Problemen kommen kann.
Da wir Anfang April sämtliche Firmwarestände aktualisiert haben (durch Erweiterung der Umgebung) war natürlich auch der HBA dabei.
Hat jemand schon mal jemand Erfahrungen mit sowas gemacht oder eine Firmware auf einen HBA wieder downgegraded?
Gruß
Martin
also Kabel wurde getauscht und promt gibt es keine ENC_OUT mehr. Problem besteht leider trotzdem weiterhin.
Jetzt habe ich einen VMWare KB gefunden der besagt das es bei bestimmten Firmwareständen von Emulex HBAs + VSphere (ab Version 3.5) zu Problemen kommen kann.
Da wir Anfang April sämtliche Firmwarestände aktualisiert haben (durch Erweiterung der Umgebung) war natürlich auch der HBA dabei.
Hat jemand schon mal jemand Erfahrungen mit sowas gemacht oder eine Firmware auf einen HBA wieder downgegraded?
Gruß
Martin
Zurück zu „vSphere 5 / ESXi 5 und 5.1“
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste