Bekomme auf der Konsole unendliche Fehlermeldungen mit sd 0:0:0:0
Nach einer gewissen Zeit verabschieden sich die VM's
Neustart der Maschine und alles läuft wieder
Umgebung:
HP DL370 ProLiant mit 46GB RAM und 1.5TB auf SAS RAID
ESX4.0 164009
VM's durchgängig MS W2008 R2 x64
Das Problem tritt wöchentlich auf. Erkennbar ist, dass nach Sicherung via VEEAM 4.1 - was zu erhöhter RAID Aktivität führt - das System kippt. Wenn ich VEEAM mehrere Tage deaktiviere, dann ist das Verhalten weg.
Alle Hardwarekomponenten wurden bereits von HP getauscht, die Firmware ist am aktuellsten Stand.
SD 0:0:0:0 interpretiere ich als mein HP P410i RAID Controller. Erkannt als "HP Serial Attached SCSI Disk".
Hat jemand eine Idee zu dem Thema?
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
Aussetzer RAID
in der Konsole werden im Sekundentakt Meldungen ausgegeben
sd 0:0:0:0 still retrying 4294967523 after 360s
Die Server sind dann nicht mehr erreichbar.
Nachvollziehbar ist, dass dies immer nach einigen Sicherungen mit VEEAM passiert.
Es laufen 7 VMs auf der Maschine. Diese werden alle 6 h vom SAS RAID-Set auf ein sATA RAID-Set (gleiche Maschine - anderer RAID Controller) inkrementuell gesichert.
Zusätzlich werden die Server inkrementuell auf einen anderen HW Server mittels VEEAM gesichert. Als letzte Sicherung erfolgt eine Bandsicherung auf einen externen HP Autoloader.
sd 0:0:0:0 ist aus meiner Sicht das SAS RAID-Set
In den Protokollen erkennt man, dass bei der Sicherung durch VEEAM (inkrementuell) auf dem SAS RAID-Set ein entsprechend emsiger Betrieb herrscht. Dies bringt aus meiner Sicht das SAS RAID-Set zum Kippen.
sd 0:0:0:0 still retrying 4294967523 after 360s
Die Server sind dann nicht mehr erreichbar.
Nachvollziehbar ist, dass dies immer nach einigen Sicherungen mit VEEAM passiert.
Es laufen 7 VMs auf der Maschine. Diese werden alle 6 h vom SAS RAID-Set auf ein sATA RAID-Set (gleiche Maschine - anderer RAID Controller) inkrementuell gesichert.
Zusätzlich werden die Server inkrementuell auf einen anderen HW Server mittels VEEAM gesichert. Als letzte Sicherung erfolgt eine Bandsicherung auf einen externen HP Autoloader.
sd 0:0:0:0 ist aus meiner Sicht das SAS RAID-Set
In den Protokollen erkennt man, dass bei der Sicherung durch VEEAM (inkrementuell) auf dem SAS RAID-Set ein entsprechend emsiger Betrieb herrscht. Dies bringt aus meiner Sicht das SAS RAID-Set zum Kippen.
schau mal ob du im IML-Log verdächtige Einträge findest! Blinken die Status-LEDs gewöhnlich oder verhält sich da eine Platte auffällig?
ich beziehe mich hierauf:
http://vmware-forum.de/viewtopic.php?p=106371#106371
ich beziehe mich hierauf:
http://vmware-forum.de/viewtopic.php?p=106371#106371
Wir haben gemeinsam mit HP sämtliche Teile des Servers ersetzt.
Controller, BBU, Board, etc
Basis dieses Austauschs war eine gesamte Prüfung des Servers mittels den Software Tools von HP in Anleitung von HP-Technikern. Hierbei wurden - so wurde uns mitgeteilt - auch die Festplatten überprüft. Ich kann dies jedoch nicht bestätigen, da kein einziger Techniker mir sagen konnte was in den Protokollen rauszulesen war.
Wo finde ich diese IML Logs und wie kann ich sie auslesen?
Controller, BBU, Board, etc
Basis dieses Austauschs war eine gesamte Prüfung des Servers mittels den Software Tools von HP in Anleitung von HP-Technikern. Hierbei wurden - so wurde uns mitgeteilt - auch die Festplatten überprüft. Ich kann dies jedoch nicht bestätigen, da kein einziger Techniker mir sagen konnte was in den Protokollen rauszulesen war.
Wo finde ich diese IML Logs und wie kann ich sie auslesen?
Ganz ehrlich - ich kann es nicht sagen.
Wir haben sämtliche Test mit HP gemeinsam auf feinster Einstellung durchgeführt. Die Protokolle wurde an HP geschickt. Diese haben diese ausgewertet und uns mitgeteilt, dass nicht wirklich was erkennbar ist, sämtliche Teile des Storage aber trotzdem getauscht werden.
Die Techniker vor Ort konnten uns ebenfalls keine Informationen geben. Ihnen vorgelegte Protokolle waren von den Technikern nicht auswertbar.
Meine Aussage stützt sich also ausschließlich auf die Aussage von HP.
Wir haben sämtliche Test mit HP gemeinsam auf feinster Einstellung durchgeführt. Die Protokolle wurde an HP geschickt. Diese haben diese ausgewertet und uns mitgeteilt, dass nicht wirklich was erkennbar ist, sämtliche Teile des Storage aber trotzdem getauscht werden.
Die Techniker vor Ort konnten uns ebenfalls keine Informationen geben. Ihnen vorgelegte Protokolle waren von den Technikern nicht auswertbar.
Meine Aussage stützt sich also ausschließlich auf die Aussage von HP.
@bla!zilla
Zur Zeit läuft ESX4.0 - keine ESXi.
Die ESX haben wir installiert damit wir mit VEEAM sichern können - das geht auf der ESXi leider nicht. Muss dazu sagen, dass ich mit dieser Entscheidung - war meine - nachträglich gesehen nicht glücklich bin. VEEAM als Software hat mich ziemlich entäuscht.
Ja, haben wir uns schon überlegt. Habe aber auch Artikel gelesen die mich dbzgl sehr verunsichert haben. Speziell zum Thema Update auf HP Server der Klasse DL370.
Habe keine vergleichbare Maschine auf der ich ein Update testen kann. Es direkt auf dem Produktionsserver zu machen ist mir einfach zu gefährlich.
@Buffer
Kann man hier was prüfen? Gibt es Wert die man kontrollieren kann?
Zur Zeit läuft ESX4.0 - keine ESXi.
Die ESX haben wir installiert damit wir mit VEEAM sichern können - das geht auf der ESXi leider nicht. Muss dazu sagen, dass ich mit dieser Entscheidung - war meine - nachträglich gesehen nicht glücklich bin. VEEAM als Software hat mich ziemlich entäuscht.
Ja, haben wir uns schon überlegt. Habe aber auch Artikel gelesen die mich dbzgl sehr verunsichert haben. Speziell zum Thema Update auf HP Server der Klasse DL370.
Habe keine vergleichbare Maschine auf der ich ein Update testen kann. Es direkt auf dem Produktionsserver zu machen ist mir einfach zu gefährlich.
@Buffer
Kann man hier was prüfen? Gibt es Wert die man kontrollieren kann?
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 18 Gäste