Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

HD am Dell PERC fällt aus ...

ESX(i)-taugliche Hardware, HCL .....

Moderatoren: irix, Dayworker

Member
Beiträge: 180
Registriert: 02.04.2010, 11:02

HD am Dell PERC fällt aus ...

Beitragvon drnicolas » 12.08.2013, 15:41

Nachdem ich jetzt einen gelisteten RAID Controller erworben habe, habe ich leider genau dieselben Probleme wie ohne.
Bereits vor einiger Zeit hatte ich meine Schwierigkeiten gepostet, eine größere Festplatte am ESX dauerhaft zum laufen zu bringen.
Damals wie jetzt werden große Festplatten mit mehr als ein Terabyte (getestet mit ein Terabyte und 1,5 Terabyte) am Sata- Controller erkannt und sind zunächst als Data Store nutzbar.
Nach längerer Zeit (ein bis 5 Stunden) verschwindet dann diese Platte als Data Store bzw. wird nur noch in grau und kursiver Schrift gelistet. Ein Zugriff ist dann nicht mehr möglich.
Nach einem Neustart des ESX ist dann wieder alles in Ordnung - für einige Stunden.
Meine Probleme wurden hier im Forum auf die Verwendung von an sich nicht supporteter Hardware in Gestalt des SATA-Controller zurückgeführt.
Jetzt habe ich einen gelisteten PERC 6/i erworben und stelle fest, dass die Probleme genau die gleichen sind.
Die resultierenden Fehlermeldungen habe ich in diesem Posting mal zusammengefasst .

Der RAID Controller wird übrigens auch bei ausgefallener Platte als funktionierend gelistet.
https://communities.vmware.com/thread/454280

Ich weiß mir langsam keinen Rat mehr. Trotz aufwändig im RAID Controller hat sich nichts geändert. Und die Welt scheint voll zu sein mit Leuten die große Festplatten an handelsüblicher Hardware betreiben.
Hat noch jemand ein Idee ?
Zeitweise hatte ich mal das auf dem Mainboard aktivierte vt-d im Verdacht als Nebeneffekt diese Schwierigkeiten auszulösen. Ein temporäres Deaktivieren führt aber nicht zu einer Besserung.
Im Grunde scheint es an der schieren Größe der Platten zu liegen. Kleinere Platten (bis 500 GB) laufen in dem selben Rechner am Mainboard Controller völlig problemlos.

King of the Hill
Beiträge: 13561
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 12.08.2013, 16:32

Welche Blockgrösse haben deine Platten, 512Byte oder 4KB?
Kabelage mal ausgetauscht?


Ich sehe im Log nur das Device "naa.600221907a935000199a7468056fd9d8" und die "
uuid 5207b8a3-a3503604-6a20-001b2178cf3b". Welches ist davon die Seagate_1TB und welches die Samsung-Platte?
Poste mal eine Device- und uuid-Liste sämtlicher Platten und der vmhba's.

Experte
Beiträge: 1337
Registriert: 25.04.2009, 11:17
Wohnort: Thüringen

Beitragvon Supi » 12.08.2013, 17:38

Hast du bei den Platten etwas mittels ATA Kommandos/ Tools in Sachen APM geändert?

http://www.ubuntu-forum.de/artikel/5058 ... on-hd.html

zumindest hier schreibt jemand was davon, dass dies bei der HD502HI mögliich ist.
Welche WD Green Platte ist das denn? Gerade bei WD Green, die man für NAS/Server eh vermeiden sollte, muss man das Kopf parken deaktivieren.

Das aber auch eine Constellation HDD Probleme machen soll, ist merkwürdig.
Für den Controller auch ein "VIB" Paket installiert?
http://blog.rebelit.net/432

King of the Hill
Beiträge: 12944
Registriert: 02.08.2008, 15:06
Wohnort: Hannover/Wuerzburg
Kontaktdaten:

Beitragvon irix » 13.08.2013, 08:49

Wenn die Controller bereits getauscht wurden mal daran Gedacht das es evtl. an der Platte liegen koennte?

Gruss
Joerg

Member
Beiträge: 180
Registriert: 02.04.2010, 11:02

Beitragvon drnicolas » 13.08.2013, 09:35

@irix: Die Constellation ist nagelneu, nachdem die WD Green als erstes durch Probleme auffiel -> beide zeigen ein identisches Verhalten.
Im übrigen habe ich alle Platten mit einem Diagnostic-Tool getestet und alle wurden für gut befunden.

@Supi: Für mich als Halb-Laien hören sich die Meldungen an wie Time-out-Probleme. Aber wieso ?
Am APM habe ich nichts gemacht -Für die beiden gorssen Platten gibt es auch keine alternative Firmware (gab es wohl für WD RE2)
Sowohl die Server-Platte wie auch das etwas ältere NAS-Modell verhalten sich im übrigen gleich -egal ob am onboard-Controller oder am PERC-RAID

Der Controller hat ein VIB bekommen, inklusive des CIM-Providers von LSI. Der Zustand der Platten wurd immer als "optimal" in den Systeminformationen angezeigt.

@dayworker: Kabel dürften nicht dass Problem sein, da der onboard-Controller und der PERC ja ganz unterschiedliche Kabel haben.

Das Fehlverhalten lässt sich gut provozieren:
- Aktuell ist die Constellation nur als datastore in voller Grösse eingebunden.
- Wenn ich grössere Datenmengen drauf kopiere (probiert mit VMs migrieren über Veeam oder durch Nutzung als Backup-Laufwerk für BackupExec) kracht es regelmässig so nach 20-30GB.
- Ausserdem lässt sich das Problem temporär nur durch einen Rebbot beheben.
- Die ausgegraute Platte läst sich nicht neu einlesen oder durch Abziehen nd Anstecken des Kabels im laufenden Betrieb wiederbeleben. Mit den anderen Platten geht das aber sehr wohl.

BTW: Gibt es Tools/Anleitungen das VMFS5 auf allen beteiligten PLatten zu prüfe und ggf. zu reparieren.
Insgesamt scheint dieses VMFS ziemlich anfällig und zickig zu sein. Warum nimmt VMWare eigentlich nichts aus dem bewährten Schrank von Linux ?

Experte
Beiträge: 1337
Registriert: 25.04.2009, 11:17
Wohnort: Thüringen

Beitragvon Supi » 13.08.2013, 10:38

Mal nur so aus dem Bauch heraus, hat das Mainboard vielleicht nen schuss weg?
Oder vielleicht das Netzteil? ggf bricht ja die 12V Spannung ein durch die Last. Wobei eine HDD keine wirkliche Last darstellt.

King of the Hill
Beiträge: 13561
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 13.08.2013, 17:12

Als was wird eigentlich dem ESXi die Einzelplatte(n) vorgesetzt, AHCI oder Raid?
Ich bin immer noch der Meinung, daß der ESXi keine Einzelplatte sehen will und das sowieso nicht supportet ist. Aber da waren wir im letzten Thread auch kein Stück vorwärts gekommen.
Was passiert denn, wenn du ein Raid1 aus Samsung und Seagate erstellst und dieses Volume dann dem ESXi als Datenspeicher präsentierst?
Desktop-HDDs an einem HW-Raidcontroller ist auch nicht die beste Lösung, könnte uns aber der Lösung näher bringen und soviele Möglichkeiten sehe ich nicht mehr.

Experte
Beiträge: 1362
Registriert: 30.03.2009, 17:13

Beitragvon UrsDerBär » 13.08.2013, 18:44

Dayworker hat geschrieben:Desktop-HDDs an einem HW-Raidcontroller ist auch nicht die beste Lösung, könnte uns aber der Lösung näher bringen und soviele Möglichkeiten sehe ich nicht mehr.
Dem kann ich nur beipflichten. Habe früher auch damit hantiert und ziemlich schnell aufgegeben. Immer wieder unerklärebare Disconnects, RAID-Fehler usw. die im Standalone Betriebe nicht bemerkbar waren. Zumindest die Constellation ES ist aber eine Enterprise HD womit es keine Probleme geben dürfte.

King of the Hill
Beiträge: 13561
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 13.08.2013, 20:38

Ob die Constellation ES eine Enterprise HD ist oder nicht, hat zum einen manchmal nichts zu bedeuten. Es waren auch von anderen HDs einige Probleme bekannt geworden, die dann vom HD-Hersteller mit einem Firmware-Update beseitigt wurden und ich glaube die Constellation war genau so eine problematische Platte.
...und zum anderen würde ich auch die Kompatibilitätsliste beim HW-Controller einsehen. Nur was darin aufgeführt ist, läuft auch zuverlässig, da in dieser Konstellation auch getestet wurde. Speziell Platten mit 4KB-Sektorgrösse verursachen immer noch einige Probleme und da es inzwischen auch Platte unterhalb von 2TB mit dieser Sektorgrösse gibt, würde ich hier nichts ausschliessen. Zumal er ja selbst andeutet, daß eine seiner Platten vorher in einem NAS gelaufen war.


Da er aber schon die Probleme mit anderen HDs am selben MB hatte, bleiben nur noch MB-Defekt im Bereich der Spannungsversorgung, RAM-Fehler oder das NT hat einfach einen Knacks weg. Ich würde daher in diesem Fall zuerst das NT wechseln, da ein Spannungseinbruch sich am stärksten auswirkt und in jedem Fall auch den RAM mit einem Primezahl-Tool (Orthos Multiprime, Prime95, Prime) überprüfen.

Member
Beiträge: 180
Registriert: 02.04.2010, 11:02

Beitragvon drnicolas » 17.08.2013, 10:22

Vielen Dank für die Hinweise!

Inzwischen habe ich das NT getauscht und das scheint es gewesen zu sein.

Im Nachhinein passt es auch:
- Zunächst korrekte Funktion
- Ausfall nach einiger Zeit


Zurück zu „Hardware“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste