Seite 1 von 1

Unerklärlicher Fehler

Verfasst: 09.01.2009, 10:26
von Doctor1445
Hallo Zusammen,

Gestern war ein schwarzer Tag für mich.
In der Firma ging ein SQL Server den Bach ab, und das schlimme daran ist, keine Ahnung wieso. Der Schaden hält sich dank dem Backup in Grenzen.

Wie es soweit kam.
Wir haben einige HP DL 365 G5 Server mit 4GB Qlogic Fiberkarten verbaut. Diese sind an einem Promise VTrack610F angeschlossen. Soweit so gut.

Die Hosts haben zu 90% VMware 1.0.8 installiert bis auf einen VMware 2.0 Server mit welchem ich seit einiger Zeit einige Server Produktiv habe um Erfahrungen zu sammeln. Die Virtuellen Server werden alle auf dem Storage betrieben.

Gestern stürzte irgendwie der VMware 2.0 Server ab ich war gerade dabei eine neue VM zu installiere bzw kopieren. Die VMs auf dem Host liefen weiter, jedoch konnte ich nicht mehr aufs Webinterface zugreifen.
Ich rebootete also den Host.

Nach dem Reboot waren von 5 VMwares auf dem Server nur noch 3 fehlerfrei. Auf dem Storage konnte ich auf einen gar nicht mehr zugreiffen "Zugriff Verweigert" auf den Ordner und bei der anderen vmware war das .vmx zerstört. dieses konnte ich dann zwar manuell wieder erstellen, doch der sqlserver auf welchen der zugriff verweigert war ist nun futsch.

Wie lässt sich das erklären?
Im Eventlog der Vmware ist nichts zu sehen genau so wie auf dem Storage.
Das Vertrauen in die Umgebung hält sich nun in grenzen.

Ich bin für jeden Tipp oder Anregnung sehr dankbar...

Verfasst: 09.01.2009, 11:22
von e-e-e
Halllllo,

welches Host-OS setzt Du ein?

Verfasst: 09.01.2009, 11:53
von Doctor1445
Windows 2003 R2 x64

Verfasst: 09.01.2009, 17:02
von saxa
Eindeutig Hardware-Problem. Auch schon erlebt. Sieht danach aus, dass eine oder mehr Festplatten im Array kaputt (oder eher offline) während der Transaktion gingen.

IMHO, Promise != Enterprise level...

Verfasst: 09.01.2009, 18:00
von Dayworker
Promise VTrak E610f Single, 2x 4Gb Fibre Channel, 3HE für 4000Euro :?:

Wo fängt denn Enterprise-Level an? Wo es aufhört, weiß ich ja selbst :lol:

Verfasst: 12.01.2009, 08:46
von Doctor1445
saxa hat geschrieben:Eindeutig Hardware-Problem. Auch schon erlebt. Sieht danach aus, dass eine oder mehr Festplatten im Array kaputt (oder eher offline) während der Transaktion gingen.


Wirklich ein Hardware Problem?
Aber ich nichts im Eventlog des Gerätes sehen?


saxa hat geschrieben:Promise VTrak E610f Single, 2x 4Gb Fibre Channel, 3HE für 4000Euro

Ja dies ist es...

Verfasst: 12.01.2009, 13:49
von saxa
Dayworker hat geschrieben:Wo fängt denn Enterprise-Level an? Wo es aufhört, weiß ich ja selbst :lol:


Hey, ich weiß nicht, wo es aufhört; möchte aber gern erfahren :)

Also, für mich erst mal mit der Auswahl der Marke. Vergleiche mal, was so ein Array, sagen wir mal, in Hewlett-Packard-Version kosten würde...

Doctor1445 hat geschrieben:Aber ich nichts im Eventlog des Gerätes sehen?


Hm... Ja... Leider werden nicht alle Fehler protokolliert... Und bei Storage ist es so wie so kritisch... Hast du das Array "auf Herz und Nieren" untersucht, bevor du es in die Produktion aufgenommen hast? Sagen wir, iometer eine Woche lang darauf ununterbrochen laufen lassen (direkt auf dem Storage, nicht in der virtuellen Maschine)?

Verfasst: 12.01.2009, 16:16
von Doctor1445
saxa hat geschrieben:Hm... Ja... Leider werden nicht alle Fehler protokolliert... Und bei Storage ist es so wie so kritisch... Hast du das Array "auf Herz und Nieren" untersucht, bevor du es in die Produktion aufgenommen hast? Sagen wir, iometer eine Woche lang darauf ununterbrochen laufen lassen (direkt auf dem Storage, nicht in der virtuellen Maschine)?


Nein hab ich nicht gemacht...
Aber werd ich machen, so viel ist noch nicht drauf...

Also dann bis in ner Woche ...
Ich lass nun mal den iometer laufen mit 5 workern und einem all in one test auf jedem.
oder muss ich was speziell konfigurieren? welcher test empfielt sich?