Hallo und guten Morgen zusammen!
"Muß" & darf hoffentlich mich mal wieder mit einem Problem an Euch wenden:
wir hatten einen Stromausfall und nun ist eins meiner Raids als "offline" gekennzeichnet
Es handelt sich um einen X3650-7979 mit nem "8k"-Raid.
Es gibt im Setup des Raids die Funktion "Enable / Restore" Raid. Was passiert wenn ich diese Funktion ausführe? Das System warnt extra, da alle Daten verloren gehen können...
Gibt es für mich noch eine andere Lösung?
Danke jetzt schon für Eure Hilfe!!
Gruß
Rik
Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!
nach Stromausfall Raid "offline" - X3650-7979
-
- King of the Hill
- Beiträge: 13561
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
Definiere bitte mal Stromausfall. Ein Raid ohne BBU/FBWC oder zumindest USV ist anfälliger für Probleme und die Probleme steigen noch mit dem Raidlevel.
Die Funktion "Enable/Restore" geht wahrscheinlich nur auf den Zustand Enable ein, bei dem alle bisherigen Einzelplatten als Raidmitglieder initialisiert und dazu komplett gelöscht werden. Inwieweit das Restore dabei möglicherweise Daten zerstört, dürfte vom Raidlevel und vor allem vom vorliegenden Zustand des Raids abhängen. Wenn die Raidinformationen im Controller oder manchmal auch in einem Superblock auf den einzelnen Raidmitgliedsplatten verloren gegangen ist, wirst du wohl ein möglichst aktuelles Backup brauchen.
Die Funktion "Enable/Restore" geht wahrscheinlich nur auf den Zustand Enable ein, bei dem alle bisherigen Einzelplatten als Raidmitglieder initialisiert und dazu komplett gelöscht werden. Inwieweit das Restore dabei möglicherweise Daten zerstört, dürfte vom Raidlevel und vor allem vom vorliegenden Zustand des Raids abhängen. Wenn die Raidinformationen im Controller oder manchmal auch in einem Superblock auf den einzelnen Raidmitgliedsplatten verloren gegangen ist, wirst du wohl ein möglichst aktuelles Backup brauchen.
Stromausfall: Baggerschaufel & Stromleitung passen nicht zusammen
ne, im ernst: hier hats gestern 3/4 der Stadt lahmgelegt, Spannungsversorgung schlagartig weg.
Eine USV besitze ich hier nicht (vllt sollte ich mal darüber nachdenken!?), was ist "BBU/FBWC", das habe ich ebenfalls nicht.
Ich war jetzt so mutig und habe die "enable / restore"-Funktion ausprobiert, hatte nicht viel andere Wahl. Hat so nicht geholfen. Was aber geholfen hat, war ein "force online" mittels IBM-Raid-Update-CD
nun habe ich alles wieder, wahrscheinlich mal wieder mit sehr viel Glück
ne, im ernst: hier hats gestern 3/4 der Stadt lahmgelegt, Spannungsversorgung schlagartig weg.
Eine USV besitze ich hier nicht (vllt sollte ich mal darüber nachdenken!?), was ist "BBU/FBWC", das habe ich ebenfalls nicht.
Ich war jetzt so mutig und habe die "enable / restore"-Funktion ausprobiert, hatte nicht viel andere Wahl. Hat so nicht geholfen. Was aber geholfen hat, war ein "force online" mittels IBM-Raid-Update-CD
nun habe ich alles wieder, wahrscheinlich mal wieder mit sehr viel Glück
-
- King of the Hill
- Beiträge: 13561
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
Mal im Ernst du hast ein X3650-7979 und hast dann nicht mal das Geld, um deinen Raidcontroller mit BBU bzw FBWC gegen Datenverlust bei Stromausfall und zum Aktivieren des die Performance absolut fördernden Writeback-Cache im Controller zu gönnen
In dieselbe Richtung geht dann auch noch die fehlende USV. Kein OS und Dateisystem sieht es gerne, wenn mittendrin der Strom ausfällt. Daran ändert die USV freilich nur, daß das OS einen geordneten Shutdown hinlegen kann.
Beim ESXi kommt noch hinzu, daß die unverständlicherweise nur einmal auf dem Datenträger (Lun/Volume/Partition) vorhandene und genauso unverständlicherweise sogar noch beschreibbar im RAM vorgehaltene Partitionstabelle schwerwiegende Probleme begünstigt. Es reicht also ein Stromausfall aus und dein Server kommt mangels nutzbarer Partitionierungsdaten nicht mehr hoch.
Mit anderen Worten sparst du am falschen Ende. Eigentlich fehlt jetzt nur noch, daß du Snapshots als Backup ansiehst.
In dieselbe Richtung geht dann auch noch die fehlende USV. Kein OS und Dateisystem sieht es gerne, wenn mittendrin der Strom ausfällt. Daran ändert die USV freilich nur, daß das OS einen geordneten Shutdown hinlegen kann.
Beim ESXi kommt noch hinzu, daß die unverständlicherweise nur einmal auf dem Datenträger (Lun/Volume/Partition) vorhandene und genauso unverständlicherweise sogar noch beschreibbar im RAM vorgehaltene Partitionstabelle schwerwiegende Probleme begünstigt. Es reicht also ein Stromausfall aus und dein Server kommt mangels nutzbarer Partitionierungsdaten nicht mehr hoch.
Mit anderen Worten sparst du am falschen Ende. Eigentlich fehlt jetzt nur noch, daß du Snapshots als Backup ansiehst.
Guten Morgen Dayworker,
danke für Deine Antwort!
Ich bin nicht geizig was die Sicherheit meines Systems angeht, aber ich bin total unerfahren in dem "Server-Bereich". Daher baut sich mein System mit meinem "Wissen" immer weiter aus - leider hab ich aber auch dafür nicht unendlich finanzielle Möglicheiten
Seit 10 Minuten weiß ich, das ich meinen RAID-Controller mit einer Backup-Battery-Unit ausstatten kann, werde mich gleich mal auf die Such danach machen.
Ebenfalls hab ich schon durch Euch gelernt das Snapshots keine Backups sind, deswegen ja auch einer meiner anderen Threads
Was wäre denn für Dich eine Umgebung für mein System, ohne am falschen Ende gespart zu haben?
Danke und Gruß
Rik
danke für Deine Antwort!
Ich bin nicht geizig was die Sicherheit meines Systems angeht, aber ich bin total unerfahren in dem "Server-Bereich". Daher baut sich mein System mit meinem "Wissen" immer weiter aus - leider hab ich aber auch dafür nicht unendlich finanzielle Möglicheiten
Seit 10 Minuten weiß ich, das ich meinen RAID-Controller mit einer Backup-Battery-Unit ausstatten kann, werde mich gleich mal auf die Such danach machen.
Ebenfalls hab ich schon durch Euch gelernt das Snapshots keine Backups sind, deswegen ja auch einer meiner anderen Threads
Was wäre denn für Dich eine Umgebung für mein System, ohne am falschen Ende gespart zu haben?
Danke und Gruß
Rik
Am falschen Ende sparen = zbsp. Tolle, schnelle Hardware aber keine USV und keine BBU
Ansonsten: Mit Force-Online sind deine Daten erstmal oben, das ist korrekt. Allerdings fand hier keine Überprüfung statt, ob die Daten tatsächlich noch alle gut sind. Das muss nicht der Fall sein, auch wenn der Explorer keine Auffälligkeiten zeigt. Arbeitest einfach weiter, werden evtl. relevante Sektoren überschrieben.
Kann in solchen Fällen eigentlich nur empfehlen, vor einer Aktion immer nen Sektor-Clone von allen beteiligten Platten zu ziehen. Ist zwar mühsam, aber verbockt man was, hat man immer noch eine Absicherung. Kennt man die RAID-Parameter, lassen sich die Daten fast immer wieder holen, wenn auch nicht zwingend alles.
Hat man aktuelle Backups ist das evtl. etwas übertrieben und ein Force Online ist ausreichend. So ganz wohl ist mir dabei allerdings nie. Zumindest nen Dateisystemcheck würde ich drüber rennen lassen.
USV: Würde hier immer ne kleine Marken-Online-USV verbauen. Grund: Du hast auch gleich nen ziemlich guten Schutz vor Hochfrequenten Sauereien, Blitzeinschäge in der Nähe usw. Kannst meist auch gut gebraucht kaufen + nen neuen Akkusatz von zbsp. ZDNET (Preiswerte (nicht billige), gute Akkusätze, auch selektiert). Würde gleich deutlich grössere Akkus nehmen und daneben mit grossem Querschnitt verkabeln. Geladen werden die problemlos, dauert einfach.
Gründe: Weniger Parallele Blöcke - das sind normal die Extensions - mit gleicher Spannung = weniger gegenseitiges Entladen = längere Lebensdauer. Die grösseren sind neben der längern Autonomiezeit in der Regel qualitativ vor allem mechanisch deutlich besser aufgebaut. Dadurch und weil sie nicht immer tiefentladen werden bei nem kleinen Stromausfall halten sie deutlich länger. Perfekt wäre noch 1-2x im Jahr ein paar Tage an nen externes Netzteil mit Pulser (Megapuls) hängen. Dann hast extrem viele Jahre freude an den gleichen Akkus. Da der Pulser auch im hochfrequenten Bereich arbeitet, allerdings nur auf sehr kurze 'Distanz' wirsam ist, bin ich nicht sicher ob man ihn auch direkt angeschlossen lassen könnte. Hab ich noch nie versucht. Am Auto mache ich das jeweils so. Und nein, das ist kein Hokuspokus. Habe so diverse alte Batterien wiederbelebt und irgendwo noch ne wissenschaftliche Arbeit rumliegen. Achtung: Netzteil/Ladegerät mit Ladestrombegrenzung, sonst kochen die Dinger wenn sie plötzlich 40Ampere Strom aufnehmen obwohl sie eigentlich voll geladen sind - werden hübsch aufgeblasen, stinkt wie die hölle und ist saugefährlich. Die im Auto halten auch problemlos 10 Jahre, wenn sie nicht mechanisch kaputt gehen.
Ansonsten: Mit Force-Online sind deine Daten erstmal oben, das ist korrekt. Allerdings fand hier keine Überprüfung statt, ob die Daten tatsächlich noch alle gut sind. Das muss nicht der Fall sein, auch wenn der Explorer keine Auffälligkeiten zeigt. Arbeitest einfach weiter, werden evtl. relevante Sektoren überschrieben.
Kann in solchen Fällen eigentlich nur empfehlen, vor einer Aktion immer nen Sektor-Clone von allen beteiligten Platten zu ziehen. Ist zwar mühsam, aber verbockt man was, hat man immer noch eine Absicherung. Kennt man die RAID-Parameter, lassen sich die Daten fast immer wieder holen, wenn auch nicht zwingend alles.
Hat man aktuelle Backups ist das evtl. etwas übertrieben und ein Force Online ist ausreichend. So ganz wohl ist mir dabei allerdings nie. Zumindest nen Dateisystemcheck würde ich drüber rennen lassen.
USV: Würde hier immer ne kleine Marken-Online-USV verbauen. Grund: Du hast auch gleich nen ziemlich guten Schutz vor Hochfrequenten Sauereien, Blitzeinschäge in der Nähe usw. Kannst meist auch gut gebraucht kaufen + nen neuen Akkusatz von zbsp. ZDNET (Preiswerte (nicht billige), gute Akkusätze, auch selektiert). Würde gleich deutlich grössere Akkus nehmen und daneben mit grossem Querschnitt verkabeln. Geladen werden die problemlos, dauert einfach.
Gründe: Weniger Parallele Blöcke - das sind normal die Extensions - mit gleicher Spannung = weniger gegenseitiges Entladen = längere Lebensdauer. Die grösseren sind neben der längern Autonomiezeit in der Regel qualitativ vor allem mechanisch deutlich besser aufgebaut. Dadurch und weil sie nicht immer tiefentladen werden bei nem kleinen Stromausfall halten sie deutlich länger. Perfekt wäre noch 1-2x im Jahr ein paar Tage an nen externes Netzteil mit Pulser (Megapuls) hängen. Dann hast extrem viele Jahre freude an den gleichen Akkus. Da der Pulser auch im hochfrequenten Bereich arbeitet, allerdings nur auf sehr kurze 'Distanz' wirsam ist, bin ich nicht sicher ob man ihn auch direkt angeschlossen lassen könnte. Hab ich noch nie versucht. Am Auto mache ich das jeweils so. Und nein, das ist kein Hokuspokus. Habe so diverse alte Batterien wiederbelebt und irgendwo noch ne wissenschaftliche Arbeit rumliegen. Achtung: Netzteil/Ladegerät mit Ladestrombegrenzung, sonst kochen die Dinger wenn sie plötzlich 40Ampere Strom aufnehmen obwohl sie eigentlich voll geladen sind - werden hübsch aufgeblasen, stinkt wie die hölle und ist saugefährlich. Die im Auto halten auch problemlos 10 Jahre, wenn sie nicht mechanisch kaputt gehen.
so, Updates von mir:
-USV ist organisiert, sollte die Tage hier eintreffen. Ist von nem Kumpel, ne APC SUI100A(?) Ist die vorerst okay?
-BatteryBackupUnit für den Raid-Controller ist bestellt
Sektor-Clone: wie komme ich an den heran bzw wie mache ich das? Habe dazu bisher nichts im I-Net gefunden...
Dateisystemcheck: EDIT: kann mich natürlich per PUTTY auf dem ESXi verbinden aber
wie führe ich ein Dateisystemcheck am besten durch? Was wären sinnvolle Vorbereitungen (VMs ausgeschaltet, ESXi im Wartungsmodus, ...?!)
-USV ist organisiert, sollte die Tage hier eintreffen. Ist von nem Kumpel, ne APC SUI100A(?) Ist die vorerst okay?
-BatteryBackupUnit für den Raid-Controller ist bestellt
Sektor-Clone: wie komme ich an den heran bzw wie mache ich das? Habe dazu bisher nichts im I-Net gefunden...
Dateisystemcheck: EDIT: kann mich natürlich per PUTTY auf dem ESXi verbinden aber
wie führe ich ein Dateisystemcheck am besten durch? Was wären sinnvolle Vorbereitungen (VMs ausgeschaltet, ESXi im Wartungsmodus, ...?!)
-
- King of the Hill
- Beiträge: 12944
- Registriert: 02.08.2008, 15:06
- Wohnort: Hannover/Wuerzburg
- Kontaktdaten:
APC 1000VA. Die hat ca. 800 Watt. Schau halt das die Batterien nicht aelter als 3.5 Jahre sind und mach einen Lasttest mit dem Geraet. Der ist dann regelmaessig zu wiederholen da Batterien verschleissteile sind und die LED Anzeige der USV ist unzuverlaessig.
Es gibt keinen Filesystemecheck fuer VMFS. Zumind. ist der Oeffentlichkeit keiner bekannt.
Gruss
Joerg
Es gibt keinen Filesystemecheck fuer VMFS. Zumind. ist der Oeffentlichkeit keiner bekannt.
Gruss
Joerg
-
- King of the Hill
- Beiträge: 13561
- Registriert: 01.10.2008, 12:54
- Wohnort: laut USV-Log am Ende der Welt...
APC selbst empfiehlt den Austausch laut Software mindestens alle 3 Jahre und viel länger sollte man im Allgemeinen auch nicht damit warten. Eine dreijährige, dauerhafte Erhaltungsladung bei einer Offline- oder Normalladung bei Online-USV hat dieselben Folgen, mit der schon normale Notebooks konfrontiert werden, wenn diese als Desktopersatz dauerhaft mit Akku am Netzteil hängen.
Als USV-Besonderheit ist auch noch zu beachten, daß sich die Laufzeit bei niedriger Last nicht einfach in die mögliche Laufzeit bei doppelter Last umrechnen läßt. Zumindest aus den APC-Dokumenten geht dieser Umstand eindeutig hervor. Darin ist anhand einer Kurve ersichtlich, daß die Last exponentiell einfließt. Doppelte Last kann daher durchaus bedeuten, daß die Laufzeit nur noch ein Fünftel beträgt.
Die Powerchute-SW von APC-USVs führt zwar automatisch alle 14 Tage bzw beim Einschalten einen Selbsttest durch. Diesem kann man aber nur bedingt vertrauen, da sich damit nur die prinzipielle Funktion jedoch nicht die noch mögliche Stützzeit ableiten läßt. Sowas kann man dann nur über den Selbsttest innerhalb der Verwaltungssoftware herausfinden. Wenn man sowas monatlich oder bei hochbelasteten Systemen auch wöchentlich aufzeichnet, dürfte man sehr einfach den besten Zeitpunkt für einen Austausch entnehmen können.
Als USV-Besonderheit ist auch noch zu beachten, daß sich die Laufzeit bei niedriger Last nicht einfach in die mögliche Laufzeit bei doppelter Last umrechnen läßt. Zumindest aus den APC-Dokumenten geht dieser Umstand eindeutig hervor. Darin ist anhand einer Kurve ersichtlich, daß die Last exponentiell einfließt. Doppelte Last kann daher durchaus bedeuten, daß die Laufzeit nur noch ein Fünftel beträgt.
Die Powerchute-SW von APC-USVs führt zwar automatisch alle 14 Tage bzw beim Einschalten einen Selbsttest durch. Diesem kann man aber nur bedingt vertrauen, da sich damit nur die prinzipielle Funktion jedoch nicht die noch mögliche Stützzeit ableiten läßt. Sowas kann man dann nur über den Selbsttest innerhalb der Verwaltungssoftware herausfinden. Wenn man sowas monatlich oder bei hochbelasteten Systemen auch wöchentlich aufzeichnet, dürfte man sehr einfach den besten Zeitpunkt für einen Austausch entnehmen können.
@Dayworker: Wie gesagt, wenn man den Akkus ein einigermassen angenehmes Umfeld beschert (sicher keine 30-40°C), diese ordentlich verkabelt, Impedanz-selektionierte sowie deutlich grössere und bessere Akkus verwendet, halten die gerne auch 8 Jahre und man hat erst noch die bessere Laufzeit. Der Schrott der in den kleinen USV's verbaut wird kann man nicht wirklich ernst nehmen.
Nach ein paar Stromausfällen bzw. Tiefentladungen sollten Akkus auf alle Fälle gepulst werden, dann erhalten sie wieder ca. 75-90% der Kapazität. Je nach dem wie lange man damit wartet.
Nach ein paar Stromausfällen bzw. Tiefentladungen sollten Akkus auf alle Fälle gepulst werden, dann erhalten sie wieder ca. 75-90% der Kapazität. Je nach dem wie lange man damit wartet.
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste