Seite 1 von 1
jemand erfahrung mit asr (automatic system recovery) von hp?
Verfasst: 17.05.2010, 08:01
von adeba
moin, am wochenende hat einer unserer esx server (hp dl 380g5) einen reboot ausgelöst. gottseidank war zu dem zeitpunkt keine vm auf ihm aktiv.
ein hardwaredefekt ist nicht zu erkennen. die hp insight management seite sagt, das ein automatischer reboot durchs asr ausgelöst wurde.
hier noch etwas zum asr:
http://kb.vmware.com/selfservice/micros ... Id=1010842
habt ihr asr aktiv? oder deaktiviert?
Verfasst: 17.05.2010, 09:58
von Piddi
im VMWare-Bereicht hatten wir bisher noch keine Probleme mit aktiviertem ASR.
Bei der ein oder anderen Windowsmaschine jedoch schon.
Haben also auf einigen Servern ASR disabled...
Verfasst: 18.05.2010, 00:14
von Saturnous
Hihi der KB reflektiert den Glaubenskrieg darüber. ASR funktioniert über HP IPMI Treiber, den nativen Watchdog Timer Funktionen des OS und der ILO (aufgebohrter IPMI CHIP).
Das Ding ist ein Teufelchen was munter rückwärts zählt und bei 0 den Reset Knopf drückt - ob es zu schnell runtergezählt hat - oder die Situation sich selbst repariert hätte weis man nie so recht. Der Treiber kann genauso sich weghängen ohne das der Hypervisor aufhört zu funktionieren.
Wie die Römer sagen "panta rei" - alles fliest - und so schwankt auch die Rate in der ein ASR ein "false positive" ist über verschiedene HP Agenten, ESX Kernel und ILO2 FW Versionen.
Wenn man jetzt überlegt was ein ASR abfangen soll dann kommt man leicht zu einer Entscheidung :
- einfrierende Systeme
- PSODs
Beides sind in ESX Versionen recht selten und man will den PSODs sehr schnell auf die Schliche kommen. Also lässt man ASR aus - bis man wirklich mit einer PR Nummer bis zum nächsten Patchrelease in der Luft hängt und ständig mit PSODs rechnen muss oder bis seine HW "gereift" ist und man lieber sich gegen einen vergessenen Hänger absichert - man weis das man mit der jetzigen Build zufrieden sein kann und das Firmware mässig nichts mehr zu erwarten ist.
Auf Windows Systemen mit NOCH mehr Parteien die ständig Treiber nachliefern macht der ASR mehr Sinn - ABER Windows hat seit 2003 sein eigenes ASR Feature und würde jeden BSOD vernünftig abfangen, also ASR beim ersten Bluescreen ausschalten und nach beheben desjenigen wieder an um ggf einen Freeze abfangen zu können.
Übrigends bei installierten Agenten auf ESX kann man den ASR live deaktivieren per "hplog -a DISABLE" und mit "hplog -a STATUS" prüfen.
Verfasst: 18.05.2010, 07:57
von adeba
danke für die tipps. ich werde es ausschalten auf allen esx servern. der hp support meinte das die server dazu eventuell rebootet werden müssen. weiss jemand ob dies bei dl380g5/dl360g5 nötig ist? oder reicht ein "hplog -a DISABLE" aus?
Verfasst: 18.05.2010, 22:30
von Saturnous
Reicht aus !