Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Oracle Sles 10 VM ESX 4 , Lunfailover MD3000i

Hilfe bei Problemen mit Installation & Benutzung des VMware ESX Server 4/VMware vSphere 4.0.

Moderatoren: Dayworker, irix

Benutzeravatar
Member
Beiträge: 253
Registriert: 22.06.2008, 16:54

Oracle Sles 10 VM ESX 4 , Lunfailover MD3000i

Beitragvon Fisi » 03.05.2011, 09:38

Hallo Leute,

ich habe das Problem, dass wenn die MD3000i einen Lunfailover macht, sprich ein Raidcontroller ausgefallen ist, die Oracle VM läuft weiter aber die Datenbank ist nicht mehr erreichbar.
Ich muss die VM dann neustarten.


# VMware SCSI devices Timeout adjustment
#
# Modify the timeout value for VMware SCSI devices so that
# in the event of a failover, we don't time out.
# See Bug 271286 for more information.
#

Nun habe ich in "etc/udev/rules.d/99-vmware-scsi-udev.rules" Timeout auf 300 s gesetzt, da ich einen Hinweis im Netz gefunden habe, dass ein Lunfailover der MD3000i 300 s dauern kann.

[url]
http://www.myoraclesupports.com/content ... scsi-stora[/url]

Was könnt Ihr dazu sagen ?

Benutzeravatar
Member
Beiträge: 253
Registriert: 22.06.2008, 16:54

Beitragvon Fisi » 05.05.2011, 11:29

Meine SLES10 Oracle VM hat die 180 sec. von VMtools nicht bekommen.
Obwohl der Kernel nicht unter 2.6.13 war.

Nun gut , bin auf diesen Link gekommen und habe es von Hand konfiguriert.
Und dann in den "/etc/init.d/boot.local" auch reingeschrieben.

Die Timeout Zeit habe ich auf 300 hochgeschraubt, da ich eine Empfehlung im Web gesehen habe, die mitteilt , dass bei einer MD3000i ein Lunfailover auch länger als 200 sec dauern kann.
Mein Suse Oracle System hatte 60 secs gehabt, wie gesagt es wurde nicht mal durch VMtools auf 180 gesetzt.
Dadurch wird das Filesystem bei einem Lunfailover sogar "read only".
Es gibt unschöne Fehler in "/var/log/messages", hier einige Ausschnitte.

May 5 07:01:35 orasrvdus kernel: mptscsih: ioc0: attempting task abort! (sc=ffff810058986c40)
May 5 07:01:35 orasrvdus kernel: sd 0:0:0:0:
May 5 07:01:35 orasrvdus kernel: command: Write (10): 2a 00 00 04 0a a7 00 00 08 00
May 5 07:01:35 orasrvdus kernel: mptbase: ioc0: IOCStatus(0x004b): SCSI IOC Terminated
May 5 07:01:35 orasrvdus kernel: mptscsih: ioc0: task abort: SUCCESS (sc=ffff810058986c40)
May 5 07:01:35 orasrvdus kernel: mptscsih: ioc0: attempting task abort! (sc=ffff810055298a00)
May 5 07:07:22 orasrvdus kernel: sd 0:0:0:0: SCSI error: return code = 0x20008
May 5 07:07:22 orasrvdus kernel: end_request: I/O error, dev sda, sector 787535
May 5 07:07:22 orasrvdus kernel: Buffer I/O error on device sda1, logical block 98434
May 5 07:07:22 orasrvdus kernel: lost page write due to I/O error on sda1
May 5 07:07:22 orasrvdus kernel: sd 0:0:0:0: SCSI error: return code = 0x20008
May 5 07:07:22 orasrvdus kernel: end_request: I/O error, dev sda, sector 787495
May 5 07:07:22 orasrvdus kernel: Buffer I/O error on device sda1, logical block 98429
May 5 07:07:23 orasrvdus kernel: EXT3-fs error (device sdb1) in ext3_reserve_inode_write: Journal has aborted
May 5 07:07:23 orasrvdus kernel: ext3_abort called.
May 5 07:07:23 orasrvdus kernel: EXT3-fs error (device sdb1): ext3_journal_start_sb: Detected aborted journal
May 5 07:07:23 orasrvdus kernel: Remounting filesystem read-only
May 5 07:08:24 orasrvdus kernel: EXT3-fs unexpected failure: buffer_uptodate(jh2bh(jh));
May 5 07:08:24 orasrvdus kernel: Possible IO failure.

Das waren bei mir die Gründe, warum mein Oracle erst nach dem Restart der ganzen VM funktionierte, nach so einem Lunfailover Event der MD3000i Storage.


Hier ist der Link zum konfigurieren der SCSI Timeouts in der VM , die Probleme beim Lunfailover bekommt.


http://xtravirt.com/linux-disk-timeout-settings-not-increased-vmware-tools


Zurück zu „vSphere 4 / ESX 4“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 22 Gäste