Die Foren-SW läuft ohne erkennbare Probleme. Sollte doch etwas nicht funktionieren, bitte gerne hier jederzeit melden und wir kümmern uns zeitnah darum. Danke!

Booten hängt bei PCI-Passthrough nach BIOS-Änderung

Moderatoren: Dayworker, irix

Member
Beiträge: 2
Registriert: 06.01.2013, 14:26
Wohnort: Bonn

Booten hängt bei PCI-Passthrough nach BIOS-Änderung

Beitragvon Tanguero » 09.01.2013, 10:53

Hallo zusammen,

seit etwa drei Jahren lief mein privater ESXi-Server im Keller und hat dehr zuverlässig die Interneteinwahl mit Firewall, Fileserver, Mediaserver, etc virtualisiert.
Nun habe ich ein kniffliges Problem:

Vor zwei Wochen war der Server plötzlich aus - Grund unbekannt. Booten funktionierte nicht weil der USB-Stick nicht mehr in der Bootabfolge eingetragen war. Also tippte ich auf eine leere CR2032 Batterie und tauschte diese. Dann Bootreihenfolge korrigiert und OK.
Neujahr wollte ich dann das Update auf 5.1 durchführen. Vermutlich habe ich dabei noch mal das BIOS überprüft und vielleicht irgend etwas geändert.
Jedenfalls hing der Bootvorgang nach dem Update bei der Meldung "cnic_register loaded successfully".
Im Netz fand sich zur Problembehebung in diesem Fall eine Neuinstallation statt Update auf 5.1.
Nach der Neuinstallation lief alles. - Bis ich meine Fritz ISDN Karte und eine 3com Netzkarte für das ADSL-Modem per passthrough durchgereicht hatte. Dann hing es wieder an der gleichen Stelle.

Ich fand einiges über nicht funktionierendes PCI-Passthrough in 5.1 und war sauer auf VMWare.
Aber kein Problem. Ich hatte mir ja vor dem Update ein Image von der laufenden 5.0 Version gemacht.
Doch auch die läuft nicht mehr!

Was folgte waren mindestens 15 Stunden mit Neuinstallationen und Fehleranalysen.

Ich habe das Problem eingegrenzt, indem ich ISDN-Karte und 3com Netzwerkkarte ausgebaut und nur die PCI-Bridge per PT eingerichtet habe. Damit ist automatisch die ASPEED Grafikkarte des Mainboards
als einziges Device durchgereicht, weil sie mit PCI angebunden ist. Das richt um den Fehler zu bekommen.
PT von z.B. nic2 oder anderen nicht-PCI-devices funktioniert.

Ich habe den Kernellog eines Bootens ohne PT mit dem des hängenden Systems verglichen. ([Alt]+F12 gedrückt wenn der Bildschirm gelb wird.)

Das Booten läuft nur bis

Code: Alles auswählen

...
2013-01-06T14:33:59.562Z cpu4:2630)Mod: 4015: Initialization of cnic_register succeeded with module ID 25.
2013-01-06T14:33:59.562Z cpu4:2630)cnic_register loaded successfully.
2013-01-06T14:33:59.564Z cpu4:2630)Uplink: 2380: Couldn't find pps. Creating ps pps
2013-01-06T14:33:59.564Z cpu4:2630)NetPortset: 737: activating portset #0 as pps (etherswitch) with 256 ports, index mask is 0xff
2013-01-06T14:33:59.565Z cpu4:2630)NetPort: 1239: enabled port 0x1 with mac 00:00:00:00:00:00
2013-01-06T14:33:59.565Z cpu4:2630)Mirror.etherswitch: MirrorSessionCreate:1793: added session legacy_promiscuous(legacy_promiscuous) to pps
2013-01-06T14:33:59.565Z cpu4:2630)Uplink: 5444: Created parking portset pps.
2013-01-06T14:33:59.587Z cpu4:2630)PCI: 3938: 000:000:31.5 named 'vmhba2' (was '')
2013-01-06T14:33:59.819Z cpu4:2630)PCI: 3938: 000:000:31.2 named 'vmhba0' (was '')
2013-01-06T14:33:59.856Z cpu4:2630)PCI: 3938: 000:001:00.0 named 'vmhba1' (was '')
2013-01-06T14:33:59.869Z cpu4:2630)PCI: 3938: 000:005:00.0 named 'vmnic0' (was '')
2013-01-06T14:33:59.881Z cpu4:2630)PCI: 3938: 000:006:00.0 named 'vmnic1' (was '')


Was folgen sollte wäre etwa:

Code: Alles auswählen

2013-01-06T14:33:59.914Z cpu4:2630)Loading module e1000e ...
2013-01-06T14:33:59.916Z cpu4:2630)Elf: 1862: module e1000e has license GPL
2013-01-06T14:33:59.918Z cpu4:2630)module heap: Initial heap size: 102400, max heap size: 5562368
2013-01-06T14:33:59.918Z cpu4:2630)vmklnx_module_mempool_init: Mempool max 5562368 being used for module: 26

2013-01-06T14:33:59.918Z cpu4:2630)vmk_MemPoolCreate passed for 25 pages

2013-01-06T14:33:59.918Z cpu4:2630)skb_mem_info mempool for module e1000e created - max size 23068672
2013-01-06T14:33:59.918Z cpu4:2630)module heap: using memType 0
2013-01-06T14:33:59.918Z cpu4:2630)module heap vmklnx_e1000e: creation succeeded. id = 0x41000b420000
2013-01-06T14:33:59.918Z cpu4:2630)<6>e1000e: Intel(R) PRO/1000 Network Driver - 1.1.2-NAPI
2013-01-06T14:33:59.918Z cpu4:2630)<6>e1000e: Copyright(c) 1999 - 2009 Intel Corporation.
2013-01-06T14:33:59.918Z cpu4:2630)PCI: driver e1000e is looking for devices
...


Da das mit dem PT vorher einwandfrei lief und ich alle 5-er Versionen noch mal neu installiert habe, muss es wohl eine Änderung im BIOS sein, die ich vorgenommen habe weil sie mir vor dem Update "richtiger" vorkam und ich von evtl. zurückgesetzten Werten wegen leerer Pufferbatterie ausging.

Inzwischen habe das neueste BIOS aufgespielt, alle Werte resettet und alles einzeln konfiguriert.
Ohne Erfolg.

Nach langer Vorrede nun meine Frage an die Gemeinde:
Welche Einstellung kann das auslösen?

Ich bedanke mich im Voraus für das Lesen bis hier hin. :-)

PS. ausgewählte BIOS Einträge:

WHEA Support [Enabled]
Intel VT-d [Enabled]

-CPU Configuration
Max CPUID Value Limit [Disabled]
Intel(R) Virtualization Tech [Enabled]
CPU TM Function [Enabled]
Intel(R) C-STATE Tech [Enabled]
A20M [Disabled]

-South bridge ACPI Configuration
Energy Lake Feature [Disabled]
APIC ACPI SCI IRQ [Disabled]
High Performance Event Timer [Enabled]
HPET Memory Address [FED00000h]

-Advanced ACPI Configuration
ACPI APIC support [Enabled]
BIOS-> AML ACPI table [Enabled]
Headless mode [Disabled]

-Advanced PCI/PnP Settings
Plug An Play O/S [No]
PCI Option ROM Scan Order [Bus 0 First]
Onboard Option Rom Priority [Normal]

-Onboard Devices Configuration
HDA Controller [Enabled]
OnBoard LAN1 Boot ROM [PXE]
OnBoard LAN2 Boot ROM [PXE]
Interrupt 19 Capture [Enabled]
VGA Rom Boot Priority [PCIE VGA Card]

-Uncore Configuration
Memory Remap Feature [Enabled]
Page Policy [Closed]
Adaptive Page [Disabled]

-Server-IPMI Configuration
BMC Firmware Version : 2.03
BMC Watch Dog Timer Action [Disabled]

-Server-Configure Remote Access type and parameters
Remote Access [Enabled]
Serial port number [com2]
Redirection After BIOS POST [Disabled]

King of the Hill
Beiträge: 13659
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 09.01.2013, 19:27

Ich würde folgenden Parameter wieder aktivieren: APIC ACPI SCI IRQ [Disabled]. Auf bios-info.de steht zu APIC ACPI SCI IRQ: Diese Option wird verwendet, um den APIC (Advanced Programmable Interrupt Controller) zu aktivieren oder zu deaktivieren. Aus Kompatibilitätsgründen kann das System im APIC-Modus betrieben werden. Bei aktiviertem APIC-Modus werden die dem System zur Verfügung stehenden IRQ-Ressourcen erweitert. Einstellungen: Enabled und Disabled.
Bei "Energy Lake Feature [Disabled]" würde ich, wie auf bios-info.de beschrieben, in Bios-Voreinstellung belassen.

Hattest du eigentlich nach dem Bios-Reset mal die normalen oder optimierten Parameter geladen? Einige Probleme lösen sich vielfach nach Aufruf vor allem der optimierten Parameter von selbst.


Zu Passthrough fällt mir grad ein, daß nicht alle PCI-Geräte durchgereicht werden können.
Dayworker hat geschrieben:Wenn ich mir den VMTN-Thread Esxi 5.1 pci passthrough broken ansehe, scheint das wohl komplett fehlerhaft implemeniert worden zu sein.
Zumindest bekommt man noch von "dariusd" den Hinweis, daß per PCIe angebunden Onboard-Devices generell vom Passthrough ausgenommen sind.

Member
Beiträge: 2
Registriert: 06.01.2013, 14:26
Wohnort: Bonn

Heureka

Beitragvon Tanguero » 09.01.2013, 22:04

Nachdem ich das BIOS nach dem Flashen schon auf Defaultwerte gesetzt hatte, habe ich nun die Stützbattterie am ausgeschalteten Rechner entfernt und den Löschjumper gesetzt. Dann alles neu eingestellt - ohne Erfolg.

Also auf dem Mainboard mal die NICs disabled - ohne Erfolg.
Also die Onboard Grafikkarte disabled und blind gebootet - nach 10 Minuten konnte ich mit dem vShpere Client tatsächlich connecten!

Nachgedacht :?: ...
... :idea: Die BIOS-Einstellung

Headless Mode [Enabled]

gesetzt.
Und jetzt bootet der Rechner wieder durch. In dem Moment in dem die Grafikkarte dem Host entrissen wird, macht er ansonsten wohl die Grätsche.

Den Parameter hatte ich nicht angetastet, da ich in Erinnerung hatte, dass dies Probleme machen würde. Es war genau umgekehrt.

Ab jetzt führe ich über alle Systemänderungen Logbuch.

Danke für die Ideen!

King of the Hill
Beiträge: 13659
Registriert: 01.10.2008, 12:54
Wohnort: laut USV-Log am Ende der Welt...

Beitragvon Dayworker » 09.01.2013, 23:08

-Server-IPMI Configuration
BMC Firmware Version : 2.03
BMC Watch Dog Timer Action [Disabled]

-Server-Configure Remote Access type and parameters
Remote Access [Enabled]
Serial port number [com2]
Redirection After BIOS POST [Disabled]
In deinem Fall kommt noch hinzu, daß du das integrierte BMC des Mainboards aktiviert hast. Damit und mit Nic's sowie allgemein mit IPMI sind hier im Forum schon einige Probleme bekannt geworden. Speziell Intels BMC macht dort einige unerwartete, fiese Spielchen.
Eine ausgewachsene Remote-Management-Lösung ala iLO von HP oder deren Pendant iDRAK von Dell sind dort die meines Wissens problemloseren Möglichkeiten. Solange es nicht um Virtualisierung geht, reicht allerdings Intels in Chipsatz bzw Platform-Hub integrierte Lösung meist aus...


Zurück zu „vSphere 5 / ESXi 5 und 5.1“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste