seit etwa drei Jahren lief mein privater ESXi-Server im Keller und hat dehr zuverlässig die Interneteinwahl mit Firewall, Fileserver, Mediaserver, etc virtualisiert.
Nun habe ich ein kniffliges Problem:
Vor zwei Wochen war der Server plötzlich aus - Grund unbekannt. Booten funktionierte nicht weil der USB-Stick nicht mehr in der Bootabfolge eingetragen war. Also tippte ich auf eine leere CR2032 Batterie und tauschte diese. Dann Bootreihenfolge korrigiert und OK.
Neujahr wollte ich dann das Update auf 5.1 durchführen. Vermutlich habe ich dabei noch mal das BIOS überprüft und vielleicht irgend etwas geändert.
Jedenfalls hing der Bootvorgang nach dem Update bei der Meldung "cnic_register loaded successfully".
Im Netz fand sich zur Problembehebung in diesem Fall eine Neuinstallation statt Update auf 5.1.
Nach der Neuinstallation lief alles. - Bis ich meine Fritz ISDN Karte und eine 3com Netzkarte für das ADSL-Modem per passthrough durchgereicht hatte. Dann hing es wieder an der gleichen Stelle.
Ich fand einiges über nicht funktionierendes PCI-Passthrough in 5.1 und war sauer auf VMWare.
Aber kein Problem. Ich hatte mir ja vor dem Update ein Image von der laufenden 5.0 Version gemacht.
Doch auch die läuft nicht mehr!
Was folgte waren mindestens 15 Stunden mit Neuinstallationen und Fehleranalysen.
Ich habe das Problem eingegrenzt, indem ich ISDN-Karte und 3com Netzwerkkarte ausgebaut und nur die PCI-Bridge per PT eingerichtet habe. Damit ist automatisch die ASPEED Grafikkarte des Mainboards
als einziges Device durchgereicht, weil sie mit PCI angebunden ist. Das richt um den Fehler zu bekommen.
PT von z.B. nic2 oder anderen nicht-PCI-devices funktioniert.
Ich habe den Kernellog eines Bootens ohne PT mit dem des hängenden Systems verglichen. ([Alt]+F12 gedrückt wenn der Bildschirm gelb wird.)
Das Booten läuft nur bis
Code: Alles auswählen
...
2013-01-06T14:33:59.562Z cpu4:2630)Mod: 4015: Initialization of cnic_register succeeded with module ID 25.
2013-01-06T14:33:59.562Z cpu4:2630)cnic_register loaded successfully.
2013-01-06T14:33:59.564Z cpu4:2630)Uplink: 2380: Couldn't find pps. Creating ps pps
2013-01-06T14:33:59.564Z cpu4:2630)NetPortset: 737: activating portset #0 as pps (etherswitch) with 256 ports, index mask is 0xff
2013-01-06T14:33:59.565Z cpu4:2630)NetPort: 1239: enabled port 0x1 with mac 00:00:00:00:00:00
2013-01-06T14:33:59.565Z cpu4:2630)Mirror.etherswitch: MirrorSessionCreate:1793: added session legacy_promiscuous(legacy_promiscuous) to pps
2013-01-06T14:33:59.565Z cpu4:2630)Uplink: 5444: Created parking portset pps.
2013-01-06T14:33:59.587Z cpu4:2630)PCI: 3938: 000:000:31.5 named 'vmhba2' (was '')
2013-01-06T14:33:59.819Z cpu4:2630)PCI: 3938: 000:000:31.2 named 'vmhba0' (was '')
2013-01-06T14:33:59.856Z cpu4:2630)PCI: 3938: 000:001:00.0 named 'vmhba1' (was '')
2013-01-06T14:33:59.869Z cpu4:2630)PCI: 3938: 000:005:00.0 named 'vmnic0' (was '')
2013-01-06T14:33:59.881Z cpu4:2630)PCI: 3938: 000:006:00.0 named 'vmnic1' (was '')Was folgen sollte wäre etwa:
Code: Alles auswählen
2013-01-06T14:33:59.914Z cpu4:2630)Loading module e1000e ...
2013-01-06T14:33:59.916Z cpu4:2630)Elf: 1862: module e1000e has license GPL
2013-01-06T14:33:59.918Z cpu4:2630)module heap: Initial heap size: 102400, max heap size: 5562368
2013-01-06T14:33:59.918Z cpu4:2630)vmklnx_module_mempool_init: Mempool max 5562368 being used for module: 26
2013-01-06T14:33:59.918Z cpu4:2630)vmk_MemPoolCreate passed for 25 pages
2013-01-06T14:33:59.918Z cpu4:2630)skb_mem_info mempool for module e1000e created - max size 23068672
2013-01-06T14:33:59.918Z cpu4:2630)module heap: using memType 0
2013-01-06T14:33:59.918Z cpu4:2630)module heap vmklnx_e1000e: creation succeeded. id = 0x41000b420000
2013-01-06T14:33:59.918Z cpu4:2630)<6>e1000e: Intel(R) PRO/1000 Network Driver - 1.1.2-NAPI
2013-01-06T14:33:59.918Z cpu4:2630)<6>e1000e: Copyright(c) 1999 - 2009 Intel Corporation.
2013-01-06T14:33:59.918Z cpu4:2630)PCI: driver e1000e is looking for devices
...Da das mit dem PT vorher einwandfrei lief und ich alle 5-er Versionen noch mal neu installiert habe, muss es wohl eine Änderung im BIOS sein, die ich vorgenommen habe weil sie mir vor dem Update "richtiger" vorkam und ich von evtl. zurückgesetzten Werten wegen leerer Pufferbatterie ausging.
Inzwischen habe das neueste BIOS aufgespielt, alle Werte resettet und alles einzeln konfiguriert.
Ohne Erfolg.
Nach langer Vorrede nun meine Frage an die Gemeinde:
Welche Einstellung kann das auslösen?
Ich bedanke mich im Voraus für das Lesen bis hier hin.
PS. ausgewählte BIOS Einträge:
WHEA Support [Enabled]
Intel VT-d [Enabled]
-CPU Configuration
Max CPUID Value Limit [Disabled]
Intel(R) Virtualization Tech [Enabled]
CPU TM Function [Enabled]
Intel(R) C-STATE Tech [Enabled]
A20M [Disabled]
-South bridge ACPI Configuration
Energy Lake Feature [Disabled]
APIC ACPI SCI IRQ [Disabled]
High Performance Event Timer [Enabled]
HPET Memory Address [FED00000h]
-Advanced ACPI Configuration
ACPI APIC support [Enabled]
BIOS-> AML ACPI table [Enabled]
Headless mode [Disabled]
-Advanced PCI/PnP Settings
Plug An Play O/S [No]
PCI Option ROM Scan Order [Bus 0 First]
Onboard Option Rom Priority [Normal]
-Onboard Devices Configuration
HDA Controller [Enabled]
OnBoard LAN1 Boot ROM [PXE]
OnBoard LAN2 Boot ROM [PXE]
Interrupt 19 Capture [Enabled]
VGA Rom Boot Priority [PCIE VGA Card]
-Uncore Configuration
Memory Remap Feature [Enabled]
Page Policy [Closed]
Adaptive Page [Disabled]
-Server-IPMI Configuration
BMC Firmware Version : 2.03
BMC Watch Dog Timer Action [Disabled]
-Server-Configure Remote Access type and parameters
Remote Access [Enabled]
Serial port number [com2]
Redirection After BIOS POST [Disabled]