vmotion von Linux SLES VMs. -> extrem lange Stuns
Verfasst: 15.05.2013, 16:46
Hallo,
Wir haben unter SuSE Linux Enterprise Server 10/11 VMs seit der Einführung von ESXi 5.x Probleme bei vmotion.
Als wir noch 4.1 im Einsatz hatten, war das definitiv nicht so schlimm. (Stun max. 3-4Sek)
Es wirkt sich folgendermaßen aus:
Wenn große VMs (ca. 40GB RAM u. 4-6 vCores) unter Last verschoben werden müssen dauern diese Stuns beim Delta-Nachschreiben bis zu 40 Sekunden. Kaum eine Applikation überlebt das und diese Hänger sind bis zum Endkunden deutlich spürbar. Jobs brechen/stürzen ab usw.
Es ist mir klar, dass unter Last stehende Maschinen nicht ganz so einfach verschieb bar sind wie welche, die nur idlen. Allerdings ist dieses Verhalten bei Windows-VMs nicht nachstellbar. Habe sogar schon eine 64GB VM mit 8vCores mit Prime95 voll beschäftigt. dh. fast der komplette RAM im aktive Status und alle Cores zu 100% beschäftigt. Der vmotion Prozess dauert ziemlich lange (sicher an die 3-4 Minuten), dafür aber ohne spürbaren Stun beim endgültigen Verschieben.
Was ich bisher rausgefunden habe:
Seit der ESXi 5.x gibt es ja für vmotion dieses "Stun During Page Send" Feature (kurz: SDPS). Wenn ich dieses Feature in den Advance Parametern auf Hostbasis deaktivere verhält sich die Windows VM genau gleich bescheiden wie die Linuxen. Sprich 40 Sekunden Stun und kein Ping möglich in dieser Zeit.
Schalte ich das feature wieder an ist unter Windows kein Stun festzustellen und unter Linux ists schlecht wie immer.
Kann das sein, dass dieses Feature unter Linux nicht funktioniert?!
vmwaretools schließe ich aus. Das ist mit und ohne genau gleich, sowohl unter windows als auch Linux. VMHW-Version ist überall min. 7, fast flächendeckend 8. Sollte das Problem also auch nicht sein.
Ehrlich gesagt bin ich etwas ratlos. Hab auch schon bei vmware gefragt, bislang aber noch keine brauchbare Lösung bekommen.
Wir verwenden zur Virtualisierung hauptsächlich vollausgestattete BL460 G6/7/8 sowie ein paar DL980G7 die sogar dedizierte 10GBit Interfaces nur für vmotion haben.
Hat da wer ne Idee dazu. Ich komme eher aus der Windows-Ecke, meine Linux Kenntnisse sind daher eher bescheiden.
Wir haben unter SuSE Linux Enterprise Server 10/11 VMs seit der Einführung von ESXi 5.x Probleme bei vmotion.
Als wir noch 4.1 im Einsatz hatten, war das definitiv nicht so schlimm. (Stun max. 3-4Sek)
Es wirkt sich folgendermaßen aus:
Wenn große VMs (ca. 40GB RAM u. 4-6 vCores) unter Last verschoben werden müssen dauern diese Stuns beim Delta-Nachschreiben bis zu 40 Sekunden. Kaum eine Applikation überlebt das und diese Hänger sind bis zum Endkunden deutlich spürbar. Jobs brechen/stürzen ab usw.
Es ist mir klar, dass unter Last stehende Maschinen nicht ganz so einfach verschieb bar sind wie welche, die nur idlen. Allerdings ist dieses Verhalten bei Windows-VMs nicht nachstellbar. Habe sogar schon eine 64GB VM mit 8vCores mit Prime95 voll beschäftigt. dh. fast der komplette RAM im aktive Status und alle Cores zu 100% beschäftigt. Der vmotion Prozess dauert ziemlich lange (sicher an die 3-4 Minuten), dafür aber ohne spürbaren Stun beim endgültigen Verschieben.
Was ich bisher rausgefunden habe:
Seit der ESXi 5.x gibt es ja für vmotion dieses "Stun During Page Send" Feature (kurz: SDPS). Wenn ich dieses Feature in den Advance Parametern auf Hostbasis deaktivere verhält sich die Windows VM genau gleich bescheiden wie die Linuxen. Sprich 40 Sekunden Stun und kein Ping möglich in dieser Zeit.
Schalte ich das feature wieder an ist unter Windows kein Stun festzustellen und unter Linux ists schlecht wie immer.
Kann das sein, dass dieses Feature unter Linux nicht funktioniert?!
vmwaretools schließe ich aus. Das ist mit und ohne genau gleich, sowohl unter windows als auch Linux. VMHW-Version ist überall min. 7, fast flächendeckend 8. Sollte das Problem also auch nicht sein.
Ehrlich gesagt bin ich etwas ratlos. Hab auch schon bei vmware gefragt, bislang aber noch keine brauchbare Lösung bekommen.
Wir verwenden zur Virtualisierung hauptsächlich vollausgestattete BL460 G6/7/8 sowie ein paar DL980G7 die sogar dedizierte 10GBit Interfaces nur für vmotion haben.
Hat da wer ne Idee dazu. Ich komme eher aus der Windows-Ecke, meine Linux Kenntnisse sind daher eher bescheiden.