Fehlersuche bei starker CPU-Auslastung; ggf. CPU Overprovisioning?
Verfasst: 05.07.2019, 09:28
Seit etwa 3 Wochen haben wir auf unserem ESXi eine deutlich erhöhte CPU Last. Sobald die VMs ein bisschen mehr gefordert werden, haben wir schnell 100% konstante Auslastung.
Bis jetzt hat es geholfen die weniger wichtigen VMs zu stoppen, und so die Grundlast zu veringern. Das dies hilft irretiert mich, da die gestoppten VMs eher ideln und kaum Last erzeugen.
Etwas mehr zu unserem System: Ein einzelner ESXi (6.5U1) auf einem Xeon E5-2630v3 (8*2,4 GHz) mit aktiviertem Hypterthreading. Darauf laufen 27 VMs, größtenteils Debian 9, 3x Windows, 1x vCSA. 3 der Linux VMs haben 4 vCPUs zugewiesen, alle anderen haben 2. Hier versteckt sich ggf. auch direkt das Problem: Habe ich zuviele vCPUs verteilt?
Allerdings sind in den letzten 3 Monaten nur 2 kleine VMs dazugekommen, wäre das Problem dann nicht früher aufgefallen?
Der Arbeitsspeicher der VMs ist nicht Over-Provisioned, alle VMs zusammen verbrauchen etwas weniger als dem Host zur Verfügung steht.
Im Rahmen der Fehlersuche habe ich die Community Edition von Veeam ONE installiert. Dieses meldet mir erhöhte Werte für CPU-ready und lässt Overprovisioning als Ursache vermuten. Zu diesem Thema lese ich mich parallel ein; was ich noch nicht finden konnte waren Richtwerte zum Verhältnis vCPUs und Prozessorkernen. Was sind hier übliche Werte?
Insgesamt irretiert mich dass das Problem erst ~Ende Juni aufgetreten ist, nachdem länger keine neue VM eingerichtet wurde. Zu diesem Zeitpunkt wurden nur die VMs gepatcht (reguläre OS-Updates), nicht jedoch der Host. Das werde ich jetzt nachholen.
Ich würde mich sehr über Tipps zur Fehlersuche freuen. Ebenfalls auch über Infos zum Thema CPU Overprovisioning und dessen Auswirkungen.
Bis jetzt hat es geholfen die weniger wichtigen VMs zu stoppen, und so die Grundlast zu veringern. Das dies hilft irretiert mich, da die gestoppten VMs eher ideln und kaum Last erzeugen.
Etwas mehr zu unserem System: Ein einzelner ESXi (6.5U1) auf einem Xeon E5-2630v3 (8*2,4 GHz) mit aktiviertem Hypterthreading. Darauf laufen 27 VMs, größtenteils Debian 9, 3x Windows, 1x vCSA. 3 der Linux VMs haben 4 vCPUs zugewiesen, alle anderen haben 2. Hier versteckt sich ggf. auch direkt das Problem: Habe ich zuviele vCPUs verteilt?
Allerdings sind in den letzten 3 Monaten nur 2 kleine VMs dazugekommen, wäre das Problem dann nicht früher aufgefallen?
Der Arbeitsspeicher der VMs ist nicht Over-Provisioned, alle VMs zusammen verbrauchen etwas weniger als dem Host zur Verfügung steht.
Im Rahmen der Fehlersuche habe ich die Community Edition von Veeam ONE installiert. Dieses meldet mir erhöhte Werte für CPU-ready und lässt Overprovisioning als Ursache vermuten. Zu diesem Thema lese ich mich parallel ein; was ich noch nicht finden konnte waren Richtwerte zum Verhältnis vCPUs und Prozessorkernen. Was sind hier übliche Werte?
Insgesamt irretiert mich dass das Problem erst ~Ende Juni aufgetreten ist, nachdem länger keine neue VM eingerichtet wurde. Zu diesem Zeitpunkt wurden nur die VMs gepatcht (reguläre OS-Updates), nicht jedoch der Host. Das werde ich jetzt nachholen.
Ich würde mich sehr über Tipps zur Fehlersuche freuen. Ebenfalls auch über Infos zum Thema CPU Overprovisioning und dessen Auswirkungen.