Seite 1 von 1

Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 11:39
von Login
Hallo Gemeinde,

ich komme wahrscheinlich mit einer eher exotischeren Frage ins Forum. Und zwar wäre die technische Anforderung, eine RDSH-Farm, bestehend aus Server2019 VMs auf einem ESXi6.7, in einem Schulungsbetrieb zu beschleunigen. Es gibt immer wieder Engpässe aufgrund der vielen parallelen An- und Abmeldungen zu Unterrichtsbeginn und -Ende. Innerhalb der Unterrichtsstunden haben wir keine Probleme, hier können sogar YouTube Filme in den RDP sessions ruckelfrei wiedergegeben werden.

Die Hardware, auf der die RDS-Hosts laufen ist ein HPE DL380 G10 mit zwei Gold6154 CPUs, die ihrerseits schon sehr befriedigende Leistung bieten. Vmware-seitig bekommen die VMs durch den "I/O sensitive switch" schon bestmögliche Leistung durchgereicht. Die pKerne sind nicht überbucht. Die virtuelle Grafikkarte ist mit den höchsten Werten konfiguriert. Eine RDSH-VM ist mit 6 vCPUs und 24GB RAM unterwegs. Storage-Engpässe bestehen keine. Der Host hängt per SAS DAS an einer HPE MSA2052, die mit 4x SSD, 14x SAS 15k und 6 NLSAS HDDs in einem performancetiering-pool läuft.

Gibt es Technologien, in Form von "Workload Accelerators", die solche Leistungsspitzen kompensieren können und einem DL380 einen gwissen Boost verschaffen können? PCIe Karten, wie z.B. die AMD Instinct MI25 bieten enorme Rechenpower durch jede Menge GPU Kerne, die im VDI-Bereich und Grafik-intensiven Workloads sicherlich ihre Daseinsberechtigung haben.

Aber das bezieht sich ja eher auf grafische Anwendungen und spezielle parallele BigData Be- und Hochrechnugnen in Rechenzentren, von denen meine RDSH-VMs m.E.n. nichts haben werden. Oder sehe ich das falsch?

Ich würde mich freuen, wenn hier jemand Licht ins Dunkle bringen würde. Die Großhändler sind mit dieser Frage sichtlich überfordert und bieten wild grafic accelerators zu exorbitanten Preisen an, ohne wirklich mitteilen zu können, ob das die Lösung des o.g. Problems sein könnte. Nach meinem aktuellen Verständnis sind das aber lediglich dedizierte Lösungen für VDI und MxGPU, also nichts für eine RDSH-Farm.

LG
login

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 12:19
von ~thc
Sorry, aber hast du schon einmal selbst versucht, über Monitoring Licht ins Dunkel zu bringen? Die Last beim gleichzeitigen An- und/oder Abmelden kann die VMs und den Host in mehreren Bereichen betreffen.

Wie sieht in diesen Lastspitzen der Ressourcenverbrauch innerhalb der VMs und - falls das keine Erleuchtung bringt - der Ressourcenverbrauch des Hosts aus?

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 12:46
von Login
~thc hat geschrieben:Sorry, aber hast du schon einmal selbst versucht, über Monitoring Licht ins Dunkel zu bringen? Die Last beim gleichzeitigen An- und/oder Abmelden kann die VMs und den Host in mehreren Bereichen betreffen.

Wie sieht in diesen Lastspitzen der Ressourcenverbrauch innerhalb der VMs und - falls das keine Erleuchtung bringt - der Ressourcenverbrauch des Hosts aus?


Ich habe nach meinen Möglichkeiten alle möglichen Leistungsdaten angesehen, aber es ist schwer, den Zeitpunkt richtig zu erwischen und die Werte dann richtig auszuwerten. Es geht 5-10 Minuten ab wie Schmit´s Katze und dann ist der Spuk vorbei. Ready-Werte und Storage-Latenzen auf dem Host sind dann per ESXTOP absolut unauffällig. Innerhalb des Gasts geht die CPU usage sehr hoch (~80% plus), RAM ist bei max 60-70%. Aber keine Warteschlangen oder Latenzen auf der Festplatte. Applikationen innerhalb des Gasts stehen in den Zeiten teilweise auf "keine Rückmeldung" und die typischen RDP-Phänomene wie das Nachpurzeln von geschriebenen Buchstaben z.B. in Word kommen dann ebenfalls auf.

Es sieht so aus, als würde die Hardware kurzzeitig in die Knie gehen. Aber das ist eher ein subjektives Gefühl als eine objektive Auswertung von Leistungsdaten. Das Phänomen ist auf Hosts mit schwächeren CPUs signifikant stärker. Mit den 6154 CPUs konnte das Problem spürbar verringert werden, was die Idee eines workload accelerator hat aufkommen lassen.

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 14:23
von ~thc
Wie viele RDSH-Sitzngen fahrt ihr auf einer - wie von dir beschriebenen - VM?

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 16:40
von Login
~thc hat geschrieben:Wie viele RDSH-Sitzngen fahrt ihr auf einer - wie von dir beschriebenen - VM?



im Schnitt 20-25 pro RDSH, würde ich schätzen.

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 17:58
von ~thc
Und wenn jetzt in einer typischen Klassenraum-Situation mehr als 6 Benutzer gleichzeitig durch An- oder Abmeldevorgänge, Programmstarts und Beenden jeweils einen CPU-Kern fordern - wer soll das dann erledigen?

Rechnet eine mögliche Best Practice Dimensionierung von RDSH-Host-VMs mit so einem Szenario?

Könnt ihr das mit einem kleinen Niedriglasttest mit einer "Klasse" mit nur 6 Teilnehmern überprüfen?

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 19:36
von Login
Nicht, dass ich dich falsch verstehe. Aber du rechnest mit einem physikalischen Kern pro User-Session? Sprich, bei zwei 6154 CPUs (ohne HT mit einzuplanen) wäre der Host mit 36 Usern, verteilt über X RDSH-VMs, an seinem theoretischen Leistungsmaximun angekommen?

Der Test, nur 6 User pro RDSH-VM zu fahren würde sicherlich positiv verlaufen. Aber dann wäre auch bei 36 Usern verteilt über 6 VMs auf dem Host Schicht im Schacht, was ich in dem Moment wirtschaftlich in Frage stellen müsste.

Die Leistung des HPE Systems mit den beiden 6154 ist brachial und das Arbeiten während des Unterrichts macht damit richtig Spaß. Wenn der Login/Logoff Storm nur mit einer höheren Skalierung bzw. weiteren physikalischen Hosts in den Griff zu bekommen ist, dann soll es so sein. Aber wenn es die Möglichkeit gäbe, durch eine PCIe Karte (o.Ä.) für 8K eur das Loch zu stopfen, dann wäre mir das sicherlich lieber, als für 25k eur pro Host und weiteren VMs noch mehr Geld und administrativen Aufwand zu leisten.

Re: Workload Accelerator HPE DL380 g10

Verfasst: 01.11.2019, 20:57
von ~thc
Wenn du mit der angegebenen Dimensionierung erzwingst, dass sich in Stoßzeiten mehrere User eine CPU teilen, dann müssen die Prozesse eben warten.

Re: Workload Accelerator HPE DL380 g10

Verfasst: 02.11.2019, 12:28
von Login
OK, danke dir für deine Einschätzung! Was mich noch interessieren würde: Hast du mir einen Link zu einem BestPractice WhitePaper für die VM Dimensionierung im RDSH Bereich? Ich habe keine offiziellen Dokumente dazu gefunden und den theoretischen Weg von VMware zu kennen, schadet ja erfahrungsgemäß nie :)

Und falls noch jmd was zum Thema WorkloadAccelerator/Blackbox/Daughterboard schreiben will: nur zu :)

Grüße!

Re: Workload Accelerator HPE DL380 g10

Verfasst: 02.11.2019, 18:29
von ~thc
Nein, leider nicht. Best practices sind eher immer allgemein für Windows Server statt für RDSH.
Forenthemen dazu drehen sich oft um die Zuschaltung von GPUs (nVidia M10) - aber Grafikpower hilft Euch eher nicht.