im Rahmen ein Support Cases wurde festgestellt das ein ESXi Host Problem mit dem RAM hat. In dem Case ging es eigentlich um etwas anderes. Mich hat es gewundert das der Hosts selber keinen Alarm erzeugt hat, auch das ILO/iRMC zeigt keine Fehler an.
Darauf habe ich die Logs aller ESXi Hosts nach MCA Meldungen durchsucht und habe einige dutzend Einträge gefunden. Betroffen sind aktuell wohl 9 Hosts mit unterschiedlicher Hardware,
Laut VMware Support werden für diese Fehler keine Alarme generiert. Was ich mich jetzt frage - bevor ich 9 Tickets bei den Server Herstellern eröffne - sind das Fehler die kritisch sind sind, oder ist das alles im "normalen" Rahmen und kann ignoriert werden? Die Hardwareüberwachung der Server zeigt bei keinem der Hosts Fehler an. VMware verweist aber an den Hardwarehersteller.
Code: Alles auswählen
xxxx2109/xxxx2109.log.20.gz:Apr 8 08:30:58 xxxx2109 vmkernel: cpu16:2453028)MCE: 189: cpu16: bank7: MCA fatal error (CE): "Memory Controller Read Error on Channel 0."
xxxx2109/xxxx2109.log.24.gz:Apr 4 11:08:42 xxxx2109 vmkernel: cpu16:641689)MCE: 189: cpu16: bank9: MCA fatal error (CE): "Memory Controller Scrubbing Error on Channel 0."
xxxx2111/xxxx2111.log.17.gz:Apr 11 09:29:39 xxxx2111 vmkernel: cpu1:2741314)MCE: 189: cpu1: bank10: MCA fatal error (CE): "Memory Controller Scrubbing Error on Channel 1."
xxxx2112/xxxx2112.log.6.gz:Apr 22 08:09:54 xxxx2112 vmkernel: cpu16:3854326)MCE: 189: cpu16: bank10: MCA fatal error (CE): "Memory Controller Scrubbing Error on Channel 1."
xxxx2123/xxxx2123.log.1:Apr 28 00:03:35 xxxx2123 vmkernel: cpu16:4189792)MCE: 189: cpu16: bank5: MCA fatal error (CE): "Memory Controller Read Error on Channel 1."
xxxx2123/xxxx2123.log.12.gz:Apr 16 17:28:30 xxxx2123 vmkernel: cpu16:3384059)MCE: 189: cpu16: bank9: MCA fatal error (CE): "Memory Controller Scrubbing Error on Channel 1."
xxxx2416/xxxx2416.log.28.gz:Mar 31 10:32:37 xxxx2416 vmkernel: cpu12:1004048)MCE: 189: cpu12: bank9: MCA fatal error (CE): "Memory Controller Scrubbing Error on Channel 0."
xxxx8002/xxxx8002.log.24.gz:Apr 4 12:05:47 xxxx8002 vmkernel: cpu40:2802668)MCE: 189: cpu40: bank9: MCA fatal error (CE): "Memory Controller Error."
xxxx0001/xxxx0001.log.26.gz:Mar 30 17:17:10 xxxx0001 vmkernel: cpu60:37606)MCE: 189: cpu60: bank8: MCA fatal error (CE): "Memory Controller Error."
xxxx0001/xxxx0001.log.29.gz:Mar 27 06:30:03 xxxx0001 vmkernel: cpu60:37606)MCE: 189: cpu60: bank9: MCA fatal error (CE): "Memory Controller Error."
xxxx0001/xxxx0001.log.29.gz:Mar 27 07:45:23 xxxx0001 vmkernel: cpu60:1993899)MCE: 189: cpu60: bank9: MCA fatal error (CE): "Memory Controller Error."
xxxx0002/xxxx0002.log.20.gz:Apr 8 14:24:04 xxxx0002 vmkernel: cpu60:33328)MCE: 189: cpu60: bank8: MCA fatal error (CE): "Memory Controller Error."
xxxx0002/xxxx0002.log.22.gz:Apr 7 01:43:21 xxxx0002 vmkernel: cpu20:5613407)MCE: 189: cpu20: bank9: MCA fatal error (CE): "Memory Controller Error."
xxxx0002/xxxx0002.log.23.gz:Apr 5 11:35:45 xxxx0002 vmkernel: cpu1:33738)MCE: 189: cpu1: bank8: MCA fatal error (CE): "Memory Controller Error."
xxxx0003/xxxx0003.log.1:Apr 27 05:52:09 xxxx0003 vmkernel: cpu40:5849699)MCE: 189: cpu40: bank9: MCA fatal error (CE): "Memory Controller Error."
xxxx0003/xxxx0003.log.13.gz:Apr 15 14:17:05 xxxx0003 vmkernel: cpu1:5849671)MCE: 189: cpu1: bank8: MCA fatal error (CE): "Memory Controller Error."