Seite 1 von 1
Doch nicht Gelöst- 2k8r2 PDC verlor Lan - stellt sich tot
Verfasst: 15.06.2011, 09:42
von Ticilein
Hallo zusammen.
Ein vorher durchweg einwandfrei laufender PDC hat vor drei Wochen seine Lan Einstellungen weggeworfen, auf DHCP umgestellt und dort den internen 169. Kram von MS eingetragen.
Nachdem ich die festen Werte wieder eingetragen hatte, stellt er sich jetzt immer nach ein paar Tagen tot. Wenn man über die Konsole einloggt, kommt man auch nicht raus ins Lan. Die Daten stimmen jedoch.
Nach einem Neustart geht es dann wieder.
Hat die vLan irgendwas abbekommen?
(Die anderen Server auf dem Host schnurren vor sich hin)
Gruß Nico
Verfasst: 15.06.2011, 10:17
von PeterDA
Hallo Nico,
ein Blick in die Glaskugel hat mir folgendes gezeigt:
MEHR INFORMATIONEN
- Welche ESX Version ist es?
- Welche HW Version hat die VM?
- Ist die HW Version vor kurzen geändert worden?
- Wie ist die vSwitch konfiguriert?
Gruß Peter
Verfasst: 15.06.2011, 10:23
von ideFix
Da du keine Angaben über die Netzwerkkonfiguration machst, kann dir schlecht in Netzwerkfragen geholfen werden
Was setzt du denn überhaupt ein? 4.0 , 4.1, 4.1U1, ....
Nutzt du VLANs? Arbeitest du mit Trunks?....
Meine Vermutung: Es ist kein VMware Problem - sondern ein Netzwerkproblem
BEschreib das hier bitte mal genauer:
Wenn man über die Konsole einloggt, kommt man auch nicht raus ins Lan.
Konsole = ESX Konsole?
btw: DC = Prim Dom Controller? / ParkDistanceControl / Professional Darts Corporation Europe...

sorry für OT
Edit: Der Peter war schneller

Verfasst: 15.06.2011, 10:59
von Ticilein
man man man, immer wollen se Daten haben
Host ist nen 4.1 ess. plus, Update ist noch nicht drauf.
Drauf geschaut habe ich mit dem vSphere Client. (Der Große läßt sich nicht installieren. Auf dem dafür gedachten externen Server meldet er immer, das 64 bit Windows wäre nicht 64 bit)
Alle Gäste hängen am gleichen vSwitch. Management.hat nen eigenen.
Nics Intel onboard Dual und gesteckte Intel 4 Port.
Verteilung 1. Lan Management, 2. Gäste, 3. Management, 4 - 6 Gäste. Also redundant.
Keine festen Zuweisungen.
Am externen Switch ist nichts eingestellt. Trunks von dort nur zu weiteren Switches und nem NAS (LACP).
An dem externen Switch hängt auch der 2. DC, über den ziehen die Clients ersatzweise -> klappt auch einwandfrei.
Neben dem 1. DC liegt auch der Druck-Server im Host. Wenn die Clients übern 2. DC drin sind. läuft alles schick, also auch das Drucken. Exchange funzt darüber auch.
Das Blech wurde Anfang April hingestellt. Seitdem keine Änderungen.
Gruß Nico
Verfasst: 15.06.2011, 12:23
von PeterDA
Hi,
du schreibst in deinem ersten Post was von vLan ist auf der pSwitch vLan eingerichtet bzw. Portgruppen auf dem ESX??
Was ist bei dir der unterschied zwischen 1. Lan Management und 3. Management?
Welche HW hat die VM?
Gruß Peter
Verfasst: 15.06.2011, 12:41
von Ticilein
war wohl schlecht formuliert. Hab gemeint, ob die virtuelle Nic möglicherweise kurz weg war, der Server sie wiedergefunden und neu eingebunden hat. Denn dann wären ja auch alle festen Einstellungen futsch.
1. und 3. NIC sind zusammen als Redundanz zueinander auf dem Management vSwitch.
HW ist ein Intel SR2600 mit HCL.
1 SATA Platte für den Host
6 600er SAS Platten im Raid 10 + 1 Standby
Controller mit BBU
32 Gig
2x Quad
6x Intel NIC
Und derzeit 4 Gäste.
( Vielleicht ist er ja überfordert?

)
Verfasst: 15.06.2011, 12:48
von continuum
melden die vmware.logs etwas von den Netzwerk problemen ?
Verfasst: 15.06.2011, 16:20
von Ticilein
Im Client unter Ereignisse haufenweise von den unteren Meldungen.
event.esx.problem.net.connectivity.lost.fullFormat
(esx.problem.net.connectivity.lost)
Fehler
30.05.2011 17:08:27
xxx-srv-vm.xxx.de
event.esx.problem.net.redundancy.lost.fullFormat
(esx.problem.net.redundancy.lost)
Warnung
30.05.2011 17:08:27
xxx-srv-vm.xxx.de
event.esx.problem.net.redundancy.degraded.full-
Format (esx.problem.net.redundancy.degraded)
Warnung
30.05.2011 17:08:27
xxx-srv-vm.xxx.de
event.esx.clear.net.redundancy.restored.fullFor-
mat (esx.clear.net.redundancy.restored)
Info
30.05.2011 17:09:41
xxx-srv-vm.xxx.de
event.esx.clear.net.connectivity.restored.fullFor-
mat (esx.clear.net.connectivity.restored)
Info
30.05.2011 17:09:41
xxx-srv-vm.xxx.de
Davor und danach nur Einlog-Meldungen.
Verfasst: 17.06.2011, 01:23
von Dayworker
Solche Meldungen deuten in meinen Augen meist auf ein Defekt (Nic, Kabelage, Switch) und seltener auf ein Config-Problem hin.
Verfasst: 17.06.2011, 08:35
von Ticilein
Und wieder weg.
Drei Tage lief er durch.
Das Problem ist, daß ich ihn immer gleich wieder durchstarten muß, damit sie schaffen können.
Sieht wie ein Überlauf oder ähnliches aus.
Verteilt vSphere die vier zur Verfügung stehenden Ports zum externen Switch dynamisch?
Oder legt es bestimmte Gäste von sich aus immer auf den gleichen Port?
Die anderen 2K8 haben ja keine Zugriffsprobleme. Es ist immer der 1. DC!
Habe auch schon überlegt, ob irgendeine NIC im Netz defekt ist und mir den DC wegbläst.
Aber in den Logs der Switches sehe ich keine Übertragungsfehler. Kann natürlich in einer höheren OSI Schicht sein.
Ich hasse diese Stocherei im Nebel.
Wir haben mal einen ähnlichen Fehler ein komplettes Jahr gesucht. FLUKE mit im Netz inklusive. Durch Zufall haben wir dann den Übeltäter gefunden. Es war eine defekte Print-Server Box!
Da es aber auch in der Nacht geschieht, wo ja das Meiste weg ist (Drucker sind auch aus, inzwischen alles interne PS), sollte man es eigentlich einkreisen können.
Verfasst: 20.06.2011, 09:12
von Ticilein
und wieder weg. Demnach alle 72 Stunden.
Hm, das scheint wohl weder VMWare noch Hardware zu sein.Wüsste adhoc nichts, was bei beidem diesen Rhythmus hat. Aber was passiert beim 2k8 R2 alle 72 Stunden?
Verfasst: 27.07.2011, 12:11
von Ticilein
Nachdem ich einen Sony Notebook aus dem Netz und auch ansonsten ganz weit fort geworfen habe, läuft der Gast (DC) wieder rund.
Immer am Morgen, wenn der Server weg war, hat der Benutzer den NB an das Netz angesteckt. Da ja viele raus geflogen sind, fiel er mir noch nicht auf. Aber jetzt war er nur noch allein übrig!

Verfasst: 28.07.2011, 11:53
von Dayworker
Hast du das NB trotzdem mal genauer untersucht?
Mich würde schon interessieren, weshalb der DC gerade damit ein Problem hatte.
Verfasst: 28.07.2011, 12:53
von Martin
Wahrscheinlich hatte das Notebook die selbe IP Adresse statisch konfiguriert.
Verfasst: 03.08.2011, 19:06
von Ticilein
Ich hol mir den Burschen nochmal aus dem Alt-EDV-Raum.
Wenn ich was sehe, gebe ich´s noch weiter.
Ich vermute, daß die beiden auf unterer OSI-Schicht so miteinander am telefonieren waren, daß damit die Zeitscheiben alle weg waren.
Fest-IPs hat keiner der Notebooks. Die Geräte sind alle auch draußen. Und es wird sowohl Lan als auch W-Lan benutzt. Da wäre ne feste IP etwas contra-produktiv
Wollen mal schauen...
Verfasst: 16.02.2012, 18:49
von Ticilein
Es ist inzwischen nur noch selten, aber tritt immer noch auf. Neustart ist nicht nötig. Über die Konsole gehe ich direkt auf die LAN-Verbindung, "Deaktivieren" "Aktivieren" und alles geht wieder.
Ich hatte schon gehofft, daß ich es weg habe, da ich gerade einen alten win2K DNS-Server beerdigt habe. Aber das war es auch nicht.
"Oh Götter aus Redmond, gebt mir eine Fehlermeldung"
Verfasst: 16.02.2012, 21:13
von weigeltchen
Hat der Kollege immer noch das Notebook und DHCP und WLAN und LAN?
Verfasst: 20.02.2012, 18:54
von Ticilein
Der befindet sich inzwischen in Italy, also gaaanz weit weg von meinem LAN ohne VPN-Zugrif! Sicher ist sicher!
Ich habe am Wochenende alle DNS-Einträge außer den statischen gelöscht. Dazu alles im DHCP und die leasetime kräftig verlängert. Mal schauen, ob es aus der Richtung kam.
Ich glaube es einfach nicht, daß der virtuelle LAN-Port das Problem verursacht. Das riecht einfach zu stark nach Redmond.
Verfasst: 20.02.2012, 19:39
von mbreidenbach
Mit welchem Netzwerkkartentreiber läuft die VM eigentlich ? e1000 ? vmxnet3 ?
Achja... wenn der PDC nur ein PDC ist... man könne ja mal nen 2. DC aufsetzen, die FSMO Rollen rüberschubsen und den PDC danach ordnungsgemäß runterstufen und töten. Normal ist das nicht was der da treibt.
Verfasst: 22.02.2012, 18:05
von Ticilein
Und wieder weg.
Es sind keine Pakete mehr unterwegs. Weder TX noch RX. Komplett still.
Karte deaktiv -> aktiv und er tickert wieder weiter.
Neustart ist nicht nötig.
Das habe ich im Log vom Host gefunden:
Die Leistung des Geräts
naa.6001517e73c2400014c6ed150852ca32 hat
sich verschlechtert. Die E/A-Latenz hat sich von
einem Durchschnittswert von 1518
Mikrosekunden auf 47105 Mikrosekunden
gesteigert.
Warnung
17.02.2012 13:30:35
Das ist mein Datastore.
Das stand Anfang und Ende Dez. drin. Dann Anfang Jan. und dann jetzt wieder am 15.,16. und 17.
Nicht, daß da was aus dem Ruder läuft.
/// Laut Jörg sind Werte, die kurzfristig bis etwa 50 ms hochgehen, nicht kriegsentscheidend, kann ich also wohl ausschließen /// Nico 25.02.
Der Treiber ist ein e1000.
Ein 2. DC läuft schon inkl. DNS und WINS.
An ein demote hab ich auch schon gedacht.
Der 1. hält noch das VPN, Zert.-Server, TS-Lizenzen und DHCP.
Die Edith sagt: Kann der 2. beim Syncen mir den 1. wegschießen? Das ist ein alter Server, der vorher der DC in Blech war.