Systemprobleme, wenn HyperV auf Host installiert ist

Hi @ll,

ich bin mir noch nicht sicher, ob das Thema auch für andere relevant ist, auch habe ich die Ursache noch nicht sicher eingegrenzt. In den verg. 48h musste ich meinen Server 2x hart ausschalten, da ein kontrolliertes Runterfahren nicht mehr möglich war. Ich hatte zunächst die jüngsten IPS-Releases im Verdacht, bin mittlerweile aber sicher, dass IPS auch nur Opfer ist.

Dennoch zur Doku hier schonmal das Fehlerbild und die bisher ermittelten Auffälligkeiten:

Fehlerbild:

[ul]
[li]in IPS tauchen Fehlermeldungen auf (die ich bisher nicht hatte):[/li][/ul]

24.08.2012 14:52:01.089 | 0 | WARNING | Kernel | Hauptthread war länger als 5 Sekunden blockiert. Dauer: 55351ms

[ul]
[li]nach ca 12h Laufzeit (ab Neustart des Servers) wird der Server träge: Anmeldung dauert sehr lange bzw, funktioniert gar nicht, andere Dienste wie IIS, IPS laufen sehr langsam bzw. reagieren gar nicht mehr[/li][li]in IPS füllt sich die Thread-Warteschlange (Anzahl der PHP-Threads deutlich unter 50% der max möglichen Anzahl lt. Konsole)[/li][li]Runterfahren des Servers ist nicht mehr möglich (da er auf Eingaben nicht mehr reagiert)[/li][/ul]

Symptome/Indizien
ich habe alle IPS-Logfiles der verg. 8 Tage durchgesehen, das allererste Auftreten des blockierten Haupttask wurde am 24.8 (Freitag) um 14:25 geloggt. Danach hatte ich in unregelmässigen Abständen (10Min-1h) wieder ein solches Event. Die höchste Blockade-Dauer hatte 582003ms. Da dieses Event vor einem IPS-Update erfolgte, konnte ich schonmal IPS selbst als Ursache ausschließen.
Weiterhin habe ich mir die Windows Event-Logs angesehen. Ich habe einen Service, der einen DCF77-Empfänger auswertet und bei Abweichungen die Systemzeit korrigiert. Auffällig war hier, dass die Syncs seit Freitag Nachmittag unregelmässig und mit großen Zeitkorrekturen (üblicherweise 2-3 Sekunden, teilweise bist zu 2 Minuten Korrektur) im Eventlog verzeichnet wurden. Normalerweise wird alle 60 Sekunden synchronisiert, die Abweichungen liegen i.d.R. deutlich unter 100ms.

vermutete Zusammenhänge
Der Beginn all dieser Auffälligkeiten liegt ganz kurz nach dem Zeitpunkt, als ich eine HyperV-(Gast-)Maschine (WINXP) auf dem Host in Betrieb genommen habe. Ich bin mir ziemlich sicher, dass das der der Grund für die Systemzeit-Probleme ist (sowas hatte ich früher auch auf dem alten Server in Kombination mit Mediaportal). Und die Zeitkorrekturen könnten der Grund für die Meldung in IPS sein (Haupttask blockiert).

Ich habe heute morgen (nach einem erneuten Hard-Reset des Hosts) den HyperV-Gast ausser Betrieb genommen, seit dem sind auch die Symptome in den jeweiligen Logs nicht mehr aufgetreten. Mal sehen, was in den kommenden 24h passiert.

das System läuft jetzt 24h problemlos (mit ausgeschaltetem HyperV-Gastcomputer), in den Logfiles kein einziger Eintrag mit blockiertem Hauptthread.
Ich bin mir nun rel. sicher, das die Ursache irgendwo im HyperV-Umfeld liegt und IPS nur Opfer war.

Hallo,
meine IPS-Server laufen auch unter Hyper-V auf W2008 (auch auf Hyper-V W2008). Ich hatte auch immer Probleme mit dem Reboot, zog sich manchmal ewig (;-))) hin. Seit dem neuesten IPS Release 2.6 … funkt es ruck zuck…

Hi Herbert,

ich glaube, das ist ein Mißverständnis: mein IPS läuft auf dem Host, die HyperV-Maschine(n) parallel auf dem Host. Es hat m.E. nichts mit IPS zu tun, IPS ist in dem Fall nur Opfer der Auswirkungen.

Ich bin inzwischen auch einen Schritt weiter:
im Web liest man häufig, dass in der Konfig der virtuellen Maschinen der Haken unter „Integrationsdienste/Zeitsynchronisation“ rausgenommen werden muss und die Zeitsynchronisation dringend über das AD/Netzwerkdienste vorgenommen werden soll.
Ich hab die Maschine entsprechend konfiguriert und nochmal 24h laufen lassen: die Probleme waren deutlich geringer, aber nicht weg. Das wirkt sich sogar auf’s Netzwerk aus: ab und zu scheinen bestimmte Dienste im LAN nicht mehr erreichbar zu sein. Auch IPS hatte noch etliche Fehlermeldungen im Log.

Also hab ich den HyperVieh-Kram wieder runtergeschmissen, nu iss Ruhe.

Hi Raketenschnecke,

Du kannst ja alternativ mal VirtualBox testen…

eher nicht :wink: wenn überhaupt nochmal (…Bedarf besteht), dann auf einer anderen Maschine und nicht auf dem Produktivsystem… ich hab hier genug Erfahrungen gesammelt :o

Hi Raketenschnecke,
dass mit der Zeitsync ist richtig, habe ich auch so parametriert.
IPS auf dem Hostsystem ist für mich ungünstiger, da -egal welcher Host- dieser natürlich auch andere Aufgaben hat.
Das „unsicherste“ am IPS bzw. am Betriebssystem ist aus meiner Sicht dass Anbinden der COM-Schnittstellen. Bei Problemen, welche zugegebenermaßen sehr selten sind (aber zum Beispiel bei Tests…) finden die COM-Ports auf Betriebssystem-Ebene sich nicht „neu“ bzw. „wieder“. (ich benutze SHARKOON-USB-Server).
Nach solchen Tests hilft ein Reboot des Guest-Systems (mit IPS) aber problemlos die COM-SS wieder zu verbinden.
Ist wahrscheinlich mehr ein Windows-COM-SS Problem als ein HYPER-V-Problem.
CIAO
Herbert

@RS: Selbige konfig laueft bei mir ohne Probleme. Hardware zu schwach?

selbige Konfig: glaub ich nicht, Du hast ganz sicher ne andere hardware, einen DCF77-Servcie hast du bestimmt nicht an Bord :wink: , und zu schwach ist meine ganz sicher auch nicht. m.E. hat das nichts mit Power zu tun, ich denke eher, dass im Umgang mit der Systemzeit irgendwas klemmt (wenn HyperV mit im Spiel ist).

Ne, nutze NTP Server, aber dafuer funktionierts.