Stabilität auf dem RasPi3

Moin,

ich beobachte bei meinem IPS auf dem RasPi3, dass der symcon Dienst so etwa alle 2-3 Wochen sich verabschiedet. Die Ursache ist mir nicht bekannt, es hilft dann das kurzfristige Trennen der Stromversorgung.

Mir fallen da spontan 2 Ideen ein:

  1. Den RasPi watchdog nutzen und auf den symcon Dienst abrichten

  2. Eine externe Hardware-Lösung mit einem Timerrelais

Mich würde interessieren, ob ihr so etwas auch beobachtet und ob ihr dafür möglicherweise Lösungsansätze habt. Die Lösungen mit shell-skripten (z.B. Test auf Port 3777) aus diesem Thread kenne ich, nur würde ich gerne die hardware-Version nutzen.

Grüße,
Tom

es hilft dann das kurzfristige Trennen der Stromversorgung.

Ist das der einfachste Weg, oder kommst du wirklich nicht mehr per Shell auf den Pi?

paresy

Hallo,

ich würde doch eher versuchen herauszufinden, weshalb der Dienst abstürzt, das ist ja definitiv nicht normal!

Grüße,
Kai

z.B. damit: Debugging für Experten (Raspberry Pi, Linux)

paresy

Bei mir laufen zwei Raspi 3 mit IPSymcon. Bis vor ein paar Tagen mit der 4.4, seit dem Wochenende mit der 5.0.
Es läuft bei mir extrem stabil, bisher auch unter der 5er, wobei ich da noch keine Langzeiterfahrung habe. Wenn ich mich Recht entsinne, gab es bei mir bei der 4.1 mal kurzzeitig ein Problem mit Abstürzen nach einer gewissen Zeit, die tatsächlich an Symcon lagen. War aber nach Symcon Updates wieder ok.
Ansonsten fahr ich die Raspis nur mal runter, wenn wie jetzt Update auf 5.0 und komplettes Update sowie Backup der SD Card erfolgt. Ich habe von KNX über Homematic, MQTT (ESP32), Siemens Logo, Ebus etc. diverse (Bastel-) Systeme im Einsatz.
Was sagen die Logs? Ist die SD Card in Ordnung? PHP Skripte die Äbstürzen und irgendwann das System blockieren?
Welche Symcon Version ist im Einsatz?

Moin Tom,
auf/vor meinem RPI2 gibt es einen Schalter den auch meine Frau bedienen kann.
Bei meiner Kiste hängt sich allerdings immer nur mal das Internetradio (via mplayer) weg - meist, wenn ich nicht zu Hause bin. Das liegt bei mir aber defintiv an meinem „schwachen“ Internetanschluß auf dem Lande. Wenn die Enkelkinder YouTube Videos schauen, bricht die Verbindung ein.
Ausfälle/Hänger von IPS (Skripten) konnte ich mit etwas debugging alle eleminieren - das ist definitiv der bessere Weg. Beim mplayer kann ich aber leider per Software nicht auswerten, ob auch Töne aus den Lautsprechern kommen (die Software läuft, aber der Stream ist weg).
Meine „Billig-Kamera“ verabschiedet sich auch gerne immer mal aus dem WLAN. Wenn die 30 Minuten nicht auf einen Ping anwortet, schaltet bei mir auch ein LCN-Relais (Öffner > Kurzzeitimer).

Mein Rat also: Hardwareschalter nur wenn der WAF es erfordert :loveips:

Grüße, Uwe

ich kann so aus den logs nichts entnehmen. Der letzte Absturz war heute mitten in der Nacht, der davor Ende Juli während unseres Urlaubs. Ich komme dann schon auf die shell, aber selbst das „reboot“ funktioniert dann nicht mehr. Auferstehung nach Stromwegnahme ist (bisher) jedoch kein Problem.

In den logs sehe ich nichts auffälliges - leider ist es zum Reproduzieren auch einfach zu selten.

Woran kann man erkennen, ob die SD einen Defekt hat ? Gibt es da so etwas wie SMART ?

Moin Tom,
Systeme, die auf einen reboot nicht hören wollten, hatte ich auch schon.
Da muss sich bei irgendwelchen Tests oder Upgrades irgendwas ins System eingeschlichen haben von dem ich keine Ahnung habe. Ich habe die Dinger kurzerhand neu aufgebaut/installiert - dann booten sie auch wieder auf Kommando.
Wirklich defekte SD hatte ich bislang erst 2 - und eine davon habe ich beim herausziehen selbst durchgebrochen :smiley:

Grüße, Uwe

Hi Tom,
ich würde die SD mal an einem anderen Linux System prüfen mit e2fsck .

Hatte am WE auch ein Problem, meine erste SD Karte an einem Pi hat es zerlegt.Zum Glück konnte ich alle Symcon Daten retten, denn der Pi ist bei meiner Tochter und ich habe nur DSL >2000 dorthin. Also So das Teil abgeholt, geprüft, neue SD rein und und alles rennt wieder.
Bei solchen Fehlern wird dir ein Hardwareschalter nicht viel nutzen,
War jetzt die erste SD die mir ausgefallen ist, mein System mit denvielen Dingen läuft immer noch mit der ersten SD seit ich mit IPS angefangen habe, aber da muss ich auch mal Gedanken verschwenden, was ich mache.

ps Die USB Stick’s zu LinHk Zeiten sind hier öfter ausgestiegen,

pps ne SD kostet nicht viel, also ne 2te neben das System legen und im Fehlerfall mal schnell umstecken (natürlich mit dem Backup vom System, ohne die „Archiv Daten“), so mache ich es, hab es aber bei mir noch nicht gebraucht.

Hi,

so meine Erfahrung.

Habe ein RasPi 3 auf dem GeCoS-Servermodullaüft seit ca. 12 Monaten ohne ein Absturz.
Mache jedes Update seit Vers. 5 mit.

Es ist allerdings nicht viel drauf

System dient nur zur Überwachung des Pruduktiv System unter Windos sowie
aller IP Geräte im Netz. ca. 60 Stück.

Dann sind noch 4 Relaise über die GPIO dran.

das war es

Hi, so ein kleines IPS habe ich zur Steuerung meines Raumschiffs (Licht und Sound) auch, es läuft tatsächlich mit IPS3 seit 3-4 Jahren ohne Absturz.

Das Produktivsystem ist schon umfangreich und es hängen auch Sachen dran wie Beschattung und Bewässerung über zig Schnittstellen, da „darf“ schon mal die Puste ausgehen - es sollte aber eben auch aus eigenen Kräften aufstehen können, wenn man ein paar Wochen weg ist, damit einem nach der Rückkehr keine verschwitzte Katze und eine Steppe erwarten.

Die Ursachenfndung ist sicherlich spannend ein eigenes Thema, mir geht es jetzt wirklich nur um das nie zu verhindernde „Restrisiko“, das man - vielleicht - noch mit einen automatischen Reboot beheben kann.

Bisher gefällt mir eine externe Lösung mit LCN am besten. Wahrscheinlich werde ich einfach via zyklische Taste eine wie von Uwe beschriebene Wuff-waf Taste nehmen, die von IPS gesperrt wird, so lange es eben rennt. Muss nur noch überlegen, wie ich das dann sinnvoll benachrichtigen / loggen kann. Vielleicht eine neue Aufgabe für das Raumschiff (boldly go where…)

Lieben Dank für eure Gedanken/Anregungen,
Tom

Ich möchte vor dem „harten“ Abschalten der Stromversorgung massiv warnen. Genau so sterben die anfälligen uSD-Karten. Vorher sollte man immer noch versuchen über SSH oder wenn möglich über temporär angeschlossene Tastatur plus Monitor alles Prozesse stoppen und dann halt ein kill absetzen. Wenn dies nicht mehr geht, muss man es halt so machen und hoffen dass der RASP wieder bootet.

Gruss
Bernd