Symcon stoppt ab und zu den Dienst

Hallo,

ich habe Symcon 5.3 auf meinem Windows 10 PC installiert. Letzter Zeit stoppt der Symcon Dienst sporadisch, wodurch so einiges im Haus nicht mehr funktioniert.

Kann man irgendwie hinter kommen, woran es liegen könnte?

Grüße

Erster Schritt wäre das (Ende vom) Logfile.
Die Glaskugeln im Forum sind leider schon seit Jahren defekt. :wink:
Michael

kann ich bestätigen

Hallo,

das stimmt natürlich😉

Ich habe mir die Logdatei mal kurz vorm Absturz angeschaut. Hier mal die letzten Einträge vorm beenden des Dienstes:
17.03.2020 14:59:16 | 26348 | DEBUG | VariableManager | [#HOME\04 Haustechnik\Esera 1-wire\Wasserspeicher unten\Wasserspeicher unten] = 46,3100000000
17.03.2020 14:59:16 | 00000 | DEBUG | ScriptEngine | Skriptausführung (Text) - Länge: 0 ~ Absender: RunScript ~ Dauer: 28 ms
17.03.2020 14:59:16 | 00000 | DEBUG | ScriptEngine | Skriptausführung (Text) - Länge: 0 ~ Absender: RunScript ~ Dauer: 110 ms
17.03.2020 14:59:16 | 00000 | DEBUG | ScriptEngine | Skriptausführung (Text) - Länge: 249 ~ Absender: RunScript
17.03.2020 14:59:16 | 00000 | DEBUG | ScriptEngine | Skriptausführung (Text) - Länge: 237 ~ Absender: RunScript
17.03.2020 14:59:16 | 29140 | MESSAGE | VariableManager | [#HOME\04 Haustechnik\Esera 1-wire\Serverschrank\Serverschrank] = 30,9300000000
17.03.2020 14:59:16 | 00000 | DE

Mehr gibt es nicht. Was mir aufgefallen ist: kurz davor hat das Unifi Modul fast 300 Meldungen auf ein Mal rausgeschickt, diese stehen alle mit den gleichen Zeitstempel im Log. Kann das vielleicht IPS ins Wanken bringen?

Grüße

Hat IP-Symcon dir danach gemeldet, dass du Absturzberichte senden kannst? Hast du dies gemacht?

paresy

Ne hat es nicht. Der Dienst wurde einfach beendet. Symcon Tray war aber noch aktiv. Als ich es gemerkt habe, startete ich den Dienst einfach wieder.

Grüße

Magst du mal schauen ob im Minidump Ordner etwas drin ist?

Unter Windows kannst du bei den Dienste angeben, dass dieser automatisch wieder starte soll - auch wenn dies nur ein vorübergehender Workaround sein sollte.

paresy

Hab ich schon 2 x gemacht. Bekommt man da Feedback? mind. 1 x ist es abgestürzt ohne Meldung…

Im Normalfall nicht. Wir versuchen das Problem direkt zu korrigieren. Feedback senden wir nur, wenn wir Rückfragen haben.

paresy

Da ist folgende Datei:
CrashDump__20200317_135905.dmp
Die Zeit passt auch zum Zeitpunkt als der Dienst beendet wurde. Die Datei ist aber 0 Bytes groß und somit ohne Inhalt.

Grüße

Der Dienst hat sich soeben ohne irgend welchen Einträgen im Log oder CrashDump gestoppt.
Vielleicht liegt es auch am letzten Windows Update?

Grüße

Loggst du vielleicht den Speicherverbraucht mit? Hast du mal geschaut ob der ggf. kontinuierlich ansteigt?

paresy

Ich habe 16GB verbaut. Ich logge zwar nicht mit, habe aber ein Tool womit es mir in der Taskleiste angezeigt wird. Meistens sind über 10GB frei.

Ich habe gestern das aktuelle IPS Updateinstalliert, Win10 Updates installiert und PC neu gestartet. Werde es dann weiter beobachten…

auch ich kämpfe mit der Box welche ständig neugestartet werden muss.

Was ich bis jetzt herausgefunden habe ist, dass der „used“ Memory immer nach oben zählt. Meine Vermutung ist, sobald das Ram aufgebraucht ist, stürzt die Box ab.

Mon Mar 23 17:18:40 CET 2020
17:18:40 up 9 min,  load average: 0.12, 0.14, 0.08
Linux SymBox 4.14.95-v7 #2 SMP Tue Dec 3 18:14:31 UTC 2019 armv7l GNU/Linux

              total        used        free      shared  buff/cache   available
Mem:         996396       90336      707172        1340      198888      897020
Swap:             0           0           0

Filesystem                Size      Used Available Use% Mounted on
devtmpfs                473.0M         0    473.0M   0% /dev
tmpfs                    64.0M         0     64.0M   0% /dev/shm
tmpfs                   128.0M      1.3M    126.7M   1% /tmp
/dev/mmcblk0p2          379.4M    244.8M    110.6M  69% /mnt/system
/dev/mmcblk0p3            3.0G    122.3M      2.7G   4% /mnt/data
/dev/loop0               46.5M     46.5M         0 100% /mnt/symupd
/dev/loop1               35.3M     35.3M         0 100% /mnt/symcon


/dev/loop0: 0 /mnt/system/symupd/symupd_1.7-804.sqfs
/dev/loop1: 0 /mnt/system/symcon/symcon_5.3-4600.sqfs



Mem: 290944K used, 705452K free, 2056K shrd, 18692K buff, 180920K cached
CPU:   1% usr   0% sys   0% nic  98% idle   0% io   0% irq   0% sirq
Load average: 0.27 0.21 0.12 2/140 1079
  PID  PPID USER     STAT   VSZ %VSZ %CPU COMMAND
  252     1 root     S     290m  30%   2% /usr/share/symcon/symcon service
  174     1 root     S    19456   2%   0% /usr/share/symupd/symupd service
 1079   925 root     R     1892   0%   0% top
  921   157 root     S     1404   0%   0% /usr/sbin/dropbear -R
    8     2 root     IW       0   0%   0% [rcu_sched]
  153     1 avahi    S     2600   0%   0% avahi-daemon: running [SymBox.local]
  121     1 dbus     S     2156   0%   0% dbus-daemon --system
  925   921 root     S     1908   0%   0% -sh
  148     1 root     S     1892   0%   0% ntpd
    1     0 root     S     1888   0%   0% init
  145     1 root     S     1884   0%   0% ifplugd -p
  198     1 root     S     1884   0%   0% /sbin/getty -L console 0 vt100
   84     1 root     S     1880   0%   0% /sbin/klogd -n
   79     1 root     S     1880   0%   0% /sbin/syslogd -n
  157     1 root     S     1376   0%   0% /usr/sbin/dropbear -R

Meine Box ist wieder abgestürzt und dieses Mal habe ich ein Log welche wie folgt aussieht:

Mar 30 18:52:03 SymBox kern.err kernel: [599384.317986] INFO: rcu_sched self-detected stall on CPU
Mar 30 18:52:03 SymBox kern.err kernel: [599384.323258] 	0-...: (1 GPs behind) idle=102/140000000000001/0 softirq=7220357/7220362 fqs=1049 
Mar 30 18:52:03 SymBox kern.err kernel: [599384.332058] 	 (t=2100 jiffies g=6162711 c=6162710 q=3178)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.337562] NMI backtrace for cpu 0
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.341149] CPU: 0 PID: 7 Comm: ksoftirqd/0 Tainted: G    B   W       4.14.95-v7 #2
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.348906] Hardware name: BCM2835
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.352426] [<8010fff8>] (unwind_backtrace) from [<8010be30>] (show_stack+0x20/0x24)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.360284] [<8010be30>] (show_stack) from [<8069b14c>] (dump_stack+0xcc/0x110)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.367708] [<8069b14c>] (dump_stack) from [<806a0e9c>] (nmi_cpu_backtrace+0x90/0xc4)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.375651] [<806a0e9c>] (nmi_cpu_backtrace) from [<806a0fe8>] (nmi_trigger_cpumask_backtrace+0x118/0x12c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.385419] [<806a0fe8>] (nmi_trigger_cpumask_backtrace) from [<8010e54c>] (arch_trigger_cpumask_backtrace+0x20/0x24)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.396146] [<8010e54c>] (arch_trigger_cpumask_backtrace) from [<80185218>] (rcu_dump_cpu_stacks+0xa8/0xd0)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.406004] [<80185218>] (rcu_dump_cpu_stacks) from [<80184574>] (rcu_check_callbacks+0x82c/0x9e8)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.415077] [<80184574>] (rcu_check_callbacks) from [<8018ad60>] (update_process_times+0x44/0x70)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.424064] [<8018ad60>] (update_process_times) from [<8019cfa8>] (tick_sched_handle+0x64/0x70)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.432877] [<8019cfa8>] (tick_sched_handle) from [<8019d204>] (tick_sched_timer+0x50/0xac)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.441341] [<8019d204>] (tick_sched_timer) from [<8018b2f4>] (__hrtimer_run_queues+0x17c/0x310)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.450238] [<8018b2f4>] (__hrtimer_run_queues) from [<8018c290>] (hrtimer_interrupt+0xbc/0x224)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.459138] [<8018c290>] (hrtimer_interrupt) from [<80585450>] (arch_timer_handler_phys+0x38/0x40)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.468214] [<80585450>] (arch_timer_handler_phys) from [<80179d68>] (handle_percpu_devid_irq+0x8c/0x240)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.477897] [<80179d68>] (handle_percpu_devid_irq) from [<80174e84>] (generic_handle_irq+0x30/0x44)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.487056] [<80174e84>] (generic_handle_irq) from [<80174f04>] (__handle_domain_irq+0x6c/0xc4)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.495868] [<80174f04>] (__handle_domain_irq) from [<801014ec>] (bcm2836_arm_irqchip_handle_irq+0xac/0xb0)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.505723] [<801014ec>] (bcm2836_arm_irqchip_handle_irq) from [<8010cc7c>] (__irq_svc+0x5c/0x7c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.514700] Exception stack(0xbc903ab8 to 0xbc903b00)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.519849] 3aa0:                                                       80615d58 00000000
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.528135] 3ac0: 0000b525 000074c0 bcef7540 b518e180 00000000 00000000 807412b0 bca90600
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.536421] 3ae0: 00000000 bc903b1c bc903b08 bc903b08 806b4ea0 806b4ecc 80000013 ffffffff
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.544712] [<8010cc7c>] (__irq_svc) from [<806b4ecc>] (_raw_spin_lock_bh+0x50/0x64)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.552570] [<806b4ecc>] (_raw_spin_lock_bh) from [<80615d58>] (rt_add_uncached_list+0x34/0x5c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.561384] [<80615d58>] (rt_add_uncached_list) from [<806174b0>] (rt_set_nexthop.constprop.9+0xc4/0x2bc)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.571068] [<806174b0>] (rt_set_nexthop.constprop.9) from [<80619c78>] (ip_route_output_key_hash_rcu+0x4b8/0x898)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.581533] [<80619c78>] (ip_route_output_key_hash_rcu) from [<8061a0b8>] (ip_route_output_key_hash+0x60/0x68)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.591650] [<8061a0b8>] (ip_route_output_key_hash) from [<806541d0>] (icmp_route_lookup.constprop.7+0xb4/0x34c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.601938] [<806541d0>] (icmp_route_lookup.constprop.7) from [<80654bcc>] (icmp_send+0x238/0x3b0)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.611010] [<80654bcc>] (icmp_send) from [<80615eb0>] (ipv4_link_failure+0x28/0x6c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.618863] [<80615eb0>] (ipv4_link_failure) from [<80651b80>] (arp_error_report+0x44/0x50)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.627325] [<80651b80>] (arp_error_report) from [<805e4344>] (neigh_invalidate+0xcc/0x144)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.635789] [<805e4344>] (neigh_invalidate) from [<805e77ac>] (neigh_timer_handler+0x220/0x278)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.644600] [<805e77ac>] (neigh_timer_handler) from [<80189528>] (call_timer_fn+0x40/0x1a8)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.653061] [<80189528>] (call_timer_fn) from [<80189794>] (expire_timers+0x104/0x174)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.661088] [<80189794>] (expire_timers) from [<801898a8>] (run_timer_softirq+0xa4/0x1c0)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.669375] [<801898a8>] (run_timer_softirq) from [<80101668>] (__do_softirq+0x178/0x3d8)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.677664] [<80101668>] (__do_softirq) from [<80123274>] (run_ksoftirqd+0x50/0x6c)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.685433] [<80123274>] (run_ksoftirqd) from [<80141c0c>] (smpboot_thread_fn+0xfc/0x1b8)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.693723] [<80141c0c>] (smpboot_thread_fn) from [<8013d540>] (kthread+0x170/0x178)
Mar 30 18:52:03 SymBox kern.warn kernel: [599384.701579] [<8013d540>] (kthread) from [<80107fcc>] (ret_from_fork+0x14/0x28)


Bei mir ist heute IPS auch einfach stehen geblieben.
In der CrashDump__20200330_092534.dmp steht wieder nichts drin. Der normale Log bleibt einfach stehen. Ich muss den Dienst wieder starten. Symcon Tray ist aber aktiv.

Meine Vermutung das die Box abstürzt infolge des Memory ist falsch. Mein neuer Verdacht ist der Ordner /tmp bei mir. Die Box lief ca 1 Woche und der /tmp Ordner war stabil von der Grösse. Heute habe ich wieder die Box neu starten müssen und jetzt innert 15 Minuten schon bei 2 M. Die Logdatei wird immer grösser. Ist irgendwo ein Job eingerichtet wo die Temp Datei verkleinert / erneuert nach einer gewissen Zeit? Bin nicht der Linux Guru…

drwxrwxrwx    2 root     root           100 Apr  5 20:36 .
drwxrwxrwt    5 root     root           140 Jan  1  1970 ..
lrwxrwxrwx    1 root     root            37 Apr  5 20:36 logfile.log -> /var/log/symcon/logfile1586111771.log
-rw-rw-rw-    1 root     root           179 Apr  5 20:36 logfile0.log
-rw-rw-rw-    1 root     root       2052580 Apr  5 20:47 logfile1586111771.log

Hauptsächlich befinden sich SONOS und Philips Hue Meldungen im Log.

Die SymBox rotiert das Logfile eigentlich vollautomatisch.

paresy

Danke paresy

Das kann es somit auch nicht sein… dann weiss ich auch nicht mehr weiter und hoffe das bald ein Update kommt damit die Box nicht mehr abstürzt… Jetzt nach ca 50 Minuten schon der nächste Absturz …

Kannst du dies hier mal probieren? Debugging für Experten (Raspberry Pi, Linux, SymBox)

Passiert dies immer so häufig bei dir?

paresy