[vz-users] Wiederkehrende System-Crashes

Rupert Schöttler rupert.schoettler at gmx.de
Sun Dec 3 13:34:31 CET 2017


Hallo ihr fleißigen Volkszähler,

nach Berichten in diesem Forum über "Raspberry legt Netzwerk lahm - ssh
network storm" und "Crash der SD Karte" möchte ich über meine seltsamen
Erfahrungen der letzten Wochen bzw. Monate berichten.

Mein gut ein Jahr alter Raspberry Pi 3 lief problemlos unter jessie,
seit Anfang Mai d.J. auch mit der vz-middleware (Datenbank und Webserver
- das Daten Sammeln erledigt ein zweiter Pi 1 Model B). Ende September
dann plötzlich war die Systemlast extrem hoch, ich konnte mich nicht
mehr per ssh einloggen, und nach dem Stecker Ziehen (ein ordentlicher
shutdown ging ja nicht...) startete das System nicht mehr. Ein fsck auf
die Karte im Leser eines anderen Rechners meldete tausende Fehler, auch
nach dem Reparieren funktionierte die Karte nicht mehr. Also habe ich
das System Anfang Oktober neu aufgesetzt. Diesmal unter stretch.

Gut zwei Wochen lief das System, dann wieder das gleiche Problem: Hohe
Systemlast, kein ssh-login, nach dem "Stromausfall" kein Systemstart
mehr. Alle Rettungsversuche der Daten auf der SD-Karte scheiterten, also
"platt machen" und neu aufsetzen.

Der Thread "Raspberry legt Netzwerk lahm - ssh network storm" von Anfang
November schien auf meine Probleme zu passen, denn ich hatte im
September mein Heimnetzwerk über die von AVS (fritz.box) angebotenen
Mechanismen nach außen geöffnet. Allerdings habe ich die im Thread
angesprochenen Sicherheitsaspekte (PW ändern, updates) immer von Anfang
an umgesetzt. Weil ich den Fernzugang aber eh nicht nutzte, habe ich ihn
sicherheitshalber wieder zu gemacht.

Wieder lief der Pi gut 2 Wochen, als Updates anstanden und ein

$ sudo apt-get update && sudo apt-get upgrade

eine Fehlermeldung lieferte wie

dpkg: nicht behebbarer fataler Fehler, Abbruch:
Abschließender Zeilenvorschub fehlt in Dateilisten-Datei des Paketes »acl«
E: Sub-process /usr/bin/dpkg returned an error code (2)

Die Recherche nach möglichen Ursachen so eines Fehlers zeigte, dass die
entsprechenden Listen-Dateien tatsächlich kein reiner Text mehr waren,
in Pfadangaben einzelne Buchstaben sinnlos verändert waren, am
Zeilenende Quatsch stand usw. Da ich mich außerstande sah, das einzeln
zu korrigieren, versuchte ich einen reboot (ich war ja eingeloggt ;-) --
der Pi startete aber nicht mehr. Also wieder fsck der SD-Karte im
anderen Rechner, automatische Reparatur Tausender Fehler, Karte im Pi
startet trotzdem nicht.

Also wird das System wieder neu aufgesetzt (wer hat mitgezählt, zum wie
vielten Mal? :-), man bekommt ja Routine, und auch die parallel zu den
Befehlen mitgeschriebene Anleitung wird immer besser. Das war letztes
Wochenende. Am Dienstag dann wollte ich wieder Updates einspielen, und
wieder kam die Fehlermeldung von dpkg. Diesmal habe ich aber (noch)
keinen Reboot veranlasst, denn der Pi läuft stabil -- halt ohne Update.
Aber die Datenbank und der Webserver funktionieren, immer noch. Trotzdem
ist der Zustand natürlich nicht dauerhaft haltbar.

Folgende Vermutungen zu Ursachen habe ich schon angestellt:

1. Fehlerhafte SD-Karte (Patriot microSDHC Card 16 GB): Vor dem letzten
Neu-Aufsetzen habe ich sie mit H2testw -- by Harald Bögeholz / c't
Magazin für Computertechnik, "Integritätstest für USB-Sticks und andere
Datenträger", Version 1.4 getestet, sie wurde für gut befunden. Die
komplette Installation inkl. Updates usw. lief ja auch fehlerfrei durch.
Jetzt und auch schon vor drei Tagen aber meldet

$ fdisk -l
Speicherzugriffsfehler

Seltsam, dass ich trotzdem Dateien auf diesem Filesystem korrekt
erzeugen kann: Um wenigstens die kontinuierlich erfassten Daten zu
retten, bevor das System wieder abschmiert, habe ich ein inkrementelles
Backup für die Datentabelle eingerichtet, das stündlich eine CSV-Datei
erzeugt und auf einem anderen Rechner kopiert.

2. Hardware-Defekt am Kartenleser des Pi: Da gilt m.E. dasselbe wie
oben: Wie hätte dann die ganze Installation, die ja mit Ausnahme des
Aufspielens des Images komplett auf diesem Pi ablief, funktionieren sollen?

3. Fehler in der Distribution (raspbian stretch oder vz Middleware):
Dann sollten doch andere User ähnliches erleben.

4. Mein System ist kompromittiert: Nicht der Pi, der den Ärger macht,
sondern andere Rechner im Netz, die unauffällig weiter laufen und nur
dieses eine Gerät torpedieren? M.E. ist so ein Szenario nicht
ausgeschlossen, aber ist es realistisch? Wie könnte ich es herausfinden?

5. Das Problem sitzt vor dem Rechner und schreibt gerade einen
Hilferuf... :-) Was mache ich falsch?

Schöne Grüße

Rupert


-------------- next part --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 5643 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://demo.volkszaehler.org/pipermail/volkszaehler-users/attachments/20171203/bccb2c88/attachment.bin>


More information about the volkszaehler-users mailing list