System Hangup

Hallo zusammen,  
Ich brauche mal einen Rat. Ich betreibe einen Repetierserver zusammen mit einem Prusa MK3 seit 2 Jahren Problemfrei. Der Server läuft auf einem Raspi4 mit einem 7 Zoll Display. Seit einigen Tagen reagiert der Server nach einigen Minuten nach Neustart nicht mehr. Aufgefallen ist mir das da er beim Drucken nur eine Bewegung gemacht hat und dann wieder stehenblieb. Temperaturprobleme kann ich ausschließen. Es sind Kühlkörper und ein Lüfter verbaut. Die einzige Änderung war das Update auf 1.42. Der Stillstand geht soweit, das die Weboberfläche nicht reagiert, der Touchscreen nicht reagiert und auch über SSH keine Verbindung möglich ist. Ich habe die Logs mal runtergeladen(mit 1kb/s) werde da aber nicht schlau draus. Unterschiedliche USB Ports und ein neues Kabel auch getestet. Aber ohne Erfolg. 
Hat da jemand eine Idee ?

Viele Grüße
Rene 

Comments

  • edited October 12
    .
  • Altes image und server mit autoupdater aktualisiert oder neues image mit 1.4.2?

    Hört sich an als ob irgend ein Prozess zu viele resourcen zieht und damit alles lahmlegt. Jetzt ist die frage wer. Am besten nach dem hochfahren per ssh einloggen und "top" starten. Dann den Druck der ja dann alles lehm legt und sehen welcher Prozess plötzlich mehr Cpu oder Speicher benötigt um es erst mal einzugrenzen. Das server.log wäre eventuell auch hilfreich, wobei "langsam" ja nicht protokolliert wird, aber vielleicht gibt es dennoch hinweise.

    >  Ich habe die Logs mal runtergeladen(mit 1kb/s)
    Das ist extrem langsam. Wenn die Verbindung zum Client plötzlich langsam ist, wäre das auch ein Problem weil webcam etc. dann mehr verbrauchen als geht und damit auch verzögerungen verursachen können. Ist wifi verbindung so schlecht? Ich gehe davon aus das du das nach einem reboot geladen hast wo das "Problem" grad noch nicht aktiv ist.
  • Hallo, vielen Dank für die schnelle Rückmeldung. Das Update wurde über den Autoupdater installiert. Wenn die Ruckler beim drucken und das Webinterface nur noch schwer reagiert. war es mir auch nicht mehr möglich mit top die CPU und Ram Auslastung zu prüfen. Nach einem Neustart wenn alles lief hatte ich meistens ca 20% Ram Auslastung und ca 1% CPU Auslastung. Beim letzten Restart heute Nachmittag blieb das System mit einem Kernel Panic beim Booten schon hängen. Ich habe mal ein sauberes Image auf eine neue SD Karte gemacht und teste aktuell.
  • so sieht es übrigens auf neuem System während dem Drucken aus ....

      PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND                                    

     6503 root      20   0  273716   3372   1508 S 100.0   0.4  53:24.81 mjpg_streamer                              

      766 repetie+   0 -20   42468  14028   6196 S   2.3   1.6   1:39.13 RepetierServer                             

     1327 pi        20   0  464080  94884  67984 S   1.3  10.6   1:21.24 chromium-browse                            

     3726 root      20   0       0      0      0 I   0.7   0.0   0:00.85 kworker/2:0-events                         

        1 root      20   0   34884   6324   4284 S   0.3   0.7   0:12.64 systemd                                    

      328 message+  20   0    7952   1972   1272 S   0.3   0.2   0:01.36 dbus-daemon                                

      333 root      20   0       0      0      0 S   0.3   0.0   0:00.83 brcmf_wdog/mmc1                            

      402 root       0 -20       0      0      0 I   0.3   0.0   0:01.84 kworker/u9:1-brcmf_wq/mmc1:0001:1          

     1166 pi        20   0  496316  75472  58912 S   0.3   8.5   0:15.45 chromium-browse                            

     1289 pi        20   0  485816  44264  22628 S   0.3   5.0   0:23.17 chromium-browse                            

     1293 pi        20   0  326160  42792  35736 S   0.3   4.8   0:07.12 chromium-browse                            

     1719 root      20   0    3156   1484   1296 S   0.3   0.2   0:01.45 bash                                       

    10746 ntp       20   0    8176   1520    984 S   0.3   0.2   0:00.25 ntpd                                       

    11146 root      20   0       0      0      0 I   0.3   0.0   0:00.54 kworker/u8:3-events_unbound                

    13068 root      20   0       0      0      0 I   0.3   0.0   0:00.83 kworker/3:3-mm_percpu_wq                   

    15730 root      20   0       0      0      0 I   0.3   0.0   0:00.04 kworker/1:0-events                         

    16409 root      20   0       0      0      0 R   0.3   0.0   0:00.51 kworker/0:0+e

  • Ganz gut abgesehen von
    >  6503 root      20   0  273716   3372   1508 S 100.0   0.4  53:24.81 mjpg_streamer  
    Wenn es eine pi cam ist kannst du über "sudo raspi-config" für die webcam den legacy modus wählen, dann nutzt sie wieder hardware komprimierung und hat keine last. Beim neuen Grafiktreiber macht zumindest mjpg_streamer dies nicht und hat hohe cpu last. Abgesehen davon ist das aber kein echtes Problem.

    Wenn es eine USB webcam ist kann es daran liegen, dass sie kein MJPG unterstützt.

    So sollte es aber sein. Hoffen wir mal das es nur ein defekt am Dateisystem war. Auch das fürt immer wieder zu den merkwürdigsten Problemen.
  • Hallo nochmal.... ich kam jetzt endlich mal dazu ein wenig weiterzutesten. Und es war tatsächlich eine defekte SD Karte. Seltsamerweise war der Fehler irgendwie auch im Backup enthalten. So das nach einem Restore der Fehler immer wieder auftrat. Habe verschiedene Pi´s getestet vom Pi4 über einen Pi3 und letztlich zu einem Pi2. Mit einem neuem System läuft es jetzt. Auf einem Raspberry Pi 2 übrigens. Gibt es eigentlich die Möglichkeit die SD Karte zu Entlasten in dem man einen USB Stick nutzt? Evtl. den Mountpoint des Verzeichnisses verschieben?
    Und nochmals Danke für die schnelle Hilfe ...
    viele Grüße
  • Grundsätzlich kann man unter linux mit Links problems Verzeichnisteile verscheiben, wobei /var/lib/Repetier-Server komplett auf eine Festplatte gehört. Problem ist das beim start des Servers das Verzeichnis existieren muss, also muss es immer vor dem Server gemounted werden weil es z.b. in /etc/fstabs  explizit drin steht als permanentes Laufwerk.

    Danach schreibt er mehr auf die USB PLatte und nur die normalen logs etc auf sd karte.

    Jetzt gibt es auch sehr einfache Lösungen für ein Backup einzelner Drucker komplett mit G-Code ode rmit dem Monitor um einen Kompletten Server mal eben zu sichern. EInziges problem nach einem defekt kopiert man auch defekte Dateien, man müsste dann also mehrere Versionen haben für den Fall der Fälle.
  • Ok dann werde ich das mal testen. Die Einträge mit seriennummern in der fstab ist kein Problem. Und das mit den Backups war so eine Sache. Ich habe die Verzeichnisse per Hand an ihren Ursprünglichen Ort zurückkopiert. Versuche ich jetzt aber über die Desktop Software (Mac OS) ein Backup zu erstellen bricht es nach ein paar Minuten kommentarlos ab. Liegt es evtl an der Größe? Sind aktuell etwas 11 GB Projekte und ca 1 GB gcode Dateien ....
  • Backup erstellen mit Monitor lädt die Dateien alle einzeln, aber bei Verbindungsproblemen wirds schwierig. Sollte also stabile Verbindung haben. Kann auch eine defekte Datei sein die Probleme macht, müsste man server.log sehen ob wa schiefgeht.

    Die einfachen backups einzelner Drucker komprimieren eigentlich on the fly, nur beim restore wird das zip erst gespeichert und dann entpackt und dann wird der Freie Speicherplatz wichtig.
Sign In or Register to comment.