Ubuntu nuc onbereikbaar na bepaalde tijd

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • Miyamoto
  • Registratie: Februari 2009
  • Laatst online: 18:57
Ik heb een Intel NUC (DN2820) met Ubuntu 18.04.4 als OS welke na willekeurige tijd onbereikbaar wordt, d.w.z.:
- SSH timeout
- Geen beeld via HDMI

Aan/uit knop brand licht. Geen enkele toets combinatie (CTRL+ALT+DEL, ESC, DEL, enz.) kan het systeem tot leven wekken. Het enige wat werkt is een power cycle.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
user@host:~$ last reboot
reboot   system boot  4.15.0-91-generi Sat Mar 28 15:11   still running
reboot   system boot  4.15.0-91-generi Fri Mar 27 19:17   still running
reboot   system boot  4.15.0-91-generi Wed Mar 18 19:09   still running
reboot   system boot  4.15.0-88-generi Mon Mar 16 14:36 - 19:09 (2+04:32)
reboot   system boot  4.15.0-88-generi Sun Mar 15 21:35 - 19:09 (2+21:33)
reboot   system boot  4.15.0-88-generi Mon Mar  9 21:25 - 19:09 (8+21:43)
reboot   system boot  4.15.0-88-generi Sat Mar  7 12:35 - 19:09 (11+06:33)
reboot   system boot  4.15.0-88-generi Sat Mar  7 11:36 - 19:09 (11+07:32)
reboot   system boot  4.15.0-88-generi Sat Mar  7 10:44 - 19:09 (11+08:25)
reboot   system boot  4.15.0-88-generi Wed Mar  4 21:15 - 19:09 (13+21:53)
reboot   system boot  4.15.0-88-generi Tue Mar  3 15:45 - 19:09 (15+03:23)
reboot   system boot  4.15.0-88-generi Tue Mar  3 15:23 - 15:42  (00:19)


dmesg geeft me ook geen verklaring of foutmeldingen die me wijzer maken (mogelijk ook omdat ik niet exact weet waar op te letten). Waar kan ik nog meer kijken om de boosdoener te vinden?

[ Voor 6% gewijzigd door Miyamoto op 28-03-2020 18:34 . Reden: Te snel geplaatst. ]

Beste antwoord (via Miyamoto op 05-04-2020 09:44)


  • MainframeX
  • Registratie: September 2017
  • Laatst online: 23:00
@Miyamoto Dan zou het nog een kernel panic kunnen zijn. Deze worden vaak niet weggeschreven naar een log o.i.d. Wat je eventueel zou kunnen proberen is vanaf een oudere kernel booten en kijken of het probleem dan verholpen is.

De nuc zou ook kapot kunnen zijn, maar laten we eerst eens kijken of dat echt zo is.

[ Voor 16% gewijzigd door MainframeX op 31-03-2020 21:21 ]

Idempotent.

Alle reacties


Acties:
  • 0 Henk 'm!

  • MainframeX
  • Registratie: September 2017
  • Laatst online: 23:00
Ik zou om te beginnen eens kijken in de logging. Dit kan je doen door "journalctl -b -1" te draaien. Dan lees je de logging van de voorgaande boot tot de volgende actieve bootup uit. Als je liever bestanden uitleest kan je bij /var/log/kern.log en /var/log/syslog terecht.

Mogelijk staan daarin wat aanwijzingen waarom je systeem niet naar behoren werkt.

Idempotent.


Acties:
  • 0 Henk 'm!

  • Miyamoto
  • Registratie: Februari 2009
  • Laatst online: 18:57
Daar had ik al gekeken, maar zie daar geen vreemde zaken.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
user@host:~$ journalctl -b -2
mrt 27 21:17:01 host CRON[3703]: pam_unix(cron:session): session opened for user root by (uid=0)
mrt 27 21:17:01 host CRON[3704]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
mrt 27 21:17:01 host CRON[3703]: pam_unix(cron:session): session closed for user root

user@host:~$ journalctl -b -3
mrt 26 22:36:12 host dhclient[904]: DHCPREQUEST of 192.168.1.10 on enp3s0 to 192.168.1.1 port 67 (xid=0x57bc241d)
mrt 26 22:36:12 host dhclient[904]: DHCPACK of 192.168.1.10 from 192.168.1.1
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4851] dhcp4 (enp3s0):   address 192.168.1.10
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4852] dhcp4 (enp3s0):   plen 24 (255.255.255.0)
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4853] dhcp4 (enp3s0):   gateway 192.168.1.1
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4853] dhcp4 (enp3s0):   lease time 86400
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4854] dhcp4 (enp3s0):   nameserver '192.168.1.1'
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4854] dhcp4 (enp3s0):   domain name 'localdomain'
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4854] dhcp (enp3s0):   domain search 'localdomain.'
mrt 26 22:36:12 host NetworkManager[572]: <info>  [1585258572.4855] dhcp4 (enp3s0): state changed bound -> bound
mrt 26 22:36:12 host dbus-daemon[551]: [system] Activating via systemd: service name='org.freedesktop.nm_dispatcher' unit='dbus-org.freedesktop.nm-
mrt 26 22:36:12 host systemd[1]: Starting Network Manager Script Dispatcher Service...
mrt 26 22:36:12 host dhclient[904]: bound to 192.168.1.10 -- renewal in 34936 seconds.
mrt 26 22:36:12 host dbus-daemon[551]: [system] Successfully activated service 'org.freedesktop.nm_dispatcher'
mrt 26 22:36:12 host systemd[1]: Started Network Manager Script Dispatcher Service.
mrt 26 22:36:12 host nm-dispatcher[28244]: req:1 'dhcp4-change' [enp3s0]: new request (1 scripts)
mrt 26 22:36:12 host nm-dispatcher[28244]: req:1 'dhcp4-change' [enp3s0]: start running ordered scripts...

user@host:~$ journalctl -b -5
mrt 15 22:16:14 host systemd-timesyncd[484]: Timed out waiting for reply from 91.189.94.4:123 (ntp.ubuntu.com).
mrt 15 22:16:14 host systemd-timesyncd[484]: Synchronized to time server 91.189.89.198:123 (ntp.ubuntu.com).
mrt 15 22:16:34 host systemd-resolved[488]: Grace period over, resuming full feature set (UDP+EDNS0) for DNS server 192.168.1.1.
mrt 15 22:17:01 host CRON[19935]: pam_unix(cron:session): session opened for user root by (uid=0)
mrt 15 22:17:01 host CRON[19936]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
mrt 15 22:17:01 host CRON[19935]: pam_unix(cron:session): session closed for user root

user@host:~$ journalctl -b -6
mrt 13 22:01:37 host systemd[1]: Started Run anacron jobs.
mrt 13 22:01:37 host anacron[30228]: Anacron 2.3 started on 2020-03-13
mrt 13 22:01:37 host anacron[30228]: Normal exit (0 jobs run)
mrt 13 22:17:01 host CRON[30346]: pam_unix(cron:session): session opened for user root by (uid=0)
mrt 13 22:17:01 host CRON[30347]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
mrt 13 22:17:01 host CRON[30346]: pam_unix(cron:session): session closed for user root


Ook in kern.log en syslog historie geen foutmeldingen of andere zaken die opvallen.

Acties:
  • Beste antwoord
  • 0 Henk 'm!

  • MainframeX
  • Registratie: September 2017
  • Laatst online: 23:00
@Miyamoto Dan zou het nog een kernel panic kunnen zijn. Deze worden vaak niet weggeschreven naar een log o.i.d. Wat je eventueel zou kunnen proberen is vanaf een oudere kernel booten en kijken of het probleem dan verholpen is.

De nuc zou ook kapot kunnen zijn, maar laten we eerst eens kijken of dat echt zo is.

[ Voor 16% gewijzigd door MainframeX op 31-03-2020 21:21 ]

Idempotent.


Acties:
  • +1 Henk 'm!

  • Miyamoto
  • Registratie: Februari 2009
  • Laatst online: 18:57
Goede tip, had ik niet aan gedacht. Ik heb 'm gisteravond nog geboot naar de voorgaande kernel versie. Ik zal over een paar dagen laten weten of het probleem daarmee verdwenen is.

Edit 2-apr:
Helaas, wederom een onbereikbare nuc. Dan toch maar een 2e nuc in gereedheid brengen en kijken of er toch een hw issue is. Bedankt in ieder geval voor het meedenken @MainframeX.

Edit 4-apr:
Inmiddels de programma's (voornamelijk unifi controller) op een 2e nuc geïnstalleerd. Vervolgens de 1e nuc een versie Ubuntu 18.04 installatie gegeven. En nu weer afwachten..

[ Voor 55% gewijzigd door Miyamoto op 05-04-2020 09:44 ]