Mijn desktop met Ubuntu MATE 16.04 "bevriest" sinds een paar dagen willekeurig. Vaak na iets meer dan 1 uur gebruik (bijv. browsen met Chromium).
Met bevriezen bedoel ik dat de muiscursor en toetsenbord het nog doen, maar nieuwe pagina's en ook nieuwe programma's niet meer laden. Van een reeds openstaande terminal-venster wordt elk nieuw commando niet meer uitgevoerd.
Met Ctrl+Alt+F1 switchen naar een console zorgt ervoor dat je wel kan inloggen als bijv. "root", maar de bash-shell niet meer laadt en het dus niet meer kan gebruiken.
Ctrl+Alt+Delete initieert wel een reboot, maar ook deze blijft hangen.
Bijna alles wijst erop dat een NFS-share is "blijven hangen". Dit gedrag geeft 'ie namelijk ook als je de netwerkkabel lostrekt. De /home is namelijk aangekoppeld via NFS met de optie "hard".
Alleen, hoe kom ik erachter wat er aan de hand is en waarom het gebeurt? Bijv. een netwerkdriver die faalt?
Er is niks aan het systeem veranderd, hij werkte jaren goed... tot enkele dagen geleden.
Gekke is dan er in /var/log/kern.log niks wordt gelogd, omdat waarschijnlijk ook dat proces blijft hangen? Misschien als ik niet in de gaten heb dat 'ie vastloopt en ik 'm langer aan laat staan hij wel iets logt? Van een paar dagen geleden vind ik namelijk wel iets wat verdacht is, maar zowel gisteren als zo-net niet:
De server kan het neem ik aan niet zijn, want er is nog een tweede PC (die van moeder) met dezelfde confguratie en die draait vrolijk verder, heeft dit probleem niet. Hardware is ook hetzelfde van beide PC's... een HP 8200 SFF, alleen de mijne heeft een extra videokaart i.p.v. de onboard.
Met bevriezen bedoel ik dat de muiscursor en toetsenbord het nog doen, maar nieuwe pagina's en ook nieuwe programma's niet meer laden. Van een reeds openstaande terminal-venster wordt elk nieuw commando niet meer uitgevoerd.
Met Ctrl+Alt+F1 switchen naar een console zorgt ervoor dat je wel kan inloggen als bijv. "root", maar de bash-shell niet meer laadt en het dus niet meer kan gebruiken.
Ctrl+Alt+Delete initieert wel een reboot, maar ook deze blijft hangen.
Bijna alles wijst erop dat een NFS-share is "blijven hangen". Dit gedrag geeft 'ie namelijk ook als je de netwerkkabel lostrekt. De /home is namelijk aangekoppeld via NFS met de optie "hard".
Alleen, hoe kom ik erachter wat er aan de hand is en waarom het gebeurt? Bijv. een netwerkdriver die faalt?
Er is niks aan het systeem veranderd, hij werkte jaren goed... tot enkele dagen geleden.
Gekke is dan er in /var/log/kern.log niks wordt gelogd, omdat waarschijnlijk ook dat proces blijft hangen? Misschien als ik niet in de gaten heb dat 'ie vastloopt en ik 'm langer aan laat staan hij wel iets logt? Van een paar dagen geleden vind ik namelijk wel iets wat verdacht is, maar zowel gisteren als zo-net niet:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
| Apr 8 23:57:12 ws45 kernel: [ 4200.409889] INFO: task ThreadPoolForeg:5145 blocked for more than 120 seconds. Apr 8 23:57:12 ws45 kernel: [ 4200.409896] Tainted: P OE 4.4.0-177-generic #207-Ubuntu Apr 8 23:57:12 ws45 kernel: [ 4200.409898] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Apr 8 23:57:12 ws45 kernel: [ 4200.409901] ThreadPoolForeg D dc1b7d08 0 5145 2707 0x00000000 Apr 8 23:57:12 ws45 kernel: [ 4200.409908] dc1b7d1c 00200086 debba9c0 dc1b7d08 f8e84e3c 00000000 d2928977 000003b4 Apr 8 23:57:12 ws45 kernel: [ 4200.409916] f53cee00 f1560000 e4ee4600 dc1b8000 e4ee4600 f63c6ce8 dc1b7d28 c17ec5cd Apr 8 23:57:12 ws45 kernel: [ 4200.409924] 000001ff dc1b7d78 c11a8b57 00000028 0000000a f16c2ca0 f87f8b60 00000000 Apr 8 23:57:12 ws45 kernel: [ 4200.409931] Call Trace: Apr 8 23:57:12 ws45 kernel: [ 4200.409954] [<f8e84e3c>] ? nfs_refresh_inode_locked+0x4c/0x300 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.409960] [<c17ec5cd>] schedule+0x2d/0x80 Apr 8 23:57:12 ws45 kernel: [ 4200.409965] [<c11a8b57>] kmap_high+0x117/0x290 Apr 8 23:57:12 ws45 kernel: [ 4200.409970] [<c11d2c95>] ? kmem_cache_alloc_trace+0x185/0x1e0 Apr 8 23:57:12 ws45 kernel: [ 4200.409974] [<c109ee50>] ? wake_up_q+0x70/0x70 Apr 8 23:57:12 ws45 kernel: [ 4200.409979] [<c106bec0>] kmap+0x40/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.409993] [<f8e7fe0d>] nfs_readdir_xdr_to_array+0xdd/0x370 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.409998] [<c11e4d62>] ? mem_cgroup_commit_charge+0x62/0xe0 Apr 8 23:57:12 ws45 kernel: [ 4200.410012] [<f8e800bb>] nfs_readdir_filler+0x1b/0x80 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410016] [<c117e3b2>] do_read_cache_page+0x102/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410029] [<f8e800a0>] ? nfs_readdir_xdr_to_array+0x370/0x370 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410033] [<c117e464>] read_cache_page+0x24/0x30 Apr 8 23:57:12 ws45 kernel: [ 4200.410046] [<f8e80261>] nfs_readdir+0x141/0x740 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410051] [<c13d21b6>] ? _copy_to_user+0x26/0x30 Apr 8 23:57:12 ws45 kernel: [ 4200.410056] [<c135fba5>] ? common_file_perm+0x55/0x1b0 Apr 8 23:57:12 ws45 kernel: [ 4200.410062] [<f8a4d890>] ? nfs3_xdr_dec_getattr3res+0x60/0x60 [nfsv3] Apr 8 23:57:12 ws45 kernel: [ 4200.410068] [<c1201c2e>] iterate_dir+0x8e/0x130 Apr 8 23:57:12 ws45 kernel: [ 4200.410073] [<c120224d>] SyS_getdents64+0x6d/0xf0 Apr 8 23:57:12 ws45 kernel: [ 4200.410077] [<c1201e10>] ? filldir+0x140/0x140 Apr 8 23:57:12 ws45 kernel: [ 4200.410082] [<c100397f>] do_fast_syscall_32+0x9f/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410087] [<c17f08b0>] sysenter_past_esp+0x3d/0x61 Apr 8 23:57:12 ws45 kernel: [ 4200.410095] INFO: task ThreadPoolForeg:4855 blocked for more than 120 seconds. Apr 8 23:57:12 ws45 kernel: [ 4200.410098] Tainted: P OE 4.4.0-177-generic #207-Ubuntu Apr 8 23:57:12 ws45 kernel: [ 4200.410100] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Apr 8 23:57:12 ws45 kernel: [ 4200.410102] ThreadPoolForeg D 00000000 0 4855 3117 0x00000000 Apr 8 23:57:12 ws45 kernel: [ 4200.410106] e390bd6c 00200086 00000000 00000000 e390bd58 c13c992f 49aea2cc 000003b5 Apr 8 23:57:12 ws45 kernel: [ 4200.410114] f53aae00 f151e400 e6d12800 e390c000 e6d12800 f5896da0 e390bd78 c17ec5cd Apr 8 23:57:12 ws45 kernel: [ 4200.410121] 000001ff e390bdc8 c11a8b57 f8e81210 e390bdb4 00000000 ef28c734 e390bd9c Apr 8 23:57:12 ws45 kernel: [ 4200.410128] Call Trace: Apr 8 23:57:12 ws45 kernel: [ 4200.410133] [<c13c992f>] ? radix_tree_lookup_slot+0x1f/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410137] [<c17ec5cd>] schedule+0x2d/0x80 Apr 8 23:57:12 ws45 kernel: [ 4200.410140] [<c11a8b57>] kmap_high+0x117/0x290 Apr 8 23:57:12 ws45 kernel: [ 4200.410153] [<f8e81210>] ? nfs_atomic_open+0x3e0/0x3e0 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410158] [<c118cdd7>] ? mark_page_accessed+0x67/0xc0 Apr 8 23:57:12 ws45 kernel: [ 4200.410162] [<c117e32b>] ? do_read_cache_page+0x7b/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410165] [<c109ee50>] ? wake_up_q+0x70/0x70 Apr 8 23:57:12 ws45 kernel: [ 4200.410169] [<c106bec0>] kmap+0x40/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410185] [<f8e8ec93>] nfs_follow_link+0x53/0x60 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410190] [<c11fbdb4>] link_path_walk+0x464/0x540 Apr 8 23:57:12 ws45 kernel: [ 4200.410194] [<c11fb4c0>] ? path_init+0x210/0x3b0 Apr 8 23:57:12 ws45 kernel: [ 4200.410199] [<c10f83ab>] ? futex_wait+0x1db/0x270 Apr 8 23:57:12 ws45 kernel: [ 4200.410203] [<c11fc1fe>] path_lookupat+0x6e/0xe0 Apr 8 23:57:12 ws45 kernel: [ 4200.410207] [<c11fd9e7>] filename_lookup+0x97/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410212] [<c11fd62a>] ? getname_flags+0x3a/0x1a0 Apr 8 23:57:12 ws45 kernel: [ 4200.410216] [<c11fdbb6>] user_path_at_empty+0x36/0x40 Apr 8 23:57:12 ws45 kernel: [ 4200.410222] [<c11f3140>] vfs_fstatat+0x60/0xb0 Apr 8 23:57:12 ws45 kernel: [ 4200.410226] [<c11f3ba1>] SyS_lstat64+0x31/0x60 Apr 8 23:57:12 ws45 kernel: [ 4200.410230] [<c10fac83>] ? SyS_futex+0x93/0x160 Apr 8 23:57:12 ws45 kernel: [ 4200.410235] [<c100397f>] do_fast_syscall_32+0x9f/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410239] [<c17f08b0>] sysenter_past_esp+0x3d/0x61 Apr 8 23:57:12 ws45 kernel: [ 4200.410243] [<c17f0000>] ? _raw_read_unlock_irqrestore+0x20/0x20 Apr 8 23:57:12 ws45 kernel: [ 4200.410247] INFO: task ThreadPoolForeg:4939 blocked for more than 120 seconds. Apr 8 23:57:12 ws45 kernel: [ 4200.410249] Tainted: P OE 4.4.0-177-generic #207-Ubuntu Apr 8 23:57:12 ws45 kernel: [ 4200.410251] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Apr 8 23:57:12 ws45 kernel: [ 4200.410253] ThreadPoolForeg D 00000000 0 4939 3117 0x00000000 Apr 8 23:57:12 ws45 kernel: [ 4200.410257] e5183d6c 00200086 00000000 00000000 e5183d58 c13c992f cb815b66 000003b5 Apr 8 23:57:12 ws45 kernel: [ 4200.410265] f53bce00 f151ee00 e5346e00 e5184000 e5346e00 f5896da0 e5183d78 c17ec5cd Apr 8 23:57:12 ws45 kernel: [ 4200.410272] 000001ff e5183dc8 c11a8b57 f8e81210 e5183db4 00000000 ef28c734 e5183d9c Apr 8 23:57:12 ws45 kernel: [ 4200.410279] Call Trace: Apr 8 23:57:12 ws45 kernel: [ 4200.410283] [<c13c992f>] ? radix_tree_lookup_slot+0x1f/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410287] [<c17ec5cd>] schedule+0x2d/0x80 Apr 8 23:57:12 ws45 kernel: [ 4200.410290] [<c11a8b57>] kmap_high+0x117/0x290 Apr 8 23:57:12 ws45 kernel: [ 4200.410303] [<f8e81210>] ? nfs_atomic_open+0x3e0/0x3e0 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410307] [<c118cdd7>] ? mark_page_accessed+0x67/0xc0 Apr 8 23:57:12 ws45 kernel: [ 4200.410311] [<c117e32b>] ? do_read_cache_page+0x7b/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410314] [<c109ee50>] ? wake_up_q+0x70/0x70 Apr 8 23:57:12 ws45 kernel: [ 4200.410318] [<c106bec0>] kmap+0x40/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410332] [<f8e8ec93>] nfs_follow_link+0x53/0x60 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410336] [<c11fbdb4>] link_path_walk+0x464/0x540 Apr 8 23:57:12 ws45 kernel: [ 4200.410340] [<c11fb4c0>] ? path_init+0x210/0x3b0 Apr 8 23:57:12 ws45 kernel: [ 4200.410344] [<c10f83ab>] ? futex_wait+0x1db/0x270 Apr 8 23:57:12 ws45 kernel: [ 4200.410348] [<c11fc1fe>] path_lookupat+0x6e/0xe0 Apr 8 23:57:12 ws45 kernel: [ 4200.410352] [<c11fd9e7>] filename_lookup+0x97/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410357] [<c11fd62a>] ? getname_flags+0x3a/0x1a0 Apr 8 23:57:12 ws45 kernel: [ 4200.410361] [<c11fdbb6>] user_path_at_empty+0x36/0x40 Apr 8 23:57:12 ws45 kernel: [ 4200.410366] [<c11f3140>] vfs_fstatat+0x60/0xb0 Apr 8 23:57:12 ws45 kernel: [ 4200.410370] [<c11f3ba1>] SyS_lstat64+0x31/0x60 Apr 8 23:57:12 ws45 kernel: [ 4200.410374] [<c10fac83>] ? SyS_futex+0x93/0x160 Apr 8 23:57:12 ws45 kernel: [ 4200.410378] [<c100397f>] do_fast_syscall_32+0x9f/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410382] [<c17f08b0>] sysenter_past_esp+0x3d/0x61 Apr 8 23:57:12 ws45 kernel: [ 4200.410386] [<c17f0000>] ? _raw_read_unlock_irqrestore+0x20/0x20 Apr 8 23:57:12 ws45 kernel: [ 4200.410389] INFO: task ThreadPoolForeg:5287 blocked for more than 120 seconds. Apr 8 23:57:12 ws45 kernel: [ 4200.410392] Tainted: P OE 4.4.0-177-generic #207-Ubuntu Apr 8 23:57:12 ws45 kernel: [ 4200.410394] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Apr 8 23:57:12 ws45 kernel: [ 4200.410396] ThreadPoolForeg D 00000000 0 5287 3117 0x00000000 Apr 8 23:57:12 ws45 kernel: [ 4200.410400] e50c5d6c 00200086 00000000 00000000 e50c5d58 c13c992f e89ab713 000003b4 Apr 8 23:57:12 ws45 kernel: [ 4200.410407] f5398e00 c1b1da80 e4ee3c00 e50c6000 e4ee3c00 f5896da0 e50c5d78 c17ec5cd Apr 8 23:57:12 ws45 kernel: [ 4200.410414] 000001ff e50c5dc8 c11a8b57 f8e81210 e50c5db4 00000000 ef28c734 e50c5d9c Apr 8 23:57:12 ws45 kernel: [ 4200.410422] Call Trace: Apr 8 23:57:12 ws45 kernel: [ 4200.410426] [<c13c992f>] ? radix_tree_lookup_slot+0x1f/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410429] [<c17ec5cd>] schedule+0x2d/0x80 Apr 8 23:57:12 ws45 kernel: [ 4200.410433] [<c11a8b57>] kmap_high+0x117/0x290 Apr 8 23:57:12 ws45 kernel: [ 4200.410445] [<f8e81210>] ? nfs_atomic_open+0x3e0/0x3e0 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410449] [<c118cdd7>] ? mark_page_accessed+0x67/0xc0 Apr 8 23:57:12 ws45 kernel: [ 4200.410453] [<c117e32b>] ? do_read_cache_page+0x7b/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410456] [<c109ee50>] ? wake_up_q+0x70/0x70 Apr 8 23:57:12 ws45 kernel: [ 4200.410460] [<c106bec0>] kmap+0x40/0x50 Apr 8 23:57:12 ws45 kernel: [ 4200.410473] [<f8e8ec93>] nfs_follow_link+0x53/0x60 [nfs] Apr 8 23:57:12 ws45 kernel: [ 4200.410477] [<c11fbdb4>] link_path_walk+0x464/0x540 Apr 8 23:57:12 ws45 kernel: [ 4200.410481] [<c11fb4c0>] ? path_init+0x210/0x3b0 Apr 8 23:57:12 ws45 kernel: [ 4200.410485] [<c10f83ab>] ? futex_wait+0x1db/0x270 Apr 8 23:57:12 ws45 kernel: [ 4200.410489] [<c11fc1fe>] path_lookupat+0x6e/0xe0 Apr 8 23:57:12 ws45 kernel: [ 4200.410493] [<c11fd9e7>] filename_lookup+0x97/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410498] [<c11fd62a>] ? getname_flags+0x3a/0x1a0 Apr 8 23:57:12 ws45 kernel: [ 4200.410502] [<c11fdbb6>] user_path_at_empty+0x36/0x40 Apr 8 23:57:12 ws45 kernel: [ 4200.410507] [<c11f3140>] vfs_fstatat+0x60/0xb0 Apr 8 23:57:12 ws45 kernel: [ 4200.410510] [<c11f3ba1>] SyS_lstat64+0x31/0x60 Apr 8 23:57:12 ws45 kernel: [ 4200.410514] [<c10fac83>] ? SyS_futex+0x93/0x160 Apr 8 23:57:12 ws45 kernel: [ 4200.410519] [<c100397f>] do_fast_syscall_32+0x9f/0x190 Apr 8 23:57:12 ws45 kernel: [ 4200.410523] [<c17f08b0>] sysenter_past_esp+0x3d/0x61 Apr 8 23:57:12 ws45 kernel: [ 4200.410527] [<c17f0000>] ? _raw_read_unlock_irqrestore+0x20/0x20 |
De server kan het neem ik aan niet zijn, want er is nog een tweede PC (die van moeder) met dezelfde confguratie en die draait vrolijk verder, heeft dit probleem niet. Hardware is ook hetzelfde van beide PC's... een HP 8200 SFF, alleen de mijne heeft een extra videokaart i.p.v. de onboard.