[ZFS] Disk vervangen: resilver process blijft herstarten?

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Simkin
  • Registratie: Maart 2000
  • Laatst online: 20:22
Ik heb een kapotte disk vervangen met een type die al een tijdje zonder problemen onderdeel is van de pool maar ik zie vanochtend dat hij nog steeds aan het resilveren is. Wat mij meteen opviel is dat de 'since' date/time stamp van nu is. Als ik opnieuw de status opvraag zie ik hetzelfde.

scan: resilver in progress since Thu Jun 1 09:13:27 2017
scan: resilver in progress since Thu Jun 1 09:15:10 2017
scan: resilver in progress since Thu Jun 1 09:18:11 2017
...


Iemand enig idee wat er bij mis gaat en hoe ik het kan oplossen?

root@nas:~# dmesg | grep ZFS
code:
1
[    5.224533] ZFS: Loaded module v0.7.0-rc4_36_g2d82116e8, ZFS pool version 5000, ZFS filesystem version 5


root@nas:~# uname -a
code:
1
Linux nas 4.9.0-0.bpo.3-amd64 #1 SMP Debian 4.9.25-1~bpo8+1 (2017-05-19) x86_64 GNU/Linux


root@nas:~# zpool status
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
  pool: naspool
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Thu Jun  1 09:13:27 2017
        3.52G scanned out of 12.8T at 157M/s, 23h40m to go
        720M resilvered, 0.03% done
config:

        NAME                                   STATE     READ WRITE CKSUM
        naspool                                DEGRADED     0     0     0
          raidz1-0                             DEGRADED     0     0     0
            wwn-0x5000c5005d126ae9             ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75    ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G    ONLINE       0     0     0
            replacing-3                        DEGRADED     0     0     0
              11962083988745856144             UNAVAIL      0     0     0  was /dev/disk/by-id/ata-TOSHIBA_DT01ACA300_45U3NSGGS-part1
              ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8    ONLINE       0     0     0

errors: No known data errors

root@nas:~# zpool status
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
  pool: naspool
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Thu Jun  1 09:15:10 2017
        511M scanned out of 12.8T at 31.9M/s, 116h23m to go
        101M resilvered, 0.00% done
config:

        NAME                                   STATE     READ WRITE CKSUM
        naspool                                DEGRADED     0     0     0
          raidz1-0                             DEGRADED     0     0     0
            wwn-0x5000c5005d126ae9             ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75    ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G    ONLINE       0     0     0
            replacing-3                        DEGRADED     0     0     0
              11962083988745856144             UNAVAIL      0     0     0  was /dev/disk/by-id/ata-TOSHIBA_DT01ACA300_45U3NSGGS-part1
              ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8    ONLINE       0     0     0

errors: No known data errors

root@nas:~# zpool status
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
  pool: naspool
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Thu Jun  1 09:18:11 2017
        40.0M scanned out of 12.8T at 3.34M/s, (scan is slow, no estimated time)
        7.78M resilvered, 0.00% done
config:

        NAME                                   STATE     READ WRITE CKSUM
        naspool                                DEGRADED     0     0     0
          raidz1-0                             DEGRADED     0     0     0
            wwn-0x5000c5005d126ae9             ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75    ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G    ONLINE       0     0     0
            replacing-3                        DEGRADED     0     0     0
              11962083988745856144             UNAVAIL      0     0     0  was /dev/disk/by-id/ata-TOSHIBA_DT01ACA300_45U3NSGGS-part1
              ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8    ONLINE       0     0     0

errors: No known data errors


root@nas:~# ls -altr /dev/disk/by-id/
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
total 0
drwxr-xr-x 8 root root 160 May 31 20:08 ..
drwxr-xr-x 2 root root 800 May 31 20:08 .
lrwxrwxrwx 1 root root   9 Jun  1 09:19 wwn-0x5001b44a10bb94af -> ../../sda
lrwxrwxrwx 1 root root   9 Jun  1 09:19 ata-SanDisk_SDSSDP128G_133230401711 -> ../../sda
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5001b44a10bb94af-part5 -> ../../sda5
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5001b44a10bb94af-part2 -> ../../sda2
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5001b44a10bb94af-part1 -> ../../sda1
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-SanDisk_SDSSDP128G_133230401711-part5 -> ../../sda5
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-SanDisk_SDSSDP128G_133230401711-part2 -> ../../sda2
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-SanDisk_SDSSDP128G_133230401711-part1 -> ../../sda1
lrwxrwxrwx 1 root root   9 Jun  1 09:19 wwn-0x5000c500646bb32a -> ../../sdc
lrwxrwxrwx 1 root root   9 Jun  1 09:19 ata-ST3000DM001-1CH166_Z1F3LC75 -> ../../sdc
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5000c500646bb32a-part1 -> ../../sdc1
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-ST3000DM001-1CH166_Z1F3LC75-part1 -> ../../sdc1
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5000c500646bb32a-part9 -> ../../sdc9
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-ST3000DM001-1CH166_Z1F3LC75-part9 -> ../../sdc9
lrwxrwxrwx 1 root root   9 Jun  1 09:19 wwn-0x5000c500a2ef74a9 -> ../../sde
lrwxrwxrwx 1 root root   9 Jun  1 09:19 ata-ST4000DM005-2DP166_ZDH1L31E -> ../../sde
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5000c500a2ef74a9-part9 -> ../../sde9
lrwxrwxrwx 1 root root  10 Jun  1 09:19 wwn-0x5000c500a2ef74a9-part1 -> ../../sde1
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-ST4000DM005-2DP166_ZDH1L31E-part9 -> ../../sde9
lrwxrwxrwx 1 root root  10 Jun  1 09:19 ata-ST4000DM005-2DP166_ZDH1L31E-part1 -> ../../sde1
lrwxrwxrwx 1 root root   9 Jun  1 09:20 wwn-0x5000c500a2a93310 -> ../../sdd
lrwxrwxrwx 1 root root   9 Jun  1 09:20 ata-ST4000DM005-2DP166_ZDH1BA2G -> ../../sdd
lrwxrwxrwx 1 root root  10 Jun  1 09:20 wwn-0x5000c500a2a93310-part1 -> ../../sdd1
lrwxrwxrwx 1 root root  10 Jun  1 09:20 ata-ST4000DM005-2DP166_ZDH1BA2G-part1 -> ../../sdd1
lrwxrwxrwx 1 root root  10 Jun  1 09:20 wwn-0x5000c500a2a93310-part9 -> ../../sdd9
lrwxrwxrwx 1 root root  10 Jun  1 09:20 ata-ST4000DM005-2DP166_ZDH1BA2G-part9 -> ../../sdd9
lrwxrwxrwx 1 root root   9 Jun  1 09:21 wwn-0x5000c5005d1119cc -> ../../sdf
lrwxrwxrwx 1 root root   9 Jun  1 09:21 ata-ST3000DM001-1CH166_W1F517W8 -> ../../sdf
lrwxrwxrwx 1 root root  10 Jun  1 09:21 wwn-0x5000c5005d1119cc-part1 -> ../../sdf1
lrwxrwxrwx 1 root root  10 Jun  1 09:21 ata-ST3000DM001-1CH166_W1F517W8-part1 -> ../../sdf1
lrwxrwxrwx 1 root root  10 Jun  1 09:21 wwn-0x5000c5005d1119cc-part9 -> ../../sdf9
lrwxrwxrwx 1 root root  10 Jun  1 09:21 ata-ST3000DM001-1CH166_W1F517W8-part9 -> ../../sdf9
lrwxrwxrwx 1 root root   9 Jun  1 09:21 wwn-0x5000c5005d126ae9 -> ../../sdb
lrwxrwxrwx 1 root root   9 Jun  1 09:21 ata-ST3000DM001-1ER166_Z500CKWL -> ../../sdb
lrwxrwxrwx 1 root root  10 Jun  1 09:21 wwn-0x5000c5005d126ae9-part1 -> ../../sdb1
lrwxrwxrwx 1 root root  10 Jun  1 09:21 ata-ST3000DM001-1ER166_Z500CKWL-part1 -> ../../sdb1
lrwxrwxrwx 1 root root  10 Jun  1 09:21 wwn-0x5000c5005d126ae9-part9 -> ../../sdb9
lrwxrwxrwx 1 root root  10 Jun  1 09:21 ata-ST3000DM001-1ER166_Z500CKWL-part9 -> ../../sdb9

Acties:
  • 0 Henk 'm!

  • Kortfragje
  • Registratie: December 2000
  • Laatst online: 06-09 23:51

Kortfragje

......

Ondertussen meer succes?

Ik heb dit zelf niet ervaren. Misschien een kabel die niet goed vast zit?

http://www.gjpvanwesten.nl


Acties:
  • 0 Henk 'm!

  • Simkin
  • Registratie: Maart 2000
  • Laatst online: 20:22
Dat is het helaas niet, heb de drive al gewisseld met een ander slot. Snap er werkelijk niets van :(

Acties:
  • 0 Henk 'm!

  • CurlyMo
  • Registratie: Februari 2011
  • Laatst online: 22:26
Probeer het eens met een FreeBSD live CD, misschien dat het in ZFS-on-linux zit. Zie ook https://github.com/zfsonlinux/zfs/issues/840

Ik denk overigens ook dat het een hardware probleem van ofwel je kabels, je harde schijf, je controller of je geheugen is. Wat zegt je kernel log verder?

Een kleine zoektocht op google geeft meerdere gebruikers met hetzelfde probleem. Heb je de mogelijke onderzoeksrichtingen uit die resultaten al geprobeerd?

[Edit]
Waar is overigens de oorspronkelijke HDD gebleven die je aan het vervangen bent?

[ Voor 40% gewijzigd door CurlyMo op 03-06-2017 17:44 ]

Sinds de 2 dagen regel reageer ik hier niet meer


Acties:
  • 0 Henk 'm!

  • Simkin
  • Registratie: Maart 2000
  • Laatst online: 20:22
Ga ik proberen, ik denk echter niet dat het een kabel probleem is omdat ik de drive bays geswapped heb en het probleem blijft gelokaliseerd tot deze nieuwe disk

Ik zie nu ook dat de drive automatisch online wordt gezet nadat ik hem vlak daarvoor offline heb gehaald, is dat logisch te verklaren?

edit: ik heb de kapotte drive nog liggen. Mbt google, iemand gaf aan dat de drive wel resilvered als hij offline is, dat lijkt bij mij niet te werken, zie onder:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
root@nas:~# zpool status
  pool: naspool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Jun  3 17:41:00 2017
        4.00G scanned out of 12.8T at 195M/s, 19h2m to go
        818M resilvered, 0.03% done
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              ONLINE       0     0     0
          raidz1-0                           ONLINE       0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors
root@nas:~# zpool offline naspool ata-ST4000DM005-2DP166_ZDH1L31E
root@nas:~# zpool status
  pool: naspool
 state: DEGRADED
status: One or more devices has been taken offline by the administrator.
        Sufficient replicas exist for the pool to continue functioning in a
        degraded state.
action: Online the device using 'zpool online' or replace the device with
        'zpool replace'.
  scan: scrub in progress since Sat Jun  3 17:41:36 2017
        24.5M scanned out of 12.8T at 2.45M/s, (scan is slow, no estimated time)
        0B repaired, 0.00% done
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              DEGRADED     0     0     0
          raidz1-0                           DEGRADED     0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  OFFLINE      0     0     0
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors
root@nas:~# zpool scrub -s naspool
root@nas:~# zpool status
  pool: naspool
 state: DEGRADED
status: One or more devices has been taken offline by the administrator.
        Sufficient replicas exist for the pool to continue functioning in a
        degraded state.
action: Online the device using 'zpool online' or replace the device with
        'zpool replace'.
  scan: scrub canceled on Sat Jun  3 17:41:53 2017
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              DEGRADED     0     0     0
          raidz1-0                           DEGRADED     0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  OFFLINE      0     0     0
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors
root@nas:~# zpool status
  pool: naspool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Jun  3 17:42:14 2017
        1B scanned out of 12.8T at 1B/s, (scan is slow, no estimated time)
        0B resilvered, 0.00% done
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              ONLINE       0     0     0
          raidz1-0                           ONLINE       0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors

Acties:
  • 0 Henk 'm!

  • CurlyMo
  • Registratie: Februari 2011
  • Laatst online: 22:26
De huidige status geeft aan dat het nu toch gelukt is? Die scrub lijkt me zinvol want ik zou je huidige HDD niet zomaar vertrouwen.

Sinds de 2 dagen regel reageer ik hier niet meer


Acties:
  • 0 Henk 'm!

  • Simkin
  • Registratie: Maart 2000
  • Laatst online: 20:22
Het probleem is dat het resilveren blijft herstarten, zie:

scan: resilver in progress since Sat Jun 3 17:51:10 2017
scan: resilver in progress since Sat Jun 3 17:51:42 2017

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
root@nas:~# date
Sat Jun  3 17:51:24 CEST 2017
root@nas:~# zpool status
  pool: naspool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Jun  3 17:51:10 2017
        593M scanned out of 12.8T at 37.1M/s, 100h10m to go
        118M resilvered, 0.00% done
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              ONLINE       0     0     0
          raidz1-0                           ONLINE       0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors
root@nas:~# date
Sat Jun  3 17:51:47 CEST 2017
root@nas:~# zpool status
  pool: naspool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Jun  3 17:51:42 2017
        37.8M scanned out of 12.8T at 4.20M/s, (scan is slow, no estimated time)
        7.09M resilvered, 0.00% done
config:

        NAME                                 STATE     READ WRITE CKSUM
        naspool                              ONLINE       0     0     0
          raidz1-0                           ONLINE       0     0     0
            wwn-0x5000c5005d126ae9           ONLINE       0     0     0
            ata-ST3000DM001-1CH166_Z1F3LC75  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1BA2G  ONLINE       0     0     0
            ata-ST4000DM005-2DP166_ZDH1L31E  ONLINE       0     0     0  (resilvering)
            ata-ST3000DM001-1CH166_W1F517W8  ONLINE       0     0     0

errors: No known data errors

Acties:
  • 0 Henk 'm!

  • Kortfragje
  • Registratie: December 2000
  • Laatst online: 06-09 23:51

Kortfragje

......

Tjah, het kan natuurlijk ook de vervangende drive zijn...

http://www.gjpvanwesten.nl


Acties:
  • 0 Henk 'm!

  • GioStyle
  • Registratie: Januari 2010
  • Laatst online: 23:03
Het komt op mij over alsof de vervangende schijf ook niet goed is.

Acties:
  • 0 Henk 'm!

  • Simkin
  • Registratie: Maart 2000
  • Laatst online: 20:22
Ik denk dat jullie beiden gelijk hebben. Heb mijn pool opnieuw aangemaakt, toen alles leeg was niets aan de hand. Nadat er weer op geschreven werd faalde dezelfde disk. Geen SMART errors dus wel een vreemde zaak vind ik.

Zojuist de disk vervangen met wederom een nieuwe drive (WD ipv SG) en nu gaat het resilver proces gewoon door. Hopelijk kan ik de disk zonder problemen RMA-en

Bedankt voor het meedenken allemaal!

Acties:
  • 0 Henk 'm!

  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

Simkin schreef op maandag 5 juni 2017 @ 13:27:
Geen SMART errors dus wel een vreemde zaak vind ik.

Hopelijk kan ik de disk zonder problemen RMA-en
Afhankelijk van hoe bekend de winkel is met ZFS en de problemen die je daarmee kan hebben, denk ik dat het gebrek aan SMART-errors mogelijk roet in het eten gaat gooien. Kun je die schijf niet beter even direct aan een Windows-(of Linux-)pc hangen, voorzien van een partitie met NTFS of EXT4 en deze dan vol schrijven met files en dan kijken of er fouten optreden? Dan weet je in ieder geval of het ZFS-specifiek is of dat het op een andere manier ook mis gaat. Desnoods even de diagnose tool van de fabrikant er op los laten.

[ Voor 7% gewijzigd door Raven op 05-06-2017 14:00 ]

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde

Pagina: 1