Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
Ik kreeg gisteren plots een melding van mijn Synology kastje dat er een disk heeft gefaald en dat ik die moet vervangen. Ik ben na het maken van wat backups het e.e.a. aan het uitzoeken, wat mij namelijk opvalt is dat de harddisk helemaal geen SMART foutmeldingen geeft. Ik heb natuurlijk ook naar mijn log gekeken, alleen begrijp ik vrij weinig van de foutmeldingen.

Uit het log maak ik op dat de problemen begonnen bij het opstarten van de hardeschijf vanuit de slaapstand. De eerste twee meldingen zijn normaal. Ook foutmeldingen tijdens het wachten op het starten van disks zijn normaal, dit is dan 'SRST failed (errno=-16)'. Dit keer komt hij echter met de melding 'ata2.00: revalidation failed (errno=-2)', en die foutmelding zie ik nergens anders in mijn logs terugkomen. Vervolgens heeft de kernel de disk gedisabled, en is het raid systeem verder gegaan op de andere disk. Alleen de systeempartitie is overigens raid1, dat is namelijk standaard bij Synology.

Even later lijkt de disk alsnog succesvol te zijn opgestart ('ata2: wake up successful, the reset fail can be ignored'), alleen is het mirrored raid inmiddels in een inconsistente staat beland (althans, dat is mijn interpretatie). Op mijn Synology krijg ik een foutmelding dat de systeempartitie moet worden gerepareerd, alle andere partities werken echter wel volkomen normaal en zoals gezegd heeft de disk ook geen enkele SMART foutmelding (terwijl je hardwarematig falen daar wel terug zou moeten zien).

Mijn vragen zijn nu als volgt:
(1) Hoe moet de foutmelding 'revalidation failed' worden geïnterpreteerd?
(2) Denken jullie dat mijn interpretatie dat het probleem softwarematig is (vermoedelijk gerelateerd aan het trage opstarten van de schijf) klopt, en het dus niet te maken heeft met een hardwarematig probleem?

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
Sep 30 01:00:12 Synology1 kernel: [5971916.000000] ata2: wake up from deepsleep, reset link now
Sep 30 01:00:12 Synology1 kernel: [5971916.080000] ata2: device plugged sstatus 0x123
Sep 30 01:00:19 Synology1 kernel: [5971919.960000] ata2.00: revalidation failed (errno=-2)
Sep 30 01:00:19 Synology1 kernel: [5971922.470000] ata2.00: revalidation failed (errno=-2)
Sep 30 01:00:19 Synology1 kernel: [5971924.980000] ata2.00: revalidation failed (errno=-2)
Sep 30 01:00:19 Synology1 kernel: [5971924.980000] ata2.00: disabled
Sep 30 01:00:19 Synology1 kernel: [5971924.990000] sd 1:0:0:0: rejecting I/O to offline device
Sep 30 01:00:19 Synology1 kernel: [5971925.010000] end_request: I/O error, dev sdb, sector 4980608
Sep 30 01:00:19 Synology1 kernel: [5971925.020000] sd 1:0:0:0: rejecting I/O to offline device
Sep 30 01:00:19 Synology1 kernel: [5971925.020000] end_request: I/O error, dev sdb, sector 4980608
Sep 30 01:00:19 Synology1 kernel: [5971925.020000] md: super_written gets error=-5, uptodate=0
Sep 30 01:00:19 Synology1 kernel: [5971925.020000] raid1: Disk failure on sdb1, disabling device. 
Sep 30 01:00:19 Synology1 kernel: [5971925.020000]  Operation continuing on 1 devices
Sep 30 01:00:19 Synology1 kernel: [5971925.040000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.050000]  --- wd:1 rd:2
Sep 30 01:00:19 Synology1 kernel: [5971925.050000]  disk 0, wo:1, o:0, dev:sdb1
Sep 30 01:00:19 Synology1 kernel: [5971925.050000]  disk 1, wo:0, o:1, dev:sda1
Sep 30 01:00:19 Synology1 kernel: [5971925.060000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.060000]  --- wd:1 rd:2
Sep 30 01:00:19 Synology1 kernel: [5971925.060000]  disk 1, wo:0, o:1, dev:sda1
Sep 30 01:00:19 Synology1 kernel: [5971925.130000] sd 1:0:0:0: rejecting I/O to offline device
Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: Disk failure on sdb2, disabling device. 
Sep 30 01:00:19 Synology1 kernel: [5971925.130000]  Operation continuing on 1 devices
Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: sdb2: rescheduling sector 2408
Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: sdb2: rescheduling sector 2416
Sep 30 01:00:19 Synology1 kernel: [5971925.160000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.160000]  --- wd:1 rd:2
Sep 30 01:00:19 Synology1 kernel: [5971925.170000]  disk 0, wo:1, o:0, dev:sdb2
Sep 30 01:00:19 Synology1 kernel: [5971925.170000]  disk 1, wo:0, o:1, dev:sda2
Sep 30 01:00:19 Synology1 kernel: [5971925.170000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.180000]  --- wd:1 rd:2
Sep 30 01:00:19 Synology1 kernel: [5971925.180000]  disk 1, wo:0, o:1, dev:sda2
Sep 30 01:00:19 Synology1 kernel: [5971925.190000] raid1: sda2: redirecting sector 2408 to another mirror
Sep 30 01:00:19 Synology1 kernel: [5971925.200000] raid1: sda2: redirecting sector 2416 to another mirror
Sep 30 01:00:19 Synology1 kernel: [5971925.560000] ata2: wake up successful, the reset fail can be ignored
Sep 30 01:00:19 Synology1 kernel: [5971925.620000] sd 1:0:0:0: [sdb] START_STOP FAILED
Sep 30 01:00:19 Synology1 kernel: [5971925.670000] SynoCheckRdevIsWorking (7925): remove active disk sdb5 from md2 raid_disks 1 mddev->degraded 0 mddev->level 1 
Sep 30 01:00:19 Synology1 kernel: [5971925.680000] raid1: Disk failure on sdb5, disabling device. 
Sep 30 01:00:19 Synology1 kernel: [5971925.680000]  Operation continuing on 0 devices
Sep 30 01:00:19 Synology1 kernel: [5971925.690000] syno_hot_remove_disk (7825): cannot remove active disk sdb5 from md2 ... rdev->raid_disk 0 pending 0
Sep 30 01:00:19 Synology1 kernel: [5971925.700000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.700000]  --- wd:0 rd:1
Sep 30 01:00:19 Synology1 kernel: [5971925.700000]  disk 0, wo:1, o:0, dev:sdb5
Sep 30 01:00:19 Synology1 kernel: [5971925.710000] RAID1 conf printout:
Sep 30 01:00:19 Synology1 kernel: [5971925.710000]  --- wd:0 rd:1
Sep 30 01:00:20 Synology1 kernel: [5971926.710000] SynoCheckRdevIsWorking (7925): remove active disk sdb5 from md2 raid_disks 1 mddev->degraded 1 mddev->level 1 
Sep 30 01:00:20 Synology1 kernel: [5971926.720000] SynoCheckRdevIsWorking (7925): remove active disk sdb2 from md1 raid_disks 2 mddev->degraded 1 mddev->level 1 
Sep 30 01:00:20 Synology1 kernel: [5971926.920000] SynoCheckRdevIsWorking (7925): remove active disk sdb1 from md0 raid_disks 2 mddev->degraded 1 mddev->level 1

Acties:
  • 0 Henk 'm!

  • rikadoo
  • Registratie: Oktober 2007
  • Niet online
Kan je eens een screenshot maken van de SMART waardes? Kan in DSM inloggen, dan opslag en dan bij de disken de integriteitsinfo.

Zie ook: https://help.synology.com...torageManager%2Fdisk.html

[ Voor 27% gewijzigd door rikadoo op 01-10-2015 20:57 ]

AMD Ryzen 7 5900x | Custom WC | ASUS ROG Strix X570-E Gaming | 32GB Corsair DDR4-3600MHz | Samsung 970 nvme 1TB | Samsung 860 EVO 2TB | AMD RX 6900XT 16GB | 1x Asus RoG XG27AQDMG | 1x LG UltraGear 27GL850


Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
rikadoo schreef op donderdag 01 oktober 2015 @ 20:56:
Kan je eens een screenshot maken van de SMART waardes? Kan in DSM inloggen, dan opslag en dan bij de disken de integriteitsinfo.

Zie ook: https://help.synology.com...torageManager%2Fdisk.html
Ja, dat kan. Zoals je ziet is er niets mis.

Smart data Synology

[ Voor 15% gewijzigd door SPT op 01-10-2015 21:20 ]


Acties:
  • 0 Henk 'm!

  • rikadoo
  • Registratie: Oktober 2007
  • Niet online
SPT schreef op donderdag 01 oktober 2015 @ 21:18:
[...]


Ja, dat kan. Zoals je ziet is er niets mis.

[afbeelding]
En de andere disk(en)? En van log center, misschien was er een twijfelende bad sector die uiteindelijk weer goed is gekeurd?

[ Voor 15% gewijzigd door rikadoo op 01-10-2015 21:37 ]

AMD Ryzen 7 5900x | Custom WC | ASUS ROG Strix X570-E Gaming | 32GB Corsair DDR4-3600MHz | Samsung 970 nvme 1TB | Samsung 860 EVO 2TB | AMD RX 6900XT 16GB | 1x Asus RoG XG27AQDMG | 1x LG UltraGear 27GL850


Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
Van de andere 3 disks in mijn 2x DS212+ Synology kastjes heeft er één wel enkele SMART errors, namelijk waarde 24 bij multi zone error rate en 59 bij raw read error rate (maar dat zal losstaan van het huidige probleem). Die 2TB disk heeft het einde van zijn planmatige levensduur bereikt (nu ruim 5 jaar oud), en was ik juist van plan te gaan vervangen voor een 5TB disk. Vandaar dat ik er een beetje tegenop zie, als ik de disk die nu problemen geeft (is juist de nieuwste) ook ga vervangen ben ik 400 euro kwijt aan hardeschijven terwijl ik eigenlijk geen of anders hooguit een klein beetje extra opslagruimte nodig heb (heb nog 1,4TB van de 10,0TB vrij). Ik koop al jaren ongeveer één disk per jaar, zodat de oudste disk in mijn NAS niet ouder dan 4 à 5 jaar oud is. De oudere disks verhuizen dan naar de offline back-up.
rikadoo schreef op donderdag 01 oktober 2015 @ 21:34:
En van log center, misschien was er een twijfelende bad sector die uiteindelijk weer goed is gekeurd?
In het log center is bar weinig te vinden, daar staat alleen dat Volume1 is gecrashed. In de andere logs in /var/log is niet veel terug te vinden over de oorzaken.

[ Voor 46% gewijzigd door SPT op 01-10-2015 22:06 ]


Acties:
  • 0 Henk 'm!

  • rikadoo
  • Registratie: Oktober 2007
  • Niet online
SPT schreef op donderdag 01 oktober 2015 @ 21:42:
Van de andere 3 disks in mijn 2x DS212+ Synology kastjes heeft er één wel enkele SMART errors, namelijk waarde 24 bij multi zone error rate en 59 bij raw read error rate (maar dat zal losstaan van het huidige probleem). Die 2TB disk heeft het einde van zijn planmatige levensduur bereikt (nu ruim 5 jaar oud), en was ik juist van plan te gaan vervangen voor een 5TB disk. Vandaar dat ik er een beetje tegenop zie, als ik de disk die nu problemen geeft (is juist de nieuwste) ook ga vervangen ben ik 400 euro kwijt aan hardeschijven terwijl ik eigenlijk geen of anders hooguit een klein beetje extra opslagruimte nodig heb (heb nog 1,4TB van de 10,0TB vrij). Ik koop al jaren ongeveer één disk per jaar, zodat de oudste disk in mijn NAS niet ouder dan 4 à 5 jaar oud is. De oudere disks verhuizen dan naar de offline back-up.


[...]


In het log center is bar weinig te vinden, daar staat alleen dat Volume1 is gecrashed. In de andere logs in /var/log is niet veel terug te vinden over de oorzaken.
En bij Opslagbeheer endan HDD/SSD --> en dan de verdachte disk -> Integriteitsinfo -> Geschiedenis

AMD Ryzen 7 5900x | Custom WC | ASUS ROG Strix X570-E Gaming | 32GB Corsair DDR4-3600MHz | Samsung 970 nvme 1TB | Samsung 860 EVO 2TB | AMD RX 6900XT 16GB | 1x Asus RoG XG27AQDMG | 1x LG UltraGear 27GL850


Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
rikadoo schreef op donderdag 01 oktober 2015 @ 22:09:
[...]


En bij Opslagbeheer endan HDD/SSD --> en dan de verdachte disk -> Integriteitsinfo -> Geschiedenis
Bij mij zijn er 4 tabbladen 'HDD/SSD', 'Logs' (waar alleen één foutmelding, disk plugged out staat), 'Test Scheduler' en 'General', waarbij in het tab 'HDD/SSD' de knoppen 'Health Info' en 'S.M.A.R.T. Test' aanklikbaar zijn.

Nergens vindt ik iets met Integriteitsinfo...

Acties:
  • 0 Henk 'm!

  • Onbekend
  • Registratie: Juni 2005
  • Nu online

Onbekend

...

Ik zie in de smart-data niets over de sata-aansluiting zelf. Controleer eens de aansluitingen? (Ik heb 1 keer zelf een disk gehad met een vies contact, maar dat stond netjes in de smart-resultaten.)

Speel ook Balls Connect en Repeat


Acties:
  • 0 Henk 'm!

  • rikadoo
  • Registratie: Oktober 2007
  • Niet online
SPT schreef op donderdag 01 oktober 2015 @ 22:16:
[...]


Bij mij zijn er 4 tabbladen 'HDD/SSD', 'Logs' (waar alleen één foutmelding, disk plugged out staat), 'Test Scheduler' en 'General', waarbij in het tab 'HDD/SSD' de knoppen 'Health Info' en 'S.M.A.R.T. Test' aanklikbaar zijn.

Nergens vindt ik iets met Integriteitsinfo...
Health info, en dan history?

AMD Ryzen 7 5900x | Custom WC | ASUS ROG Strix X570-E Gaming | 32GB Corsair DDR4-3600MHz | Samsung 970 nvme 1TB | Samsung 860 EVO 2TB | AMD RX 6900XT 16GB | 1x Asus RoG XG27AQDMG | 1x LG UltraGear 27GL850


Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
Onbekend schreef op donderdag 01 oktober 2015 @ 22:19:
Ik zie in de smart-data niets over de sata-aansluiting zelf. Controleer eens de aansluitingen? (Ik heb 1 keer zelf een disk gehad met een vies contact, maar dat stond netjes in de smart-resultaten.)
Nadat ik alles gebackupt had heb ik het kastje eerst uit elkaar gehaald, de disks eruit gehaald, alles gestofzuigd, en de disks daarna opnieuw geïnstalleerd. Daarna heb ik de boel weer opgestart en heb ik op repair geklikt (wat overigens binnen 1 seconde klaar was). Dus of het te maken had met een slechte verbinding is nu niet meer te achterhalen. Wel behoor je dat zoals jij schrijft terug te zien in de SMART output (heb ooit problemen door een slechte kabel gehad, toen stond de SMART output vol met vele honderden foutmeldingen).
rikadoo schreef op donderdag 01 oktober 2015 @ 22:24:
[...]


Health info, en dan history?
Vreemd, ik heb daar alleen de tabbladen 'Overview' en 'S.M.A.R.T. Info' te staan, nergens iets met history.

[ Voor 13% gewijzigd door SPT op 01-10-2015 22:28 ]


Acties:
  • 0 Henk 'm!

  • rikadoo
  • Registratie: Oktober 2007
  • Niet online
Hmm vaag, heb dit staan:

Afbeeldingslocatie: http://oi58.tinypic.com/29m877c.jpg

Mja als het nu allemaal weer werkt, je hebt geen sectoren die gewisseld zijn maar ook niet actief, je kabels zijn goed geen kabel errors. Dus zou het even in de gaten houden kan er zo niets raars uit opmaken.

AMD Ryzen 7 5900x | Custom WC | ASUS ROG Strix X570-E Gaming | 32GB Corsair DDR4-3600MHz | Samsung 970 nvme 1TB | Samsung 860 EVO 2TB | AMD RX 6900XT 16GB | 1x Asus RoG XG27AQDMG | 1x LG UltraGear 27GL850


Acties:
  • 0 Henk 'm!

  • SPT
  • Registratie: Januari 2007
  • Laatst online: 28-07 23:32
rikadoo schreef op donderdag 01 oktober 2015 @ 22:30:
Hmm vaag, heb dit staan:

[afbeelding]

Mja als het nu allemaal weer werkt, je hebt geen sectoren die gewisseld zijn maar ook niet actief, je kabels zijn goed geen kabel errors. Dus zou het even in de gaten houden kan er zo niets raars uit opmaken.
Ik heb denk ik nog een wat oudere versie van DSM, bij mij staat die info op een andere plaats, en gewoon in tekst weergegeven. Al de 3 error counts staan echter gewoon op 0.

Dank voor het meedenken. Denk inderdaad dat ik het risico maar neem en het nog maar even aankijk.

[ Voor 75% gewijzigd door SPT op 01-10-2015 22:42 ]

Pagina: 1