Ik kreeg gisteren plots een melding van mijn Synology kastje dat er een disk heeft gefaald en dat ik die moet vervangen. Ik ben na het maken van wat backups het e.e.a. aan het uitzoeken, wat mij namelijk opvalt is dat de harddisk helemaal geen SMART foutmeldingen geeft. Ik heb natuurlijk ook naar mijn log gekeken, alleen begrijp ik vrij weinig van de foutmeldingen.
Uit het log maak ik op dat de problemen begonnen bij het opstarten van de hardeschijf vanuit de slaapstand. De eerste twee meldingen zijn normaal. Ook foutmeldingen tijdens het wachten op het starten van disks zijn normaal, dit is dan 'SRST failed (errno=-16)'. Dit keer komt hij echter met de melding 'ata2.00: revalidation failed (errno=-2)', en die foutmelding zie ik nergens anders in mijn logs terugkomen. Vervolgens heeft de kernel de disk gedisabled, en is het raid systeem verder gegaan op de andere disk. Alleen de systeempartitie is overigens raid1, dat is namelijk standaard bij Synology.
Even later lijkt de disk alsnog succesvol te zijn opgestart ('ata2: wake up successful, the reset fail can be ignored'), alleen is het mirrored raid inmiddels in een inconsistente staat beland (althans, dat is mijn interpretatie). Op mijn Synology krijg ik een foutmelding dat de systeempartitie moet worden gerepareerd, alle andere partities werken echter wel volkomen normaal en zoals gezegd heeft de disk ook geen enkele SMART foutmelding (terwijl je hardwarematig falen daar wel terug zou moeten zien).
Mijn vragen zijn nu als volgt:
(1) Hoe moet de foutmelding 'revalidation failed' worden geïnterpreteerd?
(2) Denken jullie dat mijn interpretatie dat het probleem softwarematig is (vermoedelijk gerelateerd aan het trage opstarten van de schijf) klopt, en het dus niet te maken heeft met een hardwarematig probleem?
Uit het log maak ik op dat de problemen begonnen bij het opstarten van de hardeschijf vanuit de slaapstand. De eerste twee meldingen zijn normaal. Ook foutmeldingen tijdens het wachten op het starten van disks zijn normaal, dit is dan 'SRST failed (errno=-16)'. Dit keer komt hij echter met de melding 'ata2.00: revalidation failed (errno=-2)', en die foutmelding zie ik nergens anders in mijn logs terugkomen. Vervolgens heeft de kernel de disk gedisabled, en is het raid systeem verder gegaan op de andere disk. Alleen de systeempartitie is overigens raid1, dat is namelijk standaard bij Synology.
Even later lijkt de disk alsnog succesvol te zijn opgestart ('ata2: wake up successful, the reset fail can be ignored'), alleen is het mirrored raid inmiddels in een inconsistente staat beland (althans, dat is mijn interpretatie). Op mijn Synology krijg ik een foutmelding dat de systeempartitie moet worden gerepareerd, alle andere partities werken echter wel volkomen normaal en zoals gezegd heeft de disk ook geen enkele SMART foutmelding (terwijl je hardwarematig falen daar wel terug zou moeten zien).
Mijn vragen zijn nu als volgt:
(1) Hoe moet de foutmelding 'revalidation failed' worden geïnterpreteerd?
(2) Denken jullie dat mijn interpretatie dat het probleem softwarematig is (vermoedelijk gerelateerd aan het trage opstarten van de schijf) klopt, en het dus niet te maken heeft met een hardwarematig probleem?
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
| Sep 30 01:00:12 Synology1 kernel: [5971916.000000] ata2: wake up from deepsleep, reset link now Sep 30 01:00:12 Synology1 kernel: [5971916.080000] ata2: device plugged sstatus 0x123 Sep 30 01:00:19 Synology1 kernel: [5971919.960000] ata2.00: revalidation failed (errno=-2) Sep 30 01:00:19 Synology1 kernel: [5971922.470000] ata2.00: revalidation failed (errno=-2) Sep 30 01:00:19 Synology1 kernel: [5971924.980000] ata2.00: revalidation failed (errno=-2) Sep 30 01:00:19 Synology1 kernel: [5971924.980000] ata2.00: disabled Sep 30 01:00:19 Synology1 kernel: [5971924.990000] sd 1:0:0:0: rejecting I/O to offline device Sep 30 01:00:19 Synology1 kernel: [5971925.010000] end_request: I/O error, dev sdb, sector 4980608 Sep 30 01:00:19 Synology1 kernel: [5971925.020000] sd 1:0:0:0: rejecting I/O to offline device Sep 30 01:00:19 Synology1 kernel: [5971925.020000] end_request: I/O error, dev sdb, sector 4980608 Sep 30 01:00:19 Synology1 kernel: [5971925.020000] md: super_written gets error=-5, uptodate=0 Sep 30 01:00:19 Synology1 kernel: [5971925.020000] raid1: Disk failure on sdb1, disabling device. Sep 30 01:00:19 Synology1 kernel: [5971925.020000] Operation continuing on 1 devices Sep 30 01:00:19 Synology1 kernel: [5971925.040000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.050000] --- wd:1 rd:2 Sep 30 01:00:19 Synology1 kernel: [5971925.050000] disk 0, wo:1, o:0, dev:sdb1 Sep 30 01:00:19 Synology1 kernel: [5971925.050000] disk 1, wo:0, o:1, dev:sda1 Sep 30 01:00:19 Synology1 kernel: [5971925.060000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.060000] --- wd:1 rd:2 Sep 30 01:00:19 Synology1 kernel: [5971925.060000] disk 1, wo:0, o:1, dev:sda1 Sep 30 01:00:19 Synology1 kernel: [5971925.130000] sd 1:0:0:0: rejecting I/O to offline device Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: Disk failure on sdb2, disabling device. Sep 30 01:00:19 Synology1 kernel: [5971925.130000] Operation continuing on 1 devices Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: sdb2: rescheduling sector 2408 Sep 30 01:00:19 Synology1 kernel: [5971925.130000] raid1: sdb2: rescheduling sector 2416 Sep 30 01:00:19 Synology1 kernel: [5971925.160000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.160000] --- wd:1 rd:2 Sep 30 01:00:19 Synology1 kernel: [5971925.170000] disk 0, wo:1, o:0, dev:sdb2 Sep 30 01:00:19 Synology1 kernel: [5971925.170000] disk 1, wo:0, o:1, dev:sda2 Sep 30 01:00:19 Synology1 kernel: [5971925.170000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.180000] --- wd:1 rd:2 Sep 30 01:00:19 Synology1 kernel: [5971925.180000] disk 1, wo:0, o:1, dev:sda2 Sep 30 01:00:19 Synology1 kernel: [5971925.190000] raid1: sda2: redirecting sector 2408 to another mirror Sep 30 01:00:19 Synology1 kernel: [5971925.200000] raid1: sda2: redirecting sector 2416 to another mirror Sep 30 01:00:19 Synology1 kernel: [5971925.560000] ata2: wake up successful, the reset fail can be ignored Sep 30 01:00:19 Synology1 kernel: [5971925.620000] sd 1:0:0:0: [sdb] START_STOP FAILED Sep 30 01:00:19 Synology1 kernel: [5971925.670000] SynoCheckRdevIsWorking (7925): remove active disk sdb5 from md2 raid_disks 1 mddev->degraded 0 mddev->level 1 Sep 30 01:00:19 Synology1 kernel: [5971925.680000] raid1: Disk failure on sdb5, disabling device. Sep 30 01:00:19 Synology1 kernel: [5971925.680000] Operation continuing on 0 devices Sep 30 01:00:19 Synology1 kernel: [5971925.690000] syno_hot_remove_disk (7825): cannot remove active disk sdb5 from md2 ... rdev->raid_disk 0 pending 0 Sep 30 01:00:19 Synology1 kernel: [5971925.700000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.700000] --- wd:0 rd:1 Sep 30 01:00:19 Synology1 kernel: [5971925.700000] disk 0, wo:1, o:0, dev:sdb5 Sep 30 01:00:19 Synology1 kernel: [5971925.710000] RAID1 conf printout: Sep 30 01:00:19 Synology1 kernel: [5971925.710000] --- wd:0 rd:1 Sep 30 01:00:20 Synology1 kernel: [5971926.710000] SynoCheckRdevIsWorking (7925): remove active disk sdb5 from md2 raid_disks 1 mddev->degraded 1 mddev->level 1 Sep 30 01:00:20 Synology1 kernel: [5971926.720000] SynoCheckRdevIsWorking (7925): remove active disk sdb2 from md1 raid_disks 2 mddev->degraded 1 mddev->level 1 Sep 30 01:00:20 Synology1 kernel: [5971926.920000] SynoCheckRdevIsWorking (7925): remove active disk sdb1 from md0 raid_disks 2 mddev->degraded 1 mddev->level 1 |