Ik heb sinds de zomer van 2003 een computer met een Maxtor (P)ATA hardeschijf, de Maxtor 6Y120L0. De computer heeft sinds oktober 2004 zo goed als altijd aan gestaan, maar de harde schijf heeft lang niet al die tijd ook iets moeten lezen/schrijven. Sinds het begin van 2006 heb ik Linux erop gezet, Debian Testing. Dit ging best wel een tijdje goed, maar na verloop van tijd ging hij steeds vreemder doen. Zo sloeg hij heel vaak vast, vooral als ik Konqueror en/of amaroK tegelijk draaide. In zo'n geval wilde de computer echt nergens meer op reageren, en was de enige manier die ik nog zag om hem weer aan de praat te krijgen, de "reset" knop indrukken. Natuurlijk gaf Linux daarna bij het opstarten aan dat me ReiserFS partitie corrupt was, en ging het vrolijk herstellen, waarna ik weer lekker verder kon gaan met de computer. Deze keer ging dat echter niet zo makkelijk.
Hij sloeg dus weer een keer vast, waarna ik dus op de reset knop drukte. Toen het opstarten zonder problemen bij Grub stage 1.5 was aangekomen, werd het al vreemd. Hij deed er namelijk erg lang over om te laden naar het menu (zo'n 2 minuten, waar hij normaal gesproken maar een paar seconden nodig heeft). In het menu aangekomen, leek alles weer soepel verder te kunnen, maar toen hij Debian wou gaan laden, deed hij eerst
Bij het opstarten duurde het scannen op schijven al erg lang (ik gok zo'n kwartier). Toen Knoppix was opgestart naar KDE, zag ik dat waar normaal 2 partities stonden, nu alleen nog maar hda stond, en als ik die probeer te openen, krijg ik
maar dat is op zich niet raar, want hda is natuurlijk geen partitie. Als ik fdisk probeer, schiet ik ook niet veel op:
Als ik SMART wil gebruiken, door de software van http://smartmontools.sourceforge.net/ te installeren, krijg ik de volgende output:
Maar ik zelf kan daar niet echt veel mee.
Nu is mijn echte vraag dus: kan ik nog bestanden redden op een of andere manier van deze harde schijf, of kan ik hem beter opgeven (wat niet zo leuk zou zijn, want ik moet een aantal dingen die op die schijf staan inleveren op school, maar ik heb geen backups)?
edit: ik doe nu ook even een long self-test, resultaten over een uurtje klaar
edit: ik denk dat ie nu klaar is met de long self-test, ik kan d'r alleen (zelf) helemaal niks mee
:
(nog een) edit: het MoBo piept 1x bij het opstarten, en bij het opstarten (voor Grub/Knoppix word geladen) wordt gewoon aangegeven welke HDD ik heb
edit: Na alleen gedaan te hebben wat hierboven staat, heb ik nog een keer geprobeerd naar Debian te booten. Grub laadde nu gewoon snel, en ook Debian leek er opeens veel meer zin in te hebben. Er kwamen echter opeen allemaal foutmeldingen dat sectoren corrupt waren e.d. Debian kon blijkbaar niet meer normaal opstarten, want het startte een console met een read-only mount van mijn harde schijf, met de aanwijzing fsck te draaien. Ik deed dat dus, op /dev/hda1:
Ik vond het er nu al wat beter uitzien, want ik leek ook gewoon weer op me hda1 te kunne browsen. Dus ik startte Knoppix weer op. Dit ging nu al veel sneller dan toen het net verkeerd was gegaan. Ik deed nog een keer fsck, met ongeveer dezelfde output als hierboven net. Ook kunnen hda1 (reiserfs3) en hda2 (ntfs) nu weer gewoon gezien worden op de desktop, en ook mounten lijkt niet moeilijk te doen.
Ik wilde ook even ntfsck (fsck voor ntfs-partities) draaien, maar omdat die nog steeds niet beschikbaar is in de ntfsprogs package, doe ik ntfsresize -fi /dev/hdXY zoals aangeraden wordt op wiki.linux-ntfs.org:
Het lijkt er dus op (voor mij iig) dat de NTFS partitie onaangetast is gebleven, waar ik heel erg blij mee ben, aangezien daar al mijn data opstaat.
Aangezien ik toch al een nieuwe harde schijf wou aanschaffen, is het goed genoeg als alles weer leesbaar is, en het lijkt erop dat dat in ieder geval nu zo is. Ik blijf echter nog met een paar vragen achter...
- De fsck van hda1 (ReiserFS) nog steeds een beetje raar bij met de resultaten van mijn NTFS. Het lijkt me sterk dat de ene partitie helemaal verkloot kan zijn met bad sectors enzo, terwijl de andere nog helemaal goed lijkt
- Ligt mijn harde schijf nu toch echt op sterven, zoals mijn SMART controle-tool vond (en nog steeds vindt trouwens)?
- Is het misschien een fout in de software geweest? (lijkt me zelf sterk, aangezien er bad sectors kwamen)
Hij sloeg dus weer een keer vast, waarna ik dus op de reset knop drukte. Toen het opstarten zonder problemen bij Grub stage 1.5 was aangekomen, werd het al vreemd. Hij deed er namelijk erg lang over om te laden naar het menu (zo'n 2 minuten, waar hij normaal gesproken maar een paar seconden nodig heeft). In het menu aangekomen, leek alles weer soepel verder te kunnen, maar toen hij Debian wou gaan laden, deed hij eerst
code:
, maar na een tijdje te wachten gaf hij error 25 terug. Even nakijken op de Grub website gaf aan:1
| root(0,0) |
Dat vond ik al niet echt leuk klinken. Na nog 2x proberen op te starten, stopte ik mijn toevallig vers-gebrande Knoppix 5 DVD in me computer, om daarmee verder te gaan proberen.25 : Disk read error
This error is returned if there is a disk read error when trying to probe or read data from a particular disk.
Bij het opstarten duurde het scannen op schijven al erg lang (ik gok zo'n kwartier). Toen Knoppix was opgestart naar KDE, zag ik dat waar normaal 2 partities stonden, nu alleen nog maar hda stond, en als ik die probeer te openen, krijg ik
code:
1
2
3
| Could not mount device. The reported error was: mount: I could not determine the filesystem type, and none was specified |
maar dat is op zich niet raar, want hda is natuurlijk geen partitie. Als ik fdisk probeer, schiet ik ook niet veel op:
code:
1
2
3
| knoppix@2[knoppix]$ fdisk /dev/hda Unable to open /dev/hda |
Als ik SMART wil gebruiken, door de software van http://smartmontools.sourceforge.net/ te installeren, krijg ik de volgende output:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
| root@1[~]# smartctl -a /dev/hda
smartctl version 5.26 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Device Model: Maxtor 6Y120L0
Serial Number: Y31SBLGE
Firmware Version: YAR41BW0
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Tue Apr 4 19:06:48 2006 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
See vendor-specific Attribute list for failed Attributes.
General SMART Values:
Offline data collection status: (0x80) Offline data collection activity was
never started.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 242) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off supp
ort.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 54) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_
FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 202 202 063 Pre-fail Always -
12183
4 Start_Stop_Count 0x0032 253 253 000 Old_age Always -
608
5 Reallocated_Sector_Ct 0x0033 001 001 063 Pre-fail Always FAILI
NG_NOW 2556
6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail Offline -
0
7 Seek_Error_Rate 0x000a 253 252 000 Old_age Always -
0
8 Seek_Time_Performance 0x0027 253 242 187 Pre-fail Always -
62206
9 Power_On_Minutes 0x0032 222 222 000 Old_age Always -
72h+55m
10 Spin_Retry_Count 0x002b 253 252 157 Pre-fail Always -
0
11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail Always -
0
12 Power_Cycle_Count 0x0032 251 251 000 Old_age Always -
992
192 Power-Off_Retract_Count 0x0032 253 253 000 Old_age Always -
0
193 Load_Cycle_Count 0x0032 253 253 000 Old_age Always -
0
194 Temperature_Celsius 0x0032 253 253 000 Old_age Always -
31
195 Hardware_ECC_Recovered 0x000a 253 252 000 Old_age Always -
4554
196 Reallocated_Event_Count 0x0008 216 216 000 Old_age Offline -
37
197 Current_Pending_Sector 0x0008 249 249 000 Old_age Offline -
41
198 Offline_Uncorrectable 0x0008 242 242 000 Old_age Offline -
11
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age Offline -
0
200 Multi_Zone_Error_Rate 0x000a 253 252 000 Old_age Always -
0
201 Soft_Read_Error_Rate 0x000a 253 252 000 Old_age Always -
7
202 TA_Increase_Count 0x000a 253 001 000 Old_age Always -
0
203 Run_Out_Cancel 0x000b 253 248 180 Pre-fail Always -
1
204 Shock_Count_Write_Opern 0x000a 253 177 000 Old_age Always -
0
205 Shock_Rate_Write_Opern 0x000a 253 252 000 Old_age Always -
0
207 Spin_High_Current 0x002a 253 252 000 Old_age Always -
0
208 Spin_Buzz 0x002a 253 252 000 Old_age Always -
0
209 Offline_Seek_Performnce 0x0024 193 193 000 Old_age Offline -
0
99 Unknown_Attribute 0x0004 253 253 000 Old_age Offline -
0
100 Unknown_Attribute 0x0004 253 253 000 Old_age Offline -
0
101 Unknown_Attribute 0x0004 253 253 000 Old_age Offline -
0
SMART Error Log Version: 1
Warning: ATA error count 1253 inconsistent with error log pointer 5
ATA Error Count: 1253 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Timestamp = decimal seconds since the previous disk power-on.
Note: timestamp "wraps" after 2^32 msec = 49.710 days.
Error 1253 occurred at disk power-on lifetime: 10307 hours
When the command that caused the error occurred, the device was in an unknown
state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 03 84 00 00 e0 Error: UNC
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
20 00 08 80 00 00 e0 08 391748.352 READ SECTOR(S)
20 00 88 00 00 00 e0 08 391739.504 READ SECTOR(S)
20 00 08 00 f7 4f ee 08 391739.504 READ SECTOR(S)
e7 00 00 00 00 00 e0 08 388005.680 FLUSH CACHE
20 00 02 9e e1 c2 e0 08 388004.272 READ SECTOR(S)
Error 1252 occurred at disk power-on lifetime: 10307 hours
When the command that caused the error occurred, the device was in an unknown
state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 02 85 00 00 e0 Error: UNC
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
20 00 88 00 00 00 e0 08 391739.504 READ SECTOR(S)
20 00 08 00 f7 4f ee 08 391739.504 READ SECTOR(S)
e7 00 00 00 00 00 e0 08 388005.680 FLUSH CACHE
20 00 02 9e e1 c2 e0 08 388004.272 READ SECTOR(S)
20 00 08 78 f5 4f ee 08 388001.488 READ SECTOR(S)
Error 1251 occurred at disk power-on lifetime: 10306 hours
When the command that caused the error occurred, the device was in an unknown
state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 01 9e e1 c2 e0 Error: UNC
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
20 00 02 9e e1 c2 e0 08 387999.776 READ SECTOR(S)
20 00 08 f0 f5 4f ee 08 387998.768 READ SECTOR(S)
20 00 06 9a e1 c2 e0 08 387994.832 READ SECTOR(S)
20 00 18 25 d0 b9 e0 08 387994.832 READ SECTOR(S)
20 00 26 ff cf b9 e0 08 387994.832 READ SECTOR(S)
Error 1250 occurred at disk power-on lifetime: 10306 hours
When the command that caused the error occurred, the device was in an unknown
state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 08 f0 f5 4f ee Error: UNC
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
20 00 08 f0 f5 4f ee 08 387998.768 READ SECTOR(S)
20 00 06 9a e1 c2 e0 08 387994.832 READ SECTOR(S)
20 00 18 25 d0 b9 e0 08 387994.832 READ SECTOR(S)
20 00 26 ff cf b9 e0 08 387994.832 READ SECTOR(S)
20 00 02 fd cf b9 e0 08 387994.832 READ SECTOR(S)
Error 1249 occurred at disk power-on lifetime: 10306 hours
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 59 02 9d e1 c2 e0 Error: UNC
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name
-- -- -- -- -- -- -- -- --------- --------------------
20 00 06 9a e1 c2 e0 08 387994.832 READ SECTOR(S)
20 00 18 25 d0 b9 e0 08 387994.832 READ SECTOR(S)
20 00 26 ff cf b9 e0 08 387994.832 READ SECTOR(S)
20 00 02 fd cf b9 e0 08 387994.832 READ SECTOR(S)
20 00 20 dd cf b9 e0 08 387994.816 READ SECTOR(S)
SMART Self-test log structure revision number 1
No self-tests have been logged. [Use the smartctl -t option to run these.] |
Maar ik zelf kan daar niet echt veel mee.
Nu is mijn echte vraag dus: kan ik nog bestanden redden op een of andere manier van deze harde schijf, of kan ik hem beter opgeven (wat niet zo leuk zou zijn, want ik moet een aantal dingen die op die schijf staan inleveren op school, maar ik heb geen backups)?
offtopic:
Beetje lang verhaal, maar ik denk dat alles erin nog wel nuttig kan zijn
Beetje lang verhaal, maar ik denk dat alles erin nog wel nuttig kan zijn
edit: ik doe nu ook even een long self-test, resultaten over een uurtje klaar
edit: ik denk dat ie nu klaar is met de long self-test, ik kan d'r alleen (zelf) helemaal niks mee
code:
1
2
3
| SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 40% 10309 0x00038df8 |
(nog een) edit: het MoBo piept 1x bij het opstarten, en bij het opstarten (voor Grub/Knoppix word geladen) wordt gewoon aangegeven welke HDD ik heb
edit: Na alleen gedaan te hebben wat hierboven staat, heb ik nog een keer geprobeerd naar Debian te booten. Grub laadde nu gewoon snel, en ook Debian leek er opeens veel meer zin in te hebben. Er kwamen echter opeen allemaal foutmeldingen dat sectoren corrupt waren e.d. Debian kon blijkbaar niet meer normaal opstarten, want het startte een console met een read-only mount van mijn harde schijf, met de aanwijzing fsck te draaien. Ik deed dat dus, op /dev/hda1:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
| root@1[~]# fsck /dev/hda1 fsck 1.39-WIP (31-Dec-2005) reiserfsck 3.6.19 (2003 www.namesys.com) ************************************************************* ** If you are using the latest reiserfsprogs and it fails ** ** please email bug reports to reiserfs-list@namesys.com, ** ** providing as much information as possible -- your ** ** hardware, kernel, patches, settings, all reiserfsck ** ** messages (including version), the reiserfsck logfile, ** ** check the syslog file for any related information. ** ** If you would like advice on using this program, support ** ** is available for $25 at www.namesys.com/support.html. ** ************************************************************* Will read-only check consistency of the filesystem on /dev/hda1 Will put log info to 'stdout' Do you want to run this program?[N/Yes] (note need to type Yes if you do):Yes ****************************************************** * Warning: The dma on your hard drive is turned off. * * This may really slow down the fsck process. * ****************************************************** ########### reiserfsck --check started at Wed Apr 5 02:36:01 2006 ########### Replaying journal.. Reiserfs journal '/dev/hda1' in blocks [18..8211]: 0 transactions replayed Checking internal tree../ 11 (of 48)/ 60 (of 164) The problem has occurred looks like a hardware problem. If you have bad blocks, we advise you to get a new hard drive, because once you get one bad block that the disk drive internals cannot hide from your sight,the chances of getting more are generally said to become much higher (precise statistics are unknown to us), and this disk drive is probably not expensive enough for you to you to risk your time and data on it. If you don't want to follow that follow that advice then if you have just a few bad blocks, try writing to the bad blocks and see if the drive remaps the bad blocks (that means it takes a block it has in reserve and allocates it for use for of that block number). If it cannot remap the block, use badblock option (-B) with reiserfs utils to handle this block correctly. bread: Cannot read the block (852183): (Input/output error). Warning... fsck.reiserfs for device /dev/hda1 exited with signal 6. |
Ik vond het er nu al wat beter uitzien, want ik leek ook gewoon weer op me hda1 te kunne browsen. Dus ik startte Knoppix weer op. Dit ging nu al veel sneller dan toen het net verkeerd was gegaan. Ik deed nog een keer fsck, met ongeveer dezelfde output als hierboven net. Ook kunnen hda1 (reiserfs3) en hda2 (ntfs) nu weer gewoon gezien worden op de desktop, en ook mounten lijkt niet moeilijk te doen.
Ik wilde ook even ntfsck (fsck voor ntfs-partities) draaien, maar omdat die nog steeds niet beschikbaar is in de ntfsprogs package, doe ik ntfsresize -fi /dev/hdXY zoals aangeraden wordt op wiki.linux-ntfs.org:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
| root@2[~]# ntfsresize -fi /dev/hda2 ntfsresize v1.13.0 (libntfs 9:0:0) Device name : /dev/hda2 NTFS volume version: 3.1 Cluster size : 4096 bytes Current volume size: 115105141248 bytes (115106 MB) Current device size: 116403194880 bytes (116404 MB) Checking filesystem consistency ... 100.00 percent completed Accounting clusters ... Space in use : 108438 MB (94.2%) Collecting resizing constraints ... You might resize at 108437151744 bytes or 108438 MB (freeing 6668 MB). Please make a test run using both the -n and -s options before real resizing! |
Het lijkt er dus op (voor mij iig) dat de NTFS partitie onaangetast is gebleven, waar ik heel erg blij mee ben, aangezien daar al mijn data opstaat.
Aangezien ik toch al een nieuwe harde schijf wou aanschaffen, is het goed genoeg als alles weer leesbaar is, en het lijkt erop dat dat in ieder geval nu zo is. Ik blijf echter nog met een paar vragen achter...
- De fsck van hda1 (ReiserFS) nog steeds een beetje raar bij met de resultaten van mijn NTFS. Het lijkt me sterk dat de ene partitie helemaal verkloot kan zijn met bad sectors enzo, terwijl de andere nog helemaal goed lijkt
- Ligt mijn harde schijf nu toch echt op sterven, zoals mijn SMART controle-tool vond (en nog steeds vindt trouwens)?
- Zal dit een eenmalig "incident" zijn, of zit de kans erin dat het weer vrolijk terug komt?SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
- Is het misschien een fout in de software geweest? (lijkt me zelf sterk, aangezien er bad sectors kwamen)
[ Voor 35% gewijzigd door Whollabilla op 05-04-2006 01:33 . Reden: update ]