Toon posts:

Maxtor HDD dood, of nog "te redden"?

Pagina: 1

Acties:

134 views sinds 30-01-2008
Reageer

dinsdag 4 april 2006 19:51

Acties:

Verwijderd

Topicstarter

Ik heb sinds de zomer van 2003 een computer met een Maxtor (P)ATA hardeschijf, de Maxtor 6Y120L0. De computer heeft sinds oktober 2004 zo goed als altijd aan gestaan, maar de harde schijf heeft lang niet al die tijd ook iets moeten lezen/schrijven. Sinds het begin van 2006 heb ik Linux erop gezet, Debian Testing. Dit ging best wel een tijdje goed, maar na verloop van tijd ging hij steeds vreemder doen. Zo sloeg hij heel vaak vast, vooral als ik Konqueror en/of amaroK tegelijk draaide. In zo'n geval wilde de computer echt nergens meer op reageren, en was de enige manier die ik nog zag om hem weer aan de praat te krijgen, de "reset" knop indrukken. Natuurlijk gaf Linux daarna bij het opstarten aan dat me ReiserFS partitie corrupt was, en ging het vrolijk herstellen, waarna ik weer lekker verder kon gaan met de computer. Deze keer ging dat echter niet zo makkelijk.
Hij sloeg dus weer een keer vast, waarna ik dus op de reset knop drukte. Toen het opstarten zonder problemen bij Grub stage 1.5 was aangekomen, werd het al vreemd. Hij deed er namelijk erg lang over om te laden naar het menu (zo'n 2 minuten, waar hij normaal gesproken maar een paar seconden nodig heeft). In het menu aangekomen, leek alles weer soepel verder te kunnen, maar toen hij Debian wou gaan laden, deed hij eerst

code:

root(0,0)

, maar na een tijdje te wachten gaf hij error 25 terug. Even nakijken op de Grub website gaf aan:

25 : Disk read error
This error is returned if there is a disk read error when trying to probe or read data from a particular disk.

Dat vond ik al niet echt leuk klinken. Na nog 2x proberen op te starten, stopte ik mijn toevallig vers-gebrande Knoppix 5 DVD in me computer, om daarmee verder te gaan proberen.
Bij het opstarten duurde het scannen op schijven al erg lang (ik gok zo'n kwartier). Toen Knoppix was opgestart naar KDE, zag ik dat waar normaal 2 partities stonden, nu alleen nog maar hda stond, en als ik die probeer te openen, krijg ik

code:

1
2
3

Could not mount device.
The reported error was:
mount: I could not determine the filesystem type, and none was specified

maar dat is op zich niet raar, want hda is natuurlijk geen partitie. Als ik fdisk probeer, schiet ik ook niet veel op:

code:

1
2
3

knoppix@2[knoppix]$ fdisk /dev/hda

Unable to open /dev/hda

Als ik SMART wil gebruiken, door de software van http://smartmontools.sourceforge.net/ te installeren, krijg ik de volgende output:

code:

root@1[~]# smartctl -a /dev/hda
smartctl version 5.26 Copyright (C) 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     Maxtor 6Y120L0
Serial Number:    Y31SBLGE
Firmware Version: YAR41BW0
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Tue Apr  4 19:06:48 2006 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
See vendor-specific Attribute list for failed Attributes.

General SMART Values:
Offline data collection status:  (0x80) Offline data collection activity was
                                        never started.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 242) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off supp
ort.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  54) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_
FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   202   202   063    Pre-fail  Always       -
       12183
  4 Start_Stop_Count        0x0032   253   253   000    Old_age   Always       -
       608
  5 Reallocated_Sector_Ct   0x0033   001   001   063    Pre-fail  Always   FAILI
NG_NOW 2556
  6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail  Offline      -
       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -
       0
  8 Seek_Time_Performance   0x0027   253   242   187    Pre-fail  Always       -
       62206
  9 Power_On_Minutes        0x0032   222   222   000    Old_age   Always       -
       72h+55m
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  Always       -
       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -
       0
 12 Power_Cycle_Count       0x0032   251   251   000    Old_age   Always       -
       992
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -
       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -
       0
194 Temperature_Celsius     0x0032   253   253   000    Old_age   Always       -
       31
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   Always       -
       4554
196 Reallocated_Event_Count 0x0008   216   216   000    Old_age   Offline      -
       37
197 Current_Pending_Sector  0x0008   249   249   000    Old_age   Offline      -
       41
198 Offline_Uncorrectable   0x0008   242   242   000    Old_age   Offline      -
       11
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   Offline      -
       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -
       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -
       7
202 TA_Increase_Count       0x000a   253   001   000    Old_age   Always       -
       0
203 Run_Out_Cancel          0x000b   253   248   180    Pre-fail  Always       -
       1
204 Shock_Count_Write_Opern 0x000a   253   177   000    Old_age   Always       -
       0
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   Always       -
       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   Always       -
       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   Always       -
       0
209 Offline_Seek_Performnce 0x0024   193   193   000    Old_age   Offline      -
       0
 99 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -
       0
100 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -
       0
101 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -
       0

SMART Error Log Version: 1
Warning: ATA error count 1253 inconsistent with error log pointer 5

ATA Error Count: 1253 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Timestamp = decimal seconds since the previous disk power-on.
Note: timestamp "wraps" after 2^32 msec = 49.710 days.

Error 1253 occurred at disk power-on lifetime: 10307 hours
  When the command that caused the error occurred, the device was in an unknown
state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 59 03 84 00 00 e0  Error: UNC

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  20 00 08 80 00 00 e0 08  391748.352  READ SECTOR(S)
  20 00 88 00 00 00 e0 08  391739.504  READ SECTOR(S)
  20 00 08 00 f7 4f ee 08  391739.504  READ SECTOR(S)
  e7 00 00 00 00 00 e0 08  388005.680  FLUSH CACHE
  20 00 02 9e e1 c2 e0 08  388004.272  READ SECTOR(S)

Error 1252 occurred at disk power-on lifetime: 10307 hours
  When the command that caused the error occurred, the device was in an unknown
state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 59 02 85 00 00 e0  Error: UNC

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  20 00 88 00 00 00 e0 08  391739.504  READ SECTOR(S)
  20 00 08 00 f7 4f ee 08  391739.504  READ SECTOR(S)
  e7 00 00 00 00 00 e0 08  388005.680  FLUSH CACHE
  20 00 02 9e e1 c2 e0 08  388004.272  READ SECTOR(S)
  20 00 08 78 f5 4f ee 08  388001.488  READ SECTOR(S)

Error 1251 occurred at disk power-on lifetime: 10306 hours
  When the command that caused the error occurred, the device was in an unknown
state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 59 01 9e e1 c2 e0  Error: UNC

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  20 00 02 9e e1 c2 e0 08  387999.776  READ SECTOR(S)
  20 00 08 f0 f5 4f ee 08  387998.768  READ SECTOR(S)
  20 00 06 9a e1 c2 e0 08  387994.832  READ SECTOR(S)
  20 00 18 25 d0 b9 e0 08  387994.832  READ SECTOR(S)
  20 00 26 ff cf b9 e0 08  387994.832  READ SECTOR(S)

Error 1250 occurred at disk power-on lifetime: 10306 hours
  When the command that caused the error occurred, the device was in an unknown
state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 59 08 f0 f5 4f ee  Error: UNC

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  20 00 08 f0 f5 4f ee 08  387998.768  READ SECTOR(S)
  20 00 06 9a e1 c2 e0 08  387994.832  READ SECTOR(S)
  20 00 18 25 d0 b9 e0 08  387994.832  READ SECTOR(S)
  20 00 26 ff cf b9 e0 08  387994.832  READ SECTOR(S)
  20 00 02 fd cf b9 e0 08  387994.832  READ SECTOR(S)

Error 1249 occurred at disk power-on lifetime: 10306 hours
  When the command that caused the error occurred, the device was in an unknown                                             state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 59 02 9d e1 c2 e0  Error: UNC

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Timestamp  Command/Feature_Name
  -- -- -- -- -- -- -- --   ---------  --------------------
  20 00 06 9a e1 c2 e0 08  387994.832  READ SECTOR(S)
  20 00 18 25 d0 b9 e0 08  387994.832  READ SECTOR(S)
  20 00 26 ff cf b9 e0 08  387994.832  READ SECTOR(S)
  20 00 02 fd cf b9 e0 08  387994.832  READ SECTOR(S)
  20 00 20 dd cf b9 e0 08  387994.816  READ SECTOR(S)

SMART Self-test log structure revision number 1
No self-tests have been logged.  [Use the smartctl -t option to run these.]

Maar ik zelf kan daar niet echt veel mee.

Nu is mijn echte vraag dus: kan ik nog bestanden redden op een of andere manier van deze harde schijf, of kan ik hem beter opgeven (wat niet zo leuk zou zijn, want ik moet een aantal dingen die op die schijf staan inleveren op school, maar ik heb geen backups)?

offtopic:
Beetje lang verhaal, maar ik denk dat alles erin nog wel nuttig kan zijn

edit: ik doe nu ook even een long self-test, resultaten over een uurtje klaar

edit: ik denk dat ie nu klaar is met de long self-test, ik kan d'r alleen (zelf) helemaal niks mee

code:

1
2
3

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       40%     10309         0x00038df8

(nog een) edit: het MoBo piept 1x bij het opstarten, en bij het opstarten (voor Grub/Knoppix word geladen) wordt gewoon aangegeven welke HDD ik heb

edit: Na alleen gedaan te hebben wat hierboven staat, heb ik nog een keer geprobeerd naar Debian te booten. Grub laadde nu gewoon snel, en ook Debian leek er opeens veel meer zin in te hebben. Er kwamen echter opeen allemaal foutmeldingen dat sectoren corrupt waren e.d. Debian kon blijkbaar niet meer normaal opstarten, want het startte een console met een read-only mount van mijn harde schijf, met de aanwijzing fsck te draaien. Ik deed dat dus, op /dev/hda1:

code:

root@1[~]# fsck /dev/hda1
fsck 1.39-WIP (31-Dec-2005)
reiserfsck 3.6.19 (2003 www.namesys.com)

*************************************************************
** If you are using the latest reiserfsprogs and  it fails **
** please  email bug reports to reiserfs-list@namesys.com, **
** providing  as  much  information  as  possible --  your **
** hardware,  kernel,  patches,  settings,  all reiserfsck **
** messages  (including version),  the reiserfsck logfile, **
** check  the  syslog file  for  any  related information. **
** If you would like advice on using this program, support **
** is available  for $25 at  www.namesys.com/support.html. **
*************************************************************

Will read-only check consistency of the filesystem on /dev/hda1
Will put log info to 'stdout'

Do you want to run this program?[N/Yes] (note need to type Yes if you do):Yes

******************************************************
* Warning: The dma on your hard drive is turned off. *
* This may really slow down the fsck process.        *
******************************************************
###########
reiserfsck --check started at Wed Apr  5 02:36:01 2006
###########
Replaying journal..
Reiserfs journal '/dev/hda1' in blocks [18..8211]: 0 transactions replayed
Checking internal tree../ 11 (of  48)/ 60 (of 164)
The problem has occurred looks like a hardware problem. If you have
bad blocks, we advise you to get a new hard drive, because once you
get one bad block  that the disk  drive internals  cannot hide from
your sight,the chances of getting more are generally said to become
much higher  (precise statistics are unknown to us), and  this disk
drive is probably not expensive enough  for you to you to risk your
time and  data on it.  If you don't want to follow that follow that
advice then  if you have just a few bad blocks,  try writing to the
bad blocks  and see if the drive remaps  the bad blocks (that means
it takes a block  it has  in reserve  and allocates  it for use for
of that block number).  If it cannot remap the block,  use badblock
option (-B) with  reiserfs utils to handle this block correctly.

bread: Cannot read the block (852183): (Input/output error).

Warning... fsck.reiserfs for device /dev/hda1 exited with signal 6.

Ik vond het er nu al wat beter uitzien, want ik leek ook gewoon weer op me hda1 te kunne browsen. Dus ik startte Knoppix weer op. Dit ging nu al veel sneller dan toen het net verkeerd was gegaan. Ik deed nog een keer fsck, met ongeveer dezelfde output als hierboven net. Ook kunnen hda1 (reiserfs3) en hda2 (ntfs) nu weer gewoon gezien worden op de desktop, en ook mounten lijkt niet moeilijk te doen.

Ik wilde ook even ntfsck (fsck voor ntfs-partities) draaien, maar omdat die nog steeds niet beschikbaar is in de ntfsprogs package, doe ik ntfsresize -fi /dev/hdXY zoals aangeraden wordt op wiki.linux-ntfs.org:

code:

root@2[~]# ntfsresize -fi /dev/hda2
ntfsresize v1.13.0 (libntfs 9:0:0)
Device name        : /dev/hda2
NTFS volume version: 3.1
Cluster size       : 4096 bytes
Current volume size: 115105141248 bytes (115106 MB)
Current device size: 116403194880 bytes (116404 MB)
Checking filesystem consistency ...
100.00 percent completed
Accounting clusters ...
Space in use       : 108438 MB (94.2%)
Collecting resizing constraints ...
You might resize at 108437151744 bytes or 108438 MB (freeing 6668 MB).
Please make a test run using both the -n and -s options before real resizing!

Het lijkt er dus op (voor mij iig) dat de NTFS partitie onaangetast is gebleven, waar ik heel erg blij mee ben, aangezien daar al mijn data opstaat.

Aangezien ik toch al een nieuwe harde schijf wou aanschaffen, is het goed genoeg als alles weer leesbaar is, en het lijkt erop dat dat in ieder geval nu zo is. Ik blijf echter nog met een paar vragen achter...

- De fsck van hda1 (ReiserFS) nog steeds een beetje raar bij met de resultaten van mijn NTFS. Het lijkt me sterk dat de ene partitie helemaal verkloot kan zijn met bad sectors enzo, terwijl de andere nog helemaal goed lijkt

- Ligt mijn harde schijf nu toch echt op sterven, zoals mijn SMART controle-tool vond (en nog steeds vindt trouwens)?

SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.

- Zal dit een eenmalig "incident" zijn, of zit de kans erin dat het weer vrolijk terug komt?

- Is het misschien een fout in de software geweest? (lijkt me zelf sterk, aangezien er bad sectors kwamen)

[ Voor 35% gewijzigd door Verwijderd op 05-04-2006 01:33 . Reden: update ]

woensdag 5 april 2006 11:22

Acties:

Outerspace

Admin General Chat

AFX Ghey Edition by HlpDsK

• Ja, ik denk dat je schijf het niet meer lang zal volhouden. Dat komt mede door die bad sectors die je hebt gekregen. Ik zou zeggen doe een chkdsk /f (ik weet niet hoe je dat doet met Knoppix, maar dit werkt wel iig met een Windows XP cd).

• Ik denk niet dat dit een softwarematige fout is geweest. Vaak zijn bad sectors hardwarematig (althans ik dacht dat het door krasjes op je schijf kwam).
Tip, je zou ze misschien kunnen verhelpen:

Bad sectors: wanneer er eenmaal bad sectors op de schijf zijn gevonden, dan kun je er de donder op zeggen dat er meer zullen volgen. Hetzij al na een dag, anders pas na enkele maanden. Het beste is dus om zo snel mogelijk de data te backuppen en schijf in te ruilen.

Let op: indien je nog garantie hebt, ga beslist niet proberen om in geval van bad sectors de schijf zelf op te lappen met behulp van een Low Level Format. Sommige leveranciers trekken dan de garantie in. Mocht je daarentegen geen garantie meer hebben, dan kun je wel een poging wagen om een Low Level Format te doen met behulp van het diagnosetooltje van de harddiskfabrikant. Alle Bad Sectors worden dan gemarkeerd en er worden nieuwe sectors vrijgegeven uit de reserve-schijfruimte (ongeveer net zo groot als 0,5% van de schijfruimte). Alle Bad Sectors en vrijgegeven nieuwe sectors worden geregistreerd in de firmware van de harddisk.

Tipje: mocht het diagnosetooltje van de harddiskfabrikant niet voldoen of niet alle bad sectors te kunnen repareren, dan kan het handig zijn om het 3rd party tooltje HDD Regenerator te proberen. Daarmee zijn hier op GoT namelijk erg veel goede ervaringen vermeld. Maar, nogmaals, wanneer er eenmaal bad sectors op de schijf zijn gevonden, dan kun je er de donder op zeggen dat er meer zullen volgen.

Ik zou dus als ik jou was ASAP je data backuppen.

Wauw, een sig!

woensdag 5 april 2006 11:25

Acties:

Luuk1983

Ik heb dezelfde 120GB Maxtor van rond die tijd. Dat ding is ook dood aan het gaan. Ik krijg al S.M.A.R.T. waarschuwingen bij het opstarten van de computer. Ik heb het sowieso gehad met Maxtor, rotschijven.

woensdag 5 april 2006 13:14

Acties:

Verwijderd

Topicstarter

Ik wou sowieso al een nieuwe schijf gaan halen van 300/400 GB, dus dat doe ik dan maar zo snel mogelijk, en dan me data overzetten naar die nieuwe schijf

Ik ben trouwens wel blij dat ik me data iig nog kan lezen gewoon, en dan laat ik het schrijven op dat ding maar zitten, zodat ik niet nog meer kan verkloten... Jammer alleen dat ik net mijn Debian helemaal perfect klaar had, en ik hem nu opnieuw moet installeren

Ik ga hem trouwens nog wel ff langsbrengen bij de garantie, als ik me nieuwe schijf heb. Misschien dat ik dan een vervanger van ze kan krijgen, dan heb ik nog 120GB schijfruimte erbij

Reageer