Toon posts:

[HDD] Freeze computer + Click of death, 3 harde schijven

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik heb al een week of twee te kampen met dit probleem. Af en toe, geheel onvoorspelbaar, maar altijd na ruime tijd nadat ik mijn PC aangezet heb, freezed mijn PC, en hoor ik een "klik" om de 7 seconden vanuit een van m'n harde schijven komen (onbekend welkeen). Na een minuut of vijf wordt m'n PC weer wakker, en hoor ik de klik niet meer. Soms ben ik het beu en herstart ik gewoon de PC, waarna het probleem ook is opgelost.

Smartctl geeft voor alle drie de harde schijven een OK/PASSED health status. Dat zijn 2 IDE schijven (sda en sdb), en 1 SATA schijf (sdc).

Syslog geeft vreemd genoeg voor alle drie de harde schijven errors.

Eerst krijg ik een paar van dit:
Jul 23 10:36:01 Seven kernel: [ 2063.670353] ata8.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 23 10:36:01 Seven kernel: [ 2063.670360] ata8.00: BMDMA stat 0x25
Jul 23 10:36:01 Seven kernel: [ 2063.670366] ata8.00: cmd 25/00:40:cd:db:0a/00:00:39:00:00/e0 tag 0 dma 32768 in
Jul 23 10:36:01 Seven kernel: [ 2063.670368] res 51/40:32:dc:db:0a/40:00:39:00:00/e0 Emask 0x9 (media error)
Jul 23 10:36:01 Seven kernel: [ 2063.670371] ata8.00: status: { DRDY ERR }
Jul 23 10:36:01 Seven kernel: [ 2063.670373] ata8.00: error: { UNC }
Jul 23 10:36:01 Seven kernel: [ 2063.733934] ata8.00: configured for UDMA/133
Jul 23 10:36:01 Seven kernel: [ 2063.733948] ata8: EH complete
Dan een paar van dit, blijkbaar /dev/sdc:
[ 2429.191400] sd 7:0:0:0: [sdc] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
[ 2429.191404] sd 7:0:0:0: [sdc] Sense Key : Medium Error [current] [descriptor]
[ 2429.191423] sd 7:0:0:0: [sdc] Add. Sense: Unrecovered read error - auto reallocate failed
[ 2429.191430] end_request: I/O error, dev sdc, sector 957012956
...
[ 2429.202869] sd 7:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 MB)
[ 2429.203342] sd 7:0:0:0: [sdc] Write Protect is off
[ 2429.203347] sd 7:0:0:0: [sdc] Mode Sense: 00 3a 00 00
[ 2429.214114] sd 7:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
(sdc komt slechts 24 keer voor in de syslog)

En dan een hele resem van de volgende...

/dev/sdb:
Jul 23 10:45:49 Seven kernel: [ 2650.208320] end_request: I/O error, dev sdb, sector 167642679
Jul 23 10:45:49 Seven kernel: [ 2650.208339] sd 0:0:1:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK
Dit zo'n 766 keer, waarvan 112 met ditzelfde sector nummer.

/dev/sda:
Jul 23 10:42:45 Seven kernel: [ 2466.598115] sd 0:0:0:0: [sda] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK
Jul 23 10:42:45 Seven kernel: [ 2466.598118] end_request: I/O error, dev sda, sector 230468006
Dit zo'n 488 keer.


Ik dacht eerst dat het de SATA kabel was, omdat ik geen errors bij sda en sdb zag. Nu heb ik die vervangen, maar blijkbaar ligt het dus toch niet aan de kabel - het probleem blijft, en het is duidelijk dat sda en sdb er ook last van hebben. |:( Ideetjes? Is mijn data in gevaar?

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Klikkende hdds zijn nooit goed. Heb je het ook al met het tooltje van de hdd fabrikant getest? Die zijn vaak wat beter dan een smart uitlezing. Backuppen is sowieso verstandig.

Verwijderd

Topicstarter
Dat zal de Samsung ES-Tool zijn. Echter er staat een waarschuwing bij dat het gebruik mogelijk data kan verwijderen omdat er een "write" operatie getest wordt. Hoe courant is deze data loss?

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Verwijderd schreef op woensdag 23 juli 2008 @ 11:35:
Dat zal de Samsung ES-Tool zijn. Echter er staat een waarschuwing bij dat het gebruik mogelijk data kan verwijderen omdat er een "write" operatie getest wordt. Hoe courant is deze data loss?
Ik denk dat je wel rekening moet houden met dataloss, je weet immers nooit wat er fout gaat bij een uitgebreide test.

Verwijderd

Topicstarter
Dan ga ik daar nog even mee wachten. Heb momenteel geen tijd om backups over te zetten en een nieuw systeem te installeren. Overigens lijkt het me sterk dat er iets kapot zou zijn aan een specifieke harde schijf, aangezien ze alle drie errors geven. Dit lijkt meer op een driver of chipset issue. Of ben ik daarin fout?

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Verwijderd schreef op woensdag 23 juli 2008 @ 11:49:
Dan ga ik daar nog even mee wachten. Heb momenteel geen tijd om backups over te zetten en een nieuw systeem te installeren. Overigens lijkt het me sterk dat er iets kapot zou zijn aan een specifieke harde schijf, aangezien ze alle drie errors geven. Dit lijkt meer op een driver of chipset issue. Of ben ik daarin fout?
Imho is dat erg onverstandig. Backups van belangrijke data moet je gewoon altijd hebben, wil je de data niet kwijt zijn.

Verder, als jouw voeding ietwat instabiel draait dan kun je makkelijk 3 disks tegelijkertijd slopen. De zaak is dus om dit gewoon uit te zoeken, want als het echt aan je disks ligt is het waarschijnlijk een kwestie van tijd voordat het fout gaat.

Verwijderd

Topicstarter
Ik heb al jaren backups van mijn data. Die wordt elke dag automatisch geupdate. Deze backups worden natuurlijk wel alleen maar weggeschreven naar een van de andere schijven, dus als ze alle drie kapot zijn ben ik er ook niets mee.

Edit:
Heb geprobeerd ES Tool in gang te krijgen omdat een van de schijven geen belangrijke data bevat, maar ik krijg steeds een "Bad command or filename" error. Zucht... |:(

[ Voor 28% gewijzigd door Verwijderd op 23-07-2008 12:15 ]


  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Dan loop je natuurlijk de kans dat als je pc op z'n gat gaat je nog alles kwijt bent. Ik zou sowieso zorgen dat je data veilig is (desnoods trek je de backup disk uit je systeem) en achterhalen waar de fouten vandaan komen.

Verwijderd

Topicstarter
Ik heb ondertussen gelukkig wat meer info kunnen vinden. Omdat ik die ES Tool wou uitproberen heb ik nog een laatste backup (rsnapshot) geforceerd. 5 minuutjes nadat die gestart is hoorde ik de gevreesde "klik.....klik...." weer.

Ik kwam op het idee dat rsnapshot mogelijk het probleem triggered. Dit zou ook verklaren waarom ik slechts af en toe het probleem heb, en 1 keer per dag. Rsnapshot wordt door anacron dagelijks uitgevoerd, en het is goed mogelijk dat dat op precies die tijdstippen waren.

Nu waren er dus twee opties: ofwel de schijf waarnaar rsnapshot backupped is borked, of de schijf vanwaar rsnapshot backupped is borked. Ik heb eerst m'n backup-schijf afgekoppeld, zodat deze al veilig is. Daarna rsnapshot herconfigureerd om naar de andere schijf te backuppen, en hoewaar, hetzelfde probleem verrijst! Toen rsnapshot op precies hetzelfde bestand kwam (een logfile van azureus) hoorde ik de eerste *klik*.

Het *klikken* ligt dus aan mijn 7-maand oude Samsung Spinpoint 500GB, waarop mijn /home en m'n OS staan, juist de schijf die de belangrijkste data bevat natuurlijk. Ik vermoed dat ik deze mooi ga kunnen omruilen in de winkel, maar ik kan dus nog wel geen ES Tool er op uitvoeren om te bewijzen dat er iets mis mee is.

Ik heb nu die azureus logfile verwijderd, en de backup loopt al 20 minuten zonder problemen. Het probleem zal zich dus beperken tot een klein aantal sectoren die juist ingenomen waren door die logfile, wat me ook vreemd lijkt, maar niet onredelijk. Ik ben al blij dat het niet meer een "myserieus" probleem is.

Dan rest me nog deze vraag: Zo rap mogelijk inruilen, of zou dit probleem niet zo dringend zijn zolang die sectoren maar niet gebruikt worden? Zoals ik al gezegd heb heb ik bijna geen tijd (herexamens) en de winkel om te ruilen is een uur hier vandaan.

  • xray77241
  • Registratie: Februari 2004
  • Laatst online: 03-12-2025
Meestal als er sectoren 'kapot' zijn, volgen er onherroepelijk meer. Kan ik helaas uit ervaring vertellen. Dus lijkt me handig om het zsm te vervangen.

Verwijderd

Topicstarter
Feit is wel dat ik zowiezo data kwijt ben. Als ik de harde schijf omruil kan ik niet eerst nog de data op de nieuwe schijf kopiëren. Ik heb te weinig backupruimte om alle data te backuppen. De data die ik wel kan backuppen wordt al gebackuped.

Ik heb er dus praktisch geen voordeel bij om die vlug in te wisselen, ten zij een lagere downtime.
Pagina: 1