HD geluiden + logging in messages file -> HD kaput?

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Hallo,

Mijn HD maakt recentelijk soms nogal rare geluiden (repetitief geratel met pauzes) terwijl de PC dan ook tijdelijk blokkeert. Dit gebeurt zowel onder windows als onder linux (dual-boot).
Terwijl dit geluid gebeurt onder linux zie ik onderstaande boodschappen in /var/log/messages verschijnen.

Mijn windows is ondertussen al om zeep (filesystem errors I presume).
Onder linux heb ik filesystem errors gedetecteerd, die dan vreemd genoeg weer verdwenen bleken te zijn als ik naar een USB stick bootte om een filesystem repare te doen...

SMART zegt nochtans dat alles ok is (als ik dit goed interpreteer):
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0004   100   100   000    Old_age   Offline      -       253
  3 Spin_Up_Time            0x0007   178   178   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   099   099   000    Old_age   Always       -       2430
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   100   100   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0004   100   100   000    Old_age   Offline      -       0
  9 Power_On_Hours          0x0012   094   094   000    Old_age   Always       -       2640
 10 Spin_Retry_Count        0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       2319
160 Unknown_Attribute       0x003a   100   100   000    Old_age   Always       -       0
191 G-Sense_Error_Rate      0x000a   099   099   000    Old_age   Always       -       65537
192 Power-Off_Retract_Count 0x0032   082   082   000    Old_age   Always       -       14856568766647
193 Load_Cycle_Count        0x0012   094   094   000    Old_age   Always       -       67485
194 Temperature_Celsius     0x0002   127   127   000    Old_age   Always       -       43 (Lifetime Min/Max 6/63)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       47
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       45
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0
225 Load_Cycle_Count        0x0012   094   094   000    Old_age   Always       -       67485
240 Head_Flying_Hours       0x0032   095   095   000    Old_age   Always       -       137740
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       3121568989
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       4283977766
254 Free_Fall_Sensor        0x0032   087   087   000    Old_age   Always       -       3459


Nu goed, ik ga er vanuit dat de HD aan het falen is en bestel me ASAP een nieuwe.
Maar ik vraag me af of jullie uit deze informatie meer kunnen halen dan mij?
Buiten de kaduke windows en de vage geluiden is er niet echt iets wat sluitend in de richting van HD-fouten wijst? Windows self-destruct zichzelf sowieso om de zoveel tijd, en ext3-fs errors zijn nu ook niet zo uncommon...

Wat halen jullie hieruit?

/var/log/messages
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
Dec 13 22:44:19 pinkie kernel: [ 1033.401543] ata3.00: configured for UDMA/133
Dec 13 22:44:19 pinkie kernel: [ 1033.401557] ata3: EH complete
Dec 13 22:44:23 pinkie kernel: [ 1036.684580] ata3.00: configured for UDMA/133
Dec 13 22:44:23 pinkie kernel: [ 1036.684592] ata3: EH complete
Dec 13 22:44:26 pinkie kernel: [ 1039.968567] ata3.00: configured for UDMA/133
Dec 13 22:44:26 pinkie kernel: [ 1039.968585] ata3: EH complete
Dec 13 22:44:29 pinkie kernel: [ 1043.268564] ata3.00: configured for UDMA/133
Dec 13 22:44:29 pinkie kernel: [ 1043.268578] ata3: EH complete
Dec 13 22:44:33 pinkie kernel: [ 1046.568648] ata3.00: configured for UDMA/133
Dec 13 22:44:33 pinkie kernel: [ 1046.568661] ata3: EH complete
Dec 13 22:44:36 pinkie kernel: [ 1049.836623] ata3.00: configured for UDMA/133
Dec 13 22:44:36 pinkie kernel: [ 1049.836652] sd 2:0:0:0: [sda] Unhandled sense code
Dec 13 22:44:36 pinkie kernel: [ 1049.836655] sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 13 22:44:36 pinkie kernel: [ 1049.836660] sd 2:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Dec 13 22:44:36 pinkie kernel: [ 1049.836666] Descriptor sense data with sense descriptors (in hex):
Dec 13 22:44:36 pinkie kernel: [ 1049.836669]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Dec 13 22:44:36 pinkie kernel: [ 1049.836683]         09 ea 3b 29 
Dec 13 22:44:36 pinkie kernel: [ 1049.836689] sd 2:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Dec 13 22:44:36 pinkie kernel: [ 1049.836697] sd 2:0:0:0: [sda] CDB: Read(10): 28 00 09 ea 3b 0f 00 00 20 00
Dec 13 22:44:36 pinkie kernel: [ 1049.836714] quiet_error: 18 callbacks suppressed
Dec 13 22:44:36 pinkie kernel: [ 1049.836728] ata3: EH complete
Dec 13 22:44:49 pinkie kernel: [ 1062.932646] ata3.00: configured for UDMA/133
Dec 13 22:44:49 pinkie kernel: [ 1062.932661] ata3: EH complete
Dec 13 22:44:52 pinkie kernel: [ 1066.304565] ata3.00: configured for UDMA/133
Dec 13 22:44:52 pinkie kernel: [ 1066.304581] ata3: EH complete
Dec 13 22:44:56 pinkie kernel: [ 1069.680637] ata3.00: configured for UDMA/133
Dec 13 22:44:56 pinkie kernel: [ 1069.680656] ata3: EH complete
Dec 13 22:44:59 pinkie kernel: [ 1073.060610] ata3.00: configured for UDMA/133
Dec 13 22:44:59 pinkie kernel: [ 1073.060628] ata3: EH complete
Dec 13 22:45:02 pinkie kernel: [ 1076.444567] ata3.00: configured for UDMA/133
Dec 13 22:45:02 pinkie kernel: [ 1076.444584] ata3: EH complete
Dec 13 22:45:06 pinkie kernel: [ 1079.805569] ata3.00: configured for UDMA/133
Dec 13 22:45:06 pinkie kernel: [ 1079.805593] sd 2:0:0:0: [sda] Unhandled sense code
Dec 13 22:45:06 pinkie kernel: [ 1079.805597] sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 13 22:45:06 pinkie kernel: [ 1079.805604] sd 2:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Dec 13 22:45:06 pinkie kernel: [ 1079.805613] Descriptor sense data with sense descriptors (in hex):
Dec 13 22:45:06 pinkie kernel: [ 1079.805616]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Dec 13 22:45:06 pinkie kernel: [ 1079.805635]         0a a5 4a 49 
Dec 13 22:45:06 pinkie kernel: [ 1079.805643] sd 2:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Dec 13 22:45:06 pinkie kernel: [ 1079.805653] sd 2:0:0:0: [sda] CDB: Read(10): 28 00 0a a5 4a 37 00 00 20 00
Dec 13 22:45:06 pinkie kernel: [ 1079.805702] ata3: EH complete

Acties:
  • 0 Henk 'm!

  • sam.vimes
  • Registratie: Januari 2007
  • Laatst online: 08-06 08:44
Installeer smartmontools (Debian: http://packages.debian.org/lenny/smartmontools. Onder Ubuntu zal het pakket ook wel smartmontools heten; voor andere distributies even Googlen.) en start de smartd daemon.
Alle moderne harde schijven ondersteunen SMART. Als smartd meldt dat er iets mis is, kun je beter je harde schijf asap vervangen.

Acties:
  • 0 Henk 'm!

  • Dr_Hell
  • Registratie: Juni 2002
  • Laatst online: 03-10 13:56
code:
1
2
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       47
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       45

Deze 2 lijken wel te wijzen op een schijf die aan het overlijden is. Er zijn in ieder geval een aantal sectoren die niet meer leesbaar zijn, om wat voor reden dan ook.
Zie bijv. Wikipedia:
Wikipedia: S.M.A.R.T.

Of hier: http://www.linuxjournal.com/article/6983

Acties:
  • 0 Henk 'm!

  • Rainmaker
  • Registratie: Augustus 2000
  • Laatst online: 14-07-2024

Rainmaker

RHCDS

Ik twijfel eerlijk gezegd of het je schijf is. Ik denk eerder aan de connectie naar de schijf.

Aangezien je je schijf soms hoort downspinnen en dan weer opspinnen, denk ik aan kabels / moederbord / controller / voeding...

Ik gok dat EH staat voor "Error Handling".

[ Voor 9% gewijzigd door Rainmaker op 14-12-2010 16:39 ]

We are pentium of borg. Division is futile. You will be approximated.


Acties:
  • 0 Henk 'm!

  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Nog wat informatie:
Ik ben een image aan het maken van mijn schijf (vanaf Ubuntu Live-USB-stick met dd | gzip -> USB-HD ).
Nu vond ik dit nogal traag gaan, dus even een hdparm testje gedaan:

code:
1
2
3
4
5
6
7
8
ubuntu@ubuntu:~$ sudo hdparm -t /dev/sda

/dev/sda:
 Timing buffered disk reads:    4 MB in  3.01 seconds =   1.33 MB/sec
ubuntu@ubuntu:~$ sudo hdparm -T /dev/sda

/dev/sda:
 Timing cached reads:   1818 MB in  2.00 seconds = 909.60 MB/sec


Dat eerste getal baart mij nogal zorgen. Moet dat normaal niet rond de 40-50 MB/s zijn?
Of is dat gewoon omdat dat een 2.5" schijfje is op 5200 RPM met weinig cache?
Of DMA niet actief in Live-USB... ?

Edit: Hmm lijkt inderdaad nogal zorgwekkend...
DMA staat trouwens aan.
code:
1
 UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6


edit2: iotop geeft een read-throughput van 1200kb/s ... Pfff...

[ Voor 15% gewijzigd door DieterVDW op 15-12-2010 22:27 ]


Acties:
  • 0 Henk 'm!

  • CyBeR
  • Registratie: September 2001
  • Niet online

CyBeR

💩

sd 2:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Begin van het einde. Vervangen maar!

All my posts are provided as-is. They come with NO WARRANTY at all.


  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Yep, ben ik mee bezig.
Die throughput van 1200 kb/s is blijkbaar toch de schuld van Ubuntu Live-USB .
Geboot naar mijn Linux partitie van HD, en daar netjes ~50MB/s read throughput.
Vreemd, iemand enig idee waarom de HD access zoveel trager is in de Ubuntu Live-USB? Als ik het goed voorheb staat UDMA nochtans aan...?

Dan maar backup maken met tar, minder handig maar soit...

Verwijderd

usb je usb schijf gemounted met de sync optie?
heb weleens meegemaakt dat het daardoor heel traag werd.

  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Verwijderd schreef op donderdag 16 december 2010 @ 10:53:
usb je usb schijf gemounted met de sync optie?
heb weleens meegemaakt dat het daardoor heel traag werd.
Het probleem is niet de USB-schijf, hdparm geeft daar idd snelheiden van rond de 50MB/s .
Het is echt de interne laptop SATA HD.

  • Rainmaker
  • Registratie: Augustus 2000
  • Laatst online: 14-07-2024

Rainmaker

RHCDS

Die snelheden zijn inderdaad "nogal laag"
code:
1
2
3
4
5
root@download:~# hdparm -tT /dev/sda

/dev/sda:
 Timing cached reads:   7642 MB in  2.00 seconds = 3823.59 MB/sec
 Timing buffered disk reads: 400 MB in  3.02 seconds = 132.45 MB/sec


Dit is een virtual ESXi host op Debian. Niet helemaal eerlijk, want ESX zal ook nog wel iets van I/O caching doen.

Maar goed, dit is geen "post je hdparm score" topic.

Zoals ik al eerder zei, het is mij niet duidelijk wat hier oorzaak is en wat hier gevolg is. Misschien voor anderen wel, maar mij lijkt dat een fout op de IDE controller ook best kan leiden tot een "unrecoverable read error".

Als ik even http://www.google.nl/webh...pbx=1&fp=ef8c705bbaed2c30 kom ik onder andere uit op de 1e hit.

De 2e reply zegt al:
I have this problem both with an ordinary disk (Seagate) and with two disks (Western Digital) that are in RAID1. All disks are SATA-II, I've tried running them as SATA-I but the problem remains.
Dit doet mij dan toch eerder denken aan een probleem met de controller en niet met de disk zelf. Lullig, aangezien het een laptop is. Maar de enige manier waarop je dit zeker gaat weten is een andere schijf proberen (die je misschien voor niks koopt).

Onder ditzelfde (welliswaar oude) topic, wordt ook gezegd dat het disablen van APIC / SMP / smartd voor sommige mensen lijkt te helpen. Probeer dit eerst eens.

Aangezien het onder Windows ook gebeurd(e), denk ik toch eerder aan hardware, maar ik denk dat het niet de schijf zelf is.

[ Voor 4% gewijzigd door Rainmaker op 16-12-2010 20:48 ]

We are pentium of borg. Division is futile. You will be approximated.


Verwijderd

S.M.A.R.T. ziet er op zich prima uit (1, 6 en 7 zijn wel belangrijke indicatoren). Ik ben eerlijk gezegd ook geneigd om het te zoeken in kabel/controller.

Probeer de kabel gewoon eens te verwijderen en weer opnieuw aan te sluiten. Maatje van mij had een soortgelijk probleem, hij moest uiteindelijk de kabel daadwerkelijk vervangen door een nieuwe, maar daarna nooit meer gedoe. Het is onwaarschijnlijk, maar kennelijk kunnen zelfs de kabels het gewoon begeven. Je zou van andere componenten eerder verwachten dat ze falen.

Enfin... ik zou de HDD zelf dus nog niet zo 1, 2, 3 afschrijven. Neemt natuurlijk niet weg dat eventuele data die er nog op staat wel veilig gesteld dient te worden. Better safe than sorry.

  • deadinspace
  • Registratie: Juni 2001
  • Laatst online: 13:38

deadinspace

The what goes where now?

DieterVDW schreef op maandag 13 december 2010 @ 23:26:
code:
1
Dec 13 22:44:36 pinkie kernel: [ 1049.836660] sd 2:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Ik vind deze vrij duidelijk eigenlijk :P

  • CyBeR
  • Registratie: September 2001
  • Niet online

CyBeR

💩

deadinspace schreef op donderdag 16 december 2010 @ 21:54:
[...]

Ik vind deze vrij duidelijk eigenlijk :P
Ahuh. Zie ook mijn post :P

Overigens: SMART heeft mij werkelijk nog nooit wat nuttigs verteld. Headcrashende schijf voor m'n neus en SMART zegt 'alles ok!'.

[ Voor 25% gewijzigd door CyBeR op 16-12-2010 23:04 ]

All my posts are provided as-is. They come with NO WARRANTY at all.


Acties:
  • 0 Henk 'm!

  • jan99999
  • Registratie: Augustus 2005
  • Laatst online: 10:09
CyBeR schreef op donderdag 16 december 2010 @ 23:04:
[...]


Ahuh. Zie ook mijn post :P

Overigens: SMART heeft mij werkelijk nog nooit wat nuttigs verteld. Headcrashende schijf voor m'n neus en SMART zegt 'alles ok!'.
Smart werkt wel goed(ja niet altijd).
Je kan slechte sectoren in de gaten houden, en dus je hd op tijd vervangen.(wel de hd op een kontroller aansluiten die smart doorgeeft).
Ubuntu geeft bijv bij installatie al een foutmelding met installeren indien smart niet goed is.
Indien je nieuwe hd's koopt kun je de hd, formateren(niet de snel gebruiken) en misschien nog oppervlakte kontrolle doen, dan pas de smart gaan uitlezen. dan heb je een beetje kans dat je geen defecte hd inbouwd, zeker bij raid is dit voordelig.
Laatst 10 hd's gekocht waarvan 1 al fout was, dus direct omgeruild.
Dus smart is soms handig.

[ Voor 3% gewijzigd door jan99999 op 17-12-2010 09:08 ]


Acties:
  • 0 Henk 'm!

  • DieterVDW
  • Registratie: Juli 2002
  • Laatst online: 12-02-2017
Ik heb alvast een nieuw HD'tje aangeschaft en een externe 2.5" USB behuizing.
Dan heb ik in het ene geval een werkende laptop, en een externe HD met een twijfelachtige HD erin.
Of in het andere geval een kapotte laptop, perfect extern HD'tje en 1 overbodige HD :) .

Morgen nog eens wat experimenteren, ik laat weten als ik nog iets meer ontdek!

Edit: Ben nu mijn systeem aan het rsyncen van de slechte HD in de USB case naar de nieuwe HD.
Geen read errors, en de throughput haalt vaak enkele tientallen MB/s, maar valt soms ook terug naar 1Mb/s .
Slechte sectors op de HD veronderstel ik, waardoor de read-operatie herhaald moet worden, maar uiteindelijk wel slaagt, waardoor het OS geen read-errors ziet, enkel slechte throughput?

Ik ga het schijfje sowieso eens grondig scannen zodra mijn systeem overgezet is...

[ Voor 40% gewijzigd door DieterVDW op 17-12-2010 19:14 ]

Pagina: 1