SMART stijl stijgende Hardware ECC - Opslag en back-up

zondag 1 december 2013 23:12

Acties:

Topicstarter

Tijdens een chkdsk (/f /r), welke ik ongeveer eens per maand op alle disks uitvoer viel mij op dat er nogal wat "bad clusters" waren op data in de map "Archief". Wat er dus op duid dat die data er al heel lang, mogelijk al de hele leeftijd van de schijf, op staat.

Gewoon nieuwschierig keek ik naar de SMART data en ik zag dat een chkdsk van de hele disk 850 miljoen "Hardware ECC Recovered" bij zijn gekomen.
Nu schijnt dat volgens diverse bronnen op het web niet erg te zijn. Disktechnologie van tegenwoordig zou zo dicht zijn dat er niks foutloos gaat. Maar dat zou betekenen dat 1/3* van de bewerkingen resulteert in een fout die hij kan oplossen. Dat lijk mij wel erg veel.

Het gaat om een Samsung HD154UI van 1.5 TB met 307 power-on-days en 5600 start-stops.
Verder is de schijf gezond, geen bad-sectors of hoge temperatuur o.i.d.
Ook geven geen van mijn andere Samsung schijven deze waarden. Tweemaal 0, en een paar duizend.
Sterker nog, ik heb een seagate 1tb met bijna 500 relocated sectoren draaien (puur als experiment) en die zit onder de 40 miljoen na twee chkdsks.

Heeft iemand ervaring met dergelijke piekende waarden?

[ Voor 3% gewijzigd door jeroen3 op 01-12-2013 23:14 ]

maandag 2 december 2013 00:36

Acties:

Verwijderd

Zonder ECC kan een moderne hardeschijf vrijwel niets meer teruglezen, dus dat is normaal. Post je SMART output om meer info te krijgen; je kunt namelijk wel relatieve gezondheid afleiden aan de genormaliseerde waarden. Dus post een screenshot van CrystalDiskInfo van je disk en ik kan je daar meer over vertellen.

De raw waarde is bij sommige attributen 'binary encoded'. Dus een groot getal zoals 84379439824739287 betekent niet miljoenen fouten, maar betekent bijvoorbeeld 30 fouten de afgelopen minuut, 5900 fouten de afgelopen uur, enzovoorts. Kortom, er kan meer informatie worden gecodeerd in een enkel veld. Hetzelfde geldt voor de temperatuur; een hoog getal betekent niet dat je schijf miljoenen graden warm is, maar in dat getal zijn meerdere dingen gecodeerd opgeslagen. Denk aan de hoogste temperatuur gemeten, laagste en gemiddeld, en huidige temperatuur. Elke fabrikant kan dit weer anders opslaan, dus echt veel heb je hier niet aan. Maar je kunt aan de genormaliseerde waarden vaak wel de informatie halen die je nodig hebt.

vrijdag 6 december 2013 22:56

Acties:

jeroen3

Topicstarter

Hardware ECC Recovered is kennelijk een veld wat elke powerup gereset word. Ik heb nu weer chkdsk draaien en er zijn weer een aantal bad clusters (geen bad sectors) gevonden en restored.

Smart data report

Zijn deze foute clusters gerelateerd of is dat gewoon versleten data?

code:

1
2
3

CHKDSK is verifying file data (stage 4 of 5)...
10 percent complete. (3661 of 124656 files processed)
Windows replaced bad clusters in file 3688

[ Voor 17% gewijzigd door jeroen3 op 06-12-2013 22:57 ]

zaterdag 7 december 2013 04:07

Acties:

Wim-Bart

Zie signature voor een baan.

Ik zou eens kijken naar je SATA kabel. Windows is nu sectoren aan relocaten en bad markeren op een gezonde disk

Beheerders, Consultants, Servicedesk medewerkers. We zoeken het allemaal. Stuur mij een PM voor meer info of kijk hier De mooiste ICT'er van Nederland.

zaterdag 7 december 2013 17:05

Acties:

jeroen3

Topicstarter

Zou de "ATA CRC Error count" en "End-to-end error" dan niet iets moeten aangeven?

zaterdag 7 december 2013 17:11

Acties:

Verwijderd

End-to-End error = DRAM geheugenchip defect (meestal)
UDMA CRC Error Count = corruptie bij kabeltransfers; kortom kabelproblemen.

Wat er precies wordt bedoeld met

Windows replaced bad clusters in file 3688

is mij niet helemaal duidelijk. Hangt ook enorm veel af of je SMART na of voor actieve interventie hebt verzameld. Als je eerst chkdsk hebt gedaan en daarna pas de SMART hebt opgevraagd, dan heb je mogelijk bewijsmateriaal vernietigt. Je zult dan nooit meer weten of je bad sectors had die eventueel zijn reallocated.

Een HDTune error scan kun je verder doen. Afgezien hiervan kan het prima zijn dat er simpelweg corruptie was op je disk en dat de disk zelf prima functioneert. Aan de hand van de SMART info kan ik geen problemen zien met de disk zelf. Maar zoals gezegd: als je de SMART hebt uitgelezen nadat je actieve utilities hebt gebruikt, betekent dat verder weinig. SMART moet je juist uitlezen voordat je gaat 'kloten' met allerlei utilities. Dan zijn pending sectors en dergelijke gewoon nog te zien. Die kunen verdwijnen uit de SMART door gebruik van actieve utilities zoals een surface scan.

zaterdag 7 december 2013 17:14

Acties:

jeroen3

Topicstarter

Ik ben nu een full surface test aan het doen. Maar dat duurt eeuwen.
Er is nooit sprake geweest van Pending sectors of Reallocated sectors.

zaterdag 7 december 2013 17:17

Acties:

leuk_he

1. Controleer de kabel!

Kijk ook even je eventlog na op diskfouten. dma (met name usb-kabel) fouten kom je alleen daarin terug, maar resulteren uiteindelijk corrupte data. (file -> run "eventvwr.msc" )

Need more data. We want your specs. Ik ben ook maar dom. anders: forum, ff reggen, ff topic maken
En als je een oplossing hebt gevonden laat het ook ujb ff in dit topic horen.

zaterdag 7 december 2013 17:42

Acties:

Verwijderd

jeroen3 schreef op zaterdag 07 december 2013 @ 17:14:
Ik ben nu een full surface test aan het doen. Maar dat duurt eeuwen.

2 tot 4 uur, inderdaad.

Er is nooit sprake geweest van Pending sectors of Reallocated sectors.

Dat zul je dus nooit meer weten. Als je wel pending sectors had en je voert daarna een surface scan uit, kan het zijn dat daardoor je pending sectors verdwijnen. Dan kunnen deze wel degelijk problemen hebben veroorzaakt in het verleden, maar is ieder bewijs hiervan vernietigt door het gebruik van actieve utilities.

SMART is vooral nuttig als je het regelmatig uitleest en bij de minste verdenking eerst de SMART uitleest voordat er andere utilities worden gebruikt.

zaterdag 7 december 2013 22:48

Acties:

jeroen3

Topicstarter

Surface read test is 100% OK. Ik snap er niets van.

[ Voor 27% gewijzigd door jeroen3 op 07-12-2013 22:48 ]

zaterdag 7 december 2013 23:05

Acties:

Verwijderd

Bad clusters duidt wellicht op schade van het filesystem zelf; en niet zozeer bad sectors op de hardeschijf. De pending sector is 0 dus dat er geen surface read errors zijn bevestigt dit. Kortom de schijf is prima, je hebt filesystem schade gehad.

zondag 8 december 2013 07:18

Acties:

jan99999

Andere data kabel gebruiken, en testen.
Dan kun je nog hd op andere poort hangen.
Of andere controller proberen.

Fouten kun je ook krijgen van software op je pc,
virusscanner zit overal tussen,
firewall zit er ook tussen,
spyware scanner,
etc.
Zelf heb ik eens gehad dat de firewall 1 op de 10 files beschadigde via het netwerk.(dus van 10 700 mb films was 1 beschadigd).
Een test die je kunt doen is, om veel data bijv 40 GB, te parren en dan kopieren naar andere locatie, dan weer par2 draaien, en kijken of het klopt.(40 GB, dus 1 film met par files, in meerdere mappen stoppen zodat je map groot wordt).

Surface read test is 100% OK. Ik snap er niets van.
Bij nieuwe hd's werkt dit vaak niet meer omdat de schijf zichzelf repareert, en dus geen fouten meld, of geen fouten laat zien aan bijv hd tune.

zondag 8 december 2013 13:18

Acties:

Hell-Slave

Is je werkgeheugen nog goed?
(Test het met memtest86)
Dit kan ook voor corrupt bestandssysteem zorgen.