Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Check je SMART topic





Voor wie is dit topic?
Is jouw schijf al met één platter in de digitale hemel? Of zijn al die waarschuwingen maar overdreven en kan je schijf nog prima mee?

In dit topic kun je ons vragen om de SMART van jouw hardeschijf of SSD te analyseren. Je post een screenshot van de SMART-gegevens met daarbij de informatie om welke schijf het gaat en welke klachten er zijn. Wij zullen vervolgens jouw SMART bekijken en je van advies voorzien. Gratis en voor niets! ;)


Wat zijn de regels?
  • Je post een beknopte uitleg over waarom je om advies vraagt en of er concrete klachten zijn of vermoedens dat de schijf niet goed werkt.
  • Je post een screenshot waarbij alle SMART gegevens zichtbaar zijn.
Het posten van lange lappen text is niet toegestaan; maak een plaatje/screenshot van de SMART gegevens. Alleen als het echt niet anders kan, mag je als text posten. Maar dan moet het wel specifiek om de SMART attributen gaan en niet de gehele SMART error log. Dergelijke posts worden verwijderd.


Tip: stel de output in als decimaal
Gebruik je CrystalDiskInfo om de SMART uit te lezen, weet dan dat je het beste de output kunt instellen op decimaal ipv hexadecimaal. Dit doe je als volgt:

Menu: Function -> Advanced Feature -> Raw Values -> 10 [DEC]


Tip: doe NOOIT actieve tests voordat je de SMART hebt uitgelezen!
Maar al te vaak gaan mensen bij veronderstelde problemen met hun hardeschijf allerlei testjes uitvoeren. Populair daarbij is ook de utility van de fabrikant. Maar al te vaak gebeurt het dat zij deze utilities draaien voordat de SMART-gegevens zijn uitgelezen. In dat geval kun je spreken van contaminatie omdat de SMART niet meer betrouwbaar bewijs is. Het zou namelijk prima kunnen dat de hardeschijf utility van de fabrikant wijzigingen heeft aangebracht en bad sectors heeft verholpen. Vaak gebeurt dit zonder de gebruiker goed te informeren. De gebruiker krijgt dan gewoon te zien dat de schijf 'PASSED' is en dus in orde lijkt te zijn. Als de gebruiker daarna de SMART uitleest en ziet dat er geen bad sectors zijn, is de waarheid compleet verhuld. Zo zou de gebruiker nooit weten of er iets mis is geweest met de schijf.

Dus doe jezelf een lol en stel eerst de SMART gegevens veilig voordat je gaat prutsen met allerlei utilities. Bovendien is het zo dat een simpele surface scan genoeg is; het is niet alsof speciale utilities andere dingen doen. Alle handelingen met je hardeschijf kunnen de SMART beïnvloeden. Je wilt graag bewijs zodat je weet of je schijf een probleem heeft gehad. Dit verstoor je door eerst actieve utilities te draaien en daarna pas de SMART uit te lezen; dat kun je dus beter andersom doen. Lees je dit te laat en heb je al actieve utilities gedraaid? Dan zul je nooit meer zeker weten of de SMART die je nu ziet is veranderd. Als er nu staat 0 bad sectors kan het zijn dat je eerst wel degelijk bad sectors hebt gehad. Die informatie is dan voorgoed verdwenen; alsof het bewijs op professionele wijze is verdoezeld. Kortom, probeer zuinig te zijn met je SMART als je wat over je hardeschijf of SSD wilt weten.

Veel succes! :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Wat betekenen die Current, Worst en Threshold waarden?
Current/Worst/Threshold (Nederlands: Huidig/Slechtste/Drempel) zijn genormaliseerde waarden tussen de 0 en 255, oftewel precies één byte, 8 bits.

Voor deze waarden geldt dat hoe hoger hoe beter. Vaak beginnen de waarden op 100, 150 of 200. Dat is de best mogelijke waarde. Zodra een bepaald attribuut het slechter doet, kan de genormaliseerde waarde doen afnemen. De Current-waarde is de genormaliseerde waarde op dit moment, terwijl Worst de laagste waarde is die ooit gemeten is.

Voorbeeld: de temperatuur kan absoluut 40 graden zijn. De Current-waarde kan dan 60 zijn (100 - 40) terwijl de Worst-waarde 50 kan zijn. Dat verhult dat in het verleden de schijf ooit maximaal 50 graden is geworden. De Threshold kan 40 zijn, wat overeenkomt met 60 graden celcius.

De Threshold-waarde geeft aan dat als de Current-waarde onder deze waarde zakt, er een SMART failure wordt gegenereerd. Dan kan bijvoorbeeld je BIOS zeggen dat je hardeschijf aan het falen is. Officiëel hoor je dan 'FAILING NOW' te zien als je met een goed programma de SMART uitleest. Is de huidige waarde echter al weer hoger geworden, dan zal nog steeds de 'Worst'-waarde onthullen dat in het verleden deze waarde onder de Threshold is gezakt. Een goed programma zegt dan 'In_The_Past'.

Het interpreteren van SMART gaat altijd fout. Er is geen enkel programma ter wereld die dit helemaal correct doet. Fabrikanten misbruiken SMART ook en houden zich vaak niet aan de SMART-specs. Bijvoorbeeld door de temperatuur in absolute getallen weer te geven in de Current waarde; waardoor een lager getal beter is ipv slechter zoals SMART ontworpen is. Vooral OCZ en andere misbaksels maken zich hier schuldig aan.

CiPHER wijzigde deze reactie 22-07-2014 01:32 (108%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Uitleg over de SMART attributen:


1: Raw Read Error Rate
Dit attribuut geeft de verhouding weer tussen leesacties die géén errorcorrectie nodig hebben en leesacties die zouden mislukken als er geen ECC errorcorrectie voorhanden was. Hardeschijven kunnen niet meer zonder ECC maar als je relatief vaak ECC nodig hebt, kun je sneller onleesbare sectoren krijgen.

Kortom, dit attribuut geeft weer hoe snel je - relatief aan hoeveel data je leest - naar errorcorrectie moet grijpen. Ideaal zou zijn dat je nooit errorcorrectie nodig hebt en dus een grote marge hebt dat als een sector een keer veel slechter dan het gemiddelde doet, je heel veel errorcorrectie mogelijkheid over hebt. Maar als je standaard al heel veel bit errors moet corrigeren voor elke sector, en sector X heeft meer dan gemiddeld aantal biterrors, dan is het risico groot dat het aantal bit errors groter is dan de ECC errorcorrectie kan corrigeren. Een dergelijke schijf wordt gatenkaas met veel bad sectors; dat betekent omruilen voor garantie of permanent afschrijven.

2: Reallocated Sector Count
Aantal omgewisselde sectoren met reserve sectoren. Dit gebeurt alleen als een sector fysiek beschadigd is. Maar dat is tegenwoordig vrij zeldzaam. Minimaal 90% van de bad sectors zijn bad sectors zonder fysieke schade maar waarbij de errorcorrectie mogelijkheid onvoldoende is om de data foutloos te kunnen lezen. Typerend hierbij is dat het overschrijven van de sector met nieuwe data betekent dat die sector weer bruikbaar is; bij een fysiek beschadigde sector is dat niet zo. Zodra je een bad sector overschrijft met nieuwe data zal de hardeschijf testjes doen en als de sector nog steeds problemen geeft, dan wordt deze omgewisseld met een reserve sector; zo niet dan blijft hij gewoon in gebruik en is het geen bad sector meer.

3: Current Pending Sector
De allerbelangrijkste SMART-attribuut. Dit is het aantal onleesbare sectoren; dat kunnen bad sectors zijn mét of zónder fysieke schade, zoals hierboven uitgelegd. Zodra je deze sectoren overschrijft, verdwijnen ze omdat de sector dan weer in gebruik genomen wordt en goed werkt, of deze wordt omgewisseld met een reserve sector. De Current Pending Sector raw-value wordt dan weer lager. De raw value moet altijd 0 zijn, wat betekent geen bad sectors op dit moment.

4: Offline Uncorrectable
Hetzelfde als Current Pending Sector maar dit attribuut wordt niet continu bijgewerkt. Dus als je bewijs hebt vernietigt met een zero-write en Current Pending Sector is 0, dan kun je hieraan nog wel zien dat je in het verleden bad sectors had.

5. UDMA CRC Error Count
Dit betreffen kabelfouten. Niet de stroomkabel maar de roodkleurige datakabel die van het opslagapparaat naar de I/O controller gaat - vaak het moederbord. In tegenstelling tot veel andere attributen, gaat dit getal nooit meer omlaag. Dus als je eenmaal 30 kabelfouten hebt, blijft dit zo totdat er nieuwe fouten bij komen. Dit betekent dat je de eerste keer dat je dit ziet, niet weet hoe lang geleden dit is gebeurd. Het kan zijn dat dit in een ver verleden was en je schijf nu absoluut geen kabelfouten meer heeft. Dit kun je vrij eenvoudig controleren: bekijk de SMART nogmaals een paar dagen later. Is de (raw-)waarde gelijk gebleven? Dan heb je geen kabelfouten meer gehad sinds de laatste keer. Indien de waarde is gestegen, heb je dus nog wel problemen en is het vervangen van de kabel een optie. In mijn eigen ervaring is het goed aandrukken van de kabel en zorgen dat deze geen sterke buigingen heeft veelal voldoende. Maar je kunt ook een slechte kabel hebben. Het kan zijn dat een kabel prima werkt op SATA/300 snelheid, maar dat op SATA/600 er zich problemen voordoen. Er bestaat echter maar één 'SATA' kabel. Dus als je kabel niet werkt op SATA/600 - ook al is hij oud - dan is het gewoon een slechte kabel die niet aan de specificaties voldoet. Je kunt grofweg aan de dikte afleiden hoe goed de kabel is.

CiPHER wijzigde deze reactie 07-07-2015 18:09 (118%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Current Pending Sectors zijn actieve bad sectors en derhalve zeer gevaarlijk. Het zijn gebieden (sectoren) die onleesbaar zijn, en de schijf weet dat omdat het al eerder probeerde deze plekken uit te lezen en dat is destijds niet gelukt.

Het kan zijn dat de plekken niet in gebruik zijn. Dan is het niet zo erg en zal het vanzelf 'over' gaan zodra de plekken overschreven worden; dan verdwijnt het probleem omdat de schijf al dan niet de sector omwisselt voor een reservesector, al is dat vaak niet nodig en kan met overschrijven dezelfde 'bad sector' gewoon weer dienst doen.

Echter, als de sectoren wel in gebruik zijn dan kun je grote problemen krijgen. Denk aan hangende applicaties, blauwe schermen of zelfs bootproblemen. Of de vraag of je de schijf wilt formatteren als je deze aanklikt. Dit zijn allemaal symptonen van bad sectors. Maar vooral het 'hangen' en bevriezen van applicaties is een duidelijk symptoon van actieve bad sectors.

Wat te doen? Een zero-write oftewel een lange format van 3+ uur is iets wat alle pending sectoren zou moeten laten verdwijnen. Na zo'n procedure zou je in de SMART de 'Current Pending Sector' weer op een raw value van 0 moeten hebben staan.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
RemcoDelft schreef op woensdag 30 april 2014 @ 15:29:
Hoewel ik totaal geen problemen ondervind, en de "Overall Health Self-Assessment Test PASSED" zegt, verbaas ik me over de vele "pre-failure" en "old age" meldingen, op al mijn 3 disken. Oftewel ik ben wel benieuwd wat dit betekent..
Dat is gewoon het type van het attribuut. Elke regel is een attribuut die ofwel een indicatie geeft van vroegtijdig falen (pre-failure) ofwel een indicatie geeft van ouderdom (old age). Bijvoorbeeld een attribuut hoe lang de schijf heeft gedraait (Power on hours) is niet een indicatie van vroegtijdig falen, maar van ouderdom. Maar mechanische problemen zoals Seek Error Rate zijn wel degelijk indicaties dat de schijf aan het sterven is en er dus daadwerkelijk wat aan de hand is.

Kortom, wat jij interpreteert als 'meldingen' dat er iets mis is, is dit gewoon SMART vakjargon wat aangeeft wat voor attribuut het is, met welk nut.
quote:
Disk 1 (64 GB SSD):
Prima. Je zit op 1% van de rated erasecycles (MWI). Dus nog 99% life te gaan, mits je SSD het volhoud qua firmware/mapping tables. Je hebt geen power-safe capacitors dus voorzichtig met afsluiten. Dat lijkt goed te gaan, bij jou staat de teller op 0. Dat is overigens vrij zeldzaam, maar geeft aan dat je de computer netjes gebruikt qua opstarten/afsluiten en er geen crashes zijn geweest.
quote:
Disk 2 (320 GB backups):
41 tot 50 graden is aan de warme kant, maar verder oke. Dit soort oudere schijven draaien nu eenmaal warmer dan huidige schijven en verbruiken ook twee keer zoveel stroom.
quote:
Disk 3 (1.5 TB data)
Draait veel koeler met 28 graden. Modernere schijf. Door de hogere datadichtheid ook meer problemen met uBER. Dat veroorzaakt bad sectors - Reported Uncorrectable. Maar die zijn als het goed is niet actief, omdat Current Pending Sector op 0 staat. Dus dan zou het gaan om het verleden. Voor de zekerheid kun je een surface scan doen, zoals met HDTune de Health scan. Dan lees je al het oppervlak en zullen bad sectors ook tevoren komen als rode stipjes.

Kortom, allemaal wel oke. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Je SSD heeft genoeg life over hoor; je zit pas op 4TB writes.

Je ada1 hardeschijf heeft wel veel bad sectors. Een twintig stuks zijn al gerepareerd bijvoorbeeld door een ZFS scrub. De rest kan zijn dat deze niet in gebruik is. Maar tegen de 100 bad sectors is wel redelijk veel. Die schijf moet je in de gaten houden. In principe kan ZFS er wel tegen mits je pool redundant is, maar die bescherming heb je dus wel nodig. Je kunt je voorstellen wat er was gebeurd als je nu Linux ext4 of Windows fs gebruikte.... dan had je flinke problemen gehad.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Voor een nieuwe schijf zou ik dit niet accepteren nee. Vooral de pending sectors en de reallocated sectors zijn niet zo fijn. Het gaat immers niet om factory bad blocks...

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
@Flying,

Dit topic gaat over interpreteren van SMART-gegevens. Jij hebt een klacht over een hardeschijf wat verder weinig met je SMART te maken heeft; daarin zijn geen afwijkende zaken te zien. Je klaagt over een trage hardeschijf. Om je daarmee te kunnen helpen dien je een nieuw topic aan te maken. Dan heb ik wel wat tips voor je die je kunt proberen.

WD Green is overigens sneller dan heel veel 7200rpm, 10.000rpm en 15.000rpm schijven. Dus dat het een 5400rpm-class schijf is, is geen reden voor lage snelheden.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • +1Henk 'm!
Een centraal topic over het onderwerp zou juist de wildgroei aan topics ('er is wat met mijn hdd' en 'mijn hdd doet gek') moeten voorkomen. Ook kun je bij het lezen van dit topic al een aardig idee krijgen.

Verder is het idee dat ik in de 2e en 3e posts die ik heb gereserveerd, een uitleg komt over hoe je SMART kunt interpreteren. Twijfel je nog, dan kun je altijd je SMART posten. Het idee is dat mensen meer op de hoogte zijn van wat je met SMART kunt en hoe het werkt.

Kortom, ik vind het juist een aanvulling voor OT. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Een schijf met zoveel bad sectors (Current Pending Sector) kun je beter met garantie laten omruilen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Raw values kunnen 'binary encoded zijn'. Een groot getal slaat dan meerdere getallen op. Bijvoorbeeld de min/max/avg temperatuur, allemaal in één getal verwerkt. Je moet dan weten hoe je die waarde interpreteert om de betekenis te kunnen achterhalen. Maar je kunt ook simpel naar de genormaliseerde waarden kijken. Daar zie je 65 staan bij Airflow Temperature. Dat betekent 100 - 65 = 35 graden celcius. Een worst-waarde van 57 betekent dat hij ooit 100 - 57 = 43 graden celcius is geweest. De grenswaarde is 45, dat komt overeen met een temperatuur van 55 graden. Als je schijf ooit zo warm zou worden, zou die regel met Airflow Temperature geel of roodgekleurd worden weergegeven. Ook zou er een waarschuwing worden afgegeven.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je OS-schijf heeft nog één actieve bad sector en dien je te formatteren en de partitietabel opnieuw initialiseren. Dan opnieuw installeren en de pending sector zou weg moeten zijn.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
quote:
Jolke schreef op dinsdag 20 mei 2014 @ 13:51:
Dat lijkt me ook duidelijk in het tweede plaatje: status op failed en temperatuur van 63 graden.
Dat is een genormaliseerde waarde, die zoals het hoort 'omgekeerd' is. 0 graden = waarde van 100 (soms 150 of 200) en 100 graden = waarde van 0. Voor genormaliseerde waarden geldt: hoe hoger hoe beter.

63 is dus 37 graden want 100 - 63 = 37. De schijf is (100 - 44 = ) 56 graden geweest in het verleden, wat warmer is dan de max 55 graden die de Threshold aangeeft. Daarom is het balkje ook roodgekleurd. Maar dat is erg overdreven; een graad lager en alles zou ok geweest zijn. Een keertje 56 graden bereiken is ook geen dooddoener. Continu sterke fluctuaties van temperaturen zou wel schadelijk kunnen zijn.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Je schijf heeft in elk geval in het verleden ongeveer 1000 bad sectors gehad, door onvoldoende errorcorrectie; dus niet fysiek beschadigd. Dit kan inderdaad tot problemen leiden, van bootproblemen tot blauwe schermen tot 'hangende' applicaties.

Dat gezegd, dit soort 'bad sectors' horen erbij, al is 1000+ wel een hoog getal. In de toekomst met een modern filesystem (ReFS voor Windows, Btrfs voor Linux, ZFS voor UNIX) kun je hardeschijven met bad sectors door onvoldoende errorcorrectie (uBER bad sectors) wel prima gebruiken. Maar NTFS en Ext4 enzo is hier niet tegen bestand.

Je hebt inderdaad niet de meest betrouwbare schijf, maar ik wil wel opmerken dat de mechanische kwaliteit hier totaal los van staat. Het kan zijn dat mechanisch gezien alles 20 jaar mee gaat maar dat je door onvoldoende errorcorrectie wel af en toe last van 'bad sectors' het. Dat ligt eigenlijk in het ontwerp van het apparaat, al kan het per exemplaar sterk verschillen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Druk druk druk, maar binnenkort ga ik zeker wel verder hoor. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
quote:
Sir_Hendro schreef op vrijdag 23 mei 2014 @ 09:46:
Zover ik weet is werken met SMART waardes heel simpel. het enige wat echt belangrijk is zijn 'reallocated sector count'.
Zo simpel is het niet, en wat je vertelt is ook niet helemaal waar. Reallocated Sector Count is ongevaarlijk, maar als deze blijft stijgen kan dat een indicatie zijn van een slecht mediumoppervlakte. Wat wel gevaarlijk is, is de Current Pending Sector. Dit zijn actieve bad sectors waar je acuut problemen mee kunt krijgen. Die zijn extreem gevaarlijk; een enkele pending sector kan een schijf uit de RAID array schoppen bijvoorbeeld, als je Windows onboard RAID of hardware RAID gebruikt. Reallocated sectors zijn onzichtbaar voor de host en kunnen nooit meer problemen geven.
quote:
Uiteraard geldt dit alleen voor traditionele HDD's. Bij solid state drives mag je wel reallocated sectors op de teller hebben omdat ze hier gewoon defect zijn gegaan vanwege te vaak overschrijven.
Wat je nu zegt is redelijk zeldzaam. In de praktijk is het zo dat veel beschreven NAND cellen een lagere retentietijd hebben, en dus een grotere kans op een actieve 'bad sector' oftewel een onleesbare page. Bij USB sticks komt het wel voor, maar bij SSDs is het erg uitzonderlijk om problemen te krijgen met MWI en retentie. Dan moet je een SSD behoorlijk hebben uitgewoond.

Ik raad je aan om dit verhaal over SMART eens te lezen, dan heb je denk ik meer achtergrond over hoe SMART werkt en hoe de attributen op elkaar inspelen. Met name Current Pending Sector is cruciaal om te weten; dat is het belangrijkste SMART-attribuut.

CiPHER in "Het grote ZFS topic"
quote:
Farmie schreef op vrijdag 23 mei 2014 @ 09:41:
Ik heb een PC met volgende S.M.A.R.T. waarden
(.)
De PC begon vast te lopen bij bepaalde applicaties en verschillende random errors schermen te tonen in Windows.
Moet deze schijf best vervangen worden?
Enorm veel bad sectors (Current Pending Sector). Schijf kun je beter niet meer gebruiken; alleen ZFS zou hem goed kunnen gebruiken. Als je garantie hebt zeker omruilen deze schijf.
quote:
sjteef1986 schreef op vrijdag 23 mei 2014 @ 09:19:
Harddisk van Qnap geeft status ABONORMAL

Nu staat alles bij smart op OK.
Moet ik me zorgen maken voer de raw value's ?

[afbeelding]
Je hebt precies de verkeerde getallen omcirkeld. Alles wat je hebt omcirkeld is onschuldig. Wat je over het oog ziet zijn de meer dan duizend bad sectors die natuurlijk een acuut probleem vormen. Ernstig genoeg om ook deze schijf te vervangen indien mogelijk.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Veel fysieke ad sectors. Verder weinig aan te zien. Maar als je garantie nog hebt zou ik hem zeker omruilen. De kans is namelijk groot dat er meer bad sectors bijkomen, al hoeft dat niet altijd zo te zijn. Er zijn prima gevallen waarbij een schijf met veel bad sectors prima verder werkt. Maar 1500+ is wel erg veel wat mij betreft.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Je hebt defecte sectors (Reallocated Sector Count) je hebt enorm veel actieve bad sectors (Pending Sector COunt) en je Raw Read Error Rate is heel slecht; wat opzich geen probleem is maar leidt tot meer bad sectors. Kortom, deze schijf kun je afschrijven.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Nee hoor; gewoon wat pending sectors. Wel veel, maar nog niet omgewisseld. Je kunt zo'n schijf prima gebruiken als je een modern filesystem gebruikt (ReFS, Btrfs, ZFS). Je kunt hem beter niet meer gebruiken voor legacy storage (NTFS, Ext4, HFS, RAID). Je kunt de bad sectors laten verdwijnen door een lange format uit te voeren. Daarna zou de Current Pending Sector op 0 moeten staan. Op dat moment heb je (voorlopig) geen bad sectors meer.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Zie de reactie boven je.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
MotorWout: één van de regels in dit topic is dat alle SMART-informatie zichtbaar moet zijn. Het is prima als je specifiek informatie wilt over één attribuut, maar kun je ajb ook de rest posten?

Verder: welk programma is dit? Is dit van Ubuntu ofzo?

Het is jammer dat SMART bijna ALTIJD verkeerd wordt geïnterpreteerd. Wat daar staat "Een waarde anders dan nul wijst op een probleem met het schijfoppervlak of met de lees/schrijfkoppen". Dat is absoluut flauwekul.

Hoe zit dat nou? Alle hardeschijven maken leesfouten; daarom is errorcorrectie (ECC) ook cruciaal. Alleen héél oude hardeschijven kunnen zonder errorcorrectie; maar dat is prehistorisch. Een moderne hardeschijf kan jouw gegevens niet meer lezen zonder deze errorcorrectie. Daarvoor is de datadichtheid veels te hoog.

De mate waarin errorcorrectie nodig is; hoeveel bitfouten per X gelezen data, dat is wel relevant. Dat is de Raw Read Error Rate. Dat laatste is cruciaal: rate betekent verhouding. Het gaat dus in de mate waarin er errorcorrectie nodig is. Een laag niveau is wenselijk: dan heb je veel errorcorrectie tot je beschikking maar je hebt het spaarzaam nodig. Weinig bitfouten dus. Dat betekent dat je mediumoppervlakte in gezonde toestand is; iets wat je mag verwachten van een nieuwe en gezonde schijf. Als je schijf ouder is, of van mindere kwaliteit, kan het zijn dat je schijf 'op zijn tenen' loopt en heel sterk op de errorcorrectie vertrouwt om je data terug te krijgen. Er is dan weinig marge voor als een bepaalde sector wat extra bitfouten heeft. Concreet betekent een slechte RRER-waarde dus, dat er sneller bad sectors kunnen worden gevormd.

In jouw geval is de genormaliseerde waarde 120. Hiervoor geldt: hoe hoger hoe beter. 99 is de slechtst gemeten genormaliseerde waarde. Pas bij een genormaliseerde waarde onder de 6 gaat dit attribuut van 'Goed' naar 'Slecht' of 'Gefaald'. Je kunt hierdoor concluderen dat het prima in orde is met het niveau van biterrors op jouw schijf. Je mediumoppervlakte is van prima kwaliteit. De raw-value kun je eigenlijk niets mee. Daarvoor moet je weten hoe de fabrikant dit heeft geprogrammeerd. De hardeschijf zelf bepaalt de genormaliseerde waarden, dus dat geeft wel een prima indicatie hoe de hardeschijf zelf denkt over een bepaald attribuut.

Bij sommige attributen is de genormaliseerde waarde relevant, zoals voor RRER (#1). Maar bij andere attributen is de raw-value juist het enige wat telt; zoals bij Current Pending Sector - het aantal bad sectors op dit moment nog in gebruik. Dat moet inderdaad altijd 0 zijn, anders heb je een probleem.

G-sense kan alleen wat zeggen als de schijf schokken heeft ondervonden terwijl het van stroom is voorzien; dat zegt dus niets over transport van de schijf in passieve toestand. Je kunt dus niet weten hoe goed het transport is geweest. Helaas.

Je kunt de gezondheid van een schijf niet zonder gedetailleerde kennis vaststellen op basis van de SMART. Er zijn veel utilities die deze informatie proberen te interpreteren. Maar dat gaat altijd fout: een beetje fout zoals in die beschrijving, tot klinklare onzin als "60% health" en dat soort uitspraken. Als een schijf bad sectors heeft enzo, kun je wel stellen dat er een probleem is. Maar de gezondheid in procenten uitdrukken, daar frons ik mijn wenkbrauwen van.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
@knorde: je SMART is prima.

@MotorWout: hoge temperatuur kan veroorzaakt worden omdat je kast ambient temperatuur hoog is; dus hoeft niet door de schijf zelf te komen. Verder, weet je zeker dat hij spinned down is? Vermoedelijk heeft je kast gewoon te weinig airflow.

En SMART niet goed ontworpen; dat is misschien waar, maar om andere redenen dat jij noemt. Het is simpelweg niet mogelijk om één interpretatie te maken of een schijf goed is. Dat is afhankelijk van zoveel factoren en je kunt maar een beperkt aantal factoren objectief meten. Hetzelfde geldt voor een mechanisch product zoals een auto; daar kun je ook niet een teller hebben 'Binnen 7 uur en 24 minuten en 23 seconden gaat uw motor stuk'. Hooguit kun je zeggen dat bepaalde onderdelen na xxx kilometer dienen te worden vervangen, maar dat is dus vooral preventief niet omdat er een directe aanleiding is om te denken dat het onderdeel defect aan het raken is.

CiPHER wijzigde deze reactie 27-07-2014 23:24 (55%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
knorde schreef op zondag 27 juli 2014 @ 23:31:
Kan de controller ook de oorzaak zijn van de write error rate, of is dit echt iets wat op de schijf zelf gebeurt of is er geen oorzaak aan te wijzen voor dit gedeelte?
Wat houdt deze error nou precies in en wat gaat er nou precies mis, ik ben daar wel eens benieuwd naar.
Waarom gebeurt dit op hdd1 niet en op hdd2 wel?
Dit is een mechanisch issue van de schijf zelf; niet van de controller. Alleen UDMA CRC Error Count is vrijwel altijd niet de schuld van de schijf; en temperatuur en G-sense enzo opzich ook. Maar de rest zijn gewoon issues van de schijf.

Mechanische techniek werkt niet altijd 100%, maar dat is niet erg. Als het een keer niet lukt dan wordt er gewoon opnieuw geschreven. Het lokaliseren van een sector is precisiewerk en wellicht dat trillingen/vibraties ook invloed hebben.

Maar we praten over 6x een write error; geen 20.000 keer. Dus we praten helemaal nergens over.
quote:
Of moet ik dat gewoon vergeten en lekker gaan genieten van mijn pc
Lijkt mij een goed plan! :Y
quote:
MotorWout schreef op maandag 28 juli 2014 @ 11:29:
@Cipher: Wat de temperatuur betreft: Die kan inderdaad veroorzaakt worden door een hoge ambient. Dat is hier echter niet het geval. Ik had al eerder aangegeven dat andere hhd's in hetzelfde systeem een significant lagere temperatuur laten zien.
Daar heb ik dan geen verklaring voor. Hooguit dat de schijf op dat moment toch niet spinned down was.
quote:
Geert de Graaf schreef op dinsdag 29 juli 2014 @ 10:29:
Het aantal blijft maar oplopen (regel 5) vervangen of niet?
[afbeelding]
Toch een groot aantal omgewisselde sectoren. Als je garantie hebt zeker laten omruilen. Zo niet dan kun je hem nog prima gebruiken maar het is mogelijk dat hij een hogere kans op falen heeft dan een nieuwe schijf. Dat gezegd, passieve bad sectors zijn geen gevaar voor je data. Alleen actieve bad sectors zijn een gevaar. Een schijf zal namelijk een sector alleen omwisselen als de data nog gelezen kon worden of als er naar geschreven wordt; dus zonder gegevensverlies.
quote:
-The_Mask- schreef op dinsdag 29 juli 2014 @ 17:28:
Bij Seagate (en Samsung's uit de Seagate fabriek) is dit niet zo, daar is een hoge RRER normaal, dus ik denk dat daar gewoon elke RRE wordt geteld.
Dat hoeven geen absolute getallen te zijn; dit kan ook 'binary encoded' zijn zoals informatie over het verleden. Zelfde geldt voor de temperatuur twee posts boven jou; die schijf is geen 219 miljard graden Celsius. Een dergelijk hoog getal betekent in feite dat er meerdere getallen in één hexadecimale waarde zijn gestopt.

Met mijn eigen schijven veranderde de RRER ook in grote stappen; ook in negatieve zin. Als het aan absolute counter zou zijn, zou dit niet mogen. Bovendien is de SMART spec heel duidelijk dat het een rate betreft. Men zou het ook in percentage kunnen uitdrukken; per x reads x aantal keer correctie nodig = x % raw error rate. Een equivalent is Hardware ECC Recovered.

Het is natuurlijk wel mogelijk dat per fabrikant/schijf verschilt wat de raw value precies betekent. Daarom heb je er eigenlijk niets aan zonder te weten welk algoritme er achter ligt die deze cijfers produceert. Wel kun je wat zeggen over de genormaliseerde waarden en de afstand tot de Threshold.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

De rated cycles zit vaak op 300.000 of 600.000. Dus het is goed dat je dat nu hebt beperkt. Het is overigens niet zo dat je je gelijk zorgen hoeft te maken. Je kunt ook 1,2 miljoen load cycles hebben en dat je schijf nog prima functioneert. Maar het is wel mechanische slijtage en dat betekent dat je HDD hierdoor sneller defect kan raken.

Ik zou me er niet zo'n zorgen om maken. Maar wel goed dat je het nu hebt ingesteld op 5 minuten. Vooral de eerste generatie WD Green (EADS met 500GB platters + EARS met 666GB platters) hadden erg agressieve headparking ingesteld.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je hoeft je daar niet druk om te maken. Als je bijvoorbeeld 4000 errors hebt, kan dat een genormaliseerde waarde van 99 betekenen. Pas bij vele honderd duizenden tot miljoenen errors gaat het uitmaken. Zo snel hoort het namelijk niet op te lopen.

Zelfde voor kabelfouten. 13 kabelfouten dat is niets. Kan in een paar milliseconden gebeurd zijn waarin er even veel EMI interferrence was, ofzoiets. Een brakke kabel kan zomaar tienduizenden fouten veroorzaken. Dan weet je dat het mis is.

Write Error Rate is sowieso niet zo spannend; pas als het leesfouten geeft is het een probleem; enkel write errors betekent enkel dat het net iets langer duurt die ene keer; 2 milliseconden ipv 1. De tijd dat je hersenen bezig zijn om hier over na te denken (en voor mij om dit bericht te typen) had je al vele miljoenen write errors kunnen hebben. :P

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zien er allemaal prima uit. Geen bad sectors of kabelfouten (die 2 kabelfouten tel ik niet mee). :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Dat zijn serieus veel kabelfouten. Je kunt echter niet weten of dit in het verleden zich afspeelde; of dat het momenteel nog steeds een probleem is. De waarde gaat namelijk nooit meer omlaag. Kan prima zijn dat je een jaar geleden kabelproblemen had, maar nu niet meer. Wat je dus moet doen is die waarde in de gaten houden. Als hij blijft stijgen, heb je op dit moment nog steeds kabelproblemen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Waar schrik je precies van? Het enige dat me opvalt is dat je schijf al 48 graden is geworden. De rest ziet er prima uit. 1 uur aan en 22 keer power cycles; dat laatste komt wel vaker voor als je aan het installeren bent en veel reboot/whatever. Ook aansluiten terwijl de spanning erop staat kan voor vele inschakelingen zorgen. Maar het is niet direct duidelijk dat die schijf al lang gebruikt is; de power-on-hours ziet er goed uit en de SMART wissen is niet iets wat je met normale utilities kunt doen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Die staan op de best mogelijke genormaliseerde waarde (100). Alleen bij command timeout kun je zien dat dit in het verleden op 99 stond; de op-een-na-beste waarde.

Je moet de raw value niet als absoluut aantal errors interpreteren. Anders zou je schijf nu ook 94 miljard graden zijn, wat natuurlijk niet zo is. Deze hoge waarden zijn binary encoded; meerdere getallen die alleen zijn uit te lezen als je het algoritme kent. In de meeste gevallen wordt hier informatie van het verleden toegevoegd. Bij temperatuur is dat vaak min/max/current temp. Die waarden worden allemaal in één getal verenigd. Dat maakt het een groot getal.

De fout van dergelijke hoge getallen als een probleem aan te merken, maken veel mensen. SMART wordt vrijwel altijd verkeerd geïnterpreteerd, ook door programma's die speciaal gemaakt zijn om SMART te interpreteren. Ook de WikiPedia-pagina heeft het veelal verkeerd of geeft zo'n technische uitleg waarvan ik me afvraag of degene die dat schreef het letterlijk uit een manual heeft overgetypt en zelf wel begrijpt wat hij schrijft.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

@Wim-Bart: 40-45 graden is prima hoor. Weet niet wat voor schijf je had, maar dergelijke temperaturen zijn niet onacceptabel. Prima zelfs, mits het constant is. Boven de 50 graden wil je schijven liever niet hebben.

@Gelgersma: Reallocated Sector Count is vrij hoog bij jou; 1430. Dat zou al een reden kunnen zijn de schijf te vervangen. Qua RPM geldt wat mij betreft juist: hoe lager hoe beter. Tenzij je je hardeschijf als systeemdisk gebruikt (C:) maar als het voor massaopslag is, is tussen de 3600 - 5900rpm juist het beste. Zeker als dat betekent dat je hogere datadichtheid kunt realiseren. Hoge rpm is iets van het verleden; toen we nog verlegen zaten om random I/O performance. Daar zijn SSDs veel beter in. Een hardeschijf gebruik je nu eigenlijk alleen maar voor massaopslag.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Iedere sample zal sterk kunnen afwijken van het gemiddelde; dus je kunt op basis van één exemplaar geen uitspraken doen over de kwaliteit van een serie/model/merk schijven. Dat spreekt voor zich.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zolang je ZFS gebruikt in een redundante array, heb je aan 48 uBER bad sectors geen problemen. Doe wel een scrub op de pool. Als de pending sectors er dan nog zijn, bevonden deze zich in inactieve data. Dat is dus al helemaal onbelangrijk - ook als je geen ZFS had gebruikt.

65 duizend inschakelingen zijn echter wel erg veel; je hebt waarschijnlijk lange tijd spindown gebruikt (gemiddeld eens per kwartier). Je kunt overwegen de spindown minder agressief in te stellen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zie de topicstart en 1e post van dit topic. Evenals de 1e post van het ZFS topic, daar staat ook een verhaal over SMART en bad sectors.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ziet er goed uit; zijn ook vrij nieuwe schijven met 129 en 440 power-on-hours.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zou kunnen dat hij met de kabels gerommeld heeft en elke schijf wel een foute kabel heeft gehad. De UDMA CRC Error Count dient hij in elk geval in de gaten te houden; die mag niet verder stijgen. Het flink buigen van de SATA kabels kan hier overigens ook voor zorgen. Sommige mensen gebruiken wel erg fanatiek ty-wraps (hoe heet dat ook alweer? :P) en dan kan de kabel flink buig bewegingen maken. Het beste is als de SATA kabels redelijk kort en stevig zijn (geen flutkabeltjes) en niet dicht tegen andere kabels of EMI-bronnen zitten en alleen zeer flauwe bochten maken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zoek even in dit topic op Read error rate en Seek error rate; want het continu herhalen ervan begint eentonig te worden. ;)

Lang verhaal kort: maak je niet druk. Dat die waarde bij andere schijven op 0 staat is precies omdat jullie consumenten gaan mekkeren als er naast het woord 'error' een andere waarde dan 0 staat en mensen zelfs om die reden schijven gaan terugsturen voor garantie. Logisch dat fabrikanten dan denken dat het beter is om de echte waarde te verbergen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Dannyyy, de waarheid is dat hardeschijven zoveel data zijn gaan bevatten dat het onmogelijk is om gegevens foutloos uit te lezen. Je hardeschijf weet simpelweg niet wat er exact is opgeslagen. Pas na het toepassen van errorcorrectie, kan de hardeschijven destilleren welke gegevens opgeslagen hadden moeten zijn.

Daarmee bedoel ik dus dat errorcorrectie geen extra is, zoals bij ECC geheugen, maar een absolute noodzaak omdat anders de hardeschijf onbruikbaar zou worden. Dit geldt ook voor SSD opslag - zonder errorcorrectie ben je nergens.

Het absoluut aantal fouten krijg je niet te zien - dat is een extreem groot getal. In plaats daarvan wordt de error rate berekend. Dit is grofweg een verhouding die aangeeft in welke mate errorcorrectie nodig is voor het construeren van de opgeslagen gegevens. Is er relatief weinig errorcorrectie nodig, dan duidt dit op een gezonde schijf met een hoge platter/medium-kwaliteit. Is er relatief veel errorcorrectie nodig, dan duidt dit op een matige mediumkwaliteit - daarbij is de drempel kleiner geworden voor sectoren die onleesbaar worden omdat errorcorrectie maar een beperkte mogelijkheid heeft om de gegevens foutloos uit te lezen. Met een slechte mediumkwaliteit kan het gebeuren dat een aantal sectoren niet meer foutloos zijn uit te lezen; alleen als er meer errorcorrectie (meer ECC bits) zouden zijn toegepast, zou dit mogelijk zijn geweest.

De SMART-gegevens kun je prima gebruiken om verschillen tussen identieke exemplaren (zelfde model/type) te vergelijken. Zo kan de ene schijf een hogere mediumkwaliteit hebben dan de andere schijf. Hiervoor kijk je niet naar de 'raw value' maar naar de genormaliseerde waarden Current en Worst. Bij deze waarden geldt: hoe hoger hoe beter. Vaak beginnen ze op 100 of 200 en is dit de best mogelijke waarde; en zakt het zodra het minder wordt. Als de ene schijf een RRER-waarde heeft van 82 en de andere heeft 62, dan is de laatstgenoemde dus minder goed dan de eerste. In dat opzicht kan de SMART dus nuttig zijn om een indicatie te geven van de kwaliteit van de schijf. Maar je mag die gegevens niet zomaar met andere type/modelnummers vergelijken - alleen met identieke schijven met dezelfde firmware. Bij het ene model kan een waarde van 82 namelijk heel laag zijn, bij de ander juist heel hoog. Je kunt daarom alleen wat zeggen als je andere schijven van hetzelfde model/type met elkaar vergelijkt.

SMART is heel nuttig, omdat het je informatie geeft die anders moeilijk tot onmogelijk te verkrijgen is. Maar het gaat vrijwel altijd fout bij de interpretatie van die gegevens. Fabrikanten maken het ons ook niet makkelijk, onder meer door de SMART specs te overtreden. Consumenten op hun beurt maken de fout door iets met 'error' gelijk te flippen. Terwijl het apparaat zonder errors onmogelijk kan functioneren.

Hoe veel errors het apparaat mag maken, is grofweg vastgelegd in de specificaties van de hardeschijf. Consumentenspul heeft allemaal 10^-14 uBER specificatie. Enterprise schijven doen 10^-16 en dat is dus 100 keer beter. Maar daar betaal je ook voor. Gebruik je een geavanceerd filesystem zoals ZFS, Btrfs of ReFS, dan maakt dit alles niet veel uit. Het maakt wel veel uit als je een ouderwets filesystem gebruikt, zoals NTFS, Ext4 of UFS. Deze filesystems behoren tot een oudere generatie die vereist dat een opslagsysteem 'perfect' werkt, zonder enige bad sectors. De nieuwe generatie heeft beschermingsmechanismen waardoor de schijf af en toe een onleesbare sector mag krijgen. Daardoor kun je flink kosten besparen en heb je het probleem in software opgelost in plaats van met dure hardware. Zoals het hoort; software is immers superieur.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Had ik al gezegd in je andere topic; het wachten is op jouw memtest86+ uitslag. ;)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Is prima. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Wat doe je ons aan door zo'n klein plaatje te uploaden?

Als ik het goed kan zien 6 omgewisselde sectors. Dat is geen groot probleem en die schijf kun je op basis van die informatie nog jarenlang gebruiken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

1294292483 = 617GB dus uitgaande van 693 uur is dat 21,4GB per dag. Lijkt mij prima?

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
Damic schreef op maandag 20 oktober 2014 @ 16:16:
Spijtig dat CDI die raw waarde niet omzet naar iets leesbaar, trouwens die C2 is wel raar :|
Is niet raar.

Current value = 66 dus 100 - 66 = 34 graden Celsius.
Worst value = 54 dus 100 - 54 = 46 graden Celsius is de schijf maximaal geweest.

Dat is dus precies zoals het hoort te werken. De hoge raw value is niet een letterlijk getal; net als bij Raw Read Error Rate is dat een binary encoded getal. Meerdere getallen gecodeerd in één 32-bit hex getal. Pas als je het algoritme weet achter die codering, kun je wat met de raw value. In veel gevallen moet je daarom naar de current/worst/threshold-waarden kijken om er wat zinnigs over te zeggen.
quote:
Gonadan schreef op maandag 20 oktober 2014 @ 16:44:
De vraag is natuurlijk hoe lang hij al op deze waarden staat en of ze nog stijgen. Maar toch, in mijn onervaren ogen zijn dit getallen waarmee je beter geen risico kunt nemen. Voor hetzelfde geld kapt die schijf er gewoon 's nachts mee.
Dat geldt voor elk opslagapparaat, toch? Zeker bij mechanische schijven. Bad sectors enzo geeft vooral weer hoe het met de mediumkwaliteit gesteld is. Maar een schijf die er plots mee kapt is vooral dankzij mechanische problemen - en juist dat kun je met SMART niet of nauwelijks zien aankomen. SMART is vooral nuttig voor temperatuur, bad sectors en kabelfouten.

Als jij wakker ligt doordat je schijf elk moment kan falen, dan is dat ook een teken dat je je data niet goed hebt beschermd. Investeer in een ZFS NAS en je bent van je zorgen af. Want elk opslagapparaat kan plots falen en je dient je data daarvan niet afhankelijk te maken.

Je dient het zo in te richten dat op elk moment elke willekeurige schijf kan falen en jij nog steeds een prima dag zonder kopzorgen hebt. Pas dan heb je het redelijk goed geregeld mijns inziens.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Jouw eerste schijf:
code:
1
2
3
4
5
6
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   001   001   051    Pre-fail  Always   FAILING_NOW 259910
197 Current_Pending_Sector  0x0032   054   054   000    Old_age   Always       -       7680
198 Offline_Uncorrectable   0x0030   001   001   000    Old_age   Offline      -       414006

Zoals je ziet is Raw Read Error Rate op zijn laagste punt (001) en hoe lager hoe slechter geldt bij genormaliseerde waarden (Current/Worst/Threshold). Dit is ook de reden van de pending sectors; die in het verleden nog veel hoger waren; namelijk meer dan 400.000 (!)

En dat is je probleem met deze schijf, dat de mediumkwaliteit zo laag is geworden dat een heleboel sectoren veelal onleesbaar worden; vaak kunnen die wel leesbaar gemaakt worden als je vaak genoeg probeert of weer overschrijft, maar dit is een hele duidelijke indicatie van een platter die behoorlijk brak is en niet meer bruikbaar voor betrouwbare gegevensopslag.

Mechanisch kan de schijf prima in orde zijn en nog 20+ jaar meegaan, maar dan heb je wel een schijf met amnesia; gatenkaas dus en daar heb je weinig aan.
quote:
Echter om de schijf te kunnen formatteren moet ik toch al een nieuwe kopen om de data eerst te migreren. :+
Dan heb je het toch niet goed geregeld want dat zou betekenen dat je nergens anders een kopie hebt van de data die op de schijf staat. Ook voor minder belangrijke data is dat geen fijne gedachte.
quote:
Ook een ZFS NAS neemt eventuele zorgen niet weg, het blijft een elektrisch apparaat wat zomaar kan overlijden en alle schijven meenemen. Voor data die ik belangrijk vind heb ik gewoon back-up (historisch) naar andere devices, voor data die ik écht belangrijk vind heb ik nog een offsite locatie.
Maar wat backup je dan, als je niet weet of het origineel corruptievrij is? Legacy filesystems kunnen niet weten of jouw data corrupt is of niet. Dus een goede backup begint bij een corruptievrij origineel, opgeslagen op een systeem wat corruptie kan detecteren. Kortom, ZFS NAS + backup is wat je eigenlijk wilt hebben. Een legacy filesystem + driedubbele backup kan nog steeds zorgen voor trouwfoto's die vol zitten met artifacts, of een corrupt .rar bestand of iets in die geest.

Wil je het echt goed geregeld hebben, zou je toch kunnen nadenken over een NAS, omdat je dan veel geavanceerdere opslagtechnologie kunt gebruiken, zoals het ZFS bestandssysteem.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Alleen bij corruptie. Als de kabel zo slecht is dat er geen link gemaakt kan worden; loopt UDMA CRC Error Count ook niet op. Zie het als je TV signaal. Heb je helemaal geen verbinding; dan telt dat niet als corruptie. Heb je wel verbinding maar zie je 'blipjes' oftewel artefacts, dan telt dat als corruptie.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ik zie geen probleem met je disk. Kan iets met de stroomstekker geweest zijn of datakabel of wat dan ook. Zou gewoon even aankijken. Bad blocks e.d. hoef je niet te doen want als dat het was geweest, had je dat gezien in de SMART. Andere dingen kun je niet in de SMART zien dus daar zou je de oorzaak moeten zoeken.

Mocht het nou vaker gebeuren zou ik de kabels omwisselen. Gebeurt het niet meer dan zou ik me er geen zorgen om maken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ik schat zo'n 10 tot 20 jaar....

Bad sectors heeft niets met voortijdig falen te maken. Mechanisch falen = motorproblemen, seekproblemen enzovoorts. Bad sectors is iets anders en heeft met de mediumkwaliteit en beschikbare errorcorrecite (software) te maken. Het kan dus zijn dat je veel bad sectors genereert maar het mechanische gedeelte decennia lang meegaat.

In jouw geval heb je 8 bad sectors. Dat hoort er gewoon bij.... hardeschijven zijn gemaakt om bad sectors te genereren (meer weten hierover? vraag maar :) )

Gewoon een zero-write erover en dan is je hardeschijf weer bruikbaar en staat je Current Pending Secotr op 0.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Apple heeft geen 4th gen FS, helaas. Ze hadden wel ooit ZFS versie 11 ofzoiets geloof ik. Maar nadat Oracle het bedrijf Sun had overgenomen, hebben ze dit verwijderd, mogelijk uit angst voor claims of afhankelijkheid of iets in die geest. Of Apple nu nog een antwoord heeft op het uBER-probleem is onbekend. Maar HFS is gewoon ouderwets net als UFS, NTFS en Ext3/4. Het werkt prima, zolang het opslagapparaat perfect is. En dat is een utopie. Een vierde generatie filesystem accepteert gebreken in het opslagapparaat en biedt bescherming en errordetectie. En dat is in dit tijdperk gewoon een must wat mij betreft. Als er iets corrupt raakt wil je dat tenminste weten; oudere filesystems kunnen dit niet en schaar ik om die reden onder de noemer 'oude rommel'.

Een ZFS NAS zou het mooiste zijn. Goede backups is een goede 2e. Bedenk wel dat je met 'goede backups' vanaf een 2nd gen FS nog steeds corruptie kunt ondervinden; ook al backup je twintig keer; als je niet weet of je origineel corruptie-vrij is, dan kan die corruptie zich ook in de backup propageren. Het begint allemaal met errordetectie - zonder dat ben je nergens.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Als dat zo is, wat is dan het probleem? Je hebt je data veilig op ZFS. Je gebruikt je disks enkel voor caching of tijdelijk spul. Prima toch. Zolang het op ZFS staat, is het in veilige handen.

Het enige gevaar is wel dat je dingen genereert (download of maakt via photoshop, whatever) en van die 750GB disk op ZFS zet. Dan kan het zo zijn dat ZFS data aangeleverd krijgt die al corrupt is, en ZFS die corrupte data heel goed gaat beschermen; maarja daar heb je weinig aan natuurlijk.

Wees je gewoon bewust van dit punt. En het is ook niet zo dat alles wat niet op ZFS staat, automatisch corrupt raakt ofzo. Dat is extreem overdreven. Maar het is wel zo dat het niet weten of iets nu goed of corrupt is, wel een schijnveiligheid kan bieden.

In jouw geval kun je die schijf prima blijven gebruiken. Gewoon af en toe een zero-write als je bad sectors krijgt. Bedenk ook dat bad sectors ook kunnen ontstaan op plekken die al lange tijd niet zijn gebruikt. Dat is helemaal niet erg omdat zodra die plekken wel weer in gebruik worden genomen, de data wordt overschreven en dan verdwijnt de bad sector ook automatisch. Kortom, een schijf met enkele bad sectors is volstrekt normaal en hoef je echt niet om te panieken zoals veel mensen wel doen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Zie de topicstart over uitleg over die waarden: CiPHER in "Check je SMART".

De raw-waarde is van belang. Die geeft aan dat je 126 omgewisselde sectoren hebt. Als je garantie gehad zou hebben, zou ik zeggen ruil je schijf om. Maar Reallocated Sector Count zelf is niet gevaarlijk; Current Pending Sector is dat wel want dit zijn actieve bad sectors die zichtbaar zijn. Reallocated Sectors zijn sectoren die zijn omgewisseld; dit zijn 'passieve' dus onzichtbare bad sectors. Die kunnen geen problemen meer veroorzaken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

24 duizend draaiuren dus al een ouder exemplaar. De bearings kunnen na verloop van tijd meer geluid gaan maken. Weet niet meer waar dit precies door komt, maar voor zover ik heb onthouden is dit niet gevaarlijk; alleen irritant dat je schijf meer geluid maakt in idle; een wat zwaarder en scherper draai geluid ongeveer zoals je wasmachine/centrifuge maar dan minder luid. Ik had ooit ook één zo'n schijf, die werkt nu nog steeds ook al is het een oud 80GB exemplaar; ligt ergens eenzaam te verrotten. :P

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

@Kortfragje: heb je een link voor die grafiek die je post?

Betreft het hier een correcte vergelijking, dus dezelfde schijven waarbij de één headparking is uitgeschakeld en de ander is ingeschakeld op verschillende timers? Of - zoals ik gewend ben van BackBlaze - een pseudo-wetenschappelijke vergelijking met verschillende modellen onder verschillende omstandigheden en ook nog eens met veels te kleine aantallen?

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
Studies zijn niet perfect maar we hebben niets beters... Tenzij ik me uiteraard vergis en er wel een goeie publiek toegankelijke studie is op een dergelijke schaal naar de betrouwbaarheid van SMART waarden?
Het feit dat er geen beter onderzoek is, betekent niet dat we de resultaten van dit onderzoek belangrijker moeten maken dan ze zijn. De schijven worden in een heel andere omgeving gebruikt dan consumenten doen en factoren worden flink door elkaar gehaald. Je kunt denk ik wel heel voorzichtig bepaalde informatie afleiden en alles met een korrel zout nemen. Zo is het denk ik best aannemelijk dat Seagate iets minder betrouwbaar is dan de overige merken; maar het gevaar is dat mensen al die cijfertjes zo letterlijk gaan nemen.

Ik ben er namelijk van overtuigd dat als je wél een heel groot en heel goed onderzoek zou doen voor moderne schijven en ook in condities die overeenkomen met hoe consumenten hun schijven gebruiken, je ook héél andere resultaten krijgt. Misschien dat er sommige overlap is met de uitkomsten van BackBlaze, maar ik denk ook juist heel veel verschillen.

En het feit dat BackBlaze bijvoorbeeld externe schijven gebruikt en deze uit hun behuizing haalt, en ga zo maar door, zijn de resultaten ook voor enterprise gebruikers niet direct relevant. Er zijn gewoon teveel specifieke factoren waardoor dit onderzoek vooral toepasbaar is op de situatie hoe BackBlaze hun schijven gebruikt, en niet zozeer zoals andere gebruikers dat doen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Nooit geen self tests doen! Altijd de SMART informatie uitlezen. Dat heb je nog niet gedaan?

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je hebt nu waarschijnlijk het bewijsmateriaal vernietigd en het is mogelijk dat je nu nooit zult weten wat de echte oorzaak is. Lees de topicstart ook ajb. Daarin staat ook dat dit topic bedoeld is om de SMART gegevens te analyseren. Die self tests betekenen niets en kunnen alleen maar je bewijsmateriaal (de SMART data) verpesten. Dat heb je nu waarschijnlijk gedaan.

Probeer de SMART nog eens uit te lezen. Kabelfouten e.d. kun je wel terugvinden. Bewijs over bad sectors is mogelijk verloren gegaan.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

ada2 lijkt goed te zijn; althans geen bad sectors. ada0 heeft ook geen kabelfouten, maar wel heel veel bad sectors (2167). Beide schijven hebben geen omgewisselde sectoren.

Conclusie:
- ada0 is rot met zoveel bad sectors moet je hem opsturen voor garantie indien mogelijk; zo niet dan kun je hem nog wel gebruiken voor ZFS. De bad sectors kom je vanaf als je hem lang formatteert (zero write). Dat kan onder Linux/BSD met 'dd'.

- ada2 lijkt goed, maar kan in het verleden bad sectors gehad hebben die zijn verdwenen door de self-tests; dus dat weet je niet meer zeker. Valt nu in elk geval niets meer te zien.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Probeer regelmatig de SMART uit te lezen en het beste bewaar je deze ergens. Gaat dan enkel om de SMART attributen zoals het eerste gedeelte van wat je in je pastie hebt staan. Vermoed je problemen met een schijf; stel dan eerst de SMART veilig voor andere dingen te doen. Zou het om bad sectors (Current Pending Sector) gaan, dan heb je dat bewijs tenminste nog; terwijl je anders mogelijk niet weet of er nou wat mis was ja of nee, omdat de bad sector kan verdwijnen door actieve ingrepen (zoals een self-test) en dan is het bewijs weg.

Self-tests zijn ook niet erg nuttig. Je kunt evengoed via je OS een volledige surface scan doen (met dd bijvoorbeeld). Of een ZFS scrub als je ZFS gebruikt. Dan test je ook of de host->disk interface goed werkt, en je geen kabelproblemen hebt (UDMA CRC Error Count).

Succes!

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

@Nindustries: Zou kunnen; maar vertel eens wat er met de overige 2 is gebeurd?

@The Executer: ik denk dat een extra schijf een stuk goedkoper is dan commerciële recovery. Zeker opdat het om 320GB gaat denk ik wtf? Koop een 6TB schijf en je kunt 20 van die disks backuppen. ;)

Hoe dan ook: niet mee wachten. Koppel de schijf direct af en koppel hem pas weer aan zodra je gaat recoveren. Als het hard gaat telt ieder moment; je schijf blijven gebruiken ook al belast je hem niet actief (geen I/O) kan het probleem doen verergeren, tot het punt dat je vrijwel niets meer heel terughaalt. Dus als je data je wat waard is, moet je nu wel de juiste dingen doen.

CiPHER wijzigde deze reactie 28-11-2014 08:37 (40%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Feit dat je geen backup hebt van de data betekent dat je sowieso meer schijfruimte nodig hebt. Dus genoeg reden een schijf erbij te kopen denk ik dan. :)

Ik ken ddrescue zelf niet zo goed; gebruik altijd standaard dd. Maar ddrescue is wat slimmer en meer gericht op recoveren van disks met bad sectors. Dus dat lijkt me prima geschikt.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Behalve vier kabelfouten zie ik weinig spannends. Zit je het HDD lampje continu branden als dit gebeurt? Daar kun je eens op letten.

@TrsvK: ik zie niets verkeerds aan de schijf. Het kan zijn dat je bad sectors hebt gehad maar ondertussen actieve tests/utilities hebt gebruikt, waardoor het 'bewijs' nu weg is. Maar anderzins lijkt je schijf prima te zijn.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je ziet dus wel je HDD led continu branden? In dat geval zou ik toch eens de datakabel omwisselen/vervangen en kijken of dat nog steeds het geval is. Niet alle kabelfouten kun je in UDMA CRC Error Count terug zien; alleen de fouten die voor corruptie zorgen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

11 duizend ongewisselde sectoren wijst erop dat het goed mogelijk is dat je continu nieuwe bad sectors aan het maken bent. Aangezien dit om fysiek beschadigde sectoren gaat, is deze hardeschijf niet meer te gebruiken. Zo snel mogelijk je gegevens eraf halen dus!

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Dat is inderdaad wel vreemd. Maar bedenk ook dat 11 duizend sectoren nog maar 5,5 megabyte is. Als er best veel aan reserve ruimte is, kan dit de genormaliseerde waarde genoeg beïnvloeden om nog op 100 te staan. Toch vind ik het enigszins vreemd. Ik zou op zijn minst 98 verwachten.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Elke Linux livecd will do. Enige wat je nodig hebt is 'dd' commando. Ubuntu Linux lijkt me de meest universele distributie. Open de command line en voer het dd commando uit:
code:
1
dd if=/dev/zero of=/dev/sdX bs=1M

Waarschuwing: voer bovenstaand commando alleen uit als je alle schijven hebt afgekoppeld waarvan je de data wilt behouden! Het dd-commando vernietigt alle data op de schijf! Vervang sdX voor de naam van de schijf, zoals sda.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Dan moet je controller wel IDE ondersteunen; want AHCI werkt niet onder DOS. Bovendien kun je ook niet zomaar de SMART checken onder DOS zonder speciale utilities. Onhandig gekloot vind ik dat maar. Dan is een Linux livecd met een simpel commando toch veel meer newbie-vriendelijk, toch?

Wat is de meerwaarde van (pseudo-)random data schrijven ipv nullen? Het gaat er toch om dat de sector wordt overschreven met nieuwe data; zodat alle bad sectors verdwijnen?

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Nee, maar je hebt wel 5 bad sectors. Backup alle gegevens en doe een lange format, daarna kun je de schijf weer gebruiken. Aangezien dit je C: schijf is kun je overwegen gelijk de stap naar een SSD te nemen en deze schijf als opslagschijf te gebruiken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Problemen met Raw Read Error Rate vertalen zich in veel Current Pending Sectors. RRER wil zeggen dat je relatief veel errorcorrectie nodig hebt en dat duidt op slechte mediumkwaliteit. Dat betekent dat er veel bad sectors kunnen opduiken omdat het niveau van errorcorrectie zeer hoog is. Zie het als veel 'ruis' op de lijn waardoor de correctiemechanismen de ruis nauwelijks kunnen overwinnen.

Een dergelijke schijf kun je niet meer redden en dat betekent definitief het einde. Maar dat wist je 'toen' ook al want bijna 2000 bad sectors is teveel. Tot 20 bad sectors kan normaal zijn daarboven is het zeer verdacht.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Nee, je uitleg over RRER klopt niet.

1: Raw Read Error Rate
Dit attribuut geeft de verhouding weer tussen leesacties die géén errorcorrectie nodig hebben en leesacties die zouden mislukken als er geen ECC errorcorrectie voorhanden was. Hardeschijven kunnen niet meer zonder ECC maar als je relatief vaak ECC nodig hebt, kun je sneller onleesbare sectoren krijgen.

Kortom, dit attribuut geeft weer hoe snel je - relatief aan hoeveel data je leest - naar errorcorrectie moet grijpen. Ideaal zou zijn dat je nooit errorcorrectie nodig hebt en dus een grote marge hebt dat als een sector een keer veel slechter dan het gemiddelde doet, je heel veel errorcorrectie mogelijkheid over hebt. Maar als je standaard al heel veel bit errors moet corrigeren voor elke sector, en sector X heeft meer dan gemiddeld aantal biterrors, dan is het risico groot dat het aantal bit errors groter is dan de ECC errorcorrectie kan corrigeren. Een dergelijke schijf wordt gatenkaas met veel bad sectors, en dat is dus bij jou aan de hand. Die schijf moet je wegdonderen of ter garantie opsturen; is onbruikbaar.

2: Reallocated Sector Count
Aantal omgewisselde sectoren met reserve sectoren. Dit gebeurt alleen als een sector fysiek beschadigd is. Maar dat is tegenwoordig vrij zeldzaam. Minimaal 90% van de bad sectors zijn bad sectors zonder fysieke schade maar waarbij de errorcorrectie mogelijkheid onvoldoende is om de data foutloos te kunnen lezen. Typerend hierbij is dat het overschrijven van de sector met nieuwe data betekent dat die sector weer bruikbaar is; bij een fysiek beschadigde sector is dat niet zo. Zodra je een bad sector overschrijft met nieuwe data zal de hardeschijf testjes doen en als de sector nog steeds problemen geeft, dan wordt deze omgewisseld met een reserve sector; zo niet dan blijft hij gewoon in gebruik en is het geen bad sector meer.

3: Current Pending Sector
De allerbelangrijkste SMART-attribuut. Dit is het aantal onleesbare sectoren; dat kunnen bad sectors zijn mét of zónder fysieke schade, zoals hierboven uitgelegd. Zodra je deze sectoren overschrijft, verdwijnen ze omdat de sector dan weer in gebruik genomen wordt en goed werkt, of deze wordt omgewisseld met een reserve sector. De Current Pending Sector raw-value wordt dan weer lager. De raw value moet altijd 0 zijn, wat betekent geen bad sectors op dit moment.

4: Offline Uncorrectable
Hetzelfde als Current Pending Sector maar dit attribuut wordt niet continu bijgewerkt. Dus als je bewijs hebt vernietigt met een zero-write en Current Pending Sector is 0, dan kun je hieraan nog wel zien dat je in het verleden bad sectors had. In jouw geval is de waarde juist lager dan CPS, wat inhoudt dat er sinds de laatste offline meting er bad sectors zijn bijgekomen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Bovenste schijf heeft actieve bad sectors (Current Pending Sector). Lange format doen en dan kijken of CPS weer 0 is en tijdje in de gaten houden.

Onderste schijf heeft veel passieve bad sectors (Reallocated Sector Count) en dat is zoveel (0x24D) dat je hem beter kunt afschrijven. De kans dat je weer bad sectors erbij krijgt is vrij groot.

Doe voortaan jezelf en ons een lol en lees even in de topicstart hoe je decimale weergave krijgt via CrystalDiskInfo. Dan hoef ik niet elke keer mijn rekenmachine tevoorschijn te toveren. ;)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ja, zeker zolang het niet verder toeneemt en het getal laag blijft. Reallocated Sector Count = passieve bad sectors dus die kunnen zelf geen problemen geven. Alleen Current Pending Sector = actieve bad sectors zijn gevaarlijk. Maar een ongewisselde sector had ooit een actieve bad sector geweest kunnen zijn, maar dat hoeft niet.

In jouw geval denk ik dat je schijf prima is zeker als die 24 omgewisselde sectoren lekker stabiel blijft.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Schijf 2 heeft een slechte mediumkwaliteit (platter oppervlakte) waardoor er bovengemiddeld veel ECC nodig is om bitfouten te corrigeren. Gevolg is dat je schijf sneller dan gebruikelijk bad sectors vormt. Maar opzich is hij nog wel te gebruiken; mits je iets als ZFS gebruikt. Dus wellicht nog niet weggooien, maar voor gebruik met legacy RAID / filesystems zoals Ext4/SHR bij Synology zou ik deze schijf niet aanraden.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Dat maakt zeker uit. Bedenk wel dat je de huidige data kwijt bent als je de RAID verbreekt. Dus eerst backuppen als je dat nog niet had gedaan en dan de RAID verbreken. Daarna de goede disk als standalone disk gebruiken en de foute disk opsturen ter garantie, direct naar de fabrikant.

Tip: doe bij je RMA ook een uitdraai van de SMART informatie en andere screenshots. Dat helpt is mijn ervaring. Zou je Current Pending Sector weer 0 zijn namelijk, dan zou je schijf door de test kunnen komen. Maar je kunt dus extra argumenten aanvoeren dat je continu last hebt van bad sectors en dat is af te leiden uit je screenshots en ook de SMART data.

CiPHER wijzigde deze reactie 04-02-2015 18:43 (38%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je hardeschijf mag oud wezen, maar hij doet het behoorlijk goed na al die tijd.

Geen omgewisselde sectoren. Maar je hebt wel in het verleden te maken gehad met 2 bad sectors. Die zijn verdwenen nadat ze zijn overschreven. Nu heb je dus geen bad sectors meer; maar attribuut C6 verraadt wel dat dit in het verleden is gebeurd.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

De raw value ("Data" in HDtune) voor sommige waarden heeft geen betekenis zonder dat je weet hoe die waarde is gegenereerd. 44457 kan staan voor 44 duizend bit errors per minuut, per miljoen IOps of kan een waarde zijn die binary encoded is.

Kijk maar eens naar C2 Temperature. De schijf is 36 graden warm (100 - 64 = 36) dat kun je zien aan de Current-waarde. Maar de raw value ("Data") betekent niet dat de schijf warmer dan de zon is, maar wel een waarde die verschillende getallen kan opslaan. Zoals min/max/avg wat in één getal of 32-bit binary code is opgeslagen. HDtune laat standaard de raw value in decimale getallen zien; maar het kan dus eigenlijk vanalles zijn.

Bij RRER en SER kijk je naar de genormaliseerde waarden, niet naar de raw value. Dus Current moet hoger zijn dan Threshold. Worst is het verleden; als dat slechter is geweest dan het nu is kan dit getal lager zijn. Bij Spin Up Time kun je dit zien; nu 83 en als slechtste 81. Pas als de waarde onder de 25 zakt, geldt dit als failed. De raw value geeft zeer waarschijnlijk het aantal milliseconden weer; dus 5309 betekent 5,3 seconde spinup time wat dus ruimschoots binnen de gestelde norm ligt.

Nu wat je echt wilt weten: de RRER zit op Current waarde 1 en dat is vèr beneden de 51 threshold. Dus hartstikke failed. Maar dit is op zichzelf geen probleem. Het resultaat is echter wel dat je bad sectors krijgt, te zien aan C5 Current PEnding Sector. En dat zijn nu al 49 bad sectors. Daar gaan continu nieuwe bad sectors bijkomen omdat RRER op zijn laagst zit. Dit betekent dat je platter medium oppervlakte een hoge 'ruis' geeft bij het uitlezen van de data en er dus heel veel error correctie nodig is om de data in te lezen. Als je de normale grens naarboven verlegt, betekent dit vaker bad sectors.

Echter, dit zijn geen fysiek beschadigde sectoren; na het overschrijven werken ze weer. Daarom is je Reallocated Sector Count ook 0. Geen omgewisselde sectoren dus.

Een schijf is deze is prima bruikbaar met een modern filesystem die bitcorrectie kan uitvoeren en liefst ook nog met redundantie. Dan zou hij nog vele jaren mee kunnen gaan want mechanisch lijkt je schijf prima. Maar voor normaal gebruik zoals NTFS etc. is deze schijf niet meer bruikbaar. Je zult de hele tijd bij browsen directories of andere dingen een hangende applicatie krijgen en daarna foutmeldingen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

CDI is het beste voor Windows; of nouja eigenlijk gewoon het open source smartmontools. Werkt ook voor windows maar dan moet je de command line gebruiken.

CDI geeft standaard weer in Hex, maar je kunt eenvoudig via het menu instellen op decimale weergave. Staat ook in de startpost. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Heel veel bad sectors; die kun je inderdaad afschrijven. Recovery is deels nog wel mogelijk; ddrescue is een mogelijkheid. Dan heb je wel een lege hardeschijf nodig van minimaal dezelfde grootte.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

2,7 miljoen headparks >:)

En ook de G-Sense is flink van slag; dat zijn schokken tijdens dat de schijf van stroom is voorzien.

Maar hij kan het prima nog jaren volhouden. :)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

131 duizend omgewisselde sectoren is inderdaad extreem veel. Als je garantie hebt zeker omruilen!

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Die hardeschijf zou ik afschrijven als je nog garantie hebt. Het aantal omgewisselde sectoren is ook schrikbarend, en het aantal actieve bad sectors eveneens. Bij garantie zeker opsturen. Zo niet, de schijf enkel nog gebruiken voor onbelangrijke dingen, of gewoon afschrijven.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ziet er allemaal prima uit.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
-The_Mask- schreef op maandag 09 maart 2015 @ 12:38:
Dat hoeft dus helemaal niet zo te zijn. Een paar current pending sectors is totaal geen probleem, zolang je ze maar laat vervangen door de reserve sectors. Is totaal niks bijzonders daarom hebben hardeschijven ook reserve sectors om dit op te vangen.
Het omwisselen van bad sectors voor reservesectoren is tegenwoordig vrij zeldzaam. Dat gebeurt alleen als er fysieke schade is. Het leeuwendeel van de bad sectors zijn niet fysiek beschadigd maar hebben enkel teveel bitruis (te lage SnR) en vereisen meer ECC-correctie dan er voorhanden is om de data foutloos uit te lezen.

Dit soort bad secotrs worden niet omgewisseld; ze verdwijnen enkel bij het overschrijven ervan. Dus Current Pending Sector neemt af, maar Reallocated Sector Count neemt niet toe.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Als je geen trek hebt in het oplossen van het probleem door een simpele format, dan laat je het toch zo? Maar klaag dan niet als er straks problemen optreden; daar kies je dan voor.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Full format kan gewoon in windows 7+ (format zonder 'quick format' aangevinkt te hebben). Windows XP leest alleen en doet niet aan zero-write tijdens formatteren. Vista weet ik niet.

Als je een clone-installatie doet, is dat ook voldoende, alleen kan het zijn dat niet alle bad sectors worden overschreven. Die veroorzaken dan geen problemen meer en verdwijnen vanzelf zodra je de schijf volschrijft met data.

Dus als je een clone install doet, hoef je niet persé eerst een full format te doen. Een deel van de bad sectors zal/kan worden overschreven wanneer je de clone weer naar de schijf schrijft, dan overschrijf je ook de sectoren natuurlijk dat hoeft niet persé nulletjes te zijn zoals met een full format.

En over bad sectors met fysieke schade: die worden automatisch vervangen indien nodig. Maar je moet eerst schrijven naar een bad sector anders blijft hij daar eeuwig tenzij hij een keer toch gelezen zou kunnen worden. Pas na het overschrijven geef je het signaal aan de hardeschijf dat de (onleesbare) data niet meer nodig is. Dus dan kan de schijf ook de sector omwisselen indien nodig.

Ik verwacht echter dat er geen fyieke schade is. Dit kun je zien doordat na de format/clone de Current Pending Sector wel 0 is (of bij clone afgenomen is) maar de Reallocated Sector Count (omgewisselde sectoren voor reservesectors) gewoon 0 blijft.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Direct na het formatteren moet de Current Pending Sector 0 zijn.

Zou je binnen een maand weer één of twee of drie sectoren hebben, dan is dat vervelend maar nog geen reden hem gelijk af te schrijven. Maar je moet er wel op letten want het kan voorkomen dat een schijf continu nieuwe bad sectors maakt. Dan heb je een probleem behalve voor nieuwe filesystems die daar wel goed tegen kunnen. Dat is voor later, indien je Windows gebruikt.

Dus je schijf is misschien iets minder betrouwbaar, maar toch is dit eigenlijk heel normaal en past binnen de specs van de hardeschijf. Kijk het gewoon aan na het formatteren.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ziet er goed uit. Zou je die andere schijf ook nog even kunnen laten zien?

En wat bedoel je met de grootte; ik zie in je screenshot 1TB.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
M0nkeymen schreef op maandag 23 maart 2015 @ 22:49:
zie volgens mij alleen de Raw_Read_Error_Rate erg afwijken ten opzichte van schijf 2, maar wat betkent dat precies?
Astublieft: CiPHER in "Check je SMART"

Je SMART ziet er prima uit.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Je hebt behoorlijk veel bad sectors. Waarschijnlijk ook in de partitieindeling daarom ziet Windows je partitie niet meer en vraagt hij om de disk te initialiseren. Als je dat doet, dan vernietig je nog meer data.

Wil je de data terughalen, dan kun je diverse recovery tools gebruiken. Gebruik daarbij een programma dat ruwe data kan halen; dus zonder dat een partitie zichtbaar is. Ook zijn er diverse programma's die verdwenen partities weer kunnen herkennen. Daarmee zou je de beste kans op recovery hebt.

Het beste is als je de schijf eerst kopieert naar een andere schijf, en op die andere schijf datarecovery uitvoert. Dit kun je doen met 'ddrescue'.

Zie voor meer informatie: Thematopic: Datarecovery

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Schijf is nu prima, maar je hebt wel bad sectors gehad in het verleden. Synology levert enkel legacy storage; ouderwetse opslagtechnologie. Ext4 en legacy RAID kan niet goed tegen bad sectors beschermen. Dus zorg extra goed voor backups, want ook zonder drive failure kan je storage klappen. Bovendien heb je geen bevestiging wanneer dit gebeurt: silent corruption is altijd mogelijk.

Aangezien je schijf al bad sectors heeft gehad, is de kans ook groter dat dit weer gaat gebeuren. Zorg dus dat je niets op synology opslaat waar je geen backup van hebt en wat je niet wilt kwijtraken. Incremental backups zijn extra goed om het risico van silent corruption die doorslaat naar de backups tegen te gaan.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Welke melding precies; kun je daar ook een screenshot van maken?

En heb je direct na de melding opnieuw de SMART gegevens gescreenshot? Zijn er wijzigingen?

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

CrystalDiskInfo leest de SMART, maar doet verder niets. SeaTools is een programma wat de schijf kan repareren in sommige gevallen - iets dat je ook zonder die tools kunt overigens. Maar het vervelende is dat die tool bewijsmateriaal vernietigt. Je zult dus nooit weten wat het probleem was als je Seatools gebruikt zonder de SMART veilig te stellen. Altijd eerst naar de SMART grijpen en pas als die gegevens zijn veiliggesteld andere dingen proberen.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Kun je ook de SMART van je C-schijf nog eens laten zien? Graag dit maal volledig want het vorige screenshot stond niet alle info erop. Kabelfouten bijvoorbeeld heb ik nog niet kunnen uitsluiten.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

@PaulHedrix: Mja één kabelfout. Dat mag ook geen naam hebben. Ik heb geen idee waarom Windows je aan je kop zeurt; maar ik denk dat je die melding gewoon kunt negeren.

@Amd RuLuzzz (in the past): pics or it didn't happen!

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

61 bad sectors (Current Pending Sector) dus dat zou je problemen veroorzaken. Na lang formatteren hoort de pending sectors weer op 0 te staan, dan kun je de schijf weer gebruiken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Als je geen backup hebt van je data, kun je datarecovery uitvoeren.

De eerste stap zou zijn een ruwe kopie van de schijf te maken naar een lege goede schijf van minstens dezelfde capaciteit. Dan kun je kijken of Windows de partitie herkent en de schade kan repareren. Dan heb je de meeste data terug, minus wat is beschadigd door de bad sectors. Merk op dat je nooit zult weten of je bestanden goed zijn; je kunt corruptie binnen de bestanden hebben die je niet kunt detecteren. Denk aan JPEGs met artifacts of een videobstand met blipjes erin. Maar dat is nog corruptie die je kunt managen. Corruptie binnen een VM image of archief is minder leuk.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Ik zie niets vreemds aan je SMART. Allemaal prima.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Als dat 50000 zou zijn, zou dat een probleem zijn. Maar 5 kabelfouten stellen niets voor. Dat betekent dat je ooit 5x 0,1 milliseconde extra hebt moeten wachten.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Test je RAM; want RST doet aan dirty write-back; en corruptie wordt daarbij niet gedetecteerd en vloeit rechtstreeks naar corruptie op je filesystem. Even goed je geheugen testen is dus een grote aanrader.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

@Tijntje: memtest86+ voor 12 of 24 uur draaien.

@topbuzzer: Je hebt nu 32 bad sectors, en in het verleden meerdere duizenden gehad. Dat is wel een probleem. Je 500GB-schijf is nu niet meer zo betrouwbaar als eerst. Maar nog steeds goed bruikbaar, mits je voorzorgmaatregelen neemt.

Begin met je schijf lang te formatteren, dan verdwijnen alle actieve bad sectors (Current Pending Sector) en hoort de SMART raw value voor dit attribuut weer op 0 te staan. Dan kun je de schijf weer in gebruik nemen. Zorg wel voor goede backups, en schakel in de toekomst over op een 3e generatie filesystem wat tegen bad sectors kan, zoals ReFS voor Microsoft.

CiPHER wijzigde deze reactie 24-04-2015 12:53 (5%)

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

quote:
Stuk aan het gaan. >:)
quote:
Timmmeeehhh schreef op donderdag 07 mei 2015 @ 00:22:
Ik dacht ik check m'n smart van mn iets meer als 2.5 jaar oude SSD eens...
Kan ik hieruit opmaken dat hij binnenkort de geest gaat geven, of kan het niet zoveel kwaad?
Dit kan geen kwaad. Wat er gebeurd is, is dat een erase block is afgekeurd. Je ziet 4096 blocks; dat is een macht van 2. Dit betekent dat een erase block van 2MiB is afgekeurd. In die erase block zitten 4096 blokjes van 512-bytes (logische sectoren). In feite is maar één 'ding' stuk in je SSD. Redelijk normaal en kan zeker geen kwaad. Zou het flink oplopen zoals bij Dutchie! hierboven, dan heb je wel een probleem.

Heel veel SSDs komen al vanuit de fabriek met kapotte pages of erase blocks, maar dat wordt in de SMART verborgen. Voor de werking van de SSD absoluut geen probleem want het gaat om kleine hoeveelheden (2MiB in jouw geval) en er zijn genoeg reserve pages en erase blocks om dit op te vangen.

Enkel wanneer er een groot onderliggend probleem is waardoor er continu meer bad blocks worden gegenereerd, dan heb je een groot probleem. Maar bij een paar 'bad sectors' (of erase blocks in geval van een SSD) hoef je je niet druk om te maken.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
@TommieW: heel veel vervangende sectoren dus die schijf kun je beter vervangen.

@gerbiepiep: 6 bad sectors dus dat valt heel erg mee. Schijf lang formatteren in Windows 7+ en dan controleren dat Current Pending Sector weer op 0 staat. Dan kun je de schijf weer gebruiken. Bij het formatteren gaat natuurlijk alle data verloren!

Wanneer ga jij jouw data beschermen? Kies voor ZFS!


Acties:
  • 0Henk 'm!
Ja dat kan; maak een clone-backup van je schijf en zet deze na het formatteren weer terug. Dan heb je alles bij het oude.

Wanneer ga jij jouw data beschermen? Kies voor ZFS!

Pagina: 1 2 3


Apple iPhone 11 Microsoft Xbox Series X LG OLED C9 Google Pixel 4 CES 2020 Samsung Galaxy S20 4G Sony PlayStation 5 Nintendo Switch Lite

'14 '15 '16 '17 2018

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2020 Hosting door True