Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Beste Tweakers,

Dit wordt dan mijn eerste post op het forum en het is gelijk een vraag over iets dat wel eens een issue zou kunnen zijn waar ik tot nu toe geen erg in had.

Het zit zo: Een jaar of drie geleden wilde ik een flinke externe opslagoplossing kopen voor multimedia.
Uiteindelijk is dit een externe usb behuizing met 2 hardeschijven van 2TB geworden die tot nu toe nog steeds prima functioneren. (Intussen wel verplaatst naar een andere behuizing.)

Die drives zijn Western Digital RE4-GP (Raid Edition modellen, bedoeld voor enterprise omgevingen).
Ik heb ze echter altijd gewoon in een externe behuizing gebruikt, zonder enige problemen.
Nou las ik laatst dat dit soort schijven eigenlijk niet bedoeld zijn voor desktop gebruik vanwege de TLER feature die een lockup door error recovery voorkomt in RAID omgevingen.

Na enkele enigzins verontrustende posts te hebben gelezen in verschillende fora begin ik me toch zorgen te maken om de data die erop staat. Kan iemand mij vertellen of ik mij zorgen moet maken over data corruptie?
Hebben jullie hier ervaring mee?

Bij voorbaat dank

PS. Links naar fora over dit mogelijke probleem:

http://hardforum.com/showthread.php?t=1023001
http://community.wdc.com/...unning-single/td-p/114622

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Ik heb er niet echt veel geen ervaring mee maar het klinkt aan de ene kant als onzin en aan de andere kant als best mogelijk.

Aan de ene kant: het zijn "speciale" schijven bedoelt voor in servers, juist waar het BELANGRIJK is om data goed te bewaren. Je zou dus zeggen waarom zou het dan "currupt" raken.

Maarja aan de anderen kant: het klinkt ook wel aannemelijk op die links die jij post, als er inderdaad een (erg) korte data recovery tijd is en er is iets corrupt is dan wordt het niet overnieuw geschreven.

Vind het een heel interesant probleem. Ik denk ook dat dit afhankelijk van de software//controller is, je hdd behuizing zal waarschijnlijk ook een cache hebben en je pc zelf ook. Je zou toch verwachten dat als er iets niet goed gaat er ergens een belletje gaat rinkelen.

Anyway ben heel benieuwd of er mensen zijn die hier écht iets vanaf weten, alles wat ik hierboven post is puur mijn "gevoel"

(o en welkom op tweakers :) )

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • _JGC_
  • Registratie: Juli 2000
  • Nu online
Deze schijven verschillen in een paar opzichten van desktopdrives:
- TLER ingeschakeld
- Geen agressieve powersaving zoals desktopdisks dat wel hebben
- Geen silent seeking
- Hogere betrouwbaarheid

Ik heb op dit moment thuis een server staan met twee WD RAID edition schijven erin, die dingen maken tijdens seeken meer lawaai dan een fileserver met 24x Hitachi 7K3000 desktopdrives.

Of je powersaving en silent seeking aan kunt zetten is nooit zeker, dat hangt af van wat de fabrikant instelt in de firmware, maar in principe kan je bij deze serverschijven TLER met de geschikte tools (WDTLER) gewoon uitzetten, net zoals je dat bij sommige desktopdrives nog handmatig kunt inschakelen.

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Ik zie trouwens ook dit staan op link nr 1
Because of the TLER feature works though a message will be present in your system log that says if the drive encountered an error.
Je kan voor de gein eens kijken of je daar wat ziet staan als je wat actiefs doet met je schijven (hdtune benchmark oid)

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Alvast bedankt voor jullie reacties. :)
_JGC_, van die features wist ik wel het een en ander af.
Vooral de hoge betrouwbaarheid was erg aantrekkelijk toen ik op zoek ging naar schijven.

Ik maak me vooral zorgen om datacorruptie bij stand-alone gebruik. (Twee losse volumes in een externe behuizing). Is het zo dat ze op dat vlak echt onbetrouwbaar zijn?

Acties:
  • 0 Henk 'm!

  • _JGC_
  • Registratie: Juli 2000
  • Nu online
Mja, een harddisk kan corrupt raken, zowel een serverschijf als een desktopschijf. Zal bij een desktopschijf vaak sneller gebeuren dan een serverschijf.
Wat een desktopschijf gaat doen bij datacorruptie is net zolang proberen de corrupte sector te lezen op zoveel mogelijk manieren totdat het lukt, of totdat alle opties zijn doorlopen. In het gunstige geval heb je na een minuut alsnog je sector terug dan.
Een serverschijf zal na 7 seconden zeggen tegen het systeem: "Deze is kapot, zoek het maar uit", waarna de RAID-controller in je server vervolgens de sector van een andere schijf uit het RAID-array leest en deze terugschrijft naar de disk die zojuist problemen gaf. Als je zo'n schijf in een systeem zonder RAID gaat draaien, moet je dus eerst TLER uitzetten, omdat je juist wilt dat de disk alle mogelijke acties onderneemt om een evt bad sector alsnog te lezen.

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Ah op zo'n manier, bedankt voor de uitleg.

Je kan het natuurlijk uitzetten maar opzich als er iets mis gaat is er maar weinig data verloren. Voor zover ik weet is een sector standaard 512 bytes. En als we dan praten over films (oid) dan is 512 bytes echt wel te verwaarlozen.
Als er een hoop textfiles op staan van <1kb ja dan is het wel vervelend als er iets mis mee is. Maar aan de beschrijving te lezen van JGC is het dus beter om het uit te zetten, zeker @ desktop systemen :)

Weer wat geleerd vandaag! Wel een erg interessant onderwerp imo!

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Tuurlijk, de kans op data corruptie is altijd aanwezig.
De belangrijkste data op die schijven staat uiteraard ook nog op twee andere locaties en ik zou in geval van corruptie de rest ook terug kunnen halen (al zou dat wel veel tijd kosten).

Eind deze maand komt er nog een nieuw setje "gewone" schijven dus dan ga ik wat dingetjes migreren en deze inzetten voor "minder" belangrijke data.
Uiteraard sta ik open voor nog meer advies, reacties en ervaringen.

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Waarom niet gewoon nu TLER uitzetten? Het lijkt me dat ze dan gewoon hun werk doen als "desktop" schijven maar dan met betere kwaliteit componenten.

Tenzei het niet mogelijk is TLER uit te zetten zonder verlies van data natuurlijk.

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
De procedure om TLER uit te zetten is nogal omslachtig, wordt niet meer officieel ondersteund door WD en je kan er je drive mee slopen als er iets fout gaat. Ik durf het in elk geval niet aan.

In het ergste geval moet ik ze misschien maar wegdoen of verkopen.
Zonde van zulke schijven en vervelend dat ik er nu zo achter moet komen. :-(

In elk geval is de meeste belangrijke data zeker veilig.

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Mjaok, als het inderdaad zo "lastig" is zou ik ook het zekere voor het onzekere nemen, miss een mailtje sturen naar WD met ik heb deze en deze disks hoe zet ik (veilig) TLER uit?

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Nog maar even goed over nadenken.
Als iemand nog meer tips heeft of kennis of ervaringen wil delen, ik hoor het graag.

In elk geval alvast bedankt voor jullie reacties. ;)

Acties:
  • 0 Henk 'm!

  • Hell-Slave
  • Registratie: Juni 2011
  • Laatst online: 11-09 15:24
Ik heb deze vraag een paar jaar geleden gesteld aan WD zelf en die zeiden dat RE schijven buiten een HW raid controller om gebruiken niet verstandig is.
Dit vanwege dat de schijven nu geen zelf controle doen met TLER ingeschakeld. (een taak van een HW raid controller)

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Maarja, als het al 3 jaar gewoon zonder problemen werkt en er volgens SMART 0 fouten zijn opgetreden vraag ik me echt af in hoeverre dit een issue is.

Als er een sector kapot zou zijn en de hdd zou een "lange" tijd nodig hebben om een sector te lezen dan vraag ik me af of er (veel) verschil in geredde data zal zijn tussen 7 sec en 2 minuten.....

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Hell-Slave schreef op donderdag 14 juni 2012 @ 17:10:
Ik heb deze vraag een paar jaar geleden gesteld aan WD zelf en die zeiden dat RE schijven buiten een HW raid controller om gebruiken niet verstandig is.
Dit vanwege dat de schijven nu geen zelf controle doen met TLER ingeschakeld. (een taak van een HW raid controller)
Bedankt voor je reactie Hell-Slave.
Ik heb vanmiddag behoorlijk wat tijd besteed aan Googelen op dit probleem maar kom veel tegenstrijdige berichten tegen. Inmiddels ben ik er wel achter dat het geen verstandige beslissing is geweest.
Het advies zou dus gewoon zijn, disks vervangen door normale desktop schijven.

Maar wat betreft de data die er nu opstaat...
SMART values zijn perfect. Geen Raw read of write errors, geen reallocated sectors, niks.
Volgens WD specs geeft TLER de schijf 7 seconden om eventuele fouten te corrigeren voor er een bericht naar de RAID controller gaat die zegt "ik ben bezig, los die fout later maar op."
Ik heb al vaker bestanden van die schijven gehaald en gebruikt en nooit problemen gehad.
Hoe groot is de kans dat de ER data corrupt is?

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Volgens mij zegt de schijf niet "ik ben bezig, los die fout later maar op" maar iets anders:

Een raidcontroller "denkt" na 10 seconden => "hey, die schijf geeft geen data meer, hij is vast kapot" => RAID array == degraded.

Bij een 'gewone' hdd die 2 minuten lang probeert om data te recoveren kan dit dus optreden terwijl er miss helemaal niks aan de hand is met de schijf zelf. Als hij later weer "online" komt moet de hele array weer gelijkgetrokken worden wat een hoop resources kost.

Daarom zit die functie in de schijf, na 7 seconden geen data? => STOP met recoveren en geef door aan de raidcontroller (of het OS of de Controllerchip of ....) "hey kijk deze data kan ik niet benaderen, probeer het bij disk #2 of gooi het weg"

Het KAN zijn dat de data na 8 seconden wél leesbaar is, maar hoe groot zal die kans zijn? Ik denk dus dat je met het aan laten van TLER dus geen "verhoogd" risico loopt op data corruptie bij een gezonde schijf, alleen als er al problemen zouden zijn en er veel recovery pogingen nodig zijn KAN het zijn (als er bijv 8 sec nodig is) dat er dan "goede" data weggegooid wordt.

Mocht het dus voorkomen in de toekomst (wat me sterk lijkt omdat je helemaal geen fouten heb) dan ZOU HET KUNNEN ZIJN DAT je een sector aan data kwijt raakt. Maar dan heb je het over 512 bytes (uitgaande van standaard instellingen). Op een HDD van 2 TB is dit gewoon verwaarloosbaar en zeer waarschijnlijk softwarematig te repareren.

Dan is het ook nog de vraag wat voor data er op staat: 512 bytes in een complete film ga je echt niet merken, 512 bytes in een foto is misschien 1 pixel, en ook dat ga je (imo) niet merken. Ik weet niet exact hoe het daar zit met foutcorrectie maar daar er zal vast wel rekening gehouden zijn met het feit dat er wel is sectoren niet (goed) leesbaar zijn.

note: bovenstaande info is hoe ik het opvat, ik ben geen "hdd sector deskundige" oid.

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Mooi verhaal Mattie. Ik ben benieuwd of andere mensen dit kunnen bevestigen.
Dit zou namelijk betekenen dat er op dit moment nog niks aan de hand HOEFT te zijn.

Zoals ik het nu begrijp zou het in de toekomst, als de drive op een gegeven moment gewoon op is (drive moe/einde levensduur), mogeljk voor problemen kunnen zorgen, omdat er dan vaker fouten op zullen treden die steeds lastiger te corrigeren zijn.

Zo komt het nu op dit moment bij mij over.

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Absoluut ik geef ook geen garanties :) Alleen als ik wikipedia er bij pak (en ook die hoeft niet te kloppen) dan komt dat op die manier aan mij over:
Limiting the recovery time allows for improved error handling in a RAID environment. In some cases, there is a conflict as to whether error handling should be undertaken by the hard drive or by the RAID controller, which leads to drives being marked as unusable and significant performance degradation, when this could otherwise have been avoided.
Het is inderdaad puur gemaakt om er voor te zorgen dat de raidcontroller de hdd niet als "stuk" markeert.
Effectively, TLER and similar features limit the performance of on-drive error handling, to allow RAID controllers to handle the error if problematic. In a non-RAID environment, such features are unhelpful, and manufacturers do not recommend their use.
Er staat dat ze het niet "recommenden", dat wil niet zeggen dat het ook kwaad kan. Ik zou ook niet aanraden om met 150km/h over de snelweg te rijden maar of het echt kwaad kan.........
The WDTLER utility allows for the enabling or disabling of the TLER parameter in the hard disk's firmware settings allowing the user to determine the best setting for his particular usage as either a stand-alone or RAID drive. This utility is written for DOS and you will require a DOS bootable disk with this utility on it to use it.
Als ik dit lees is er gewoon een tooltje om de TLER uit te zetten, als je zeker wilt zijn van je zaak zou ik dat gewoon doen :) Dan blijft het nog de vraag hoe dit precies zit maar dan ben je in elk geval "veilig".

Meer info zie: Wikipedia: Error recovery control

Dan nog een vraag:
Hoe zijn je hdd's nu "ingesteld" ik neem aan dat je maar 1 usb kabel heb? Dus is het dan niet JBOD (een versie van RAID)? Dan zou er helemaal geen probleem zijn?

En dan sowieso als er RAID mogelijk is zit er een RAID controller in, zal die dan niet alsnog de fouten "afvangen" zelfs al zitten je schijven NIET in een array?

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Het is 1 usb 3.0 kabel. De behuizing is een Lian Li EX-503. Ik heb hem aan het topic gekoppeld. ;)
Deze behuizing heeft een RAID controller met een flink aantal verschillende RAID modi maar de schijven staan niet in RAID. Ze worden door het systeem waarop ze zijn aangesloten gezien als 2 losse volumes.

Geen idee of die controller nu uberhaupt iets doet qua foutafhandeling.
Zou mooi zijn als dat zo was, dan hoefde ik me nergens zorgen over te maken.
Maar fouthandeling door de controller vind vermoedelijk alleen plaats als de schijven ook echt in een array staan.

Zou iemand anders deze en eerdere beweringen kunnen bevestigen?

Acties:
  • 0 Henk 'm!

  • Mattie112
  • Registratie: Januari 2007
  • Laatst online: 16:32
Volgens mij zijn de volgende scenario's mogelijk:

(ik ga er telkens van uit dat er zojuist een leesfout is opgetreden, dus dat de data al corrupt geraakt is bij het wegschrijven)

Optie #1 TLER aan => RAID ARRAY

Uitgaande van RAID1(of 5, of 10):
hdd 1 heeft een fout => deze lukt het niet om binnen 7 sec de fout te herstellen => geeft door aan de controller//het OS dat er een fout is en dat hij het maar bij hdd 2 moet gaan proberen. Een andere disk leest het wel goed en klaar, de array is niet "degraded".

Optie #2 TLER aan => GEEN ARRAY

hdd x geeft een fout => het lukt niet om binnen 7 sec de fout te herstellen => hij geeft het door aan de controller//het OS dat er een fout is. Aangezien hier geen 2e disk is met dezelfde info zit er niks anders op dan de sector softwarematig te herstellen (door het OS). Of door gewoon nog een lees request te sturen ;p
Het kan zijn dat het niet hersteld kan worden en dus is de data "weg". Het kan zijn dat het na 8 sec wel gelukt was maar het kan ook prima zijn dat het na 2 minuten nog steeds niet gelukt is.

Optie #3 TLER uit => RAID ARRAY

hdd 1 geeft een fout => is hier zo lang mee bezig (bijv 1 minuut) dat de controller besloten heeft dat de disk "unuseable" is. Wanneer de disk na het lezen (positief of negatief resultaat) zich weer meld bij de controller moet de HELE array weer gelijkgetrokken worden. Niet echt handig dus.

Optie #4 TLER uit => GEEN RAID ARRAY

hdd x geeft een fout => de disk is hier lang mee bezig (bijv 1 minuut). De controller kan niet beslissen de disk "unuseable" te maken omdat er geen array aangemaakt is. De controller//het OS moet dus gewoon wachten op de schijf welke de data wel (maar er is ook kans van niet) kan lezen.

-----------------

Dat waren even wat situatie schetsen. Als ik het goed begrijp is TLER (time limited error recovery) puur een functie die er voor moet zorgen dat de schijf niet te lang bezig is met error recovery. De data IS dus al corrupt geraakt (bij een schrijfactie waarschijnlijk).

Het maakt dus ook niet echt uit of je controller wel of niet de fout "afvangt". Je HDD beslist om er mee te kappen, je controller krijgt dat te horen (indien RAID) en kan bij een andere hdd terecht. Aangezien je geen RAID hebt is het dus niet nodig om die fout door te geven aan de controller :)

Dus om je vraag te beantwoorden:

"Kan iemand mij vertellen of ik mij zorgen moet maken over data corruptie?"

Ja en nee, de data is al corrupt (dit heeft niks met TLER te maken) alleen het is de vraag: kan de data hersteld worden binnen 7 seconden. Zo ja => geen probleem, zo nee => data kwijt.

Zelf denk ik dat als de schijf echt zo lang bezig is met het lezen van een enkele sector (512 bytes) dat het eigenlijk niet veel nut heeft om te herstellen. Ik zou me dus zeker geen zorgen maken :)
Als het zonder verlies van data mogelijk is om TLER uit te zetten kan je dat doen als ie "iets" zekerder wilt zijn van je zaak, maar nieuwe schijven kopen puur zodat ze geen TLER hebben zou ik toch niet zo 123 doen :)

O en je schijven zijn 3 jaar oud, maar draaien ze 24/7? Die dingen zijn gemaakt om heel veel draai-uren te maken dus ik denk dat je data veiliger is op zulk soort schijven (zelfs met TLER) dan op 'gewone' schijven.

3780wP (18x 210wP EC Solar) | 2x Marstek Venus E (5.12kWh)


Acties:
  • 0 Henk 'm!

  • Specter06
  • Registratie: April 2012
  • Laatst online: 11-09 11:06
Hmm, ja ze zijn meer dan 3 jaar oud, hebben nog steeds geen enkel probleem dus met de reliability zit het wel snor. Nou zitten ze dan ook in een externe behuizing (eigenlijk niet voor bedoeld natuurlijk) en die gebruik ik alleen om 1 keer per week een backup te maken dus ze staan meer uit dan aan.

Daarnaast staan er vooral disk images op van m'n complete verzameling cd's, dvd's, blu-rays en games omdat het gewoon makkelijker is om even een image te mounten dan die disks op te zoeken dus de originele bron van al die images heb ik nog. De echt belangrijke data, die praktisch onvervangbaar is heb ik uiteraard nog op 2 andere plekken staan zoals ik al eerder gezegd heb.

Denk dat het gewoon een kwestie is van voorzichtig zijn in dit geval dus, omdat bad sectors mogelijk niet hersteld kunnen worden en die data dus verloren gaat mocht er echt een probleem zijn dat niet opgelost kan worden binnen de 7 seconden die TLER de schijf gunt om de data te herstellen. Er zijn door SMART echter nog geen bad sectors gedetecteerd. Als die images weg zijn is het nog geen enorme ramp maar het kost wel een hoop tijd om ze terug te halen van de originele bron.

Ik ga ze denk niet vervangen, wel zorgen voor extra ruimte om eventuele problemen op te kunnen vangen mocht SMART die detecteren. Misschien dat ik ze op een gegeven moment alsnog eruit gooi maar zoals het report er nu uitziet is er nog geen enkel probleem.
Pagina: 1