Kans op succesvol rebuilden "grote" ZFS array

Pagina: 1
Acties:

  • TommyboyNL
  • Registratie: Januari 2006
  • Niet online
Naar aanleiding van de reacties op nieuws: 'Toshiba brengt nog dit jaar een met helium gevulde 14TB-hdd uit' ben ik eens gaan rekenen aan mijn ZFS array, en krijg het daar stiekem een beetje benauwd van...
Ik heb een RAIDZ array van 5 pricewatch: Seagate IronWolf, 6TB disks, met volgens de datasheet "Niet-herstelbare leesfouten per gelezen bits, maximaal 1 per 10E15"

Dus, de kans dat een bitje succesvol uitgelezen wordt is 1-(1/10^15)
Bij een overleden disk moet ik 4 x 6 TB uitlezen: 4 * 6 * 8 * 10^12

Dat levert het volgende sommetje op: (1-(1/10^15)) ^ (4 * 6 * 8 * 10^12) = 0,82543353091 (aldus google)

Ik weet dat RAIDZ wat slimmere dingen doet dan een simpele RAID 5, maar dit percentage was toch wat verontrustend.

Is er iemand met meer verstand van deze materie (met name RAIDZ) die mij kan vertellen of, en zo ja waar, ik de fout in ga?

Overigens zijn er veel disks die het een factor 10 slechter doen op dit gebied, dan wordt de berekening helemaal dramatisch: (1-(1/10^14)) ^ (4 * 6 * 8 * 10^12) = 0,14683211986

Edit: En ja, ik maak backups :+ Een mislukte rebuild is dut kut, maar niet het eind van de wereld.

[ Voor 3% gewijzigd door TommyboyNL op 05-09-2017 19:06 ]


  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

Het gaat fout op het punt dat je de aanname maakt dat jouw schijf zich houdt aan de minst gunstige interpretatie van de specificaties. Hoe vaak voer jij een scrub uit over jouw schijven? Hoe groot is de kans dat je al een leesfout gehad zou moeten hebben, en heb je al leesfouten gehad?

  • johnkeates
  • Registratie: Februari 2008
  • Laatst online: 04-07-2025
Ik zou geen RAIDZ meer gebruiken als je data echt belangrijk is. 20-40%% ipv 50% ruimte verliezen is leuk, maar als je je pool gewoon uit mirrors of triple mirrors bouwt is het sneller en veiliger. Ik heb zo'n beetje alles triple-mirrored, dan kan je gewoon goedkope schijven gebruiken, en als je genoeg bays hebt kan je ook heel veel schijven gebruiken in plaats van hele grote schijven, wat het herstel sneller maakt.

[ Voor 36% gewijzigd door johnkeates op 05-09-2017 20:53 ]


  • TommyboyNL
  • Registratie: Januari 2006
  • Niet online
dcm360 schreef op dinsdag 5 september 2017 @ 20:49:
Het gaat fout op het punt dat je de aanname maakt dat jouw schijf zich houdt aan de minst gunstige interpretatie van de specificaties. Hoe vaak voer jij een scrub uit over jouw schijven? Hoe groot is de kans dat je al een leesfout gehad zou moeten hebben, en heb je al leesfouten gehad?
Uit voorzorg reken ik graag met worst-kaas scenario's, maar je hebt inderdaad gelijk wat betreft de grote kans op voorbeeldiger gedrag dan beloofd. Verder heb ik de scrub op de default van FreeNAS laten staan, dat is geloof ik wekelijks of eens in de 10 dagen.
En nee, nog geen leesfouten. Disks zijn slechts een paar maanden oud.
johnkeates schreef op dinsdag 5 september 2017 @ 20:53:
Ik zou geen RAIDZ meer gebruiken als je data echt belangrijk is. 20-40%% ipv 50% ruimte verliezen is leuk, maar als je je pool gewoon uit mirrors of triple mirrors bouwt is het sneller en veiliger.
Het merendeel van mijn data mag in het slechtste geval verdampen en de belangrijke data wordt momenteel gebackupt naar Dropbox. De belangrijkste data komt dit weekeind echter ook in een tweede FreeNAS doos te hangen. Ik moet alleen ESXi nog even overtuigen dat 3,84GB RAM het zelfde is als de minimale 4GB die het eist...