Server HDD replace -> na hoeveel jaar

Pagina: 1
Acties:

  • Martijn
  • Registratie: Juli 1999
  • Nu online
Ik heb in een paar servers verschillende RAID opstellingen met per server ook verschillende soorten schijven. Nu draaien sommige servers al beetje meer dan 3 jaar prima, nergens problemen mee gehad...

Nu zat ik me echter af te vragen hoe lang dit veilig is, en wanneer het verstandig is de schijven te wisselen... In een server zitten bijvoorbeeld WD Raptors, maar in een andere server weer gewone WD Caviar SE schijven... Kwalitatief dus ook nog wel wat verschil... Wat ik ook ergens gelezen heb, is dat wanneer er een schijf kapot gaat in een RAID array, en je gaat rebuilden op een nieuwe schijf, dat de kans erg groot is dat de andere 'oude' schijf ook geest geeft... Dat soort situaties wil ik uiteraard voorkomen ;)...

Dus, kort door de bocht, hoe lang kun je schijven continue hebben draaien? ;)

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Ik denk juist dat als je ze continu laat draaien dat er dan niet ineens disks uitgaan vallen. De meeste schijven gaan dood als ze weer ingeschakeld worden (of door piekspanningen). Als het draait zou ik het lekker laten draaien.
De kans dat een RAID array sterft op het moment dat je hem aan het rebuilden bent is net zo groot als dat hij sterft bij normaal gebruik. dus als je backups hebt zou ik daar niet bang voor zijn.

  • Martijn
  • Registratie: Juli 1999
  • Nu online
Terw_Dan schreef op dinsdag 22 juli 2008 @ 13:46:
Ik denk juist dat als je ze continu laat draaien dat er dan niet ineens disks uitgaan vallen. De meeste schijven gaan dood als ze weer ingeschakeld worden (of door piekspanningen). Als het draait zou ik het lekker laten draaien.
De kans dat een RAID array sterft op het moment dat je hem aan het rebuilden bent is net zo groot als dat hij sterft bij normaal gebruik. dus als je backups hebt zou ik daar niet bang voor zijn.
Nu moet ik een heel aantal servers binnenkort gaan verhuizen... Ik dacht dat het wellicht verstandig was om dan ook schijven te wisselen, maar jij zegt dat wanneer alles weer prima boot het gewoon zou moeten kunnen blijven draaien?

Na hoeveel tijd moet je preventief toch wel gaan wisselen? Ik heb niet veel zin in een degraded RAID array, dus ben liever proactief dan reactief ;).

  • DukeBox
  • Registratie: April 2000
  • Nu online
Bij een raidset met meerdere disken is de kans vrij groot dat na lange tijd draaien bij een spindown er meerdere disken defect blijken (lees: niet meer opspinnen). Dat is ook een reden dat veel SAN's regelmatig disk rebuilds doen op hun spare om zo de 'nieuwe spare' een spindown en up te geven.
Martijn schreef op dinsdag 22 juli 2008 @ 13:53:
Nu moet ik een heel aantal servers binnenkort gaan verhuizen... Ik dacht dat het wellicht verstandig was om dan ook schijven te wisselen, maar jij zegt dat wanneer alles weer prima boot het gewoon zou moeten kunnen blijven draaien?
Als het toch een raid1 of hoger is dan kun je natuurlijk gewoon handmatig een failure genereren.. als je na de rebuild telkens een andere disk pakt weet je vrijwel zeker dat ze ook weer netjes opkomen.

[ Voor 48% gewijzigd door DukeBox op 22-07-2008 13:57 ]


  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Zoek de MTBF van de disks op, dat is de beste manier om een inschatting te maken. Al zegt dat nog niet veel natuurlijk. Als je net die ene schijf hebt die het na een jaar begeeft heb je alsnog problemen. Daar is dus niet echt een regel voor, het hangt heel erg af van de disks.

Zelf zou ik, ook in servers, pas gaan kijken naar andere disks op het moment dat je aanwijzingen krijgt dat de huidige steken laten vallen. Dus krijg je SMARTerrors, controleer of die ergens over gaan en ga dan gelijk vervangen. Op die manier ben je erbij voordat een disk helemaal defect raakt zonder dingen onnodig te vervangen.
Maar ook in deze situatie geldt dat een disk altijd stuk kan gaan. Maar met een backup en een goede RAID array zou ik daar niet bang voor zijn.

  • Kenw00t
  • Registratie: Augustus 2007
  • Laatst online: 09-02 20:18
Terw_Dan schreef op dinsdag 22 juli 2008 @ 13:46:
De kans dat een RAID array sterft op het moment dat je hem aan het rebuilden bent is net zo groot als dat hij sterft bij normaal gebruik. dus als je backups hebt zou ik daar niet bang voor zijn.
Dat dacht ik ook, tot ik dit las: http://blogs.zdnet.com/storage/?p=162
Wel met een korreltje zout te nemen natuurlijk ;)

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Kenw00t schreef op dinsdag 22 juli 2008 @ 14:02:
[...]
Dat dacht ik ook, tot ik dit las: http://blogs.zdnet.com/storage/?p=162
Wel met een korreltje zout te nemen natuurlijk ;)
Een korreltje... gaarne een heel pak.

Het maakt toch geen klap uit of je 8 100GB drives in RAID 5 hebt, of 8 1000GB drives in RAID 5. De kans dat 1 ding dood gaat is even groot (mogelijk kleiner, doordat hdds steeds verder geperfectioneerd worden, maar daar tegenover staan weer kinderziektes in nieuwe series. dus zeg even groot).
Dat hele in 2009 verhaal gaat je array dood is imho beetje stemmingmakerij. Natuurlijk is RAID 6 beter dan RAID 5, omdat je simpelweg een spare disk hebt. Ik heb zelf een RAID 5 array van 8 disks. De kans dat zo'n ding stuk gaat is aanwezig, dat weet ik, maar daar kun je rekening mee houden. De array is niet van vitaal belang, dus ik heb geen spare disk. Ik had ook RAID 5 met spare of RAID 6 en zelfs RAID 6 met spare kunnen kiezen, maar dat vind ik niet nodig voor mijn toepassing.

Backups zijn altijd belangrijk, ook al heb je een RAID 6 array die opgebouwd is uit RAID 1 array's, er kan altijd wat stuk gaan.

Wat ze in dat artikel hebben gedaan is leuk met statistiekjes schuiven, en er zal ook vast wel ergens een RAID5 array sterven, maar ik denk dat het meerendeel gewoon vrolijk door blifjt draaien.

  • Martijn
  • Registratie: Juli 1999
  • Nu online
Hmm, dit alles werpt wel een nieuw licht op de zaak... Geld uitgeven als het niet echt hoeft is natuurlijk ook BS...

Wat is wellicht dan een betere config? Ik heb nu een RAID5 array van 3 raptors, dus het minimale zonder spare... Is een RAID 1 met hotspare veiliger? Ik weet dat de hoeveelheid GB's 50% kleiner wordt, maar dat is niet zo'n probleem...

  • asing
  • Registratie: Oktober 2001
  • Laatst online: 18:43
Je kan er eigenlijk geen klap van zeggen. Sommige disks houden het jaren uit (mijn pa heeft nog een Quantum Fireball 20GB 5,25") en anderen vallen binnen een jaar uit. Begin dus met een goede backup zodat je dat geborgd hebt.

Ik weet niet hoelang je je servers in produktie houdt, als je ze met 3 jaar al vervangt dan kan je de disks gewoon laten zitten. Bij 5 jaar zou ik het maximum stellen. Maar dan meteen de hele server.

Who's General Failure and why is he reading my harddrive? - Projectmanager : a person who thinks nine women can make one baby in one month


  • Dirk
  • Registratie: November 2004
  • Laatst online: 13:27

Dirk

Coördinator frontpagemoderatie
Martijn schreef op dinsdag 22 juli 2008 @ 14:20:
Wat is wellicht dan een betere config? Ik heb nu een RAID5 array van 3 raptors, dus het minimale zonder spare... Is een RAID 1 met hotspare veiliger? Ik weet dat de hoeveelheid GB's 50% kleiner wordt, maar dat is niet zo'n probleem...
Tja, als je die kant op gaat zou ik zeggen raid 1 over 3 disks zonder spare, hoef je minder te rebuilden en kun je eenvoudig twee disks verliezen zonder problemen. Qua lees- en schrijfsnelheid zul je er ook op vooruit gaan, want je verliest de pariteits berekeningen.

[ Voor 39% gewijzigd door Dirk op 22-07-2008 14:29 ]

All statements are true in some sense, false in some sense, meaningless in some sense, true and false in some sense, true and meaningless in some sense, false and meaningless in some sense, and true and false and meaningless in some sense.


  • asing
  • Registratie: Oktober 2001
  • Laatst online: 18:43
Martijn schreef op dinsdag 22 juli 2008 @ 14:20:
Hmm, dit alles werpt wel een nieuw licht op de zaak... Geld uitgeven als het niet echt hoeft is natuurlijk ook BS...

Wat is wellicht dan een betere config? Ik heb nu een RAID5 array van 3 raptors, dus het minimale zonder spare... Is een RAID 1 met hotspare veiliger? Ik weet dat de hoeveelheid GB's 50% kleiner wordt, maar dat is niet zo'n probleem...
Zet er een hot spare bij. Als er nu een disk defect gaat draait je RAID nog wel door, maar wordt erg langzaam. Met een hot spare wordt die opgebouwd. Kost ook tijd er performance maar het draait daarna wel weer.

* asing heeft beheerders meegemaakt die vrolijk gingen booten met een defecte disk en uiteindelijk het OS er maar opnieuw opzetten omdat ze het ook niet meer wisten.

Who's General Failure and why is he reading my harddrive? - Projectmanager : a person who thinks nine women can make one baby in one month


  • leuk_he
  • Registratie: Augustus 2000
  • Laatst online: 28-01 19:27

leuk_he

1. Controleer de kabel!

Hot spare is de grote kunst van beheers kosten terug te brengen.

Na een aantal jaar weet niemand meer precies hoe die raid was ingericht. (jij bent dan weer weg bij die club). Als er dan een schijf dood gaat en automatisch herbouwd wordt op de nieuwe disk heb je het meest kans dat het systeem langer gaat draaien zonder downtime of dat iemand midden in de nacht iets moet ondernemen.

Inmiddels is dat systeem dan wel zo oud dat het weer vervangen moet gaan worden. (harde schijven die identiek zijn aan schijven van 5 jaar terug zijn heel erg duur in verhouding.)

Als je het over extreem dure server systeem hebt gelden uiteraard weer ander economische redenen.

Need more data. We want your specs. Ik ben ook maar dom. anders: forum, ff reggen, ff topic maken
En als je een oplossing hebt gevonden laat het ook ujb ff in dit topic horen.


  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Dirk schreef op dinsdag 22 juli 2008 @ 14:28:
[...]

Tja, als je die kant op gaat zou ik zeggen raid 1 over 3 disks zonder spare, hoef je minder te rebuilden en kun je eenvoudig twee disks verliezen zonder problemen. Qua lees- en schrijfsnelheid zul je er ook op vooruit gaan, want je verliest de pariteits berekeningen.
Dat gaat dus niet, RAID 1 vereist een even aantal disks. Dus je kunt dan wel RAID 1 met 1 spare doen.
Daarbij is RAID 5 zonder extra spare sneller dan RAID 1 met spare, omdat je met RAID 1 max de throughput van 1 disk hebt.

  • Martijn
  • Registratie: Juli 1999
  • Nu online
Terw_Dan schreef op dinsdag 22 juli 2008 @ 14:59:
[...]

Dat gaat dus niet, RAID 1 vereist een even aantal disks. Dus je kunt dan wel RAID 1 met 1 spare doen.
Daarbij is RAID 5 zonder extra spare sneller dan RAID 1 met spare, omdat je met RAID 1 max de throughput van 1 disk hebt.
Mja, inderdaad, ik denk dat ik er een hotspare bij zet bij de RAID5 config... Lijkt me for now de beste optie... De RAID1 servers hebben RAID kaarten met 2 porten, dus hotspares zijn daar vrij moeilijk ;).

  • Martijn
  • Registratie: Juli 1999
  • Nu online
Ik ben nu even aan het shoppen voor een extra Raptor, echter bestaat exact dezelfde schijf niet meer... Maakt dit wat uit. De 3 schijven in RAID5 die erin zitten zijn Raptor 74GB eerste generatie met 8MB cache, wat je nu koopt is allemaal met 16MB, wel nog steeds SATA 1 geloof ik...

  • Dirk
  • Registratie: November 2004
  • Laatst online: 13:27

Dirk

Coördinator frontpagemoderatie
Terw_Dan schreef op dinsdag 22 juli 2008 @ 14:59:
[...]

Dat gaat dus niet, RAID 1 vereist een even aantal disks. Dus je kunt dan wel RAID 1 met 1 spare doen.
Daarbij is RAID 5 zonder extra spare sneller dan RAID 1 met spare, omdat je met RAID 1 max de throughput van 1 disk hebt.
Hoezo? Met hardware raid en specifieke servers kun je inderdaad beperkt zijn, maar met DIY servers software raid zoals je dat vindt in linux/bsd moet het prima kunnen. Ik weet het, dat is hier niet van toepassing, maar het kán dus wel. Raid 10 kan idd niet, maar raid 1 wel, of je nou mirrort naar een of twee schijven, dat maakt nauwelijks iets uit. En, bij een goede raid-implementatie, is de leessnelheid bijna gelijk aan de snelheid van de drie disken bij elkaar, je kunt van alle drie tegelijkertijd lezen tenslotte. De schrijfsnelheid kan wel lager zijn, je moet tenslotte naar alle disks alle data wegschrijven, dus dat is maximaal de snelheid van een enkele disk.

All statements are true in some sense, false in some sense, meaningless in some sense, true and false in some sense, true and meaningless in some sense, false and meaningless in some sense, and true and false and meaningless in some sense.

Pagina: 1