[RAID] problemen bij onverwachte shutdown

Pagina: 1
Acties:

  • Boyd
  • Registratie: Januari 2006
  • Laatst online: 27-01 23:27
Ik heb momenteel 2 raptors in RAID1 draaien. Dit doe ik op de onboard RAID controller van mij ga-p35-dq6. (ICH9)

Voorheen had ik RAID0, maar op wat van manier dan ook raakte hij tot 2 keer toe 1 van de 2 schijven kwijt en ben ik maar overgestapt op RAID1.

Ik ben erachter gekomen, dat zodra mijn computer op een "niet normale manier" uit gaat, hij problemen krijgt met de RAID array.
Hier bedoel ik dus mee, stroomstoring, reset knop indrukken, bluescreen.

Als iets van die voorbeelden gebeurd, en ik start weer, gaat hij 1 schijf weer controlen en soms zelfs helemaal rebuilden.
Waarschijnlijk was dit dus ook het probleem bij m'n RAID0, zodra er een storing is, raakt hij een hele schijf kwijt of iets degelijks.

Is dit een vaker voorkomend probleem? En wat is de oorzaak hiervan?

Theoretisch gezien zou het dus best wel gevaarlijk kunnen zijn voor m'n bestanden, stel de bliksem slaat in, 1 harde schijf gaat kapot en de pc gaat uit door stroomstoring.. Dan kan het dus zijn dat hij beide schijven gewoon kwijt is, 1 kapot, andere kapot door onverwachte shutdown.

[ Voor 15% gewijzigd door Boyd op 02-10-2007 19:25 ]


  • MadDog11
  • Registratie: Juni 2001
  • Laatst online: 21-02 10:07
Yep, goede oplossing is dan een ups, die hebben meestal standaard een overspanningbeveiliging en houden ffff de stroom erop, zodat je pc gecontrolleerd plat gaat.

  • Boyd
  • Registratie: Januari 2006
  • Laatst online: 27-01 23:27
MadDog11 schreef op dinsdag 02 oktober 2007 @ 19:39:
Yep, goede oplossing is dan een ups, die hebben meestal standaard een overspanningbeveiliging en houden ffff de stroom erop, zodat je pc gecontrolleerd plat gaat.
Ik neem aan dat het niet zo hoort, dat een RAID volume naar god is zodra er een onverwachte shutdown is. Geen oplossing is dit dus.

Wat ik wel zie: Write-back cache volume ingeschakeld: NEE

Wat betekent dat? Moet ik dat juist aanzetten misschien?

  • BCC
  • Registratie: Juli 2000
  • Laatst online: 19:41

BCC

Een fatsoelijke raid kaart kopen kan iig helpen, maar is niet goedkoop. De meeste onboard raid oplossingen zijn software raid: de driver in Windows verzorgt een groot deel van bijvoorbeeld de raid functionaliteit. Bij hardware raid heb je dit probleem niet. Maar waarom heb je BSODs? Het lijkt me belangrijker om de oorzaak op te lossen dan de effecten ervan.

Na betaling van een licentievergoeding van €1.000 verkrijgen bedrijven het recht om deze post te gebruiken voor het trainen van artificiële intelligentiesystemen.


Verwijderd

Gamepie56 schreef op dinsdag 02 oktober 2007 @ 19:19:
Als iets van die voorbeelden gebeurd, en ik start weer, gaat hij 1 schijf weer controlen en soms zelfs helemaal rebuilden.
Is dit een vaker voorkomend probleem? En wat is de oorzaak hiervan?
Zonder dit gedrag is je RAID-controller of implementatie niets waard. Bij parity of mirroring RAID is het van belang dat je array zich in een 'consistente' status bevindt, ofwel gesynchroniseerd. Immers: wat je mirror nog waard als op schijf2 zich andere data bevindt dan schijf1? Hoe bepaal je dan welke schijf de 'echte' of goede data bevat? Om dit probleem te ondervangen maken goede implementaties gebruik van metainformatie vlak voordat er wordt geschreven naar de array. De array wordt als 'dirty' gemarkeerd wat inhoudt dat het zich in een transitionele fase bevindt. Het is natuurkundig onmogelijk om beide schijven op exact hetzelfde moment te updaten. Er zal ongetwijfeld een tijdverschil zitten. Als precies daartussen de stroom uitvalt dan heb je dus een probleem.

De oplossing: zoals gezegd metainformatie. Zodra je windows opstart ziet de RAID-driver dat je array zich nog in een 'dirty' status bevindt. Hey dat is niet goed, kennelijk is de array tijdens een write-opdracht niet netjes afgesloten! De juiste reactie is: rebuild je array, daarbij kun je garanderen dat de data synchroon is op beide schijven. Eén schijf is de master (vaak disk1) waarvan de data als authoritative wordt gezien. De mirroring disk zal dus worden gerebuild naar de data van de authoritative disk. Gedurende deze rebuild mag er niet gelezen worden van de mirroring disk, omdat de kans bestaat dat er oude ("stale") data wordt gelezen. Er zal dus alleen gelezen worden van de authoritative disk totdat de rebuild compleet is.

Echt goede implementaties werken nog iets geavanceerder maar het feit dat je array zich rebuild na een unclean shutdown is een GOED teken!
BCC schreef op dinsdag 02 oktober 2007 @ 19:59:
Een fatsoelijke raid kaart kopen kan iig helpen, maar is niet goedkoop. De meeste onboard raid oplossingen zijn software raid
Dat maakt natuurlijk niets uit, het gaat om de RAID implementatie. Of deze hardwarematig of softwarematig biedt geen theoretische voordelen. Wel hebben goede hardware RAID controllers de mogelijkheid van een Battery Backup Unit (BBU). Maar hetzelfde kun je met een UPS bewerkstelligen, zij het dat deze vaak kortere hold-up times hebben terwijl een BBU zo rond de 36 tot 48 uur de buffer-data vasthoudt. Overigens zorgt een BBU niet dat schijven blijven functioneren dus in principe zit je met hetzelfde probleem als een softwarematige implementatie.

  • BCC
  • Registratie: Juli 2000
  • Laatst online: 19:41

BCC

Verwijderd schreef op dinsdag 02 oktober 2007 @ 20:21:
[...]

Dat maakt natuurlijk niets uit, het gaat om de RAID implementatie. Of deze hardwarematig of softwarematig biedt geen theoretische voordelen.
Jawel, want deze wordt dan door een andere processor uitgevoerd. Op het moment dat je computer vastloopt kan je raidkaart nog wel zijn laatste schrijf acties afronden, omdat hij onafhankelijk van het OS draait.


Punt blijft dat een normale machine niet om de haverklap BSOD. Stroomuitval heb ik hier de afgelopen 6 jaar 1x gehad, dus dat lijkt me ook niet echt een veel voorkomend probleem.

Na betaling van een licentievergoeding van €1.000 verkrijgen bedrijven het recht om deze post te gebruiken voor het trainen van artificiële intelligentiesystemen.


Verwijderd

BCC schreef op dinsdag 02 oktober 2007 @ 20:50:
[...]

Jawel, want deze wordt dan door een andere processor uitgevoerd. Op het moment dat je computer vastloopt kan je raidkaart nog wel zijn laatste schrijf acties afronden, omdat hij onafhankelijk van het OS draait.
Prima maar wat moet je RAID-kaart doen als je schijven zijn uitgevallen? En denk je dat processor op de RAID-kaart nog werkt na de spanning kwijt te zijn, zelfs al heb je een BBU? Wat denk je dat er gebeurt als de RAID-kaart via de PCI-express of PCI-X een HW_RESET signaal krijgt?

M.a.w. het feit dat je een dedicated processor hebt, betekent niet direct dat je storage oplossing veiliger is. Misschien als je een standalone oplossing gebruikt waarbij de fysieke schijven een eigen stroomvoorziening hebben onafhankelijk van de host PC.
Punt blijft dat een normale machine niet om de haverklap BSOD. Stroomuitval heb ik hier de afgelopen 6 jaar 1x gehad, dus dat lijkt me ook niet echt een veel voorkomend probleem.
Toch is het enorm belangrijk dat een RAID-array ook bij unclean shutdowns niet in de problemen komt. Waarom draai je anders een mirror? Om diezelfde reden is het belachelijk om write-back op een RAID1-array in te schakelen. Draai dan gewoon RAID0.

  • Boyd
  • Registratie: Januari 2006
  • Laatst online: 27-01 23:27
Ok, kan iemand het stukje kopieren waar ik zeg dat ik "om de haverklap" een BSOD heb?
Het gaat even om het princiepe.. Het is me in de afgelopen maand 2 keer gebeurd.. Beide keren door het installeren van tv kaart drivers op vista64.. dat werkt niet..

Daarnaast deze maand ook 2 keer stroomuitval gehad, ik woon in nieuwbouw, overdag ben ik op m'n werk, en er waren bijvoorbeeld vandaag wat mensen voor de zonwering, dus de stroom moest eraf.. Hebben ze gewoon de schakelaar omgezet in de meterkast..

@de rest,
een heleboel info.. , ik heb weer wat geleerd :P, thnx

  • base_
  • Registratie: April 2003
  • Laatst online: 21-02 02:37
een raid controller moet idd opnieuw syncen na power loss, alleen een bbu zorgt ervoor dat de buffer zijn data behoud. Bij een goede raid controller wordt namelijk de (write) cache van de harddisk uitgeschakeld en hiervoor wordt cache op de controller gebruikt met bbu zodat in principe geen data verloren gaat bij power failure... De betere controllers kunnen dan op de achtergrond de schijven nogmaals syncen/checken. Overigens zal een simpele raid 1 zonder bbu best veilig zijn, normaliter kan je gewoon met 1 van beide schijven doorwerken en zal bij power failure alleen de data uit de buffer weg zijn (dus de data van de bestanden die op dat moment geschreven worden ben je kwijt, lezen maakt niet uit), maar biedt raid geen enkele bescherming tegen virussen of per ongeluk verwijderen van bestanden/partities etc, vandaar dat raid 1 normaliter voornamelijk gebruikt wordt om systemen online te kunnen houden ondanks harddisk failure en moeten er nog steeds aparte backups gemaakt worden van deze storage! Voor een goeie systeembeheerder hebben bestanden die dus op 1 fysieke lokatie staan niet veel recht van bestaan :P

  • BCC
  • Registratie: Juli 2000
  • Laatst online: 19:41

BCC

Verwijderd schreef op dinsdag 02 oktober 2007 @ 20:55:
[...]

Prima maar wat moet je RAID-kaart doen als je schijven zijn uitgevallen? En denk je dat processor op de RAID-kaart nog werkt na de spanning kwijt te zijn, zelfs al heb je een BBU?.
True, ik denk niet dat je naast een BBU of UPS iets kan doen tegen stroomuitval. Misschien de schijven niet gebruiken net voor de stroomuitval :)
Toch is het enorm belangrijk dat een RAID-array ook bij unclean shutdowns niet in de problemen komt. Waarom draai je anders een mirror? Om diezelfde reden is het belachelijk om write-back op een RAID1-array in te schakelen. Draai dan gewoon RAID0.
Je hebt meer kans dat het goed misgaat als het misgaat :)

Na betaling van een licentievergoeding van €1.000 verkrijgen bedrijven het recht om deze post te gebruiken voor het trainen van artificiële intelligentiesystemen.

Pagina: 1