[RAID 5] Na schijfcrash toch uit de lucht ?

Pagina: 1
Acties:

  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Ik post hier maar even omdat er dan denk ik sneller reacties komen, en m.i. hoort het hier ook wel een beetje.


Ik was altijd in de veronderstelling dat een RAID 5 config bij een schijfcrash gewoon door blijft draaien.

Echter nu ligt een Netfinity 5500 met RAID 5 bij ons plat met de melding dat scsi-id 2 (=de derde hdd) niet meer reageert.

De storing is aangemeld enzo maar ik wou hier eens de vraag stellen of het inderdaad kan dat een RAID 5 toch uit de lucht gaat bij een schijfcrash.....

Donec eris felix, multos numerabis amicos


Verwijderd

hij mag niet uitgaan...
je moet normaal gesproken server uitzetten, nieuwe schijf erin, en rebuilden

  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
kan niet: als een RAID controller geconfigged is voor RAID-5 moet ie gewoon blijven draaien met een schijf minder.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


  • Harrie666
  • Registratie: November 2000
  • Laatst online: 23-02 19:35
Op donderdag 30 mei 2002 12:27 schreef arjo_kamp het volgende:
hij mag niet uitgaan...
je moet normaal gesproken server uitzetten, nieuwe schijf erin, en rebuilden
HOTSWAP :) server NIET uit en dan rebuilden van je raidset.

zal wel wat performence verschil geven afhankelijk van hoe snel je hem weer rebuild wil hebben.

  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Heb de hdd ff van id 2 naar 3 gezet en wat denk je, hij draait weer.

Probleem zit dus in de scsi-controller (ID2), kan het dan wel zijn dat de server er op dat moment mee kapt ?

Moet haast wel, fout zit in de controller dus die heeft op dat moment geweigerd. Nu draait ie wel weer maar voor hoelang is de vraag. :+

Donec eris felix, multos numerabis amicos


  • Jorn
  • Registratie: Juni 2001
  • Laatst online: 30-04 16:47
Op donderdag 30 mei 2002 12:47 schreef seq_uence het volgende:
Heb de hdd ff van id 2 naar 3 gezet en wat denk je, hij draait weer.

Probleem zit dus in de scsi-controller (ID2), kan het dan wel zijn dat de server er op dat moment mee kapt ?

Moet haast wel, fout zit in de controller dus die heeft op dat moment geweigerd. Nu draait ie wel weer maar voor hoelang is de vraag. :+
Als de controller echt kapot is kan dat idd wel ja!
Heeft nl. niets met de raid te maken(nou ja, niet zoals ik bedoel!) maar is gewoon een hardware probleem, mijn comp hing een keer op een kapotte soundcard(ging aan maar geen beeld), en zoeken dat ik deed totdat ik alles er uit en 1 voor 1 er weer in!

* Erkens is een sukkel en ramt in mirc op f5 :+
* XTerm GROOOOOOTE kuis houden op hd's :)


  • _nethack
  • Registratie: September 2000
  • Laatst online: 17:39

_nethack

We're all MAD here

Firmware + Bios van de controller updaten!!

Ik heb dit probleem al 2 keer meegemaakt, één keer met een IBM x232 waar een schijf uit de array stapte, de server wel bleef draaien maar waar toch datacorruptie optrad, en vorige week nog met een ouwe Netfinity 7000, waar ook na het doodgaan van één schijf de array beschadigd raakte.
(De array zelf was overigens nog wel min of meer in tact. De controller gaf aan 1 device defunct, 2 logical drives critical. NT startte niet meer op, maar met een dosflop met NTFSPro kon ik nog wel gewoon de partities benaderen.)

Sometimes you just have to sit back, relax, and let the train wreck itself


  • JackBol
  • Registratie: Maart 2000
  • Niet online

JackBol

Security is not an option!

Op donderdag 30 mei 2002 12:28 schreef paulhekje het volgende:
kan niet: als een RAID controller geconfigged is voor RAID-5 moet ie gewoon blijven draaien met een schijf minder.
nee hoor. raid 5 werkt niet met 2 schijven.
je zult eerst een nieuwe 3e erin moeten stoppen, en de data rebuilden, voordat ales weer werkt.

Opbrengst van mijn Tibber Homevolt met externe kWh meter. | Opbrengst van mijn Tibber Homevolt volgens de Tibber Data API.


  • GarBaGe
  • Registratie: December 1999
  • Laatst online: 14:28
Op donderdag 30 mei 2002 15:10 schreef Dirk-Jan het volgende:

[..]

nee hoor. raid 5 werkt niet met 2 schijven.
je zult eerst een nieuwe 3e erin moeten stoppen, en de data rebuilden, voordat ales weer werkt.
Zonder redundancy wel.

Mijn RAID-10 heeft ook 2 maanden gedraaid op 3 disks ipv 4. Wel continue waarschuwingen en je redundantie is pleitte, maar het doet het nog wel. Dat is nou juist de gein van RAID (>0)

Ryzen9 5900X; 16GB DDR4-3200 ; RTX-4080S ; 7TB SSD


  • Koffie
  • Registratie: Augustus 2000
  • Laatst online: 13:25

Koffie

Koffiebierbrouwer

Braaimeneer

Op donderdag 30 mei 2002 15:10 schreef Dirk-Jan het volgende:

[..]

nee hoor. raid 5 werkt niet met 2 schijven.
je zult eerst een nieuwe 3e erin moeten stoppen, en de data rebuilden, voordat ales weer werkt.
:? Dat kan dus WEL met RAID-5 hoor.
Zou een beetje erg kl#te zijn als je in de tussentijd niet bij je data kan.
Je kunt gewoon bij een 3 schijven setup doorwerken met maar 2 werkende schijven.

dat is o.a. de kracht van RAID-5

Tijd voor een nieuwe sig..


  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op donderdag 30 mei 2002 13:53 schreef Operations het volgende:
Firmware + Bios van de controller updaten!!

Ik heb dit probleem al 2 keer meegemaakt, één keer met een IBM x232 waar een schijf uit de array stapte, de server wel bleef draaien maar waar toch datacorruptie optrad, en vorige week nog met een ouwe Netfinity 7000, waar ook na het doodgaan van één schijf de array beschadigd raakte.
(De array zelf was overigens nog wel min of meer in tact. De controller gaf aan 1 device defunct, 2 logical drives critical. NT startte niet meer op, maar met een dosflop met NTFSPro kon ik nog wel gewoon de partities benaderen.)
Updaten van firmware heb ik pas nog gedaan, ik heb geen corrupte data, na het verplaatsen van de hdd naar een ander scsi ID loopt ie weer probleemloos.

Donec eris felix, multos numerabis amicos


  • JackBol
  • Registratie: Maart 2000
  • Niet online

JackBol

Security is not an option!

hhmmz... weet ik dat ook weer...
ik werk niet zovaak met Raid setups, maar ik heb altijd gedacht dat raid 5 juist 3 disks nodig had. ach... bent nooit te oud om te leren. ;)


MAAR ik weer wel zeker dat het verstandig is die 3e disk snel te vervangen voor een nieuwe :Y)

Opbrengst van mijn Tibber Homevolt met externe kWh meter. | Opbrengst van mijn Tibber Homevolt volgens de Tibber Data API.


  • Karel2001
  • Registratie: Februari 2001
  • Laatst online: 03-06-2022
Op donderdag 30 mei 2002 15:48 schreef Dirk-Jan het volgende:
hhmmz... weet ik dat ook weer...
ik werk niet zovaak met Raid setups, maar ik heb altijd gedacht dat raid 5 juist 3 disks nodig had. ach... bent nooit te oud om te leren. ;)


MAAR ik weer wel zeker dat het verstandig is die 3e disk snel te vervangen voor een nieuwe :Y)
je kan ook werken met een "dedicated" of "global" hotspare (afhankelijk van je setup) hierbij zal de uitgevallen HD direct vervangen worden door de hotspare...kan je dus op je gemak de kapotte schijf vernieuwen :)

  • ArCadE
  • Registratie: Januari 2000
  • Laatst online: 14:21

ArCadE

No banana available

Nog mooier, Raid ADG van Compaq.
Raid 5 gaat tot maximaal 14 schijven. ADG kan tot 52 schijven. Hij legt er een dubbele stripe overheen i.p.v. een enkele...

  • JackBol
  • Registratie: Maart 2000
  • Niet online

JackBol

Security is not an option!

Op donderdag 30 mei 2002 15:52 schreef Karel2001 het volgende:

[..]

je kan ook werken met een "dedicated" of "global" hotspare (afhankelijk van je setup) hierbij zal de uitgevallen HD direct vervangen worden door de hotspare...kan je dus op je gemak de kapotte schijf vernieuwen :)
jah, dat wist ik wel... :)

Opbrengst van mijn Tibber Homevolt met externe kWh meter. | Opbrengst van mijn Tibber Homevolt volgens de Tibber Data API.


Verwijderd

Als RAID 5 niet uit mag gaan, is de data dan nogsteeds beschikbaar bij 1 defecte schijf? :?

  • wildhagen
  • Registratie: Juni 1999
  • Niet online

wildhagen

Blablabla

Op donderdag 30 mei 2002 18:25 schreef RS het volgende:
Als RAID 5 niet uit mag gaan, is de data dan nogsteeds beschikbaar bij 1 defecte schijf? :?
Ja, die kan de controller reconstrueren uit de resterende disks + indexdisk.

Bij 2 of meer defecte schijven heb je een probleem (lees: dan hoop ik dat je je backups goed bijhoud...)

Virussen? Scan ze hier!


  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op donderdag 30 mei 2002 15:48 schreef Dirk-Jan het volgende:
hhmmz... weet ik dat ook weer...
ik werk niet zovaak met Raid setups, maar ik heb altijd gedacht dat raid 5 juist 3 disks nodig had. ach... bent nooit te oud om te leren. ;)


MAAR ik weer wel zeker dat het verstandig is die 3e disk snel te vervangen voor een nieuwe :Y)
Niet dus, als je mijn verhaal goed leest weet je dat het probleem in de controller zat, de hdd is wel in orde.

Donec eris felix, multos numerabis amicos


  • Jedi Lord
  • Registratie: Februari 2000
  • Laatst online: 16-04 09:32
Dit heb ik vorig jaar meerdere keren mee mogen maken.

Toen hadden we nog van die brakke HP E50 servers met externe storage racks, die RAID controllers waren een beetje brak.

Wat er gebeurd:
Er zal meestal 1 schijf failen, en omdat deze op de scsi bus daarvan melding maakt of dat de controller dit opmerkt wil het wel eens gebeuren dat dan zomaar een of meerdere werkende schijven ook als failed komen te staan, kortom
Een defecte schijf kan een andere schijf op dezelfde scsi bus plat leggen.

Dit zou idd met een bios update verholpen moeten zijn, maar of dat ook echt zo is, geen idee geen failing stripes meer gehad.

Maar jij steld dus op je HD een scsi id in? neem een echt merk die doet dat voor je, want das nou net iets wat je vergeet als je je spare Hotplug schijf er in hangt.
en ja dan array plat

May the Force be with You instead of Bill


Verwijderd

Op donderdag 30 mei 2002 18:46 schreef wildhagen het volgende:

[..]

Ja, die kan de controller reconstrueren uit de resterende disks + indexdisk.

Bij 2 of meer defecte schijven heb je een probleem (lees: dan hoop ik dat je je backups goed bijhoud...)
Dus bij 4 schijven waar van 1 defect is, draait het systeem door, zonder dat je een nieuwe erin hangt voor reconstructie?

Of moet verplicht een reconstructie plaats vinden?

  • drepa
  • Registratie: Februari 2001
  • Laatst online: 28-01-2025
dussss...

raid 5 (striping met redundancy) minimaal 3 schijven maximaal aantal schijven is afhankelijk van de controler, als je raid met 2 schijven is dan is het GEEN raid 5 meer.

maar goe...
je raid controler heeft als t goed is ook een scsi ID, misschien is die id van de kaart versprongen naar 2 of iets dergelijks.

tis maar een idee

  • JackBol
  • Registratie: Maart 2000
  • Niet online

JackBol

Security is not an option!

Op donderdag 30 mei 2002 19:52 schreef seq_uence het volgende:

[..]

Niet dus, als je mijn verhaal goed leest weet je dat het probleem in de controller zat, de hdd is wel in orde.
in jou geval jah, ik had het over Raid 5 in het algemeen.

Opbrengst van mijn Tibber Homevolt met externe kWh meter. | Opbrengst van mijn Tibber Homevolt volgens de Tibber Data API.


Verwijderd

Op donderdag 30 mei 2002 16:01 schreef ArCadE het volgende:
Nog mooier, Raid ADG van Compaq.
Raid 5 gaat tot maximaal 14 schijven. ADG kan tot 52 schijven. Hij legt er een dubbele stripe overheen i.p.v. een enkele...
Raid adg is een raid5 met een additionele parityset gebaseert op een ander parity algoritme. raid5 gaat zeker wel tot een x nummer van disken, maar het is aanbevolen ( afhankelijk van de controller ) bij 8 of 14 disken naar raid adg te gaan omdat je een 2de disk mag verliezen. voor schrijven is het echter wel een beetje trager ( afhankelijk van cache )

  • Karel2001
  • Registratie: Februari 2001
  • Laatst online: 03-06-2022
nog mooier is RAID 50 (alleen bij HP)

je hebt dan 2 RAID 5 array's van minimaal 3 schijven met waarover RAID 0 :P

Het is dus een combinatie van RAID 5 en 0, betrouwbaar (RAID 5) en snelheid (RAID 0)

Verwijderd

Op donderdag 30 mei 2002 20:42 schreef Karel2001 het volgende:
nog mooier is RAID 50 (alleen bij HP)

je hebt dan 2 RAID 5 array's van minimaal 3 schijven met waarover RAID 0 :P

Het is dus een combinatie van RAID 5 en 0, betrouwbaar (RAID 5) en snelheid (RAID 0)
Ehm, das niet helemaal waar.... dat houd in dat als ik kleine i/o doe, kleiner dan de chunksize, ik gewoon naar een raid5 schrijf. En als ik kan schrijven buiten de grote van de chunksize , ik mijn i/o split over 2 helften, wat dus effectief 1 i/o naar raid5-1 en 1 i/o naar raid5-2 stuur, dus eigenlijk de performance van een 2 disk raid0 heb. Raid 1+0 is dus sneller en meer redundant. Dit is ook de reden waarom raid 1+0 meer geimplementeerd wordt.

  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op donderdag 30 mei 2002 20:01 schreef Jedi Lord het volgende:
Dit heb ik vorig jaar meerdere keren mee mogen maken.

Toen hadden we nog van die brakke HP E50 servers met externe storage racks, die RAID controllers waren een beetje brak.

Wat er gebeurd:
Er zal meestal 1 schijf failen, en omdat deze op de scsi bus daarvan melding maakt of dat de controller dit opmerkt wil het wel eens gebeuren dat dan zomaar een of meerdere werkende schijven ook als failed komen te staan, kortom
Een defecte schijf kan een andere schijf op dezelfde scsi bus plat leggen.

Dit zou idd met een bios update verholpen moeten zijn, maar of dat ook echt zo is, geen idee geen failing stripes meer gehad.

Maar jij steld dus op je HD een scsi id in? neem een echt merk die doet dat voor je, want das nou net iets wat je vergeet als je je spare Hotplug schijf er in hangt.
en ja dan array plat
Wie zegt dat ik dat doe ?

Ik heb de hdd in een andere bracket gestoken en dan krijgt ie automatisch een ander ID.

Een IBM Netfinity 5500 heeft standaard 6 hdd brackets, daar zijn er bij deze server 3 van in gebruik.

Donec eris felix, multos numerabis amicos


  • kell.nl
  • Registratie: Januari 2002
  • Laatst online: 27-09-2023

kell.nl

Fizzgig's evil twin

Het hoeft niet perse aan je ID/bracket te liggen.
Ik heb zelf eens met een HP server hetzelfde gehad.
1 schijf stond op "failed".
Eruit gehaald, en direct weer teruggezet in hetzelfde slot.
Et voila, hij begon direct online te rebuilden.

  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op vrijdag 31 mei 2002 02:10 schreef kell.nl het volgende:
Het hoeft niet perse aan je ID/bracket te liggen.
Ik heb zelf eens met een HP server hetzelfde gehad.
1 schijf stond op "failed".
Eruit gehaald, en direct weer teruggezet in hetzelfde slot.
Et voila, hij begon direct online te rebuilden.
Ik heb die schijf ook nog weer teruggezet in de oude bracket, gevolg de hdd is not responding. Ligt in dit geval dus wel aan de bracket...

Donec eris felix, multos numerabis amicos


  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
aangezien men nu bezig is RAID-5 ervaringen te posten zal ik er ook 1 bij doen:

Op een maandag morgen kom ik op het werk, doet het netwerk het niet: bleek een 3com switch nergens meer op te reageren (nooit eerder gezien). Kijk ik in de mail: berichtje van Veritas Volume manager op een Sun server: schijf eruit geklapt in RAID-5 config. Er zit hardware support op dus Sun bellen. Monteur komt met nieuwe schijf, heeft ie de verkeerde maat bij, net te klein.
Dan maar een keer schijf eruit, zelfde "kapotte"schijf er weer in: en ja hoor, hij doet het weer.
Dit is nu ongeveer 3 maanden geleden.

Wel erg toevallig dat een switch en een schijf tegelijk problemen hadden. Dan denk je al snel aan de stroomvoorziening. Maar de SUN zit op een UPS en de gehele ruimte zit overspanningsbeveiliging op. Niks gevonden in de log van de UPS.

Conclusie: als een schijf/RAID controller niet meer werkt, kan het ook nog andere oorzaken hebben.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op vrijdag 31 mei 2002 07:44 schreef paulhekje het volgende:
aangezien men nu bezig is RAID-5 ervaringen te posten zal ik er ook 1 bij doen:

Op een maandag morgen kom ik op het werk, doet het netwerk het niet: bleek een 3com switch nergens meer op te reageren (nooit eerder gezien). Kijk ik in de mail: berichtje van Veritas Volume manager op een Sun server: schijf eruit geklapt in RAID-5 config. Er zit hardware support op dus Sun bellen. Monteur komt met nieuwe schijf, heeft ie de verkeerde maat bij, net te klein.
Dan maar een keer schijf eruit, zelfde "kapotte"schijf er weer in: en ja hoor, hij doet het weer.
Dit is nu ongeveer 3 maanden geleden.

Wel erg toevallig dat een switch en een schijf tegelijk problemen hadden. Dan denk je al snel aan de stroomvoorziening. Maar de SUN zit op een UPS en de gehele ruimte zit overspanningsbeveiliging op. Niks gevonden in de log van de UPS.

Conclusie: als een schijf/RAID controller niet meer werkt, kan het ook nog andere oorzaken hebben.
Lekker onderhoudscontract, ze behoren toch te weten wat er in die doos zit ?

Donec eris felix, multos numerabis amicos


  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
Op vrijdag 31 mei 2002 07:57 schreef seq_uence het volgende:
Lekker onderhoudscontract, ze behoren toch te weten wat er in die doos zit ?
Sun levert server aan onze leverancier; leverancier doet er extra schijven in en laat onderhoudscontract registreren.
Telefonisch vraagt men dan bij een storing: welke schijf zit er in?
Dus ik exacte typenummer van die 18Gb schijf doorgeven. Heeft de monteur net een schijf met 1 nummertje verschil bij. wel 18Gb, maar net 100kb te weinig. Kan gebeuren, was ook geen hoogste prioriteit want de server draaide nog: RAID-5 >:)

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|


  • seq_uence
  • Registratie: Mei 2000
  • Laatst online: 01-08-2024
Op vrijdag 31 mei 2002 08:04 schreef paulhekje het volgende:

[..]

Sun levert server aan onze leverancier; leverancier doet er extra schijven in en laat onderhoudscontract registreren.
Telefonisch vraagt men dan bij een storing: welke schijf zit er in?
Dus ik exacte typenummer van die 18Gb schijf doorgeven. Heeft de monteur net een schijf met 1 nummertje verschil bij. wel 18Gb, maar net 100kb te weinig. Kan gebeuren, was ook geen hoogste prioriteit want de server draaide nog: RAID-5 >:)
Ja de server draait nog maar hoe zit het met de performance ?

Trouwens hier was het ook vreemd, de oude hdd is niet defect maar wordt niet opgenomen in de RAID, nieuwe hdd erin en hij gaat lekker rebuilden.......

Donec eris felix, multos numerabis amicos


  • paulhekje
  • Registratie: Maart 2001
  • Laatst online: 30-04 18:30
Op vrijdag 31 mei 2002 12:38 schreef seq_uence het volgende:
Ja de server draait nog maar hoe zit het met de performance ?

Trouwens hier was het ook vreemd, de oude hdd is niet defect maar wordt niet opgenomen in de RAID, nieuwe hdd erin en hij gaat lekker rebuilden.......
- performance was nog prima; draait een oracle db die nog lang niet aan z'n max zit in verhouding tot de hardware.

- oude hd blanco maken zal waarschijnlijk ook werken.

|=|=|=||=|=|=||=|=|=| http://www.vanwijck.com |=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=||=|=|=|

Pagina: 1