Hoe een gefaalde disk te vervangen in RAID 1 config

Pagina: 1
Acties:

Onderwerpen

Vraag


Acties:
  • 0 Henk 'm!

Anoniem: 913185

Topicstarter
Ik heb een Dell Poweredge T620 server met 5 SAS disks waarbij een van de disks sinds kort een ‘PDR1101 Fault detected on drive 1’ melding geeft. Bij het booten van de server krijgen we nu de melding dat er een virtual drive mist:
There are offline or missing virtual drives with preserved cache....Press any key to enter the configuration utility.

In de PERC H710 config utility zie ik bij de Virtual Drive Mgmt dat Disk Group 0 een RAID 5 config heeft, hierin zitten 3 fysieke drives die alledrie 'online' zijn. Bij de Physical Drive Mgmt zie ik 5 de 5 disks waarvan er dus 3 online zijn en 2 andere een 'Foreign' state hebben. In de Foreign View tenslotte zie ik een Disk Group 0, Raid 5 met 3 online disks en verder een Disk Group 1, Raid 1 (Foreign) met hierin twee fysieke disks waarbij er eentje een online status heeft en de andere een rebuild status; beide zijn Foreign.

Ik heb inmiddels nieuwe disks besteld, deze komen morgen binnen. Mijn vraag is nu ok ik de gefaalde disk 1 zonder meer kan vervangen (het zijn hot plug disks) en wat ik met de foreign configuration moet doen; import of clear en dit voor of na het vervangen van de disk?

Bij voorbaat dank voor jullie advies hierover!

Alle reacties


Acties:
  • 0 Henk 'm!

  • MdO82
  • Registratie: Maart 2007
  • Laatst online: 22:21
Als ik het goed heb kan je de slechte disken eruit halen en vervangen door de 2 nieuwe disken zodat je je Raid weer hersteld wordt.
Echter omdat het om 2 disken gaat durf ik dit niet met zekerheid te zeggen en ben benieuwd hoe andere dit bekijken :)

2250 WP Zuid PVoutput


Acties:
  • 0 Henk 'm!

  • Jaded
  • Registratie: Augustus 2001
  • Laatst online: 06-06 15:57
Een foreign state op zoveel disks klinkt als een controller falen. Dit betekent namelijk dat er een config op staat die de controller niet herkent, wat erg vreemd is, tenzij je zelf al aan het verwisselen geweest bent.

Ik zou geen enkele disk vervangen zolang er geen disks volledig Online zijn, en dus ook niet meer foreign. Sowieso is het verstandig om de Rebuild even af te laten maken.

Boot de server verder nog wel? Als ik dit zo lees waarschijnlijk niet?

Acties:
  • 0 Henk 'm!

Anoniem: 913185

Topicstarter
Jaded: nee, disks zijn nog niet verwisseld.
De rebuild lijkt niet echt gaande te zijn; heeft het hele weekend zo gestaan....
Nee, de server boot niet verder.

Acties:
  • 0 Henk 'm!

  • dujour
  • Registratie: Maart 2002
  • Laatst online: 27-05 19:10
Dus als ik het goed begrijp heb je 2 raid groepen 1 raid 5 met 3 disken en 1 raid 1 met 2 disken?

Acties:
  • 0 Henk 'm!

Anoniem: 913185

Topicstarter
dujour: Yep

Acties:
  • 0 Henk 'm!

  • Bigs
  • Registratie: Mei 2000
  • Niet online
Jaded schreef op maandag 24 april 2017 @ 13:39:
Een foreign state op zoveel disks klinkt als een controller falen. Dit betekent namelijk dat er een config op staat die de controller niet herkent, wat erg vreemd is, tenzij je zelf al aan het verwisselen geweest bent.

[..]
Dit klopt inderdaad niet. Aangezien je nog niets gewisseld hebt kun zou je de foreign RAID1 set gewoon weer moeten kunnen importeren (waardoor je zou moeten kunnen booten van/met de degraded array) en daarna de defecte schijf vervangen. Maar als er echt niemand aan die schijven is geweest sinds het falen dan is hier waarschijnlijk meer aan de hand en gaat dat waarschijnlijk niet zomaar lukken.

[ Voor 4% gewijzigd door Bigs op 24-04-2017 14:59 ]


Acties:
  • 0 Henk 'm!

  • Jaded
  • Registratie: Augustus 2001
  • Laatst online: 06-06 15:57
Als de server niet verder boot ben ik bang dat je aan het restoren van backups moet gaan denken.
Aangezien het array toch al offline/kapot is zou ik alle foreign configs importeren en kijken wat er de controller er nog van kan maken. Er is een kans dat er dan weer wat online komt.

Check even of je PERC firmware de laatste versie is. Ik zie dit soort problemen vaker, vooral de PERC H700 gaf vaak problemen door een oude firmware. Even updaten in dat geval.

Acties:
  • 0 Henk 'm!

  • Wim-Bart
  • Registratie: Mei 2004
  • Laatst online: 10-01-2021

Wim-Bart

Zie signature voor een baan.

<kan weg>

[ Voor 94% gewijzigd door Wim-Bart op 24-04-2017 15:46 ]

Beheerders, Consultants, Servicedesk medewerkers. We zoeken het allemaal. Stuur mij een PM voor meer info of kijk hier De mooiste ICT'er van Nederland.


Acties:
  • 0 Henk 'm!

  • JackBol
  • Registratie: Maart 2000
  • Niet online

JackBol

Security is not an option!

Dus als ik het even samenvat:

5 fysieke disks op 1 controller
- DG0 (RAID5) met 3 disks: 3x online
- DG1 (RAID1) met 2 disks: 2x foreign

Ik denk dat je basisuitgangspunt op dit moment moet zijn dat je de data op DG1 kwijt bent. Dan kan het vanaf hier alleen nog maar mee vallen.

"Foreign" betekent dat de raid configuratie op de disks niet overeen komt met de raid configuratie in de controller. Dit is geen prettige situatie om te zijn en kan op 2 manieren opgelost worden.
1) je pusht de configuratie van de controller naar de disks (feitelijk een her-initialisatie) --> je data is 99% byebye
2) je importeert de configuratie van de risks naar de controller --> god zegene de greep

Optie twee geeft je de meeste kans. Als je de configuratie importeert, en beide disks komen weer online en je kan weer booten, dan heeft je controller waarschijnlijk een probleem en zou ik die RMAen.

Als je de configuratie niet meer werkend kan importeren voor een van de disks (i.e. beide disks komen niet meer online) dan is het einde oefening en kan je de tapes erbij gaan pakken.

De actuele opbrengst van mijn Tibber Homevolt


Acties:
  • 0 Henk 'm!

  • Bigs
  • Registratie: Mei 2000
  • Niet online
Er is niet sprake van twee losse disks met 'foreign' configuratie. Er wordt wel herkend dat die twee samen een RAID 1 set vormen, aldus de TS:
In de Foreign View tenslotte zie ik een [..] Disk Group 1, Raid 1 (Foreign) met hierin twee fysieke disks waarbij er eentje een online status heeft en de andere een rebuild status
Daarom valt het nog wel mee, ik ben erg benieuwd wat de Import knop teweeg heeft gebracht @Anoniem: 913185

Acties:
  • 0 Henk 'm!

Anoniem: 913185

Topicstarter
Ik heb de import geprobeerd, maar krijg de volgende fout:
ERROR! Foreign Config Import
2 out of 2 failed to Import!
Controller has data in cache for offline...

Dan toch maar de disk vervangen?

Acties:
  • 0 Henk 'm!

  • Jaded
  • Registratie: Augustus 2001
  • Laatst online: 06-06 15:57
Dan kun je inderdaad helaas opnieuw beginnen. Met de disks zelf is misschien (waarschijnlijk?) niets mis, alleen de controller heeft het RAID-configuratie gesloopt. De RAID1 config kun je dus clearen en een nieuw array opzetten.

(Nieuwe disks gebruiken is natuurlijk altijd beter)

Acties:
  • 0 Henk 'm!

  • KoeKk
  • Registratie: September 2000
  • Laatst online: 01-06 21:28
Heb je nog garantie / uitgebreide garantie op de server? Zo ja dan zou ik ook vooral ook even met de Dell support bellen, zo te lezen dikke kans dat je data weg is, maar zij kunnen je ook adviseren en/of direct de controller vervangen.

Acties:
  • 0 Henk 'm!

  • Consequator
  • Registratie: Juli 2000
  • Laatst online: 12-03 11:28
Ik ben eigenlijk wel benieuwd wat hier uitgekomen is als oorzaak van dit probleem. (en of je het hebt kunnen oplossen zonder data verlies)

Hardware fout(defecte disk) die naar de mirror disk is geschreven voordat hij als failed is gemarkeerd door het systeem ?

Acties:
  • 0 Henk 'm!

  • SpamLame
  • Registratie: Augustus 2000
  • Laatst online: 18:50

SpamLame

niks

Consequator schreef op maandag 1 mei 2017 @ 08:53:


Hardware fout(defecte disk) die naar de mirror disk is geschreven voordat hij als failed is gemarkeerd door het systeem ?
Onwaarschijnlijk, de write word door de controller afgegeven.
De enige manier waardoor een read van ene disk op de andere geschreven wordt is tijdens een rebuild.
Anoniem: 913185 schreef op maandag 24 april 2017 @ 21:10:
Ik heb de import geprobeerd, maar krijg de volgende fout:
ERROR! Foreign Config Import
2 out of 2 failed to Import!
Controller has data in cache for offline...

Dan toch maar de disk vervangen?
Naar ik begrijp is de disk nog steeds niet vervangen maar vind de controller dat ie stuk is...?
Wat je dan nog kan proberen is de defecte disk eruit te trekken en dan kijken wat je met de R1 set kan aanvangen. Als de host dan boot druk je je vervangende disk op dezelfde positie in en zou een rebuild moeten starten.

[ Voor 24% gewijzigd door SpamLame op 01-05-2017 09:01 ]

Pagina: 1