[W2k3] RAID critical -> Windows reboot constant

Pagina: 1
Acties:

  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
Ik ben er zojuist achter gekomen dat in mijn RAID5-configuratie (HighPoint RocketRAID 2220) een van de schijven 'degraded' is en mijn RAID-config nu dus 'critical' is.
Op zich zou dat nog niet meteen een ramp moeten zijn, maar Windows vindt blijkbaar van wel: bij het opstarten zie ik even het Windows-logo met het lopende balkje, maar daarna gaat ie spontaan rebooten. Dit blijft ie tot in den treure herhalen en ik kan Windows dus niet meer opstarten.

Ook in Veilige Modus wil Windows niet opstarten.

Ik heb nu de RAID-controller eruit gehaald en nu start Windows wel goed op. Heeft iemand enig idee waar dit aan kan liggen? Windows zou met een 'critical' RAIDconfig toch nog steeds gewoon op moeten starten?

Windows staat op mijn andere harddisk, maar alle data (user-profiles, SQL-databases, etc.) staan op mijn RAID-configuratie.
Ik zelf zat al te denken aan een driver-probleem, maar dat kan ik niet controleren aangezien Windows alleen wil opstarten zonder de RAID-controller.

  • elevator
  • Registratie: December 2001
  • Niet online

elevator

Officieel moto fan :)

Als je op F8 drukt tijdens het booten kan je uitzetten dat Windows direct reboot bij een BSOD, je kan dan eventueel kijken of je iets meer kan halen uit de BSOD die je krijgt? :)

  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
elevator schreef op zondag 11 mei 2008 @ 15:48:
Als je op F8 drukt tijdens het booten kan je uitzetten dat Windows direct reboot bij een BSOD, je kan dan eventueel kijken of je iets meer kan halen uit de BSOD die je krijgt? :)
Done: PAGE_FAULT_IN_NONPAGED_AREA
Zegt me weinig, maar ik zal eens rond gaan zoeken.

Ik heb overigens de RAID-controller nog in 2 andere PCI-sloten geprobeerd, maar kreeg constant dezelfde melding.
Ook m'n BIOS-instelling allemaal terug gezet naar default, maar ook dat mocht niet baten.

Uit de 'Windows XP en 2000 BSOD Guide':
Meestal duidt bovenstaande STOP foutmelding op slecht geheugen of een fout in de harde schijf.
Tja... dat wist ik dus al, maar daar moet ie gewoon niet moeilijk over doen.
Zal overigens ook het geheugen eens testen.

[ Voor 19% gewijzigd door maikel op 11-05-2008 16:41 ]


  • elevator
  • Registratie: December 2001
  • Niet online

elevator

Officieel moto fan :)

Nou, "gewoon niet moeilijk over doen" kan natuurlijk niet, Windows probeert geheugen te lezen en daar gaat iets mis, dan moet hij wel moeilijk doen.

Wat wel raar is, is dat er een 'zichtbaar' probleem met die harde schijf is, Windows ziet namelijk bij RAID sets normaal gesproken niet de drie individuele diskjes, maar ziet 1 RAID5 volume. Windows "weet" dus officieel niet dat de disk kapot is (enkel de raid controller weet dat).

  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
elevator schreef op zondag 11 mei 2008 @ 16:52:
Nou, "gewoon niet moeilijk over doen" kan natuurlijk niet, Windows probeert geheugen te lezen en daar gaat iets mis, dan moet hij wel moeilijk doen.

Wat wel raar is, is dat er een 'zichtbaar' probleem met die harde schijf is, Windows ziet namelijk bij RAID sets normaal gesproken niet de drie individuele diskjes, maar ziet 1 RAID5 volume. Windows "weet" dus officieel niet dat de disk kapot is (enkel de raid controller weet dat).
Dat bedoelde ik dus met 'niet moeilijk doen': volgens de RAID-controller is de configuratie 'critical' (omdat er dus 1 schijf niet werkt), maar zou deze nog wel bruikbaar moeten zijn. Daarom zou Windows er volgens mij geen foutmelding op moeten geven en gewoon een werkende schijf zien.
Zo heeft RAID5 niet echt veel nut, als ik bij een kapotte schijf Windows al niet meer kan gebruiken. |:(

[ Voor 5% gewijzigd door maikel op 11-05-2008 17:09 ]


  • Zwelgje
  • Registratie: November 2000
  • Laatst online: 20-01 19:37
meest waarschijnlijk heeft die defecte disk gewoon corrupte data lopen genereren, en die is dus op de andere disken terecht gekomen...vandaar dus deze situatie.

raid5 beschermt je niet tegen een schijf die corrupte data loopt te generen, (zeg maar net niet helemaal defecte disk) daartegen beschermd een backup je wel ;)

A wise man's life is based around fuck you


  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
Powershell schreef op zondag 11 mei 2008 @ 17:03:
meest waarschijnlijk heeft die defecte disk gewoon corrupte data lopen genereren, en die is dus op de andere disken terecht gekomen...vandaar dus deze situatie.

raid5 beschermt je niet tegen een schijf die corrupte data loopt te generen, (zeg maar net niet helemaal defecte disk) daartegen beschermd een backup je wel ;)
Betekent dat ook dat als ik die kapotte harddisk vervang, de RAID-controller mijn RAID-config weer gaat rebuilden en netjes alle corrupte data ook weer op die nieuwe schijf zet? En Windows dus vervolgens nog niet wil opstarten?

  • alt-92
  • Registratie: Maart 2000
  • Niet online

alt-92

ye olde farte

Daar wordt je data niet opeens on-corrupt van nee :)

ik heb een 864 GB floppydrive! - certified prutser - the social skills of a thermonuclear device


  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
alt-92 schreef op zondag 11 mei 2008 @ 17:16:
Daar wordt je data niet opeens on-corrupt van nee :)
Dat begreep ik al ja. Hoe kan ik dat nu het best aanpakken? Nieuwe schijf erin en de array laten rebuilden heeft dan ook geen nut (behalve dat mijn array niet meer 'critical' is uiteraard).
Eerst nieuwe schijf erin, laten rebuilden en dan de data proberen te redden? Welke tool is daar geschikt voor? Heeft de harddisk-tool van Samsung zelf nut? Die kan volgens mij de afzonderlijke schijven niet zien, omdat die aan een RAID-controller hangen.
Of is mijn data gewoon voorgoed verloren?

  • alt-92
  • Registratie: Maart 2000
  • Niet online

alt-92

ye olde farte

maikel schreef op maandag 12 mei 2008 @ 00:35:
[...]

Dat begreep ik al ja. Hoe kan ik dat nu het best aanpakken? Nieuwe schijf erin en de array laten rebuilden heeft dan ook geen nut (behalve dat mijn array niet meer 'critical' is uiteraard).
Of wel, want nu weet je ook niet wat er mis is en gelukkig heb je je backups nog liggen.
toch?

Het kan zelfs zoiets simpels zijn als een boot entry die nu verkeerd staat, en ik héb zelfs controllers meegemaakt waarvan de driver weigert te laden bij een reboot zolang de array niet 100% is.

ik heb een 864 GB floppydrive! - certified prutser - the social skills of a thermonuclear device


Verwijderd

ik vind het knap dat je een raid-5 wel kan opstarten zonder "raid controller". Volgens mij heb je dan zowieso nooit een raid 5 os-disk.

Je page file is geredirect naar je raid-5 disk? Verplaats die eens naar de losse disk...

  • lier
  • Registratie: Januari 2004
  • Laatst online: 19:33

lier

MikroTik nerd

Verwijderd schreef op dinsdag 13 mei 2008 @ 17:35:
ik vind het knap dat je een raid-5 wel kan opstarten zonder "raid controller". Volgens mij heb je dan zowieso nooit een raid 5 os-disk.
Windows staat op mijn andere harddisk, maar alle data (user-profiles, SQL-databases, etc.) staan op mijn RAID-configuratie.

Eerst het probleem, dan de oplossing


  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
alt-92 schreef op maandag 12 mei 2008 @ 18:57:
[...]

Of wel, want nu weet je ook niet wat er mis is en gelukkig heb je je backups nog liggen.
toch?

Het kan zelfs zoiets simpels zijn als een boot entry die nu verkeerd staat, en ik héb zelfs controllers meegemaakt waarvan de driver weigert te laden bij een reboot zolang de array niet 100% is.
Backups.... backups.... dat woord zoek ik even op. ;)
Het is maar een thuisserver en kan niet zomaar even 1TB gaan backuppen. Mijn foto's heb ik sowieso nog wel op mijn gewone PC staan, maar al mijn muziek en software stond op die server. Uiteraard is dat ook weer terug te krijgen, maar het zou toch wel heel erg vervelend zijn.

Vandaag wilde Windows wel weer opstarten en begon de HighPoint-software automatisch de RAID-array te rebuilden. Daar is ie nu net mee klaar en volgens die software zijn alle schijven goed (heb al wel een nieuwe besteld) en is de array ook weer 'normal'.

Echter, ik heb in Windows zelf nog maar 1 schijf. Volgens de diskmanager is die andere wel aanwezig, maar 'Unallocated' en 'Not initialized' . Ook na een reboot is dit nog zo.
Ik durf nu niet zomaar een partitie aan te maken, omdat ik bang ben dat ik dan zeker alle data kwijt ben.

PS. Ik zie nu net ook dat 'New partition' grijs is. Wel kan ik 'Initialize disk' doen....
Morgen maar eens verder zoeken wat ik het best kan doen.

[ Voor 6% gewijzigd door maikel op 14-05-2008 00:18 ]


  • DeV0uReR
  • Registratie: Mei 2004
  • Laatst online: 07-06-2025
Hoi Maikel,

dit probleem doet zich voor als Windows de "disk signature" of end of sector marker niet kan lezen van de disk. Als je op initialize drukt heb je grote kans dat het niet meer wat wordt. Ik zou je adviseren om eens met data recovery software te gaan stoeien. R-Studio heb ik zelf erg goede ervaringen mee. Je kunt met recovery software meestal de data nog wel herstellen naar een andere disk. Je zal dus ff een flinke USB disk eraan moeten hangen oid. Hierna zou ik de raid rebuilden en partitioneren en vervolgens alle data weer terug pompen.

Als je niks kan lezen met herstelsoftware dan zal een initialize er waarschijnlijk voor zorgen dat hij 1 grote "unknown" partitie ziet. Probeer het na een initialize nog eens met herstelsoftware. Dit laatste heb ik een keer met een bijna defecte IDE disk gehad. Na de initialize kon ik met R-Studio de data er alsnog afhalen.

Succes ermee!

  • maikel
  • Registratie: Januari 2001
  • Laatst online: 09-02 13:28
DeV0uReR schreef op woensdag 14 mei 2008 @ 20:34:
Hoi Maikel,

dit probleem doet zich voor als Windows de "disk signature" of end of sector marker niet kan lezen van de disk. Als je op initialize drukt heb je grote kans dat het niet meer wat wordt. Ik zou je adviseren om eens met data recovery software te gaan stoeien. R-Studio heb ik zelf erg goede ervaringen mee. Je kunt met recovery software meestal de data nog wel herstellen naar een andere disk. Je zal dus ff een flinke USB disk eraan moeten hangen oid. Hierna zou ik de raid rebuilden en partitioneren en vervolgens alle data weer terug pompen.

Als je niks kan lezen met herstelsoftware dan zal een initialize er waarschijnlijk voor zorgen dat hij 1 grote "unknown" partitie ziet. Probeer het na een initialize nog eens met herstelsoftware. Dit laatste heb ik een keer met een bijna defecte IDE disk gehad. Na de initialize kon ik met R-Studio de data er alsnog afhalen.

Succes ermee!
Inmiddels heb ik een nieuwe harddisk binnen (hoewel de oude het nu weer gewoon goed schijnt te doen en er volgens S.M.A.R.T. niets aan de hand is) en heb nog aardig wat data kunnen redden.
Ik probeer nu nog een andere tool en ga daarna toch maar opnieuw de partitie aanmaken en alle data weer terug zetten.

Die nieuwe harddisk kan ik mooi gebruiken om backups te maken (van maximaal de helft van alle data, maar toch).

Wel vraag ik me nog steeds af hoe dit heeft kunnen gebeuren. Als een schijf kapot gaat, zou de RAID-controller dit toch moeten merken en de schijf negeren? Dat lijkt mij het hele idee van RAID5: met 1 kapotte schijf toch nog door kunnen werken.
En als de schijf corrupte data is gaan genereren, waar kan dit door komen?

Overigens ben ik wel van plan nog wat meer koeling in de server te plaatsen, omdat de schijven toch nog vrij warm worden. Wellicht dat dat, en het warme weer, er wat mee te maken hebben gehad?
Pagina: 1