HDD valt continu uit RAID0-array

Pagina: 1
Acties:

Onderwerpen

Vraag


Acties:
  • 0 Henk 'm!

  • Processorkoeler
  • Registratie: Oktober 2013
  • Laatst online: 10-09 11:22

Processorkoeler

Geen stock koeler

Topicstarter
Hi Tweakers,

Mijn RAID0-config viel gisteren weg. Ik maak tussentijds back-ups, maar deze failure zit daar precies tussenin. Het overgrote deel is te herdownloaden, maar er zit ook afstudeerwerk tussen en dat wil ik z.s.m. recoveren.

Ik heb eerder gehad dat de RAID config weg was toen de CMOS leeg was. Toen was het een kwestie van de adapter re-enabelen en de RAID opnieuw koppelen. Echter is het nu anders en lijkt een van de HDD's het probleem.

Het probleem

Gisteren zag ik dat System Volume Info 450GB was (op 2TB totaal). Dat heb ik gefixt door de index-optie te disabelen. Vlak hierna vial de partitie (en de array dus) weg. Na reboots/checks zag ik in de Marvell RAID-BIOS dat disk 1 (1CH162) niet meer "assigned" maar "free" was. De RAID0-config blijft offline en het initialiseren duurt enorm lang bij boot.
Set-up
Windows 10 22H2 x64 build 19045.2965
Gigabyte Z77X-D3H (rev 1.1)
CoolerMaster HAF-XM met X-dock voor 2x 3,5" SATA - hier zitten disk 0 en 1 op
[overige specs n.v.t. voor dit probleem]

Marvell 88SE91xx RAIDcontroller (ingebouwd op mobo)
RAID0 - 64KB striping - WriteBack
disk 0 -ST1000DM003-9YN162
disk 1 ST1000DM003-1CH162
Geprobeerd
  • Via UltimatebootCD SMART-data uitgelezen
  • Via UltimatebootCD sector checks gedaan - 9YN helemaal prima, 1CH failde al bij 10%
  • Nog niet van RAID naar AHCI gezet omdat anders de RAID-data weg is
  • Bij rebuilden van de disks 1:1 dezelfde settings gehouden
  • HDD's fysiek reseated[, geen verschil/li]
  • HDD's onderling fysiek geswapt, probleem ligt niet aan de kabels of connectors
  • Disks re-assignen - mislukte op en af. Uiteindelijk re-assigned maar 1CH valt na boot van assigned naar free.
SMART - ST1000DM003-1CH162
  • Reallocated sector count - 1743
  • Current pending sector count - 2433
  • Offline uncorrectable - 2433
  • Reported uncorrectable - 94
  • PoH count: 16429 hours
Geen andere gekke dingen. PoH is niet al te laag. Wel veel data geschreven in z'n tijd.
SMART - ST1000DM003-9YN162
  • Reallocated sector count - 0
  • Current pending sector count - 0
  • Offline uncorrectable - 0
  • Reported uncorrectable - 0
  • PoH count: 22415 hours
Geen bijzonderheden dus, op de 'hoge' PoH-count na. Ook veel data geschreven.
Vraag
Ik heb al veel gezocht, de manual doorgespit maar krijg 't niet gefixt. Het reallocaten van bad sectors gaat bij de ST1000DM003-reeks gewoon op hardwareniveau dus ik wil niet softwarematig sectoren gaan reallocaten, want dat gaat sowieso fout. Ik heb helaas geen identieke controller om te crosstesten, maar vermoed de 1CH-disk.

De HDD's hebben flink wat PoH's en LBA's written. De 1CH-disk heeft al wat reallocated sectors en is niet de nieuwste meer, maar werkte altijd prima tot gister. Ik wil de verloren data nog herstellen als dat kan.

Edit: in Eventvwr geen Marvell-events (driver en software installed). 9YN is in de BIOS assigned, de 1CH-disk 'free' en dus zichtbaar in Windows. Beide disks wel zichtbaar in devmgr > marvell > busrelaties. Het lijkt dus echt op hardware/firmwareniveau ergens stuk te gaan waardoor 1CH continu uit de array valt.

Heeft iemand nog suggesties of oplossingen? Onderstaand wat foto's van m'n troubleshooting.

Afbeeldingslocatie: https://tweakers.net/i/AgMHiXLILLg4hrHoQVc4Z_cNxPw=/800x/filters:strip_icc():strip_exif()/f/image/IxhZUY3tt563I5Meq48PKMnG.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/bVLmVUNeu1TmLUUZVXSFUxdJaBw=/800x/filters:strip_icc():strip_exif()/f/image/LswHI92rF8ju5SyQHCyyJLaN.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/6rqCd6QZi8m97PpGUBkU1tl7eXU=/800x/filters:strip_icc():strip_exif()/f/image/q9G8xf7MSXeq6F16YFWODMG9.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/waJQyM8_oqaALDoEDVjB7_MK0aA=/800x/filters:strip_icc():strip_exif()/f/image/fYTkMyr8TZ5QJ9wmMSr05itJ.jpg?f=fotoalbum_large

[ Voor 19% gewijzigd door Processorkoeler op 27-05-2023 15:12 ]

Alle reacties


Acties:
  • +2 Henk 'm!

  • nhanssen
  • Registratie: Oktober 2002
  • Laatst online: 00:51

nhanssen

QVL is non-tweakers

De tool Raid-reconstructor proberen en dan de image die gemaakt word uitlezen met Nemo pro

Maar belangrijke data op een falende disk i.c.m. raid 0 is vragen om problemen.

Spec's PC


Acties:
  • +1 Henk 'm!

  • Ben(V)
  • Registratie: December 2013
  • Laatst online: 16:33
Raid 0 gebruiken is echt heel erg af te raden.
Als je meer snelheid wil koop een ssd, maar striping met disken is een absolute nogo.

All truth passes through three stages: First it is ridiculed, second it is violently opposed and third it is accepted as being self-evident.


Acties:
  • 0 Henk 'm!

  • Processorkoeler
  • Registratie: Oktober 2013
  • Laatst online: 10-09 11:22

Processorkoeler

Geen stock koeler

Topicstarter
nhanssen schreef op zaterdag 27 mei 2023 @ 15:16:
De tool Raid-reconstructor proberen en dan de image die gemaakt word uitlezen met Nemo pro

Maar belangrijke data op een falende disk i.c.m. raid 0 is vragen om problemen.
RAID0 is voor integrity inderdaad niet de slimste keuze, maar ik deze array biedt zowel 'performance' als de capaciteit (2TB) over een reeks VM's. Daarom maak ik tussentijd back-ups maar gezien de grootte is dat elke dag niet te doen.

Ik ga even naar die reconstructor kijken, thanks!
Is er een manier om enige logging van die controller of de situatie te bekijken?
edit: zie dat 'ie wel betaald is helaas. Heb een tool van Stellar gevonden die ik even ga testen.
Ben(V) schreef op zaterdag 27 mei 2023 @ 15:30:
Raid 0 gebruiken is echt heel erg af te raden.
Als je meer snelheid wil koop een ssd, maar striping met disken is een absolute nogo.
Dat vind ik ook, maar dit is nu de situatie :)

__

Update: Er komt aankomende week een vervangende ST1000DM003-1CH162 aan met zo bijna ongeveer dezelfde firmware. Ik ga van de huidige een fysieke kopie maken en hoop die over te zetten op de nieuwe. Ik kreeg zelfs een diskcheck niet meer voor elkaar op de huidige HDD, dus ik denk echt dat hij op z'n einde is, of in ieder geval niet lekker werkt met de RAIDcontroller.

Weet iemand wat de kans van slagen is met dit proces, gezien de bad sectors? Als 'ie alles 1:1 overneemt met een physical, kan de controller wellicht erna daadwerkelijk de errors fixen omdat de nieuwe disk wel gewoon gezond is. Maar dat is mijn theorie.

[ Voor 25% gewijzigd door Processorkoeler op 27-05-2023 19:16 ]


Acties:
  • +1 Henk 'm!

  • nelizmastr
  • Registratie: Maart 2010
  • Laatst online: 21:08

nelizmastr

Goed wies kapot

Met zoveel reallocated sectors is die ene disk gewoon dood. Vervangen is eigenlijk de enige oplossing en je verlies nemen, anders opsturen naar recovery bedrijf en een paar K neerleggen.

I reject your reality and substitute my own


Acties:
  • +2 Henk 'm!

  • nhanssen
  • Registratie: Oktober 2002
  • Laatst online: 00:51

nhanssen

QVL is non-tweakers

nelizmastr schreef op zaterdag 27 mei 2023 @ 21:06:
Met zoveel reallocated sectors is die ene disk gewoon dood. Vervangen is eigenlijk de enige oplossing en je verlies nemen, anders opsturen naar recovery bedrijf en een paar K neerleggen.
Valt wel mee met de prijzen tegenwoordig, het is niet meer 1995. :+

Spec's PC


Acties:
  • 0 Henk 'm!

  • _JGC_
  • Registratie: Juli 2000
  • Laatst online: 00:46
Op linux zou dmraid die disks weer aanelkaar moeten kunnen krijgen, maar zodra je tegen de eerste beste diskfout aanloopt gaat het gewoon weer offline.

Die disk is praktisch dood, heeft 2433 sectoren die slecht zijn maar nog niet reallocated. De enige manier om daarvoor te zorgen is ze overschrijven, maar jij wilt de bestaande data van die disk uitlezen.

Acties:
  • 0 Henk 'm!

  • nelizmastr
  • Registratie: Maart 2010
  • Laatst online: 21:08

nelizmastr

Goed wies kapot

nhanssen schreef op zaterdag 27 mei 2023 @ 21:24:
[...]


Valt wel mee met de prijzen tegenwoordig, het is niet meer 1995. :+
€749 ex BTW is toch nog €900. Best een smak geld voor iets wat op een stel low budget Seagates van 4 tientjes staat :+

I reject your reality and substitute my own


Acties:
  • 0 Henk 'm!

  • sig69
  • Registratie: Mei 2002
  • Laatst online: 22:50
Die schijf is klaar denk ik, ik heb weinig hoop voor je. Leermoment. Afstudeerwerk op een raid0 array :X

Roomba E5 te koop


Acties:
  • +2 Henk 'm!

  • nhanssen
  • Registratie: Oktober 2002
  • Laatst online: 00:51

nhanssen

QVL is non-tweakers

nelizmastr schreef op zaterdag 27 mei 2023 @ 22:03:
[...]


€749 ex BTW is toch nog €900. Best een smak geld voor iets wat op een stel low budget Seagates van 4 tientjes staat :+
Dat is aan de gebruiker, het boeit me totaal 0 of deze data het red. Het is mijn inziens het totale gebrek aan logica om belangrijke data te willen redden van een schijf die kapot is én in een raid 0 configuratie. 2x een downsyndroom om het rooskleurig te houden imho. Sorry. :O

Spec's PC


Acties:
  • 0 Henk 'm!

  • Processorkoeler
  • Registratie: Oktober 2013
  • Laatst online: 10-09 11:22

Processorkoeler

Geen stock koeler

Topicstarter
Ik vind het super nice dat iedereen meedenkt maar ik zei in de openingspost al dat dit niet de beste optie was en dat het nu eenmaal zo is. RAID5 was beter ja, maar ik had geen andere optie met de beschikbare middelen en maakte handmatig tussentijdse back-ups. Dus de "dit is dom-opmerkingen" zijn niet echt nodig 8)7

Deze week ga ik een physical kopie maken van de HDD en die terugplaatsen op een identieke variant met bjina dezelfde firmware. Kijken of dat werkt en anders is het jammer denk ik, risico was aanwezig en pakte toevallig slecht uit qua timing. Wat ik wel gek blijf vinden is dat drie verschillende SMART tools allemaal roepen dat er niks aan de hand is met die disk.... mooi moment om weer te beseffen dat dat helemaal niks toevoegt (en ook geen garantstelling is).

Acties:
  • 0 Henk 'm!

  • _JGC_
  • Registratie: Juli 2000
  • Laatst online: 00:46
Processorkoeler schreef op dinsdag 30 mei 2023 @ 13:29:
Ik vind het super nice dat iedereen meedenkt maar ik zei in de openingspost al dat dit niet de beste optie was en dat het nu eenmaal zo is. RAID5 was beter ja, maar ik had geen andere optie met de beschikbare middelen en maakte handmatig tussentijdse back-ups. Dus de "dit is dom-opmerkingen" zijn niet echt nodig 8)7

Deze week ga ik een physical kopie maken van de HDD en die terugplaatsen op een identieke variant met bjina dezelfde firmware. Kijken of dat werkt en anders is het jammer denk ik, risico was aanwezig en pakte toevallig slecht uit qua timing. Wat ik wel gek blijf vinden is dat drie verschillende SMART tools allemaal roepen dat er niks aan de hand is met die disk.... mooi moment om weer te beseffen dat dat helemaal niks toevoegt (en ook geen garantstelling is).
Je data dupliceren naar een identieke schijf is niet nodig, zolang de disk groot genoeg is accepteert de controller dat ook gewoon. De metadata van je array staat nml op de schijven (en die geeft nu aan dat je array corrupt is omdat er een disk failed is).

Je zou onder linux met dd_rescue een kopie kunnen trekken naar een andere schijf en dan met dmraid daarna je array weer kunnen samenstellen. Dan moet je alleen wel hopen dat de disk door het vele resetten tijdens het kopieren niet ineens verdwijnt want dan stopt het hele proces.

Acties:
  • 0 Henk 'm!

  • Processorkoeler
  • Registratie: Oktober 2013
  • Laatst online: 10-09 11:22

Processorkoeler

Geen stock koeler

Topicstarter
_JGC_ schreef op dinsdag 30 mei 2023 @ 13:36:
[...]

Je data dupliceren naar een identieke schijf is niet nodig, zolang de disk groot genoeg is accepteert de controller dat ook gewoon. De metadata van je array staat nml op de schijven (en die geeft nu aan dat je array corrupt is omdat er een disk failed is).

Je zou onder linux met dd_rescue een kopie kunnen trekken naar een andere schijf en dan met dmraid daarna je array weer kunnen samenstellen. Dan moet je alleen wel hopen dat de disk door het vele resetten tijdens het kopieren niet ineens verdwijnt want dan stopt het hele proces.
Oh top, dat eerste wist ik niet.
Ik heb de "kapotte" disk fysiek gekopieerd met 'n Tableau Imager, 1:1 overgezet op de vervangende ST1000DM003-1CH62. Die nu in de array gehangen, array opnieuw gebuild.


Windows herkent de partitie niet direct (de vorige keer pakte 'ie 'm direct). Met FTK Imager even live gekeken en de data is er nog. Voor de zekerheid een physical copy van de hardware array (die Windows ziet als 1 Marvell-disk). En vanuit daar de belangrijke data exporteren. Had niet verwacht dat dit zou werken.

Thanks voor alle hulp :)
Pagina: 1