HDD's defect. Sanity check voor een fix.

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
Systeem: HP microserver gen10, 4 x 3TB WD Red in een 5586GB Storage Pool, Windows Server 2022. Systeem is stabiel, Windows staat op een aparte NVME drive. Back-up is aanwezig maar in de cloud en dus traag.

- In mijn eventlog zie ik 750 keer: The device, \Device\Harddisk4\DR4, has a bad block.

- Crystaldiskinfo zegt over 2 van de 4 schijven Caution waarbij Reallocated sector count gehighlight is. De details daarvan wijken niet af van mijn goede disks. (De disks met 63000 uur zijn stuk-ish, de disks met 74000 uur niet :P )

Los van het feit dat ik zal moeten achterhalen welke windows disk nu welke fysieke disk in de machine is (tips welkom): Ik heb dit systeem jaren geleden gebouwd en de disks uit een andere machine overgezet. Destijds heb ik ze in een Windows Storage Pool gegooid en ik ben in de veronderstelling dat dit hetzelfde is als een RAID 10 setup, ook vanwege de totale Pool grootte (12TB aan disks in een 6TB pool).

Vraag: Kan ik de disks vervangen zodat er nieuwe duplicatie plaatsvindt en is het dan verstandig om 1 of 2 disks tegelijkertijd te vervangen? Of moet dit anders aangevlogen worden?

Alle reacties


Acties:
  • 0 Henk 'm!

  • bananasplit
  • Registratie: December 2024
  • Laatst online: 15-01 15:39
Meerdere disken gelijktijdig vervangen is helemaal nooit aan te raden.

Heeft niets met je disk probleem te maken maar Windows Storage pool is geen Raid 10 maar gewoon het equivalent van Raid 5.

Dat je te weinig ruimte hebt komt waarschijnlijk doordat je de column size niet (of niet goed) gezet hebt.
Die moet namelijk gelijk staan aan het aantal disken.
Ik weet alleen niet of je dat "on the fly" kunt veranderen.

Acties:
  • 0 Henk 'm!

  • Noob_Saibot
  • Registratie: Maart 2012
  • Laatst online: 20:34

Noob_Saibot

Azerbaijan 🔥

Heb je al in HP Array Configuration Utility gekeken?

Land van het eeuwige vuur


Acties:
  • 0 Henk 'm!

  • MsG
  • Registratie: November 2007
  • Laatst online: 18:46

MsG

Forumzwerver

Heb je alle smart-waarden ook? Reallocated sectors opzich betekent natuurlijk niet per se dat een hdd defect is. Die dingen hebben niet voor niets dat soort dingen aan boord.

Ik zou kijken of je current pending sectors op 0 staat of dat dat in de toekomst verder blijft oplopen, tezamen met de reallocated sectors.

Denk om uw spatiegebruik. Dit scheelt Tweakers.net kostbare databaseruimte! | Groninger en geïnteresseerd in Domotica? Kom naar DomoticaGrunn


Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
@bananasplit Het betreft hier een mirrored pool dus volgens mij is het verschil in ruimte goed te verklaren, grosso modo de helft van het totaal. De column count is 2 en dat lijkt de goede waarde te zijn in dit specifieke scenario (https://learn.microsoft.c...es_decide_how_many_to_use, 2-way mirror, column to disk ratio 1:2)

Je hebt gelijk dat het onverstandig is om 2 disks tegelijkertijd te vervangen, dat was even een brainfart.

@Noob_Saibot Er is nooit iets via de HP array configuration utility geconfigureerd. Er is dan ook niets zichtbaar in die applicatie.

Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
MsG schreef op woensdag 8 januari 2025 @ 09:46:
Heb je alle smart-waarden ook? Reallocated sectors opzich betekent natuurlijk niet per se dat een hdd defect is. Die dingen hebben niet voor niets dat soort dingen aan boord.

Ik zou kijken of je current pending sectors op 0 staat of dat dat in de toekomst verder blijft oplopen, tezamen met de reallocated sectors.
Ik ben niet helemaal thuis in smart en ik snap de kolom "worst" niet helemaal , dit zijn de waarden:

Afbeeldingslocatie: https://tweakers.net/i/dJJ-Z0ZtEhyWQnM91c6VGvYo5YQ=/232x232/filters:strip_exif()/f/image/taaYqhKnTeGzmdeZAm2dXCoY.png?f=fotoalbum_tileAfbeeldingslocatie: https://tweakers.net/i/zf0cUt7vC2KObjyNjcMujcisbNY=/232x232/filters:strip_exif()/f/image/TNWqZPo8RQ0QH86pW8BEvOxU.png?f=fotoalbum_tile

[ Voor 15% gewijzigd door oef! op 08-01-2025 10:15 ]


Acties:
  • 0 Henk 'm!

  • Noob_Saibot
  • Registratie: Maart 2012
  • Laatst online: 20:34

Noob_Saibot

Azerbaijan 🔥

In mijn ervaring is dit begin van een falende disk, dus 1 disk los trekken en dan nog eens in je tool kijken welke er verdwijnt, deze goed noteren en door naar andere tot je overzicht hebt van je fysiek > Raid opstelling.

Zodoende de disk(s) vervangen wat reeds warming geven....

Land van het eeuwige vuur


Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
Noob_Saibot schreef op woensdag 8 januari 2025 @ 10:28:
In mijn ervaring is dit begin van een falende disk, dus 1 disk los trekken en dan nog eens in je tool kijken welke er verdwijnt, deze goed noteren en door naar andere tot je overzicht hebt van je fysiek > Raid opstelling.

Zodoende de disk(s) vervangen wat reeds warming geven....
Ik heb op basis van de serienummers in CDI al acherhaald welke fysieke disks het zijn maar was vergeten de openingspost aan te passen.

Volgens MS moet je geen disks verwijderen uit een pool voordat je er een goede disk naast hebt gezet, dit zou tot problemen leiden. Daarmee heb ik wel een ander issue want ik heb maar ruimte voor 4 disks.

Acties:
  • 0 Henk 'm!

  • Noob_Saibot
  • Registratie: Maart 2012
  • Laatst online: 20:34

Noob_Saibot

Azerbaijan 🔥

oef! schreef op woensdag 8 januari 2025 @ 10:41:
[...]


Ik heb op basis van de serienummers in CDI al acherhaald welke fysieke disks het zijn maar was vergeten de openingspost aan te passen.

Volgens MS moet je geen disks verwijderen uit een pool voordat je er een goede disk naast hebt gezet, dit zou tot problemen leiden. Daarmee heb ik wel een ander issue want ik heb maar ruimte voor 4 disks.
Not so nice, in ergste geval heb je backup toch ;)

Heb je mogelijkheid om jou RAID te migreren?

Land van het eeuwige vuur


Acties:
  • 0 Henk 'm!

  • MsG
  • Registratie: November 2007
  • Laatst online: 18:46

MsG

Forumzwerver

Noob_Saibot schreef op woensdag 8 januari 2025 @ 10:28:
In mijn ervaring is dit begin van een falende disk, dus 1 disk los trekken en dan nog eens in je tool kijken welke er verdwijnt, deze goed noteren en door naar andere tot je overzicht hebt van je fysiek > Raid opstelling.

Zodoende de disk(s) vervangen wat reeds warming geven....
Een symptoom moet je niet verwarren met een oorzaak. Als jij en ik beide hoofdpijn hebben kan dat beide om heel andere redenen. Daarmee is het bij deze schijf ook niet automatisch zo dat hij stuk aan het gaan is, omdat dat bij jou wellicht zo was. Ik zou de current pending sectors (die nu op 0 lijkt te staan) en de reallocated sectors kritisch blijven monitoren.

Overigens kan je CrystalDiskInfo veel menselijker zetten qua waarden (Functies > Geavanceerde functies > Raw-waarden > 10 DEC)

Denk om uw spatiegebruik. Dit scheelt Tweakers.net kostbare databaseruimte! | Groninger en geïnteresseerd in Domotica? Kom naar DomoticaGrunn


Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
Noob_Saibot schreef op woensdag 8 januari 2025 @ 10:53:
[...]


Not so nice, in ergste geval heb je backup toch ;)

Heb je mogelijkheid om jou RAID te migreren?
Technisch ja, praktisch niet echt. De oplossing die ik daarvoor zie is alles naar een externe disk van 6TB kopiëren, een nieuwe setup bouwen en dan alles terug kopiëren. Ik heb dit in het verleden gedaan en het kost letterlijk dagen. Restoren vanuit de cloud is nog veel trager. Hier komt ook nog een kostenplaatje bij van 2 nieuwe disks en een tijdelijke disk waardoor ik +/- 400 euro verder ben.

Acties:
  • 0 Henk 'm!

  • oef!
  • Registratie: Februari 2011
  • Niet online
MsG schreef op woensdag 8 januari 2025 @ 10:59:
[...]


Een symptoom moet je niet verwarren met een oorzaak. Als jij en ik beide hoofdpijn hebben kan dat beide om heel andere redenen. Daarmee is het bij deze schijf ook niet automatisch zo dat hij stuk aan het gaan is, omdat dat bij jou wellicht zo was. Ik zou de current pending sectors (die nu op 0 lijkt te staan) en de reallocated sectors kritisch blijven monitoren.

Overigens kan je CrystalDiskInfo veel menselijker zetten qua waarden (Functies > Geavanceerde functies > Raw-waarden > 10 DEC)
Dank je voor de uitleg (ook @Noob_Saibot voor het meedenken), ik was verward over de current en worst waarden maar het gaat dus over de (decimale) current waarden. Ik interpreteer de situatie nu als minimaal zorgelijk maar niet dramatisch. Aangezien het een low maintance systeem is ga ik wel kijken naar vervangende disks voor de gemoedsrust. De schijven hebben 7 en 8 jaar lang 24/7 gedraaid, een mooi moment voor pensioen.

Ik zal moeten uitzoeken hoe dit precies via storage spaces gaat. Voor nu is het wel duidelijk tenzij ik hierboven iets raars zeg.

Acties:
  • +1 Henk 'm!

  • DataGhost
  • Registratie: Augustus 2003
  • Laatst online: 19-09 21:26

DataGhost

iPL dev

MsG schreef op woensdag 8 januari 2025 @ 10:59:
[...]


Een symptoom moet je niet verwarren met een oorzaak. Als jij en ik beide hoofdpijn hebben kan dat beide om heel andere redenen. Daarmee is het bij deze schijf ook niet automatisch zo dat hij stuk aan het gaan is, omdat dat bij jou wellicht zo was. Ik zou de current pending sectors (die nu op 0 lijkt te staan) en de reallocated sectors kritisch blijven monitoren.

Overigens kan je CrystalDiskInfo veel menselijker zetten qua waarden (Functies > Geavanceerde functies > Raw-waarden > 10 DEC)
Ja, het *kan* dat een schijf reallocated sectors krijgt en niet kapot aan het gaan is. De kans daarop is echter in ieder geval uit mijn ervaring extreem klein. Dat moet dan ook zo ongeveer in de eerste paar minuten van de levensduur van de schijf gebeurd zijn (a.k.a. al kapot voor ingebruikname), anders is er inderdaad iets stukgegaan wat eerst niet zo was.

Ik heb ondertussen volgens mij al wel minimaal 10 schijven van verschillende fabrikanten en series mogen RMA-en die begonnen met pending en reallocated sectors. Dat ontwikkelde zich eigenlijk altijd volgens hetzelfde patroon, de schijf werkte jarenlang prima totdat de eerste pending/reallocated sector verscheen, en vanaf dat moment nam het aantal pending/reallocated sectors in korte tijd (weken) flink toe. Ondertussen leverde dat flink dataverlies op. Of laat ik het omdraaien: ik heb 0 schijven gehad die reallocated sectors begonnen aan te geven en die sinds die tijd nog probleemloos werken.

De fabrikant heeft die in ieder van die gevallen ook gewoon vervangen onder garantie zonder dat het probleem zo ver gevorderd moest zijn dat de schijf verder niet meer bruikbaar was. Die kwamen dan niet met een of ander vaag verhaaltje over hoofdpijn aanzetten, dus daarmee neem ik aan dat hun conclusie dezelfde is als de mijne: de schijf is gewoon onbetrouwbaar geworden en dient vervangen te worden.

Acties:
  • +1 Henk 'm!

  • bananasplit
  • Registratie: December 2024
  • Laatst online: 15-01 15:39
Persoonlijk zou ik alle disken vervangen en de backup terug zetten, dan meteen in plaats van een Raid 1 een Raid 5 maken.
Er zijn al unrecoverable error's dus als de defecte disken elkaars mirror zijn heb je al corrupte data.
Pagina: 1