Acties:
  • +2 Henk 'm!

  • Hahn
  • Registratie: Augustus 2001
  • Laatst online: 20:59
LankHoar schreef op zondag 28 maart 2021 @ 13:33:
Van de week een nieuwe schijf in gebruik genomen, een WD Blue van 4 TB. Vandaag hoor ik wat gekraak uit mijn PC kast komen dus ik dacht laat ik hem even uitlezen met CrystalDiskInfo, en dit is wat ik zie:

[Afbeelding]

Geen idee wat dit precies betekend maar dat "Caution" zegt natuurlijk niets goeds. Gevalletje RMA denk ik, of niet?
Als dit een nieuwe schijf is, zeker direct terugsturen. Harde schijven horen geen SMART-warnings te geven, al helemaal niet als ze nieuw zijn.

The devil is in the details.


Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Hahn schreef op zondag 28 maart 2021 @ 13:42:
[...]

Als dit een nieuwe schijf is, zeker direct terugsturen. Harde schijven horen geen SMART-warnings te geven, al helemaal niet als ze nieuw zijn.
Precies wat ik al vermoedde. Heb de oude schijf al verkocht daar ik geen problemen verwachte, dus heb een RMA ingediend bij de shop en hopelijk kunnen ze me eerst een nieuwe schijf toesturen zodat ik mijn data over kan zetten. Backup herstellen kan ook, maar duurt met 1,7 TB behoorlijk lang op een 30 mbit/s lijntje :)

When life throws you a curve, lean into it and have faith!


Acties:
  • 0 Henk 'm!

  • Q
  • Registratie: November 1999
  • Laatst online: 22:02

Q

Au Contraire Mon Capitan!

HyperBart schreef op zondag 28 maart 2021 @ 10:52:
offtopic:
@Q ik weet niet waarom of hoe maar ik krijg ondanks dat ik op disks selecteer ("show disk") ook de loop network interfaces mee van Docker, althans dat denk ik. Maak ik daar een GitHub issue'tje van aan?
@HyperBart Ja prima.

Acties:
  • 0 Henk 'm!

  • HyperBart
  • Registratie: Maart 2006
  • Laatst online: 08:17
LankHoar schreef op zondag 28 maart 2021 @ 13:33:
Van de week een nieuwe schijf in gebruik genomen, een WD Blue van 4 TB. Vandaag hoor ik wat gekraak uit mijn PC kast komen dus ik dacht laat ik hem even uitlezen met CrystalDiskInfo, en dit is wat ik zie:

[Afbeelding]

Geen idee wat dit precies betekend maar dat "Caution" zegt natuurlijk niets goeds. Gevalletje RMA denk ik, of niet?
Terugsturen en voor een veel goedkopere prijs en met garantie dat ze geen sectoren mis hebben een van mijn 4TB’s kopen 😜

[ Voor 3% gewijzigd door HyperBart op 28-03-2021 20:47 ]


Acties:
  • 0 Henk 'm!

  • Valkyre
  • Registratie: April 2002
  • Laatst online: 17-09 15:36

Valkyre

Kitesurf FTW!

in mijn truenas server heb ik een aantal WD schijven zitten Device Model: WDC WD30EFRX-68AX9N0
vorige jaar in mei had ik al eens de melding gehad One or more devices has experienced an unrecoverable error. echter toen gecleared en ook niet gecheckt welke disk het was.

maar nu tijdens de scrubs is het weer terug en ben ik er even in gedoken alleen zeggen de waardes mij dan weer weinig.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       174
  3 Spin_Up_Time            0x0027   183   179   021    Pre-fail  Always       -       5850
  4 Start_Stop_Count        0x0032   087   087   000    Old_age   Always       -       13041
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   030   030   000    Old_age   Always       -       51324
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       638
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       137
193 Load_Cycle_Count        0x0032   196   196   000    Old_age   Always       -       12903
194 Temperature_Celsius     0x0022   116   105   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       7

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     37929         16895664
# 2  Extended offline    Completed without error       00%     25294         -
# 3  Extended offline    Completed without error       00%     24943         -
# 4  Extended offline    Completed without error       00%     24195         -
# 5  Extended offline    Completed without error       00%     23476         -
# 6  Extended offline    Completed without error       00%     22732         -
# 7  Extended offline    Completed without error       00%     21385         -
# 8  Extended offline    Completed without error       00%     20665         -
# 9  Extended offline    Completed without error       00%     19922         -
#10  Extended offline    Completed without error       00%     19909         -
#11  Extended offline    Completed without error       00%     19203         -
#12  Extended offline    Completed without error       00%     18461         -
#13  Extended offline    Completed without error       00%     17789         -
#14  Extended offline    Completed without error       00%     14882         -
#15  Extended offline    Completed without error       00%     13833         -
#16  Extended offline    Completed without error       00%     10246         -
#17  Short offline       Completed without error       00%     10217         -
#18  Extended offline    Completed without error       00%      4020         -
#19  Extended offline    Aborted by host               70%      4012         -
#20  Extended offline    Aborted by host               90%      4010         -
#21  Short offline       Completed without error       00%      4010         -


ik kan moeilijk beoordelen of dit een geval replace disk is, of gewoon nog een keer clearen?

iRacing Profiel


Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Rij 7: je hebt 1 (ooit) succesvol vervangen sector, je kunt niet zien wanneer dat is opgetreden.
Dat kan goed die van vorig jaar mei zijn geweest.
Omdat het getal ongelijk aan 1 is zul je elke keer een warning krijgen.
Het wordt zorgelijk als het aantal (snel) oploopt.
Als je regelmatig backups maakt en je Smart data checkt, is dit nu geen reden tot zorg.

Acties:
  • 0 Henk 'm!

  • 418O2
  • Registratie: November 2001
  • Nu online
Ik had wat rare dingen en ging mijn event log checken en zag deze error in het log
The device, \Device\Harddisk0\DR0, has a bad block.
Game (Division 2) crashte en tijdens werk (wat op diezelfde schijf staat) naaide hij ook vast. Maar nu kijk in CDI en zie ik dit

Afbeeldingslocatie: https://tweakers.net/i/zvjh0zSd6Ezndk0JAE1YPS9kkyQ=/x800/filters:strip_exif()/f/image/RgVZIlumkIqjYoIkvfuQZjaN.png?f=fotoalbum_large
dat is toch weer prima juist?

draai nu een chkdsk /r en die is wel het nodige aan het fixen
Windows has made corrections to the file system.
No further action is required.

512672767 KB total disk space.
257698368 KB in 56202 files.
13712 KB in 6761 indexes.
556 KB in bad sectors.
163543 KB in use by the system.
65536 KB occupied by the log file.
254796588 KB available on disk.

4096 bytes in each allocation unit.
128168191 total allocation units on disk.
63699147 allocation units available on disk.
Total duration: 14.96 minutes (897957 ms).
Afbeeldingslocatie: https://tweakers.net/i/cb5L2Tnyeri0dvqXFU4b0Ra6RAQ=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/j4VlsgBApzku4ssb8bvQildE.png?f=user_large

weinig aan de hand toch?

[ Voor 34% gewijzigd door 418O2 op 01-04-2021 18:36 ]


Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

LankHoar schreef op zondag 28 maart 2021 @ 13:33:
Van de week een nieuwe schijf in gebruik genomen, een WD Blue van 4 TB. Vandaag hoor ik wat gekraak uit mijn PC kast komen dus ik dacht laat ik hem even uitlezen met CrystalDiskInfo, en dit is wat ik zie:

[Afbeelding]

Geen idee wat dit precies betekend maar dat "Caution" zegt natuurlijk niets goeds. Gevalletje RMA denk ik, of niet?
Deze schijf heeft het inmiddels begeven. Had alvast een nieuwe gekocht zodat ik de datat hopelijk nog kon overzetten, maar tijdens dat proces gaf ie de geest. Althans, ik kon hem nog benaderen via Windows, maar geen enkel bestand openen of kopiëren en toen ik hem net via disk management wilde benaderen gaf hij ook foutmeldingen.

Heb dus een nieuwe (ook WD Blue 4 TB) geïnstalleerd, en ben even benieuwd of deze qua health wel in orde is:

Afbeeldingslocatie: https://tweakers.net/i/5rdvjygv8-FJMgYzP3tHjMpvZrQ=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/Iu2XYvj8ZvFGYFPu6hssCHcq.png?f=user_large

En dan nog een vraag: de data die al wel gekopieerd is van de defecte schijf, kan ik die vertrouwen? Of is het beter om een backup te herstellen?

@HyperBart ik woon niet in BE/NL dus dat zou niet handig zijn geweest voor mij ;)

[ Voor 8% gewijzigd door LankHoar op 01-04-2021 23:09 ]

When life throws you a curve, lean into it and have faith!


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@418O2:
Het is de vraag (dat weet jij wel en wij niet) of de "harddisk-foutmelding" verwijst naar deze SSD.
Als je dat met zekerheid weet, duidt de melding op een fout in het bestandssysteem en niet zozeer op een hardwarefout in de SSD. Het grote aantal unexpected Power Losses kán daar ook op wijzen, het hoeft niet.
Met het ChkDsk commando repareer je ook je bestandssysteem, niet een hardwarefalen op de SSD.
Doe dus eens wat vaker een Windows Schijfcontrole (en niet een ChkDsk) en voer ook met regelmaat een Trim uit (staat onder de Schijfcontrole).

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@LankHoar:
Ja, deze tabel laat niets verkeerds zien en de harddisk was echt nieuw.
De data van backup af is beter te vertrouwen: zet dus als basis de backup erbij terug en verrijk deze met uitgeteste bestanden (dus die bewezen nieuwer en goed zijn) uit de bestanden die je kon redden. Basis hiervoor is de datum van de bestanden (als die niet zijn gereset tijdens het kopiëren).

Acties:
  • 0 Henk 'm!

  • 418O2
  • Registratie: November 2001
  • Nu online
@Renault het is wel deze schijf, die staat als disk0 in disk manager.

Schijf controle is nog relevant in deze tijd? Moet zeggen dat ik al in geen jaren meer iets aan onderhoud heb gedaan aan harddisks

Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Renault schreef op donderdag 1 april 2021 @ 23:42:
@LankHoar:
Ja, deze tabel laat niets verkeerds zien en de harddisk was echt nieuw.
De data van backup af is beter te vertrouwen: zet dus als basis de backup erbij terug en verrijk deze met uitgeteste bestanden (dus die bewezen nieuwer en goed zijn) uit de bestanden die je kon redden. Basis hiervoor is de datum van de bestanden (als die niet zijn gereset tijdens het kopiëren).
Top. Kom er net achter dat mijn backup een beetje brak is... :\ Carbonite staat wel goed aangeschreven en toch heb ik al een paar keer gehad dat dingen niet goed gebackupt zijn, ondanks contact met support om dingen juist in te stellen.. Ik ga even spelen met die van het weekend en hopelijk krijg ik alles weer in orde.

When life throws you a curve, lean into it and have faith!


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
418O2 schreef op donderdag 1 april 2021 @ 23:42:
@Renault ...
Schijf controle is nog relevant in deze tijd? Moet zeggen dat ik al in geen jaren meer iets aan onderhoud heb gedaan aan harddisks
Als je wat zekerheden wil inbouwen qua beschikbaarheid van je PC en data, zou je m.i. de volgende drie dingen minimaal eenmaal per maand moeten uitvoeren:
1. backup maken van al je belangrijke data EN je backupmedium voorafgaand een schijfcontrole geven (evt. ook virusscan)
2. schijfcontrole doen op al je actieve en passieve opslagmedia. Bij actieve SSD's ook een Trim (staat onder Schijfcontrole)
3. een Herstelpunt maken.
Updates binnenhalen en installeren doe je natuurlijk permanent, dat is geen periodieke actie.
En een bijgewerkte goede antivirusscanner met bankierbeveiliging is m.i. ook vanzelfsprekend op het Windows platform. Die zit vrijwel altijd gratis bij je internetabonnement.

[ Voor 10% gewijzigd door Renault op 02-04-2021 19:20 ]


Acties:
  • +1 Henk 'm!

  • 418O2
  • Registratie: November 2001
  • Nu online
Trim doet hij wekelijks, updates doe ik en backups maak ik niet.

Alles wat ik wil backuppen staat in git. Foto's heb ik in de cloud.

Acties:
  • 0 Henk 'm!

  • chim0
  • Registratie: Mei 2000
  • Nu online
Heb een MX100 overgenomen van een kennis en vind het toch wel apart dat ie "gezonder" is dan mijn nieuwere MX500. Of denk ik weer raar? Hij is ook veel koeler, maar dat kan te maken hebben met hoe de SSD is gebouwd.

- Ongeveer evenveel draaiuren
- Veel meer inschakelingen (mijn PC staat bijna altijd aan)
- Paar TB meer geschreven.

Afbeeldingslocatie: https://tweakers.net/i/OQTv2BZ7cUg89AjKUaZqcnfMd6Q=/full-fit-in/4920x3264/filters:max_bytes(3145728):no_upscale():strip_icc():fill(white):strip_exif()/f/image/hpPC6UcfYn3MD4AWzS7zgrzH.jpg?f=user_large

Afbeeldingslocatie: https://tweakers.net/i/9LwPtVq4rfNSGwm2xQjlJNNPTM4=/full-fit-in/4920x3264/filters:max_bytes(3145728):no_upscale():strip_icc():fill(white):strip_exif()/f/image/HqK0HXcMtwCkR97cvDKvE2OL.jpg?f=user_large

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Dat is verklaarbaar: het % resterende levensduur wordt berekend uit het werkelijke aantal geschreven TB versus het statistisch voor die SSD opgegeven aantal max TB written.

Het zou zomaar kunnen dat dat voor de 100 hoger is opgegeven dan voor de 500, je zult het zelf even moeten narekenen.

Apropos, waarom maak je je druk? Ze zien er beide nog vrij redelijk uit:
- de bovenste:
De temperatuur is nog binnen de marges gebleven.
Wel ooit drie communicatiefouten gehad.
- de onderste:
Nu 1 wachtende sector, die verdwijnt vanzelf in het gebruik. Wel in de gaten houden dat dat goed afloopt.

Acties:
  • 0 Henk 'm!

  • chim0
  • Registratie: Mei 2000
  • Nu online
@Renault Ik maak me ook niet echt druk, maar vond het gewoon opvallend. Maar je uitleg klinkt idd logisch.

Die wachtende sector had ik even gemist. Ik gebruik nu die 100 als Windows drive en de 500 als data/werk drive. Eerst was de 500 mijn Windows drive, maar heb een 1 op 1 clone gedaan en ging perfect. Voorheen had ik een 2,5" SATA schijfje als werk/data drive. Daar deed ik dan dingen op downloaden, kopiëren, bewerken etc. maar dat gaat nu een stukje sneller.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Doe dan op beide even handmatig een volledige antiviruscontrole (Malwarebytes Free bv.), Bestandscontrole en een Trim, dan slaap je rustiger ... :+

Acties:
  • 0 Henk 'm!

  • rainbowniagara
  • Registratie: April 2021
  • Laatst online: 30-06 20:58
Hoi,
Mijn laptop is enige jaren oud, maar heb ik het goed voor dat hij nog in redelijke staat is?

Afbeeldingslocatie: https://tweakers.net/i/mtVuIfoDS2BBpulZqGOBaYGw3bw=/full-fit-in/4920x3264/filters:max_bytes(3145728):no_upscale():strip_icc():fill(white):strip_exif()/f/image/BMBiHgCMgkZ8VdWvdgAgU3Ic.jpg?f=user_large

Acties:
  • 0 Henk 'm!

  • AOC
  • Registratie: September 2001
  • Niet online

AOC

Onlangs heb ik twee nieuwe externe hardeschijven (seagate) gekocht van elk 10TB. Nu heb ik hiervan direct de smart gecontroleerd wat mij in twijfel brengt.

Is dit wat je kan verwachten van nieuwe hdd's? Met de tool StaleBit Scanner zie ik de melding "smart is prediciting imminent failure of this disk (code 0)"

Te zien in onderstaande plaatje

Afbeeldingslocatie: https://tweakers.net/i/5vtYPDxsF5XGI9H_Iex-7BLSLXE=/232x232/filters:strip_icc():strip_exif()/f/image/9OVa45CGiU6d0xzKaw8yl0qX.jpg?f=fotoalbum_tile


Als ik diezelfde hdd in crystaldisk bekijk dan staat er Good bij.

Afbeeldingslocatie: https://tweakers.net/i/HrWCIXHY_WA_9tPGrBHxYb8bkW4=/232x232/filters:strip_icc():strip_exif()/f/image/kAIFWjesbVeRTVpYLwaxHIrC.jpg?f=fotoalbum_tile


en de andere hdd in crystaldisk.

Afbeeldingslocatie: https://tweakers.net/i/gQOw03fjMOtqGhAHY5DUPb0jXSo=/x800/filters:strip_icc():strip_exif()/f/image/nGWDz0J1NtHMAj585avqZ5v4.jpg?f=fotoalbum_large

Moet ik mij nu zorgen gaan maken of dienen de hdd's zich nog in te draaien? Het zijn geen ssd's maar hdd's op 7200rpm. Ik hoor ze ook duidelijk tikken/schokken en soms voel ik het door mn bureau heen. Ik kan mij niet heugen of dat kenmerkend is voor de 7200rpm hdd's.

edit: tool erbij gepakt van Seagate zelf. Ook hierin krijg ik een smart error en de short DST failed ook. Naja, waar rook is is vuur denk ik dan, stuur ze wel terug

[ Voor 56% gewijzigd door AOC op 05-04-2021 20:27 ]


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@rainbowniagara:
Die disk laat nog geen enkele fout zien. Gewoon doorgaan dus.
... en periodieke backups van al je belangrijke data zijn sowieso aan te raden ...

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@AOC:
Bij beide disks is geen enkele foute waarde te zien, dus op grond van deze SMART-gegevens zou ik niet weten waarom je ze niet gewoon zou houden.
Bij de bovenste disk kan het programma wat je daar gebruikt van slag raken door de "1" bij de G-sensor waarde.
Maar dat heeft niets te betekenen.

Wat het tikken/schokken en lawaai betreft: via AAM kan je daar wat aan doen door dat minder agressief in te stellen. En wellicht helpt het ook om de disks gedempt te bevestigen.

Dat gezegd hebbende: als de RMA-software van Seagate zelf na een gedraaide testcyclus met een error komt, is de disk niet in orde.
Als je ze heel recent hebt gekocht via een webshop, kan je de koop wellicht nog zonder opgave van redenen ontbinden (geld terug).

Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Met het oog op falende schijven gelijk maar even een nieuwe externe disk aangeschaft voor backups. Deze lijkt in orde, of heb ik het mis?

Afbeeldingslocatie: https://tweakers.net/i/Tu2SyA31GBHjg8r3eW67iE_15wM=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/ZfLYx45B3S0k836CscW0YR2K.png?f=user_large

When life throws you a curve, lean into it and have faith!


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Daar is inderdaad niets mis mee ...

Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Renault schreef op woensdag 7 april 2021 @ 23:34:
Daar is inderdaad niets mis mee ...
Het ironische is dat ik hem vanavond voor een tweede keer aansloot, en hij nu niet meer herkend word door Windows. De disk spint op (hoor ik), dan hoor ik een vrij harde soort van klik waarna het spinnen stopt, dat een keer of 2/3 en dan niets... :? Dit nu 3 keer achter elkaar. Ik hoor wel het Windows geluidje dat er iets aangesloten word, maar zie niets in explorer verschijnen.

When life throws you a curve, lean into it and have faith!


Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Stroomprobleem ...

Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Hoe los ik dat op? Het is namelijk nog steeds zo :?

When life throws you a curve, lean into it and have faith!


Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Tja, dat ligt eraan: welke hardware heb jij?
- op internet zie ik dat het een 2,5" harddisk is en die zal USB-gevoed zijn.
- gebruik je een PC of een laptop?

Je zou een andere USB-poort kunnen gebruiken, bij deze grote capaciteiten vermoed ik dat je veel aanloopstroom nodig hebt als de disk opspint en een USB3 poort levert meer stroom dan een USB2 poort.
Dus wissel eens van USB-poort.
Als je alleen USB2 poorten hebt, kan je een zg. Y-adapter gebruiken (als die niet is bijgeleverd). Die kan je goedkoop bestellen bij allekabels.nl

Acties:
  • 0 Henk 'm!

  • LankHoar
  • Registratie: April 2013
  • Laatst online: 18-09 16:07

LankHoar

Langharig tuig

Renault schreef op vrijdag 9 april 2021 @ 16:30:
Tja, dat ligt eraan: welke hardware heb jij?
- op internet zie ik dat het een 2,5" harddisk is en die zal USB-gevoed zijn.
- gebruik je een PC of een laptop?

Je zou een andere USB-poort kunnen gebruiken, bij deze grote capaciteiten vermoed ik dat je veel aanloopstroom nodig hebt als de disk opspint en een USB3 poort levert meer stroom dan een USB2 poort.
Dus wissel eens van USB-poort.
Als je alleen USB2 poorten hebt, kan je een zg. Y-adapter gebruiken (als die niet is bijgeleverd). Die kan je goedkoop bestellen bij allekabels.nl
Een andere poort helpt. Ik probeerde het aanvankelijk op de poort van mijn monitor arm (USB 3, volgens mij 3.1), en de eerste keer werkte dat wel en daarna niet meer. Nu lukt het via de USB 3.0 poort die op mijn PC kast zelf zit wel.

When life throws you a curve, lean into it and have faith!


Acties:
  • 0 Henk 'm!

  • Running_Cow
  • Registratie: Juni 2008
  • Niet online
Het begint er op te lijken dat mijn Seagate 2TB HD aan het overlijden is, maar zou nog graag even de SMART data willen posten voor de fun. De data lezen gaat in spurts, en duurt erg lang. Daarnaast maakt dat gedrag Transmission instabiel en kom ik bij lange na niet meer aan de gewenste 1TB/dag upload.

Ik heb de schijf een paar jaar geleden van een mede-tweaker overgenomen als proof-of-concept gekocht voor 10 euro met bad sectors. Nu jaren later vind ik het cool dat de schijf nog gewoon werkt. eigenlijk best netjes van een consumenten schijf van Seagate. Ikzelf kan erg genieten dat de "Head Flying Hours" niet eens zoveel afwijken van de power on hours: Toch ruim 8,5 jaar staan werken.

Het is mij niet echt duidelijk waarom de schijf aan het overlijden is, de Raw_Read_Error_Rate staat al jaren erg hoog. Als via ZFS even een test wordt gedaan is de schijf wel snel, maar met gewone I/O niet. Ben nu nog aan het proberen wat (legale) torrents over te zetten naar een andere HD, maar als ie crashed is het jammer maar helaasch. Wie ziet wel gelijk wat er mis is?

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-9YN164

===knipper-de-knip===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   077   070   006    Pre-fail  Always       -       240664764
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       425
  5 Reallocated_Sector_Ct   0x0033   051   051   036    Pre-fail  Always       -       64584
  7 Seek_Error_Rate         0x000f   072   060   030    Pre-fail  Always       -       159470802984
  9 Power_On_Hours          0x0032   015   015   000    Old_age   Always       -       74479
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       420
183 Runtime_Bad_Block       0x0032   098   098   000    Old_age   Always       -       2
184 End-to-End_Error        0x0032   090   090   099    Old_age   Always   FAILING_NOW 10
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       3669
188 Command_Timeout         0x0032   100   085   000    Old_age   Always       -       1516 1516 1530
189 High_Fly_Writes         0x003a   001   001   000    Old_age   Always       -       569
190 Airflow_Temperature_Cel 0x0022   061   052   045    Old_age   Always       -       39 (Min/Max 33/43)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       209
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1109
194 Temperature_Celsius     0x0022   039   048   000    Old_age   Always       -       39 (0 18 0 0 0)
197 Current_Pending_Sector  0x0012   097   001   000    Old_age   Always       -       496
198 Offline_Uncorrectable   0x0010   097   001   000    Old_age   Offline      -       496
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       17
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       72697h+08m+13.635s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       151215375124657
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       231316921141021

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
SMART Error Log Version: 1
ATA Error Count: 3408 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 3408 occurred at disk power-on lifetime: 8943 hours (372 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00  48d+04:11:05.176  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:11:05.176  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:11:05.176  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:11:05.176  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:11:05.176  READ FPDMA QUEUED

Error 3407 occurred at disk power-on lifetime: 8943 hours (372 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00  48d+04:10:59.377  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:10:59.377  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:10:59.377  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:10:59.377  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+04:10:59.377  READ FPDMA QUEUED

Error 3406 occurred at disk power-on lifetime: 8942 hours (372 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00  48d+03:45:44.125  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:44.125  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:44.125  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:44.125  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:44.125  READ FPDMA QUEUED

Error 3405 occurred at disk power-on lifetime: 8942 hours (372 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00  48d+03:45:32.690  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:32.690  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:32.690  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:32.690  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:45:32.690  READ FPDMA QUEUED

Error 3404 occurred at disk power-on lifetime: 8942 hours (372 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00  48d+03:40:47.163  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:40:47.163  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:40:47.163  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:40:47.163  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  48d+03:40:47.163  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     44735         -
# 2  Short offline       Completed without error       00%     44016         -
# 3  Short offline       Completed without error       00%     43752         -
# 4  Short offline       Aborted by host               90%     43388         -
# 5  Short offline       Completed without error       00%     43008         -
# 6  Short offline       Completed without error       00%     42289         -
# 7  Extended offline    Completed without error       00%     42038         -
# 8  Short offline       Completed without error       00%     41974         -
# 9  Short offline       Completed without error       00%     41545         -
#10  Short offline       Completed without error       00%     40824         -
#11  Extended offline    Completed without error       00%     40255         -
#12  Short offline       Completed without error       00%     40081         -
#13  Short offline       Completed without error       00%     39409         -
#14  Short offline       Completed without error       00%     38665         -
#15  Short offline       Completed without error       00%     37538         -
#16  Short offline       Completed without error       00%     36793         -
#17  Short offline       Completed without error       00%     36091         -
#18  Short offline       Completed without error       00%     35349         -
#19  Short offline       Completed without error       00%     34605         -
#20  Extended offline    Completed without error       00%     34253         -
#21  Short offline       Completed without error       00%     27511         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

U.P.L.I.F.T.I.N.G.


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Mik die harddisk zo snel mogelijk weg, hij heeft hele series met problemen: 5, 184 en 197 zijn de ergste.

Als je een nieuwe harddisk koopt (SSD?), vervang dan ook je SATA-kabel meteen, want in 199 is te zien dat de harddisk (ooit in zijn leven) óók communicatiefouten heeft gehad richting het moederbord.
En kijk daarna enkele keren of 199 op nul blijft staan.

Een harddisk overkopen? Brrr.
Een harddisk met bad sectors overkopen? Brrrrrrrrrrrr.
:o

Acties:
  • 0 Henk 'm!

  • vanaalten
  • Registratie: September 2002
  • Nu online
Recent wat stroomstoringen gehad waardoor een opslagmachine onverwacht is uitgezet. Sindsdien geeft m'n ZFS report aan dat er wat mis is met de ZFS-mirror. Leek mij dus zinnig om eerst een SMART selftest te doen om de 6TB schijven. Resultaat na 'smartctl -t long /dev/sdc':
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Model Family:     Western Digital Green
Device Model:     WDC WD60EZRX-00MVLB1
<<knipknip>>
SMART overall-health self-assessment test result: PASSED
<<knipknip>>
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VA                                 LUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   211   194   021    Pre-fail  Always       -       8450
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3161
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       5592
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       90
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       10
193 Load_Cycle_Count        0x0032   174   174   000    Old_age   Always       -       78334
194 Temperature_Celsius     0x0022   124   098   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

Voor de zekerheid: volgens mij is er qua SMART waardes niets mis met deze schijf, toch? Enkel is die load_cycle_count wat hoog, maar dat zou volgens mij weinig kwaad moeten kunnen.

Acties:
  • +1 Henk 'm!

  • P5ycho
  • Registratie: Januari 2000
  • Laatst online: 07:24
vanaalten schreef op dinsdag 13 april 2021 @ 14:10:
[...]
Enkel is die load_cycle_count wat hoog, maar dat zou volgens mij weinig kwaad moeten kunnen.
Het ligt een beetje aan het type schijf, maar ik vind je load cycle count niet hoog. Ik heb hier 5x Travelstar 5K1000 met tussen de 1500000 en 3000000 load cycles en die doen t nog prima :).

12x 280Wp ZW, 12x 280Wp ZO, Zubadan SHW80YAA 8kW, Zehnder Q450 ERV


Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Van de getoonde waarden duidt niets op een hardwarefalen.
Je zou hierna je bestandssysteem (de mirror) ook eens moeten checken.

Acties:
  • 0 Henk 'm!

  • Jazco2nd
  • Registratie: Augustus 2002
  • Laatst online: 18-09 15:46
Het valt me op dat hier alleen maar tools worden gebruikt om je SMART waardes op 1 moment uit te lezen. Het is toch veel nuttiger om te zien (en een alert te ontvangen) wanneer bepaalde waardes juist te snel toenemen, bijvoorbeeld LLC?

Voor de mensen die al over zijn op Docker, dit kom ik net tegen:
https://github.com/analogj/scrutiny

Lijkt me ideaal, al weet ik niet zek of deze kan wat ik bedoel. Ik gebruik ook Ubuntu en de UI met Disks is leuk, maar wanneer ik een maand later weer waardes check weet ik echt niet of die nou zo anders zijn.
HyperBart schreef op zondag 28 maart 2021 @ 10:52:


Nu was ik met de tool van @Q mijn disks eens aan het nakijken en ik merkte vandaag pas op dat ik ook "park" kon opvragen. Nou ja, monitoring/logging wat aangepast zodat dit nu mee komt en klaar. Maar bij inspectie viel me wel op dat in verhouding die park precies heel snel omhoog gaat voor die nieuwe disks versus disks die ik al jaren heb zitten:

-----------------------------------------------------------------------------------------
| Dev   | Model                     | GB    | Temp | Hours | PS | RS | RSE | CRC | Park |
-----------------------------------------------------------------------------------------
| loop0 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| loop1 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| loop2 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| loop3 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| loop5 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| loop6 |                           | 0     | ?    | ?     | ?  | ?  | ?   | ?   | ?    |
| sda   | WDC WD120EDAZ-11F3RA0     | 12000 | 35   | 2592  | 0  | 0  | 0   | 0   | 1887 |
| sdb   | Samsung SSD 840 EVO 500GB | 500   | ?    | 95449 | ?  | 0  | ?   | ?   | ?    |
| sdc   | WDC WD120EDAZ-11F3RA0     | 12000 | 34   | 2462  | 0  | 0  | 0   | 0   | 1853 |
| sdd   | WDC WD120EDAZ-11F3RA0     | 12000 | 36   | 2596  | 0  | 0  | 0   | 0   | 1848 |
| sde   | WDC WD120EDAZ-11F3RA0     | 12000 | 36   | 2593  | 0  | 0  | 0   | 0   | 1874 |
| sdf   | ST4000DM000-1F2168        | 4000  | 33   | 53701 | 0  | 0  | ?   | 0   | 8436 |
| sdg   | ST4000DM000-1F2168        | 4000  | 32   | 54618 | 0  | 0  | ?   | 0   | 8670 |
| sdh   | ST4000DM000-1F2168        | 4000  | 33   | 54615 | 0  | 0  | ?   | 0   | 8553 |
| sdi   | WDC WD120EDAZ-11F3RA0     | 12000 | 34   | 2459  | 0  | 0  | 0   | 0   | 1857 |
| sdj   | Samsung SSD 840 EVO 250GB | 250   | ?    | 99384 | ?  | 11 | ?   | ?   | ?    |
| sdk   | ST4000DM000-1F2168        | 4000  | 35   | 54611 | 0  | 0  | ?   | 0   | 8722 |
| sdl   | WDC WD120EDAZ-11F3RA0     | 12000 | 38   | 2488  | 0  | 0  | 0   | 0   | 1889 |
-----------------------------------------------------------------------------------------
Welke tool is dit? Want ik heb op username Q gezocht, posts gevonden maar niks gaat over een tool..

Acties:
  • +1 Henk 'm!

  • HyperBart
  • Registratie: Maart 2006
  • Laatst online: 08:17
@Jazco2nd https://github.com/louwrentius/showtools

Ik heb smartmontools zo geconfigureerd dat ik een Telegram krijg als er wat gebeurt op mijn disks, daarnaast log ik iedere dag al mijn Smart waardes om een trend of historiek te kunnen zien.

[ Voor 65% gewijzigd door HyperBart op 14-04-2021 09:03 ]


Acties:
  • 0 Henk 'm!

  • Jazco2nd
  • Registratie: Augustus 2002
  • Laatst online: 18-09 15:46
HyperBart schreef op woensdag 14 april 2021 @ 08:55:
@Jazco2nd https://github.com/louwrentius/showtools

Ik heb smartmontools zo geconfigureerd dat ik een Telegram krijg als er wat gebeurt op mijn disks, daarnaast log ik iedere dag al mijn Smart waardes om een trend of historiek te kunnen zien.
Wow nice, ben wel benieuwd hoe je dan logt, je bewaart de output van de tool en maakt zelf in Excel een tabel ofzoiets?

Acties:
  • 0 Henk 'm!

  • HyperBart
  • Registratie: Maart 2006
  • Laatst online: 08:17
Jazco2nd schreef op woensdag 14 april 2021 @ 13:16:
[...]


Wow nice, ben wel benieuwd hoe je dan logt, je bewaart de output van de tool en maakt zelf in Excel een tabel ofzoiets?
Gewoon een bash script waarbij ik een smartctl -a doe per disk, nog een date ervoor en dat per maand in een plat tekst bestand. Als ik dan ooit wat nodig heb dan “bash grep” of goochel ik wat in notepad++ en dan komt er wel wat nuttigs uit.

Een van de SMART specialisten hier gaf eens aan dat SMART leuk is maar dat je dan ook historisch wat moet bijhouden, nou ja das nu wel het geval. Zo zag ik een tijd geleden dat mijn head parking count sneller omhoog ging dan bij mijn andere/vorige disks.

Voor telegram gebruik ik een simpel scriptje en een botje, was wat geklungel om werkend te krijgen maar het zit nu wel goed.

Als ZFS hier iets aan de hand heeft stuurt ZFS ZED via hetzelfde script ook een berichtje. Fijn hoor, iedere maandag een berichtje met je scrub resultaten 👌🏻

[ Voor 36% gewijzigd door HyperBart op 14-04-2021 13:35 ]


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Dat is een kwestie van "maturity level": de meesten zijn pas geïnteresseerd in Smart waarden als er iets fout gaat en ze als onderdeel van hun analyse (vaak dan voor het eerst) daarop stuiten.
Iemand die zijn data belangrijk vindt zal zijn Smart waarden eens wat vaker checken, met hetzelfde doel als backups maken: zo goed mogelijk anticiperen op data uitval.
Velen weten niet dat ze die tools ook zo kunnen configureren dat je een signaal krijgt als er iets afwijkends wordt opgemerkt. Nadeel is dan wel dat je moet vertrouwen op de interpretatie-capaciteiten van zo'n tool: bij NAS leveranciers is dat meestal goed in orde, bij losse (gratis) tools minder.
Het beste is als je de Smart data niet alleen absoluut beoordeelt, maar ook de trend erin. En dat enablen is wat hierboven wordt uitgelegd (voordelen daarvan en een kleine how to).

Acties:
  • +1 Henk 'm!

  • HyperBart
  • Registratie: Maart 2006
  • Laatst online: 08:17
Ok, wie heeft na mijn bericht een schijf thuis genomen en zitten voodoo prikken? :+

Vanmorgen op Telegram:

The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 8 Currently unreadable (pending) sectors

[ Voor 45% gewijzigd door HyperBart op 11-05-2021 07:58 ]


Acties:
  • 0 Henk 'm!

  • Jazco2nd
  • Registratie: Augustus 2002
  • Laatst online: 18-09 15:46
Ik heb 32 dagen geleden 2 schijven (Seagate 2.5" 5TB) vervangen (voor zelfde model). De schijven worden niet gebruikt om torrents te downloaden, ik heb ongeveer 1.5TB aan data verspreid over de schijven en een paar keer zeker 600GB gewist en weer opnieuw zoveel data erop geplaatst, met name fotos, documenten en filmpjes.

Nu schrik ik enorm, want ik mag alweer nieuwe kopen, zie de read error rate en seek errror rate.
Dit viel mij eerst niet op want ik keek alleen naar SMART waardes 5, 10, 184, 187, 188, 197, 198. Nu ik Scrutiny gisteravond heb geinstalleerd valt dit heel snel op.

Afbeeldingslocatie: https://tweakers.net/i/erKbmkD8WKOZoSUnykhBjZB09ag=/x800/filters:strip_exif()/f/image/Yv4w7Qhq7Jx13YJwHH6fZ1ER.png?f=fotoalbum_large

En na een backup van een deel van de schijf te hebben gemaakt zojuist zijn de niet-genormaliseerde waarden verandert, ik weet niet wat ik daaruit kan afleiden? Ik denk: er is verschil, dus in de afgelopen 2 uur zijn er sowieso weer read errors en seek errors geweest:
Afbeeldingslocatie: https://tweakers.net/i/tXo3x9VGRsPbROVSiVBd8H5ROm4=/x800/filters:strip_exif()/f/image/OZVRZQEdwjfelmT53PiFt0xb.png?f=fotoalbum_large


De 2e schijf voordat ik een backup draaide van een deel ervan:

Afbeeldingslocatie: https://tweakers.net/i/2wSz0CNaZ1i73HvY_ioBmK0iHzQ=/x800/filters:strip_exif()/f/image/ksdI80hBlQJij2AHbD0yMehw.png?f=fotoalbum_large

En vervolgens na de backup:
Afbeeldingslocatie: https://tweakers.net/i/GClyXKiS_RRcgyVyyvZxd_aiF0c=/800x/filters:strip_exif()/f/image/V14zCHRrSGXmUBlTPCHGm5aE.png?f=fotoalbum_large

Wat kan dit veroorzaakt hebben? Er is dus helemaal geen sprake van intensief gebruik.
De schijven gaan na 30min slapen. Worden paar keer per dag wakker, minimaal 1x ivm nachtelijke backups verder gaat het meeste via de SSD.

[ Voor 35% gewijzigd door Jazco2nd op 15-04-2021 13:05 ]


Acties:
  • +1 Henk 'm!

  • bitshape
  • Registratie: Februari 2003
  • Niet online

bitshape

japanse vechtvis

Jazco2nd schreef op donderdag 15 april 2021 @ 10:11:
Nu schrik ik enorm, want ik mag alweer nieuwe kopen, zie de read error rate en seek errror rate
Alle Seagates waarvan ik de Smart data heb gezien hebben altijd waardes gehad bij 'read error rate' en 'seek error rate'.
1 en 195 'Hardware ECC Recovered' zijn dan ook nagenoeg gelijk.
Als 5 en 197, 198, 199 op '0' blijven is het oke. Al je Seagate schijven zijn dus niet defect.

avatar redux
bit 2.0: i7-8700K - Z370 Apex - 32GB 3200c14 - Strix GTX1080 - Prime 850W - LSI 9207-8i - 22TB HDD - 5.5TB SSD


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Het ligt er een beetje aan, je geeft geen informatie hoe (waarin) je deze harddisks gebruikt:
- niet in een NAS: de Seek error rate en Read error rate zeggen niets over de betrouwbaarheid en/of levensduur van de harddisk. Het is heel gewoon dat deze waarden oplopen in het gebruik. Kijk maar eens in harddisks eerder in dit topic die gewoon "goed" waren en zich sindsdien normaal gedragen.
- wel in een NAS: sowieso werkt een NAS het betrouwbaarst als je er harddisks in gebruikt die op de Hardware Compatibility List van dat model NAS voorkomen.
En de fabrikant van de NAS implementeert software op de NAS die op een andere manier omgaat met de Smart waarden en de alerts die daarop worden afgegeven (als je dat hebt enabled/geconfigureerd).

Zolang we niet weten waarin je harddisks worden gebruikt en wat je aanleiding is geweest om zo naar de Smart waarden te kijken, kunnen we er eigenlijk niets zinnigs over zeggen buiten wat @bitshape er al over zegt.

Acties:
  • 0 Henk 'm!

  • Jazco2nd
  • Registratie: Augustus 2002
  • Laatst online: 18-09 15:46
Aanleiding was dat ik nog iets zocht om automatisch een melding te krijgen wanneer daar aanleding voor is. Scrutiny geinstalleerd, die toont de smart waardes wat leesbaar + vergelijkt met Backblaze database + toont de historie, toename/afname in waardes.

Toen ik vanochtend keek zag ik bij de detail weergave deze 2 velden gemarkeerd:Afbeeldingslocatie: https://tweakers.net/i/fcwNmSmejyOeLMGPx2BoDWDgzlY=/800x/filters:strip_exif()/f/image/iqDdxXrfhyrLtincsxP5rXaJ.png?f=fotoalbum_large

Maar dat is dus ivm de ratio die berekend is obv backblaze data en waarmee vervolgens wordt vergeleken. Toch als ik online zoek, komen er wel enge waarschuwingen voor deze waardes, maar ik lees ook dat de waardes van Seagate schijven bij deze 2 parameters niet altijd betrouwbaar is.

Verder is mijn ervaring met inmiddels 8 Seagate 2.5" 5TB schijven dat ze binnen een paar dagen/weken al "klingelend/bellende tikken" laten horen bij up spin en bij schrijven/lezen: daardoor ben ik extra alert.
Een geluid dat vroeger absoluut alarmbellen deed rinkelen, maar nu lijkt het erop dat ik het geluid moet accepteren.
Ik heb inmiddels al 4 schijven vervangen die volgens SMART prima waren, max 1.5 jaar oud, maar dat geluid gaven.
De vervangende schijven begonnen binnen een paar dagen/weken hetzelfde te doen.

Dit is een zelfbouw homeserver:
Intel C246 chipset (speciaal voor stabiliteit/continu aanstaan/zuinig)/Fujitsu mobo.
i3-9100, 32GB ECC non-reg RAM. OS draait op een SSD, daarnaast via MergerFS (een tool die een union maakt van je schijven, soort pool) gaat nieuwe data naar een (2e) SSD, waardoor de HDDs in de pool ontlast worden. Die zijn meestal stil.

[ Voor 10% gewijzigd door Jazco2nd op 15-04-2021 17:33 ]


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Ik betwijfel of je wel een (aankomend) probleem had.
Daarnaast is de gemeenschappelijke factor (als je inderdaad een probleem had) je voeding (verdacht), moederbord (wat zou daaraan mis moeten zijn?) en de inbouwmethode van de harddisks in de case.
Het zou niet de eerste keer zijn dat ze last hebben van elkaars trillingen, waarvoor een andere inbouwmethode (in rubbers of juist zonder rubbers) een oplossing zou kunnen zijn.

Waarom laat je trouwens "de handel niet gewoon stuk lopen"?
- dan weet je eindelijk of je terecht maatregelen hebt genomen (disks vervangen) of dat de SMART-waarden gelijk hebben
- het is waarschijnlijk goedkoper voor je (minder disks nodig)
- en het is vrij risicoloos als er maar één disk tegelijk defect raakt EN je een goed backupregime uitvoert (!)

Acties:
  • 0 Henk 'm!

  • mrmrmr
  • Registratie: April 2007
  • Niet online
4TB en 5TB 2.5" Seagate hard disks geven soms een klikkend geluid. Dat is volgens mij het (ver-)plaatsen van de koppen. Het geluid ontstaat denk ik doordat de magnetische plaat ander metaal raakt. De klik klinkt alsof je telescoopbuizen met bal-in-gatsysteem in elkaar klikt. Bijvoorbeeld van een parasol.

Mijn theorie is dat als je de klik hoort terwijl de drive iets doet. De vraag is natuurlijk wat. Het zou een poging kunnen zijn om een bad spot op de schijf te lezen. Als er meerdere kliks achter elkaar zijn zou dat een herhaalde poging of reset kunnen zijn. Ik weet niet of deze interpretatie klopt, want ik heb zo'n drive niet opengemaakt om te zien wat er gebeurt. Als je regelmatig de klik hoort zou die kunnen worden getriggered door het opnieuw opstarten vanuit stilstand na een spindown. Dat werkt niet helemaal zoals je zou denken, de drive kan al na korte tijd weer proberen in slaapstand te gaan terwijl het nog niet klaar is met de taak.

Ik gebruik diverse 4TB drives die langdurig in spin down stand staan. Ik hoor zelden zo'n klik.

Onder Windows gebruik ik 15 minuten spindown. Dat is lang genoeg om iedere tijdelijke actie uit te voeren en kort genoeg om maximaal energie te besparen.

Bij een disk naar disk kopie heb je de grootste kans ergens onderweg een of meerdere kliks te horen. Dat zou hypothetisch een slechte plek kunnen zijn. Alle hard disks bevatten in principe slechte of minder goede plekken en moderne disks bevatten firmware die problemen poogt weg te poetsen door het stukje disk opnieuw te lezen of te schrijven en vervolgens data te verplaatsen. Doe je dat met Seatools, dan poetst die meteen de SMART waarden op zodat het lijkt alsof er niets aan de hand is. Met die kliks lijkt Seagate minder goed in het verbergen van problemen dan andere merken.

Als je denkt dat mijn theoriën niet kloppen, laat dat gerust weten. Een slechte theorie kan altijd worden vervangen door een betere. :)

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Over geluiden uit harddisks: zet eerst eens AAM op zijn zachtste stand, dan leer je al meer over de oorzaak ervan denk ik.

Acties:
  • 0 Henk 'm!

  • TiesD
  • Registratie: Augustus 2011
  • Laatst online: 18-09 10:53
Vanmorgen bleek een map op mijn harde schijf niet meet toegankelijk. Met CHKDSK heb ik dit probleem weten op te lossen. Daarna heb ik de schijf gecontroleerd met Crystaldiskinfo met onderstaand resultaat. Ik heb geen idee hoe ik dit moet interpreteren. Moet ik mij zorgen gaan maken over deze schijf, of valt dat mee op dit moment?

Afbeeldingslocatie: https://tweakers.net/i/hKq4qYFeD_-rxwLkLni9KxFPYy8=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/IL87M6nRNpeQiPr2FJZnvrhc.png?f=user_large

Acties:
  • 0 Henk 'm!

  • Groentjuh
  • Registratie: September 2011
  • Laatst online: 18-09 16:07
@TiesD,
C5 betekend dat er 5 sectoren van die schijf mogelijk niet meer gelezen kunnen worden. De schijf moet die nog een keer beoordelen (is te doen door een volledige format te doen. Dan komt C5 weer op 0 te staan.)

05: Een aantal sectoren van de schijf zijn onleesbaar en vervangen door andere reserve sectoren.

Zowel C5 en 05 dienen niet op te lopen. Die 5 sectoren van C5 mogen nog bij 05 erbij, maar mochten ze beiden verder oplopen betekend dat min of meer einde voor deze schijf.

Mocht je geen backups hebben, is dit het moment om dit maar eens te regelen. Deze schijf is mogelijk niet meer betrouwbaar; Data kan gaan verdwijnen is meer sectoren kapot gaan/onleesbaar worden

Acties:
  • 0 Henk 'm!

  • TiesD
  • Registratie: Augustus 2011
  • Laatst online: 18-09 10:53
Heel hartelijk bedankt voor je hulp.
Ik ga de schijf formateren en houd hem in de gaten
Qua backups zit ik wel goed; ik heb er altijd drie ;-)

Acties:
  • 0 Henk 'm!

  • Juzzuts
  • Registratie: Augustus 2011
  • Laatst online: 18-09 10:05
Juzzuts schreef op dinsdag 16 februari 2021 @ 16:28:
[Afbeelding]

Ik kom er zelf niet helemaal uit. Ik heb hier een bijna nieuwe Samsung SSD 860 pro 512GB die in een CCTV video recorder gebruikt gaat worden. Nou wil ik een gemiddelde levensduur bepalen gebaseerd op het aantal bytes de recorder per uur schrijft naar de SSD. Het plan is om de SMART gegevens van de SSD voor en na de testdag uit te lezen en samen met de TBW waarde die Samsung opgeeft (600TBW) een inschatting geven.

Is dit een goede aanpak om mijn doel te behalen? Zo ja, moet ik dan de "Total Host Writes"-waarde moet pakken of de "Total LBAs Written"-waarde?

Alvast bedankt voor jullie hulp!
Helaas is 24uur niet mogelijk geweest en ben ik blijven steken op 5 uur. In die tijd geeft SMART aan dat de TBW 1GB omhoog is gegaan (zie ook mijn vorige gequote post). Is het veilig aan te nemen dat er in 5 uur maximaal 2GB geschreven wordt (vanwege afrondingsfouten). En dat bij vol continu gebruik en bij een opgegeven 600 TBW verwacht wordt dat de schijf (600*1024 / 2 / 5 = 1,536 miljoen uur mee gaat? Dus 175 jaar?

Of zien jullie nog andere dingen in de SMART waarden als de LBA die andere informatie geven? Let overigens niet op de bedrijfsuren... hij heeft nog een tijdje aan mijn PC gehangen zonder dat ik er wat mee deed.

Afbeeldingslocatie: https://tweakers.net/i/WKQwO2QcJdg4dFzCZdwrZbsiXmg=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/o81pM3q1AmfBKzM7MoC1zv5B.png?f=user_large

Acties:
  • +2 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Je krijgt waarschijnlijk weinig reacties omdat je "te moeilijk doet" met je SSD.
Mijn mening: gewoon de SSD in je videorecorder hangen en nergens meer naar kijken.
Hou er wel rekening mee dat de SSD daarbij volledig wordt gewist door de videorecorder.

Waarom?
De slijtage van de SSD wordt in de praktijk alléén bepaald door de snelheid waarmee jij de opgenomen video's "wegkijkt"en vervolgens wist. Dat gaat zo (relatief) langzaam, dat je helemaal niet hoeft te letten op de slijtage.
Ik meen me te herinneren dat een 300 Gb harddisk 60 uur HD-video kan bevatten. Dat betekent dan dat een uur video 5 GB data is. Als je per dag 6 uur opgenomen video zou kijken, is dat pakweg 30 GB. En dan doe je wel enkele jaren met je SSD ...

Acties:
  • 0 Henk 'm!

  • ptrx
  • Registratie: Juli 2015
  • Laatst online: 05-09 14:10
Ik heb een WD WD10EZEX schijf van 1 TB in een externe behuizing. De schijf is 2 jaar en 2 maanden oud en werd alleen voor backupdoeleinden gebruikt. Deze week gaf de schijf plotseling foutmeldingen (input/output errors) tijdens het maken van een backup. Ik heb toen een aantal testen gedaan maar die werden al vrij snel afgebroken vanwege leesfouten. De Current_Pending_Sector liep uiteindelijk op tot boven de 3000.

Het leek mij dat de schijf onherstelbaar beschadigd was dus heb ik hem gewist met shred. Maar tijdens het wissen kwamen er geen foutmeldingen. Een nieuwe lange SMART test heeft de schijf zonder problemen doorlopen. De Current_Pending_Sector staat weer op 0, maar toch vertrouw ik het niet. In hoeverre is deze schijf nog (veilig) te gebruiken?

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   138   138   051    Pre-fail  Always       -       3091
  3 Spin_Up_Time            0x0027   171   167   021    Pre-fail  Always       -       2433
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       38
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       90
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       37
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       84
194 Temperature_Celsius     0x0022   108   101   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   190   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%        90         -
# 2  Short offline       Completed: read failure       90%        70         88094392
# 3  Extended offline    Completed: read failure       90%        70         88094392
# 4  Short offline       Completed: read failure       90%        69         88094396
# 5  Short offline       Completed: read failure       90%        69         88094392
# 6  Short offline       Completed: read failure       90%        69         88094392
# 7  Short offline       Completed without error       00%        68         -

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Wat eigenlijk veel belangrijker is dan de Current_Pending_Sector count (197), is de Reallocated_Sector_Count (5).
Ik zie geen communicatiefouten (199) staan, dus waar die 3000 Current_Pending_Sectors vandaan komen is mij een raadsel, mogelijk een voedingsprobleem.

Hoe nu verder?
Het is nog steeds mogelijk dat er niets met deze harddisk aan de hand is. Je bent geen data kwijt, want je hebt nog steeds alle originele data. Dus ik zou deze harddisk gewoon opnieuw in gebruik nemen voor backups, maar wel steeds vóór het maken van een nieuwe backup de Smart-data controleren (m.n. 199, 197 en 5), die mogen dan niet (in grote getale) oplopen. En ik zou altijd vóór het maken van een nieuwe backup een schijfcontrole uitvoeren (géén CHKDSK) om zeker te weten dat je een backup maakt in een solide bestandssysteem.
Als de Smart waarden gaan afwijken zou ik afscheid nemen van deze harddisk en hem vervangen.
Check ook de manier waarop je hem voedt.

Acties:
  • 0 Henk 'm!

  • ptrx
  • Registratie: Juli 2015
  • Laatst online: 05-09 14:10
Een voedingsprobleem had ik al uitgesloten door de schijf in een ander systeem te plaatsen. De Current_Sector_Count bleef toen ook oplopen. Voor iedere backup draaide ik al een SMART short self-test (die heb ik weggelaten in mijn eerdere bericht), altijd zonder problemen. Vandaag heb ik een backup gemaakt en daarna een SMART extended self-test gedraaid. Geen enkele foutmelding, alsof er niets is gebeurd.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Ok. Hou je er wel rekening mee dat Smart "de hardware-SSD" statistisch monitort, maar dat je bestandssysteem iets heel anders is? Dat laatste kán lijden onder tijdelijk onleesbare sectoren, het hoeft niet zo te zijn.
Maar voor beide moet je apart moeite doen om ze betrouwbaar / in orde te houden.

Acties:
  • 0 Henk 'm!

  • biertjuh?
  • Registratie: Juli 2009
  • Laatst online: 18-09 14:14
Dus... Ik heb een SSD in een Intel NUC zitten die al heel lang zo ongeveer 24/7 draait en nu net een reboot heeft gehad.
Juist omdat deze SSD al lang draait (jaar of 5-6) in een ESXi host had ik zoiets van eens kijken hoe de status van de SSD is.

Nu haal ik met smartctl het volgende eruit:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron MX100/MX200/M5x0/M600 Client SSDs
Device Model:     Crucial_CT256M550SSD3
<<KNIP>>
Local Time is:    Mon May 17 11:00:56 2021 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Status not supported: Incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
<<KNIP>>

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always       -       0
  5 Reallocate_NAND_Blk_Cnt 0x0033   100   100   000    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       55426
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       44
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Ave_Block-Erase_Count   0x0032   048   048   000    Old_age   Always       -       1576
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       39
180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       2159
183 SATA_Interfac_Downshift 0x0032   100   100   000    Old_age   Always       -       0
184 Error_Correction_Count  0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   063   023   000    Old_age   Always       -       37 (Min/Max 16/77)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       16
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       0
202 Percent_Lifetime_Used   0x0031   048   048   000    Pre-fail  Offline      -       52
206 Write_Error_Rate        0x000e   100   100   000    Old_age   Always       -       0
210 Success_RAIN_Recov_Cnt  0x0032   100   100   000    Old_age   Always       -       0
246 Total_Host_Sector_Write 0x0032   100   100   000    Old_age   Always       -       108354040860
247 Host_Program_Page_Count 0x0032   100   100   000    Old_age   Always       -       3600645473
248 Bckgnd_Program_Page_Cnt 0x0032   100   100   000    Old_age   Always       -       1118812410

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     22062         -


Als ik alles goed lees dan heeft deze disk nu 55426 uur aangestaan waarbij hij nu iets over de helft van de verwachte levensduur is. Dit baseer ik op marts id's 9 en 202. Klopt mijn gedachtegang hierin of zie ik iets over het hoofd?
Ik weet alleen niet hoe ik id 246 (total host sector write) moet interpreteren, maar al met al zou ik zeggen dat deze SSD nog minimaal een jaar mee zou moeten gaan tenzij ik nu gekke dingen uit ga halen...

Oftewel, SSD kan nog even mee....

Waarom een jaar? Ik hoop ergens dit jaar een nieuwe NUC te kopen met een SSD en HDD en die in te gaan zetten als nieuwe ESX host.

Acties:
  • 0 Henk 'm!

  • The Executer
  • Registratie: Juli 2005
  • Laatst online: 06:40

The Executer

Lekker belangrijk!

Laatste tijd heeft mijn PC veel aangestaan. Na wat reboots e.d. en wat kopieeracties begon alles wat vreemd aan te voelen. Trage BIOS, trage boots, inloggen wat lang duurt etc. Nu probeerde ik een backup te maken naar 1 van de 2 interne HDD's, maar kwam de backup maar niet op gang. Een rondje Crystal Disk info maakt een hoop duidelijk, een falende schijf:

Afbeeldingslocatie: https://tweakers.net/i/ZjmG_rTYULtE_UER_We4G4nfAQM=/234x176/filters:strip_exif()/f/image/yTtFUnILsSqzqWd58eBhKsLz.png?f=fotoalbum_medium

Ook mijn tweede schijf gaat niet heel lekker meer. Veel zoekfouten, CRC fouten etc:
Afbeeldingslocatie: https://tweakers.net/i/6qXmK2smH0fpUqyHxNTQLLvqxpk=/234x176/filters:strip_exif()/f/image/hZ15k1Yzp5wrXqL0mSk9BiSH.png?f=fotoalbum_medium

Zou dit nog een falende SATA controller kunnen zijn? De problemen zijn begonnen nadat de PC ruim 4 dagen aan heeft gestaan, eigenlijk al die tijd zonder issues. Tussendoor een Windows update gehad waar hij niet meer uit kwam. Sindsdien is het horten en stoten eigenlijk.

OS disk:
Afbeeldingslocatie: https://tweakers.net/i/evO3r5F-3s0Ce6uRdz5efumTJTQ=/234x176/filters:strip_exif()/f/image/NjdSDLzA2sSrqAMQJkAu4HKc.png?f=fotoalbum_medium

[ Voor 11% gewijzigd door The Executer op 17-05-2021 14:07 ]

"We don't make mistakes; we just have happy accidents" - Bob Ross


Acties:
  • 0 Henk 'm!

  • The Executer
  • Registratie: Juli 2005
  • Laatst online: 06:40

The Executer

Lekker belangrijk!

Vanavond de PC uitgeblazen, de HDD met waarschuwing afgekoppeld en de schijf met CRC fouten op een andere SATA kabel gezet. CRC fouten bleven nu gelijk, maar de search error rate bleef met tientallen tegelijk oplopen. Nog geen harde fouten, geen reallocated sectors, geen pending etc. Binnenkort dus alle data er vanaf trekken en beide schijven de kliko maar in. De eerste is niet meer te vertrouwen met zijn replaced sectors, de 2e zal over niet al te lange tijd ook met sectors gaan lopen swappen vermoedt ik.

Eigenlijk wil ik niet meer investeren in HDD's / SATA SSD's omdat ik zit te denken aan een nieuwe PC. Hier wil ik gelijk overstappen naar M2 SSD's en een 2e bankje inzetten voor de 'statische' data. Scheelt een stuk aan kabels en ruimte.

"We don't make mistakes; we just have happy accidents" - Bob Ross


Acties:
  • 0 Henk 'm!

  • chim0
  • Registratie: Mei 2000
  • Nu online
The Executer schreef op maandag 17 mei 2021 @ 20:42:

Hier wil ik gelijk overstappen naar M2 SSD's en een 2e bankje inzetten voor de 'statische' data. Scheelt een stuk aan kabels en ruimte.
Voor opslag zou ik toch gewoon een SATA SSD pakken. Is veel goedkoper en snel genoeg. Je gaat er toch alleen dingen op opslaan en kopiëren, dus je hebt geen 2000MB/sec nodig, lijkt me.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@biertjuh? :

Je conclusie klopt.
Het Percentage Lifetime Used is de verhouding van 246 tot het door de fabrikant opgegeven max bytes written.

Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
The Executer schreef op maandag 17 mei 2021 @ 20:42:
Vanavond de PC uitgeblazen, de HDD met waarschuwing afgekoppeld en de schijf met CRC fouten op een andere SATA kabel gezet.
Het plastic van sommige SATA-connectors gaat vervormen als deze ouder worden en dan wordt het contact minder. Soms is even schoonmaken met alcohol ook voldoende.

Op zich hebben je schijven niet zoveel draaiuren, dus zouden best nog wel goed kunnen zijn. Moeilijk te zeggen, want je moet eigenlijk een log hebben van het verloop van de fouten door de tijd.

Ze zijn in principe nog prima te gebruiken voor offline opslag (bijv. van niet essensiele data).

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@The Executer :

Je hebt geen "communicatiefoutjes", zo heel af en toe komt er nog een goed bitje doorhéén!!! |:(
Er zit echt iets mis met je SATA-kabels en/of SATA connectoren.

Ik vermoed dat er met geen van je opslagmedia iets mis is en van een falende SATA-chip zonder aanwijsbare oorzaak (water/cola/wijn enz.) heb ik nog niet vaak gehoord.
Ook met je 2TB Samsung harddisk is helemaal niets mis: er zijn nu geen pending sectoren en er zijn nu 14 sectoren succesvol omgewisseld voor daarvoor klaar staande reservesectoren dus ook dat is goed gegaan.

In jouw plaats zou ik alle SATA-kabels vervangen door nieuwe, die zorgvuldig monteren en de komende tijd in de SMART-data van al je opslagmedia controleren of het huidige aantal CRC-fouten niet oploopt: ze worden nooit meer nul, maar zo mogen niet meer oplopen, nog niet met 1!

En controleer je bestandssysteem eens (met schijfcontrole, NIET met CHKDSK!) op al die opslagmedia: met zoveel communicatiefouten heb je grote kans dat daar flinke fouten in zitten.
Ook Windows zou ik eens een SFC/scannow gunnen vanaf de admin-commandprompt.

Acties:
  • 0 Henk 'm!

  • The Executer
  • Registratie: Juli 2005
  • Laatst online: 06:40

The Executer

Lekker belangrijk!

epias schreef op maandag 17 mei 2021 @ 23:40:
[...]
Het plastic van sommige SATA-connectors gaat vervormen als deze ouder worden en dan wordt het contact minder. Soms is even schoonmaken met alcohol ook voldoende.

Op zich hebben je schijven niet zoveel draaiuren, dus zouden best nog wel goed kunnen zijn. Moeilijk te zeggen, want je moet eigenlijk een log hebben van het verloop van de fouten door de tijd.

Ze zijn in principe nog prima te gebruiken voor offline opslag (bijv. van niet essensiele data).
De eerste schijf vertrouw ik niet meer. Is een schijf die al eerder problemen heeft gegeven en nu met sectors gaat swappen. Mijn ervaring is dat het vaak snel bergafwaarts gaat.

Van de tweede schijf lopen de fouten met tientallen per seconde op, wat een voorbode voor mechanisch falen zou kunnen zijn. De kabel waar hij nu op zit sluit beter aan, wat ook terug te zien is in de CRC fouten die niet meer op lopen.

"We don't make mistakes; we just have happy accidents" - Bob Ross


Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
The Executer schreef op maandag 17 mei 2021 @ 23:55:
[...]


De eerste schijf vertrouw ik niet meer. Is een schijf die al eerder problemen heeft gegeven en nu met sectors gaat swappen. Mijn ervaring is dat het vaak snel bergafwaarts gaat.

Van de tweede schijf lopen de fouten met tientallen per seconde op, wat een voorbode voor mechanisch falen zou kunnen zijn. De kabel waar hij nu op zit sluit beter aan, wat ook terug te zien is in de CRC fouten die niet meer op lopen.
Hier ben ik het in het geheel niet mee eens.
Niets duidt op een vreselijk hardwarefalen in je opslagmedia, je hebt wel een major probleem met je SATA-communicatie.

Mijn advies kost je bijna niets en dat kan je gewoon veilig uitproberen.
En natuurlijk heb je backups van al je belangrijke data.

[ Voor 8% gewijzigd door Renault op 17-05-2021 23:59 ]


Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
The Executer schreef op maandag 17 mei 2021 @ 23:55:
[...]
De eerste schijf vertrouw ik niet meer. Is een schijf die al eerder problemen heeft gegeven en nu met sectors gaat swappen. Mijn ervaring is dat het vaak snel bergafwaarts gaat.
Die Samsung schijf heeft een behoorlijk aantal optaters gehad, zie 'G-Sense_Error_Rate'. Een aantal bad sectors is dan redelijk normaal. Dit zie je ook vooral bij oude laptop-schijven, geen reden om weg te gooien.

Maar goed, dat moet je natuurlijk helemaal zelf weten. Ik heb hier precies dezelfde schijf en die is dik 10+ jaar.

Acties:
  • 0 Henk 'm!

  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

epias schreef op dinsdag 18 mei 2021 @ 01:04:
[...]
Die Samsung schijf heeft een behoorlijk aantal optaters gehad, zie 'G-Sense_Error_Rate'. Een aantal bad sectors is dan redelijk normaal. Dit zie je ook vooral bij oude laptop-schijven, geen reden om weg te gooien.

Maar goed, dat moet je natuurlijk helemaal zelf weten. Ik heb hier precies dezelfde schijf en die is dik 10+ jaar.
G-Sense_Error_Rate is een rate, niet een count. Wat je dan precies met de waarde aanmoet is vaak niet duidelijk, ik zou in dit geval gokken dat het weergeeft hoeveel trillingen er in de omgeving zijn. Een schijf die vanwege een stuiter bad sectors heeft, levert meestal ruim beroerdere SMART-waarden op dan er verder zijn. Deze hoeveelheid bad sectors zou ik gewoon aan de leeftijd van de schijf koppelen, van een stapel Samsung-schijven van vergelijkbare leeftijd heb ik er slecht 3 van 10 zonder bad sectors.

Acties:
  • 0 Henk 'm!

  • Polderviking
  • Registratie: Augustus 2020
  • Laatst online: 17-09 15:19
Hi all. Ik heb opeens twee (Proxmox) servers 't volgende:
SMART Health Status: WARNING: ascq=0x4 [asc=b, ascq=4]
Dit is terug te vinden in de output van:

code:
1
smartctl -a -d megaraid,0 /dev/sda


Schijven zijn dus onderdeel van een raid. (PERC controllers)

Ik kan op internet niet heel veel vinden over deze code, anders dan dat het misschien iets met start/stop waarde van de hdd te maken heeft.
Echter is dat aantal 9 of 10 (machine staat altijd aan in een DC) dus lijkt me een rare waarde om een warning voor te genereren.

Opvallende dingen:

Beide servers begonnen binnen een maand van elkaar deze melding te geven. De tweede sowieso nadat ik wat updates had geinstalleerd + reboot.
Zijn allebij Dell PowerEdge 620 servers. (wel verschillende modellen PERC controllers)
Gaat in beide gevallen om HDD 00 (de eerste schijf in de raid).
Zelfde foutcode.
Op beide servers heb ik geen health waarschuwingen in het lights out management van de servers in kwestie. (iDRAC)

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Je moet de Smart data uitgebreider uit kunnen lezen dan de twee regels die je hierboven vermeldt.
Ik heb dat in dit topic al eerder voorbij zien komen, inclusief het commando dat daarvoor nodig is.

Acties:
  • 0 Henk 'm!

  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

Uit het genoemde commando zou een vergelijkbare tabel moeten komen als ook te zien is bij biertjuh? in "Check je SMART" . Die tabel bevat mogelijk de aanwijzingen of er iets mis is met de schijf.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
En het gaat om de hele Smart tabel, niet de beoordeling van de tabel met "Warning" of iets dergelijks.

Acties:
  • 0 Henk 'm!

  • Polderviking
  • Registratie: Augustus 2020
  • Laatst online: 17-09 15:19
dcm360 schreef op dinsdag 18 mei 2021 @ 13:36:
Uit het genoemde commando zou een vergelijkbare tabel moeten komen als ook te zien is bij biertjuh? in "Check je SMART" . Die tabel bevat mogelijk de aanwijzingen of er iets mis is met de schijf.
Krijg ik dus niet echt:
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.4.106-1-pve] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor: SEAGATE
Product: ST900MP0146
Revision: C003
Compliance: SPC-4
User Capacity: 900,185,481,216 bytes [900 GB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
LU is fully provisioned
Rotation Rate: 15052 rpm
Form Factor: 2.5 inches
Logical Unit id: 0x5000c500cf05661b
Serial number: WAG0XMB50000E027ARAS
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Tue May 18 16:13:18 2021 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Health Status: WARNING: ascq=0x4 [asc=b, ascq=4]

Grown defects during certification <not available>
Total blocks reassigned during format <not available>
Total new blocks reassigned <not available>
Power on minutes since format <not available>
Current Drive Temperature: 44 C
Drive Trip Temperature: 60 C

Accumulated power on time, hours:minutes 7561:34
Manufactured in week 07 of year 2020
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 10
Specified load-unload count over device lifetime: 300000
Accumulated load-unload cycles: 322
Elements in grown defect list: 0

Vendor (Seagate Cache) information
Blocks sent to initiator = 2993251240
Blocks received from initiator = 2001563872
Blocks read from cache and sent to initiator = 3373583070
Number of read and write commands whose size <= segment size = 406673149
Number of read and write commands whose size > segment size = 107419

Vendor (Seagate/Hitachi) factory information
number of hours powered up = 7561.57
number of minutes until next internal SMART test = 29

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 3142736228 0 0 3142736228 0 48006.916 0
write: 0 0 0 0 0 18650.794 0
verify: 1538620459 0 0 1538620459 0 6302.187 0

Non-medium error count: 3


[GLTSD (Global Logging Target Save Disable) set. Enable Save with '-S on']
No Self-tests have been logged
Edit: Die hogere ECC corrections schijnt normaal te zijn volgens dell:

[ Voor 4% gewijzigd door Polderviking op 18-05-2021 16:18 ]


Acties:
  • 0 Henk 'm!

  • The Executer
  • Registratie: Juli 2005
  • Laatst online: 06:40

The Executer

Lekker belangrijk!

Renault schreef op maandag 17 mei 2021 @ 23:55:
@The Executer :

Je hebt geen "communicatiefoutjes", zo heel af en toe komt er nog een goed bitje doorhéén!!! |:(
Er zit echt iets mis met je SATA-kabels en/of SATA connectoren.

Ik vermoed dat er met geen van je opslagmedia iets mis is en van een falende SATA-chip zonder aanwijsbare oorzaak (water/cola/wijn enz.) heb ik nog niet vaak gehoord.
Ook met je 2TB Samsung harddisk is helemaal niets mis: er zijn nu geen pending sectoren en er zijn nu 14 sectoren succesvol omgewisseld voor daarvoor klaar staande reservesectoren dus ook dat is goed gegaan.

In jouw plaats zou ik alle SATA-kabels vervangen door nieuwe, die zorgvuldig monteren en de komende tijd in de SMART-data van al je opslagmedia controleren of het huidige aantal CRC-fouten niet oploopt: ze worden nooit meer nul, maar zo mogen niet meer oplopen, nog niet met 1!

En controleer je bestandssysteem eens (met schijfcontrole, NIET met CHKDSK!) op al die opslagmedia: met zoveel communicatiefouten heb je grote kans dat daar flinke fouten in zitten.
Ook Windows zou ik eens een SFC/scannow gunnen vanaf de admin-commandprompt.
Zoals gisteren al aangegeven bleef de CRC-fouten na het omwisselen van kabels verder stabiel. Zojuist een compleet ander systeem er bij gepakt, schijf aangesloten en een Linux Mint live USB stickje geboot. Ook in dit systeem blijft de CRC onveranderd, dus goed teken. Tijd voor een nieuwe SATA kabel. Overigens was de vorige nieuw uit plastic gehaald. Schijnbaar een maandagochtend modelletje. In het andere systeem blijft de Seek error rate echter nog steeds oplopen. Het verschil in onderstaande screenshots is het openen van 3 mapjes (verder niets, zonder thumbnails daarin oid).

Afbeeldingslocatie: https://tweakers.net/i/6dnEvm3eJvkbcdPlKruNiGtzdUo=/234x176/filters:strip_exif()/f/image/K6cCDPVVsijFNgsplfOMFYgQ.png?f=fotoalbum_medium Afbeeldingslocatie: https://tweakers.net/i/uv8_oYKh-7OU9s4d4XELE6mqZKM=/234x176/filters:strip_exif()/f/image/ipQFzD1SuDieOTY9qV0LDQJ7.png?f=fotoalbum_medium

Mijn zorgen over de Seek Error rate komt overigens door de volgende tekst bij Acronis:
Seek Error Rate S.M.A.R.T. parameter indicates a rate of seek errors of the magnetic heads. In case of a failure in the mechanical positioning system, a servo damage or a thermal widening of the hard disk, seek errors arise.
Bron: https://kb.acronis.com/content/9107

[ Voor 7% gewijzigd door The Executer op 18-05-2021 16:25 ]

"We don't make mistakes; we just have happy accidents" - Bob Ross


Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
dcm360 schreef op dinsdag 18 mei 2021 @ 11:31:
[...]
G-Sense_Error_Rate is een rate, niet een count.
Ik zie niet in wat dat uitmaakt als ik duidelijk wil maken dat de schijf externe schokken heeft ondervonden. Een schijf laten stuiteren is ook wat anders dan een schop tegen de systeemkast, terwijl de schijf data aan het leven/schijven is.

Acties:
  • 0 Henk 'm!

  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

epias schreef op dinsdag 18 mei 2021 @ 21:40:
[...]
Ik zie niet in wat dat uitmaakt als ik duidelijk wil maken dat de schijf externe schokken heeft ondervonden. Een schijf laten stuiteren is ook wat anders dan een schop tegen de systeemkast, terwijl de schijf data aan het leven/schijven is.
Het punt is dat het een actuele waarde is (met onbekende schaal), en geen indicatie over het verleden van de schijf geeft. Als een schijf daadwerkelijk een te grote impact gemeten heeft, zou het wel op failed moeten staan. In dit geval is de schijf van mening dat het een prima waarde is, want de genormaliseerde waarde staat nog op 100.

Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
dcm360 schreef op dinsdag 18 mei 2021 @ 22:18:
[...]
Het punt is dat het een actuele waarde is (met onbekende schaal), en geen indicatie over het verleden van de schijf geeft. Als een schijf daadwerkelijk een te grote impact gemeten heeft, zou het wel op failed moeten staan. In dit geval is de schijf van mening dat het een prima waarde is, want de genormaliseerde waarde staat nog op 100.
Deze waarde geeft wel degelijk een indicatie over het verleden. Het zijn het aantal geregistreerde fouten ten gevolge van een schok. Het aantal wordt ook niet meer minder. Ik zie niet in wat hier zo moeilijk aan is. Of het een grote of kleine schok is, wordt niet geregistreerd.

Met de genormaliseerde waarde heb ik nooit iets gedaan, die gaat pas bewegen als het al veel te laat is...

Acties:
  • 0 Henk 'm!

  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

epias schreef op dinsdag 18 mei 2021 @ 22:52:
[...]
Deze waarde geeft wel degelijk een indicatie over het verleden. Het zijn het aantal geregistreerde fouten ten gevolge van een schok. Het aantal wordt ook niet meer minder. Ik zie niet in wat hier zo moeilijk aan is. Of het een grote of kleine schok is, wordt niet geregistreerd.

Met de genormaliseerde waarde heb ik nooit iets gedaan, die gaat pas bewegen als het al veel te laat is...
Nogmaals, het is een rate, niet een count, hiervan begrijp ik dan weer niet wat er zo moeilijk aan is. Het is niet een blijvend oplopende waarde. Ik heb hier schijven die wel met aardige trillingsdemping gemonteerd zijn, en bij die schijven is de waarde lager dan bij de schijven die net wat matiger gemonteerd zijn. Ook geinig: bij net gestarte schijven is de waarde hoger, na even idle staat de waarde later weer op 0.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
@The Executer :
CRC-fouten worden geregistreerd als ergens tussen de SATA-controller op het moederbord en de SATA-controller op de printplaat van de harddisk iets voorvalt waardoor de berekende checksum (Paritybit) van het byte niet meer klopt. Je kunt zelf beredeneren wat daar allemaal tussen zit, zelfs een haperende soldeerverbinding van de SATA-chip kan zo'n error veroorzaken.
Jouw uitdaging is om zo'n situatie te creëren dat het aantal CRC-fouten verder voor geen van je opslagmedia optreedt.

En als je pakweg 30 of 100 pagina's in dit topic terugkijkt naar diverse zeer hoge waarden voor de Seek Error Rate, zul je zien dat dat een waarde is die door de firmware van het opslagmedium (harddisk/SSD) wordt gemanaged: hij leidt wel tot vertraging (wegens her-uitlezen bij uitlees-falen), maar niet tot degeneratie/falen van je opslagmedium zelf. Ik kan dat niet goed onderbouwen, maar het is een ervaringsfeit van de laatste pakweg minimaal 30 pagina's hier. Oftewel: een hoge Seek error Rate kan ongemerkt voorkomen, of performanceproblemen geven, maar het is geen indicatie voor onbetrouwbare dataopslag.
Een vermoeden wat ik zelf heb is dat het wordt veroorzaakt door onnauwkeurige postionering van de leesarm door slijtage, trillingen of andere oorzaken.

Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
dcm360 schreef op dinsdag 18 mei 2021 @ 23:14:
[...]
Nogmaals, het is een rate, niet een count, hiervan begrijp ik dan weer niet wat er zo moeilijk aan is.
Deze waarde gaat niet naar 0 bij een Seagate HD203WI en daar hebben we het hier over. Ook bij mijn andere Seagate schijven blijft deze waarde alleen maar toenemen. Ik heb een historie van 10 jaar aan smart-gegevens.

Als het bij jou zo is, prima! Ik ga toch echt op mijn eigen bevindingen af.

Acties:
  • 0 Henk 'm!

  • dcm360
  • Registratie: December 2006
  • Niet online

dcm360

Moderator Discord

HD7767 powered

epias schreef op dinsdag 18 mei 2021 @ 23:47:
[...]
Deze waarde gaat niet naar 0 bij een Seagate HD203WI en daar hebben we het hier over. Ook bij mijn andere Seagate schijven blijft deze waarde alleen maar toenemen. Ik heb een historie van 10 jaar aan smart-gegevens.

Als het bij jou zo is, prima! Ik ga toch echt op mijn eigen bevindingen af.
Ook prima. De genoemde schijf is overigens een Samsung ;)

Acties:
  • 0 Henk 'm!

  • epias
  • Registratie: Februari 2001
  • Niet online
dcm360 schreef op dinsdag 18 mei 2021 @ 23:48:
[...]
Ook prima. De genoemde schijf is overigens een Samsung ;)
Dat moet inderdaad Samsung zijn. Die andere schijven zijn Seagate en Toshiba. Ben wel benieuwd bij welk type schijf de G-Sense_Error_Rate weer minder wordt.

Acties:
  • +1 Henk 'm!

  • mrmrmr
  • Registratie: April 2007
  • Niet online
Renault schreef op dinsdag 18 mei 2021 @ 23:24:
En als je pakweg 30 of 100 pagina's in dit topic terugkijkt naar diverse zeer hoge waarden voor de Seek Error Rate, zul je zien dat dat een waarde is die door de firmware van het opslagmedium (harddisk/SSD) wordt gemanaged: hij leidt wel tot vertraging (wegens her-uitlezen bij uitlees-falen), maar niet tot degeneratie/falen van je opslagmedium zelf. Ik kan dat niet goed onderbouwen, maar het is een ervaringsfeit van de laatste pakweg minimaal 30 pagina's hier. Oftewel: een hoge Seek error Rate kan ongemerkt voorkomen, of performanceproblemen geven, maar het is geen indicatie voor onbetrouwbare dataopslag.
Een vermoeden wat ik zelf heb is dat het wordt veroorzaakt door onnauwkeurige postionering van de leesarm door slijtage, trillingen of andere oorzaken.
Hieraan wil ik het volgende toevoegen:
Alle gangbare hard disks bevatten sinds oudsher fouten. Met name in de jaren '80 met MFM schijven konden die nog handmatig worden gemaakt door de gebruiker en je kon zelfs een lijst zien van de als niet bruikbaar gemarkeerde sectoren (bad sectors). Na ontwikkelingen in firmware verplaatste het herstel zich naar de firmware. Fabrikanten hebben de volledige controle over SMART. Bijvoorbeeld Seagate laat weinig nuttigs zien via SMART, ook als er wel degelijk iets gaande is. Dat is duidelijk herkenbaar aan de trage of haperende werking en ook door geluid (kliks: actuator met magnetische aansturing). Andere fabrikanten laten wat meer zien.

Ook nu nog is de verwachting van de consument vaak dat schijven perfect worden geleverd, maar dat is niet het geval. In de fabriek al worden slechte plekken (of een hele zijde van een schijf) overgeslagen en er komen meer slechte plekken bij die gaandeweg worden gemanaged door de firmware. Dat is een reden waarom een schijf niet zomaar hoeft te worden afgeschreven, voor een klein jaarlijks percentage soms weer wel. Het is de aard van het beestje.

Nu zijn 4 of 8TB SATA Samsung SSD's beschikbaar en ik adviseer momenteel om de volgende stap te nemen en die te gebruiken als vervanging voor mechanische schijven. Goed voor het energieverbruik en ze hebben voor een groot deel niet de problemen die mechanische hard disks kenmerken.

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Mee eens, zij het dat je data op SSD's wat beter preventief moet managen (bv. via Smart, goede antivirusscans en schijfcontroles), omdat data op SSD's minder eenvoudig/goed/goedkoop is te recoveren bij problemen.

Acties:
  • 0 Henk 'm!

  • The Executer
  • Registratie: Juli 2005
  • Laatst online: 06:40

The Executer

Lekker belangrijk!

Renault schreef op dinsdag 18 mei 2021 @ 23:24:
@The Executer :
En als je pakweg 30 of 100 pagina's in dit topic terugkijkt naar diverse zeer hoge waarden voor de Seek Error Rate, zul je zien dat dat een waarde is die door de firmware van het opslagmedium (harddisk/SSD) wordt gemanaged: hij leidt wel tot vertraging (wegens her-uitlezen bij uitlees-falen), maar niet tot degeneratie/falen van je opslagmedium zelf. Ik kan dat niet goed onderbouwen, maar het is een ervaringsfeit van de laatste pakweg minimaal 30 pagina's hier. Oftewel: een hoge Seek error Rate kan ongemerkt voorkomen, of performanceproblemen geven, maar het is geen indicatie voor onbetrouwbare dataopslag.
Een vermoeden wat ik zelf heb is dat het wordt veroorzaakt door onnauwkeurige postionering van de leesarm door slijtage, trillingen of andere oorzaken.
Nou, dan heb ik bij deze nieuws, helaas geen goed nieuws: de HDD is inmiddels overleden. Vanmiddag zette ik de pc aan, waarbij de schijf niets anders meer doet dan tikken. Al met al geen kans/tijd gehad data er af te krijgen. Ga vanavond nog wat proberen, maar deze is rijk voor de kliko. Voor mij is een hoge SER dus zeker een teken dat een schijf op (zeer) korte termijn wel eens de geest kan gaan hebben

"We don't make mistakes; we just have happy accidents" - Bob Ross


Acties:
  • 0 Henk 'm!

  • Maulet
  • Registratie: September 2020
  • Laatst online: 18-09 12:49
Fantastisch thema, bravo voor @Verwijderd
Gisteren nieuwe schijf erin, en gegoogled en niet de beste hulp gevonden om SMART te interpreteren. Nu hier direct wat ik nodig had gevonden in het 1e bericht, om te bevestigen dat ik een splinternieuwe schijf ontvangen heb.
👌

9950x3d+4090+64DDR


Acties:
  • 0 Henk 'm!

  • Jazco2nd
  • Registratie: Augustus 2002
  • Laatst online: 18-09 15:46
Ik heb 4 Seagate 2.5" 5TB schijven (allemaal zelfde type dus, uit de Seagate Backup Plus/Portable Drive geshucked). Nu heb ik de luxe dat ik 1 schijf uit het systeem kan halen: simpelweg niet nodig. Die kan ik evt terug in zijn USB behuizing zetten.

De vraag is welke?
De resterende 3 schijven zullen gebruikt worden voor: 1) snapraid parity file, 2) btrfs backup disk (met btrfs send/receive de btrfs subvolumes syncen nachtelijk), 3) "overloop disk" (via MergerFS gepooled) voor als mijn downloads SSD of de SSD met persoonlijke mappen (documenten, fotoalbums, filmpjes etc) vollopen, dat gebeurd niet gauw, dus deze schijf zal voorlopig leeg blijven.

Dit is mijn oudste schijf: 1jr.
Dit is mijn huidige Snapraid parity file disk (de enige ext4 formatted disk).
Ik overweeg deze te kiezen voor verwijderen omdat hij tikt als hij wakker wordt/upspint 3-5 keer, maar dat schijnt normaal te zijn voor deze Seagate schijven, alle 5TB 2.5" Seagate schijven die ik heb gehad doen dit op een gegeven moment (kwestie van maanden) wel.
Ik vermoed dat zeker 1 van de overige 3 schijven hetzelfde gedrag vertoond, af en toe. Onmogelijk te bepalen welke het is.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   079   064   006    Pre-fail  Always       -       85932640
  3 Spin_Up_Time            0x0003   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       232
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   068   060   045    Pre-fail  Always       -       6947212
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       3377 (78 128 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       50
183 SATA_Downshift_Count    0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   066   048   040    Old_age   Always       -       34 (Min/Max 24/46)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       322
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1817
194 Temperature_Celsius     0x0022   034   052   000    Old_age   Always       -       34 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   079   064   000    Old_age   Always       -       85932640
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       530 (22 1 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       15332884787
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       23224196
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0
SMART Error Log Version: 1
No Errors Logged

Deze disk is gebruikt om nachtelijk backups te draaien, 4-5mnd oud:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   078   064   006    Pre-fail  Always       -       70612292
  3 Spin_Up_Time            0x0003   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       104
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   062   060   045    Pre-fail  Always       -       1492677
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       847 (98 73 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       25
183 SATA_Downshift_Count    0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   054   040    Old_age   Always       -       36 (Min/Max 24/45)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       200
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       363
194 Temperature_Celsius     0x0022   036   046   000    Old_age   Always       -       36 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   078   064   000    Old_age   Always       -       70612292
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       33 (108 147 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       3807586176
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       13622398
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0
SMART Error Log Version: 1
No Errors Logged

Deze schijf is gebruikt voor de opslag van persoonlijke gegevens, documenten, fotos etc. 6 maanden oud:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   076   064   006    Pre-fail  Always       -       43754149
  3 Spin_Up_Time            0x0003   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       465
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   073   060   045    Pre-fail  Always       -       18529656
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1607 (125 243 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       31
183 SATA_Downshift_Count    0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   048   040    Old_age   Always       -       33 (Min/Max 23/41)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       883
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2986
194 Temperature_Celsius     0x0022   033   052   000    Old_age   Always       -       33 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   076   064   000    Old_age   Always       -       43754149
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       94 (124 201 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       1990766448
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       42294263128
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0
SMART Error Log Version: 1
No Errors Logged

Deze schijf is ook gebruikt voor de opslag van persoonlijke gegevens, documenten, fotos etc. 6 maanden oud:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   078   064   006    Pre-fail  Always       -       59385948
  3 Spin_Up_Time            0x0003   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       185
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   067   060   045    Pre-fail  Always       -       5298635
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1258 (54 191 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       30
183 SATA_Downshift_Count    0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   066   041   040    Old_age   Always       -       34 (Min/Max 23/42)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       376
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       960
194 Temperature_Celsius     0x0022   034   059   000    Old_age   Always       -       34 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   078   064   000    Old_age   Always       -       59385948
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       101 (33 108 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       13256892471
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       919029760
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Ze zien er allemaal nog goed uit.
En ik neem aan dat je de "slechtste" disk zoekt, om het systeem zo betrouwbaar mogelijk te houden.
Dat in aanmerking genomen zou ik gaan voor de disk met de hoogste waarde voor 241, schijf 1 dus.
Ook omdat deze schijf afwijkend is, hij tikt namelijk.

Acties:
  • 0 Henk 'm!

  • dennis_rsb
  • Registratie: November 2011
  • Laatst online: 01:22
Ik had het met een collega erover, als je SMART aanzet in de bios/uefi hoe dat dan zit met meerdere schijven.

Ik heb ook al gegoogled, maar vaak gaan die topics uit van één schijf. Terwijl, ik en mijn broers in hun pc een SSD hebben voor Windows+progs+1 data HDD. Stel dat je SMART aanzet in de bios, geeft ie dan waarschuwingen als de HDD current pending sectors heeft, of geeft ie alleen waarschuwingen als de SSD (OS drive) niet goed is?

Ik en mijn broers checken gewoon regelmatig met crystaldiskinfo of de HDD geen current pending sectors heeft (omdat dat voor mij de enige echt belangrijke factor is, ivm mogelijk dataverlies/corruptie) en verder meerdere backups maken regelmatig. Maar als een SMART in de bios/uefi nut zou hebben, dan ben je vaak sneller op de hoogte dan als je regelmatig crystaldiskinfo moet uitlezen.

Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
De SMART-data wordt niet geregistreerd door de NAS, maar door/op de printplaat van elk opslagmedium (elke harddisk, elke SSD). De NAS leest deze wel uit en interpreteert die volgens een door de NAS-fabrikant gedefinieerd algoritme. Daaruit komt wel/niet een warning als er een afwijking in de SMART-waarden wordt gedetecteerd en je eigen aanvullende configuratie van die warnings bepaalt hoe die zichtbaar worden (bv. ook als Warning-email naar je emailadres).
Bij meerdere fysieke schijven/SSD's wordt dat dus voor elke schijf/SSD separaat bijgehouden en gemeld.

Acties:
  • 0 Henk 'm!

  • dennis_rsb
  • Registratie: November 2011
  • Laatst online: 01:22
@Renault Ik neem aan dat je reactie aan mij gericht is? Ik heb echter géén NAS. Dus ik weet niet of je reactie dan van toepassing is. Voor het geval niet helder is, ik ben dus benieuwd of de BIOS/UEFI optie voor SMART AAN geldt voor alleen de de OS disk (dikwijls SSD) of óók voor de dataschijf (dikwijls HDD). En de optionele vraag is, is dit nog wisselend per moederbord, of is dit overal hetzelfde.

Acties:
  • 0 Henk 'm!

  • Reniervdg
  • Registratie: Mei 2021
  • Laatst online: 24-06-2021
Dag allen, ik heb een externe harde schijf en deze heb ik nog niet eens zolang in gebruik, maar hij lijkt kuren te hebben. Al een enkele keer een corrupt bestand tegengekomen. Het overzetten van (foto- en film-)bestanden naar het apparaat lijkt ook steeds trager te gaan. Ik heb het programma CrystalDiskInfo gebruikt om een beeld te krijgen. Ik krijg na analyse een "Waarschuwing" m.b.t. heringedeelde sectoren: 668. De volledige output:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
 (03) TOSHIBA MQ04UBD200
----------------------------------------------------------------------------
       Enclosure : TOSHIBA External USB 3.0 USB Device (V=0480, P=0900, sa1)
           Model : TOSHIBA MQ04UBD200
        Firmware : JT000U
   Serial Number : 18S1T8FMT
       Disk Size : 2000,3 GB (8,4/137,4/2000,3/2000,3)
     Buffer Size : onbekend
     Queue Depth : 32
    # of Sectors : 3907029168
   Rotation Rate : 5400 RPM
       Interface : USB (Serial ATA)
   Major Version : ACS-3
   Minor Version : ACS-3 Revision 5
   Transfer Mode : SATA/300 | SATA/300
  Power On Hours : 1205 uren
  Power On Count : 258 keer
     Temperature : 33 C (91 F)
   Health Status : Waarschuwing
        Features : S.M.A.R.T., APM, NCQ
       APM Level : 0080h [ON]
       AAM Level : ----
    Drive Letter : D:

-- S.M.A.R.T. --------------------------------------------------------------
ID Cur Wor Thr RawValues(6) Attribute Name
01 100 100 _50 000000000000 Lees Fout Factor
02 100 100 _50 000000000000 Data Doorvoersnelheid
03 100 100 __1 000000000885 Opstart Tijd
04 100 100 __0 000000000534 Start/Stop Aantal
05 100 100 _50 00000000029C Heringedeelde Sectoren
07 100 100 _50 000000000000 Zoek Fouten Factor
08 100 100 _50 000000000000 Zoek tijd prestaties
09 _97 _97 __0 0000000004B5 Bedrijfs Uren
0A 126 100 _30 000000000000 Herstart's
0C 100 100 __0 000000000102 Power Cyclus
BF 100 100 __0 00000000001A G-Sensor Fout Factor
C0 100 100 __0 000000000007 Power-Uit Intrekken
C1 100 100 __0 0000000014BA Laden/Ontladen Cyclus
C2 100 100 __0 003300110021 Temperatuur
C4 100 100 __0 00000000029C Heringedeelde Events
C5 100 100 __0 000000000000 Huidig Wachtende Sectoren
C6 100 100 __0 000000000000 Niet Corrigeerbare Sectoren
C7 200 200 __0 000000000000 UltraDMA CRC Fouten
DC 100 100 __0 000000003030 Schijf Verschuiving
DE 100 100 __0 000000000088 Laad Uren
DF 100 100 __0 000000000000 Laden /Ontladen Opnieuw Testen
E0 100 100 __0 000000000000 Laad Wrijving
E2 100 100 __0 0000000000AE Laad 'In'-Tijd
F0 100 100 __1 000000000000 Koppen Flying Uren


Wat betekenen die heringedeelde sectoren? Valt hier iets aan te doen? Hoe krijg ik mijn externe harde schijf weer fatsoenlijk aan het werk? Of betekent dit: nieuwe kopen?

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Tja, dat grote aantal heringedeelde sectoren betekent dat de magnetische laag op de harddisk op sommige plekken slecht wordt, waardoor data op sommige sectoren iet correct uitgelezen kan worden. Zo'n sector wordt dan tig keer uitgelezen in een poging om de oorspronkelijke data terug te krijgen en daarna gemarkeerd en vervangen door een reservesector.

Zorg nu eerst voor een volledige backup van al je data.
Daarna formatteer je deze harddisk en installeer je alles opnieuw, waarna je meteen ook alle data terugzet: de gemaakte backup is dan ook meteen je backup geworden omdat je op de harddisk weer originelen hebt staan.
Zodra uit de nieuwe SMART-data blijkt dat de Heringedeelde Sectoren verder oploopt (hij wordt niet nul door het formatteren) (en idem voor C5 en C6) kijk je naar een nieuwe harddisk (of SSD).

Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
dennis_rsb schreef op donderdag 27 mei 2021 @ 00:13:
@Renault Ik neem aan dat je reactie aan mij gericht is? Ik heb echter géén NAS. Dus ik weet niet of je reactie dan van toepassing is. Voor het geval niet helder is, ik ben dus benieuwd of de BIOS/UEFI optie voor SMART AAN geldt voor alleen de de OS disk (dikwijls SSD) of óók voor de dataschijf (dikwijls HDD). En de optionele vraag is, is dit nog wisselend per moederbord, of is dit overal hetzelfde.
Ik nam aan dat je een NAS had, omdat bij meerdere schijven dáárin je vraag relevanter kon zijn dan een PC met meerdere schijven erin.
Maar ook zonder NAS geldt hetzelfde antwoord: de printplaat met firmware op elk opslagmedium (elke harddisk en SDSD apart) houdt zijn eigen SMART-statistieken bij.

Acties:
  • 0 Henk 'm!

  • dennis_rsb
  • Registratie: November 2011
  • Laatst online: 01:22
@Renault Ah zo. Oke dus de SMART monitor in de BIOS/UEFI die checkt alle schijven, dus niet enkel je OS schijf? En ik neem aan dat ie gaat piepen bij current pending sectors? Of ook al bij reallocated sectors?

edit; wow heb nu ff 2 systemen van mij gecheckt, beide zelfbouw en beide hebben geen SMART optie in de uefi. Dus niet elk moederbord ondersteund dat? Gelukkig werkt crystaldiskinfo wel op iedere Windows pc :p

[ Voor 33% gewijzigd door dennis_rsb op 28-05-2021 19:17 ]


Acties:
  • +1 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
De BIOS checkt niets: als je de SMART monitor daar aanzet, open je de mogelijkheid dat de BIOS evt. warnings vanuit de opslagmedia (harddisks/SSD's) aan je toont, meer niet.
Welke warnings via de BIOS doorkomen naar jou toe wordt bepaald door de BIOS en harddisk samen, daar is dus vooraf geen peil op te trekken. En de enige zekerheid die je hebt is dat je bij de opstart van je PC kijkt naar het BIOS-scherm, welke warnings daar mogelijk worden getoond: het piepen vanuit de BIOS is wat dat betreft óók geen zekerheid. Gewoon periodiek in Crystaldiskinfo kijken (bv. bij elk maandbegin) is een goede gewoonte.

Acties:
  • +1 Henk 'm!

  • dennis_rsb
  • Registratie: November 2011
  • Laatst online: 01:22
@Renault Ik bedoel inderdaad dat warning tonen. Maar ik heb nu al meerdere pc's bekeken, en bij lange na niet allemaal ondersteunen ze uberhaubt de optie. Dus ik ga mijn broer (die niet veel verstand van pc's heeft, maar ik geef hem soms instructies) ook niet laten veranderen. Idd crystaldiskinfo regelmatig checken, dat werkt op ieder Windows systeem tenminste. En dan weet je tenminste zeker dat je alle schijven kan zien. Vooral current pending sectors vind ik belangrijk, omdat dat de echte rode vlag is (kans op datacorruptie).

Thanks voor je advies iig !

Acties:
  • 0 Henk 'm!

  • Flying
  • Registratie: September 2003
  • Laatst online: 04:58
Vanmorgen had ik problemen met het installeren van nieuwe grafische drivers (nadat Windows update automatisch verouderde drivers erop had gezet). Dat lag aan mezelf, had lopen klooien met een GPO-instelling.

Heb uiteindelijk wel de drivers verwijderd in veilige modus met DDU. Daarna wou Windows 10 helemaal niet meer opstarten. Na een (door Windows automatisch uitgevoerde) checkdisk leek het erop dat er fouten gevonden waren en werden gerepareerd. Dat heeft mij gelukkig toch in Windows laten booten. Ik had een korte tijd terug ook dat Windows bij opstart ineens een checkdisk had opgestart uit het niets.

Zou de SSD in dit geval mogelijks de geest aan het geven zijn?

Afbeeldingslocatie: https://i.imgur.com/aHhHBKB.png

Alles ziet er hier nog oké uit, maar ik twijfel toch om deze retour te sturen. Leeftijd is nu net geen 2, garantie is 5 jaar. Mijn gevoel zegt doen. Wat denken jullie?

Acties:
  • 0 Henk 'm!

  • Renault
  • Registratie: Januari 2014
  • Laatst online: 20:32
Ik zie niets wat mis is in de Smart tabel.
Maar 2 x een Chkdsk in 8118 bedrijfsuren lijkt mij helemaal niet verkeerd: dan heb je nog geluk gehad.
Ik denk dat je geen hardwaredefect hebt in je SSD, maar een fout in je bestandssysteem.

Je tackelt dat als volgt:
- neem afscheid van CHKDSK en gebruik in het vervolg gewoon je Windows Schijfcontrole én de optie daaronder, namelijk "Optimaliseren". (Dat is onderhoud aan je bestandssysteem.)
- zet herstelpunten aan en maak regelmatig herstelpunten aan
- doe alle voorstellen eenmaal per maand, inclusief een volledige scan op virussen met een goede virusscanner (bv. de gratis versie die je provider meestal aan je ter beschikking stelt).

Acties:
  • +1 Henk 'm!

  • Flying
  • Registratie: September 2003
  • Laatst online: 04:58
Optimaliseren is gewoon trim. Dat deed hij op alle schijven automatisch, maar niet op deze. Dat is bij deze gebeurd. Scan op virussen gebeurde sowieso al frequent. Ik hou de schijf gewoon en doe sowieso eens een fresh install komende tijd.

Acties:
  • 0 Henk 'm!

  • HyperBart
  • Registratie: Maart 2006
  • Laatst online: 08:17
Vandaag kreeg ik een berichtje van mijn server dat disk nummer 2 naar FAULTED is gegaan binnen mijn ZFS Pool met 1 RAIDZ2 VDEV.

Ik kan zelf niet inschatten hoe ernstige de fout is, wie kan even mee beoordelen. Er gaat voor de rest niks mis met sectors, het lijkt mij op het eerste zicht een communicatiefout tussen disk en controller, waarbij de diskmechanica en logica goed werkt maar er iets mis loopt bij het aanleveren/communiceren van de data.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0004   128   128   054    Old_age   Offline      -       108
  3 Spin_Up_Time            0x0007   180   180   024    Pre-fail  Always       -       319 (Average 411)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       131
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0004   140   140   020    Old_age   Offline      -       15
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       4214
 10 Spin_Retry_Count        0x0012   100   100   060    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       32
 22 Unknown_Attribute       0x0023   100   100   025    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   097   097   000    Old_age   Always       -       4442
193 Load_Cycle_Count        0x0012   097   097   000    Old_age   Always       -       4442
194 Temperature_Celsius     0x0002   185   185   000    Old_age   Always       -       35 (Min/Max 22/53)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       1

SMART Error Log Version: 1
ATA Error Count: 1
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 occurred at disk power-on lifetime: 4205 hours (175 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 43 00 00 00 00 00  Error: ICRC, ABRT at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  61 00 90 18 9c a3 40 08  32d+04:03:38.908  WRITE FPDMA QUEUED
  61 40 88 58 9f a3 40 08  32d+04:03:38.907  WRITE FPDMA QUEUED
  61 40 e0 18 9f a3 40 08  32d+04:03:38.907  WRITE FPDMA QUEUED
  61 40 78 d8 9b a3 40 08  32d+04:03:38.906  WRITE FPDMA QUEUED
  61 40 d8 98 9b a3 40 08  32d+04:03:38.906  WRITE FPDMA QUEUED




Aangezien ZFS O+ heb ik nu gewoon even de pool gecleared (=de fouten clearen, dus de pool terug op orde stellen en aangeven dat de disk terug mag mee doen), dan doet de disk hopelijk toch al terug (een tijdje mee, tenzij er wat ernstigers aan de hand is maar dan zal de disk ongetwijfeld er weer uit knikkeren.


root@nas:~# zpool clear poolnaam
scan: resilvered 493M in 0 days 00:00:05 with 0 errors on Tue Jun  8 10:11:36 2021

[ Voor 14% gewijzigd door HyperBart op 14-06-2021 23:54 ]

Pagina: 1 ... 31 ... 37 Laatste