Acties:
  • 0 Henk 'm!

  • Cruz
  • Registratie: November 1999
  • Laatst online: 22-04 21:15
Mijn 'munin' maakt de SMART informatie van verschillende harde schijven inzichtelijk. Nu heb ik geen problemen op mijn server maar toch zie ik wat raars bij de UDMA_CRC_Error_Count...

Afbeeldingslocatie: http://fi.nder.com/img/327//

Smartctl info:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
=== START OF INFORMATION SECTION ===
Model Family:     Maxtor DiamondMax Plus 9 family
Device Model:     Maxtor 6Y160P0
Serial Number:    Y44FHSHE
Firmware Version: YAR41BW0
User Capacity:    163,928,604,672 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Tue Jul 26 15:52:23 2011 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED


en

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   206   205   063    Pre-fail  Always       -       14417
  4 Start_Stop_Count        0x0032   253   253   000    Old_age   Always       -       625
  5 Reallocated_Sector_Ct   0x0033   253   253   063    Pre-fail  Always       -       1
  6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail  Offline      -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0027   252   247   187    Pre-fail  Always       -       52527
  9 Power_On_Minutes        0x0032   175   175   000    Old_age   Always       -       945h+42m
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   252   252   000    Old_age   Always       -       676
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0032   253   253   000    Old_age   Always       -       47
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   Always       -       8800
196 Reallocated_Event_Count 0x0008   252   252   000    Old_age   Offline      -       1
197 Current_Pending_Sector  0x0008   253   253   000    Old_age   Offline      -       1
198 Offline_Uncorrectable   0x0008   252   252   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0008   183   092   000    Old_age   Offline      -       105
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -       1
202 TA_Increase_Count       0x000a   253   252   000    Old_age   Always       -       0
203 Run_Out_Cancel          0x000b   253   252   180    Pre-fail  Always       -       0
204 Shock_Count_Write_Opern 0x000a   253   252   000    Old_age   Always       -       0
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   Always       -       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   Always       -       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   Always       -       0
209 Offline_Seek_Performnce 0x0024   192   192   000    Old_age   Offline      -       0
 99 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0
100 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0
101 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0


Volgens wat ik op google wist te vinden is het een communicatieprobleem tussen de harddisk en het moederbord. Maar deze 'storing' bestaat al bijna een jaar - en de vorm van de grafiek is nogal bizar. Een overflow van de counter zou imo ervoor zorgen dat hij daarna op 0 staat en weer oploopt... Het enige wat ik kan bedenken is dat de storing continue is en de SMART-waarde een logaritmische schaal heeft, die op ~94 begint.

Iemand tips of goede inzichten?

Acties:
  • 0 Henk 'm!

Anoniem: 292340

Probeer eens eens een andere kabel, grote kans dat je van het probleem af bent (mits deze ook defect is natuurlijk). ;)

Acties:
  • 0 Henk 'm!

Anoniem: 52211

Cruz schreef op zondag 07 augustus 2011 @ 13:55:
de vorm van de grafiek is nogal bizar.
Ik vermoed dat de SMART waarde berekend wordt door het aantal CRC fouten uit te middelen over de bedrijfsduur? Als er eens een aantal fouten optreden neemt de grafiek een duik, en de smart waarde herstelt zich dan langzaam tijdens een lange periode waarin er geen fouten zijn (totaal aantal fouten blijft gelijk, maar bedrijfsduur loopt langzaam op)?

Acties:
  • 0 Henk 'm!

  • Cruz
  • Registratie: November 1999
  • Laatst online: 22-04 21:15
Er waren 2 (dezelfde) schijven op dezelfde (PATA) kabel aangesloten. Heb de andere schijf losgekoppeld en het probleem is verholpen - de CRC error count blijft nu steeds dezelfde waarde houden :)