SATA errors

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
Sinds een aantal dagen heb ik problemen met mijn Ubuntu Server box.

OS: Ubuntu Server 10.04
MB: VIA EPIA 1200EN
sda: WD 250GB / en /home
sdb: WD 500GB /data

Het begon met een aantal vreemde errors. Directories die niet meer te zien waren en zeer lage throughputs op m'n sdb disk. Later op de dag was de hele schijf niet eens meer te zien en zaten m'n logs vol met errors.

Na het een en ander te hebben geprobeerd kwam ik tot de conclusie dat de schijf overleden was. De WD SMART tool zag de hele schijf niet en verschillende Live CD's gaven aan dat alle ext4 superblocks corrupt waren. Mijn conclusie: sdb is dood.

Nieuwe WD Green Caviar 1,5TB EARS gekocht en Ubuntu Server meteen maar opnieuw geinstalleerd.

Omdat er nogal wat data op m'n 500GB HD probeerde ik toch nog een keer de schijf te lezen en verrek; alle data is opeens weer te lezen! Meteen alles gekopierd naar m'n nieuwe HD. Wel vreemd overigens dat de WD SMART tool de schijf nogsteeds niet ziet.

Nieuwe setup:
sda: WD 250GB / en /home
sdb: WD 1,5TB /data

Het probleem is nu; tijdens het kopieren van data van sdb naar sda krijg ik een hele zooi errors, en wel:

code:
1
2
3
4
5
6
7
8
9
10
Sep  5 19:44:24 EPIA kernel: [ 2555.122961] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Sep  5 19:44:24 EPIA kernel: [ 2555.123266] ata4.00: BMDMA stat 0x25
Sep  5 19:44:24 EPIA kernel: [ 2555.123491] ata4.00: failed command: READ DMA
Sep  5 19:44:24 EPIA kernel: [ 2555.123739] ata4.00: cmd c8/00:00:c0:15:e1/00:00:00:00:00/e0 tag 0 dma 131072 in
Sep  5 19:44:24 EPIA kernel: [ 2555.123744]          res 51/84:5f:c0:15:e1/00:00:00:00:00/e0 Emask 0x10 (ATA bus error)
Sep  5 19:44:24 EPIA kernel: [ 2555.124423] ata4.00: status: { DRDY ERR }
Sep  5 19:44:24 EPIA kernel: [ 2555.124649] ata4.00: error: { ICRC ABRT }
Sep  5 19:44:24 EPIA kernel: [ 2555.124895] ata4: soft resetting link
Sep  5 19:44:24 EPIA kernel: [ 2555.297225] ata4.00: configured for UDMA/33
Sep  5 19:44:24 EPIA kernel: [ 2555.297225] ata4: EH complete


Dit gebeurt dus enkel tijdens het kopieren van sdb naar sda. Elke andere combinatie geeft geen errors.

Daarnaast geeft de nieuwe 1,5TB schrijf al SMART errors met smartctl.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
Error 2 occurred at disk power-on lifetime: 9 hours (0 days + 9 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 01 30 4f c2 e0  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b0 d6 01 be 4f c2 e0 02      00:04:55.204  SMART WRITE LOG
  b0 da 01 00 4f c2 e0 02      00:04:55.119  SMART RETURN STATUS
  80 44 00 00 44 57 e0 02      00:04:55.119  [VENDOR SPECIFIC]
  b0 d6 01 be 4f c2 e0 02      00:04:54.643  SMART WRITE LOG
  80 45 00 00 44 57 e0 02      00:04:54.643  [VENDOR SPECIFIC]

Error 1 occurred at disk power-on lifetime: 9 hours (0 days + 9 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 01 30 4f c2 a0  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b0 d6 01 be 4f c2 a0 02      00:00:50.573  SMART WRITE LOG
  b0 da 01 00 4f c2 a0 02      00:00:50.489  SMART RETURN STATUS
  80 44 00 00 44 57 a0 02      00:00:50.489  [VENDOR SPECIFIC]
  b0 d6 01 be 4f c2 a0 02      00:00:50.473  SMART WRITE LOG
  80 45 00 01 44 57 a0 02      00:00:50.473  [VENDOR SPECIFIC]


Wat is heb gedaan:
- Nieuwe SATA kabels
- Ubuntu Server opnieuw geinstalleerd
- Rot gezocht op Google
- Voeding gemeten
- Beide HD's gechecked met de WD SMART tool (extended tests)

Waar moet ik dit zoeken? Ik begin het vermoeden te krijgen dat het moederbord mogelijk aan het overlijden is.

Iemand?

Acties:
  • 0 Henk 'm!

  • GraveR
  • Registratie: Januari 2000
  • Laatst online: 22-08 19:26
Lijkt me op een compatibiliteitsprobleempje tussen de 'oude' 250GB schijf en (gezien je de bekabeling al hebt uitgesloten) de controller op het moederbord, gezien de foutmelding (ICRC error en ATA bus-error) en het feit dat hij overschakelt naar UDMA/33.

Is het een oude SATA-150-only schijf die je aan een SATA-300 controller hangt?

Acties:
  • 0 Henk 'm!

  • M2M
  • Registratie: Juli 2006
  • Laatst online: 23:24

M2M

medicijnman

ik heb ooit een VIA epia 12000 EN in mijn bezit gehad. Ik kreeg daar ook constant foutmeldingen van de harde schijf. Nu bleek dat de harde schijf niet het probleem was, maar de controller / chipset op het moederbord. Later een PCI kaartje met sata poorten toegevoegd, maar ook hier problemen. Het OS was weliswaar windows xp, maar het kan zijn dat ergens iets van incompatabiliteit in zit.

edit: wat je dus kunt doen, is een tweede systeem er bij pakken om de schijven te testen. Draai gelijk even memtest 86 op je via systeem (twee maal, want als er fouten zitten in de southbridge / sata controller, kan het ook wel zijn dat het memtest programma corrupt geladen wordt)

[ Voor 28% gewijzigd door M2M op 06-09-2010 08:59 ]

-_-


Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
GraveR schreef op maandag 06 september 2010 @ 08:47:
Lijkt me op een compatibiliteitsprobleempje tussen de 'oude' 250GB schijf en (gezien je de bekabeling al hebt uitgesloten) de controller op het moederbord, gezien de foutmelding (ICRC error en ATA bus-error) en het feit dat hij overschakelt naar UDMA/33.

Is het een oude SATA-150-only schijf die je aan een SATA-300 controller hangt?
Beide drives zijn SATA-300. Ik ben er achter gekomen dat het bord zelf maar SATA-150 support. Opzich zou dit wel het een en ander kunnen verklaren. Aan de andere kant zou ik al eerder problemen moeten hebben gehad lijkt mij. De vorige config bestond ook uit 2 SATA-300 schijven. Dit werkte zonder problemen.

Ik kan proberen beide schijven te forceren naar SATA-150 dmv een jumper.
M2M schreef op maandag 06 september 2010 @ 08:53:
ik heb ooit een VIA epia 12000 EN in mijn bezit gehad. Ik kreeg daar ook constant foutmeldingen van de harde schijf. Nu bleek dat de harde schijf niet het probleem was, maar de controller / chipset op het moederbord. Later een PCI kaartje met sata poorten toegevoegd, maar ook hier problemen. Het OS was weliswaar windows xp, maar het kan zijn dat ergens iets van incompatabiliteit in zit.

edit: wat je dus kunt doen, is een tweede systeem er bij pakken om de schijven te testen. Draai gelijk even memtest 86 op je via systeem (twee maal, want als er fouten zitten in de southbridge / sata controller, kan het ook wel zijn dat het memtest programma corrupt geladen wordt)
Ik zal hier eens naar kijken. Heb je nu een ander EPIA bordje? Of een andere low power oplossing voor een home server?

Acties:
  • 0 Henk 'm!

  • GraveR
  • Registratie: Januari 2000
  • Laatst online: 22-08 19:26
Lawrentium schreef op maandag 06 september 2010 @ 09:54:
[...]

Beide drives zijn SATA-300. Ik ben er achter gekomen dat het bord zelf maar SATA-150 support. Opzich zou dit wel het een en ander kunnen verklaren. Aan de andere kant zou ik al eerder problemen moeten hebben gehad lijkt mij. De vorige config bestond ook uit 2 SATA-300 schijven. Dit werkte zonder problemen.

Ik kan proberen beide schijven te forceren naar SATA-150 dmv een jumper.
Dat is inderdaad het proberen waard. Ik ken ook een geval met een SATA-300 WD250GB schijf die niet werkte op een VIA-chipset in SATA-300-mode (handshake/identificatie liep fout), SATA-150 was dan geen enkel probleem.

Acties:
  • 0 Henk 'm!

  • M2M
  • Registratie: Juli 2006
  • Laatst online: 23:24

M2M

medicijnman

Lawrentium schreef op maandag 06 september 2010 @ 09:54:
Ik zal hier eens naar kijken. Heb je nu een ander EPIA bordje? Of een andere low power oplossing voor een home server?
na een week of twee prutsen ben ik overgestapt op een atom. Ik vond de via CPU toch eigenlijk al niet krachtig genoeg. cq. niet vooruit te branden. Maar misschien dat het met een lichte variant van linux wel goed werkbaar is :)

-_-


Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
M2M schreef op maandag 06 september 2010 @ 08:53:
edit: wat je dus kunt doen, is een tweede systeem er bij pakken om de schijven te testen. Draai gelijk even memtest 86 op je via systeem (twee maal, want als er fouten zitten in de southbridge / sata controller, kan het ook wel zijn dat het memtest programma corrupt geladen wordt)
Inmiddels het bordje getest met 7 Memtest passes. Resultaat 0 errors.

Ik zal vanavond de jumpers proberen om de schijven te forceren in SATA-150 mode.

Acties:
  • 0 Henk 'm!

  • M2M
  • Registratie: Juli 2006
  • Laatst online: 23:24

M2M

medicijnman

ik denk inderdaad dat je de schijven moet forceren op SATA 150. ik heb nog eens wat rondgesurft en ben verschillende (oa deze) websites tegengekomen waar jouw southbridge chipset (vt8237R (plus)) op vermeld staat, met compatabiliteitsproblemen met SATA 300 schijven.

-_-


Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
M2M schreef op dinsdag 07 september 2010 @ 15:43:
ik denk inderdaad dat je de schijven moet forceren op SATA 150. ik heb nog eens wat rondgesurft en ben verschillende (oa deze) websites tegengekomen waar jouw southbridge chipset (vt8237R (plus)) op vermeld staat, met compatabiliteitsproblemen met SATA 300 schijven.
Vandaag heb ik beide schijven geforceerd in SATA 150 mode. Het helpt echter niets. Ik blijf problemen ondervinden op het moment dat ik bestanden kopieer van de 1,5TB schijf naar de 250GB schijf.

Ik ga later vanavond een andere boot schijf proberen. Kijken of het aan de 250GB schijf ligt.

Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
Na nog het een en ander getest te hebben met een aantal andere harde schijven ben ik tot de conclusie gekomen dat het probleem iig bij de 1,5TB schijf ligt.

Vandaag een vervangend exemplaar gehaald maar ook deze vertoont dezelfde errors. Waarschijnlijk zijn deze HD en chipset (VIA VT8237R Plus) gewoon niet compatible.

Acties:
  • 0 Henk 'm!

  • M2M
  • Registratie: Juli 2006
  • Laatst online: 23:24

M2M

medicijnman

Vreemd, maar er zijn wel meer vage dingen met (oude) VIA chips. dus wordt het of op zoek naar een alternatieve plank, of een SATA kaartje, of kleinere schijven gebruiken.

-_-


Acties:
  • 0 Henk 'm!

  • Lawrentium
  • Registratie: Oktober 2005
  • Laatst online: 16-01 22:36
M2M schreef op woensdag 08 september 2010 @ 14:22:
Vreemd, maar er zijn wel meer vage dingen met (oude) VIA chips. dus wordt het of op zoek naar een alternatieve plank, of een SATA kaartje, of kleinere schijven gebruiken.
Inderdaad erg vreemd, maar niets aan te doen... Ik kan het nog proberen met een 1,5TB Samsung schijf, maar dan moet ik weer terug naar de winkel etc etc. Op dit moment ben ik de boel aan het installeren op een oude AMD 64 4000+ die ik nog had liggen. 'T lijkt er op dat ie headless maar ongeveer 25 Watt meer verbruikt dan het VIA plankje. Best netjes moet ik zeggen!

Acties:
  • 0 Henk 'm!

  • Big Mama
  • Registratie: Mei 2000
  • Laatst online: 19:08
Kun je die disk niet in een USB-behuizing stoppen? Als dan de problemen nog steeds optreden ligt het i.i.g. niet aan de SATA-interface van de Via chipset.

Computers follow your orders, not your intentions.

Pagina: 1