De benchmark draait nog. Ik weet niet hoe jij rekent, maar hij is nu al ruim 5 uur bezig met één disk (~95MB/s).
De fouten voor sda is nog niet opgelopen. Is het verstandig om straks eerst sdd te testen, aangezien dat de disk met de meeste problemen is?
Voor wat betreft de partities. Ik heb op alle disks één Linux RAID partitie gemaakt van 2000GB groot. De mdadm array is met die 4 partities opgebouwd.
Edit; Wanneer ik de benchmark voor de 4e (sdd) schijf start krijg ik meteen smart-fouten voor die disk.
De snelheden zijn ook niet om over naar huis te schrijven
hemy@hemy-server:~$ sudo dd if=/dev/sdd of=/dev/null bs=1M
[sudo] password for hemy:
2+0 records in
1+0 records out
1048576 bytes (1.0 MB) copied, 55.2864 s, 19.0 kB/s
3+0 records in
2+0 records out
2097152 bytes (2.1 MB) copied, 91.2698 s, 23.0 kB/s
5+0 records in
4+0 records out
4194304 bytes (4.2 MB) copied, 168.592 s, 24.9 kB/s
Ook het uitlezen van die schijf duurt ook veel langer dan de andere 3 goede disks. Daarnaast heeft tot nu toe ieder gelezen blok van de disk een UDMA_CRC_Error_Count getriggerd.
emy@hemy-server:~$ sudo ./smart.sh
Mon Nov 25 21:29:34 CET 2013
sda
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 189
sdb
197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x0036 099 099 000 Old_age Always - 791
sdc
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
sdd
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x0032 199 199 000 Old_age Always - 163
dmesg geeft telkens de volgende (fout)meldingen
Nov 25 21:31:08 hemy-server kernel: [33856.209157] ata4.00: exception Emask 0x50 SAct 0x1 SErr 0x280900 action 0x6 frozen
Nov 25 21:31:08 hemy-server kernel: [33856.209163] ata4.00: irq_stat 0x08000000, interface fatal error
Nov 25 21:31:08 hemy-server kernel: [33856.209168] ata4: SError: { UnrecovData HostInt 10B8B BadCRC }
Nov 25 21:31:08 hemy-server kernel: [33856.209174] ata4.00: failed command: READ FPDMA QUEUED
Nov 25 21:31:08 hemy-server kernel: [33856.209182] ata4.00: cmd 60/08:00:e8:3f:00/00:00:00:00:00/40 tag 0 ncq 4096 in
Nov 25 21:31:08 hemy-server kernel: [33856.209184] res 40/00:04:e8:3f:00/00:00:00:00:00/40 Emask 0x50 (ATA bus error)
Nov 25 21:31:08 hemy-server kernel: [33856.209188] ata4.00: status: { DRDY }
Nov 25 21:31:08 hemy-server kernel: [33856.209195] ata4: hard resetting link
Nov 25 21:31:09 hemy-server kernel: [33856.700032] ata4: softreset failed (device not ready)
Nov 25 21:31:09 hemy-server kernel: [33856.700040] ata4: applying PMP SRST workaround and retrying
Nov 25 21:31:09 hemy-server kernel: [33856.872049] ata4: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
Nov 25 21:31:09 hemy-server kernel: [33856.887243] ata4.00: configured for UDMA/33
Nov 25 21:31:09 hemy-server kernel: [33856.900038] ata4: EH complete
Dit gebeurt alleen voor sdd, de andere disk, waarvan de benchmark nog steeds draait (sda) geeft geen fouten.
Een summiere zoektocht op teh interwebz geeft me de volgende mogelijkheden:
The presence of BadCRC is a pretty good indicator of a poor quality SATA cable. However, if a better cable does not solve the issue, then it is probably a power problem (loose power cable or backplane connection, poor connectors, poor power splitter, overloaded power supply, too many drives on power rail, bad power supply, etc).
Aan SATA-kabels heb ik gelukkig geen gebrek. Hoe herken ik "goede" SATA-kabels?
Edit 2364: Dat zou trouwens ook wel DE verklaring zijn waarom mijn PC nooit problemen heeft gehad met RAID en de OS disk van mijn server al 24/7 365 5 jaar lang retestabiel draait.
Daarin zitten namelijk (zie ik zojuist) allemaal dezelfde SATA-kabels.
Ik heb nu alleen voor de sdd de SATA-kabel vervangen met een "goede" kabel zoals ze ook aan mijn PC en de OS disk van mijn server zitten.
FUUUUUUUUUUUUUUUUUUUU, na het vervangen van de SATA-kabel gaat het dd-en van de sdd ook superstrak. De snelheid komt overeen met de sda-test van vanmiddag.
De smart-fouten lopen niet meer op.
Zou echt al mijn voorgaande RAID-problemen te wijten zijn geweest aan een 4-tal lullige SATA-kabels?
Woeps, mdadm bleek uit zichzelf weer begonnen te zijnen met het syncen van de disks
De
probleem-kabel die ik eruit heb gehaald heeft als opdruk:
LIAN FENG E209329 serial ATA 26AWG AWM 21149 30V 80°C FT1 FT2 -F-
De
goede kabel heeft helaas geen opdruk, maar ik heb er in totaal 6 van. 3 in mijn PC. 1 in mijn server aan de OS-disk en ééntje aan de sdd. Volgens mij zaten ze bij een van mijn eerste gigabyte-moederborden.
Hoe kan ik op een veilige manier uitvinden welke van de kabels goed is? Zo heb ik flexibele en stugge kabels, met en zonder lipje, gehoekt en met een bocht. Linksom en rechtsom.
[
Voor 119% gewijzigd door
Matis op 25-11-2013 22:12
]