Ik heb een RAIDZ2 pool van 10 stuks 1.5TB disks, die al een paar jaar draait.
Nu heb ik de laatste tijd opeens heel veel problemen met 2 van die 10 disks, ik zie een hoop read en write errors op 2 van die 10 disks in het zpool status commando.
Met een zpool clear (en soms een reboot) is dat tot nu toe wel op te lossen geweest en alles draait dan eigenlijk weer prima.
De log van vannacht echter baart me wat meer zorgen:
pool: tank
state: DEGRADED
status: One or more devices could not be opened. Sufficient replicas exist for
the pool to continue functioning in a degraded state.
action: Attach the missing device and online it using 'zpool online'.
see: http://illumos.org/msg/ZFS-8000-2Q
scan: scrub in progress since Thu Dec 15 18:33:41 2016
7.32T scanned out of 11.2T at 392M/s, 2h52m to go
0 repaired, 65.40% done
config:
NAME STATE READ WRITE CKSUM
tank DEGRADED 0 0 0
raidz2-0 DEGRADED 0 0 0
8092002995827492606 UNAVAIL 3 6.91K 0 was /dev/label/disk5
15670923897101494583 REMOVED 0 0 0 was /dev/label/disk10
label/disk1 ONLINE 0 0 0
label/disk2 ONLINE 0 0 0
label/disk3 ONLINE 0 0 0
label/disk4 ONLINE 0 0 0
label/disk6 ONLINE 0 0 0
label/disk7 ONLINE 0 0 0
label/disk8 ONLINE 0 0 0
da11 ONLINE 0 0 0
Nu zou je zeggen dat deze twee disks gewoon kapot zijn en vervangen moeten worden.
Het vreemde/opvallende aan het verhaal is echter dat van deze pool 8 disks op een IBM-1015 kaartje aangesloten zitten en 2 disks op mijn moederboard (Supermicro X8SIL-F).
En het laat zich raden welke 2 disks de problemen geven ... dit zijn 'toevallig' de 2 disks die op het mobo zitten aangesloten.
Ik geloof echter niet zo in 'toevalligheden' dus ik vraag me af of er een andere reden zou kunnen zijn dat deze twee disks problemen geven? Mijn eigen idee was eigenlijk dat het probleem ontstaat als er op deze disks een bad sector beschreven wordt, dat om één of andere reden het mobo de disk dan uit de pool gooit (of inactief maakt of iets dergelijks). Bij herstarten wordt deze bad sector dan vervangen en dat zou dan verklaren dat het daarna weer goed werkt.
Voor ik zomaar nieuwe disks koop, wil ik graag het achterliggende probleem achterhalen, het is mij net iets
te toevallig dat de overige 8 disks in deze pool nooit problemen hebben en juist deze twee wel.
Iemand een idee?