Goed, ik heb een vervelend probleem met mijn (software) raid onder linux (debian).
The facts:
* Server (duron 1300, k7s41gx asrock)
* Ik heb op een apart SATAkaartje (zit niet op het moederbord) twee 320 gig (WD) schijven hangen.(/dev/sd[ab])
* Daarop heb ik (per schijf) 1 linux raid partitie zitten (/dev/sd[ab]1).
* Deze had ik met mdadm als /dev/md0 draaien, (raid1 / mirrored).
* er staat een ext3 partitie op die /dev/md0 (en dus ook op de 2 /dev/sd schijven
)
na een nieuwe installatie die vervelend genoeg nodig was om andere redenen, ging ik mijn raid weer builden. hiervoor gebruikte ik het volgende commando:
Dit is to the best of my knowledge correct, en in ieder geval is dit de methode waar het de vorige keer prima mee ging. nu echter niet
so far so good. Nu gaat ie dus syncen. het enige wat ik zo niet kan plaatsten is de nonpersistent superblock melding. is dat iets om me zorgen over te maken?
elkeweg, na een poosje syncen:
De /proc/mdstat laat daarna duidelijk zien dat er niets meer gebeurd. (tijd gaat alleen maar omhoog, snelheid naar beneden en hij komt niet verder dan het aantal blocks waar de fout optreedt).
tries:
* reboot, nog een keer proberen. hij blijft dan op een ander punt (eens op 44% en eens op 6%) steken.
* reboot, de schijven 'los' mounten. dit werkt like charm (mount /dev/sda1 /root/test) . Ik kan er ook van lezen etc. hetzelfde voor sdb1, waar evenveel op staat. de schijven lijken prima dus, en ik heb verder ook geen reden aan te nemen dat er iets mis mee is.
wat ik verder nog kan doen is de schijven gaan testen (heb wel een bootdisk met tools etc) op fouten, maar ik ben bang dat ik gewoon iets raars doe met mdadm. klopt dat hele verhaal met die superblocks etc wel? doe ik nou gewoon iets doms bij mijn raid? Als iemand wat steun kan geven, gaarne
edit: voor de zekerheid: forum search gedaan op die ata2 timeout regel, de snese key medium error (iets met tapes
) en mdadm algemeen. just in case ;D
The facts:
* Server (duron 1300, k7s41gx asrock)
* Ik heb op een apart SATAkaartje (zit niet op het moederbord) twee 320 gig (WD) schijven hangen.(/dev/sd[ab])
* Daarop heb ik (per schijf) 1 linux raid partitie zitten (/dev/sd[ab]1).
* Deze had ik met mdadm als /dev/md0 draaien, (raid1 / mirrored).
* er staat een ext3 partitie op die /dev/md0 (en dus ook op de 2 /dev/sd schijven
na een nieuwe installatie die vervelend genoeg nodig was om andere redenen, ging ik mijn raid weer builden. hiervoor gebruikte ik het volgende commando:
code:
1
| mdadm --build -- verbose /dev/md0 --level=1 --raid-devices=2 /dev/sda1 /dev/sdb1 |
Dit is to the best of my knowledge correct, en in ieder geval is dit de methode waar het de vorige keer prima mee ging. nu echter niet
code:
1
2
3
4
5
6
7
8
9
10
11
| md: bind<sda1> md: nonpersistent superblock ... md: bind<sdb1> md: nonpersistent superblock ... md: raid1 personality registered as nr 3 raid1: raid set md0 active with 2 out of 2 mirrors mdadm: array /dev/md0 built and started md: syncing RAID array md0 md: minimum _guaranteed_ reconstruction speed: 1000 KB/sec/disc. md: using maxsimum available idle IO bandwith (but not more than 200000 KB/sec) for reconstruction md: using 128k window, over a total of 312568642 blocks |
so far so good. Nu gaat ie dus syncen. het enige wat ik zo niet kan plaatsten is de nonpersistent superblock melding. is dat iets om me zorgen over te maken?
elkeweg, na een poosje syncen:
code:
1
2
3
4
5
6
7
8
| ata2: command 0x35 timeout, stat 0xd9 host_stat 0x61 scsi1: ERROR on channel 0, id 0, lun 0 , CDB: Write (10) 00 02 2e 46 bf 00 04 00 00 Current sdb: sense key Medium Error Additional sense: Write Error - auto reallocation failed end_request: I/O error, dev sdb, sector 36587199 ATA: Abnormal status 0xd9 on port 0xdc81dec7 ATA: Abnormal status 0xd9 on port 0xdc81dec7 ATA: Abnormal status 0xd9 on port 0xdc81dec7 |
De /proc/mdstat laat daarna duidelijk zien dat er niets meer gebeurd. (tijd gaat alleen maar omhoog, snelheid naar beneden en hij komt niet verder dan het aantal blocks waar de fout optreedt).
tries:
* reboot, nog een keer proberen. hij blijft dan op een ander punt (eens op 44% en eens op 6%) steken.
* reboot, de schijven 'los' mounten. dit werkt like charm (mount /dev/sda1 /root/test) . Ik kan er ook van lezen etc. hetzelfde voor sdb1, waar evenveel op staat. de schijven lijken prima dus, en ik heb verder ook geen reden aan te nemen dat er iets mis mee is.
wat ik verder nog kan doen is de schijven gaan testen (heb wel een bootdisk met tools etc) op fouten, maar ik ben bang dat ik gewoon iets raars doe met mdadm. klopt dat hele verhaal met die superblocks etc wel? doe ik nou gewoon iets doms bij mijn raid? Als iemand wat steun kan geven, gaarne
edit: voor de zekerheid: forum search gedaan op die ata2 timeout regel, de snese key medium error (iets met tapes
sig