Ik draai hier een Linux (Gentoo 2004.4) servertje welke als fileserver zijn werk doet. In deze fileserver lopen 2 RAID-1 arrays (Linux software RAID) van 2 schijven elk. De schijven zijn aangesloten op de onboard Promise Fasttrack 100 lite controller van het MSI K7T Turbo board wat in die computer zit.
Voor ongeveer 2 jaar lang heeft dit probleemloos gelopen. Enige tijd geleden hing de fs zich vaker op. Bij nadere inspectie bleek dat 1 schijf aan het overlijden was. Goed, die schijf was al 2 jaar oud, dus alle beide schijven in dat array eruit gegooid, 2 nieuwe schijven erin en het loopt weer als een zonnetje.
Nu, een week of 2 later heb ik weer problemen. Ik merkte gisteren dat 1 array als read only was gemount. Vreemd. Toen ik eens e2fsck (soort van checkdisk, maar dan de linux variant) liet lopen vond'ie een rammel fouten (inodes welke niet op de schijf liggen etc). Gefixt en het loopt weer.
Reboot ik de computer, wordt opeens 1 van de nieuwe schijven niet meer gevonden. Reboot ik die computer weer, dan vind de RAID controller helemaal geen schijf meer en krijgt ik een melding dat de IRQ's voor PCI apparaten niet goed ingesteld zijn (die melding kreeg ik vanuit het RAID bios). Nog eens aan en uit en het werkt weer. Ik merk echter dat een heleboel bestanden op mijn fileserver corrupt zijn. Nog maar eens een e2fsck doen (je moet wat), kan niet, device is busy. Ok, reboot. Voordat ik e2fsck opnieuw start bekijk ik nog eens wat van de corrupte bestanden en ze doen het weer. HUH?? Nu heb ik e2fsck weer gestart en worden er weer een hele boel problemen gevonden.
Mijn vraag is dus: heeft iemand enig idee wat er hier aan de hand zou kunnen zijn?
Voor ongeveer 2 jaar lang heeft dit probleemloos gelopen. Enige tijd geleden hing de fs zich vaker op. Bij nadere inspectie bleek dat 1 schijf aan het overlijden was. Goed, die schijf was al 2 jaar oud, dus alle beide schijven in dat array eruit gegooid, 2 nieuwe schijven erin en het loopt weer als een zonnetje.
Nu, een week of 2 later heb ik weer problemen. Ik merkte gisteren dat 1 array als read only was gemount. Vreemd. Toen ik eens e2fsck (soort van checkdisk, maar dan de linux variant) liet lopen vond'ie een rammel fouten (inodes welke niet op de schijf liggen etc). Gefixt en het loopt weer.
Reboot ik de computer, wordt opeens 1 van de nieuwe schijven niet meer gevonden. Reboot ik die computer weer, dan vind de RAID controller helemaal geen schijf meer en krijgt ik een melding dat de IRQ's voor PCI apparaten niet goed ingesteld zijn (die melding kreeg ik vanuit het RAID bios). Nog eens aan en uit en het werkt weer. Ik merk echter dat een heleboel bestanden op mijn fileserver corrupt zijn. Nog maar eens een e2fsck doen (je moet wat), kan niet, device is busy. Ok, reboot. Voordat ik e2fsck opnieuw start bekijk ik nog eens wat van de corrupte bestanden en ze doen het weer. HUH?? Nu heb ik e2fsck weer gestart en worden er weer een hele boel problemen gevonden.
Mijn vraag is dus: heeft iemand enig idee wat er hier aan de hand zou kunnen zijn?