Software RAID(5) probleem -> gebruik = system crash

Pagina: 1
Acties:

  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
Had het probleem al gepost op LinuxQuestions, maar omdat ik nog geen hulp heb gekregen na enkele dagen en omdat ik stilaan gek wordt, hoop ik hier alsnog hulp te krijgen..

De meeste info staat in de thread op LQ, het heeft weinig zin om alles naar hier te copy-pasten. Basicly komt het hier op neer:
- ik slaag er in om een raid array te maken (vb /dev/md0)
- ik kan die array ook formatten (reiser/ext3)
- wanneer ik echter mount, crashed het systeem (volledig vast - geen reactie meer)
Wanneer mouten wél slaagt, dan crashed het systeem even later (wanneer ik bestanden naar het array begin te schrijven).

Heel raar & heel vervelend - zit hier echt al enkele dagen aan bezig :(


Ik vermoed nu dat het ligt aan 1 van deze zaken:
- bugje in mdadm (not likely)
- bug in hpt drivers (most likely)
- combinatie van kernel+mdadm versie

Systeem:
XP1500+
512MB RAM
ECS K7V5A something
40GB system disk
Controller: HighPoint 1820A
SATA schijven: 4x Samsung 400GB
Linux Slackware 12.0 (met standaard kernel, 2.6.x)


Reeds een update:
heb een iets oudere versie van mdadm geprobeerd (2.5.4 ipv 2.6.4). Na een array te hebben gecreëerd en deze te hebben geformateerd, kon ik ze ook nog mounten zonder problemen. Heb dan enkele files getouched op de array en ook een directory aangemaakt & die ge-chown'ed: geen probleem.
Maar van zodra ik data begon te transfereren naar de array (tegen pakweg 25MB/s, over netwerk, smb) crashte het systeem weer..

Ik ga nu eens proberen met een oudere Slackware vesie (10.1), kernel 2.4.x

[ Voor 20% gewijzigd door BlackRabbit op 30-03-2008 13:01 ]


Verwijderd

Ik begrijp iets niet. Je gebruikt een hardware raidcontroller voor RAID (highPoint 1820A) en linux software raid (mdadm) om een Raid setup te maken? Kun je me uitleggen waarom?

  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
Dat is een heel ander verhaal, dat ik ondertussen opgegeven heb.

Op zich is het ook een software-raid controller, dus volgens mij gaat het helemaal niet zoveel uitmaken qua snelheid (die bovendien niet het meest belangrijke is voor dit systeem - met 20-30MB/s ben ik tevreden - sneller mag natuurlijk).


Update: ben ondertussen dus begonnen met Slack 10.1, die blijkbaar deze controller niet standaard ondersteund -> even drivers gedownload van highpoint site, en nu krijg ik blijkbaar geen problemen..

[ Voor 19% gewijzigd door BlackRabbit op 30-03-2008 13:41 ]


  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
Alrighty:
SlackWare 10.1 + highpoint 'opensource' drivers -> success! (voorlopig lijkt het toch zo :))

Nu vraag ik me af: toen ik 12.0 gebruikte, downloadde ik steeds mdadm (laatste versie) van de mdadm-site (ik wist niet dat deze tool standaard werd meegeleverd met slack). Zou het dáar aan kunnen liggen? Maw: als ik nu terug 12.0 installeer & de meegeleverde mdadm gebruik, is er dan meer kan op succes?


Slack 12.0 biedt immers wel wat voordelen tov 10.1: oa nieuwere versies van Mysql, Apache, samba (!), .. True, die kan ik ook apart installeren, maar das weer wat werk + prutswerk imho. Liever een clean 12.0 install eigenlijk :)

Ga nog wat testen met de 10.1, I'll keep you updated (maar indien je nog info kan voorzien: zeker doen! ;))


PS: de transferrate ligt in 10.1 wel (een beetje) lager.. Lijkt te liggen aan bdflush, die aardig wat CPU power wegsnoept (+/- 30%).


UPDATE: systeem lijkt echt wel stabiel te draaien zo.. Let's try Slack 12.0 again.. :)

[ Voor 12% gewijzigd door BlackRabbit op 30-03-2008 14:41 ]


  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
*zucht*

Slackware 12.0 geïnstalleerd, drivers van highpoint site geïnstalleerd.
modprobe hptmv -> zoals hier beschreven: keert niet terug naar de command line.

Wanneer ik dan probeer een array te createn, begint de controller te beep'en..


Maw: de highpoint drivers lijken niet overweg te kunnen met deze kernel versie? (2.6)
Dan maar terug naar Slack 10.1 met kernel 2.4, of kan iemand nog nuttige tips geven?

  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
Nog een laatste attempt: tijdens het booten worden de kernel-built-in drivers geladen:
code:
1
2
root@sun:~# dmesg|grep 3xx
RocketRAID 3xxx SATA Controller driver v1.0 (060426)


Hoe kan ik er voor zorgen dat dit niet gebeurd? (de highpoint module hoeft niet geladen te worden tijdens boot).

  • BlackRabbit
  • Registratie: Januari 2003
  • Laatst online: 04-01 09:57
Final update:
- installed Slack 12.0 again
- recompiled the kernel without support for any HighPoint controllers
- installed opensource drivers from highpoint

Although it took a bit more time before the controller started beeping, it still did when I tried to access a device on the controller (eg cfdisk /dev/sda).


I've sent a mail to Highpoint with my findings, hopefully a fix will be published soon.

Until then, I'm back to Slack 10.1
Pagina: 1