In onze HP ML350G4 server zitten 4 Maxtor 80GB SATA schijven in een RAID5 configuratie op een Adaptec 2610SA controller. Het OS is Suse Linux 10.0. Daarop draait VMware server met daarop weer 4 FreeBSD 6.1 servers. Het hele verhaal heeft 2 maanden naar volle tevredenheid gedraaid.
Eergisteren gaf disk #0 aan dat hij een defect had (oranje ledje knipperde). HP heeft een nieuwe schijf geleverd en daarmee heb ik de defecte #0 vervangen (terwijl de server draaide!) De lampjes op de nieuwe schijf brandden groen, en afgaande op de schijfactiviteit van de andere 3 schijven begon het rebuilden van de array. Ongeveer een kwartier later is de server compleet onderuit gegaan. Op de console van Suse stonden meldingen in de trent van 'critical I/O /dev/sda'.
Ik heb de server toen uitgezet, en weer aan, waarna de array controller vond dat de RAID5-array FAILED was als gevolg van missing, of rebuilding members. In de configuratie van de arraycontroller waren schijf #0 en #2 grijs, en #1 en #3 wit. De lampjes op alle schijven brandden groen.
Mijn conclusie was dat de array-configuratie gegevens op de schijven verminkt zijn geraakt, en de inmiddels gearriveerde 'engineer' van HP was het daar mee eens. Uiteindelijk dus maar 2 nieuwe schijven geplaatst en opnieuw begonnen. Ik ben er echter niet echt gerust op
Voorheen gebruikten we altijd SCSI in servers, en dit is ons eerste experiment met SATA. Twee vragen dus eigenlijk:
Hoe kan die RAID-controller zijn configuratie vern**ken en gebeurt dat vaker (ik heb het nog nooit gezien)
Zijn SATA schijven eigenlijk wel al productieserver 'waardig'?
Eergisteren gaf disk #0 aan dat hij een defect had (oranje ledje knipperde). HP heeft een nieuwe schijf geleverd en daarmee heb ik de defecte #0 vervangen (terwijl de server draaide!) De lampjes op de nieuwe schijf brandden groen, en afgaande op de schijfactiviteit van de andere 3 schijven begon het rebuilden van de array. Ongeveer een kwartier later is de server compleet onderuit gegaan. Op de console van Suse stonden meldingen in de trent van 'critical I/O /dev/sda'.
Ik heb de server toen uitgezet, en weer aan, waarna de array controller vond dat de RAID5-array FAILED was als gevolg van missing, of rebuilding members. In de configuratie van de arraycontroller waren schijf #0 en #2 grijs, en #1 en #3 wit. De lampjes op alle schijven brandden groen.
Mijn conclusie was dat de array-configuratie gegevens op de schijven verminkt zijn geraakt, en de inmiddels gearriveerde 'engineer' van HP was het daar mee eens. Uiteindelijk dus maar 2 nieuwe schijven geplaatst en opnieuw begonnen. Ik ben er echter niet echt gerust op
Voorheen gebruikten we altijd SCSI in servers, en dit is ons eerste experiment met SATA. Twee vragen dus eigenlijk:
Hoe kan die RAID-controller zijn configuratie vern**ken en gebeurt dat vaker (ik heb het nog nooit gezien)
Zijn SATA schijven eigenlijk wel al productieserver 'waardig'?