Raidset problemen

Pagina: 1
Acties:

  • 3raser
  • Registratie: Mei 2008
  • Laatst online: 14-02 10:41

3raser

⚜️ Premium member

Topicstarter
Ik heb een regelmatig terugkerend probleem met mijn raidsets en ik wil graag weten of iemand deze problemen herkent.

De gebruikte hardware is als volgt:
Chenbro RM314 serie serverkast met hot swappable HD's
Areca 1230 RAID controller
Willekeurig Supermicro moederbord
Verschillende schijven per server (maar uiteraard altijd dezelfde schijven in 1 server) (oa. WD Velociraport, Seagate Barracuda)

Het probleem is dat er met enige regelmaat channels uitvallen zonder dat ze daadwerkelijk stuk zijn.
De Areca controller geeft aan dat er een write error is waarna de hotspare wordt gebruikt om de raidset opnieuw op te bouwen. Na een herstart van de server kan de schijf die eerst als failed werd gezien gewoon weer gebruikt worden. Om vragen alvast uit de wereld te helpen, deze schijven zijn echt niet defect. Er zijn geen slechte sectoren e.d.

Het lijkt er dus op alsof er iets mis gaat tussen de Areca controller en de harde schijf. Mijn beste gok is dat het in de backplanes zit en dus een probleem van Chenbro is. Via google heb ik al gezocht en vond ik een vergelijkbaar probleem uit 2004.

Zijn er hier mensen met vergelijkbare problemen?

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Dit mag naar OM

OH > OM

Verder, kun je die backplanes er niet tussenuit trekken en de schijven direct aan de controller hangen om te testen?

  • 3raser
  • Registratie: Mei 2008
  • Laatst online: 14-02 10:41

3raser

⚜️ Premium member

Topicstarter
Buiten het gedoe met de voeding van de schijven om zou het bijna niet te testen zijn. Er valt geen touw aan vast te knopen wanneer een schijf uitvalt. Zo kan het systeem maanden goed draaien en plotseling 2 keer per week een fout geven.

Ik zoek dus eigenlijk mensen die een soortgelijk probleem hebben en dit reeds hebben opgelost.

  • Fauna
  • Registratie: December 2000
  • Laatst online: 06:40
Read/Write errors kunnen zoveel oorzaken hebben, je doet er het beste aan om toch een aantal zaken uit te sluiten. Zo zijn daar o.a.: kabels, voeding, schijf, write back caching aan/uit, NCQ/TCQ aan/uit, RAM op mobo, RAM op de controller.

Overigens: dat er geen bad sectors zijn wil nog niet zeggen dat er niks mis is met de schijf. Haal de schijven eens door bijv. SeaTools?

  • 3raser
  • Registratie: Mei 2008
  • Laatst online: 14-02 10:41

3raser

⚜️ Premium member

Topicstarter
De schijven zijn uiteraard getest. O.a. met Seatools.
De zaken die je noemt kunnen invloed hebben op 1 server, maar niet op meerdere lijkt mij.

Enig uitzoekwerk leert ook dat de uitval vrijwel alleen voorkomt bij de servers met Velociraptor schijven. Bij zowel de 150GB als 300GB uitvoering. Dus misschien toch niet de backplanes? Of een combinatie?

  • Fauna
  • Registratie: December 2000
  • Laatst online: 06:40
Als je dezelfde configuraties gebruikt in de controllers en het is een controller-(backplane)-disk issue of incompatibiliteit, is het natuurlijk niet gek dat je dezelfde problemen krijgt. Er zitten genoeg opties op zo'n Areca, en ik zoek het nog steeds in de richting van caching. Te meer omdat dit vaak andere compatibiliteitsproblemen oplost.

De WD3000HLFS staat iig in de compatibiliteitslijst bij Areca, dus een rechtstreeks probleem zou het niet moeten zijn.
Pagina: 1