Acties:
  • 0 Henk 'm!

  • Tead
  • Registratie: November 2001
  • Laatst online: 14:08
Sinds een aantal dagen heb ik een raar probleem met mijn Adaptec 3805 SAS RAID controller. Op deze controller heb ik o.a. een RAID 5 array van 4 Samsung F1 SATA schijven van 1TB. Na 1.5 jaar kreeg ik opeens de melding dat een drive was removed en dat de array was degraded, maar nog wel online. Een seconde of 8 later kreeg ik de melding dat de zelfde drive 'added' was en dat hij begon met rebuilden. Echter 6 minuten later, toen het rebuild proces nog bezig was, ging een andere wilkeurige schijf op removed en was de array dus stuk (failed). Na enkele seconde was deze drive ook weer added. Sinds dien gaat er om de paar minuten een wilkeurige schijf op removed en dan enkele seconde later weer op added. Als ik zelf een force online uitvoer op de array wilt hij gaan rebuilden, maar ook deze mislukt omdat er een schijf uitklapt.

Hier bij een gedeelte van de log:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
10:57:30    Adaptec Storage Manager started on TCP/IP port number 34.571.
11:03:41    User Tead logged into Computer with administrative privileges.
11:04:59    Physical drive removed: controller 1, connector 1, device 3
11:04:59    Logical device is degraded: controller 1, logical device 1 ("data").
11:05:07    Physical drive added: controller 1, connector 1, device 3
11:05:20    Rebuilding: controller 1, logical device 1 ("data").
11:13:24    Physical drive removed: controller 1, connector 1, device 2
11:13:24    Rebuild failed: controller 1, logical device 1 ("data") [0x00].
11:13:29    Logical device failed: controller 1, logical device 1 ("data").
11:13:31    Physical drive added: controller 1, connector 1, device 2
11:23:20    Physical drive removed: controller 1, connector 1, device 0
11:23:21    Physical drive removed: controller 1, connector 1, device 1
11:23:26    Physical drive added: controller 1, connector 1, device 0
11:23:27    Physical drive added: controller 1, connector 1, device 1
11:31:02    Physical drive removed: controller 1, connector 1, device 3
11:31:11    Physical drive added: controller 1, connector 1, device 3
11:41:13    Physical drive removed: controller 1, connector 1, device 2
11:41:22    Physical drive added: controller 1, connector 1, device 2
11:43:15    Forced the logical device online: controller 1, logical device 1 ("data").
11:43:20    Logical device is degraded: controller 1, logical device 1 ("data").
11:44:20    Rebuilding: controller 1, logical device 1 ("data").
11:44:57    Physical drive removed: controller 1, connector 1, device 0
11:45:02    Rebuild failed: controller 1, logical device 1 ("data") [0x00].
11:45:09    Logical device failed: controller 1, logical device 1 ("data").
11:45:07    Physical drive added: controller 1, connector 1, device 0
11:48:24    Physical drive removed: controller 1, connector 1, device 3
11:48:31    Physical drive added: controller 1, connector 1, device 3

De log komt van Adaptec Storage Manager in Windows 7.

Maar, als ik een rebuild laat doen in de bios van de Adaptec kaart gaat deze helemaal vlekkenloos en is na een nachtje rebuilden de gehele array ook weer optimaal. Na het starten van windows kan ik de array dan ook meestal een minuut of 10 foutloos benaderen en dan krijg ik weer last van de zelfde problemen. Nu dacht ik zelf eerst dat het aan Windows zou kunnen liggen, maar ook met Ubuntu (10.04) heb ik de zelfde problemen.

Enkele feiten:
  • Array heeft 1.5 jaar foutloos gewerkt
  • Andere array van 2 x 147GB 10k rpm SAS op RAID 0 ondervind geen problemen
  • Vervanging van de stroom en SAS/SATA kabels had geen invloed
  • De Adaptec had ik zelf al voorzien van een fan, hij kan dus niet te warm zijn geworden
  • Overige hardware: E8400, 4GB, GA-X48T-DQ6, CoolerMaster M620
  • Voor de problemen begonnen heb ik geen hardware vervangen of software geïnstalleerd
  • In de bios zijn er geen problemen, in Windows en Ubuntu wel
Wie-o-wie kan mij vertellen wat er mis is.

Acties:
  • 0 Henk 'm!

Verwijderd

Je zou het eens kunnen proberen met een andere voeding, misschien is die wat instabiel op de volt lijnen geworden.

Acties:
  • 0 Henk 'm!

  • Tead
  • Registratie: November 2001
  • Laatst online: 14:08
Verwijderd schreef op zaterdag 29 januari 2011 @ 01:32:
Je zou het eens kunnen proberen met een andere voeding, misschien is die wat instabiel op de volt lijnen geworden.
Net even een andere 700 Watt voeding geprobeerd, maar de problemen blijven. Ook heb ik ondertussen de andere connector op de kaart geprobeerd en de firmware van de Adaptec kaart geüpgraded naar de laatste versie. Het mocht allemaal niet baten. :(

Andere tips?

Acties:
  • 0 Henk 'm!

Verwijderd

Ja, heb er nog wel 1. Testen met 4 willekeurige andere HD's en kijken of er dan weer hetzelfde gebeurt. Mocht dat zo zijn, dan weet je dat de controller de hoofdschuldige is. Als het dan wel goed blijft draaien, dan zit het bij de HD's en zou je kunnen kijken of je de firmware kan updaten.
Ook is het een bekend feit, dat F1's de neiging hebben om uit een raidset te vallen. Maar dan is het wel vreemd dat het pas na 18 maanden gebeurt.

Acties:
  • 0 Henk 'm!

  • SAiKO
  • Registratie: September 2000
  • Laatst online: 20-05-2024

SAiKO

Grote Smurf

Ik heb hetzelfde probleem met een Adaptec 3085 (externe variant; infiniband kabels naar binnen geleid). Ik heb ook een Raid 5 en 8 Samsung HD204UI 2TB schijven. Na een bepaalde periode 'verdwijnt' er een willekeurige schijf uit de configuratie en is de raid degraded. Als ik dan reboot dan is de schijf weer gevonden en begint hij automatisch te rebuilden. Dan is alles weer goed tot er weer een schijf uitvalt.

Acties:
  • 0 Henk 'm!

Verwijderd

SMART van de hardeschijven? Heeft één hardeschijf misschien een Current Pending Sector in de SMART output? Misschien ergens de SMART van al je schijven posten?

Acties:
  • 0 Henk 'm!

  • _Dune_
  • Registratie: September 2003
  • Laatst online: 21:11

_Dune_

Moderator Harde Waren

RAID is geen BACKUP

CiPHER de SAMRT waarden van 1 schijf is natuurlijk wienig zeggend :) aangezien meerdere schijven ad-random uit de array vallen. Persoonlijk zou ik het meer zoeken in de Samsung schijven en niet in de controller. Je kunt inderdaad zeggen, "maar ze hebben al anderhalf jaar gedraaid", dat klopt, maar er zijn meer dergelijke gevallen bekend. De F1 serie staat er ook om bekend dergelijke neigingen te hebben, ook pas na langer tijd, zoek maar eens in dit forum op RAID configuraties met de F1 serie. Ik meen mij zelf te herinneren dat Samsung daar ook firmware updates voor heeft uitgegeven, maar als je daar aan begint zorg dan voor een goede backup, voordat je gaat updaten.

[ Voor 15% gewijzigd door _Dune_ op 27-02-2012 13:28 ]

Sinds 1999@Tweakers | Bij IT-ers gaat alles automatisch, maar niets vanzelf. | https://www.go-euc.com/

Pagina: 1