Sinds een aantal dagen heb ik een raar probleem met mijn Adaptec 3805 SAS RAID controller. Op deze controller heb ik o.a. een RAID 5 array van 4 Samsung F1 SATA schijven van 1TB. Na 1.5 jaar kreeg ik opeens de melding dat een drive was removed en dat de array was degraded, maar nog wel online. Een seconde of 8 later kreeg ik de melding dat de zelfde drive 'added' was en dat hij begon met rebuilden. Echter 6 minuten later, toen het rebuild proces nog bezig was, ging een andere wilkeurige schijf op removed en was de array dus stuk (failed). Na enkele seconde was deze drive ook weer added. Sinds dien gaat er om de paar minuten een wilkeurige schijf op removed en dan enkele seconde later weer op added. Als ik zelf een force online uitvoer op de array wilt hij gaan rebuilden, maar ook deze mislukt omdat er een schijf uitklapt.
Hier bij een gedeelte van de log:
De log komt van Adaptec Storage Manager in Windows 7.
Maar, als ik een rebuild laat doen in de bios van de Adaptec kaart gaat deze helemaal vlekkenloos en is na een nachtje rebuilden de gehele array ook weer optimaal. Na het starten van windows kan ik de array dan ook meestal een minuut of 10 foutloos benaderen en dan krijg ik weer last van de zelfde problemen. Nu dacht ik zelf eerst dat het aan Windows zou kunnen liggen, maar ook met Ubuntu (10.04) heb ik de zelfde problemen.
Enkele feiten:
Hier bij een gedeelte van de log:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
| 10:57:30 Adaptec Storage Manager started on TCP/IP port number 34.571. 11:03:41 User Tead logged into Computer with administrative privileges. 11:04:59 Physical drive removed: controller 1, connector 1, device 3 11:04:59 Logical device is degraded: controller 1, logical device 1 ("data"). 11:05:07 Physical drive added: controller 1, connector 1, device 3 11:05:20 Rebuilding: controller 1, logical device 1 ("data"). 11:13:24 Physical drive removed: controller 1, connector 1, device 2 11:13:24 Rebuild failed: controller 1, logical device 1 ("data") [0x00]. 11:13:29 Logical device failed: controller 1, logical device 1 ("data"). 11:13:31 Physical drive added: controller 1, connector 1, device 2 11:23:20 Physical drive removed: controller 1, connector 1, device 0 11:23:21 Physical drive removed: controller 1, connector 1, device 1 11:23:26 Physical drive added: controller 1, connector 1, device 0 11:23:27 Physical drive added: controller 1, connector 1, device 1 11:31:02 Physical drive removed: controller 1, connector 1, device 3 11:31:11 Physical drive added: controller 1, connector 1, device 3 11:41:13 Physical drive removed: controller 1, connector 1, device 2 11:41:22 Physical drive added: controller 1, connector 1, device 2 11:43:15 Forced the logical device online: controller 1, logical device 1 ("data"). 11:43:20 Logical device is degraded: controller 1, logical device 1 ("data"). 11:44:20 Rebuilding: controller 1, logical device 1 ("data"). 11:44:57 Physical drive removed: controller 1, connector 1, device 0 11:45:02 Rebuild failed: controller 1, logical device 1 ("data") [0x00]. 11:45:09 Logical device failed: controller 1, logical device 1 ("data"). 11:45:07 Physical drive added: controller 1, connector 1, device 0 11:48:24 Physical drive removed: controller 1, connector 1, device 3 11:48:31 Physical drive added: controller 1, connector 1, device 3 |
De log komt van Adaptec Storage Manager in Windows 7.
Maar, als ik een rebuild laat doen in de bios van de Adaptec kaart gaat deze helemaal vlekkenloos en is na een nachtje rebuilden de gehele array ook weer optimaal. Na het starten van windows kan ik de array dan ook meestal een minuut of 10 foutloos benaderen en dan krijg ik weer last van de zelfde problemen. Nu dacht ik zelf eerst dat het aan Windows zou kunnen liggen, maar ook met Ubuntu (10.04) heb ik de zelfde problemen.
Enkele feiten:
- Array heeft 1.5 jaar foutloos gewerkt
- Andere array van 2 x 147GB 10k rpm SAS op RAID 0 ondervind geen problemen
- Vervanging van de stroom en SAS/SATA kabels had geen invloed
- De Adaptec had ik zelf al voorzien van een fan, hij kan dus niet te warm zijn geworden
- Overige hardware: E8400, 4GB, GA-X48T-DQ6, CoolerMaster M620
- Voor de problemen begonnen heb ik geen hardware vervangen of software geïnstalleerd
- In de bios zijn er geen problemen, in Windows en Ubuntu wel