[RAID5] 3WARE 9650SE-24M8 + WD20EARS => Traag na een tijdje

Pagina: 1
Acties:

  • BSeB
  • Registratie: Juni 2001
  • Laatst online: 22-09-2025
Als eerste mijn specs:

- 3x - WD20EARS
- 3WARE - 9650SE-24M8
- Mainboard - Asus L1N64-SLI WS/B
- 2x AMD 2345 quad core
- Opensuse 11.2 64bit
- Kernel 2.6.34 (custom)

Probleem:
De RAID5 wordt zo traag dat ik nog maar een schrijfsnelheid haal van 1mb/s.

Wat gedaan:
Vanacht een test gedaan op de bios van de raid controller (verify), reboot erna en meteen een dd test met 10GB. Resultaat was een transfer van 170 mb/s. Erg relaxed dus. Ga even weg (30min) doe de dd test opnieuw en de snelheid is terug naar 1 mb/s.

Het lijkt alsof de schijven gaan slapen. Misschien is dit vreemd uitgedrukt, maar ik zou niet weten hoe ik dit kan testen. Alleen na die verify actie hebben ze goed gepresteerd. Het zijn geen kernel opties naar mijn idee dus het zullen ergens instellen moeten zijn.

Getest met:
- dd if=/dev/zero of=/home/storage_02/tijdelijk/test.bin bs=1M count=10000
- /usr/bin/bonnie++ -d /home/storage_02/tijdelijk/ -s 16g -f -b -m Hash -u root

Beide test geven hetzelfde resultaat. Een tergend traag systeem.

1 maal getest om data van de schijven af te halen, dus te kopieren naar de OS schijf. Dit gaat met 80 mb/s.

Kan iemand me helpen om dit probleem op te lossen, want zelf weet ik niet waar ik moet zoeken.
Mocht meer informatie benodigd zijn dan hoor ik het graag.

  • FireDrunk
  • Registratie: November 2002
  • Laatst online: 13-02 13:08
Geeft je raidcontroller niet een foutmelding in de log weer ofzo? (iets van dropped from raidset...)

Even niets...


  • Q
  • Registratie: November 1999
  • Laatst online: 22:35

Q

Au Contraire Mon Capitan!

1. Heeft het ooit goed gewerkt?
2. Test eerst eens met een stock kernel zoals aangeleverd door SuSE?
3. Test eens met een andere distro?

  • BSeB
  • Registratie: Juni 2001
  • Laatst online: 22-09-2025
Wat ik tot dusver gevonden heb:

code:
1
2
3
4
5
Aug  4 13:28:35 Hash smartd[3105]: Device: /dev/sda [SAT], Failed SMART usage Attribute: 190 Airflow_Temperature_Cel.
Aug  4 13:32:21 Hash smartd[3105]: smartd received signal 15: Terminated
Aug  4 13:32:21 Hash smartd[3105]: Device: /dev/sda [SAT], state written to /var/lib/smartmontools/smartd.ST3500630AS-9QG1X86W.ata.state
Aug  4 13:32:21 Hash smartd[3105]: smartd is exiting (exit status 0)
Aug  4 13:38:13 Hash kernel: [23999.082994] 3w-9xxx: scsi15: AEN: ERROR (0x04:0x004D): Battery temperature is too high:.


code:
1
2
3
4
5
6
7
8
Aug  4 12:30:46 Hash kernel: [19952.373399] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
Aug  4 12:30:46 Hash kernel: [19952.373750] 3w-9xxx: scsi15: ERROR: (0x03:0x0101): Invalid command opcode:opcode=0x80.
Aug  4 12:30:46 Hash kernel: [19952.373816] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
Aug  4 12:30:46 Hash kernel: [19952.374091] 3w-9xxx: scsi15: ERROR: (0x03:0x0101): Invalid command opcode:opcode=0x80.
Aug  4 12:30:53 Hash kernel: [19958.994584] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
Aug  4 12:30:53 Hash kernel: [19958.994919] 3w-9xxx: scsi15: ERROR: (0x03:0x0101): Invalid command opcode:opcode=0x80.
Aug  4 12:30:53 Hash kernel: [19958.995027] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
Aug  4 12:30:53 Hash kernel: [19958.995306] 3w-9xxx: scsi15: ERROR: (0x03:0x0101): Invalid command opcode:opcode=0x80.

[ Voor 46% gewijzigd door BSeB op 04-08-2010 13:44 ]


  • FireDrunk
  • Registratie: November 2002
  • Laatst online: 13-02 13:08
Hmm. het lijkt op verouderde firmware problemen ofzo.
Weet je zeker dat je de nieuwste firmware hebt voor de kaart?

http://www.lsi.com/channe...re_9650se-24m8/index.html

Stukje naar beneden staat kopje Firmware... Versie 9.5.3 is nieuwst.

Even niets...


  • BSeB
  • Registratie: Juni 2001
  • Laatst online: 22-09-2025
Ik denk dat ik zojuist het probleem gevonden heb. Er zit een BBU op deze kaart en iedere keer als ik de controller stress door een aantal keer achter elkaar 10GB zero naar een bestand op de RAID 5 te pompen krijg ik de volgende error:

code:
1
Aug  4 14:09:00 Hash kernel: [25845.437198] 3w-9xxx: scsi15: AEN: ERROR (0x04:0x004D): Battery temperature is too high:.


Vanavond even proberen de BBU van de controller te halen en buiten de kast te hangen.
Het lijkt erop dat de kaart door het processen van de data warm wordt en daardoor de BBU heet wordt en de kaart in een soort van SAFE mode schiet die de throughput limiteerd.

Verder geloof ik dat ik de laatste firmware heb: (Moet ik vanmiddag thuis checken)

  • FireDrunk
  • Registratie: November 2002
  • Laatst online: 13-02 13:08
Het cache gaat gewoon uit als er geen BBU aan zit. Dan krijg je realtime I/O op je schijven, en dat is een stuk trager ja ;)

Even niets...


  • BSeB
  • Registratie: Juni 2001
  • Laatst online: 22-09-2025
Nee de BBU laat ik aangekoppeld, echter de unit zit nu op de kaart geschroefd, vanavond maak ik dat los en dan laat ik hem even ploegen.

  • FireDrunk
  • Registratie: November 2002
  • Laatst online: 13-02 13:08
Ik bedoel dat de kaart de BBU negeert als hij te warm word, en hem dus 'uit' zet... Met als gevolg dat het onboard cache ook uitgeschakeld word (als safety-feature).

Even niets...


  • BSeB
  • Registratie: Juni 2001
  • Laatst online: 22-09-2025
Hier ben ik weer.
Gisteren nadat ik thuiskwam even snel de server uit gezet. Na een tijdje heb ik de batterij los gemaakt van de RAID controller (wel aangesloten gelaten) en deze buiten de warmte gehangen (even profosorisch) met een plastic zak dichtbinder.

Daarna een aantal keer getest met wiles van 100GB en deze 3 maal achter elkaar. Continue blijf ik een doorvoer van 150mb/s halen.
In de logs alleen wat smwart opmerkingen die verder niet spannend zijn.
Doorvoer is dus gefixed en ik moet nu een bracket kopen:

- 3ware BBU-BRACKET-04

  • FireDrunk
  • Registratie: November 2002
  • Laatst online: 13-02 13:08
Mooi, probleem opgelost :)
Je kan natuurlijk ook heel 'profisorisch' een koelklok op de batterij monteren ;)

Even niets...

Pagina: 1