SCSI drive hangt even -> huge error log

Pagina: 1
Acties:

  • trinite_t
  • Registratie: Maart 2003
  • Laatst online: 18-02 14:55
Ik heb een Gentoo servertje draaien. Dit draait op een ASUS P2B-DS dual cpu mobo. Dit moederbord heeft een onboard SCSI controller (Adaptec AIC-7890 Ultra 2).
Al vanaf het begin dat ik dit heb draaien hangt soms deze pc even.. Hij reageert nog wel:
- als ik inlog via ssh krijg ik netjes "login as:" te zien, hier kan ik dan ook wel een gebruikersnaam invullen.. Als ik op enter druk duurt het totdat de freeze over is voordat ik een wachtwoord op kan geven.
Een webpagina request hetzelfde, ik krijg geen timeout, m'n browser wacht rustig totdat de pc weer reageert...
In het begin had ik niet zoveel last van dit probleem, maar nu die server steeds meer gebruikt gaat worden wordt het toch wel iritant.

ff een stukje uit m'n errorlog:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
Dec 18 03:48:17 localhost scsi0:0:0:0: Attempting to queue an ABORT message
Dec 18 03:48:17 localhost CDB: 0x2a 0x0 0x0 0x11 0x6c 0xdc 0x0 0x0 0xc8 0x0
Dec 18 03:48:17 localhost scsi0: At time of recovery, card was not paused
Dec 18 03:48:17 localhost >>>>>>>>>>>>>>>>>> Dump Card State Begins <<<<<<<<<<<<<<<<<
Dec 18 03:48:17 localhost scsi0: Dumping Card State in Data-out phase, at SEQADDR 0x57
Dec 18 03:48:17 localhost Card was paused
Dec 18 03:48:17 localhost ACCUM = 0x0, SINDEX = 0x90, DINDEX = 0xe4, ARG_2 = 0x1
Dec 18 03:48:17 localhost HCNT = 0x2 SCBPTR = 0x7
Dec 18 03:48:17 localhost SCSISIGI[0x4]:(BSYI) ERROR[0x0] SCSIBUSL[0x31] 
Dec 18 03:48:17 localhost LASTPHASE[0x0] SCSISEQ[0x12]:(ENAUTOATNP|ENRSELI) 
Dec 18 03:48:17 localhost SBLKCTL[0xa]:(SELWIDE|SELBUSB) SCSIRATE[0x95]:(SINGLE_EDGE|WIDEXFER) 
Dec 18 03:48:17 localhost SEQCTL[0x10]:(FASTMODE) SEQ_FLAGS[0x20]:(DPHASE) 
Dec 18 03:48:17 localhost SSTAT0[0x0] SSTAT1[0x2]:(PHASECHG) SSTAT2[0x50]:(EXP_ACTIVE|SHVALID) 
Dec 18 03:48:17 localhost SSTAT3[0x0] SIMODE0[0x8]:(ENSWRAP) SIMODE1[0xac]:(ENSCSIPERR|ENBUSFREE|ENSCSIRST|ENSELTIMO) 
Dec 18 03:48:17 localhost SXFRCTL0[0x80]:(DFON) DFCNTRL[0x2c]:(DIRECTION|HDMAEN|SCSIEN) 
Dec 18 03:48:17 localhost DFSTATUS[0x2]:(FIFOFULL) 
Dec 18 03:48:17 localhost STACK: 0x84 0x84 0x167 0x5e
Dec 18 03:48:17 localhost SCB count = 48
Dec 18 03:48:17 localhost Kernel NEXTQSCB = 38
Dec 18 03:48:17 localhost Card NEXTQSCB = 38
Dec 18 03:48:17 localhost QINFIFO entries: 
Dec 18 03:48:17 localhost Waiting Queue entries: 
Dec 18 03:48:17 localhost Disconnected Queue entries: 
Dec 18 03:48:17 localhost QOUTFIFO entries: 
Dec 18 03:48:17 localhost Sequencer Free SCB List: 23 25 22 18 24 2 11 30 28 9 10 26 13 16 14 21 0 17 6 27 3 29 31 5 19 15 1 20 12 8 4 
Dec 18 03:48:17 localhost Sequencer SCB Info: 
Dec 18 03:48:17 localhost 0 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 1 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 2 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 3 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 4 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 5 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 6 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 7 SCB_CONTROL[0x60]:(TAG_ENB|DISCENB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0x7] 
Dec 18 03:48:17 localhost 8 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 9 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 10 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 11 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 12 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 13 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 14 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 15 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 16 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 17 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 18 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 19 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 20 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 21 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 22 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 23 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 24 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 25 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 26 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 27 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 28 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 29 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 30 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost 31 SCB_CONTROL[0xe0]:(TAG_ENB|DISCENB|TARGET_SCB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] SCB_TAG[0xff] 
Dec 18 03:48:17 localhost Pending list: 
Dec 18 03:48:17 localhost 7 SCB_CONTROL[0x60]:(TAG_ENB|DISCENB) SCB_SCSIID[0x7] 
Dec 18 03:48:17 localhost SCB_LUN[0x0] 
Dec 18 03:48:17 localhost Kernel Free SCB list: 24 8 20 0 33 34 25 17 36 47 2 9 37 12 40 6 29 19 26 18 32 30 5 16 31 28 14 42 43 39 3 27 4 21 41 13 15 1 22 23 10 11 35 46 45 44 
Dec 18 03:48:17 localhost 
Dec 18 03:48:17 localhost <<<<<<<<<<<<<<<<< Dump Card State Ends >>>>>>>>>>>>>>>>>>
Dec 18 03:48:17 localhost scsi0:0:0:0: Device is active, asserting ATN
Dec 18 03:48:17 localhost Recovery code sleeping


Als ik het log goed interpreteer gaat er toch iets goed mis op m'n SCSI controller. Ik heb op google en andere fora al gezocht naar een oplossing. Ik kom wel pagina's tegen waar het probleem op beschreven staat, maar niet waardoor het komt.
Ik hoop dat hier wel iemand een id heeft.

Ow ja, ik heb de voglende SCSI drives aan het systeem hangen:
  • COMPAQPC DDRS-34560W (Direct-Access)
  • COMPAQ BB00921B91 (Direct-Access)
  • TOSHIBA CD-ROM XM-6201TA (CD-ROM)
  • IOMEGA ZIP 100 (Direct-Access)
  • iomega jaz 2GB (Direct-Access)
Ik draai de volgende kernel:
  • Linux version 2.6.14-hardened-r1
lspci geeft de volgende SCSI controller weer:
  • 00:06.0 SCSI storage controller: Adaptec AHA-2940U2/U2W / 7890/7891
Als driver gebruik ik de volgende (low level) driver:
  • Adaptec AIC7xxx Fast -> U160 support (New Driver)
Met de volgende settings:
  • (32) Maximum number of TCQ commands per device
  • (15000) Initial bus reset delay in milli-seconds
  • [Y] Compile in Debugging Code
  • (0) Debug code enable mask (2047 for all debugging)
  • [Y] Decode registers during diagnostics

The easiest way to solve a problem is just to solve it.


  • maratropa
  • Registratie: Maart 2000
  • Niet online
Heb je al:

-Kabels nagelopen / vervangen?
-Terminator gechecked / vervangen?
-Jumpers nagelopen / vervangen?

En misschien licht het aan 1 schijf of device, kun je sommige loskoppelen? Als het probleem verdwijnt weet je misschien meer.

En als je in de controller de snelheid van het scsi kanaal omlaag haalt, tot UW 40mb per sec snelheid?

Hoe is de boel aangesloten, via 2 kanalen?

[ Voor 7% gewijzigd door maratropa op 21-12-2005 18:16 ]

specs


  • trinite_t
  • Registratie: Maart 2003
  • Laatst online: 18-02 14:55
Daar zit nu net ff een probleempje, dat ding staat op een plaats waar ik nogal slecht bij kan... Ik zal dit weekend proberen om er bij te kunnen...
Verder dacht ik dat de HD-racks op 1 kabel zaten, en de rest op een andere kabel.. Dus mss maar eens die kabels wissellen.. mss helpt dat... Terminator vervangen kan lastig worden... heb maar een bak met een SCSI controller staan...

The easiest way to solve a problem is just to solve it.


  • trinite_t
  • Registratie: Maart 2003
  • Laatst online: 18-02 14:55
Kabels omwisselen is een beetje lastig... m'n cdrom speler, zip drive en jazzdrive hebben (als ik het goed heb) een ribbon IDC 50 aansluiting en m'n schijven een Half Pitch DB68. Ik heb nu de snelheden maar omlaag gehaald. hopend dat dat werkt :D

The easiest way to solve a problem is just to solve it.