Hi mede-tweakers, ik heb een probleempje met een linux server. Wij (ik + vriend van me die behoorlijk wat meer van linux afweet) zijn er al een paar weken mee bezig maar kunnen er niet achter komen wat het nou is.
Specs:
XP 2400+ / 1gb ram
3x 3c905C-TX/TX-M
Promise Technology Ultra133TX2 pci card met 4x hdds in raid0.
Het probleem is dat er constant 1 van de 3 nics TX overruns krijgt en dan niet meer data kan verwerken. elk nieuw pakketje wat je erheen stuurt word als TX overrun erbij getelt.
Enige oplossing is dan het pid van de eth killen en restarten.
De ene keer gebeurd dit na een dag of 2, de andere keer na 2 uur. Of er veel of geen data overheen word gestuurd maakt niks uit.
Zoals je ziet heeft eth2 nogal wat overruns. Veel meer dan normaal iig.
Nou heb ik een paar vragen:
- Kan dit komen door een kapotte switch/kabel? Lijkt me dat er dan ook RX overruns moeten komen? Zou ook teveel toeval zijn omdat het random bij elke lijn gebeurd?
- Kan het door een IRQ conflict komen? Alle 3 de kaartjes hebben aparte IRQ's en voor zover ik het kan vinden heeft geen ander device hetzelfde IRQ als een 3com kaartje.
- Zou het hardware of softwarematig kunnen zijn, wat is het meest logische?
Dan nog een los vraagje:
Klopt het dat een 66MHz PCI bus 133 MB/s kan verwerken maximaal?
Als 3 NICS dan 36 mb/s doen, en de HDDs ook nog 36MB/s, dan zou dat toch geen bottleneck moeten kunnen zijn?
Wat ik op internet kon vinden over het TX probleem was dat het aan meerdere dingen kon liggen, CPU is sowieso te langzaam want die is constant op 100% bezig, maar dat zou dit probleem niet moeten veroorzaken. Is het trouwens ook normaal dat eth0 geen base adress heeft
Elke ander hulp is zeer welkom!
Specs:
XP 2400+ / 1gb ram
3x 3c905C-TX/TX-M
Promise Technology Ultra133TX2 pci card met 4x hdds in raid0.
Het probleem is dat er constant 1 van de 3 nics TX overruns krijgt en dan niet meer data kan verwerken. elk nieuw pakketje wat je erheen stuurt word als TX overrun erbij getelt.
Enige oplossing is dan het pid van de eth killen en restarten.
De ene keer gebeurd dit na een dag of 2, de andere keer na 2 uur. Of er veel of geen data overheen word gestuurd maakt niks uit.
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
| eth0 Link encap:Ethernet HWaddr 00:0A:5E:99:99:99
inet addr:123.123.123.1 Bcast:123.123.123.123 Mask:255.255.254.0
UP BROADCAST NOTRAILERS RUNNING MULTICAST MTU:1500 Metric:1
RX packets:1708925 errors:0 dropped:0 overruns:1 frame:0
TX packets:893008 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:936930331 (893.5 Mb) TX bytes:984265574 (938.6 Mb)
Interrupt:4
eth1 Link encap:Ethernet HWaddr 00:0A:5E:99:99:99
inet addr:123.123.123.2 Bcast:123.123.123.123 Mask:255.255.254.0
UP BROADCAST NOTRAILERS RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4024572 errors:0 dropped:0 overruns:410 frame:0
TX packets:3035881 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:3743860819 (3570.4 Mb) TX bytes:3341367168 (3186.5 Mb)
Interrupt:10 Base address:0x2000
eth2 Link encap:Ethernet HWaddr 00:0A:5E:99:99:99
inet addr:123.123.123.3 Bcast:123.123.123.123 Mask:255.255.254.0
UP BROADCAST NOTRAILERS RUNNING MULTICAST MTU:1500 Metric:1
RX packets:3999900 errors:0 dropped:0 overruns:26307 frame:0
TX packets:3099537 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:3576199827 (3410.5 Mb) TX bytes:3343934965 (3189.0 Mb)
Interrupt:12 Base address:0x4000 |
Zoals je ziet heeft eth2 nogal wat overruns. Veel meer dan normaal iig.
Nou heb ik een paar vragen:
- Kan dit komen door een kapotte switch/kabel? Lijkt me dat er dan ook RX overruns moeten komen? Zou ook teveel toeval zijn omdat het random bij elke lijn gebeurd?
- Kan het door een IRQ conflict komen? Alle 3 de kaartjes hebben aparte IRQ's en voor zover ik het kan vinden heeft geen ander device hetzelfde IRQ als een 3com kaartje.
- Zou het hardware of softwarematig kunnen zijn, wat is het meest logische?
Dan nog een los vraagje:
Klopt het dat een 66MHz PCI bus 133 MB/s kan verwerken maximaal?
Als 3 NICS dan 36 mb/s doen, en de HDDs ook nog 36MB/s, dan zou dat toch geen bottleneck moeten kunnen zijn?
Wat ik op internet kon vinden over het TX probleem was dat het aan meerdere dingen kon liggen, CPU is sowieso te langzaam want die is constant op 100% bezig, maar dat zou dit probleem niet moeten veroorzaken. Is het trouwens ook normaal dat eth0 geen base adress heeft
Elke ander hulp is zeer welkom!
57696520646974206c65657374206973206e657264