Elcheapo NIC's in hotplug PCI-X slot: regelmatige timeouts

Pagina: 1
Acties:

  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Al van het begin af zijn mijn website en forum op mijn IBM Netfinity 8500R webserver om ongeveer de 2 uur voor 1 à 5 minuten onbereikbaar en er is gedurende deze periode een onverklaarbare CPU load op de MRTG statistieken te zien. Ik zie helaas helemaal niks in de eventviewer van W2K Server danwel de errorlog van Apache (staat op DEBUG ingesteld). Ook laat de Netfinity Director software van IBM niks bijzonders zien.

Ik verdenk de combinatie netwerkkaart -- hotplug PCI-X sloten. Ik had namelijk diverse netwerkkaarten geprobeerd die ik hier nog heb rondslingeren: tweemaal 3com 3C900B 10Mbit, tweemaal Realtek RTL8139C 100Mbit en eenmaal Realtek RTL8029AS 10Mbit. De 3coms legden direct het loodje na ~2 uur activiteit. Als in: ze werden zomaar uitgeschakeld zodat je ze bij wijze van spreken gerust uit de hotplug PCI slot kunt trekken. Alle drie de Realteks werden ook zomaar uitgeschakeld, maar na 1 à 5 minuten herleven ze, in tegenstelling tot de 3coms.

Om netwerkuitvallers exact te timen had ik even snel een .bat bestandje in elkaar geprutst dat ongeveer elke 5 seconde een 1-packet ping doet vanuit de Realtek RTL8139C netwerkkaart in de webserver naar de Linksys WAG54G ADSL modem/router. Hiervan worden alle timeouts gelogd naar een .txt bestandje. Ziehier het resultaat sinds vanavond:
20:13:25,84 Request timed out.
20:28:26,40 Request timed out.
20:43:28,71 Request timed out.
20:58:30,64 Request timed out.
21:13:32,64 Request timed out.
21:28:32,93 Request timed out.
21:43:33,43 Request timed out.
21:58:34,92 Request timed out.
22:13:35,79 Request timed out.
22:28:36,60 Request timed out.
22:43:38,43 Request timed out.
22:58:39,70 Request timed out.
23:13:42,60 Request timed out.
23:28:44,60 Request timed out.
23:43:41,60 Request timed out.
23:58:42,89 Request timed out.
Wel erg opvallend; om het kwartier is de webserver zegmaar onbereikbaar, maar die komt dus snel terug, want er komt elke keer na 5 seconden geen timeout meer. Ook is de server sindsdien niet meer om ongeveer de 2 uur voor 1 à 5 minuten onbereikbaar, wat voorheen wel het geval was. Ook zijn de onverklaarbare CPU loads uit de MRTG statistieken verdwenen. Schijnbaar houden de pings de Realtek 'levend' 8)7

Ik heb in de online documentatie van de 3com en de Realteks gekeken en nergens wordt er gerept over hotplug-compatibiliteit. Daarom overweeg ik een NIC, waarvan de hotplug-compatibiliteit wél is gedocumenteerd, omdat ik denk dat dit het probleem zal oplossen. Vóórdat ik een kleine 100 euro spendeer aan een leuke 3Com 3C996B-T Gigabit Server NIC, wil ik graag even van ervaringsdeskundigen horen of dit dé oplossing kan zijn. Ik kan iig nergens op GoT vergelijkbare problemen vinden. Ook al zal de 3com het ruim waard kunnen zijn, maar het zou best wel lullig zijn als het probleem blijft voortbestaan ;) Al helemaal omdat ik nog geen concrete verklaring heb voor de ping timeouts die zich om zowat exact 15 minuten voordoen én dat dit de NIC 'levend' houdt.

  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Een probleem als dit heb ik nog nooit meegemaakt eigenlijk, maar ik moet zeggen dat ik tot nu toe ook nog 1 server met hotswap pci sloten onder handen ehb gehad.
Die had overigens geen problemen met de standaard realtek, intel en 3com kaarten.

Maar ik zou ook niet weten wat het anders nog kan zijn in dit geval :P

Overigens, dat 3Com kaartje is sowieso geen slechte koop, echt een geweldige kaart.
Enne, op GoT zullen er sowieso weinig mensen zijn die problemen hebben met hotswap pci sloten, er zijn simpelweg weinig mensen met dat soort hardware ;)

Blog [Stackoverflow] [LinkedIn]


  • silverstorm
  • Registratie: Februari 2005
  • Laatst online: 31-03 11:05

silverstorm

tearing me apart

Iets met spaarstand/standy? Ik heb ooit een rare situatie gezien dat het fout ging met 3com kaartjes. Hoe het toen precies zat, weet ik niet meer. Maar altijd even het checken waard dacht ik.

Poverty stole your golden shoes, but it din’t steal your laughter
Fools memorize, smart people make notes

Het sysadmin irc-cafe


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Spaarstand/standby op een server? :P Helaas, dit is het ook niet. Screensaver staat uitgeschakeld (@default W2K Server) en de power options staat op 'Always on' waarbij enkel de (niet-aanwezige :+ ) monitor wordt uitgeschakeld na 20 minuten.

  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Dat kan het nog best wel zijn BalusC, kijk eens bij de hardware details en dan de eigenschappen van de netwerkkaart, daar zitten misschien ook power options.

Blog [Stackoverflow] [LinkedIn]


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Link Down Power Saving -- Disable
Dit is eigenlijk alles wat ik mbt power opties kan vinden. Voor de rest zijn het slechts performance en wakeup instellingen.

Vergis je trouwens niet over de activiteit van de server: deze webserver is zowat voortdurend actief. In totaal worden er atm netto (bots enzo dus niet meegeteld) 2000 à 2500 pageviews per dag gedaan en ongeveer 200MB per dag getransporteerd. Ik zie geen enkele reden dat de webserver zich tot rust zou brengen.

[ Voor 49% gewijzigd door BalusC op 28-12-2005 02:14 ]


  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Ik bedoel eigenlijk het vinkje "Allow the computer to turn off this device to save power"

Staat die aan/uit?

Blog [Stackoverflow] [LinkedIn]


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Dat zie ik nergens staan? Ik heb trouwens geen Power Management tab in de NIC-properties zitten, alleen General-Advanced-Driver-Resources.

Verwijderd

Staat power management ook uit in de BIOS? hotplug PCI is altijd net weer effe wat spannender dan consumentenspul en ik heb bij een (ondertussen trouwens antieke) Compaq Proliant ook eens gezien dat ie af en toe een NIC uit gooide omdat het mobo een bugje in de firmware had. Dat was wel béta firmware, dat moet er wel even bij gemeld worden. Ik zit nu trouwens te twijfelen of die NIC wel in een hotplug slot zat.

[ Voor 4% gewijzigd door Verwijderd op 28-12-2005 14:43 ]


  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

BalusC schreef op woensdag 28 december 2005 @ 10:25:
Dat zie ik nergens staan? Ik heb trouwens geen Power Management tab in de NIC-properties zitten, alleen General-Advanced-Driver-Resources.
Blijkbaar heeft niet alle hardware/elke windowsversie die mogelijkheid, ik zal zo wel eventjes een screentje uppen van wat ik bedoel (als ik de windowsbak op m'n werk kan bereiken tenminste)

Afbeeldingslocatie: http://img334.imageshack.us/img334/9188/nic1vn.gif

[ Voor 13% gewijzigd door Wolfboy op 28-12-2005 20:29 ]

Blog [Stackoverflow] [LinkedIn]


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Late reactie, ik wilde eigenlijk wachten tot de noodzaak om de server te herstarten. Welnu, dat is gisteren gebeurd ;)
Verwijderd schreef op woensdag 28 december 2005 @ 14:42:
Staat power management ook uit in de BIOS? hotplug PCI is altijd net weer effe wat spannender dan consumentenspul en ik heb bij een (ondertussen trouwens antieke) Compaq Proliant ook eens gezien dat ie af en toe een NIC uit gooide omdat het mobo een bugje in de firmware had. Dat was wel béta firmware, dat moet er wel even bij gemeld worden. Ik zit nu trouwens te twijfelen of die NIC wel in een hotplug slot zat.
Er staat dus niks in de BIOS :/
Wolfboy schreef op woensdag 28 december 2005 @ 20:22:
[...]
Blijkbaar heeft niet alle hardware/elke windowsversie die mogelijkheid, ik zal zo wel eventjes een screentje uppen van wat ik bedoel (als ik de windowsbak op m'n werk kan bereiken tenminste)

[afbeelding]
Duidelijk. Deze tabblad staat helaas niet in de props van de Realtek NIC.

Andere ideeën? Zou die nieuwe nog te bestellen 3com Gigabit Server NIC trouwens ook echt gaan helpen ivm occifieel gedocumenteerde hotplug-compatibiliteit, denken jullie?

  • Wolfboy
  • Registratie: Januari 2001
  • Niet online

Wolfboy

ubi dubium ibi libertas

Aangezien het hotpluggen gewoon een mogelijkheid van de PCI 1.1 specificatie is kan ik me eigenlijk niets anders bedenken dan dat de kaarten of niet PCI 1.1 compliant zijn, of dat er ergens een bug in de firmware/drivers moet zitten.
Heb je niet de mogelijkheid om eventjes een pci-x netwerkkaart te lenen van iemand ofzo?
Als het helpt, ik heb zelf twee Alteon PCI-X fiber kaartjes (in m'n werkstation en server) die je opzich wel zou mogen lenen van me :)
Dan ga ik wel even over op koper gbit ;)

Het zou kunnen dat een niet pci-x kaart gewoon niet lekker met hot-plug kan samenwerken ofzo, hoewel het volgens de standaard niet het geval zou mogen zijn :/

Blog [Stackoverflow] [LinkedIn]


  • sphere
  • Registratie: Juli 2003
  • Laatst online: 23:07

sphere

Debian abuser

offtopic:
Je werkt er niet meer, maar heb je niet nog wat connecties bij IBM :P

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454


  • BalusC
  • Registratie: Oktober 2000
  • Niet online

BalusC

Carpe diem

Topicstarter
Welnu, een klein maandje geleden had ik die 3Com 3C996B-T binnen en de problemen waren hiermee geheel opgelost :Y)

Blijft nog wel vaag dat hotplug PCI sloten per-se een hotpluggable kaart lijken te vereisen. Ik dacht dat je er ook wel gewone PCI kaarten erin kunt drukken, maar dat je ze niet runtime moet erin cq eruittrekken.
Pagina: 1