Toon posts:

Netwerkconnectie valt af en toe weg

Pagina: 1
Acties:

Verwijderd

Topicstarter
Situatieschets:

Een Dual opteron 248 hangt in een datacenter met een 100mbit/s uplink, deze wordt gebruikt als server voor een aantal multiplayer games.
Sinds vorige week treden komt het steeds vaker voor dat de gameservers voor een paar seconden volledig uit de lucht zijn, om hierna weer terug te keren alsof er niets aan de hand is (soort van extreem lange lag).

Nu heb ik het volgende al gedaan:

Op de server zelf zijn gateway continu laten pingen.
Vanaf 2 andere locaties diezelfde gateway continu pingen.
Vanaf 2 andere locaties de server zelf continu pingen.

Resultaat: Op het moment dat de gameservers niet meer reageren is van buitenaf de server zelf niet meer te pingen, de gateway nog wel.
De server zelf kan zijn eigen gateway ook niet meer pingen, hieruit concludeer ik dat het toch echt aan mijn server ligt.

Als volgende stap heb ik dmv Performance counters een aantal zaken in de gaten laten houden:

Network: Output queue length
Disk: Avg. Queue length
Memory: Pages/sec + Available memory
CPU: % cpu time

Ik had graag willen zeggen dat ik op de momenten dat de verbinding wegviel hier rare dingen zag staan maar dat is helaas niet zo, het meest vreemde vind ik dat de queue length op de netwerkinterface geen rariteiten vertoond.
Persoonlijk heb ik het idee dat de ethernetcontroller de geest aan het geven is, ik kan hier natuurlijk helemaal naast zitten.

Komende zaterdag ga ik als ik eindelijk gevonden heb wat het probleem is / nuttige suggesties gekregen heb naar het datacenter om werk te verrichten aan de server (ik begin allereerst met het gebruiken van een andere netwerkkaart in de server).

Het is momenteel ontzettend onvoorspelbaar wanneer de server dit gedrag vertoond, hij doet dit dan ook max. een keer of 10 per dag (voornamelijk in de avond uren).
De hoeveelheid dataverkeer heeft totaal geen invloed in mijn ogen aangezien het gebeurt wanneer er een bandbreedteverbruik van 400kb/s (up+down) is maar ook als er maar 10kb/s (up+down) verstookt wordt.

Iemand enig idee wat ik hier nog aan zou kunnen testen / veranderen?

  • BlackWhizz
  • Registratie: September 2004
  • Laatst online: 03-03 11:49
Specs? Het kan natuurlijk aan je LAN kaart liggen.

Verwijderd

Topicstarter
BlackWhizz schreef op woensdag 16 juli 2008 @ 18:02:
Specs? Het kan natuurlijk aan je LAN kaart liggen.
Wat voor specs wou je weten?
Je weet dat het om serverhardware gaat, je weet dat de machine een 100mbit uplink heeft en dat het aan de lan kaart zou kunnen liggen gaf ik zelf ook al aan.


Dit even terzijde, ik loop net toevallig tegen een periode van veel uitval aan en merk dat toch de pages/sec en de avg disk queue behoorlijk oploopt op het moment dat het ding onbereikbaar is.
Ik zal wat hd benchmarks draaien en de resultaten hier laten weten.


Voor de volledigheid:

Tyan

2GB KINGSTON ECC REG DDR400
TYAN TRANSPORT GX28
DUAL AMD OPTERON 248
1x WD CAVIAR 80GB
1x WD CAVIAR 160GB

Ondanks het feit dat het mainboard, geheugen en proc goede serverhardware is is er destijds toch gekozen voor desktop hardeschijven, simpelweg omdat er weinig schijfperformance nodig is en de server in bezit is van een vriendengroep (dus ook niet teveel mag gaan kosten, aanschaf van de hardware was destijds behoorlijk prijzig).

Verwijderd

Topicstarter
Tijdens het heen en weer gooien van bestanden (+- 10gb per stuk) tussen de verschillende schijven en op de schijven zelf zie ik ook weer de pages/sec avg. queue length omhoog schieten, dit keer zonder dat de verbinding wegvalt.
Wat mij betreft kan ik de harde schijven dus gaan schrappen qua mogelijke oorzaak.
Harddisk benchmarks met hdtune laten verwachtte resultaten zien qua snelheid op beide disks, smart status is ook in orde voor beide schijven.

  • Vicarious
  • Registratie: Juni 2008
  • Laatst online: 24-06-2024

Vicarious

☑Rekt | ☐ Not rekt

Niet gewoon iets simpels als een duplex mismatch? Staan beide kanten vast op 100 mbps full duplex? Automagisch detecteren levert nog wel eens problemen op, vooral als de ene kant op 100 mbps full staat ingesteld en de andere kant op auto.

Vicariously I live while the whole world dies


Verwijderd

Topicstarter
Hmm, mijn kant staat op auto, zal hem eens vastzetten op full duplex, kijken of dat helpt.

Verwijderd

Topicstarter
Het probleem is eindelijk boven water, het probleem bleek bij een switch van het datacenter te liggen.
Uiteindelijk waren zelfs alle netwerkpoorten permanent onbereikbaar.
Sinds de provider de switch vervangen heeft zijn er geen problemen meer opgetreden.

Miscshien wel een oud topic, maar het vermelden wel waar denk ik ;)
Pagina: 1