Toon posts:

Linux loopt onverklaarbare wijze vast.

Pagina: 1
Acties:

Verwijderd

Topicstarter
Hallo,

1 van mijn servers die in 1 van onze racks hangt in een datacenter die loopt onverklaarbaar vast.
Die server is van een klant, maar we kunnen er geen oplossing voor vinden.

Hij word gebruikt voor 1 enkele sites en wat downloads. Wel gewilde downloads. Nu word er constant ftp opgebruikt (ftp server) en dat gaat zonder problemen, enkele dagen terug is er een download opgezet van fedora 6 en is er een anonymous ftp aangemaakt, zodat die public te downloaden was, na paar minuten loopt server vast.

Staat anonymous ftp uit dan gaat het dagen goed, zet je dat account aan dan loopt hij binnen paar uur vast.
Het enige dat veranderd word is dat er even een wachtwoord op dat account gezet word.
Nu staat hij op max 10 connecties op anonymous dus dat zou ook het probleem niet mogen zijn, en de processor belasting staat meestal op 0.01 of 0.02 dus hij is ook niet overbelast en hij beschikt over 768 MB DDR waarvan 314 werd gebruikt volgens de server.

In logfiles zie ik ook niks. Wanneer hij eenmaal vastloopt is hij zelfs niet meer te pingen en moet ik echt met behulp van de powerswitch een hard reboot uitvoeren.

En soms gebruikt de server tussen 60 a 70 mbit per sec zonder problemen, dus daar ligt ook niet aan.

Iemand enig idee waar ik nog naar kan kijken.

Het gaat om een:
AMD Athlon 2800+
768DDR
en asus serverboard
Linux fedora 3

Alvast bedankt
p.s: er draait DirectAdmin op met apache en php 4,4,4.

Verwijderd

Tja, je server knalt er geheid uit met een kernel panic. Het beste is om na je colo te gaan een monitor aan je server te prikken, anonymous ftp weer inschakelen en hopen dat je server gaat crashen. Misschien dat er een bug in je kernel zit oid? Of misschien problemen met je tcp buffers.

  • Wilke
  • Registratie: December 2000
  • Nu online
Bij het vastlopen schrijft 'ie ook niks in de logs (vlak voor het crashen, dus)? /var/log/messages, of als die uitgesplitst wordt (metalog) even zoeken waar de relevante kernel-meldingen terecht zouden komen.

Er is zo nog een beetje weinig informatie om te gokken waar het aan ligt. Met wat je aangeeft zou het misschien kunnen liggen aan:

a) harddisk (onwaarschijnlijk in dit geval)
b) geheugen (te testen met memtest86; kun je installeren als kernel image, in lilo/grub toevoegen, en dan gewoon booten, is niet moeilijk; echter moet je op locatie zijn)
c) netwerkkaart (of de driver van de netwerkkaart! - gebruik je een onboard ding? Wat is de driver?)
d) voeding (als niks anders helpt, proberen te vervangen..maar da's meestal shotgun-debugging)
e) moederbord (brakke, lekkende, ontplofte capacitors?)
f) software fout of exploit (?) - maar is onwaarschijnlijk dat die nou net met het anonymous account te maken zou hebben. Je kunt toch even rondbladeren voor de zekerheid...(FC3 is niet bepaald de nieuwste versie; wel security updates geinstalleerd?)

Ik heb gepoogd ze in de volgorde te zetten waarin ik het zou testen. Niet per se de volgorde van waar het waarschijnlijk aan ligt, maar in oplopende moeilijkheidsgraad van uitvoerbaarheid. Maar je ziet, hier kun je nog alle kanten mee op...

In het geval dat de netwerkkaart het veroorzaakt, zou ik toch zeker log-meldingen verwachten, zelfs als de kernel daarna crasht (wat eerder een brakke driver zou suggereren, overigens). Idem als het aan een kapotte disk zou liggen; daar crasht linux echter niet zo snel van meestal; in ieder geval zeker niet zonder veel logmeldingen, en als het echt stuk is zou rebooten waarschijnlijk vrij snel ook niet meer werken.

  • cyctech
  • Registratie: Juni 2003
  • Laatst online: 22-11-2025
Ik wil niet heel erg vervelnd doen, maar zelfs de servers van REDHAT liepen vast,
Kortom teveel vraag,

Zeg maar DOS maar dan zonder vooropgezet plan;-)