• K4F
  • Registratie: Juli 2008
  • Laatst online: 21:15
Hallo, :)
Jammer genoeg heb ik sinds enige dagen problemen met m'n linux bak en ik ben benieuwd of iemand er misschien een touw aan vast kan knopen.

De situatie is als volgt. Na een uptime van 450+ dagen een spontane reboot. Mijn eerste gok was een power failure maar dit bleek niet het geval. Een ochtend later, weer rond hetzelfde tijdstip, bleek de server weer gerestart zonder dat er iets in de logs van vermeld was. (vandaar ook mijn eerste gedachte dat er stroomproblemen waren)
Daarbij komt ook nog het gekke dat na de reboots de server weer prima werkte, na enkele uren begint de server zeer schommelende latencies te laten zien van 10 ms tot 250+ (vanaf thuis en ook andersom naar div hosts extern en op dezelfde switch). Pingen naar localhost gaat prima met 0.0x ms.

Omdat het me tot 2 keer toe nu is opgevallen dat ik bepaalde config files na de reboot moest wijzigen (gewijzigd password voor een service), kom ik uit bij de volgende stap. Na de 2 reboots heb ik hetzelfde bestand gewijzigd, blijkbaar is na de reboot het bestand terug veranderd of nooit weggeschreven??!

Even opsommend dus mijn probleem. Ongevraagde reboots sinds enkele dagen, gewijzigde config bestanden blijken nooit gewijzigd te zijn (pas na een restart pas terug naar oude situatie) en een zeer schommende latency na enkele uren (vlak na de restart tot enkele uren daarna is alles normaal).

Ik heb geen cron jobs toegevoegd de laatste maanden en er word ook niet domweg ergens de opdracht gegeven om te restarten.

Op dit moment begin ik zeer te twijvelen aan de schijfcontroller, met name door de "ongewijzigde" config bestanden. Heb al een korte memtest gedraaid die geen fouten leek aan te geven, hoewel het natuurlijk geen echte stresstest is. De temperaturen van de bak zijn normaal ,<40 graden, en de voltages van de psu (supermicro) probeer ik nog na te kijken maar vereist eigenlijk een nieuwere kernel.

Het beestje is een Debian Etch bak (van vroegah, ik weet het O-)), sata, amd x2.

Wat denken jullie, word het tijd om te kijken naar een nieuw mobo, schijf, alles... of moet ik het ergens anders zoeken?

Verwijderd

Ik gok mobo die kaduuk is.

  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 18-02 13:27

CAPSLOCK2000

zie teletekst pagina 888

Het klinkt mij ook als een hardwareprobleem in de oren
Kijk eens in het Hangen en Opstartproblemen topic.
Aangezien dit een hardwareprobleem lijkt te zijn verplaats ik dit topic naar PMG.

This post is warranted for the full amount you paid me for it.


  • K4F
  • Registratie: Juli 2008
  • Laatst online: 21:15
Hoewel er al sinds 48 uur geen spontane reboot is geweest heb ik nog eens gekeken naar waar de bottleneck ligt. Ik heb gekeken naar iowait, cpu load, geheugen en eth interface en kan geen schrikbarende waardes ontdekken. De temperaturen zijn volgende de sensor normaal @ 40 graden.

Afbeeldingslocatie: http://img705.imageshack.us/img705/1627/pingth.png

Hier een paar venstertjes waar misschien iemand iets in kan ontdekken, ik zie in ieder geval geen waardes die erg uit het lood liggen. Van iowait is bijna geen sprake dus ik begin toch weer te twijvelen. (de 2 services die aanzienlijk veel cpu% gebruiken draaien zoals ze altijd draaien, dit is normaal. Het probleem doet zich ook voor zonder die services)
Als ik een trace route doe zie ik ook echt heel duidelijk dat pas de laatste hop een erg hoge latency heeft, andere servers in het rack hebben een prima ping van ~ 10 ms.

  • vanaalten
  • Registratie: September 2002
  • Laatst online: 18-02 18:30
Gezien je laatste post heb ik de indruk dat je zelf nog twijfelt tussen een hard- of softwareprobleem (mijn gevoel zegt hardware, maar goed). De beste aanpak voor het vinden van de oorzaak: mogelijkheden uitsluiten.

Als je inderdaad twijfelt tussen soft of hardware: her-formatteer/installeer je besturingssysteem. Is het opgelost? Mooi, oorzaak gevonden. Zo niet, dan is het een hardware-probleem en zal je toch de hangen/opstarten-troubleshooter moeten gebruiken, dan kom je er niet met software-analyses.

  • K4F
  • Registratie: Juli 2008
  • Laatst online: 21:15
vanaalten schreef op vrijdag 25 maart 2011 @ 19:50:
Gezien je laatste post heb ik de indruk dat je zelf nog twijfelt tussen een hard- of softwareprobleem (mijn gevoel zegt hardware, maar goed). De beste aanpak voor het vinden van de oorzaak: mogelijkheden uitsluiten.

Als je inderdaad twijfelt tussen soft of hardware: her-formatteer/installeer je besturingssysteem. Is het opgelost? Mooi, oorzaak gevonden. Zo niet, dan is het een hardware-probleem en zal je toch de hangen/opstarten-troubleshooter moeten gebruiken, dan kom je er niet met software-analyses.
Normaal gesproken zou ik inderdaad maar al te graag even alles opnieuw installeren maar aangezien deze bak in het DC hangt als hobbyserver heb ik hiervoor niet de mogelijkheid. Mocht ik het probleem niet kunnen vinden zal het waarschijnlijk een setje hardeschijven, moederbord en een geheugen upgrade worden met op goed geluk een verse Debian installatie erop. Bedankt voor het meedenken though, ik ga nog even goed alles monitoren.
Pagina: 1