Hallo,
Jammer genoeg heb ik sinds enige dagen problemen met m'n linux bak en ik ben benieuwd of iemand er misschien een touw aan vast kan knopen.
De situatie is als volgt. Na een uptime van 450+ dagen een spontane reboot. Mijn eerste gok was een power failure maar dit bleek niet het geval. Een ochtend later, weer rond hetzelfde tijdstip, bleek de server weer gerestart zonder dat er iets in de logs van vermeld was. (vandaar ook mijn eerste gedachte dat er stroomproblemen waren)
Daarbij komt ook nog het gekke dat na de reboots de server weer prima werkte, na enkele uren begint de server zeer schommelende latencies te laten zien van 10 ms tot 250+ (vanaf thuis en ook andersom naar div hosts extern en op dezelfde switch). Pingen naar localhost gaat prima met 0.0x ms.
Omdat het me tot 2 keer toe nu is opgevallen dat ik bepaalde config files na de reboot moest wijzigen (gewijzigd password voor een service), kom ik uit bij de volgende stap. Na de 2 reboots heb ik hetzelfde bestand gewijzigd, blijkbaar is na de reboot het bestand terug veranderd of nooit weggeschreven??!
Even opsommend dus mijn probleem. Ongevraagde reboots sinds enkele dagen, gewijzigde config bestanden blijken nooit gewijzigd te zijn (pas na een restart pas terug naar oude situatie) en een zeer schommende latency na enkele uren (vlak na de restart tot enkele uren daarna is alles normaal).
Ik heb geen cron jobs toegevoegd de laatste maanden en er word ook niet domweg ergens de opdracht gegeven om te restarten.
Op dit moment begin ik zeer te twijvelen aan de schijfcontroller, met name door de "ongewijzigde" config bestanden. Heb al een korte memtest gedraaid die geen fouten leek aan te geven, hoewel het natuurlijk geen echte stresstest is. De temperaturen van de bak zijn normaal ,<40 graden, en de voltages van de psu (supermicro) probeer ik nog na te kijken maar vereist eigenlijk een nieuwere kernel.
Het beestje is een Debian Etch bak (van vroegah, ik weet het
), sata, amd x2.
Wat denken jullie, word het tijd om te kijken naar een nieuw mobo, schijf, alles... of moet ik het ergens anders zoeken?
Jammer genoeg heb ik sinds enige dagen problemen met m'n linux bak en ik ben benieuwd of iemand er misschien een touw aan vast kan knopen.
De situatie is als volgt. Na een uptime van 450+ dagen een spontane reboot. Mijn eerste gok was een power failure maar dit bleek niet het geval. Een ochtend later, weer rond hetzelfde tijdstip, bleek de server weer gerestart zonder dat er iets in de logs van vermeld was. (vandaar ook mijn eerste gedachte dat er stroomproblemen waren)
Daarbij komt ook nog het gekke dat na de reboots de server weer prima werkte, na enkele uren begint de server zeer schommelende latencies te laten zien van 10 ms tot 250+ (vanaf thuis en ook andersom naar div hosts extern en op dezelfde switch). Pingen naar localhost gaat prima met 0.0x ms.
Omdat het me tot 2 keer toe nu is opgevallen dat ik bepaalde config files na de reboot moest wijzigen (gewijzigd password voor een service), kom ik uit bij de volgende stap. Na de 2 reboots heb ik hetzelfde bestand gewijzigd, blijkbaar is na de reboot het bestand terug veranderd of nooit weggeschreven??!
Even opsommend dus mijn probleem. Ongevraagde reboots sinds enkele dagen, gewijzigde config bestanden blijken nooit gewijzigd te zijn (pas na een restart pas terug naar oude situatie) en een zeer schommende latency na enkele uren (vlak na de restart tot enkele uren daarna is alles normaal).
Ik heb geen cron jobs toegevoegd de laatste maanden en er word ook niet domweg ergens de opdracht gegeven om te restarten.
Op dit moment begin ik zeer te twijvelen aan de schijfcontroller, met name door de "ongewijzigde" config bestanden. Heb al een korte memtest gedraaid die geen fouten leek aan te geven, hoewel het natuurlijk geen echte stresstest is. De temperaturen van de bak zijn normaal ,<40 graden, en de voltages van de psu (supermicro) probeer ik nog na te kijken maar vereist eigenlijk een nieuwere kernel.
Het beestje is een Debian Etch bak (van vroegah, ik weet het
Wat denken jullie, word het tijd om te kijken naar een nieuw mobo, schijf, alles... of moet ik het ergens anders zoeken?
