Toon posts:

[Debian] Linux laat mijn pc constant crashen

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik heb een beetje een probleem. Heb al een hele tijd een server, Debian Linux erop. Sinds de laatste 2 dagen gaf die plotseling IRQ problemen. PC crashed om de paar keer. Ik heb geen idee waarom. 2.6.10 kernel staat erop. En ik wil toch maar aangeven dat deze server dus gewoon een 100 dagen zonder configuratieverschil bios aanpassingen gedraaid heeft. De server draait al een hele tijd de 2.6 kernel dus dat kan het ook niet zijn geweest.

Config:

Athlon 1200 (thunderbird)
KT133A mobo van Asus
20 GB hdd

Wat zou het kunnen zijn?

  • Alex)
  • Registratie: Juni 2003
  • Laatst online: 12-12-2025
Heb je misschien een stroomuitval gehad, en dat zo je BIOS is gereset? Heb je hardwareveranderingen doorgevoerd?

We are shaping the future


Verwijderd

Topicstarter
Nope ik zelfs de bios gereset op fabrieksinstellingen...zelfs dat heeft niet geholpen.

  • savale
  • Registratie: Oktober 2000
  • Laatst online: 08:53
grote kans dat er een hardware failure is... geheugen misschien...bad sectors op je schijf, pci kaartje naar de (A$#__)@# ja ik noem maar even wat op :)

  • Bergen
  • Registratie: Maart 2001
  • Laatst online: 27-01 12:55

Bergen

Spellingscontroleur

begin maar eens bij 't geheugen.... www.memtest86.com is je vriend

[ Voor 9% gewijzigd door Bergen op 17-03-2005 22:15 . Reden: com, niet org ]


  • AlterEgo
  • Registratie: Juli 2001
  • Niet online
KT133 ? Rotte elco's op het moederbord?

Verwijderd

Netwerkkaart ?

Mijn debian bak knalde er ook steeds vaker uit, nadat het geheugen was volgelopen. De sweex nics eruit gegooid, 3c905 erin en zo stabiel als wat :)

Verwijderd

Topicstarter
Nou hij is nu eindelijk weer een 2 uurtjes stable....
Ik heb in de bios de Promise ATA100 controller aangezet...(auto ipv disabled)

Ondanks dat het in linux geen ruk uitmaakt want hij ziet de controller ondanks dat.
Maar dat is dus de verandering en zo te zien werkt het nu.

Maar ja dit is natuurlijk niet genoeg, ik wil wel is weten of dat ook echt de reden is....
Het is idd een klote bord ik weet het...

Want als die plotseling met IRQ problemen komt aanzetten en de kernel crashed....
Wat me wel opviel is dat er een bericht komt bij het opstarten cq laden van de kernel dat een bepaalde pci procedure binnen de kernel herschreven is....

Maar goed probleem zelf opgelost zo te zien....

Ander vraagje btw...
Als ik bind9 herstart of gewoon start dan doet die tegelijk fetchmail herstarten en squid de config herladen... :? :? :?

Dit is echt het vaagste wat ik ooit gezien heb...
Het is niet zo dat ik er last van heb maar het is wel heel vaag...

Verwijderd

Topicstarter
Verwijderd schreef op donderdag 17 maart 2005 @ 22:26:
Netwerkkaart ?

Mijn debian bak knalde er ook steeds vaker uit, nadat het geheugen was volgelopen. De sweex nics eruit gegooid, 3c905 erin en zo stabiel als wat :)
Er zit een realtek in (B of C) 8139 in en een 3com 3c59x netwerkkaart...10 mbit geleverd door chello toen ik kabel kreeg in 2000 of zo....

Wel problemen mee gehad, linux wilde mijn 2e netwerkkaart niet detecteren maar dat is opgelost door een bios upgrade...

  • Tatsu
  • Registratie: Augustus 2000
  • Niet online

Tatsu

Paradigm shift

Post eens de output van dmesg. :)
En als ik jou was, zou ik inderdaad ook even checken naar bolstaande elco's op het betreffende moederbord. Kwam er laatst ook nog weer een tegen op een soortgelijk bord, mooi even een soldeerprojectje van maken. :P

[ Voor 77% gewijzigd door Tatsu op 18-03-2005 09:45 ]

If someone begins with uncertainty, experience will eventually lead to certainty. But what defines certainty?


Verwijderd

Topicstarter
Oke hij is dus weer gecrashed maar nu kon ik gelukkig nog het laatste beetje code opvangen voordat de console in schermbeveiliging ging:

Ik krijg een lijst van geladen modules te zien...
CPU:0
EIP: 0060:[<c01bcb86>] Not Tained VLI
EFlags: 00010046 (2.6.10-1-k7
EIP is at vsnprintf+0x246/0x440
Eax: 355b00c0 ebx: 00000010 ecx: 00000000 edx: 0000006c
esi: c0389123 edi: 00000010 ebp: c038951f esp: c0355a7b
ds: 007b es: 007b ss: 0068
process swapper (pid:0, threadinfo=c0354000, task=c02dcb00)
ik krijg een hex code van stack hierna
ook hieronder enkele hex code van call trace
<kernel panic - not syncing: Fatal exception in interrupt>

Nou ja ik wist dat ik een probleem had met de interrupt maar ik kan nog steeds niet uitvinden welke dat nou kan zijn....

Kan het een probleem zijn met de netwerkkaart?? Deze pc dient als gateway voor internet, mail en een fileserver...

Verwijderd

Topicstarter
Tatsu schreef op vrijdag 18 maart 2005 @ 09:44:
Post eens de output van dmesg. :)
En als ik jou was, zou ik inderdaad ook even checken naar bolstaande elco's op het betreffende moederbord. Kwam er laatst ook nog weer een tegen op een soortgelijk bord, mooi even een soldeerprojectje van maken. :P
Denk je dat er onderdeeltjes op mijn mobo kaput zijn dan?

Verwijderd

Lijkt op een mem probleem zoniet kun je inderdaad gelijk je mobo of de l2 cache in twijfel gaan trekken,hardware wijzigingen in bios door een reset kunnen zo'n probleem toch niet veroorzaken in Debian ?? O-)

  • killercow
  • Registratie: Maart 2000
  • Laatst online: 12-02 10:50

killercow

eth0

kt133 (en alle andere border uit die tijd zo'n beetje) hebben enorm last van slechte capacitors, De borden van bijvoorbeeld abit deden het vaak niet langer dan 1/1.5 jaar.

Je kunt het controlleren door even in de buurt van die groene busjes te ruiken (stinkt het naar pis, dan ben je de lul), of als de bovenkant open staat (kruisjes op de bovenkant open), of als er aan de onderkant zwart gruis uit de onderkant komt.

openkat.nl al gezien?


Verwijderd

Topicstarter
killercow schreef op vrijdag 18 maart 2005 @ 11:00:
kt133 (en alle andere border uit die tijd zo'n beetje) hebben enorm last van slechte capacitors, De borden van bijvoorbeeld abit deden het vaak niet langer dan 1/1.5 jaar.

Je kunt het controlleren door even in de buurt van die groene busjes te ruiken (stinkt het naar pis, dan ben je de lul), of als de bovenkant open staat (kruisjes op de bovenkant open), of als er aan de onderkant zwart gruis uit de onderkant komt.
Ik zal zeker even controleren op geheugen...via memtest86
En als dat niets oplevert dan even kijken naar mobo..

Het is wel raar dat dit in eens gebeurt...
PC draait namelijk al 4 jaar...

Nou en mocht het mobo toch naar de kut zijn dan wordt het gewoon een nieuw of 2e hands bordje kopen...

[ Voor 8% gewijzigd door Verwijderd op 18-03-2005 11:07 ]


  • vanheemst
  • Registratie: November 2002
  • Laatst online: 09:19
Is een bekend probleem!
Zoek eens met google op "EIP is at vsnprintf"

Zit in Dcache! en lijk een BUG te zijn in de gcc compiler.

  • Tatsu
  • Registratie: Augustus 2000
  • Niet online

Tatsu

Paradigm shift

vanheemst schreef op vrijdag 18 maart 2005 @ 11:06:
Is een bekend probleem!
Zoek eens met google op "EIP is at vsnprintf"

Zit in Dcache! en lijk een BUG te zijn in de gcc compiler.
Mja, kan dus een probleem zijn, maar niet het probleem. Door middel van de aangegeven eventuele problemen uit te sluiten door middel van eliminatie kan de topicstarter het eigenlijke probleem lokaliseren.

If someone begins with uncertainty, experience will eventually lead to certainty. But what defines certainty?


Verwijderd

Topicstarter
vanheemst schreef op vrijdag 18 maart 2005 @ 11:06:
Is een bekend probleem!
Zoek eens met google op "EIP is at vsnprintf"

Zit in Dcache! en lijk een BUG te zijn in de gcc compiler.
Ja dat zou kunnen want ik laat regelmatig mijn debian upgraden

Welke packetten bevatten deze bug dan precies....

[ Voor 10% gewijzigd door Verwijderd op 18-03-2005 16:46 ]


  • Ultraman
  • Registratie: Februari 2002
  • Laatst online: 12:51

Ultraman

Moderator Harde Waren

Boefje

Bug in Dcache. Dus de compiler cache om het compilen te versnellen. Als daar een bug in zit kunnen die natuurlijk ook doorgegeven worden aan alles wat je compiled. Maar het lijkt me dan dat je een compile error krijgt.
Ik zou als ik jou was ff nachtje memtest en dan je mobo checken.
Als dat alles het niet is dan zou ik alles ff uit die pc trekken en zo kaal mogelijk booten. Doet ie het dan goed? Vervolgens alle onderdelen 1 voor 1 gaan aansluiten en proberen. Kom je er denk ik wel achter wat het veroorzaakt.

Als je stil blijft staan, komt de hoek wel naar jou toe.


Verwijderd

Topicstarter
Nou memtest geeft geen foutmelding iig...
Dus ik heb er nu een nieuw netwerkkaartje ingezet...
Daar moet ik nog even aan werken en kijken of dat misschien de oorzaak is.

Verwijderd

Topicstarter
Nou de crashes beginnen nu wel heel irri te worden en gaan zich steeds verder achter elkaar opvolgen. Ik denk dat het mobo dan ook daadwerkelijk het probleem is. Enkel ik moet zeker weten dat het mobo het onderdeel is dat de problemen ook daadwerkelijk veroorzaakt, hoe doe ik dat precies...?

Verwijderd

Topicstarter
Met memtest nog maar een keer getest ging hij nu wel errors geven. Echter hij liep ook vast...
Met een nieuw reepje geheugen erin hangt die zelfs keer op keer met de foutmelding Unexpected interrupt - halting....

Wat zal nu het probleem zijn?

  • Ultraman
  • Registratie: Februari 2002
  • Laatst online: 12:51

Ultraman

Moderator Harde Waren

Boefje

Jeetje.
Als ik jou was zou ik je pc zo volledig mogelijk strippen. Dus alle hardware er af en alleen de basics er aan. Mobo,CPU,RAM,Video,keyboard, event. muis. Het minimale dat je nodig hebt om op te starten en vanuit daaruit gaan kijken. Crasht hij nog steeds? Dan is het een van die onderdelen, aan de hand van de foutmelding en waar die die geeft even kijken. Loop hij beter dan onderdeel voor onderdeel op gaan bouwen tot je het probleem weer hebt.
Maar eh heb je je condensatoren nou gecheckt want ik kan nergens terug vinden dat die ook echt goed zijn. Maak eventueel een goede foto van je bord en post die hier ook even.

Als je trouwens even wat dingen erbij wilt zetten post dan niet 2x achter jezelf maar gebruik dan even de Afbeeldingslocatie: http://gathering.tweakers.net/global/templates/tweakers/images/icons/edit.gif knop. Is wel zo netjes ;)

Als je stil blijft staan, komt de hoek wel naar jou toe.


Verwijderd

Topicstarter
Ja condensatoren zijn gecheckt en zijn volgens mij goed...geen smurrie aan de onderkant en ze zitten er nog goed op.

Na nog een keer getest te hebben met een andere voeding, dezelfde fout...geen melding gewoon hangen in memtest.

Ik had nu alleen aangesloten:

Videokaart: standaard ati Rage 128
CDROM speler voor het opstarten van memtest
Geheugen: Wat overigens al getest is
Proc
en mobo

Er blijven nu voor mij 2 onderdelen over die het kunnen zijn de proc of het mobo dat is nu wel uitgesloten. Een foto zal ik later misschien nog ff sturen!

  • LollieStick
  • Registratie: Juni 2001
  • Laatst online: 15-12-2025
Verwijderd schreef op dinsdag 22 maart 2005 @ 12:03:
Een foto zal ik later misschien nog ff sturen!
Dat zal wel mooi zijn. Misschien zien wij iets wat jij niet ziet :)

Verwijderd

Topicstarter
Nog even een update voordat ik ga maffen! Ik heb me bedacht om een Athlon XP 1800+ erin te zetten. Deze had ik namelijk nog over. De pc deed er niet moeilijk over en met een terugschakeling van de FSB op 100 MHZ deed mijn pctje er niet moeilijk over. Memtest crashte niet, maar ik kreeg toch nog veel errors bij memtest toen die het geheugen teste. Wat betekent dit nu voor mijn pc?

Verwijderd

Dat je geheugen brak is?

  • BoAC
  • Registratie: Februari 2003
  • Laatst online: 12:40

BoAC

Memento mori

Nieuw geheugen erin en weer testen met memtest :)
Heb hetzelfde probleem gehad toen 1 van m'n bankjes het had begeven :(

  • Ultraman
  • Registratie: Februari 2002
  • Laatst online: 12:51

Ultraman

Moderator Harde Waren

Boefje

Ik begin toch richting je RAM te neigen. Aangezien die het de ene keer wel goed doet en dan weer niet. Brak geheugen zou de crashes veroorzaken en de compile fouten waar gcc van gaat hangen.

Als je stil blijft staan, komt de hoek wel naar jou toe.


Verwijderd

Topicstarter
cybersteef schreef op woensdag 23 maart 2005 @ 19:16:
Ik begin toch richting je RAM te neigen. Aangezien die het de ene keer wel goed doet en dan weer niet. Brak geheugen zou de crashes veroorzaken en de compile fouten waar gcc van gaat hangen.
Nou ja de RAM is denk ik idd wel brak, het zijn echter wel 2 reepjes. Eentje kwam uit een andere PC, maar beiden hadden wel compile fouten. Nu er echter een nieuwe processor in zit liep Memtest echter niet meer zomaar vast. Dus dat was wel een constatering.

Maar voor de duidelijkheid, die Dcache bug in Debian....daar heb ik dus niets mee te maken. Ik was niet eens aan het compilen toen de kernel crashte, Die server was toen gewoon idle en is eigenlijk hele tijd idle wanneer die vastloopt. Hij kan gewoon een bepaald IRQ niet sync'en. Ik ga het proberen met deze CPU en misschien met nieuw geheugen....

Daarna Debian proberen opnieuw te installeren en als ik dan nog veel fouten krijg dan denk ik dat mijn mobo dood is en dan weet ik het in principe zeker.
Pagina: 1