Random uitvallen PC

Pagina: 1
Acties:
  • 136 views sinds 30-01-2008
  • Reageer

  • maleadt
  • Registratie: Januari 2006
  • Laatst online: 13-05 17:56
Hallo mede-tweakers,

Ik heb een oude PC gepromoveerd tot server (van alles en nog wat), maar er scheelt iets mee en ik kan het probleem maar niet vinden... Hopelijk kan iemand me helpen. :)

Wat voor een PC?

Eerst en vooral een beschrijving wat er in de machine huist:
Processor: Pentium III Coppermine (700 MHz, 256KB L2, Family 6 Model 8 Stepping 3)
Moederbord: Asus P3B-F
Voeding: 200W, merk onbekend :)
Grafische kaart: NVidia TNT2 Riva 64 (32MB)
RAM geheugen: 256 MB (128mB + 64MB + 64MB)
Harde schijf: Quantum Fireball 8 (8GB, UDMA2)
CD-ROM: Philips CD-ROM drive, leest aan 48x (prehistorisch model, kan nog niet branden :z)
Extra PCI-kaart: Hauppauge WinTV PVR-150 (non-MCE edition)
Netwerkkaart: Linksys Fast Ethernet 10/100 (Network Everywhere)
OS: Linux: Ubuntu 6.06.1 LTS Server Edition

Wat is het probleem?

Op min of meer willekeurige momenten valt de PC gewoon uit. Geen blue-screen of niks, geen enkele kernelwarning, NIKS. De computer herstart NIET, maar gaat in een pseudo-dode toestand (harde schijf en fans draaien, maar monitor ontvangt geen signaal en het bakje boot niet).
Om de PC daarna terug werkend te krijgen, bestaat er geen vaste methode. De ene keer is stroom-uit stroom-aan genoeg, maar daarnet heb ik alles (PCI kaarten, AGP kaart, RAM-geheugen, processor) er moeten uithalen en opnieuw instoppen en goed aanduwen voordat hij weer verder wou.

Wat heb ik zelf al geprobeerd?

Ongeveer alles :/ daarom juist dat ik jullie mijn probleem voorleg, ik heb gewoon geen gedacht meer hoe of waarom.
Geheugen: getest met memtest86
Resultaat: geen warnings, MAAR memtest86 bleef iedere keer steken @ Test8. Bingo, dacht ik dus. Alle RAM latjes eruit, en apart controleren op die specifieke test. Maar niks van, bij elk latje bleef memtest86 op dezelfde plek steken, niet afhankelijk van mijn RAM-geheugen dus :’(
Moederbord: vervangen door een identiek model (Asus P3B-F)
Moederbord: BIOS-update, tot een bèta-versie toe
Voeding: vervangen door een Chieftec 300W model, werkte perfect in een andere PC
Grafische kaart: vervangen door een 3Dfx Voodoo 3
Harde schijf: vervangen door een Quantum Fireball, de 20gb uitvoering (ook getest met UDMA uitgeschakeld)
Extra PCI-kaart: TV-tuner verwijderd
Netwerkkaart: vervangen door een oud 10Mbs Realtek geval
OS: Ubuntu vervangen door Windows XP
CPU: Opnieuw aanbrengen van CPU koelpasta (max temp <50°)
CPU/Moederbord: Variatie in het VCore voltage (staat stock om minimum 1.65V, omhooggezet tot 1.80V)

Reproductie van het probleem?

Onmogelijk. De ene keer crasht het boeltje tijdens de compilatie van een kleine C applicatie, maar een complete kernel compilen lukt daarentegen probleemloos 8)7 Wat ik al geprobeerd heb:
CPU stress: test CPUBURN-MMX
CPU & Memory stress test: MPEG2 bestand laten hercoderen
NIC stress test: op het netwerk gooien van een continue 10Mbs MPEG2 stream
PVR stress test: enkele uren video en audio laten inlezen, ongecomprimeerd op netwerk gooien, hercoderen & op netwerk gooien

Ik ben echt volledig radeloos, in mijn ogen heb ik ongeveer ALLES geprobeerd. Hopelijk kan iemand mij enig advies geven :)

Alvast bedankt,
MALEADt


PS: Ik heb een beetje geëxperimenteerd met de pagina-layout, kwestie van de functies van het forum beter te leren kennen en de boel aangenamer om lezen te maken :)

[ Voor 1% gewijzigd door maleadt op 10-04-2007 17:51 . Reden: voeding toegevoegd. ]


Verwijderd

Hulde voor je TS, die zien we niet vaak :)
Er is één belangrijk onderdeel waar je geen aandacht aan besteed hebt: de voeding. De problemen die je omschrijft wijzen weliswaar niet overduidelijk op de voeding, maar ik zou toch even proberen met een andere voeding.

  • gerre22
  • Registratie: December 2006
  • Laatst online: 11-03 21:40
Eén ding vind ik niet terug, je voeding. Heb je al eens gekeken wat de voltages zijn op de verschillende lijnen?
Voor de rest heb je zowat alles gehad ja. En nette topicstart! :)

Edit: lap, juist te laat! :p

Ook eens opgezocht wat test8 doet van memtest:

Test 8 [Modulo 20, ones&zeros]

Using the Modulo-X algorithm should uncover errors that are not detected by moving inversions due to cache and buffering interference with the the algorithm. As with test one only ones and zeros are used for data patterns.

[ Voor 51% gewijzigd door gerre22 op 10-04-2007 17:46 ]


  • maleadt
  • Registratie: Januari 2006
  • Laatst online: 13-05 17:56
Bedankt voor reacties! Voeding heb ik ook al vervangen, als 1 van de eerste dingen (nu zit er een Chieftec 300W in). Zal toch even de stabiliteit van de lijnen controleren, daar had ik nog niet aan gedacht :)

EDIT: dit meld lm_sensors in verband met de voeding:
VCore 1: +1.81 Volt
VCore 2: +2.66 Volt
+3.3 Volt: +3.49 Volt
+5 Volt: +5.11 Volt
+12 Volt: +12.04 Volt
-12 Volt: -11.76 Volt
-5 Volt: -5.13 Volt
BIOS-instelling: 1.80 Volt

VCore 2 mag ik buiten beschouwing laten vermoed ik, want er zit een single-core in. In mijn ogen lijken deze waarden correct en maar weinig afwijkend van de norm...

maleadt

[ Voor 53% gewijzigd door maleadt op 10-04-2007 17:57 . Reden: performance voeding toegevoegd. ]


  • gerre22
  • Registratie: December 2006
  • Laatst online: 11-03 21:40
Is dat onder load, of idle? Je kan eens kijken of daar grote fluctuaties tussen zitten, maar dat is al een long shot.

  • Thandor
  • Registratie: Juni 2002
  • Laatst online: 21:19

Thandor

SilverStreak

CSL policy
Vragen over problemen horen hier niet thuis alsmede vragen en/of discussies over een bepaald hardware onderdeel, daar zijn de andere fora voor.
Nette topicstart maar niet de policy lezen hé! ;)

Ik geef dit topic een schopje naar PMG. Het geheugen is niet gegarandeerd goed, de processor net zo min. Er is dus een mogelijkheid dat alle geheugen modules dezelfde problemen geven en/of dat de processor simpelweg defect is en roet in het eten gooit.

Profiel | https://thandor.net - hardware
And the rest of us would be carousing the aisles, stuffing baloney.


  • skelleniels
  • Registratie: Juni 2005
  • Laatst online: 21-05 07:28
Heb je het geheugen ook al in een ander slot getest? De cpu onderklokken kan misschien ook wel eens helpen(ik heb hier een amd k-6 2 550 mhz die ook ineens niet meer stabiel liep. Op 500 mhz loopt die dan wel weer rotsstabiel.)

http://specs.tweak.to/16567


  • maleadt
  • Registratie: Januari 2006
  • Laatst online: 13-05 17:56
@gerre22: ah kijk, weer iets bijgeleerd. Hier de vergelijking tussen idle & load:
Beschrijving: Idle <-> Load
VCore 1: +1.86 Volt <-> +1.79 Volt
VCore 2: +2.64 Volt <-> +2.64 Volt
+3.3 Volt: +3.44 Volt <-> +3.50 Volt
+5 Volt: +5.11 Volt <-> +5.08 Volt
+12 Volt: +12.73 Volt <-> +11.98 Volt
-12 Volt: -11.70 Volt <-> -11.89 Volt
-5 Volt: -5.13 Volt <-> 5.13 Volt
BIOS-instelling: 1.80 Volt
Nog altijd geen spectaculaire verschillen... weer een factor waar het níet aan ligt dus :P

@Skelleniels:
De ram-modules zitten nu in andere sloten gepropt, en atm draait de machine stabiel...
Underclocken is ook een optie, zal ik zeker proberen als het weer misloopt.

@Thandor:
Best die policy es grondig lezen dan O-)
Is het mogelijk om af te leiden in welke staat een processor zich bevindt? Of kan het zijn dat mijn cpu "gewoon" regelmatig crasht door ouderdom zonder dat er iets anders aan te merken valt?

  • maleadt
  • Registratie: Januari 2006
  • Laatst online: 13-05 17:56
Een schopje voor dit topic, want ik heb het probleem gevonden!

Zoals Thandor al suggereerde, lag het probleem inderdaad aan de inmiddels 5 jaar oude processor. Underclocken, overclocken, niets helpte om het random uitvallen van het boeltje tegen te houden. Na vervanging van de processor, draait de computer inmiddels twee weken zonder enig probleem.

Bedankt voor alle reacties, wat mij betreft mag hier dus een slotje op :)
Pagina: 1