Zeer infrequente hardwareproblemen lokaliseren

Pagina: 1
Acties:

  • MadEgg
  • Registratie: Februari 2002
  • Laatst online: 17:49

MadEgg

Tux is lievvv

Topicstarter
Ik heb een PC geassembleerd (inventaris: ProbleemPC) en daar Windows 8 op geïnstalleerd voor een kennis. Build is geïnspireerd door een pricewatch van een jaar geleden.

Helaas functioneert het niet helemaal zoals het zou moeten. Heel zelden start het systeem niet goed op en geeft Windows 8.1 een foutmelding. De eigenaar heeft dit netjes genoteerd en kwam op de volgende lijst van foutmeldingen:

2 x kernel security check failure
1 x memory management
1 x critical proces died
1 x driver irql not less or equal

Hier hebben we het dus over een periode van een aantal maanden bij frequent gebruik van de PC. Na deze foutmeldingen is het altijd een kwestie van het systeem rebooten waarna het weer werkte.

Tot vier weken geleden, toen was Windows 8.1 stuk. Herstellen mbv systeemherstel gaf een foutmelding, met de installatiemedia lukte dit ook niet. Uiteindelijk heb ik een schone setup gedaan op de PC, en hem eens grondig uitgetest.

Passmark burn-in test heb ik gebruikt en geeft géén foutmeldingen. Memtest86+ heeft dagen staan draaien en geeft geen foutmeldingen. Daarna heb ik Prime95 gedraaid. Hierbij heb ik in drie weken tijd twee keer een foutmelding (afrondingsfout in Prime95 zelf, niet van Windows) weten te produceren, na een uur of 5 draaien. Echter, in diezelfde periode heeft hij ook meerdere malen enkele dagen achter elkaar staan stampen zonder fouten.

Ik heb getracht om het probleem te lokaliseren door drivers uit te schakelen, maar aangezien hij het soms ook al meerdere dagen deed zonder foutmeldingen kan ik niet met zekerheid zeggen of het enig effect heeft.

Wellicht ten overvloede, maar ik heb alle drivers ge-update naar de laatste versie, de SSD is bijgewerkt met de performance restoration tool van Samsung en de BIOS is ook bijgewerkt naar de laatste versie.

Wat kan ik hier nu mee? Ik wil graag het probleem oplossen, maar het is dermate lastig te reproduceren dat ik geen idee heb hoe ik het kan lokaliseren. Tips zijn van harte welkom!

Tja


  • Rann
  • Registratie: November 2010
  • Laatst online: 31-01 17:22
Zelf een tijd geleden ook zoiets gehad, is toch vaak dan een moederbord probleem (of voeding die het probleem in het mobo heeft veroorzaakt). Dat is uiteraard lastig testen, zit er überhaubt een degelijke voeding in?

  • Silent7
  • Registratie: November 2004
  • Laatst online: 12-12-2024
Ja dit lijkt inderdaad een mobo dingetje.
SSD al getest (HD Tune)? dat zou ook nog kunnen

  • MadEgg
  • Registratie: Februari 2002
  • Laatst online: 17:49

MadEgg

Tux is lievvv

Topicstarter
Rann schreef op woensdag 01 juli 2015 @ 10:18:
zit er überhaubt een degelijke voeding in?
Van het lijstje: pricewatch: be quiet! System Power 7 300W

Zou voldoende moeten zijn voor dit systeem, en goede reviews. Wel degelijk dus.

HDTune zal ik eens gaan draaien. SMART-status heb ik wel uitgelezen en Windows heeft ook een volledige bad sector scan gedaan mbv chkdsk, dus ik vermoed dat de SSD wel in orde is, maar meer testen kan geen kwaad natuurlijk.

Tja


  • Format-C
  • Registratie: Maart 2005
  • Laatst online: 00:43

Format-C

Tracing Rays

Kan je de dump bestanden nog terug vinden en eventueel verder uitpluizen?

Zie hier: http://www.overclock.net/...lysis-and-debugging-guide

Edit; aangezien je aangeeft dat windows ineens stuk was, verdenk ik de SSD. Heb t zelf ook wel eens gehad met OCZ Vertexen.


Wat je ook nog zou kunnen proberen is alle BIOS voltages en instellingen (bijv RAM timings (+2T), RAM voltage, CPU voltage) handmatig op voorgeschreven fabrieks instellingen te zetten.

Edit; heb je na het updaten van alle software en drivers ook nog problemen gehad? Of alleen daarvóór?

Waardeloos, dit soort spook problemen. }:|

[ Voor 62% gewijzigd door Format-C op 01-07-2015 11:25 ]

Ducati 899 Panigale / CM MB511 RGB/ 7800X3D @ ML360R RGB/ RTX5090 Phantom/ Gbyte B650 GAMING PLUS/ 32GB G.Skill Z5 6000 CL30 / Team M2 1TB/ 990Pro M2 1TB/ MX500 1TB/ 5TB SATA / Gbyte WBAX200/ Corsair 1000w/ Scarlett Solo / AOC AG493UCX/ LG 65" OLED TV


  • MadEgg
  • Registratie: Februari 2002
  • Laatst online: 17:49

MadEgg

Tux is lievvv

Topicstarter
Helaas, dumpfiles zijn niet meer beschikbaar.

Ik ben nu weer met de PC in kwestie bezig, ik zal eerst eens HD Tune gaan draaien om te kijken of er daar nog wat aan mankeert.

BIOS voltages en timings op voorgeschreven settings zetten zal ik proberen. Lastig is echter dat de problemen sowieso al schaars zijn, dus voordat ik weet of het daadwerkelijk effect heeft ben ik dan weken verder ben ik bang.

Ik zou graag een methode hebben om de problemen te vergroten zodat ik ze betrouwbaar kan reproduceren. Maar goed, eerst de SSD maar eens testen.

Bedankt voor de suggesties!

Tja


  • MadEgg
  • Registratie: Februari 2002
  • Laatst online: 17:49

MadEgg

Tux is lievvv

Topicstarter
Vreemd. HD Tune gaf eerst geen problemen aan bij de health check. Bij de deze run gaf hij 3 damages 45 MB areas aan. Bij een rerun gaf hij wederom geen problemen aan. Wat ik daarvan moet denken?

Daarna nog 3dMark gedraaid. Buiten een bedroevende score (Deze PC scoort beter dan 0% van de geteste systemen...), geen problemen, artefacts en dergelijke. Een paar keer herhaald, niets aan het handje.

Daarna nog de suggestie gekregen om Aida64 te draaien, met de system stability test. Deze heb ik aangeslingerd met álle tests (inclusief SSD), en binnen 2 uur had ik een BSOD te pakken, voor de eerste keer dat ik het zelf voor elkaar kreeg: CLOCK_WATCHDOG_TIMEOUT. Ben nu aan het kijken of ik met de gerefereerde guide nog iets uit de bijbehorende dumpfile kan afleiden.

Daarna ook Aida64 weer gestart met alle tests behalve de SSD, en dat heeft inmiddels ~16 uur zonder problemen gedraait. Daarna nog een uur of 2 met SSD, maar toen geen foutmeldingen. HD Tune is ook nog steeds tevreden.

Helaas heb ik dus nog steeds geen reproduceerbaar probleem gevonden.

Update:

Crash analysis is niet behulpzaam:
System Uptime: 0 days 0:20:11.646
Loading Kernel Symbols
...............................................................
................................................................
......................
Loading User Symbols
PEB is paged out (Peb.Ldr = 00000000`7ffdf018). Type ".hh dbgerr001" for details
Loading unloaded module list
.............
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 101, {60, 0, ffffd0005c375180, 1}

*** ERROR: Module load completed but symbols could not be loaded for aswMonFlt.sys
Probably caused by : Unknown_Image ( ANALYSIS_INCONCLUSIVE )

Followup: MachineOwner
---------
0: kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

CLOCK_WATCHDOG_TIMEOUT (101)
An expected clock interrupt was not received on a secondary processor in an
MP system within the allocated interval. This indicates that the specified
processor is hung and not processing interrupts.
Arguments:
Arg1: 0000000000000060, Clock interrupt time out interval in nominal clock ticks.
Arg2: 0000000000000000, 0.
Arg3: ffffd0005c375180, The PRCB address of the hung processor.
Arg4: 0000000000000001, 0.

Debugging Details:
------------------


BUGCHECK_STR: CLOCK_WATCHDOG_TIMEOUT_2_PROC

DEFAULT_BUCKET_ID: WIN8_DRIVER_FAULT

PROCESS_NAME: aida64.exe

CURRENT_IRQL: d

ANALYSIS_VERSION: 6.3.9600.17336 (debuggers(dbg).150226-1500) amd64fre

STACK_TEXT:
fffff801`ba067c88 fffff801`b87efecf : 00000000`00000101 00000000`00000060 00000000`00000000 ffffd000`5c375180 : nt!KeBugCheckEx
fffff801`ba067c90 fffff801`b86c0f67 : 00000000`00000000 00000000`00000000 00000000`00000001 ffffe000`00000000 : nt! ?? ::FNODOBFM::`string'+0xad0f
fffff801`ba067d20 fffff801`b861c67f : 00000000`00000001 00000000`00000000 fffff801`b86689b0 00000000`00000000 : nt!KeClockInterruptNotify+0x787
fffff801`ba067f40 fffff801`b875b143 : fffff801`b8668900 00000000`00000000 ffffd000`58706c80 fffff801`b87d5d87 : hal!HalpTimerClockInterrupt+0x4f
fffff801`ba067f70 fffff801`b87d612a : fffff801`b8668900 fffff801`b8987180 00000000`00000005 00000000`00000000 : nt!KiCallInterruptServiceRoutine+0xa3
fffff801`ba067fb0 fffff801`b87d650f : ffffe000`e56f3300 00000000`568cbafb fffff801`b8987180 ffffd000`23047a10 : nt!KiInterruptSubDispatchNoLockNoEtw+0xea
ffffd000`230479c0 fffff801`b86afb2f : ffffe000`e610ab28 ffffd000`23047b90 00000000`00000000 ffffc001`e68b22d0 : nt!KiInterruptDispatchLBControl+0x11f
ffffd000`23047b50 fffff801`b86afa29 : 00000000`00000000 00000000`036aa352 00000000`00000000 00000000`00000000 : nt!KxFlushEntireTb+0xbf
ffffd000`23047b90 fffff801`b86e48d0 : 00000000`00000001 00000000`036aa352 ffffd000`23047e20 00000000`000001fb : nt!KeFlushTb+0x12d
ffffd000`23047cb0 fffff801`b86e76d6 : 00000000`00000000 00000000`00000001 00000000`036aa352 00000000`00000001 : nt!MiFlushTbList+0x300
ffffd000`23047df0 fffff801`b86c6267 : 00000000`00000005 00000000`00000000 00000000`00000005 00000000`00000000 : nt!MiFlushTbAsNeeded+0xe6
ffffd000`23047f30 fffff801`b86c5590 : 00000000`00000002 00000000`00000000 00000000`00005000 00000000`00000000 : nt!MiAllocatePoolPages+0x14b
ffffd000`23047f80 fffff801`b8928973 : 00000000`00000000 00000000`00000000 ffffe000`00000000 ffffc001`ef106be0 : nt!ExpAllocateBigPool+0xd0
ffffd000`23048070 fffff800`6434eb97 : ffffe000`e5f747e0 00000000`00000000 00000000`00000002 00000000`00000000 : nt!ExAllocatePoolWithTag+0xa83
ffffd000`23048140 fffff800`6434effb : ffffc001`e8534010 ffffc001`e8534010 ffffd000`23048301 ffffd000`23048300 : aswMonFlt+0x1b97
ffffd000`23048190 fffff800`64354f82 : ffffc001`e8564e60 ffffd000`23048300 00000000`00000000 ffffe000`e64feb58 : aswMonFlt+0x1ffb
ffffd000`23048200 fffff800`6436b374 : ffffc001`e8564e60 ffffd000`23048398 ffffd000`23048398 00000000`00000000 : aswMonFlt+0x7f82
ffffd000`23048230 fffff800`620989d7 : ffffe000`e64fea00 ffffd000`23048398 ffffe000`e64feb58 ffffe000`e64fec78 : aswMonFlt+0x1e374
ffffd000`23048350 fffff800`6209914d : ffffe000`e60c5500 ffffc001`e7965000 ffffe000`e471d618 00000000`00000000 : fltmgr!FltpPerformPostCallbacks+0x2d7
ffffd000`23048420 fffff800`62097bc1 : ffffe000`e64fea80 ffffe000`e64fea98 ffffe000`e69d0780 ffffe000`e64fea80 : fltmgr!FltpPassThroughCompletionWorker+0x7d
ffffd000`23048490 fffff800`620c0349 : ffffd000`23048570 ffffe000`e64fea80 ffffe000`e69d03e0 ffffe000`e47df880 : fltmgr!FltpLegacyProcessingAfterPreCallbacksCompleted+0x371
ffffd000`23048530 fffff801`b8aa6dd1 : 00000000`00000000 00000000`00000085 00000000`00000000 00000000`00000000 : fltmgr!FltpCreate+0x339
ffffd000`230485e0 fffff801`b8b2ddc4 : 00000000`00000000 00000000`00000000 00000000`00000000 ffffe000`e3fb7a70 : nt!IopParseDevice+0x6c1
ffffd000`23048800 fffff801`b8abb6b3 : 00000000`00000000 ffffd000`230489a8 ffffe000`00000040 ffffe000`e3ccab00 : nt!ObpLookupObjectName+0x784
ffffd000`23048930 fffff801`b8ad44db : 00000000`00000001 ffffe000`e68bd8d8 00000000`00000001 00000000`00000020 : nt!ObOpenObjectByName+0x1e3
ffffd000`23048a60 fffff801`b8ad415c : 00000000`086ce818 00000000`80100080 00000000`086cf0d0 ffffe000`e60248c0 : nt!IopCreateFile+0x36b
ffffd000`23048b00 fffff801`b87e04b3 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!NtCreateFile+0x78
ffffd000`23048b90 00007ffd`5db0171a : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiSystemServiceCopyEnd+0x13
00000000`086ce7a8 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x00007ffd`5db0171a


STACK_COMMAND: kb

SYMBOL_NAME: ANALYSIS_INCONCLUSIVE

FOLLOWUP_NAME: MachineOwner

MODULE_NAME: Unknown_Module

IMAGE_NAME: Unknown_Image

DEBUG_FLR_IMAGE_TIMESTAMP: 0

IMAGE_VERSION:

FAILURE_BUCKET_ID: CLOCK_WATCHDOG_TIMEOUT_2_PROC_ANALYSIS_INCONCLUSIVE

BUCKET_ID: CLOCK_WATCHDOG_TIMEOUT_2_PROC_ANALYSIS_INCONCLUSIVE

ANALYSIS_SOURCE: KM

FAILURE_ID_HASH_STRING: km:clock_watchdog_timeout_2_proc_analysis_inconclusive

FAILURE_ID_HASH: {5f48d231-8e44-ce72-5515-b1876b99bd63}

Followup: MachineOwner
---------
User symbols zijn niet beschikbaar, analysis is inconclusive. Ik zie alleen een referentie aan een Avast Antivirus-bestand, maar die lijkt niet per sé als de schuldige aangewezen te worden.

[ Voor 106% gewijzigd door MadEgg op 03-07-2015 22:37 ]

Tja

Pagina: 1