Vraag


Acties:
  • +1 Henk 'm!

  • pwitteveen
  • Registratie: Oktober 2022
  • Laatst online: 12-09-2024
Ik heb een probleem met een 'MSI Radeon RX 6800 gaming z trio 16g'

Deze GPU lijkt instabiel en zorgt voor systeem crashes.


De GPU wordt normaal gesproken gebruikt in het game-systeem van een goede vriend van mij die mij met enige regelmaat om raad en hulp vraagt bij PC problemen.
Hij heeft het volgende systeem:

Intel Core i5 12600KF
32 GB DDR4
Radeon RX 6800 16GB (De verdachte GPU)
Een higher end Gigabyte mainboard met PCIe-4/5 support
(Extra info volgt zodra ik die weer beschikbaar heb)
Corsair RMe 750W voeding

Noemenswaardig is ook dat de PSU qua wattage misschien op het randje is en dat de airflow/koeling van de kast wat te wensen overlaat.
Er zijn case fans, maar die zijn vanwege kosten besparing en een hergebruikte kast suboptimaal geplaatst.
De CPU koeler is ooit stuk gegaan en de nieuw geplaatste CPU fan is een niet RPM te controleren case fan die voorhanden was die continu op max RPM draait.

Er zijn 2 QuadHD monitors aangesloten plus een FullHD TV.
(Display Port, TV via HDMI)


Het oorspronkelijk waargenomen probleem is dat zijn systeem vastloopt.
De HMDI TV geeft een volledig groen scherm weer, de DP monitors een volledig zwart scherm.
Het geluid van de TV valt ook weg en een brom is te horen.
Kort daarna gaat het systeem uit.

Ik heb dit probleem ter plekke kunnen reproduceren.
Het eerste waar ik aan dacht was oververhitting of misschien een slijtende PSU.
We hebben een gloednieuwe 850W voeding ingebouwd die ik had liggen, maar daarmee crashte het systeem nog steeds.
Daarna hebben we de settings van AMD Adrenaline nagelopen en voor een tijd de zero fan speed uit gezet en de temperatuur in de gaten gehouden, maar soms bij 44 graden al een crash.

We hebben ook de Windows 11 updates nagelopen en geverifieerd dat de laatste AMD driver actief was via de Adrenaline software.
Nadat een BIOS update en het herplaatsen van de GPU ook niet hielpen heb ik mijn oude RX 6600 XT in het systeem geplaatst.
Tot heden werkt het systeem daarmee zonder crashes of andere problemen.

Ik heb toen de MSI RX 6800 mee naar huis genomen om te testen.

De GPU heeft dezelfde instabiliteit in de volgende systemen:

Intel Core i3-12100F
32 GB DDR4
Gigabyte B660M DS3H DDR4
Cooler Master MWE GOld 850W

Met:
Windows 11, met de laatste AMD driver
Opensuse Tumbleweed met de laatste MESA open source driver
Debian 12, dezelfde open source driver


AMD Ryzen 5 5600X
32 GB DDR4
Gigabyte b550m aorus pro-p
Sharkoon WPM Gold Zero 750W

Met:
Windows 10, met de laatste AMD driver en de Adrenalin 24.5.1 (WHQL Recommended) uit april


Ik heb gedurende een aantal dagen de GPU getest met gaming en soms met een YouTube playlist die ik tot een uur laat lopen.
De temperatuur blijft normaal (36-39 graden idle, bij gamen niet boven de 76 graden), geen beeldartefacten of lage performance.
(Het verschil in graden tussen de algehele temperatuur en de 'hotspot' temperatuur was slechts enkele graden in gpuZ)
(Getest op 1440P en 1080P)
Vroeg of laat, dus na ongeveer 30 minuten of anderhalf uur, vind er een crash plaats van het gehele systeem waarbij ook de audio meteen of na 30 seconden weg is.
(Audio via HDMI, maar ook getest met een losse geluidskaart en Display Port kabel)
Het lijkt niet uit te maken of er full load wordt gewerkt of niet.

Ik heb ook nog via Adrenaline geprobeerd voorzichtig te undervolten met de automatische undervolt knop, Maar daarmee crashte het systeem binnen minuten.
Nieuwe of oude drivers lijken ook het verschil niet te maken, alsmede het OS.
Resizeable BAR staat aan, ik heb BIOS settings verder ook nagelopen.
Bij het plaatsen van de GPU in een ander systeem heb ik het primaire 16x PCIe slot gebruikt en zorgvuldig de power kabels aangesloten en gecontrolleerd.
Ik heb overwogen de kaart van nieuwe firmware te voorzien, maar voor dit specifiek model kon ik geen betrouwbare firmware bron vinden. (Dit model heeft geen fysieke firmware switch helaas)
Opnieuw koelpasta aanbrengen heb ik ook overwogen maar ik wil de garantie sticker niet breken.
Van buiten af geen zichtbare schade zoals een capacitor die bol staat of iets dat doorgebrand lijkt.
De vriend in kwestie heb ik verzocht zijn garantie gegevens erbij te zoeken.


Mijn vraag aan jullie:

Is er nog iets dat ik kan proberen, of zal ik moeten concluderen dat de GPU stuk is?

Buiten het crashen om werkt de GPU nog uitstekend namelijk.

Alle reacties


  • boyette
  • Registratie: November 2009
  • Laatst online: 10:25
Ik lees niets in je verhaal wat duidt op een GPU die stuk is.. waaruit leidt je dat af?

  • Majestici
  • Registratie: Juli 2013
  • Laatst online: 01-04 21:28
Ik draai een overclocked 6800XT en 5800X3D op een 550W voeding. Als er één ding is die vaak serieus overrated wordt is het wel dat.

Garantie breken mbt de sticker is al tijden lang niet meer enforceable. Beetje hetzelfde als de oliedop van je auto verzegelen, je moet gewoon onderhoud kunnen doen. Maar als de temperaturen niet te hoog worden op de core, zie ik dat niet als hoofdoorzaak nummer 1. Maarja, 6800, inmiddels toch wel paar jaar oudt. Vermoed dat zelfs fabrieksgarantie lastig wordt.

Die undervolt, ik zou dat wel eens even handmatig doen, ipv de knop. Iets van 2250mhz @ 1volt moet altijd wel lukken. Kan zijn dat door warmte ergens een slecht contactje komt. Helpt het als je de fans op 100% laat staan?

Zal beetje trial en error worden. Je hebt al hoop geprobeerd, maar het helpt om het wat systematischer aan te pakken mbt de GPU zelf. Dus welke factor de reden is waarom hij crashed. GPU (wellicht soldeerballetje die slecht contact maakt), voeding/powerstages, geheugen, etc.

Afbeeldingslocatie: https://tweakers.net/i/TUeVgNbtgOjtRxg9iWVwrc0zTMI=/800x/filters:strip_exif()/f/image/HUZRCyR2pUeeoIdAaS3Xtz0l.png?f=fotoalbum_large

[ Voor 28% gewijzigd door Majestici op 12-09-2024 00:20 ]


  • FrankoNL
  • Registratie: December 2004
  • Laatst online: 09:32
boyette schreef op woensdag 11 september 2024 @ 23:39:
Ik lees niets in je verhaal wat duidt op een GPU die stuk is.. waaruit leidt je dat af?
Omdat de GPU dezelfde problemen geeft in verschillende systemen?

  • FlowSnake
  • Registratie: Maart 2017
  • Laatst online: 18-04 08:34
Die GPU klinkt inderdaad wel klaar.

Random hard locks, load of geen load, verschillende systemen, is een moeilijk te negeren feit.

Als er nog garantie op zit, zo snel mogelijk claimen. Mocht dat er niet meer opzitten, is het enige idd koelpasta/heatspreader opnieuw positioneren. Misschien dat een van de memory chips/VRM's onvoldoende contact maakte en te heet wordt.

Dan fingers crossed dat het niet al te laat is natuurlijk.

  • DannyXP1600
  • Registratie: Januari 2002
  • Nu online
Zoals je hebt aangetoond dat er iets mis is met je videokaart door hem in verschillende systemen te testen, wat dezelfde problemen geeft in al die systemen, zou je ook nog andersom kunnen proberen of je systeem niet crasht met een andere videokaart erin. Maar dat de videokaart in ieder geval stuk is lijkt mij duidelijk.

  • pwitteveen
  • Registratie: Oktober 2022
  • Laatst online: 12-09-2024
Bedankt voor jullie reacties.

Voor ik afgelopen nacht ben gaan slapen heb ik nog geprobeerd wat Majestici voorstelde.
Althans, daar ben ik mee begonnen.

Ik heb om mee te beginnen het voltage op 1 volt gezet en de maximale kloksnelheid op 2251 mHz zoals gesuggereerd.
Ik heb toen een benchmark tool aangezet om de GPU wat te doen te geven en ben gaan slapen.

Om 6:00 ongeveer werd ik even wakker en toen stond het systeem nog de benchmark uit te voeren. (hij herhaalt zich steeds totdat men 'm cancelled)
Dus dat is al een uptime van op zijn minst 5 uur, wat al een verbetering is.

Om 9:00 vandaag werd ik begroet met het Windows 10 inlogscherm, en volgens de event viewer is er om 7:00 ongeveer een hardware fout geweest. (Zie afbeelding)

Ik heb de foutmelding opgezocht en wat ik er van maak is dat dit een CPU probleem is geweest.
(Processor APIC ID: 08)

Dus ik ga proberen de GPU stabiel te krijgen middels de tweaking settings in Adrenaline.
Mocht er nog garantie zijn dan claimen we die op tijd natuurlijk.
Afbeeldingslocatie: https://tweakers.net/i/qk9ZsusFTz4yiZJJeV1dhkz76og=/full-fit-in/4000x4000/filters:no_upscale():fill(white):strip_exif()/f/image/At3CTbbP6pRT3QKrAiWEhDpN.png?f=user_large

[ Voor 8% gewijzigd door pwitteveen op 12-09-2024 09:55 ]


  • Majestici
  • Registratie: Juli 2013
  • Laatst online: 01-04 21:28
Probeer eens het voltage zo laag mogelijk te krijgen, zie curve. Meestal beneden een kantelpunt kun je best aggressief met het voltage zijn. Zeker onder 2.2ghz is RDNA2 best efficiënt.

Mocht dit steeds meer de stabiliteit verbeteren dan kan het wellicht een of andere choke of mosfet zijn die slecht is, wellicht kan dan thermal pads wisselen wel helpen. Of de fans wat harder zetten.

Maar als het een solderverbinding is dan houdt het op. Re-flowen moet je nooit doen. Desnoods kun je ook eens (heel licht!) ermee wiebelen op de kabels, misschien dat daar een breukje op de connector.

[ Voor 10% gewijzigd door Majestici op 12-09-2024 10:41 ]

Pagina: 1