Ervaring met RAM bottleneck, CPU overhead en draw calls

Pagina: 1
Acties:

Acties:
  • +2 Henk 'm!

  • Trygve
  • Registratie: Oktober 2009
  • Laatst online: 21:47

Trygve

Redacteur
Topicstarter
TLDR/samenvatting: een simpele upgrade van mijn systeemgeheugen heeft een flinke bottleneck weggehaald.

EDIT: de fout zat 'm in de 'uncore ratio' die in de bios op Auto stond. Die had ik op 3400 MHz moeten zetten om alles optimaal te laten draaien. Dus voor de duidelijkheid: mijn grafieken en vergelijkingen laten het verschil zien tussen verkeerde en juiste instellingen van 'uncore ratio', en laten niet het verschil tussen 1333C9 en 1866C9 RAM zien. Bij dat laatste zit een véél kleiner verschil.

Allereerst het overzicht van mijn setup:
#ProductPrijsSubtotaal
1Intel Core i5-4670K Boxed€ 243,95€ 243,95
1Gigabyte GA-Z87-D3HP€ 0,-€ 0,-
1Sapphire R9 280X 3GB GDDR5 OC VAPOR-X€ 0,-€ 0,-
1Cooler Master Hyper 412S€ 34,70€ 34,70
1Corsair CMV4GX3M2A1333C9€ 22,-€ 22,-
2Corsair VS2GB1333D3€ 9,95€ 19,90
1Antec VPF Series 450W€ 52,95€ 52,95
1Crucial MX200 2,5" 250GB€ 79,-€ 79,-
Bekijk collectie
Importeer producten
Totaal€ 452,50


Zoals je ziet heb ik de veelgekozen 4670K als CPU, en de R9 280X als videokaart. Een combinatie die veel waar biedt voor het geld. Toch? Dat klopt, alleen presteerde de 280X niet heftig beter dan mijn vorige videokaart, de HD7850. De upgrade naar de 280X heb ik destijds gedaan om GTA5 met hogere settings, framerates en hogere textures te kunnen spelen. Dat ging met de 280X wel een stuk beter, maar op de texture quality (gerelateerd aan VRAM) na, konden de settings niet echt veel hoger zonder in te leveren op de framerate. Althans, de framerate in bepaalde delen van de spelwereld. In veel gebieden liep het spel wél op 60fps, maar één van gebieden waar de framerate zo nu en dan inzakte naar 35-40 fps is Vinewood Boulevard (afbeelding om aan te geven waar dat is):
Afbeeldingslocatie: https://i.imgur.com/zQNjV4I.jpg

Een lichte overklok door alle CPU-cores op maximaal 4GHz te laten lopen hielp wel wat, maar de storende minimale fps bleven. Bij de zoektocht naar de mogelijke bottleneck keek ik uiteindelijk naar het werkgeheugen, wat voor mij altijd een ondergeschoven kindje is geweest. Ik was in de veronderstelling dat de hoeveelheid RAM eerder een probleem zou zijn dan de snelheid ervan, en dat alleen APU's echt profijt hebben van snel RAM. Daarom gebruikte ik nog steeds 4 reepjes Corsair DDR3 1333MHz in tweemaal dual channel. Dit werkgeheugen heb ik destijds overgezet van mijn oude Phenom-systeem. Ik had het toch nog liggen, en 8GB was voorlopig voldoende, dus waarom niet?

In de Tweakers Pricewatch zag ik dat bij RAM-geheugen standaard de 'true latency' getoond wordt, wat een goede indicatie zou zijn van de prestaties. De true latency reken je als volgt uit:
CAS Latency / Frequentie * 1000 = de echte latency in nanoseconden.

Mijn 4 reepjes Corsair 1333MHz met een CAS latency van 9 hebben dus elk een true latency van: 9 / 667 * 1000 = 13.49 ns. Is dat veel, is dat weinig? Ik ging op zoek in de Pricewatch naar vergelijkingsmateriaal. Daar kwam ik na wat filteren de betaalbare Crucial Ballistix Tactical BLT2CP4G3D1869DT1TX0CEU tegen; twee reepjes van 1866 MHz met een CAS latency van 9. Hiervan is de true latency dus 9 / 933 * 1000 = 9.65 ns. Enkel door de hogere klokfrequentie ligt in dit geval de true latency lager. Ik besloot ze gewoon maar te bestellen en te proberen of het verschil zou maken. Hieronder zie je de resultaten.

1333MHz, CAS9, 2x dual channel
Afbeeldingslocatie: https://i.imgur.com/1eXaW4s.png

1866MHz, CAS9, dual channel
Afbeeldingslocatie: https://i.imgur.com/5CnuroR.png
Met de upgrade van het RAM is de latency volgens AIDA gehalveerd, en de leessnelheid met bijna 10.000 MB/s toegenomen. Vanwege de Trial-versie kan ik de (toename in) schrijf- en kopieërsnelheid helaas niet zien.

Maar dan GTA5, daar ging het mij tenslotte om. Toen het spel was opgestart had ik onmiddelijk door hoe groot het verschil was, buttery smooth in vergelijking met eerder! Dit verschil zou in de benchmark vast ook wel naar voren komen. Laten we voor het beste inzicht naar de percentielen kijken:
Afbeeldingslocatie: https://i.imgur.com/qK2D8to.png
Kijk, dat laat het verschil goed zien. Door de RAM-upgrade zijn nu in ieder geval 95% van de frames in het zwaarste deel van de benchmark (pass 4) 16.6ms of lager, waardoor ik het grootste deel van de tijd van de volle 60fps kan genieten. Er blijft ruimte voor verbetering, want het mooiste zou zijn als die lijn kaarsrecht doorloopt onder de 16.67ms.

Naast GTA5 was het ook merkbaar in games zoals Far Cry 4, Tomb Raider (2013) en Dying Light; een véél groter deel van de tijd blijft het spel draaien op 60fps. Om de 280X goed aan het werk te krijgen was dus zonder twijfel sneller werkgeheugen nodig dan ik eerder had. De 4670K blijkt zeker in staat om de 280X van voldoende instructies te voorzien, alleen was het voorheen bij mij de processor die moest wachten op het werkgeheugen. Een benchmark die dit mooi illustreert is de 3DMark API Overhead feature test:
1333MHz, CAS9
Afbeeldingslocatie: https://i.imgur.com/pWLwkJ7.png

-----
En vervolgens 1866MHz, CAS9
Afbeeldingslocatie: https://i.imgur.com/Vq7R0ck.png

In DX11 is het aantal draw calls 60-70% toegenomen.

Nu kom ik aan het eind van deze post. Ik ben natuurlijk ontzettend blij met deze verbetering, en baal er ergens van dat ik dit niet eerder heb gedaan. Ik heb geleerd dat latency, klokfrequentie en bandbreedte weldegelijk belangrijk zijn om een gebalanceerde 'gaming pc' samen te stellen. Tegelijkertijd zit ik met nog meer vragen:
  • Wat is een betrouwbare manier om er achter te komen of (de snelheid van) werkgeheugen de bottleneck is?
  • Zou de afhankelijkheid van snel werkgeheugen verschillen tussen AMD en nVidia (in relatie tot CPU overhead)?
  • Kan het zijn dat de geheugencontroller op de cpu sneller overstuur raakt van 4 reepjes geheugen dan van 2?
  • Wat zijn jullie ervaringen en tips met betrekking tot dit onderwerp en de bijbehorende valkuilen?
Ongetwijfeld zullen er reacties komen over mijn verkeerde redeneringen, onjuiste terminologieën, etc. Ook die zijn van harte welkom :) Dat is het mooie aan alle expertise op GoT, iedereen kan er van leren.

[ Voor 6% gewijzigd door Trygve op 18-06-2016 13:43 ]


Acties:
  • 0 Henk 'm!

Verwijderd

• Kan het zijn dat de geheugencontroller op de cpu sneller overstuur raakt van 4 reepjes geheugen dan van 2?
DUAL channel werkt het best met 2 sloten gevuld ook al heb je er 4
2x2gb is altijd better als 4x1gb op een dual channel bord

quad channel werkt het beste met 4 niet 8

waarom dat zo is weet ik ook niet precies miss omdat het daarom dual channel heet ?

Acties:
  • +1 Henk 'm!

  • Xant0r
  • Registratie: April 2007
  • Laatst online: 13-08 09:00
Leuke post en interessant resultaat. Toen je over GTA5 begon wist ik al meteen waar de drops in fps voorkwamen, die straat krijgt mijn systeem namelijk ook over de zeik als ik mijn grafische settings wat hoger zet :P. Zelfde kaart, alleen een wat oudere cpu (i5 760 @ 4.0ghz). Van weekend misschien zelf eens benchmarkje draaien met wat verschillende ram clocks, heb mijn geheugen namelijk trager lopen om mijn cpu oc bij te houden.

Acties:
  • 0 Henk 'm!

  • Trygve
  • Registratie: Oktober 2009
  • Laatst online: 21:47

Trygve

Redacteur
Topicstarter
Ben benieuwd wat de uitkomsten bij jouw vergelijkingen zijn. Grappig dat het zo herkenbaar is bij dat onderdeel. Ik heb nu pas zelf gemerkt dat de 280X nog best goede prestaties levert, ik mag van mijzelf dus voorlopig nog even niet upgraden ;)

Acties:
  • 0 Henk 'm!

  • Trygve
  • Registratie: Oktober 2009
  • Laatst online: 21:47

Trygve

Redacteur
Topicstarter
Xant0r schreef op dinsdag 14 juni 2016 @ 18:54:
Van weekend misschien zelf eens benchmarkje draaien met wat verschillende ram clocks, heb mijn geheugen namelijk trager lopen om mijn cpu oc bij te houden.
Als je RAM gewoon normaal/goed is ingesteld met normale snelheden en latencies zou er niks aan de hand moeten zijn. Ik kwam er namelijk achter dat er iets misgaat bij mij als het RAM (ook m'n nieuwe) op 1333MHz loopt. Ergens ging er bij mij iets mis met de north bridge, waarbij ook de snelheid van het L3- en L2-cache enorm inzakte. Hier is het verschil bij mij:

Crucials op 1333MHz, 4760K @4GHz:
Afbeeldingslocatie: https://i.imgur.com/D9iU6f8.png

Crucials op 1866MHZ (XMP), 4670K @4GHz:
Afbeeldingslocatie: https://i.imgur.com/9fxwwz0.png

Dat ik daar pas na twee jaar achter kwam :F

Acties:
  • 0 Henk 'm!

Verwijderd

Dus je had gewoon de verkeerde instellingen op je ram ? Dan is het toch niet zo vreemd dat het niet goed werkt ?

Acties:
  • 0 Henk 'm!

  • Trygve
  • Registratie: Oktober 2009
  • Laatst online: 21:47

Trygve

Redacteur
Topicstarter
Mijn oude RAM was wel goed ingesteld. Het liep op 1333MHz met de CAS latency van 9; precies volgens de aangegeven specificaties van de fabrikant. Er gebeurt iets anders qua instellingen waardoor het suboptimaal draait, dit gebeurt ook als ik met m'n nieuwe RAM kies voor 1333MHz. Wat die instelling(en) is/zijn, weet ik niet precies, maar die frequentie van de North Bridge zakt dan in ieder geval compleet in.
Het werkt nu prima, dus er is bij mij eerlijk gezegd weinig motivatie om nog tijd te steken in het vinden van de eerdere oorzaak.

EDIT: de fout zat 'm in de 'uncore ratio' die in de bios op Auto stond. Die had ik op 3400 MHz moeten zetten om alles optimaal te laten draaien. Dus voor de duidelijkheid: mijn grafieken en vergelijkingen laten het verschil zien tussen verkeerde en juiste instellingen van 'uncore ratio', en laten niet het verschil tussen 1333 en 1866 MHz RAM zien. Bij dat laatste zit een véél kleiner verschil.

[ Voor 40% gewijzigd door Trygve op 18-06-2016 13:41 ]

Pagina: 1