TLDR/samenvatting: een simpele upgrade van mijn systeemgeheugen heeft een flinke bottleneck weggehaald.
EDIT: de fout zat 'm in de 'uncore ratio' die in de bios op Auto stond. Die had ik op 3400 MHz moeten zetten om alles optimaal te laten draaien. Dus voor de duidelijkheid: mijn grafieken en vergelijkingen laten het verschil zien tussen verkeerde en juiste instellingen van 'uncore ratio', en laten niet het verschil tussen 1333C9 en 1866C9 RAM zien. Bij dat laatste zit een véél kleiner verschil.
Allereerst het overzicht van mijn setup:
Zoals je ziet heb ik de veelgekozen 4670K als CPU, en de R9 280X als videokaart. Een combinatie die veel waar biedt voor het geld. Toch? Dat klopt, alleen presteerde de 280X niet heftig beter dan mijn vorige videokaart, de HD7850. De upgrade naar de 280X heb ik destijds gedaan om GTA5 met hogere settings, framerates en hogere textures te kunnen spelen. Dat ging met de 280X wel een stuk beter, maar op de texture quality (gerelateerd aan VRAM) na, konden de settings niet echt veel hoger zonder in te leveren op de framerate. Althans, de framerate in bepaalde delen van de spelwereld. In veel gebieden liep het spel wél op 60fps, maar één van gebieden waar de framerate zo nu en dan inzakte naar 35-40 fps is Vinewood Boulevard (afbeelding om aan te geven waar dat is):

Een lichte overklok door alle CPU-cores op maximaal 4GHz te laten lopen hielp wel wat, maar de storende minimale fps bleven. Bij de zoektocht naar de mogelijke bottleneck keek ik uiteindelijk naar het werkgeheugen, wat voor mij altijd een ondergeschoven kindje is geweest. Ik was in de veronderstelling dat de hoeveelheid RAM eerder een probleem zou zijn dan de snelheid ervan, en dat alleen APU's echt profijt hebben van snel RAM. Daarom gebruikte ik nog steeds 4 reepjes Corsair DDR3 1333MHz in tweemaal dual channel. Dit werkgeheugen heb ik destijds overgezet van mijn oude Phenom-systeem. Ik had het toch nog liggen, en 8GB was voorlopig voldoende, dus waarom niet?
In de Tweakers Pricewatch zag ik dat bij RAM-geheugen standaard de 'true latency' getoond wordt, wat een goede indicatie zou zijn van de prestaties. De true latency reken je als volgt uit:
CAS Latency / Frequentie * 1000 = de echte latency in nanoseconden.
Mijn 4 reepjes Corsair 1333MHz met een CAS latency van 9 hebben dus elk een true latency van: 9 / 667 * 1000 = 13.49 ns. Is dat veel, is dat weinig? Ik ging op zoek in de Pricewatch naar vergelijkingsmateriaal. Daar kwam ik na wat filteren de betaalbare Crucial Ballistix Tactical BLT2CP4G3D1869DT1TX0CEU tegen; twee reepjes van 1866 MHz met een CAS latency van 9. Hiervan is de true latency dus 9 / 933 * 1000 = 9.65 ns. Enkel door de hogere klokfrequentie ligt in dit geval de true latency lager. Ik besloot ze gewoon maar te bestellen en te proberen of het verschil zou maken. Hieronder zie je de resultaten.
1333MHz, CAS9, 2x dual channel

1866MHz, CAS9, dual channel

Met de upgrade van het RAM is de latency volgens AIDA gehalveerd, en de leessnelheid met bijna 10.000 MB/s toegenomen. Vanwege de Trial-versie kan ik de (toename in) schrijf- en kopieërsnelheid helaas niet zien.
Maar dan GTA5, daar ging het mij tenslotte om. Toen het spel was opgestart had ik onmiddelijk door hoe groot het verschil was, buttery smooth in vergelijking met eerder! Dit verschil zou in de benchmark vast ook wel naar voren komen. Laten we voor het beste inzicht naar de percentielen kijken:

Kijk, dat laat het verschil goed zien. Door de RAM-upgrade zijn nu in ieder geval 95% van de frames in het zwaarste deel van de benchmark (pass 4) 16.6ms of lager, waardoor ik het grootste deel van de tijd van de volle 60fps kan genieten. Er blijft ruimte voor verbetering, want het mooiste zou zijn als die lijn kaarsrecht doorloopt onder de 16.67ms.
Naast GTA5 was het ook merkbaar in games zoals Far Cry 4, Tomb Raider (2013) en Dying Light; een véél groter deel van de tijd blijft het spel draaien op 60fps. Om de 280X goed aan het werk te krijgen was dus zonder twijfel sneller werkgeheugen nodig dan ik eerder had. De 4670K blijkt zeker in staat om de 280X van voldoende instructies te voorzien, alleen was het voorheen bij mij de processor die moest wachten op het werkgeheugen. Een benchmark die dit mooi illustreert is de 3DMark API Overhead feature test:
1333MHz, CAS9

-----
En vervolgens 1866MHz, CAS9

In DX11 is het aantal draw calls 60-70% toegenomen.
Nu kom ik aan het eind van deze post. Ik ben natuurlijk ontzettend blij met deze verbetering, en baal er ergens van dat ik dit niet eerder heb gedaan. Ik heb geleerd dat latency, klokfrequentie en bandbreedte weldegelijk belangrijk zijn om een gebalanceerde 'gaming pc' samen te stellen. Tegelijkertijd zit ik met nog meer vragen:
Dat is het mooie aan alle expertise op GoT, iedereen kan er van leren.
EDIT: de fout zat 'm in de 'uncore ratio' die in de bios op Auto stond. Die had ik op 3400 MHz moeten zetten om alles optimaal te laten draaien. Dus voor de duidelijkheid: mijn grafieken en vergelijkingen laten het verschil zien tussen verkeerde en juiste instellingen van 'uncore ratio', en laten niet het verschil tussen 1333C9 en 1866C9 RAM zien. Bij dat laatste zit een véél kleiner verschil.
Allereerst het overzicht van mijn setup:
# | Product | Prijs | Subtotaal |
1 | Intel Core i5-4670K Boxed | € 243,95 | € 243,95 |
1 | Gigabyte GA-Z87-D3HP | € 0,- | € 0,- |
1 | Sapphire R9 280X 3GB GDDR5 OC VAPOR-X | € 0,- | € 0,- |
1 | Cooler Master Hyper 412S | € 34,70 | € 34,70 |
1 | Corsair CMV4GX3M2A1333C9 | € 22,- | € 22,- |
2 | Corsair VS2GB1333D3 | € 9,95 | € 19,90 |
1 | Antec VPF Series 450W | € 52,95 | € 52,95 |
1 | Crucial MX200 2,5" 250GB | € 79,- | € 79,- |
Bekijk collectie Importeer producten | Totaal | € 452,50 |
Zoals je ziet heb ik de veelgekozen 4670K als CPU, en de R9 280X als videokaart. Een combinatie die veel waar biedt voor het geld. Toch? Dat klopt, alleen presteerde de 280X niet heftig beter dan mijn vorige videokaart, de HD7850. De upgrade naar de 280X heb ik destijds gedaan om GTA5 met hogere settings, framerates en hogere textures te kunnen spelen. Dat ging met de 280X wel een stuk beter, maar op de texture quality (gerelateerd aan VRAM) na, konden de settings niet echt veel hoger zonder in te leveren op de framerate. Althans, de framerate in bepaalde delen van de spelwereld. In veel gebieden liep het spel wél op 60fps, maar één van gebieden waar de framerate zo nu en dan inzakte naar 35-40 fps is Vinewood Boulevard (afbeelding om aan te geven waar dat is):

Een lichte overklok door alle CPU-cores op maximaal 4GHz te laten lopen hielp wel wat, maar de storende minimale fps bleven. Bij de zoektocht naar de mogelijke bottleneck keek ik uiteindelijk naar het werkgeheugen, wat voor mij altijd een ondergeschoven kindje is geweest. Ik was in de veronderstelling dat de hoeveelheid RAM eerder een probleem zou zijn dan de snelheid ervan, en dat alleen APU's echt profijt hebben van snel RAM. Daarom gebruikte ik nog steeds 4 reepjes Corsair DDR3 1333MHz in tweemaal dual channel. Dit werkgeheugen heb ik destijds overgezet van mijn oude Phenom-systeem. Ik had het toch nog liggen, en 8GB was voorlopig voldoende, dus waarom niet?
In de Tweakers Pricewatch zag ik dat bij RAM-geheugen standaard de 'true latency' getoond wordt, wat een goede indicatie zou zijn van de prestaties. De true latency reken je als volgt uit:
CAS Latency / Frequentie * 1000 = de echte latency in nanoseconden.
Mijn 4 reepjes Corsair 1333MHz met een CAS latency van 9 hebben dus elk een true latency van: 9 / 667 * 1000 = 13.49 ns. Is dat veel, is dat weinig? Ik ging op zoek in de Pricewatch naar vergelijkingsmateriaal. Daar kwam ik na wat filteren de betaalbare Crucial Ballistix Tactical BLT2CP4G3D1869DT1TX0CEU tegen; twee reepjes van 1866 MHz met een CAS latency van 9. Hiervan is de true latency dus 9 / 933 * 1000 = 9.65 ns. Enkel door de hogere klokfrequentie ligt in dit geval de true latency lager. Ik besloot ze gewoon maar te bestellen en te proberen of het verschil zou maken. Hieronder zie je de resultaten.
1333MHz, CAS9, 2x dual channel

1866MHz, CAS9, dual channel

Met de upgrade van het RAM is de latency volgens AIDA gehalveerd, en de leessnelheid met bijna 10.000 MB/s toegenomen. Vanwege de Trial-versie kan ik de (toename in) schrijf- en kopieërsnelheid helaas niet zien.
Maar dan GTA5, daar ging het mij tenslotte om. Toen het spel was opgestart had ik onmiddelijk door hoe groot het verschil was, buttery smooth in vergelijking met eerder! Dit verschil zou in de benchmark vast ook wel naar voren komen. Laten we voor het beste inzicht naar de percentielen kijken:

Kijk, dat laat het verschil goed zien. Door de RAM-upgrade zijn nu in ieder geval 95% van de frames in het zwaarste deel van de benchmark (pass 4) 16.6ms of lager, waardoor ik het grootste deel van de tijd van de volle 60fps kan genieten. Er blijft ruimte voor verbetering, want het mooiste zou zijn als die lijn kaarsrecht doorloopt onder de 16.67ms.
Naast GTA5 was het ook merkbaar in games zoals Far Cry 4, Tomb Raider (2013) en Dying Light; een véél groter deel van de tijd blijft het spel draaien op 60fps. Om de 280X goed aan het werk te krijgen was dus zonder twijfel sneller werkgeheugen nodig dan ik eerder had. De 4670K blijkt zeker in staat om de 280X van voldoende instructies te voorzien, alleen was het voorheen bij mij de processor die moest wachten op het werkgeheugen. Een benchmark die dit mooi illustreert is de 3DMark API Overhead feature test:
1333MHz, CAS9

-----
En vervolgens 1866MHz, CAS9

In DX11 is het aantal draw calls 60-70% toegenomen.
Nu kom ik aan het eind van deze post. Ik ben natuurlijk ontzettend blij met deze verbetering, en baal er ergens van dat ik dit niet eerder heb gedaan. Ik heb geleerd dat latency, klokfrequentie en bandbreedte weldegelijk belangrijk zijn om een gebalanceerde 'gaming pc' samen te stellen. Tegelijkertijd zit ik met nog meer vragen:
- Wat is een betrouwbare manier om er achter te komen of (de snelheid van) werkgeheugen de bottleneck is?
- Zou de afhankelijkheid van snel werkgeheugen verschillen tussen AMD en nVidia (in relatie tot CPU overhead)?
- Kan het zijn dat de geheugencontroller op de cpu sneller overstuur raakt van 4 reepjes geheugen dan van 2?
- Wat zijn jullie ervaringen en tips met betrekking tot dit onderwerp en de bijbehorende valkuilen?
[ Voor 6% gewijzigd door Trygve op 18-06-2016 13:43 ]