Het is eindelijk zo ver, na bijna 2.5 maand bezig te zijn geweest kan je jullie lastig vallen met een ellenlange post van het DDR5 Samsung B-die en Hynix M-die geheugentuning/onderzoek voor de 7800X3D

.
Mijn hoop was dat het minder tijd in beslag zou nemen, maar gaandeweg het testen is er steeds meer bijgekomen en ik wilde geen concessies maken door het testen in te korten. Dat zou het voorgaande werk ook een beetje teniet doen. Mijn doel is om hiermee voor mijzelf i.i.g. een referentie te maken om evt. van daaruit weer verder te kunnen bouwen. Maar misschien kan het jullie ook van pas komen.
Aangezien het de eerste keer is dat ik het zo uitgebreid aanpak, koste het ook enige tijd om uit te zoeken welke benchsoftware de meest consistente resultaten opleverde.
Zo maakte ik aanvankelijk gebruik van SuperPI32 om de timings invloed te onderzoeken, maar dat bleek niet consistent genoeg te zijn en ook een zéér tijdrovende benchmark met de 32M calculatie.
De eigenaardigheid was dat de meetresultaten daarvan hoofdzakelijk in twee kampen vielen, waardoor het een frustrerend proces is geweest van meerdere keren opnieuw starten en afbreken.
Uiteindelijk heb ik dat maar vervangen door PYprime 2.2 dat wel heel betrouwbaar is en bovendien snel.
Bij elkaar hebben ik denk ik +200 uur werk erin zitten.
Maar wees gerust, het meeste is parallel gedaan tijdens het gamen of wanneer ik aan het werk was op de hoofd PC. Het zou anders ondraaglijke monniken werk zijn. Alhoewel knagende nieuwsgierigheid ook een goede motivator kan zijn om door te zetten ^^.
Een voorwaarde om consistente metingen te kunnen doen is om de klok van de cpu vast te zetten, maar met de 7800X3D is dat helaas niet mogelijk. Om dat probleem te omzeilen is de coreboost uitgezet waardoor de klok bij belasting op 4.2GHz begrenst is. Dat blijkt laag genoeg voor een constante klok tijdens het benchen.
De gemaakte benchmarks zijn verder in twee gedeelten op te splitsen.
Het 1e gedeelte met synthetische benchmarks bestaande uit
PyPrime 2.2, Y-cruncher 2.5B, Linpack Extreme en
AIDA. Het 2e gedeelte uit gaming benchmarks bestaande uit
Factorio, Cyberpunk 2077 en
Shadow of the Tombraider.
De gebruikte randvoorwaarden zijn:
HardwareSyntethische benchmarks- Coreboost uit
- SMT uit
- Spreadspectrum uit
- Windows safemode
- Per benchmark het gemiddelde van 5 metingen genomen. Uitschieters er in gelaten (imho is variatie een factor dat meetelt)
Gaming benchmarks- Coreboost uit
- SMT uit
- Spreadspectrum uit
- RTX4090FE: fixed 2.5GHz @0.95Vcore
- Benchmarks gedaan met CapFrameX
- 1080p met hoogste instellingen, scaling en raytracing uit
- Factorio: gemiddelde van 5 benchmarks genomen, uitschieters er in gelaten
- Cyperpunk 2077 & SotTR: gemiddelde van 3 benchmarks genomen, zeer grote uitschieters opnieuw gedaan
Het stresstesten en het uitzoeken van de minimale spanningen- Coreboost aan
- SMT aan
- Spreadspectrum aan
- CPU SoC tests: AIDA cache & memory stresstest voor minimaal 1uur met handmatig dingen openen en sluiten zoals: video's, vensters, foto's
- Geheugen tests: 20 passes TM5, voor tREFI ook Memtest86 bitfade test
Het volgende kan een beetje duizelingwekkend zijn.
Ik heb geprobeerd om het een beetje compact te houden, maar om een overzicht te behouden met zoveel parameters is dat erg lastig. Het bleek ook niet te doen om verticaal te werken omdat de kolombreedte dan te vaak in de weg zat.
Voor degene die het interessant vinden zijn hieronder de spreadsheet screenshots te zien met per regel de timing die getest is (groen gemarkeerd), alle informatie over gebruikte Fclock, Uclock, spanningen e.d. en notities over o.a. gevonden minima waarden. Aan het einde van iedere regel zitten de benchmarks.
De laatste 5 (of 6) regels zijn waarschijnlijk het meest interessant, want dat zijn een aantal profielen die gemaakt zijn na afloop van de tuning, waaronder een persoonlijke 'safe' en 'fast' profiel.
G.Skill Flare X5 36-36-36-96-132 Samsung B-die:
Timingstabel
Benchmarks
G.Skill Flare X5 32-38-38-96-134 Hynix M-die:
Timingtabel
Benchmarks
Hynix M-die spanningschaling: tCL, tRFC en afhankelijkheid tRP - tRTP
Bevindingen
Opvallend is dat met stock / EXPO II timings de spanning voor beide geheugenkits fors verminderd kan worden. Aan 1.25 Vdd hebben beide kits dan meer dan genoeg
Samsung B-die doet het wat dat betreft wel een stuk beter, want zodra de timings werden aangedraaid is er alleen een klein beetje extra nodig in de vorm van +10mV.
Het Hynix M-die geheugen was met het EXPO II/stock profiel stabiel op 1.18V maar moest na het aandraaien van de (hoofdt)timings direct naar 1.21V verhoogt worden.
Om tRRDs/tRRDL/tFAW daarbij te verkleinen moest de spanning nog een stap verhoogt worden naar 1.24V
Ook blijkt er voor Hynix M-die een verband te zijn tussen de minimale tRP en tRTP en vormen ze samen opgeteld een minimum.
Wat tuning betreft was het vinden van de minima en het afstellen met Samsung B-die veel gemakkelijker en fijner. Simpelweg naar beneden bijstellen totdat het niet meer gaat en dan op naar de volgende timing.
Het enige waar ik mee heb moeten lopen stoeien is het proberen te verlagen van de tCL.
Daar blijkt een harde grens te liggen welke niet met spanning schaalt.
Maar of dit nu een IC eigenschap is durf ik niet te zeggen.
Het is niet wat ik van Samsung gewend ben en het is ook opmerkelijk dat de rest van de hoofdtimings wél prima naar 34 kunnen bij 6000MHz.
Eigenlijk is al bekend wat het meeste winst geeft en dat is hier ook te zien.
Kort samengevat is dat:
Fclock en
tRFC +
tREFI. De rest van de timings hebben een minieme invloed, maar het is erg lastig om dat uit de meetruis te halen en ik betwijfel ten zeerste of je zoiets ooit in de praktijk zult merken.
Ondanks dat de 7800X3D een erg grote L3 cache heeft, is hier en daar toch een aardige verbetering/tendens zichtbaar en heeft het dus wel zin om het geheugen wat aan te draaien.
Met een non-X3D cpu zullen deze procentuele verhoudingen nog verder uitvergroot worden.
Voor de gaming benchmarks zit de winst vooral in de P1 & P0.1 FPS en is er grofweg 5% te behalen.
Als ik een gok zou moeten doen, dan zou dat voor een non-X3D wel eens op kunnen lopen naar 10% of meer.
Linpack Extreme had ik als benchmark gekozen om de bandbreedte te testen, maar na aanpassing van tRFC & tREFI is daar nog nauwelijks verbetering in te zien, dit in tegenstelling tot AIDA.
Ik heb daardoor een sterk vermoeden dat de bandbreedte tussen de CCD en IOD verzadigd is.
En het geheugen nog sneller laten lopen, doet het bad alleen maar verder overlopen. Even gechecked met coreboost + SMT aan en er is nog ca. 10% groei in GFlops. Jammer genoeg ben ik dus met Linpack Extreme tegen een CPU bottleneck aangelopen.
AIDA laat wel onmogelijke waarden zien, die waarschijnlijk door de cache beïnvloed zijn.
Met een Fclock van 2000Mhz en interlink van 32byte/cycle read & 16byte/cycle write, is de theoretische max. 64000MB/s read en 32000MB/s write. En dan moet er nog de overhead incl. foutcorrectie vanaf.
Maar misschien is het wel fijn om te zien of het 'in theorie' een verbetering is

.
Wat voor mij persoonlijk een hamvraag was, is of er voor Zen4 veel verschil merkbaar/meetbaar zou zijn tussen Samsung B-die en Hynix M-die. De prijzen zijn inmiddels bijna gelijk getrokken, maar toen de kitjes waren aangeschaft, was er nog een aardig prijsverschil.
Om het wat meer behapbaar te houden is hier de procentuele verhouding tussen beide kits van de laatste 6 geheugenprofielen:
Je zou voorzichtig kunnen stellen dat M-die met het Fast profiel ongeveer 1% sneller is bij FPS dips, wat indirect ook te zien is aan PyPrime. Maar zoiets zal je in de praktijk echt niet merken.
Het voordeel van Samsung B-die is dat het ca. 50mV minder nodig heeft en dat scheelt toch weer zo'n 2°C - 3°C. Samsung B-die is dus bij lange na niet zo slecht als het leek

.
Wat verder niet uit het onderzoek komt is dat de boottijden aanzienlijk sneller zijn met Samsung.
Eigenlijk op het niveau van AM4. Van koud tot Windows desktop: ca. 24-26 seconden.
Met Hynix is de training om de een of andere reden een stuk trager (@
Cidious om gelijk een antwoordt te geven op je vraag, ja helaas wel).
Tot slot nog de gevonden minimale spanningen (Vsoc, Vddio/mc e.d.) van beide kits op het Asus B650ei en B650ee bord met beiden een eigen 7800X3D.
Met een Fclock van 2000MHz vormt de 3000MHz Uclock de zwakste schakel en bepaald wat de minimale Vsoc & Vddio/mc moet zijn i.c.m. de Vddp rail. Het type geheugen maakt verder niet.
Tussen de twee 7800X3D en moederborden is er een kleine 20mV verschil, wat waarschijnlijk silicon lottery is van de geheugencontroller. In ieder geval is de benodigde spanning fors lager dan wat de autosettting van het moederbord zou invullen. Met de mindere sample is Vsoc = 1.08V en Vddio/mc = 1.18V genoeg om 20mV marge aan te blijven houden (voor alle duidelijkheid dat is de min. Vsoc en min. Viddio/mc waarde uit de tabel + 30mV). Uiteraard kan het per CPU sample verschillen en ook de kwaliteit van het moederbord is een factor. Maar ik denk niet dat er echt veel meer nodig is. Met Vsoc = 1.10V en Vddio/mc = 1.20V + bijregelen van de Vddp richting 0.85-0.95V, zal het gros van de systemen wel stabiel draaien.
Dat was het dan. Ik hoop dat jullie er wat aan hebben en dat het niet teveel TLDR is.
[
Voor 255% gewijzigd door
CMT op 14-08-2023 18:26
]