sdk1985 schreef op donderdag 17 september 2020 @ 23:05:
Ik ben niet bij met lezen van dit topic dus wie weet heeft iemand dit al gedaan maar ik keek net even naar de stats van de 3080 vs de 3070:
CUDA cores 5888/8704 = 67%
Vermogen 220/320= 67%
Bandbreedte 512/760 = 67%
Als je dan vervolgens die 67% toepast op de resultaten bij techpowerup dan krijg je zo iets:
[
Afbeelding]
Als ik dan dat plaatje bekijk dan zou ik daar tov mijn huidige 2070 voor 519 euro een winst van 33% zien. Geef ik 719 euro uit dan wordt dat een winst van 100%. Dan wordt die 3080 ineens een stuk zinniger

.
Helaas kun je niet zo rekenen. Sowieso is de 3070 GA104 in plaats van GA102, dus sommige verhoudingen zullen anders liggen. Belangrijker is echter dat het niet om 8704 en 5888 CUDA cores gaat. Het gaat om respectievelijk 4352 en 2944 FP32 ALU's, met daarnaast nog een extra 4352 en 2944 FP32/INT32 ALU's die
deels aangesproken kunnen worden. In de praktijk komt het er op neer dat je pakweg 20-40% van de tijd extra FP32 rekenkracht hebt, afhankelijk van de game. Als je naar TPU's samenvatting kijkt zie je dat het over de gehele linie zo'n 23% schaalt voor de 3080.
Voor de 3080 moet je de 2080 Ti als basis nemen (zelfde aantal SM's, dus zelfde aantal pure FP32 ALU's) en daar 20% tot 40% bij tellen om zo grofweg te schatten tussen welke range een game uit komt. In het geval van F1 neem je dus 182 FPS; een 3080 komt dan uit tussen 218,4 en 255 FPS. De 240,1 in de praktijk betekent dat F1 bovengemiddeld schaalt met pakweg 32%.
Voor de 3070 moeten we de 2080 als basis nemen (zelfde reden als hierboven). Als we die verhoudingen toepassen op de 3070 krijgen we dit: 146,2 * 1,32 = 192,98 FPS, laten we het 193 noemen. Dat is 80% van de 3080, niet 67%. Zelfs op 20% "timeshare" van de hybrid ALU's kom je al op 175 FPS uit, wat 73% is.
Dit is er van uit gaande dat de verhouding tussen pure en hybrid ALU's in GA104 hetzelfde is, wat op basis van de vrijgegeven specs wel haast zo móet zijn. Ik zie niet in hoe ze anders tot exact dezelfde verhoudingen komen
Nu kan het bovenstaande alsnog anders uitpakken als F1's INT32 werk dusdanig omvangrijk is dat de hybrid ALU's nauwelijks aan FP32 toekomen. Dan zou je wel op die 67% (of zelfs minder!) van jou uit komen, maar ik geloof niet dat dat het geval is. Het spel schaalt bovengemiddeld, wat juist betekent dat het INT32 werk relatief beperkt is.
TL;DR: ik vermoed dat de 3070 het beter gaat doen dan Nvidia's cijfers doen vermoeden
Edit: bovenstaande kan natuurlijk ook met TFLOPS, maar dat wordt nog lastiger omdat je iets met de kloksnelheid zult moeten doen. De effectieve kloksnelheid ligt iets lager, omdat de context switches denk ik een extra cycle kosten.
Edit #2: bovenstaande kan uiteraard meteen het raam uit zodra er RT of Tensor cores aangesproken worden.
[
Voor 5% gewijzigd door
Werelds op 18-09-2020 11:58
]