Ik had het eigenlijk over de DX12 synthethische tests, maar je hebt ergens wel gelijk
Even vooraf:
- Weer een iets langere post

- De polygon throughput test in TR's "Beyond3D Suite" is geschreven door rys op Beyond3D; werkzaam bij IT's PowerVR afdeling dus die suite is heel erg bijzonder en speciaal voor TR gemaakt
Het aantal polygonen kan wel omhoog, maar rauwe triangle throughput is slechts een klein aspect. Ik geloof wel dat culling al toegepast in die test (zou even door rys' posts moeten neuzen, hij heeft er ooit iets over gezegd), maar dan heb je het alsnog alleen over de polygonen an sich. Vervolgens moet de rest van de pipeline er ook nog overheen en dat is waar de bottlenecks zitten. Om je een idee te geven van hoe veel polygonen er in games zitten; Star Citizen (de polygon-king) gebruikt er 100k op je character model; eerstvolgende game in de lijst is waarschijnlijk Ryse met zo'n 40k. Dat betekent dat een 980 Ti 100000 / 7500000000 = 0,000013 sec * 1000 * 1000 = 13 ns nodig heeft om de triangles voor dat model te verwerken. Bij Hawaii/Fiji is dat dan 100000 / 2300000000 = 0,00004 sec * 1000 * 1000 = 40 ns. Een ander voorbeeld is Infamous: Second Son; Sucker Punch heeft gezegd dat er momenten zijn waarop er 11 miljoen polys op je TV staan. Dan heb je het over 1,47ms tegenover 4,78ms en zelfs 6,88ms op de PS4 (realiteit zit iets anders in elkaar, maar voor het gemak gaan we hier even van uit

). Dat klinkt als bijzonder veel, en toch draait het spel gewoon tussen de 30 en 60 FPS op een GPU met slechts 1,6 miljard tris/sec
Dat valt in het niet bij de tijd die nodig is voor alle andere dingen. Meer polygonen betekent ook niet per definitie dat iets mooier wordt, het is ook nog eens resolutie afhankelijk. De meeste dingen in 3D rendering hebben een grens waarboven je alleen rekentijd verspilt, zo ook polygonen (ik heb eerder al MSAA en tessellation als voorbeelden gebruikt). En vooral met tessellation zijn er heel veel dingen waar men in eerste instantie juist minder polygonen gebruikt.
Nvidia's grote voordeel komt voornamelijk doordat zij nu massaal op geometry in zetten; AMD heeft blijkbaar besloten dat er geen reden is om nog meer triangles per clock te kunnen verwerken. Waarom weet ik niet maar ik gok stiekem dat dit toch komt door wat ik hierboven al aan geef: games komen nu nog bij lange na niet aan die maxima omdat er bottlenecks op andere delen in de pipeline zitten. Nu moet ik er overigens ook bij vermelden dat de resultaten uit die test voor Nvidia
boven hun theoretische maximum liggen en bij AMD er onder. Ik moet eens gaan kijken of rys ergens uit legt hoe die test precies werkt
En dan komt nu de grote clou. Je hebt helemaal gelijk dat er onder DX12 een hoop meer polygonen door de GPUs gestampt kunnen worden. Nu (in DX11) doet men dat vooral door het aantal draw calls te beperken...voel je hem al hangen? Dit is waarom Sucker Punch er gewoon zonder al te veel problemen 11 miljoen door die kleine GPU gestampt krijgt. Ze kunnen het werk veel beter verdelen en meer drawcalls gebruiken. Niet elke polygoon even belangrijk of complex.
Ik zeg ook niet dat dit niet zo is. GM20x kan dan wel meerdere queues asynchroon gebruiken, ze zijn echter nog steeds gekoppeld aan specifieke clusters, waardoor het aantal resources per queue nog steeds beperkter is dan bij GCN het geval is.
Om maar weer eens een analogie te trekken (/ een poging daartoe

). Men neme een bedrijf met 320 werknemers (willekeurig getal, echt waar

). AMD heeft 8 managers die alle 320 werknemers van het bedrijf mogen aanspreken en aan het werk zetten. Nvidia heeft er 32, maar die hebben er elk maar 10 tot hun beschikking. Gevolg is dat er bij Nvidia best wel eens 30 man stil kunnen zitten omdat die in de productie afdeling werken terwijl er juist alleen marketing werk is
Dit is in de praktijk natuurlijk niet helemaal het geval, maar de essentie komt hier wel op neer. Vooralsnog (en dan baseer ik dit vooral op wat men op Beyond3D ervaart) lijkt het er gewoon op dat Nvidia eerdere tegen een muur aan loopt.