Maar aangezien de "choo choo" trein toch allang is vertrokken is het tijd voor wat laatste observaties van mij.
Inmiddels denk ik dat het 64, 72 en 80CU's gaat worden. Implicerend dat alle Navi 21 chips ook de volle 4SE/8SA/128ROPS gaan krijgen. Ik had echt 60CU's/3SE/6SA/96ROPS gedacht, maar ik klaag niet want dit is beter. Je gaat hier waarschijnlijk kijken naar een videokaart die de RTX3070 kan verslaan en eentje waar je zoveel back end hebt dat je serieus zou kunnen overwegen om SSAA te gaan forceren in drivers op 1440p. De enorme hoeveelheid L2 cache die inmiddels ook bevestigd is, zou hier nog eens extra bij kunnen helpen.
Die L2 cache zal alleen meer doen. Het vermoeden dat ze dit doen voor BVH checks voor RT heb ik al uitgesproken, maar er is nog iets. Ik vermoed namelijk dat dit op 1440p gaat helpen met consistentie in zowel gemiddelde, maar zeker 99% en 99,9% lows. Immers met een hogere framerate is de latency impact om data uit VRAM te halen, hoger. De videokaart draait op een clock speed, maar deze is niet gelijk aan framerate. Als een videokaart op 1440p bijvoorbeeld 90fps doet en op 4K is het 60, dan is er voor 30 frames extra aan data-aanvragen gedaan. Natuurlijk is dit een heel ruw voorbeeld, maar het geeft aan dat die enorme cache hier ook kan helpen om de aanvragen naar VRAM te beperken en dat zou je terug moeten zien in gemiddelden, maar vooral in lows. RGT die echt goede bronnen lijkt te hebben, had het er ook al over dat Navi 21 erg goed zou zijn op 1440p.
RGT vermelde ook dat er sprake zou zijn dat er in december met de jaarlijkse grote driver update, er een upsampling technologie toegevoegd gaat worden. Deze zou niet zo goed zijn als DLSS2.0, maar wel sneller. Dat is iets om morgen naar te kijken of het klopt. De implicatie lijkt ook te zijn dat het game agnostisch is als het met de jaarlijkse december driver komt.
Laatste en nu gaan we echt controversieel doen. Ik ben eigenlijk best teleurgesteld in iedereen hier.
Ik bedoel, niemand die de Super SIMD heeft vermeld? Werkelijk?
Ik heb dit namelijk zeer bewust helemaal verzwegen de afgelopen maanden omdat ik geen zin had in al te veel "choo choo", maar ik ben het zeker niet vergeten. Ik heb zelfs af en toe wat hints laten vallen zoals dat ik meer uitkeek naar de architectuur.

A super single instruction, multiple data (SIMD) computing structure and a method of executing instructions in the super-SIMD is disclosed. The super-SIMD structure is capable of executing more than one instruction from a single or multiple thread and includes a plurality of vector general purpose registers (VGPRs), a first arithmetic logic unit (ALU), the first ALU coupled to the plurality of VGPRs, a second ALU, the second ALU coupled to the plurality of VGPRs, and a destination cache (Do$) that is coupled via bypass and forwarding logic to the first ALU, the second ALU and receiving an output of the first ALU and the second ALU. The Do$ holds multiple instructions results to extend an operand by-pass network to save read and write transactions power. A compute unit (CU) and a small CU including a plurality of super-SIMDs are also disclosed.
https://patents.google.com/patent/US20180121386A1/en
De publicatie van dit patent stamt al uit 2018 en dit was de eerste aanwijzing dat er een vervanger van GCN eraan zat te komen. Het zat niet in RDNA1 en ik weet oprecht niet of het in RDNA2 zal zitten. Als ik alleen kijk hoe het zich de laatste dagen ontwikkelde met een paar benchmarkscores, RGT die claimt dat de RX6800XT echt rond de RTX3080 zit, ook op 4K en ik wat door reken, tja.
Ik neem de RX5700XT @1900MHz als basislijn en dan moet ik concluderen dat als de "RX6900XT" ook maar in de buurt van de RTX3090 zit, iets dat wel eens een realistische uitkomst kan blijken te zijn, RDNA2 een werkelijk ongekend goed schalende architectuur is. Vergelijk maar eens ALU's tussen de RTX2080 en RTX2080Ti of RTX3070 en RTX3080. Het gebeurd vrijwel nooit dat de grote chip ook maar in de buurt van perfect schalend zit. Komt er nog eens bij dat ze het met "maar" 512GB/s doen. Ik kan zo snel geen voorbeeld bedenken,dat een architectuur zo goed schaalt en dan zou Navi 21 het ook nog eens relatief beter doen op 1440p dan 4K wat juist een probleem aan het worden is voor deze zeer grote videokaarten. Een paar honderd megahertz aan clock speed, hoe indrukwekkend dat ook lijkt te gaan worden en hoe belangrijk het is voor het eindresultaat, verklaard dergelijke prestaties niet zomaar voor mij. Een combinatie van clock speed en de L2 cache, tja ik weet niet of dat alles verklaard. Dat zou kunnen, maar ik zou niet verbaast zijn als de Super SIMD het geheim van RDNA2 zal blijken waar je niemand over gehoord hebt.
En dat is waar ik dus morgen naar uitkijk naast wat andere zaken zoals:
-DirectStorage ondersteuning
-Upscaling, zei het via driver voor alle games met waarschijnlijk RIS als sharpening filter of via DirectML
-1440p en 4K resultaten
-De cache structuur
-DXR
-Configuraties
-"Hoeveel nieren dit gaat kosten"
Gelukkig gaven ze bij AMD al aan dat het ook over architectuur zal gaan. Het zal voor de meeste wel weer een saaie, slecht doordachte presentatie worden die onnodig verwarring zal zaaien, maar ik kijk er stiekem meer naar uit dan het product zelf.
Never argue with an idiot. He will drag you down to his own level and beat you with experience.