Weet je, er komt zoveel tegenstrijdige informatie die allemaal zo vaag is, dat ik het wel afwacht.
Wet weten dat er drie chips zijn, Navi 21, Navi 22 en Navi 23. Over Navi 21 komt het meest, over Navi 22 heb ik werkelijk niks meer gezien dan dat deze kennelijk bestaat en Navi 23 is niet veel beter.
Sienna Cichlid en Navi 21 lijken hetzelfde ID te delen, namelijk GFX1030. Daar is alleen niet eens duidelijk of het nu GDDR6 of HBM2E is aangezien beiden opgedoken zijn. Zie:
https://videocardz.com/ne...emory-rumors-hbm-vs-gddr6
Daarnaast gaan de speculaties en geruchten van Navi 21 ergens tussen de 60-84CU's. Ik heb 60, 64, 72, 80 en 84CU's allemaal gehoord. Dat is nogal een spectrum. Veder wat weten we nu van RDNA2? Nou 50% perf/watt en in elke CU zit een
Intersection Engine die ray tracing zou doen. Kennelijk zijn 36CU's die op 2,2GHz+ geclocked zijn, in staat tot tenminste enige serieuze ray tracing effecten zoals reflecties of schaduwen. Dat weten we via Sony. Dit is het ook echt.
Een heel ander probleem is dat AMD waarschijnlijk voor een EUV node van TSMC gaat. Van wat ik heb begrepen geld er een restrictie van 505mm
2 voor dat proces. Nu is Tu-102 op TSMC 16/12nm een gigantische 754 mm² chip met 18,6 miljard transistoren. Met perfecte schaling ten opzichte van Navi 10, zou je ongeveer 20 miljard transistoren binnen 505mm
2 kwijt kunnen. Ik begrijp alleen dat schaling veel complexer is, waardoor ik niet uitsluit dat het minder dan 20 miljard transistoren gaan zijn. Een tweede is dat er een aardige kans is dat er wederom meer cache op de chip zal zitten en die Intersection Engine voor RT zal denk ik ook niet klein zijn. Dat gaat onherroepelijk in het transistorenbudget voor het totale aantal CU's hakken.
Vervolgens zijn RDNA1 en Turing zijn zeer vergelijkbaar qua transistoraantallen en prestatieniveau per ALU met genormaliseerde clock speeds, maar Turing doet dit met ogenschijnlijk veel meer hardware. Gedeeltelijk inefficiënt omdat Turing FP32 en INT ALU's en Tensorcores heeft en de 1660 series FP16 ALU's i.p.v. Tensorcores. RDNA1 heeft gewoon een ALU die alles kan. Die kan alleen zomaar wel eens groter zijn dan fixed function ALU's van Nvidia. Het is mij alleen onduidelijk hoe die verhoudingen liggen en hoe zaken schalen als je naar kleinere nodes gaat. Ik weet dat geheugencontrollers en cache niet echt goed schalen, maar verhoudingen durf ik niet te geven.
Het is gemiddeld procentenwerk. Een circa 18,5-19 miljard transistoren grote RDNA1 chip met vergelijkbare clock speeds zou ik dan ook rond de Titan RTX verwachten, misschien iets lager omdat RDNA1 iets meer tegengehouden lijkt te worden door geheugenbandbreedte dan Turing. Dat zegt alleen nog steeds weinig over RDNA2.
Ergo, de RTX2080Ti verslaan is goed mogelijk, maar hoeveel sneller gaat afhangen van clockspeeds en verbeteringen in de RDNA2 architectuur. Die 50% perf/watt is natuurlijk aardig hoopgevend, idem voor de 2,2GHz+ van de PS5, maar het betekend niet dat Navi 21 zomaar op 2,3GHz loopt met 80CU's of zo met een betere gemiddelde belasting van de CU's dan RDNA1 haalde, wat zich moet verlaten in gemiddeld meer instructies per clock cycle. Gebeurd dat, tja dan ga je ruim voorbij de Titan RTX, en dus ook de RTX2080Ti. Immers hebben we het hier over een 1545/1635MHz normaal/FE RTX2080Ti. 2,3GHz of zelfs maar 2GHz Navi 21 met een matchend aantal van 72CU's, zonder verder architectuur verbeteringen, zou een Titan RTX zo al moeten verslaan. Uiteindelijk zit al jaren de echte winst in GPU's in de clock speeds.
Maar we weten dus niet hoeveel CU's het zijn, wat de clock speeds worden, noch eventueel andere bottlenecks zoals geheugenbandbreedte. We weten niet eens of het GDDR6 of HBM2E is.
Dus ik wacht gewoon af en ik zie wel waar het schip strand. Het zal in ieder geval sneller zijn dan de RX5700XT.
Never argue with an idiot. He will drag you down to his own level and beat you with experience.