@MneoreJ Precies ja.
Komt nog eens bij dat het zo niet hoeft. Shadows en al helemaal reflections zijn vele malen intensiever dan global illumination en zijn redelijk te "faken" met traditionele technieken. Juist goede GI is iets dat je meteen ziet in elke frame, het wow effect geeft en het met RT doen is veel minder intensief. Neem die demo van dat treinstation met Lumen of wat Nvidia laat zien met hun eigen GI SDK. Dat is een gevalletje zodra je het ziet, wil je niet meer zonder.
Dan nog iets anders. Ik heb de laatste tijd eens lopen nadenken wat ik vermoed dat AMD voor RT wat gaat veranderen. Dit is dus allemaal hoog speculatief niveau. Noem het MLID niveau, maar dan met enige basale kennis om mee te gokken.
Eerst maar eens de constatering dat we weten dat RDNA3, matrix berekeningen kan gaan uitvoeren. Dat impliceert ook een matrix unit. En ik weet wel hoe ze dat gaan doen als ik naar CDNA kijk.
Geheel toevallig lijken RDNA en CDNA SIMD blokken wel heel veel op elkaar buiten de gebruikte types ALU's.

:strip_exif()/f/image/PnVyK9QP8buHPR0QbunrSp3A.jpg?f=fotoalbum_large)
Ik denk dus al een tijdje dat in RDNA3 er een (kleine) matrix unit aan elke SIMD 32 gehangen zal worden. De functie lijkt me tweedelig. Betere FSR in de toekomst en denoising voor RT.
Blijft over de RT zelf. AMD gebruikt een typische lv2 aanpak waar Nvidia op lv3 zit. Het verschil is dat bij Ampere de BvH en de intersections door de RT core worden gedaan. De data komt uit de shared SM L1 cache en denoising word gedaan door de Tensor Core. Bij RDNA2 zit BvH in de ALU's en de dataopslag zal de Vector Register File zijn. Ray intersections worden door de RA gedaan en denoising zal ook door de ALU's gedaan worden.

Wat ik voor RDNA3 vermoed is dat denoising naar een matrix unit gaat om dit in minder clock cycles af te handelen. Vervolgens is het echt gokken. Ik vermoed dat AMD bij dit systeem en lv2 ondersteuning blijft, maar het systeem capabeler zal worden om twee redenen: Voor Navi 31/32 zou Vector Register File naar 192KB gaan waardoor er meer dataopslag beschikbaar komt. Tweede zou zijn dat ze simpelweg meer rays intersection checks gaan doen per clock met een betere RA.
Het grootste nadeel blijft alleen ook in dat dit bovenop de reguliere shading komt. Uiteindelijk heb je maar zoveel clock cycles per seconde waarbinnen een frame gerenderd moet worden en RT is een enorme impact. Zeker met RDNA2 haar aanpak komen er waarschijnlijk nog meer cycles erbij voor denoising en intersections tests. Daarom vermoed ik dat de focus komt te liggen op meer intersections en efficiëntere denoising.
Hierom is mijn "hoop" ook niet gevestigd op de kwaliteit van de SIMD units, RAs en matrix unit, maar op de kwantiteit. Want uiteindelijk moet je hier ook rekenkracht naar gooien en zo komen we bij de grote verwachte Navi chips. Ik koester niet veel hoop voor Navi 33, maar bij 31 en 32 vraag ik me af hoeveel ze kunnen forceren door botweg meer tegen het probleem aan te aangooien.
Komt nog eens bij dat het zo niet hoeft. Shadows en al helemaal reflections zijn vele malen intensiever dan global illumination en zijn redelijk te "faken" met traditionele technieken. Juist goede GI is iets dat je meteen ziet in elke frame, het wow effect geeft en het met RT doen is veel minder intensief. Neem die demo van dat treinstation met Lumen of wat Nvidia laat zien met hun eigen GI SDK. Dat is een gevalletje zodra je het ziet, wil je niet meer zonder.
Dan nog iets anders. Ik heb de laatste tijd eens lopen nadenken wat ik vermoed dat AMD voor RT wat gaat veranderen. Dit is dus allemaal hoog speculatief niveau. Noem het MLID niveau, maar dan met enige basale kennis om mee te gokken.
Eerst maar eens de constatering dat we weten dat RDNA3, matrix berekeningen kan gaan uitvoeren. Dat impliceert ook een matrix unit. En ik weet wel hoe ze dat gaan doen als ik naar CDNA kijk.
Geheel toevallig lijken RDNA en CDNA SIMD blokken wel heel veel op elkaar buiten de gebruikte types ALU's.

:strip_exif()/f/image/PnVyK9QP8buHPR0QbunrSp3A.jpg?f=fotoalbum_large)
Ik denk dus al een tijdje dat in RDNA3 er een (kleine) matrix unit aan elke SIMD 32 gehangen zal worden. De functie lijkt me tweedelig. Betere FSR in de toekomst en denoising voor RT.
Blijft over de RT zelf. AMD gebruikt een typische lv2 aanpak waar Nvidia op lv3 zit. Het verschil is dat bij Ampere de BvH en de intersections door de RT core worden gedaan. De data komt uit de shared SM L1 cache en denoising word gedaan door de Tensor Core. Bij RDNA2 zit BvH in de ALU's en de dataopslag zal de Vector Register File zijn. Ray intersections worden door de RA gedaan en denoising zal ook door de ALU's gedaan worden.

Wat ik voor RDNA3 vermoed is dat denoising naar een matrix unit gaat om dit in minder clock cycles af te handelen. Vervolgens is het echt gokken. Ik vermoed dat AMD bij dit systeem en lv2 ondersteuning blijft, maar het systeem capabeler zal worden om twee redenen: Voor Navi 31/32 zou Vector Register File naar 192KB gaan waardoor er meer dataopslag beschikbaar komt. Tweede zou zijn dat ze simpelweg meer rays intersection checks gaan doen per clock met een betere RA.
Het grootste nadeel blijft alleen ook in dat dit bovenop de reguliere shading komt. Uiteindelijk heb je maar zoveel clock cycles per seconde waarbinnen een frame gerenderd moet worden en RT is een enorme impact. Zeker met RDNA2 haar aanpak komen er waarschijnlijk nog meer cycles erbij voor denoising en intersections tests. Daarom vermoed ik dat de focus komt te liggen op meer intersections en efficiëntere denoising.
Hierom is mijn "hoop" ook niet gevestigd op de kwaliteit van de SIMD units, RAs en matrix unit, maar op de kwantiteit. Want uiteindelijk moet je hier ook rekenkracht naar gooien en zo komen we bij de grote verwachte Navi chips. Ik koester niet veel hoop voor Navi 33, maar bij 31 en 32 vraag ik me af hoeveel ze kunnen forceren door botweg meer tegen het probleem aan te aangooien.
Never argue with an idiot. He will drag you down to his own level and beat you with experience.