Anoniem: 149755 schreef op vrijdag 31 maart 2006 @ 21:06:
[...]
Het algemene verhaal was toch dat de X1800/X1900 een groot oppervlakte heeft aan geheugencontroller? De X1600 is met zijn 157mjn trans. ook meer dan de helft zo klein, dus procentueel is het aandeel geheugencontroller nog aanzienlijk het zij niet groter.
Ik geloof dat de MC zo'n 20% in beslag neemt. Dat valt volgens mij dus wel mee.
X300/600: 75M, 4 Fragment Pipes, 4 PSE, 2 VS, 128-bit (2x64-bit)
X1300: 105M, 4 Fragment Pipes, 4 PSE, 2 VS, 128-bit (4x32-bit)
X1600: 157M, 4 Fragment Pipes, 12 PSE, 5 VS, 128-bit (4x32-bit) + ringbus (2x128-bit), verdubbelde Z Samples per clock
ATi heeft bij de R520 -> R580 zo'n 2M transistoren per PSE nodig gehad. Trek je dat door naar de X1600, dan was een X1600 met oude memory-controller zo'n 121M transistoren groot. Dat is dus maar 36M verschil. Die 36M wordt gedeeld door de ringbus, de verdubbelde Z Samples rate van de X1600 vs X1300 en 3 extra vertexshaders. Dus het aandeel voor de MC is vrij 'normaal'.
De maktpositie en verkoopprijs is hier niet ter discussie, ik ben het zeker met je eens dat de X1600 meer waar biedt voor het geld dan de 7600GS. nVidia heeft met de 7600 serie alleen wel laten zien dat de high-tech geheugencontroller niet per difinitie nodig is om een kaart met dit caliber te voeden.
Dit ligt dus absoluut niet aan de memory controller hoor... Wat nVidia heeft laten zien met de 7600 Serie is een simpel voorspelbaar iets, namelijk dat 8 ROPs sneller is dan 4 ROPs, dat 12 TMUs sneller zijn dan 4 TMUs. En dat het hebben van 24 fully functional ALUs sneller kan zijn dan 12 fully functional ALUs en 12 mini ALUs.
Het punt is dat de X1600 i.p.v. een grote geheugencontroller misschien beter extra ROPs e.d. had kunnen hebben, dan hadden de 157Mjn trans wellicht een hoger rendement gehad.
Het was OF meer ROPs OF meer PSEs per fragment pipe en niet beide.
RV530 is de basis van wat er komen gaat. RV535 is de goedkopere RV530 waardoor de X1600 nog verder in prijs omlaag gaat. En RV560 en RV570 zijn de kaarten die jij waarschijnlijk liever had gezien met respectievelijk 8 ROPs en 12 ROPs. ATi heeft straks echter wel alle fronten gedekt:
Enthusiast: 16 ROPs, 48 PSE
Performance: 12 ROPs, 36 PSE
Mainstream: 8 ROPs, 24 PSE
Value: 4 ROPs, 12 PSE & 4 ROPs, 4 PSE
Als de RV530 8 ROPs had gehad dan was de RV560 nutteloos geweest die ook al een tijd op de roadmap stond. En dan had ATi waarschijnlijk niet voor de 3:1 TEX situatie moeten kiezen en gewoon een RV410 + SM3 moeten uitbrengen en dan waren ze ongetwijfeld ook rond de 160M transistoren uitgekomen. Maar ja, GPUs zijn vaak zo'n jaar of 2 in ontwikkeling en men weet nooit hoe de markt gaat verlopen en men kan zeker geen rekening houden met dead-die SKUs zoals de X800GTs en X800GTOs die opeens in de midrange zitten wanneer een X1600 al een tijd lang in ontwikkeling is..
Dat een X1600 helemaal nog geen verkeerde keuze is geweest laat de recensie van B3D wel zien, waarin ze de prestaties vergelijken met een X1300Pro en X700Pro. Een X1600 komt nog aardig goed uit de bus tov een X700 terwijl hij 4 ROPs minder heeft, 1 vertexshader minder, 4 TMUs minder (maar wel 4 PixelShaderEngines meer). Je ziet dat er duidelijk keuzes gemaakt dienden te worden en de X1600 scoort tot soms zo'n 80% sneller dan een X700 terwijl de corespeed maar zo'n 38% omhoog is gegaan, en in pixelshaderintensieve bewerkingen is de X1600 soms wel tot meer dan 100% efficienter.
De X1300 heeft ook niet die grote geheugencontroller, nu blijkt dat dit voor deze kaart een goede keus is geweest. Overigens moet je bij de vergelijking met de 9700pro wel beseffen dat de X1300 op bijna het dubbele geklokt is. De extra features en SM3.0 maken dit ruimschoots goed, de X1300 is wat dat betreft zeker een efficient product.
Je weet niet hoe een X1300 zou presteren met een ringbus. Dus om daar conclusies uit te trekken dat dit een goede keuze is geweest weet je niet. Ik weet dat ATi ook in de X1300 een ringbus had willen inbouwen, maar dat de kosten dan de pan uit rezen voor dat segment en dat is duidelijk bij de X1600 niet zo, dus waarom daar geen ringbus inbouwen als het kostenplaatje nog klopt bij ATi? De X1300 core was te klein voor de ringbus. De chip zou dan niet meer in het kostenplaatje passen (zou dan rond de 130M uit komen).
En je vergeet een belangrijk iets... dat de 3:1 ALU:TEX verhouding van de X1600 en X1900 meer beinvloed worden door het geheugen en dus meer baat hebben van een memorycontroller die geavanceerder is en met fijnere batchsizes kan omgaan dan de memorycontrollers die we kenden van de R9700 en X800 serie. Zelfs de X1300 serie is omgeschakeld van een 2x64 naar 4x32-bit memory controller waardoor deze efficienter is met geheugentoepassingen zoals Hypermemory.
Als men voor beide had gekozen dan was de core nog veel groter geweest en paste het niet meer in de midrange. Als ATi voor meer ROPs had gekozen dan was nog niet helemaal duidelijk of de X1600 wel veel sneller was geweest dan de X700. Maar daar zullen we nooit meer achter komen.
Zie:
http://www.beyond3d.com/reviews/ati/rv5xx/index.php?p=08
In die review zie je ook de verschillen tussen een X600 en X1300. Eigenlijk zijn het dezelfde cores, maar de X1300 heeft natuurlijk SM3 + Avivo, maar de X1300 is in veel tests eigenlijk alleen maar sneller dan een X600 vanwege de hogere snelheid en de tweaks in memorycontroller van 2x64 naar 4x32. Ditzelfde beeld zou je zeer waarschijnlijk ook zien bij een X1600 met 8 ROPs en een 1:1 ALU:TEX verhouding.
Het is alleen jammer dat de relatief dure X1600 chip wordt opgeoffert voor een X1600pro met pover ddr2 geheugen. Ik vraag me dus af of ATI hiermee zichzelf niet tekort heeft gedaan.
Ik denk dat mensen zich te veel blind staren op marges bij ATi. Een X1600 is niet duur.
De X1600XT is vooral ingezet om de 6600GT te bestrijden, dit was ongetwijfelt ook wel gelukt met een oudere controller op ca. 600Mhz 1.6ns GDDR3 geheugen. ATI had met de transitie naar 90nm alle troeven in handen om de 6600GT difinitief weg te vegen, zowel qua prijs als prestatie. Helaas blijft de X1600XT boven de 150 euro kosten wat mij enigzins teleursteld, dit had lager kunnen zijn als ze wat conservatiever waren geweest.
Nogmaals dat kan je helemaal niet stellen. Elke keuze heeft trade-offs zoals ik hierboven al had laten zien. 8 ROPs? Prima, maar dan geen 3:1 ALU:TEX. Niet op dat moment in dit prijssegment. Een half jaar later kan de situatie ineens heel anders zijn.
Om het maar in ATi's woorden te zeggen. De X1600XT is niet ingezet om de 6600GT te bestrijden. .. De X1600XT is bedoeld om de X700Pro te vervangen en sneller te zijn dan de X700Pro. Daarin zijn ze geslaagd en in het proces is ook nog eens de 6600GT verslagen. Maar goed, iedereen zet 'm natuurlijk tegenover de 6600GT wat logisch is en ten tijde van launch was het niet eens zo'n slechte zet hoor. De X1600XT had 256MB terwijl de meeste GTs maar 128MB hadden voor hetzelfde geld en de XT was ook nog eens sneller.
Het verschil tussen 4x32 of 2x64 bit lijkt me niet zo relevant aangezien de 7600 serie bewijst dat 2x64bit snel genoeg is.
Niet relevant?

Zie bovenstaand verhaal over het 'belangrijke' ding dat je vergat en dat de MC niet eens zozeer verantwoordelijk is voor de goede performance van de 7600 serie... En je kan ATi's 2x64-bit moeilijk vergelijken met nVidia's 2x64-bit. Dat is nou net het hele punt. De technieken zijn anders. Je zou gelijk hebben als blijkt dat ATi's eigen 2x64-bit inderdaad voldoende was geweest ipv een 4x32-bit. Maar zoals ik hierboven al had gezegd profiteert bv HM meer van 4x32 bit granularity dan 2x64-bit. Maar niet alleen HM profiteert er van. Over het algemeen is de nieuwe memory controller tot zo'n 4x efficienter dan de vorige.
Beyond just the addition of the arbitration login, ATI are claiming a 4x efficiency in random access of the memory by virtue of the fact there are now 8 memory banks per DRAM on the R520 memory controller, as opposed to 4 banks per DRAM on R420, and also 8x32-bit memory channels rather than 4x64-bit channels. To get the maximum efficiency out of the memory bus the memory channels should ideally carry enough data to max out the width of the channel and the burst length of the DRAM module - the wider the memory channel the less likely this is to occur, so breaking down the memory channel into even smaller width can increase the effective bandwidth utilisation. Up until now all 256-bit memory busses have utilised 4 way crossbar's, breaking the channels down to 4x64-bit busses; its likely that previous designs were not able to go down any further due to the trace density issues mentioned before - the ring bus mechanism now allows this to occur and also reduces the trace density, increasing the clock speeds.
http://www.beyond3d.com/reviews/ati/r520/index.php?p=05
^^ dat geldt dus ook voor 4x32-bit itt 2x64-bit.
De memorycontroller moet kunnen meeschalen tot GDDR4 geheugen van 1.8Ghz en sneller, en zal in alle kaarten van ATi worden ingevoerd. ATi is dus gewoon toekomstgericht bezig. Zoals altijd eigenlijk. Dat een 7900GTX het leuk doet zonder ringbus en 4x64-bit is mooi, maar ATi bereikt hetzelfde (en meer) met 8x32-bit en een ringbus. En de programmeerbaarheid heeft al laten zien dat er leuke boosts 'gevonden' kunnen worden door te spelen met de MC. nVidia aan de andere kant zal hun memory controller moeten volledig moeten ombouwen om geschikt te maken voor GDDR4. Dat hoeft ATi niet meer te doen.
Technical PR Officer @ MSI Europe. My thoughts and opinions may not reflect the ones of my employer.