Werelds schreef op vrijdag 21 november 2014 @ 10:56:
[...]
Ach kom op zeg. Als je het zo wil gaan spelen heeft Nvidia 2008/2009 ook niet gewonnen, immers had AMD toen R600. Ja tuurlijk niet zo snel, maar wel een stuk goedkoper dus weldegelijk competitief.
'Competitief' in de financiele context bedoelde ik (het ging immers om of bedrijven al dan niet ten onder gaan aan een 'falende generatie').
Aangezien de R600 de generatie is waar ATi failliet ging en overgenomen door AMD, is deze dus zeker NIET competitief.
nVidia was wel competitief, want ze hebben in de Fermi-tijd prima bedrijfsresultaten gedraaid, netjes winstgevend.
Natuurlijk wel. In 1978 kwam Intel met de 8086, en niet met de Core i7, omdat de 8086 wel binnen de technische mogelijkheden van het procede lag, en een Core i7 niet. 29000 transistors op een chip, dat lukte wel, met 4.77 MHz.
Een paar miljard transistors, op om en nabij de 4 GHz? Nee, dat gaat niet lukken.
Werelds schreef op vrijdag 21 november 2014 @ 10:56:
Deels wel aan kloksnelheid, maar in de meeste ontwerpen is het niet zo zeer op een specifieke snelheid gericht, als wel op de efficiëntie per tik (waardoor er dus met hogere kloksnelheden meer rendement is).
Dit hangt heel nauw samen, zoals al uitgelegd. Propagatietijd ligt min of meer vast, dus als je puur op efficientie per tik richt, heb je relatief weinig pipeline stages, en dus hoge propagatietijd per stage, en dus lage kloksnelheid.
Je spreekt jezelf hier tegen.
Jawel, want het gaat exponentieel met dat soort dingen.
Zoals je zelf aangeeft, nVidia was de enige die chips van een dergelijke grootte bouwde. Risico nam exponentieel toe.
Werelds schreef op vrijdag 21 november 2014 @ 10:56:
Ik zeg alleen dat een SS-SIMD architectuur niet per definitie efficiënter is, hij is alleen eenvoudiger te gebruiken in het geval van games. In complexere berekeningen komt VLIW in verhouding een stuk beter uit de bus.
Precies andersom.
Games (graphics) zijn extreem parallel, en het is niet heel lastig om in een rasterizer efficient gebruik te maken van VLIW. Bijna alles gaat met 3d of 4d vectors (ARGB data, XYZ posities, normals etc). Zeker met VLIW4 is dat dus vrij efficient.
Het probleem zit hem juist in alle wat meer complexe berekeningen, waar je ook met 1d, 2d data etc te maken hebt.
Omdat games tegenwoordig ook meer naar complexe berekeningen toe gaan (niet alleen 3d graphics, ook physics, AI, video encoding/decoding/postprocessing etc), is VLIW dus minder interessant aan het worden.
Werelds schreef op vrijdag 21 november 2014 @ 10:56:
Afhankelijk van het soort, is bij coin mining een 5870 nog steeds een bijzonder effectieve chip. In Bitcoin mining ligt hij zelfs nog steeds ruim voor op GK110. Bij Litecoins is het stuivertje wisselen (pun intended

). Leuk detail is overigens dat AMD het daar nog steeds stukken beter doet dan Nvidia.
Coin mining is juist helemaal geen complexe berekening (aleen maar wat integer hashing).
Bovendien haalt AMD de winst vooral uit het feit dat ze een shifter/rotator in hardware hebben, die nVidia nog niet heeft, en het feit dat AMD meer geoptimaliseerd heeft voor integer-berekeningen, waar nVidia vooral voor float performance is gegaan.
Daar maakt coin mining dankbaar gebruik van (zie hier:
http://www.extremetech.co...oys-nvidia-bitcoin-mining)
Is dus een special case, zegt weinig over het algemene geval, en al helemaal niets over VLIW.
Werelds schreef op vrijdag 21 november 2014 @ 10:56:
Nogmaals, jij hebt het over
makkelijker. Code die is geschreven op een dusdanige wijze dat alle 4 of 5 de ALU's in VLIW aangesproken worden is
lastiger te schrijven (of voor een compiler te optimaliseren dat dat gebeurt inderdaad), maar uiteindelijk zal die code
efficiënter z'n werk doen.
Jij draait het hier om: Je schrijft code niet om 4 of 5 ALUs in een VLIW aan te spreken.
Je schrijft code om een bepaald probleem te berekenen. Het probleem is dus leidend, en je moet proberen dat probleem op je hardware te mappen.
Veel problemen mappen gewoon niet efficient op een VLIW4/5-architectuur. SIMD heeft dit probleem niet.
Dat is ook het geval (nou ja, 'magisch'...). De 8800 was de eerste 'moderne' GPU, in de zin dat ie niet specifiek voor graphics ontworpen was, maar ook voor GPGPU. nVidia deed dit dmv een SIMD-aanpak, wetende dat dit puur voor graphics iets minder efficient is, maar voor GPGPU-problemen juist veel voordelen biedt.
Alle huidige GPUs zijn dus op deze SIMD/GPGPU-filosofie gebaseerd.
Dat kun je 'evolutie' noemen, maar dat neemt niet weg dat nVidia hier als eerste mee kwam, en dat AMD pas vele jaren later dit idee overnam.
Blijkbaar vind jij het erg belangrijk om dat te benoemen. Ga je gang.
Zoals gezegd, dat komt door shift/rotate, heeft niets met SIMD/VLIW an sich te maken, en echt 'magisch' kan ik het ook niet noemen (CPUs uit de jaren 70 hadden het ook al). Gewoon een instructie die toevallig voor 1 specifiek probleem wat winst kan boeken. nVidia vond blijkbaar dat het (nog?) niet nodig was om een dergelijke instructie in hardware te implementeren, en dus zijn ze minder efficient in coin mining.
Het probleem is dan ook niet dat nVidia die double VIA's niet gebruikte. Ze gebruikten ze wel degelijk. Het punt was dat bij de productie de dubbele VIA's vrij vaak mislukten, waarbij maar 1 van de twee punten contact had (effectief single VIA dus), of helemaal niet.
Dit probleem is opgelost, enerzijds doordat TSMC z'n VIA's betrouwbaarder maakte, en anderzijds doordat nVidia op bepaalde probleempunten dan nog maar vettere VIA's gebruikte voor de zekerheid.
Nogmaals, VIA's waren niet nieuw. Hier een document van nVidia over Tesla:
http://www.cse.psu.edu/~x...s/IEDM2009/DATA/01-01.PDF
Daar zeggen ze al: "To
design for manufacturing, we use double or multiple vias for
each connecting node up to the limits allowed by die size. In
Fig.7, roughly 75% of all vias in a chip have redundancy to
improve yield. The remaining 25% single vias (a few
hundred millions) are at risk and are mainly responsible for
yield loss."
En dan wil jij beweren dat ze met de opvolger van Tesla, namelijk Fermi, ineens niets meer weten over double VIA's, multiple VIA's, redundancy, de risico's, yields etc?
Echt, get a clue.