Een Bulldozer 8-core krijgt dus vier keer wat er op dat plaatje staat? Of toch acht keer? Ik ga op basis van de tekst uit van vier keer. Maar het blijft wel onduidelijk.
Over de Integer-performance heeft het plaatje helaas weinig tot geen voorspellende functie. Het enige wat er echt uit te halen valt is de toename van drie naar vier integer pipelines per core. We weten namelijk verder niet weten over zaken als cache-groottes en -latencies, de branch-predictor, etc.
Als alle andere zaken gelijk blijven kan een toename van drie naar vier pipelines de
IPC ongeveer 5% tot 10% laten toe nemen. Het maximum van 33% toename kan namelijk niet gehaald worden door instructie-afhankelijkheden. Mocht er
SMT (wat Intel Hyperthreading noemt) geimplementeerd worden, dan kan daar wellicht nog 5% - 10% bij komen, want dan wordt die extra pipeline vaker en efficiënter benut.)
Wat FloatingPoint-performance komt AMD met een interessant idee. Strikt genomen valt te zeggen dat Bulldozer ten opzichte van Sandy Bridge op gelijke FP-throughput per kloktik uit komt. Maar dat Bulldozer deze waarschijnlijk efficiënter kan gebruiken omdat de integer-pipelines van de helft van de cores beschikbaar blijft, ook bij een volledige FP-load.
Hoe dan ook komen beide uit op 8 DP FLOPS / processor. De processor met de hoogste kloksnelheid heeft dan ook de hoogste FP performance. Mocht er in software echter goede ondersteuning komen voor FMAC (en deze instructie komt ook regelmatig voor in dat programma), dan is wel plots een forse prestatie-verbetering te verwachten. (Een programma wat allemaal FMAC zou doen kan rekenen op maximaal een verdubbeling tov Sandy Bridge). Dit omdat een 128-bits FMAC instructie dan hetzelfde doet als een 128-bit FM en 128-bit FA instructie.
Verder is de losse scheduler voor Floating Point een potentieel voordeel, omdat als core A zwaar met integers belast wordt, dat core B het FP-gedeelte van core A ook kan gebruiken.
Naar aanleiding van dat plaatje zijn er twee vragen waar ik antwoorden voor zoek...
Zijn het nu vier of acht van deze plaatjes voor een 8-core Bulldozer? Ik ga nog steeds uit van vier, maar mochten het er acht blijken te zijn dan is deze CPU een monster.
Welke andere IPC-verhogende zaken mogen we verwachten? Het vermeerderen van het aantal integer pipelines per core doet vermoeden dat er ook iets ala
SMT beschikbaar zal zijn, omdat het anders wel eens zonde kon zijn van de extra transistors die die pipelines kosten. (Meer pipelines zijn via SMT beter te benutten dan zonder).
[
Voor 9% gewijzigd door
kalizec op 11-11-2009 21:56
]
Core i5-3570K/ASRock Z75 Pro3/Gigabyte Radeon HD7850/Corsair XMS3 2x4GB/OCZ Vertex2 64GB/3x640GB WD Black/24" B2403WS Iiyama x2/Nec 7200S