Op maandag 10 juni 2002 14:01 schreef Procyon for life het volgende:
[..]
Het ontwerp van de PIII is ook veel beter en complexer dan die van de P4, bij de P4 hebben ze op bepaalde punten concessies gedaan om hogere snelheden te halen (klein L1 cache, hele lange pipeline), hierdoor hoeft het niet net zo snel te lopen als de P4.
WARNING!! hele lange post
ik hou van discussieren
Dit is niet juist: Als de PIII complexer is, waarom is de P4 core dan groter ? Je bedoelt waarschijnlijk IPC,
Instructions
Per
Clockcycle. De PIII doet meer werk per kloktik. Langere pipelines maken cores juist complexer en groter. Dat is een investering die zich terugbetaald doordat effectief er toch meer instructies per seconde uitgevoerd kunnen worden.
De grootte van de L1 cache valt ook mee, de
data cache is niet groot, maar dat wordt gecompenseerd door een 256 bit brede bus naar het L2 cache (de Athlon heeft maar een 64 bit brede bus naar het L2 cache). De L1 instructie cache, is goed voor 12.000 µops, en dat is volgens kenners ongeveer gelijk aan 64 kb.
Eigenlijk is de P4 gewoon een slappe hap als je die SSEII weg zou halen, en waarschijnlijk zou dan een P4 2,53+GHz mindere scores laten zien in de cpu benchmark van SisoftSandra, dan de PIII1533MHz.
Zie boven. De P4 is zeker geen slappe hap, al lijkt het een zwaktebod om bewust een ontwerp te kiezen met lagere IPC, om dat maar te gaan compenseren met hogere kloksnelheid.
Als je weet dat een PIII tualatin met 512 kb aan L2 cache bijna net zo snel (of soms net iets sneller) is dan een Athlon XP 1533, (XP188+) dan kom je uit op een P4 1800. Zeker niet zo snel als een P4 2533, zelfs met zwakkere FPU unit.
Bovendien denk ik dat ook de PIII nog veel hoger had kunnen lopen, als daar net zoveel tijd en energie in gestoken was als in de P4.
En dan ? Nou spreken CPU guru's als Paul DeMone je tegen, want die bevestigen dat de rek ècht uit de PIII core is. Als Intel nou met man en macht de PIII nog weet op te rekken tot 1800 MHz, dan houdt het daarna alsnog op. (Vraag maar aan Motorola, die de PowerPC G4 maakt, die heeft een nog kortere pipeline dan de PIII, en de G4 is echt heel slecht op te schalen.)
Intel is overgegaan op de P4 omdat dit nieuwe ontwerp heel ver op kan schalen. Dat zou met de PIII nooit mogelijk geweest kunnen zijn. Intel
moest dus wel met een geheel nieuw ontwerp komen.
En als we dan toch terug kijken naar de P pro cores dan zien we dat het zelfde ontwerp, door een paar aanpassingen van 200MHz naar 1533Mhz schaalde.
Tsja, dan is nu de vraag wat je nou precies verstaat onder "het
zelfde ontwerp".
PPRO, op 0,50 µ, naar PII op 0,35 µ met MMX erbij (klamath), naar PII op 0,25 µ (deschutes), naar PIII op 0,25 µ met SSE erbij (katmai), naar PIII op 0,18 µ (coppermine) naar PIII op 0,13 µ, met data prefetch en (optioneel) 512 Kb L2 (tualatin).
Vergeet even niet dat bij iedere overgang naar een kleiner productie proces het hele ontwerp op de schop gaat / kan gaan. Het enige dat gebleven is is het aantal pipelines, aantal stages in pipelines, en L1 cache structuur. De rest, MMX, SSE, data prefetch, Out Of Order schakel logica, dat kan allemaal ondertussen anders zijn. Al met al zal je heel weinig schakelingen in de PIII tualatin vinden zoals ze in de PPRO zaten. Ik ga er wel vanuit dat Intel ook aan optimalisatie gedaan heeft in plaats van copy-paste.
Het lijkt me juister om te zeggen dat de PIII
gebaseerd is op de PPRO archtectuur. Van 'het zelfde ontwerp', op niveau van schakelingen, valt denk ik niet meer te spreken. Ik noem die hele opsomming niet meer 'een paar aanpassingen'.
Dat is 766% meer dan hij ooit geweest was, voor AMD zou dat dan 500MHz * 7.665 zijn = 3.8 Ghz op .13micron zijn voor het Athlon ontwerp.
Die vergelijking kan je niet maken, je vergelijkt appels met peren. Waarom ? de Athlon begon op 0,25 µ, de PPRO op 0,50 µ. En Intel heeft een veel groter budget uit te geven aan research voor optimalisatie. De Pentium heeft ook minder pipelines dan de athlon. Enz. enz.
( Daar komt nog bij dat de PPRO makkelijk sneller gekund had, maar dat was op 0,50 µ niet mogelijk (!!) Toen was 'ie dus ook al 'maxed out' alleen niet om ontwerp-technische redenen. De Katmai was het ook op 600 MHz, en de coppermine op 1133.)
Wel grappig trouwens:
"Meer details over 0,13 micron problemen Intel"
"Gepost door Wouter Tinus maandag 7 mei 2001 - 00:15"
ALL-CAPS WITH NO PUNCTUATION IS SO MUCH TRUER TO THE WAY THOUGHTS HURTLE OUT OF THE HUMAN BRAIN THAN CAREFULLY MANICURED AND PUNCTUATED SENTENCES COULD EVER BE