Even in het kort uitgelegd:
IPC= instructions per second.
Niet iedere instructie heeft evenveel stappen, maar vergelijk het met het maken van een auto aan een lopende band. Je kunt tien teams elk een auto laten maken, waardoor telkens alles bezet is, en er tien auto's aan het eind klaar zijn. Je kunt ook een lopende band maken en ieder team een ander deel van de auto laten maken. Je begrijpt dat elk stapje nu tien keer zo kort duurt (gedeeld door tien teams). Zo werkt het ook met cpu's. Je hebt een pipeline in een proc van een bepaald aantal stappen. Athlon heeft er 11, de Pentium4 heeft er 20. Maar hetgeen wat ze doen (de instructies) zijn redelijk hetzelfde. De stappen bij athlon duren dus langer dan bij de pentium4, omdat er in die stappen meer werk gebeurt.
Conclusie: omdat de stappen bij de Pentium4 minder tijd kosten, kan de kloksnelheid omhoog. Bij de athlon gaat dit minder goed, omdat er te veel werk gedaan moet worden in die kloktik. Vandaar het verschil in kloksnelheid, maar het zijn ook echt twee andere strategieen.
ps:
Verder gaan er nog dingen spelen als branche-prediction. De instructies worden door algorithmes in de cpu berekend (welke er uitgevoerd moet worden), maar af en toe gaat dit fout, en moet de gehele pipeline geflushed worden. Bij de pentium4 is de penalty hiervan natuurlijk hoger, omdat het weer twintig kloktikken duurt voor de pipeline weer gevuld is. Bij de athlon kost dit minder tijd. Vandaar dat intel allerlei manieren heeft bedacht dit zo weinig mogelijk te laten voorkomen (m.b.v. trace cache e.d.).
Wanneer ALLE opdrachten goed zouden worden voorspeld, zou de pentium4 tussen de 20% en 30% sneller zijn. de lange pipeline maakt de penalty (zelfs bij de gehaalde nauwkeurigheid, ongeveer 97%) erg groot.
De instructies van athlon (waarin ze worden vertaald) zijn trouwens groter dan bij de pentium. Intel heeft micro-ops en AMD macro-ops. Deze worden weer gesplitst in 'ingewikkelde' (Die meerdere bevatten), en simpele. Moeilijke worden opgezocht in een rom in de cpu, en de makkelijke is nu net waar de pentium4 bijvoorbeeld ontzettend snel in is. De trage is hij brak in, maar dat vertelt Intel je niet

)
Iedere instructie kent zijn eigen unit om uitgevoerd te worden.
Dit is HEEL GLOBAAL wat er gebeurt, maar ik sla hierbij grote stukken over. Het zou teveel tijd en kennis vereisen om hier nauwkeurig op in te gaan. Ik hoop in ieder geval dat je er wat aan hebt..
**beertje**