Verschil tussen AMD Athlon X2 QL-64 en Intel Core i3 370M

Pagina: 1
Acties:

  • Peetz0r
  • Registratie: Mei 2009
  • Laatst online: 15-02 01:46
Ik heb ene kapotte laptop met een AMD Athlon X2 QL-64 en ik heb een nieuwe besteld met een Intel Core i3 370M erin.
Op een rijtje:
AMD Athlon X2 QL-64Intel Core i3 370M
Kloksnelheid2,1 GHz2,4 GHz
Aantal cores22
TDP*35 watt35 watt

* TDP van de i3 is inclusief grapics
Meer specs

Ze lijken bijna hetzelfde. De i3 is 14% sneller.
Verder kan ik niet zoveel specs naast elkaar leggen.

Maar nu vind ik o.a. deze stapel benchmarks:
PassMark3DMark06 CPUCinebench R10 32Bit MultiSuperPI 32MwPrime 1024DhrystoneWhetstone
X2103714743264275914611434112873
i3222125756215098706663238025350


Hoe kan het dat de i3 ruim twee keer zo snel is/lijkt dan de X2?
Een verschil wat ik kan vinden is dat de i3 Hyperthreading en SSE4 ondersteunt, maar maakt dat zoveel verschil?

Zijn er andere (betrouwbare) benchmarkt beschikbaar van beide cpu's?
Edit: ik heb er net een paar toegevoegd

[ Voor 70% gewijzigd door Peetz0r op 02-09-2011 23:59 ]


Verwijderd

Om te beginnen heeft de Intel 3MB L3 cache en de AMD niet, verder verschilt de architectuur van de CPU enorm.

  • Peetz0r
  • Registratie: Mei 2009
  • Laatst online: 15-02 01:46
Verwijderd schreef op vrijdag 02 september 2011 @ 23:49:
Om te beginnen heeft de Intel 3MB L3 cache en de AMD niet, verder verschilt de architectuur van de CPU enorm.
Voor zover ik kan vinden heeft de X2 helemaal geen L3 cache. Klopt dit?
Als hij wel een L3 cache heeft, hoeveel is dat dan?
Hij heeft wel een grotere L1 en L2 cache, voorzover dat helpt
Dus:
AMD Athlon X2 QL-64Intel Core i3 370M
L1 cache128 KB (code) + 128 KB (data)64 KB (code) + 64 KB (data)
L2 cache1024 KB512 KB
L3 cache?3072 KB


En is het in alle benchmarks de L3 cache die het verschil maakt?

  • GENETX
  • Registratie: Juni 2005
  • Laatst online: 20:30
De AMD heeft geen L3. Maar het is verder ook de architectuur van de CPU. Zo was de pentium4 gemaakt voor hoge kloksnelheid, maar had heel weinig power per kloktik. Die i3 is bv nog sneller dan een pentium4 dualcore die op 4,8GHz zou lopen.


Oud, maar nog steeds van toepassing.

[ Voor 7% gewijzigd door GENETX op 03-09-2011 09:32 ]


  • Peetz0r
  • Registratie: Mei 2009
  • Laatst online: 15-02 01:46
GENETX schreef op zaterdag 03 september 2011 @ 09:27:
De AMD heeft geen L3. Maar het is verder ook de architectuur van de CPU. Zo was de pentium4 gemaakt voor hoge kloksnelheid, maar had heel weinig power per kloktik. Die i3 is bv nog sneller dan een pentium4 dualcore die op 4,8GHz zou lopen.

[video]
Oud, maar nog steeds van toepassing.
De G4 vs P4 is PowerPC vs x86

Deze twee is x86_64 vs x86_64.
Is het verschil dan net zo groot of hoe zit dat?
Wat van de architectuur is er dan zo verschillend als ze dezelfde instructieset hebben?

  • bwerg
  • Registratie: Januari 2009
  • Niet online

bwerg

Internettrol

Instructieset is niet gelijk aan de architectuur, het is slechts een deel van de interface waar een CPU-ontwerper zich aan moet houden. Hoe snel of traag een CPU intern instructies verwerkt wordt geheel niet door de instructieset bepaald. Zo voert een pentium4 dezelfde instructies uit als een i7 maar doet dat wel veel trager.

Een instructieset is als een handleiding van een ikea-kast: je moet precies doen wat er staat maar hoe lang je erover doet maakt niet uit. Je kan de kast in elkaar zetten in een kwartiertje of je kan er drie uur over doen. Zelfde instructieset, verschillende prestaties.

En wat er dan allemaal extra in een architectuur zit behalve het noodzakelijke: optimalisaties om code sneller te kunnen uitvoeren, in alle soorten en maten. Hier kan je hele studies over volgen, d'r zit dus best veel in en daar kan dus ook veel verschil in zitten.

[ Voor 54% gewijzigd door bwerg op 03-09-2011 13:14 ]

Heeft geen speciale krachten en is daar erg boos over.


  • Reepje
  • Registratie: Juni 2010
  • Niet online
P.E.T.E.R. schreef op vrijdag 02 september 2011 @ 23:40:
Ze lijken bijna hetzelfde. De i3 is 14% sneller.
Verder kan ik niet zoveel specs naast elkaar leggen.

Maar nu vind ik o.a. deze stapel benchmarks:
Wel lachen. Hoe weet je dat de i3 14% sneller is. Of heb je gewoon simpelweg de kloksnelheden vergeleken, en daaruit geconcludeerd dat de i314% sneller is? 8)7

Maar je bent er nu dus ook achter dat kloksnelheid niets zegt.

  • GENETX
  • Registratie: Juni 2005
  • Laatst online: 20:30
P.E.T.E.R. had dus ook nog de verkeerde opvatting dat kloksnelheid bijna alles zegt ;) Enkel die kloksnelheid is dus 14% hoger, maar dat zegt niks.

Wat betreft de instructieset is er ook nog een leuke. Je hebt als het ware ook synoniemen. Je kan namelijk dingen op meerdere manieren berekenen. Denk vooral aan vermenigvuldigen van getallen >10 op de basisschool. Dan gingen die onderelkaar en werd de som makkelijker gemaakt door hem in stukjes te hakken. In plaats van 1 vermenigvuldiging deed je er dan 2 of 3. Steeds het tussenantwoord opschrijven etc etc. Zoiets heet een algoritme. Een werkwijze om een antwoord te vinden.

En zo kan dat in de processor ook. Je kan in één keer een 64-bit vermenigvuldiging doen bijvoorbeeld, maar je kan ook gebruik maken van een simpelere 32-bit vermenigvuldiging. Dat kost minder transistoren en is dus goedkoper/makkelijker te realizeren. De prijs is echter wel dat je voor grote getallen meer tussenstappen moet doen. Tussenberekening en opslaan, en dan weer doorgaan tot het eindantwoord. Dan kom je tot hetzelfde antwoord, maar kost het bijvoorbeeld 4 instructies (stappen en kloktikken) ipv 1.

En dat zie je bijvoorbeeld met aanvullingen als SSE, die extra instructies komen dan echt beschikbaar om aan te roepen. Zo hoeft de programmeur of compiler het zelf niet meer op te lossen. Maar andersom kan het ook (en dat gebeurd ook). Ingewikkelde instructies aanbieden als onderdeel van de set, maar intern vertalen naar een serie van instructies. Hierdoor wordt de CPU dus goedkoper omdat de hardware niet hoeft te worden gerealiseerd en is de instructie wel beschikbaar.

En zo zijn er allemaal trucjes waarbij kosten en performancewinst worden afgewogen. HT maakt het zo mogelijk om soms 2 instructies in één keer te verwerken ipv 1. Daarvoor zijn standaardzaken dubbel uitgevoerd. Één daarvan is het register. Dat is het geheugen waar antwoorden worden opgeslagen na de verwerking van een instructie. Maar Intel kan enkel 2 instructies uitvoeren die geen onderdelen van de zogenoemde ALU (Arithmetic Logic Unit) met elkaar delen. AMD's Bulldozer core gaat nog verder. Die heeft enkel de veelgebruikte dingen 2x uitgevoerd en zaken die minder belast worden slechts enkel. Zo besparen ze veel transistoren terwijl 1 "module" bijna de performance van een reguliere dualcore behaalt. Allemaal efficiëntie.

Wat betreft Cache. Dit is vooral belangrijk om snel veel data aan te wenden. Een aantal toepassingen heeft hier baat bij, zoals games bijvoorbeeld. Werkgeheugen is relatief traag en moeten wachten tot de data beschikbaar is kost veel klokcycles. Immers, een processor kan niks doen zolang de data voor de berekening niet beschikbaar is. Jij kunt wel klaar zitten voor een toets en het schrijfpapier al hebben, maar zolang je de toets zelf niet voor je hebt kun je helemaal niks beginnen.

En zo kom je uiteindelijk bij de IPC (Instructions Per Clock cycle). Dat is dus de prestatie die er per kloktik uitkomt. En dat die is dus afhakelijk van het ontwerp van de processor. Hoe lang is de pipeline, hoe veel cache is er, hoe snel is die cache, zijn grote instructies ook in hardware uitgevoerd, of worden ze opgesplitst? Hoe efficiënt is de scheduler? Kan de volgorde van instructies efficiënter (out-of-order instructieverwerking, iets dat bv de Atom mist en dus slechter is in multitasken). Er zijn echt honderden dingen die meetellen voor de prestaties. Een instructieset is enkel de taal zodat de processor de code begrijpt en kan uitvoeren. Maar het is uiteindelijk de processor zelf die bepaald hoe snel de opdracht wordt verwerkt.

De meeste fietsemakers kunnen ook wel een band plakken als je ze die opdracht geeft, maar het is maar de vraag hoe snel ze dat kunnen. Ook dat hangt af van het personeel dat er loopt en hoeveel. Hoeveel ruimte ze hebben in de werkplaats, etc etc. De enige overeenkomst tussen al die fietsenhandelaren is dat ze weten hoe ze de band moeten plakken, maar de uitvoering in dat hele proces kan anders verlopen.

Goed, deze post is alweer veel langer dan ik had gewild :P . Ik zag in je profiel dat je nog op de middelbare school zit. Ik heb de indruk dat je dit topic niet voor niets starte omdat het grote verschil je ineens boeide :) . Op wikipedia kun je nog veel meer vinden als je zoekt op dingen als instructieset en ALU (Arithmetic Logic Unit). En bij een opleiding als elektrotechniek mag je zelfs met FPGA's gaan spelen en zelf je processortje bouwen :D En ja, dat is echt geweldig leuk speelgoed ;)

[ Voor 16% gewijzigd door GENETX op 03-09-2011 15:55 ]


  • Peetz0r
  • Registratie: Mei 2009
  • Laatst online: 15-02 01:46
GENETX schreef op zaterdag 03 september 2011 @ 15:45:
P.E.T.E.R. had dus ook nog de verkeerde opvatting dat kloksnelheid bijna alles zegt ;) Enkel die kloksnelheid is dus 14% hoger, maar dat zegt niks.
Dat bedoelde ik dus. De frequentie is 14% hoger. Verder had ik gezien dat beide CPU's (ongeveer) dezelfde uitbreidingen ondersteunen
Dus als je de X2 een complexe instructie geeft breekt hij die op in bijv. 10 instructies.
De i3 doet hetzelfde, maar met 5 instructies. En dan is de i3 ineens twee keer zo snel met die instructie. Nu begin ik het te snappen :)

Beiden hebben niet de specifieke hardware om de instructie "echt" uit te voeren, maar doen dat "virtueel". En daarin is de i3 dus vaak beter.
GENETX schreef op zaterdag 03 september 2011 @ 15:45:
Goed, deze post is alweer veel langer dan ik had gewild :P . Ik zag in je profiel dat je nog op de middelbare school zit. Ik heb de indruk dat je dit topic niet voor niets starte omdat het grote verschil je ineens boeide :) . Op wikipedia kun je nog veel meer vinden als je zoekt op dingen als instructieset en ALU (Arithmetic Logic Unit). En bij een opleiding als elektrotechniek mag je zelfs met FPGA's gaan spelen en zelf je processortje bouwen :D En ja, dat is echt geweldig leuk speelgoed ;)
Ik ben inmiddels gestopt met de middelbare (4VWO wil niet lukken) en ik doe nu Applicatieontwikkeling op het ROC. Goed dat je me eraan herinnerd om mijn profiel te updaten!

  • GENETX
  • Registratie: Juni 2005
  • Laatst online: 20:30
Jup, ik kon niet de exacte cijfers vinden voor de Athlon. Maar als ik het mag gokken, dan heeft de i3 meer dan 2x zoveel transistoren in huis. Een groot deel gaat naar het geheugen (dat is "duur", kost veel ruimte en transistoren). Dat zal zich dan doorgaans dus ook vertalen in een 2x zo hoge performance.

  • Peetz0r
  • Registratie: Mei 2009
  • Laatst online: 15-02 01:46
Dan is het aantal transistoren dus iets waar je op kan letten als je totaal verschillende processors vergelijkt. Handig om te weten :)

Verwijderd

Wat denk je hier http://www.anandtech.com/bench/CPU/2 van?
Pagina: 1