![]() Het derde topic van de reeks waar alle in's en out's van Intel's nieuwste multi-core processoren besproken kunnen worden! De focus van dit topic zal voornamelijk op de Core 2 Quad, Core i5 en de Core i7 liggen. Voor informatie over de oudere Pentium D kun je het beste in vorige deel kijken. Inhoudsopgave
1. Dual-core en multi-coreTwee jaar geleden waren dual-core processoren helemaal top. Steeds meer desktop PC's werden uitgerust met twee cores, iets wat voorheen enkel voor de die-hard beschikbaar was in de vorm van een duur dual-processor systeem. Sinds die tijd zijn zowel AMD als Intel bezig om steeds meer cores in één processor te verwerken. Vandaag de dag zitten we 'nog' bij quad-cores maar de toekomst heeft nog veel meer in petto.Allemaal leuk en eigennaardig maar wat heb ik hier aan, hoe werkt het en wat moet ik mij voorstellen bij de programmering van applicaties op een dual-core systeem? Je leest het hieronder! 1.1 Wat is het voordeel van een dual/multi-core processor?Het praktijkvoorbeeldHet voordeel van een dual-core processor, ten opzichte van een single-core processor, is dat je meer tegelijk kunt doen op de PC of dat een applicatie sneller zal werken. Bij een gelijke single en dual-core processor zal een dual-core in absolute zin niet sneller worden. Een WAV-bestand dat naar MP3 omgezet moet worden zal op een Pentium 4 530 precies even lang kunnen duren als op een Pentium D 830 terwijl deze laatste dual-core is. Pas zodra de MP3-encoder geoptimaliseerd is en met twee of meerdere cores overweg kan zal het omzetten sneller gaan. Applicaties dienen dus overweg te kunnen met de techniek alvorens er winst geboekt kan worden. Wat als de meeste applicaties niet geschreven zijn voor dual of multi-core processoren? Dan valt er alsnog winst te behalen. Een kale, vers geïnstalleerde PC met Windows Vista zal in taakbeheer al tientallen verschillende actieve processen (programma's / onderdelen die Windows draaiende houden) laten zien. Dit zijn op zichzelfstaande programma's en die nemen allen een thread in beslag. Dat betekent dus dat er al tientallen threads zijn en om die allemaal een eigen core te geven zou een processor met 32-cores eigenlijk al niet genoeg zijn. Nu zijn de meeste processen vrij licht qua rekenkracht en hebben ze niet allemaal een eigen core nodig. Stel dat er een single-core processor in zou zitten, alle processen van Windows draaien en er wordt een WAV-bestand naar MP3 omgezet. De encoder zal op volle kracht willen draaien maar kan niet 100% van de processor benutten omdat de processen van Windows ook moeten blijven draaien. De MP3-encoder loopt hier dus al vertraging op. Wil je op dat moment verder werken op de PC dan zul je merken dat de PC een stuk trager aanvoelt omdat de processor volledig belast is. Vanaf dit moment komt een dual of multi-core processor al als geroepen. Immers zou de MP3-encoder dan automatisch één core gaan gebruiken waardoor de andere over blijft voor de processen van Windows en het werk wat je in de tussentijd af wilt maken. Je houdt dan als het ware, naast het encoden, één volledige processor over voor de rest van de taken. Dit kun je uiteraard ook doortrekken naar quad-core (of met nog meer cores / processoren) door een applicatie te gebruiken die wél twee cores gebruikt of door twee WAV-bestanden tegelijk om te zetten. De vergelijking met auto's Vergelijkingen tussen PC's en auto's slaan meestal kant noch wal. Toch zijn ze vaak genoeg prima om techniek te koppelen aan iets praktisch. Aanschouw daarom de twee fictieve processoren hieronder: ![]() ![]() De linker processor is single-core en heeft één baan, één weg. De rechter heeft twee banen en is daarmee dual-core. Beide processoren zijn '80KM/u snel' en alle auto's die er overheen rijden zullen altijd 80KM/u rijden. De weg is trouwens tachtig kilometer lang. Stel dat er één auto (één programma met één thread) naar de overkant moet rijden dan doet deze daar één uur. Immers zal de auto over één baan mogen rijden en blijft de tweede baan (de tweede core) onbenut. In geval van twee auto's zal de eerste auto op de éénbaansweg altijd eerder aankomen dan de tweede auto. Immers kunnen ze niet inhalen (minimum en limiet van 80KM/u) en naast elkaar rijden dat kan ook niet. Bij de tweebaansweg (dual-core) kunnen de auto's tegelijk van start gaan en exact naast elkaar blijven rijden. Ergo: de auto's komen tegelijk aan. Het voordeel van de tweebaansweg is dus dat er meer tegelijk overheen kan. Echter moet je dan wel genoeg auto's hebben om de tweede baan op te vullen. Heb je slechts twee auto's (met MP3 en MSN) dan heeft het niet veel zin om een tweebaansweg aan te leggen. 1.2 Hoe ziet dual/multi-core er op technisch niveau uit?Op technisch niveau steken de dual en quad-core processoren van Intel niet geheel hetzelfde inelkaar. Om er een totaalplaatje van de maken vind je hieronder, in chronologische volgorde, stap voor stap een uitleg.Pentium D De Pentium D is heel simpel gezegd een dubbele Pentium 4. Er zijn twee Pentium 4-cores aan elkaar geplakt en deze zullen via één front-side-bus (FSB) met elkaar communiceren. De chipset bevat een arbiter (scheidsrechter) om te bepalen welke core groen licht heeft en z'n werk mag doen. Er zijn twee soorten Pentium D's uitgebracht, een 800-serie met de codenaam 'Smithfield' en een 900-serie met codenaam 'Presler'. De 800 serie bestaat uit twee 90nm Pentium 4 'Prescott' die letterlijk en figuurlijk aanelkaar zitten (foto). De 900-serie heeft twee 65nm Pentium 4 'Cedar Mill' cores die samenwerken, bijelkaar gevoegd zijn maar niet fysiek aanelkaar vast zitten (foto). Intel heeft hiervoor gekozen omdat de uitval dan lager is. Als bij 'Smithfield' een core defect was, zat de andere core opgescheept met een defecte core. Bij 'Presler' kon er gewoon een nieuwe 'Cedar Mill' core naast gezet worden waardoor het apparaat toch weer werkte. ![]() ![]() De linker is een foto van de Pentium D, de rechter is een foto van de Pentium 4. Op kleurverschil na, ziet de rechter 'die'-shot er hetzelfde uit. Core Duo Technisch gezien bestaat de Core Duo uit twee Pentium-M processoren. Toch zijn deze niet zo letterlijk aan elkaar geplakt zoals bij de Pentium D. De afbeelding hieronder laat dit zien. De arceringen geven bepaalde onderdelen van de processor weer. Het paarse zijn de cores die gespiegeld tegenover elkaar staan. Daar loopt, in het geel, een bus tussen die zorgt dat alles met elkaar in verbinding staat. De bus zorgt ook voor de verbinding van het L2-cache geheugen, dat met groen aangegeven is. ![]() Core 2 Duo De Core 2 Duo is, deels met bestaande technologie, van scratch ontworpen. Naast prestaties en energiezuinigheid heeft Intel er een dual-core design van gemaakt. Voorgangers zoals de Pentium D en Core Duo hadden voor iedere core een eigen L2-cache. Het L2-cache is klein maar zeer snel geheugen op een processor waar de processor nauw mee werkt. Het nadeel van een gescheiden L2-cache is dat het kopieren van data naar de andere L2-cache vrij lang duurt omdat de weg tussen de L2-caches, technisch gezien, erg lang is. De Core 2 Duo pakt dit anders aan. Er zijn nog steeds twee rekeneenheden die aan elkaar zitten, echter kunnen deze twee cores allebei naar dezelfde L2-cache grijpen. Met andere woorden: de L2-cache is gedeeld. Intel heeft dit Advanced Smart Cache genoemd en je kunt er verderop in het topic, namelijk hier meer over lezen. ![]() Bovenstaande afbeelding is een 'die'-shot van de Core 2 Duo. De donkere vlak aan de linker kant is één grote L2-cache. Bij de Pentium D is overduidelijk te zien dat er letterlijk twee processoren aanelkaar zitten en ook bij de Core Duo is scheiding zichtbaar. De cores in de Core 2 Duo zijn, net zoals bij de Core Duo, gespiegeld tegenover elkaar gezet. Core 2 Quad Bij de Core 2 Quad heeft Intel hetzelfde truukje als bij de Pentium D 900-serie toegepast. Simpelweg twee Core 2 Duo's bijelkaar zetten en deze via de front-side-bus (FSB) met elkaar laten communiceren. De afbeelding hieronder geeft dat duidelijk weer. Vergelijk de 'dies' met die van de Core 2 Duo en zie dat ze gelijk zijn. Voor een foto van een naakte Core 2 Quad Q6600 kun je hier kijken. ![]() Core i7 Intel heeft het bij de Core i7 wederom anders aangepakt. Hier is gekozen om voor een quad-core design te gaan zodat het aan elkaar plakken van dual-core cores niet meer nodig is. Het voordeel dat hieruit voortvloeit, is dat een octa-core eenvoudig te realiseren is door deze aan elkaar te plakken. De Core i7 heeft geen gedeelde L2-cache, maar een gedeelde L3-cache. L2-cache is gereduceerd tot 256KB per core terwijl de L3-cache, die op de Core 2 Duo überhaupt niet aanwezig is, het af doet met 8MB. Zie onderstaande thumbnail voor een schema van de Core i7 met codenaam 'Nehalem'. Dank gaat uit naar Hans de Vries voor het samenstellen van de afbeelding. ![]() 1.3 Programmeren voor dual/multi-core, hoe gaat dat?Hoe is dual-core en multi-core dan toepasbaar in bijvoorbeeld computerspellen? Daar zijn een aantal manieren voor. Hieronder zal ik het één en het ander uitleggen.![]() Een programmeur zou graag zien dat de benodigde tijd om iets te berekenen minder wordt. Dit kan door processoren en/of cores toe te voegen en daar gebruik van te maken. Hierboven staat een diagram wat globaal gezien het effect is van het toevoegen van meerdere processoren en/of cores. Bij oudere singlethreaded games zou alles in serie berekend moeten worden. Hierdoor hebben we één slag waarin alles berekend wordt. Om dat multithreaded te maken is het een idee om twee slagen te maken (twee threads). Zo zullen bepaalde onderdelen van een game parallel van elkaar berekend moeten worden. Hierbij botsen we tegen het feit dat de data altijd in gebruik is. Dat is enorm lastig zodra CPU0 en CPU1 tegelijk aan dezelfde data moeten werken.
Dit alles is prima toepasbaar op dual-core systemen. Er zitten wel wat nadelen aan. Als bv. Een 'occlusion-query' weer opnieuw opgevraagd moet worden levert deze methode problemen op. Hoe zouden we dan iets kunnen maken wat gebruik kan maken van meer dan 2 cores? Zie hieronder voor multithreading:
Wat als de AI berekeningen eerder klaar zijn dan de Animation? Dan moet AI wachten totdat Animation klaar is. Daarmee schieten we niets op; dan is het in principe alsnog in serie (achterelkaar) en niet parallel (tegelijk). Deze AI data willen we dus niet vastzetten. We zullen deze data bufferen naar de eerst volgende Animation. Zie het volgende diagram voor het verloop.
Uiteraard is het ook mogelijk om het schema aan te passen. AI wordt in dit geval drie keer berekend terwijl Physics vier keer berekend wordt. Om rekenkracht te besparen zou het wellicht mogelijk zijn (afhankelijk van de game) om AI per 3 cycles slechts 2 keer te updaten. Je zou alle losse threads zo vaak als mogelijk kunnen berekenen. Vroeger ging dit met een zogenaamde 'time-slice'. Er werd bepaald of er bij frame 1 wel of geen AI berekend werd terwijl het dan juist weer tijd is om een keer Physics te berekenen. Nu loopt dat allemaal constant door waardoor alles zo actueel mogelijk blijft. Uiteraard is deze methode alleen mogelijk zodra men alles blijft bufferen. Ook hier zit weer een nadeel aan. Wat als data steeds gebruikt dient te worden door meerdere threads tegelijk? Daarvoor is een zogenaamde 'Operation-queue'.
Zoals te lezen is het schrijven van een game die gebruik maken kan van meerdere cores een stuk lastiger dan het schrijven van een game welke in serie berekend wordt. Veel data is aan verandering onderhevig en tegelijk die data bewerken is niet mogelijk. De buffers bieden uitkomst maar hebben als nadeel dat er een lichte vertraging optreedt. Belangrijk om te weten is overigens dat dit niet "de" methode is om een game te programmeren. Het is slechts een voorbeeld wat toegepast zou kunnen worden in bepaalde gevallen. 1.4 Prestaties van de nieuwste quad-core processoren?Halfweg 2006 kwam Intel met de Core 2 Duo op de proppen. Dat deze processor destijds snel was is niemand ontlopen. Ditzelfde geldt ook voor de Core i7 die zeer goede prestaties neer zet. Sedert de lancering van de Core i7 zijn er tientallen reviews opgedoken. Hieronder zal ik er een aantal noemen maar vanzelfsprekend ga ik niet alle reviews hieronder neerzetten. Wil je meer dan in de lijst staat dan moet je zelf even op zoek gaan. Dit kan door Google er op na te spitten of door zelf op de 'hardwarereview sites' te kijken. Zie HOWTO: Hoe stel ik een system samen? - Hardwarereview sites voor een lijst.Deze review bevat tekst en uitleg over de mobiele Core i7. Bevat links naar benchmarks van de Core i7 720QM, 820QM, 920XM en Core 2 Extreme QX9300 Deze review bevat benchmarks van de Core i5 750, i7 860 en 870. Ter referentie zijn de Core 2 Quad Q6700, Q9450 en Phenom II X4 955 meegenomen. Deze review bevat prestatieanalyses tussen de Core i7 920, 940, 965 en de Core 2 Quad Q6700. Hier zien we de Core i7 920, 940, 965, Core 2 Quad Q6700, Q9450, Core 2 Duo E6700, E8400, Phenom X3 8750 en Phenom X4 9850. Uitgebreide review met gameprestaties. Core i7 920, Core 2 Quad Q9550 en Phenom II X4 940. Zowel standaard als overclocked, zowel met CrossFireX videokaart opstelling als met één enkele kaart. Review met Core i7 920, 940, 965, Core 2 Quad Q9550, 9650, Core 2 Extreme QX9770. Review die eigenlijk gefocussed is op de launch van de Phenom II X4 van AMD maar daarom logischerwijs een goede vergelijking tussen AMD en Intel laat zien. Bevat Core i7 920, Core 2 Quad Q8200, Q8300, Q9400, Q9550, Phenom II X2 920 en 940. Uitgebreide review met Core i7 920, 940, Core 2 Quad Q6600, Q8300, Q9300, Q9650 en Phenom II X4 920. De review bevat zowel standaard als overclockte processoren. Wanneer komen de hexa-cores en wat kan ik daar van verwachten?De zeskopper van Intel staat op schema voor begin 2010. AMD heeft in Juni 2009 hexa-core Opteron's (Istanbul) gelanceerd en zet de Phenom II X6 in Q2/Q3 2010 op de markt.Als voorproef heeft PCLab.pl een uitgebreide preview van de 32nm Core i7 'Gulftown' met zes cores online gezet. Hieruit blijkt dat Gulftown compatible is met de huidige S1366 moederborden mits het BIOS raad weet met de processor. In de benchmarks komt naar voren dat de hexa-core prima prestaties levert mits de applicaties hiermee overweg kunnen. Kijkende naar de doelen van de meeste PC's valt hieruit te concluderen dat de hexa-core weinig nut heeft in de desktop PC van de consument. De hexa-core zich beter profileren in de workstation en server markt. 2. Onderdelenkeuze voor mijn nieuwe quad-core systeemJe wilt een nieuwe PC aanschaffen met een quad-core processor? Dat kan en je hebt vollop keus uit processoren van zowel AMD als Intel. Welke het meest interessant is hangt af van een aantal factoren:
2.1 Is een Core i5 / i7 voor mij wel interessant?Mocht een zo snel mogelijke processor het doel zijn dan is het simpelweg de benchmarks bekijken en daar de snelste processor (voor zover het budget toelaat) te nemen. Snelle processoren zijn handig bij CPU-intensieve zaken zoals het encoden van video of het compileren van source-code of lightning in (zelfgemaakte) maps voor games. Ben je echter op zoek naar een allround systeem dan is een gemiddelde processor een veel beter alternatief. Dan kun je geld steken in een goed beeldscherm (daar kijk je altijd naar en maak je dus permanent gebruik van), veel en/of snelle hardeschijven, een geluidskaart en wat al niet meer. Voor game systemen zijn videokaarten juist enorm belangrijk. Je kunt dus overwegen om een goedkoper AMD Phenom II X4 systeem met DDR2-SDRAM te nemen en meer geld te stoppen in een videokaart en een snelle SSD of Western Digital Raptor. Zie bijvoorbeeld deze review waarbij de Core i7, Core 2 Quad en Phenom II X4 op hoge resolutie zo goed als hetzelfde presteren. Sterker nog: de tragere Phenom II X4 wint hier (met een onmerkbaar verschil van 0,1FPS) van de Core i7 omdat de processor eigenlijk van ondergeschikt belang is.Let dus op dat je benchmarks goed bekijkt, ga geen Phenom II X4 kopen als je 24/7 wilt encoden omdat deze bij een game-benchmark op hoge resolutie en veel detail 0,1FPS sneller is. Ga ook geen Core i7 965 kopen met een Radeon X1950Pro omdat de 965 bij iedere review bovenaan staat als gamen jouw favoriete bezigheid is. 2.2 Moet ik socket 1156 of 1366 nemen voor de Core i7? En wat is het verschil?Het verschil tussen S1156 en S1366Beide sockets zijn fysiek niet compatible met elkaar omdat de pin-layout anders is. Houd hier rekening mee want een Core i7 S1156 past niet in een Core i7 S1366 moederbord. De S1156 processoren en moederborden zijn later geïntroduceerd en focussen zich op de consumentenmarkt. S1366 bedient met triple-channel en de toekomstige hexa-core de bovenkant van de markt. Technisch zijn de processoren voor S1156 (met codenaam 'Lynnfield') iets veranderd ten opzichte van de oudere S1366 'Bloomfield' processoren. Meer daarover lees je in hoofdstuk 3.3 De kenmerken en architectuur van Core i5 / i7 'Lynnfield'. Welke van de twee moet ik nu nemen? Kijk naar benchmarks en zet de prestaties naast de prijs van zowel processor als moederbord. Benchmarks zijn hier te vinden. Indien je wilt upgraden naar hexa-core dan is S1366 te overwegen. Houdt wel in gedachten dat de eerste Core i9 (hexa-core) processoren erg duur kunnen zijn waardoor een upgrade minder aantrekkelijk wordt. 2.3 Welk geheugen kan ik het beste nemen?Voor diegene die DDR2-SDRAM nodig hebben voor een Core 2 Duo of Core 2 Quad systeem, zie: [Discussie] Dual core Intels: Pentium D, Core (2) Duo, Xeon - Welk geheugen kan ik het beste nemen?QVL en triple-channel De mensen die een Core i7 systeem samen willen stellen kunnen DDR2-SDRAM volledig negeren en op zoek gaan naar DDR3-SDRAM. Het is aan te raden om eerst de handleiding van het moederbord erbij te pakken en te kijken hoeveel geheugensloten je hebt, welke snelheden erin kunnen en of er een zogenaamde Qualified Vendor List (QVL) aanwezig is. Deze laatste bevat een lijst met geteste geheugenmodules zodat je zeker weet dat het gaat werken. Qua snelheden spreekt het voor zich en bij het aantal geheugensloten geldt het volgende: De Core i7 op S1366 heeft een triple-channel geheugen controller op de processor zitten. Dit betekent dat je drie geheugen modules moet plaatsen om de beste performance te krijgen. Als je in eerste instantie 3x1GB neemt maar later naar 6GB (wat zo gek nog niet is) wilt dan moet je wel zes geheugensloten hebben. Lees echter even de volgende alineas voordat je direct op zoek gaat naar een triple-channel geheugen kit of een derde module om de huidige twee DDR3-SDRAM modules aan te vullen. Anandtech heeft DDR3-1066 (PC3-8500) getest samen met een Core i7 965. De verschillen zijn minimaal en in een aantal gevallen weet de dual-channel setup het zelfs te winnen. Dit komt omdat de dual-channel setup om één of ander reden een lagere latency heeft (ongeacht de CAS latency van het geheugen) dan de triple-channel setup. Bandbreedte is niet alles, latency (wachttijden) spelen ook een grote rol. Zie hier voor het artikel van Anandtech. Het is dus niet verplicht om triple-channel geheugen te nemen als je een S1366 moederbord koopt! Bij S1156 moederborden kom je sowieso op dual-channel uit omdat triple-channel daar niet op werkt. Geheugen snelheid Maakt de snelheid van het geheugen veel uit? Dat is een vraag die The Tech Report wist te beantwoorden in Exploring the impact of memory speed on Core i7 performance. De bottom-line is dat sneller geheugen steeds een aantal FPS sneller is. In de ideale situatie is DDR3-1600 (PC3-12800) met een zo laag mogelijke latency dus het beste maar helaas wel weer het duurste. Echter geen nood, de Core i7 920 en 940 ondersteunen standaard slechts 533MHz DDR3-SDRAM (PC3-8500, DDR3-1066) waarbij het eigenlijk geen zin heeft om er supersnel geheugen in te zetten. Hooguit PC3-8500 met een ietwat lagere latency als dit afweegt ten opzichte van de meerpijs. Enkel de Core i7 965 kan DDR3-1333, 1600, 1866 en 2133 aan vanwege de vrije multiplier maar deze processoren zijn schreeuwend duur en voor de meesten dus oninteressant. Toch kan het interessant zijn om sneller geheugen te plaatsen in een Core i7 920 of 940 systeem. Bij het overclocken komt dit namelijk van pas omdat de klokfrequentie van het geheugen omhoog gaat zodra de QuickPath Interconnect (QPI) opgevoerd wordt. Met een QPI van 166MHz (133MHz is standaard) is PC3-10600 al interessant. Met een QPI van 200MHz kan er ook prima PC3-12800 in. Naast het verhogen van de QPI is het mogelijk om de memory divider in te stellen. Vanzelfsprekend enkel als het moederbord dit kan. Zie de tabel hieronder voor wat opheldering in benamingen, klokfrequenties en bandbreedtes.
2.4 Core 2 Quad met 6MB of 12MB L2-cache, wat is het verschil?Het verschil is 6MB L2-cache en wat performance. Zo simpel is het zolang je het bij de 45nm Core 2 Quad Q9000 series houdt. De oudere 65nm Q6000-series zijn gebaseerd op de oudere 'Conroe' (de eerste Core 2 Duo) en die zijn per clock sowieso een paar procent trager dan de nieuwere 45nm Core 2 Duo's met 'Wolfdale' core. Niettemin is het hier ouderwets benchmarks bekijken. Vaak is het zo dat games beter uit de voeten kunnen met meer L2-cache terwijl zaken zoals encoden hier niet zoveel baat bij hebben.Op matbe.com - Comparatif de 100 processeurs vind je een overzicht van honderd recente Core 2 en Phenom processoren. Ik zal een aantal resultaten in een tabel hieronder plaatsen, voor de rest is het even zelf snuffelen tussen de resultaten.
2.5 Kan een Core 2 Duo met 2133MHz sneller zijn dan een Pentium D 930 (3GHz)?Simpel gezegd: Ja. Voor de prestatie verschillen zie deze benchmarks.Er is veel verwarring tussen 'snel' en het aantal MHz'en van een processor. Dit is onder andere de reden waarom ik niet over kloksnelheid spreek maar over klokfrequentie. Kloksnelheid suggereert naar mijn mening teveel dat de klok de snelheid bepaald. Dit zou betekenen dat 100MHz meer ook 100MHz sneller zou zijn. In sommige gevallen is dat min of meer zo, in de meeste echter niet. Om het één en ander in globale zin duidelijk te maken hieronder wat tekst en uitleg. De namen van de processoren en de effectieve klokfrequentie van de processor. De processoren zijn dual-core of quad-core. Niet Core Duo of Duo Core. Core Duo is slechts een merknaam zoals Pentium of Athlon. Duo Core is hetzelfde maar dan foutief geschreven. De dual-core processoren hebben twee cores die een bepaalde klokfrequentie hebben. Dat is dus feitelijk twee keer een losse klokfrequentie. Het moet niet gelezen worden als 2x3GHz = 6GHz maar als 2x 3GHz = 2x een core van 3GHz. Dat is dus pér core nog steeds 3GHz! Een programma dat één core aanspreekt zal dus verwerkt worden met een klokfrequentie van 3GHz. Als een programma wel gebruik zou maken van dual-core zie het dan als een opsplitsing van het programma (wat betreft berekeningen) die verdeeld wordt over de beschikbare cores. Dit zou betekenen dat de eerste helft door core 0 berekend wordt en de andere helft door core 1. Resultaat: Beide delen worden door een volle 3GHz-core berekend wat dus theoretisch net zo snel zou moeten zijn als het hele programma (niet opgedeeld) op één 6GHz-core. Echter, dit verhaal is theoretisch en er zitten nog vele zogenaamde 'maar-verhalen' aan. Voorgaande uitleg is dus in de praktijk niet altijd zozeer het geval, het is slechts een voorbeeld met wat getallen om een beeld te vormen over dual-core en de effectieve GHz'en bij het draaien van een programma. Interessant hierbij is 1.1 Wat is het voordeel van een dual/multi-core processor? Het aantal GHz'en. Waarom kan een 2GHz processor sneller zijn dan een 3GHz processor? Over de GHz verschillen tussen de Pentium D, de Core 2 Duo en Athlon 64 X2 processoren: Alle drie de processoren kunnen een bepaalde hoeveelheid berekeningen per MHz doen. De Pentium 4 (en daarmee ook de Pentium D) stond bekend om de hoge MHz'en maar de Pentium 4 kan relatief weinig per MHz doen. De Athlon 64 X2 stond bekend (en daarmee ook de Athlon XP en de Athlon 64) om weinig MHz'en maar deze processor kan juist veel berekeningen per MHz uitvoeren. De relatief nieuwe Core 2 Duo doet daar nog een schepje bovenop en kan per MHz nog meer uitvoeren dan de Athlon 64 X2. Om met (niet reële) getallen te strooien: Processor A heeft een klokfrequentie van 2000MHz en verwerkt 14 berekeningen per MHz. Processor B heeft een klokfrequentie van 3000MHz en verwerkt 9 berekeningen per MHz. In andere woorden: Processor A kan 2000 * 14 = 28000 berekeningen per seconde uitvoeren. Processor B kan 3000 * 9 = 27000 berekeningen per seconde uitvoeren. Het moge dus duidelijk zijn dat de processor met 2000MHz uiteindelijk meer doet dan de processor met 3000MHz. Sidenote: Bovenstaande uitleg is een zeer eenvoudige uitleg. Een processor zal afhankelijk van de opbouw op bepaalde punten enorm goed presteren en op bepaalde punten niet. Zodra je twee verschillende processoren vergelijkt (Pentium D versus Core 2 Duo) zul je bij een analyse zien dat de prestatieverschillen per applicatie anders zijn. Uiteraard zijn er ook andere factoren als de klokfrequentie van de processor. Denk daarbij aan bv. de front-side-bus (FSB) en het interne geheugen (de grootte en de snelheid ervan). Wat betreft algehele prestaties tellen de prestaties van bv. de hardeschijf in de meeste gevallen ook mee. Eigenlijk alles in de PC. |
Profiel | https://thandor.net - hardware
And the rest of us would be carousing the aisles, stuffing baloney.