Voor een aantal nieuwe server zijn we aan het kijken naar dual Intel en dual AMD systemen. Nu vragen onze ontwikkelaars om een overzicht van het aantal MIPS dat elke cpu aan kan. Iemand enig idee waar ik die kan vinden? Via Google kan ik alleen oude info vinden.
Het makkelijkst is om te kijken naar de resultaten uit de sisoftware sandra database
Die informatie is er niet omdat het benchmarken met MIPS door ontwikkelingen in zowel hardware als software een dergelijke maat volkomen onzinnig maakt. Het type instructie, de kans op forks in de code en iets simpels als hoe de I/O van de CPU geregeld is kan werkelijke prestaties volledig doen afwijken van wat je op basis van een MIPS benchmark zou vermoeden. Degene die vraagt naar MIPS moet eens uit de boeken van Tanenbaum komen en even in de echte wereld rondneuzen 
Uiteindelijk moet je als je wilt weten hoe jou code draait op moderne platforms (CPU+chipset+RAM, je kunt ze niet los van elkaar zien) gewoon jouw code testen op verschillende opties. Dat is wat Tweakers doet, dat is wat Anandtech doet en dat is wat veel grote bedrijven doen. Dat is niet zonder reden
Als dat onhaalbaar is moet je gewoon een goede representatieve benchmark opzoeken. Let daarbij vooral op I/O, dat is muv bij HPC nagenoeg altijd een grote bottleneck, en bij HPC zou je beter naar GPUs kunnen kijken dan CPUs.
Maareh, deze topicstart is wel heel erg magertjes. Geef eens een stuk meer info, dan kunnen wij jou verder helpen. Je zegt niet eens waarop je zocht en wat je vond met google (links!). Als je niet meer post gaat dit topic dicht ivm geen eigen inzet

Uiteindelijk moet je als je wilt weten hoe jou code draait op moderne platforms (CPU+chipset+RAM, je kunt ze niet los van elkaar zien) gewoon jouw code testen op verschillende opties. Dat is wat Tweakers doet, dat is wat Anandtech doet en dat is wat veel grote bedrijven doen. Dat is niet zonder reden

Als dat onhaalbaar is moet je gewoon een goede representatieve benchmark opzoeken. Let daarbij vooral op I/O, dat is muv bij HPC nagenoeg altijd een grote bottleneck, en bij HPC zou je beter naar GPUs kunnen kijken dan CPUs.
Maareh, deze topicstart is wel heel erg magertjes. Geef eens een stuk meer info, dan kunnen wij jou verder helpen. Je zegt niet eens waarop je zocht en wat je vond met google (links!). Als je niet meer post gaat dit topic dicht ivm geen eigen inzet

Soittakaa Paranoid!
Een programma moet snel foto's kunnen analyseren en vergelijken met het origineel. Dat moet snel kunnen gaan en het is processor intensief. De afbeeldingen zelf zijn slechts 300Kb groot.
De vraag is nu of we voor een dual quad core Xeon moet gaan of voor een dual 8 core of 12 core AMD. Wat levert nu de meeste performce per CPU. De diverse benchmarks zijn daarover nogal vaag.
De vraag is nu of we voor een dual quad core Xeon moet gaan of voor een dual 8 core of 12 core AMD. Wat levert nu de meeste performce per CPU. De diverse benchmarks zijn daarover nogal vaag.
Het lijkt me dat je dit perfect kunt parallelliseren: iedere core is bezig met zijn eigen fototje, om het simpel te zeggen. Dat betekent dat ik voor de meeste cores zou gaan. In dit geval, 12-core AMD. Tenzij de AMD cores dusdanig traag zijn dat ze 1-8/12=33% of meer langzamer zijn dan de intel cores. Misschien kan iemand met meer ervaring met de CPU's van de laatste tijd inschatten of dat waarschijnlijk is?
[Voor 14% gewijzigd door cosmo_roel op 21-05-2011 23:04]
Nee, de benchmarks zijn erg helder, het gaat erom exact hoe de code in elkaar steekt. De ene zal beter draaien op de ene CPU, de andere beter op de andere. Zelfs twee programma's die exact hetzelfde doen kunnen heel ander gedrag per CPU vertonen. Denk daarbij aan hoe met threading omgegaan wordt, welke cache optimalisaties er in de code zitten etc. etc. etc.jantje.vlaam schreef op zaterdag 21 mei 2011 @ 22:45:
Een programma moet snel foto's kunnen analyseren en vergelijken met het origineel. Dat moet snel kunnen gaan en het is processor intensief. De afbeeldingen zelf zijn slechts 300Kb groot.
De vraag is nu of we voor een dual quad core Xeon moet gaan of voor een dual 8 core of 12 core AMD. Wat levert nu de meeste performce per CPU. De diverse benchmarks zijn daarover nogal vaag.
Zoals gezegd, dit ga je niet op papier kunnen uitzoeken. Zeker als jullie devvers zelf dat prog geschreven hebben, dan gaan resultaten van anderen met andere programma's buitengewoon weinig zeggen.
Je gaat hier ervan uit dat deze programma daadwerkelijk ook perfect *is* geparallelliseerd. Zeker bij custom in elkaar gekluste code kan dat wel eens tegenvallen.cosmo_roel schreef op zaterdag 21 mei 2011 @ 23:03:
Het lijkt me dat je dit perfect kunt parallelliseren: iedere core is bezig met zijn eigen fototje, om het simpel te zeggen. Dat betekent dat ik voor de meeste cores zou gaan. In dit geval, 12-core AMD. Tenzij de AMD cores dusdanig traag zijn dat ze 1-8/12=33% of meer langzamer zijn dan de intel cores. Misschien kan iemand met meer ervaring met de CPU's van de laatste tijd inschatten of dat waarschijnlijk is?
Dat vermoed ik des te meer aangezien dit inderdaad neigt naar het soort vector processing wat op een GPU veel beter kan dan een CPU. Dat het toch op de CPU gedaan wordt klinkt alsof er niet gekeken is naar beste mensen en oplossing voor het probleem, maar naar hoe het probleem het beste met de bestaande mensen en kennis aan te pakken - en uitgerekend dat laatste hoeft niet de theoretisch beste oplossing te leveren.
Wederom, alles staat of valt bij exact hoe die software geschreven is. Als het hier gaat om een groot bedrijf en potentieel een grote order aan hardware, dan gewoon bij de hardwareleverancier vragen om samples van beide mogelijkheden. Als het gaat om een klein bedrijfje, koop een minimaal Core i3 en Athlon X4 systeempje. In beide gevallen gewoon zelf de code testen en kijken hoe het schaalt per core en per CPU type. Als het overduidelijk niet goed schaalt wil je vooral CPUs met maximale performance per thread, wat de Xeon bevoordeelt. Als het juist wel goed schaalt wil je zoveel mogelijk simultane threads kunnen verwerken. Dat klinkt meer als een Opteron, maar je zou zelfs kunnen kijken naar de Sparc T3 (die 128 threads per CPU aankan).
Soittakaa Paranoid!
Wat de TS beschrijft is inderdaad precies een applicatie welke perfect op een GPU zou kunnen draaien. Als je bijvoorbeeld deze paper (PDF) zie je dat zulke voorbeelden dus al wel degelijk bestaan en klaarblijkelijk interessant zijn. Ook vond ik de volgende thread op Stack Overflow welke hierover gaat.
Als laatste zou je ook nog zoiets als MD5 of een ander hashing algoritme kunnen gebruiken als je (niet visueel) duplicaten zoekt. Ook dit zou erg snel op een GPU kunnen.
Als laatste zou je ook nog zoiets als MD5 of een ander hashing algoritme kunnen gebruiken als je (niet visueel) duplicaten zoekt. Ook dit zou erg snel op een GPU kunnen.
Klopt, maar goed, het gaat hier niet om het doen van een ontwerp van een stuk software; of het nu optimaal is of niet, ze hebben hun software al, en willen weten op welke hardware het het beste draait.
Legitieme vraag, maar goed, niet eentje waar we zonder de software te kennen antwoord op kunnen geven, vandaar tip dat ze het gewoon zelf moeten testen.
Legitieme vraag, maar goed, niet eentje waar we zonder de software te kennen antwoord op kunnen geven, vandaar tip dat ze het gewoon zelf moeten testen.
Soittakaa Paranoid!
De software hebben ze zelf gemaakt en ontwikkelen ze zelf door. Ik zal ze de PDF mailen.
Ik zal ze tevens het advies van dion_b geven. Eerst goed testen op welk platform het het beste performt. Ze moeten echter op korte termijn een live omgeving hebben. Ze willen dat met twee servers doen waarvan 1 productie en de ander development testen en uitval functie krijgt. Als ze dan een Opteron systeem naast een Xeon systeem nemen kunnen ze meteen vergelijken.
Ik zal ze tevens het advies van dion_b geven. Eerst goed testen op welk platform het het beste performt. Ze moeten echter op korte termijn een live omgeving hebben. Ze willen dat met twee servers doen waarvan 1 productie en de ander development testen en uitval functie krijgt. Als ze dan een Opteron systeem naast een Xeon systeem nemen kunnen ze meteen vergelijken.
Pagina: 1