Graag wil ik een ARM Cortex A9, A15 of Intel Atom processor gaan gebruiken voor floating point toepassingen. Het is echter lastig te achterhalen welke FLOPS deze drie processoren kunnen halen. Het gaat me om theoretische processorkracht, los van datatoevoersnelheid etc.
De beste pagina die ik gevonden, is een forum antwoord:
Daarnaast vond ik een pagina van Anandtech met antwoorden op basis van tests:
Op een of andere manier kan ik geen officiele data hierover vinden. Intel geeft geen FLOPS in de specs en ook nVidia/Freescale/etc niet voor hun ARM processoren. Weet iemand wat de FLOPS zijn voor deze processoren - en heeft daar enige onderbouwing van?
De beste pagina die ik gevonden, is een forum antwoord:
Het is enigzins onduidelijk of deze waardes per core zijn. Zeker de Intel is verkrijgbaar in diverse varianten. Aanname: voor quad-cores doe ik x4.ARM Cortex-A9:
1.5 DP FLOPs/cycle: scalar addition + scalar multiplication every other cycle
4 SP FLOPs/cycle: 4-wide NEON addition every other cycle + 4-wide NEON multiplication every other cycle
ARM Cortex-A15:
2 DP FLOPs/cycle: scalar FMA or scalar multiply-add
8 SP FLOPs/cycle: 4-wide NEONv2 FMA or 4-wide NEON multiply-add
Intel Atom (Bonnell/45nm, Saltwell/32nm, Silvermont/22nm):
1.5 DP FLOPs/cycle: scalar SSE2 addition + scalar SSE2 multiplication every other cycle
6 SP FLOPs/cycle: 4-wide SSE addition + 4-wide SSE multiplication every other cycle
Daarnaast vond ik een pagina van Anandtech met antwoorden op basis van tests:
Maar deze waarden kloppen niet met wat er bij Stackoverflow gezegd werd. Wat is nu waar?Cortex A9:
0.5 voor DP / NEON
1 voor SP
Cortex A15:
1 voor DP
1 voor SP
Op een of andere manier kan ik geen officiele data hierover vinden. Intel geeft geen FLOPS in de specs en ook nVidia/Freescale/etc niet voor hun ARM processoren. Weet iemand wat de FLOPS zijn voor deze processoren - en heeft daar enige onderbouwing van?