Hey fellow-tweakers,
Ik heb al een tijdje een workstation draaien obv Supermicro moederbord en dual-xeon CPU's.
Werkstation met name gebouwd om erg grote collecties van audio-files te bewerken.
(daarom 2 CPU's van elk 8 cores/16 threads, total 32 threads, dus vrij veel actie-lijntjes tegelijk).
Op het moment:
- CPU's: 2x Xeon E5-2650
- RAM: 4x 16GB DDR3 1333MHz.
Ik ben nu aan het bezien hoe hier een effectieve upgrade op te doen.
Doel:
- meer speed bij single-core actie
- meer speed bij multi-core actie.
Gedachte nieuwe opzet:
- CPU's: 2x Xeon E5-2673 v2 (max 4000 MHz vs vorige max 2800MHz)
- RAM: 8x 16GB DDR3 1866 MHz (ECC dual-rank RDIMM).
Deze opzet gaat én single-core én multi-core het wel aanzienlijk beter doen denk ik (de performance scores in de benchmarks zijn duidelijk + er is bij set-up 2 duidelijk meer speed op de CPU en meer frequency+meer dimms qua RAM).
Wat ik me af vraag is of met die RAM-opzet deze vlotte Xeons met total 32 threads wel voldoende bediend worden?
Gedachtengang:
De beide CPU's samen creeren aan 'ticks'/frequentie:
- 4000Mhz, wordt bij allcore max 3200 Mhz
- x 32 threads; reductie zeg factor 0,8 omdat threads minder performen als fysieke cores (0,8 OK ?)
- dual-CPU's: reductie vanwege onderlinge overhead: zeg ook factor 0,8 (?)
Kom je op ca 3200x32x0,8x0,8= 65.000 MHz
De RAM-sticks creeren aan frequentie of beter MT/s:
- 8 sticks x 1866 MT/s = ca 15.000 MT/s. (hierbij ca 8x 15GB= ca 120GB/s bandwidth).
(dit is ook het maximum dat met dit moederbord te behalen is: 4 memory channels per CPU).
(kunnen meer sticks op maar dat verlaagt juist de bandwidth)(meer frequentie verloren aan overhead etc).
Maar, de RAM-sticks leveren dan toch alleen voldoende data aan de CPU's, als:
- de CPU-workload zodanig is dat de CPU's ca 3/4 van de ticks met processing bezig zijn en ca 1/4 met I/O (data vragen aan/schrijven naar RAM).
(1/4 van 65.000 is ca 15.000)(sterk afgerond).
Vragen:
- zijn die inschattingen van de CPU-total frequency ongeveer correct?
- klopt dat relateren van CPU-total frequency met RAM-total frequency?
- hoe is de verhouding tussen CPU-processing ticks vs CPU-data I/O-ticks?
(ja 'hangt van proces af' maar kan iemand iets zeggen over hoe dit voor wat voorbeeldprocessen ligt?).
Ik heb al het nodige doorgespit en een aantal goede 'deep dives' gevonden hierover, maar deze focussen alleen maar op het verkrijgen van max bandwidth van de RAM. Ik vind geen inzichten in hoeverre de CPU's goed 'gevoed' worden door de RAM, bij diverse CPU vs. RAM-situ's.
Verder zie ik bij oa. de 2 gen's nieuwere X11 boards, dat er 6 ipv 4 memory channels zijn én snellere DDR4 memory sticks (max 2900 MHz) dus daar ligt de total RAM-frequency fors hoger (ca 35000 ipv 15000 in mijn gedachte nieuwe opzet). Terwijl de total CPU-frequency in die v3-CPU's ook wel wat hoger ligt (vooral door nóg wat meer cores), maar lang niet zoveel hoger als de RAM verhoogt kan.
Dus in die situaties wordt er relatief meer RAM-data aangeboden per sec aan de CPU's
(ca 35.000 MT/s RAM op ca 75.000 MHz CPU).
Is dus de ratio RAM vs CPU in de door mij gedachte nieuwe opzet wel optimaal?
Shoot please!
Tx all.
.
Ik heb al een tijdje een workstation draaien obv Supermicro moederbord en dual-xeon CPU's.
Werkstation met name gebouwd om erg grote collecties van audio-files te bewerken.
(daarom 2 CPU's van elk 8 cores/16 threads, total 32 threads, dus vrij veel actie-lijntjes tegelijk).
Op het moment:
- CPU's: 2x Xeon E5-2650
- RAM: 4x 16GB DDR3 1333MHz.
Ik ben nu aan het bezien hoe hier een effectieve upgrade op te doen.
Doel:
- meer speed bij single-core actie
- meer speed bij multi-core actie.
Gedachte nieuwe opzet:
- CPU's: 2x Xeon E5-2673 v2 (max 4000 MHz vs vorige max 2800MHz)
- RAM: 8x 16GB DDR3 1866 MHz (ECC dual-rank RDIMM).
Deze opzet gaat én single-core én multi-core het wel aanzienlijk beter doen denk ik (de performance scores in de benchmarks zijn duidelijk + er is bij set-up 2 duidelijk meer speed op de CPU en meer frequency+meer dimms qua RAM).
Wat ik me af vraag is of met die RAM-opzet deze vlotte Xeons met total 32 threads wel voldoende bediend worden?
Gedachtengang:
De beide CPU's samen creeren aan 'ticks'/frequentie:
- 4000Mhz, wordt bij allcore max 3200 Mhz
- x 32 threads; reductie zeg factor 0,8 omdat threads minder performen als fysieke cores (0,8 OK ?)
- dual-CPU's: reductie vanwege onderlinge overhead: zeg ook factor 0,8 (?)
Kom je op ca 3200x32x0,8x0,8= 65.000 MHz
De RAM-sticks creeren aan frequentie of beter MT/s:
- 8 sticks x 1866 MT/s = ca 15.000 MT/s. (hierbij ca 8x 15GB= ca 120GB/s bandwidth).
(dit is ook het maximum dat met dit moederbord te behalen is: 4 memory channels per CPU).
(kunnen meer sticks op maar dat verlaagt juist de bandwidth)(meer frequentie verloren aan overhead etc).
Maar, de RAM-sticks leveren dan toch alleen voldoende data aan de CPU's, als:
- de CPU-workload zodanig is dat de CPU's ca 3/4 van de ticks met processing bezig zijn en ca 1/4 met I/O (data vragen aan/schrijven naar RAM).
(1/4 van 65.000 is ca 15.000)(sterk afgerond).
Vragen:
- zijn die inschattingen van de CPU-total frequency ongeveer correct?
- klopt dat relateren van CPU-total frequency met RAM-total frequency?
- hoe is de verhouding tussen CPU-processing ticks vs CPU-data I/O-ticks?
(ja 'hangt van proces af' maar kan iemand iets zeggen over hoe dit voor wat voorbeeldprocessen ligt?).
Ik heb al het nodige doorgespit en een aantal goede 'deep dives' gevonden hierover, maar deze focussen alleen maar op het verkrijgen van max bandwidth van de RAM. Ik vind geen inzichten in hoeverre de CPU's goed 'gevoed' worden door de RAM, bij diverse CPU vs. RAM-situ's.
Verder zie ik bij oa. de 2 gen's nieuwere X11 boards, dat er 6 ipv 4 memory channels zijn én snellere DDR4 memory sticks (max 2900 MHz) dus daar ligt de total RAM-frequency fors hoger (ca 35000 ipv 15000 in mijn gedachte nieuwe opzet). Terwijl de total CPU-frequency in die v3-CPU's ook wel wat hoger ligt (vooral door nóg wat meer cores), maar lang niet zoveel hoger als de RAM verhoogt kan.
Dus in die situaties wordt er relatief meer RAM-data aangeboden per sec aan de CPU's
(ca 35.000 MT/s RAM op ca 75.000 MHz CPU).
Is dus de ratio RAM vs CPU in de door mij gedachte nieuwe opzet wel optimaal?

Shoot please!
Tx all.
.