Nou ja, geen CFD farm, want DEFORM werkt met vervorming van niet-gesmolten metaal en dus niet met 'fluids'. Klein verschil, want het is wel hetzelfde soort rekenwerk.
De situatie is als volgt: de vakgroep waar ik werk doet onder simulaties aan metaal vervorming, met het simulatiepakket DEFORM 3D. Daarvoor staan er 2 (zelfbouw) dual Athlon MP workstations, eentje met 2200+ en de ander met 2600+.
DEFORM 3D wordt door ons specifiek gebruikt voor het simuleren van extrusie. 'Extruderen' is in feite warm (maar NIET gesmolten!) metaal als hete boter door een plaat met gat, de 'matrijs' duwen. Zie plaatje hieronder:

Links: temperatuursverdeling in aluminium extrusie. Rechts: termperatuursverdeling in, en vervorming van, de matrijs tijdens extrusie.
Zoals je in het plaatje kan zien bestaat de matrijs nu nog uit een simpele plaat met gat. Binnenkort moeten we over op simulaties met holle matrijzen. De benodigde rekenkracht daarvoor zal de pan uitrijzen ... Maar hee, DEFORM 3D heeft support voor MPI (message passing interface) dus kan er een rekenfarm opgezet worden voor het gedistrubueerd berekenen van simulaties.
* JumpStart is nu dus aan het verkennen wat de opties, kosten en prestaties zijn van een rekenfarm.
Aangezien dit vooronderzoek is kan ik nog geen budget aangeven. Ik zit te denken richting 4 nodes van 2 CPU's elk, of 8 single CPU nodes, afhankelijk van kosten en prestatie. Er zijn echter zoveel mogelijkheden en beperkende factoren dat ik feedback nodig heb.
Na het nodige aan zoekwerk blijkt al dat Intel in dit specifieke geval van 'finite element method' (FEM) / 'computational fluid dynamics' (CFD) achtige berekeningen niet aantrekkelijk is. DEFORM 3D is een FPU intensief programma wat gigantische matrixen moet oplossen waarbij geen vectorisatie/MMX/SSE/SSE2 optimalisatie wordt toegepast. De Opterons en Athlons winnen het dus van de Xeons en P4s vanwege de 3 FPU units in plaats van 2. Dat blijkt ook uit de benchmarks die ik zag bij Ace's Hardware. (Zie pagina 12 van deze review hier.
Bevestiging komt van een andere CFD benchmark, uit een Opteron review van AMDzone, hier.
Verder weet ik via de mensen van DEFORM dat de SpecFP scores behoorlijk indicatief zijn voor de prestaties van DEFORM 3D zelf, waaruit nogmaals blijkt dat FPU prestatie van de CPU de doorslaggevende factor is.
...
De nodes moeten Win 2000 gaan draaien (en later dus mogelijk Win64) en mogen in reguliere PC kasten. Rackmounts in een 19" rack zou uiteraard wel mooier/netter/efficienter zijn. Ze moeten per CPU 1 GB regged ECC geheugen hebben, een klein (30 GB ofzo) HDtje, FDD (voor Ghost multicast bootflop), 100 mbit LAN en 1024x768 pixel VGA. Alle nodes komen via een schakelkast aan 1 monitor/toetsenbord/muis te hangen.
Ik ben uitgegaan van t-net pricewatch prijzen, zelfbouw. Barebones heb ik (nog) niet bekeken, deze staan op een zijspoor vanwege (veronderstelde) hogere prijzen.
Tot zover dan het vooronderzoek. De opties:
Wat betreft prijs/prestatie zit het goed, een node in een gewone PC kast zal 1100 tot 1400 € kosten. Maar het is een 'dood' platform, er zal in de toekomst geen upgrade meer mogelijk zijn: 2800+ is het eindstation.
Kiezen voor dual Opteron nodes ? Pffft. Dat is even schrikken/slikken zeg! Moederborden zijn erg duur, de 24x processors ook. Dan kom je al snel op bijna het DRIEdubbele van een dual 2600+ uit. Plus of min een paar honderd, kom ik op 3000 tot 3600 € uit voor een dual 244. Maar dit is een systeem dat in de toekomt op te waarderen valt, zowel in software (Win32 -> Win64 en een x86-64 gecompileerde versie van DEFORM 3D) als in toekomstige snellere 90 nm Opterons (246/248/252???). Maar zal DEFORM 3D op een dual Opteron 244 sneller zijn dan op een dual Athlon MP 2600+ ?
Dan blijft over: single Opteron nodes. Dit drukt de kosten in meerdere opzichten. De 1xx serie is goedkoper, er is geen dure zware voeding nodig, noch een extended ATX kast. (ik kom uit op 1250-1450 €) Maar ja, wel 2 keer zoveel kasten. Dan maar ergens 2 kuub lucht opeisen ergens binnen de vakgroep.
We hèbben al dual Athlon MP systemen, da's dus punten voor de MP oplossing. Maar het is ook een dood systeem, geen upgrades meer. Punten aftrek dus. De dual Opteron 244 is flink wat duurder, minpunten dus, maar ook aanzienlijk sneller dan een dual Athlon MP. Verhoog de score voor de dual 244 maar weer. Beide systemen zijn dure serverboards in dure extended ATX kasten met dure zware (en betrouwbare) voedingen. Tot nu toe kan ik slecht bepalen of de bijna driedubbele prijs ook gereflecteert wordt in de ver(drie?)dubbeling prestatie, specifiek voor DEFORM 3D. De enige indicatie die ik nog heb is SpecFP2000 en SpecFP_rate2000 cijfers uit Ace's Hardware SPECmine, maar dat is niet sluitend.
En dan is er nog de single Opteron oplossing. Die heeft geen speciale voeding nodig, past gewoon in een ATX kast en kost veel minder. Presteert ook niet zo goed als de dual systemen. Dat er dan 8 midi towers bij elkaar staan in plaats van 4 big towers ? Daar valt mee te leven.
Wie kan mij een zet in de goeie richting geven ? Wie kan mij nog op punten wijzen waar ik nog niet bij stilgestaan heb ? Zijn er (toch) nog alternatieven die ik over het hoofd gezien heb ?
De situatie is als volgt: de vakgroep waar ik werk doet onder simulaties aan metaal vervorming, met het simulatiepakket DEFORM 3D. Daarvoor staan er 2 (zelfbouw) dual Athlon MP workstations, eentje met 2200+ en de ander met 2600+.
DEFORM 3D wordt door ons specifiek gebruikt voor het simuleren van extrusie. 'Extruderen' is in feite warm (maar NIET gesmolten!) metaal als hete boter door een plaat met gat, de 'matrijs' duwen. Zie plaatje hieronder:

Links: temperatuursverdeling in aluminium extrusie. Rechts: termperatuursverdeling in, en vervorming van, de matrijs tijdens extrusie.
Zoals je in het plaatje kan zien bestaat de matrijs nu nog uit een simpele plaat met gat. Binnenkort moeten we over op simulaties met holle matrijzen. De benodigde rekenkracht daarvoor zal de pan uitrijzen ... Maar hee, DEFORM 3D heeft support voor MPI (message passing interface) dus kan er een rekenfarm opgezet worden voor het gedistrubueerd berekenen van simulaties.
* JumpStart is nu dus aan het verkennen wat de opties, kosten en prestaties zijn van een rekenfarm.
Aangezien dit vooronderzoek is kan ik nog geen budget aangeven. Ik zit te denken richting 4 nodes van 2 CPU's elk, of 8 single CPU nodes, afhankelijk van kosten en prestatie. Er zijn echter zoveel mogelijkheden en beperkende factoren dat ik feedback nodig heb.
Na het nodige aan zoekwerk blijkt al dat Intel in dit specifieke geval van 'finite element method' (FEM) / 'computational fluid dynamics' (CFD) achtige berekeningen niet aantrekkelijk is. DEFORM 3D is een FPU intensief programma wat gigantische matrixen moet oplossen waarbij geen vectorisatie/MMX/SSE/SSE2 optimalisatie wordt toegepast. De Opterons en Athlons winnen het dus van de Xeons en P4s vanwege de 3 FPU units in plaats van 2. Dat blijkt ook uit de benchmarks die ik zag bij Ace's Hardware. (Zie pagina 12 van deze review hier.
Bevestiging komt van een andere CFD benchmark, uit een Opteron review van AMDzone, hier.
Verder weet ik via de mensen van DEFORM dat de SpecFP scores behoorlijk indicatief zijn voor de prestaties van DEFORM 3D zelf, waaruit nogmaals blijkt dat FPU prestatie van de CPU de doorslaggevende factor is.
...
De nodes moeten Win 2000 gaan draaien (en later dus mogelijk Win64) en mogen in reguliere PC kasten. Rackmounts in een 19" rack zou uiteraard wel mooier/netter/efficienter zijn. Ze moeten per CPU 1 GB regged ECC geheugen hebben, een klein (30 GB ofzo) HDtje, FDD (voor Ghost multicast bootflop), 100 mbit LAN en 1024x768 pixel VGA. Alle nodes komen via een schakelkast aan 1 monitor/toetsenbord/muis te hangen.
Ik ben uitgegaan van t-net pricewatch prijzen, zelfbouw. Barebones heb ik (nog) niet bekeken, deze staan op een zijspoor vanwege (veronderstelde) hogere prijzen.
Tot zover dan het vooronderzoek. De opties:
- 4 nodes bestaande uit dual Athlon 2600+
- 4 nodes bestaande uit dual Opteron 244
- 8 nodes bestaande uit single Opteron 144
Wat betreft prijs/prestatie zit het goed, een node in een gewone PC kast zal 1100 tot 1400 € kosten. Maar het is een 'dood' platform, er zal in de toekomst geen upgrade meer mogelijk zijn: 2800+ is het eindstation.
Kiezen voor dual Opteron nodes ? Pffft. Dat is even schrikken/slikken zeg! Moederborden zijn erg duur, de 24x processors ook. Dan kom je al snel op bijna het DRIEdubbele van een dual 2600+ uit. Plus of min een paar honderd, kom ik op 3000 tot 3600 € uit voor een dual 244. Maar dit is een systeem dat in de toekomt op te waarderen valt, zowel in software (Win32 -> Win64 en een x86-64 gecompileerde versie van DEFORM 3D) als in toekomstige snellere 90 nm Opterons (246/248/252???). Maar zal DEFORM 3D op een dual Opteron 244 sneller zijn dan op een dual Athlon MP 2600+ ?
Dan blijft over: single Opteron nodes. Dit drukt de kosten in meerdere opzichten. De 1xx serie is goedkoper, er is geen dure zware voeding nodig, noch een extended ATX kast. (ik kom uit op 1250-1450 €) Maar ja, wel 2 keer zoveel kasten. Dan maar ergens 2 kuub lucht opeisen ergens binnen de vakgroep.
offtopic:
Pffft, welk een lap tekst. Iedereen alvast bedankt voor het lezen tot hier.
Pffft, welk een lap tekst. Iedereen alvast bedankt voor het lezen tot hier.
We hèbben al dual Athlon MP systemen, da's dus punten voor de MP oplossing. Maar het is ook een dood systeem, geen upgrades meer. Punten aftrek dus. De dual Opteron 244 is flink wat duurder, minpunten dus, maar ook aanzienlijk sneller dan een dual Athlon MP. Verhoog de score voor de dual 244 maar weer. Beide systemen zijn dure serverboards in dure extended ATX kasten met dure zware (en betrouwbare) voedingen. Tot nu toe kan ik slecht bepalen of de bijna driedubbele prijs ook gereflecteert wordt in de ver(drie?)dubbeling prestatie, specifiek voor DEFORM 3D. De enige indicatie die ik nog heb is SpecFP2000 en SpecFP_rate2000 cijfers uit Ace's Hardware SPECmine, maar dat is niet sluitend.
En dan is er nog de single Opteron oplossing. Die heeft geen speciale voeding nodig, past gewoon in een ATX kast en kost veel minder. Presteert ook niet zo goed als de dual systemen. Dat er dan 8 midi towers bij elkaar staan in plaats van 4 big towers ? Daar valt mee te leven.
Wie kan mij een zet in de goeie richting geven ? Wie kan mij nog op punten wijzen waar ik nog niet bij stilgestaan heb ? Zijn er (toch) nog alternatieven die ik over het hoofd gezien heb ?
[ Voor 2% gewijzigd door JumpStart op 03-09-2003 12:40 . Reden: typos ]
ALL-CAPS WITH NO PUNCTUATION IS SO MUCH TRUER TO THE WAY THOUGHTS HURTLE OUT OF THE HUMAN BRAIN THAN CAREFULLY MANICURED AND PUNCTUATED SENTENCES COULD EVER BE