Mja, overal lees je het, iedereen heeft een andere mening over het gebruiken van HT samen met een dnetc- of andere client. Maar wat is nu eigenlijk de definitieve conclusie, is het nu goed of juist slecht voor je koe? Het is dus een feit dat hij 2 wu's er tegelijk doorstampt, maar of die nou eerder klaar zijn? Ik heb er iig nog niet met m'n stopwatch naast gestaan.
Hangt erg af van het project dat je draait. Bij mijn project SoB heb je er wel degelijk profeit van, anders gebruik je slechts de helft van je processor.
...
Bij meerdere clients moet je een extra proces draaien om 100% van de CPU te benutten, maar dat betekend niet dat je cpu 2x zo snel is als een cpu van gelijk kaliber zonder hypertrading 
Topic titel iets veranderd
Topic titel iets veranderd
[ Voor 8% gewijzigd door Pim. op 28-08-2005 22:42 ]
"The trouble with quotes from the Internet is that you can never know if they are genuine." - Elvis Presley | Niet met me eens ? DM ME
Ik merk wel dat het makkelijker werken is met HT als ik andere programma's uitvoer naast SETI
Op mijn 2,4 P4 loopt alles toch nets iets minder makkelijk als ik bijvoorbeeld MS Word gebruik.
Voor crunchen maakt het iets uit....maar het zal niet veel schelen. Ik heb er dan voor Boinc bewust voor gekozen om SETI over 1 processor te laten lopen ipv 2.
Op mijn 2,4 P4 loopt alles toch nets iets minder makkelijk als ik bijvoorbeeld MS Word gebruik.
Voor crunchen maakt het iets uit....maar het zal niet veel schelen. Ik heb er dan voor Boinc bewust voor gekozen om SETI over 1 processor te laten lopen ipv 2.
Mooooooeeeee......
is dat werkelijk zo? want 50% in je taskmanager is niet 50% gebruik van je cpu...Haranaka schreef op zondag 28 augustus 2005 @ 20:59:
Hangt erg af van het project dat je draait. Bij mijn project SoB heb je er wel degelijk profeit van, anders gebruik je slechts de helft van je processor.
Enigste manier om daar achter te komen is om snelheid 1 client te meten en dan te kijken hoe snel je 1e client gaat als je nog een client opstart.
Als je 1e client met meer dan 45% terugloopt heeft het vrij weinig nut vind ik dan...
Mijn ervaring voor FaD:
* Deze client ondersteunt het gebruik van HT (en ook dual processors) standaard. Je hoeft je client dus geen 2 keer op te starten of dergelijke. In de setup gaat gij automatisch kijken hoeveel "processoren" er aanwezig zijn. Wil je echter deze instelling overschrijven, kan je het handmatig veranderen. (uiteraard enkel minder of gelijk aantal processen dan er "processoren" aanwezig zijn)
* In het geval van HT (P-IV 3.0 Ghz) is de totale CPUrating van de 2 processen hoger dan dat je met 1 draait (maar uiteraard niet 2 keer zo hoog)
* Als je HT uitschakeld (en dus 1 proces draait) is je CPUrating ook lager dan met HT ingeschakeld.
* Deze client ondersteunt het gebruik van HT (en ook dual processors) standaard. Je hoeft je client dus geen 2 keer op te starten of dergelijke. In de setup gaat gij automatisch kijken hoeveel "processoren" er aanwezig zijn. Wil je echter deze instelling overschrijven, kan je het handmatig veranderen. (uiteraard enkel minder of gelijk aantal processen dan er "processoren" aanwezig zijn)
* In het geval van HT (P-IV 3.0 Ghz) is de totale CPUrating van de 2 processen hoger dan dat je met 1 draait (maar uiteraard niet 2 keer zo hoog)
* Als je HT uitschakeld (en dus 1 proces draait) is je CPUrating ook lager dan met HT ingeschakeld.
"You can get more with a kind word and a gun than you can with a kind word alone." - Al Capone
Misschien een overzichtje maken met daarin de projecten waar het wel helpt en waar het beter uitgezet kan worden
Bij UD levert doet de pc er wel dubbel zo lang over om een WU af te ronden, maar aangezien je tijd meetelt bij UD ... krijg je dus ook meer punten.
Maar het tool dat ervoor zorgt dat UD tweemaal opstart (per virtuele cpu) is niet getest en het kan dus zijn dat de WU's die je instuurt kapotski zijn.
Maar het tool dat ervoor zorgt dat UD tweemaal opstart (per virtuele cpu) is niet getest en het kan dus zijn dat de WU's die je instuurt kapotski zijn.
le·vens·moe (bn.)
1.genoeg van het leven hebbend, het leven als een last beschouwend.
Hoe zit het eigenlijk met het ene project (bv. UD) op CPU #1 en een ander project (bv. FAD) op CPU #2?
Gaat dat wel goed?
Gaat dat wel goed?
What will end humanity? Artificial intelligence or natural stupidity?
Ik denk dat je zowieso van HT niet zo veel moet verwachten. Meer dan ongeveer 5% winst zal je niet snel krijgen denk ik.Resistor schreef op maandag 29 augustus 2005 @ 13:04:
Hoe zit het eigenlijk met het ene project (bv. UD) op CPU #1 en een ander project (bv. FAD) op CPU #2?
Gaat dat wel goed?
Juist denk ik dus ook onderhand, wat mij verder opvalt bij rc5 is dat de ene trager gaat als de andere, vandaar dat ik het nu gewoon heb afgezet. 1 wu 1 proc, weet je zeker dat de volle 100 gebruikt wordtSandStar schreef op maandag 29 augustus 2005 @ 16:05:
[...]
Ik denk dat je zowieso van HT niet zo veel moet verwachten. Meer dan ongeveer 5% winst zal je niet snel krijgen denk ik.
* Jive had OGR getest op twee identieke dual xeon dozen met 4 (auto-cores enabled) en met 2 (threads limited) over een weekend ..SandStar schreef op maandag 29 augustus 2005 @ 16:05:
[...]
Ik denk dat je zowieso van HT niet zo veel moet verwachten. Meer dan ongeveer 5% winst zal je niet snel krijgen denk ik.
Degene met 4 threads had 34nowaT afgewerkt als average en die zonder zat op 29nogwaT ...
Aangezien ze 2003, allebei SQL-servers, en allebij neuspeuteren in het weekend, en allebei van dezelfde proxy eten vind ik persoonlijk de vergelijking wel gesubstantieert dat HT wel degelijk een verschil in snelheid oplevert, maar daarentegen dus ook een verschil in response van een machine geeft.
Als je machine HT enabled is, maar je limit op aantal fysieke procs, dan houd je altijd "timeslices" over voor snelle reacties, maar dit gaat ten koste van pure performance op je machine.
[ Voor 3% gewijzigd door Jive op 29-08-2005 23:12 ]
Sja, ik denk dat UD een uitzondering op deze zaak is. Mede ook door het cheat/mogelijkheid tot een 2e client er naast te draaien zonder punten te 'verliezen'
op OGR is er ook sprake van een snelheidsvoordeel. HT is dan ook bedacht om ruimte te gebruiken die vrijkomt door de lange pipeline van de P4. Bij RC5-72 is HT dan weer een nadeel, daar gaat het juist trager...Jive schreef op maandag 29 augustus 2005 @ 23:11:
[...]
* Jive had OGR getest op twee identieke dual xeon dozen met 4 (auto-cores enabled) en met 2 (threads limited) over een weekend ..
Degene met 4 threads had 34nowaT afgewerkt als average en die zonder zat op 29nogwaT ...
Aangezien ze 2003, allebei SQL-servers, en allebij neuspeuteren in het weekend, en allebei van dezelfde proxy eten vind ik persoonlijk de vergelijking wel gesubstantieert dat HT wel degelijk een verschil in snelheid oplevert, maar daarentegen dus ook een verschil in response van een machine geeft.
Als je machine HT enabled is, maar je limit op aantal fysieke procs, dan houd je altijd "timeslices" over voor snelle reacties, maar dit gaat ten koste van pure performance op je machine.
Verwijderd
Ik heb onderzoek gedaan naar het nut van HT bij Folding@Home, en dan specifiek voor de QMD-WU's. Dit getest op mijn P4 3,0 @ stock. Ik heb beide situaties (mèt HT en zonder HT) uitgetest, door deze gewoon 2 weken te draaien. Daaruit heb ik de gemiddelde tijd per WU / thread gekregen. Wanneer je ea dan omrekend naar punten per uur dan krijg je dit:
Gemiddelde tijd
=> Zonder HT, 1 QMD 450-punter per CPU
Tijd per frame ca 15 minuten.
=> Met HT, 2 QMD 450-punters per CPU
Tijd per frame snel ca 37 minuten (of zelfs nog langer).
berekening
Zonder HT; punten per dag:
1440 min. P. dag
---------------------- x 450 punten ~~ 432 pts / dag
100 x 15 minuten
Met HT punten per dag:
1440 min. P. dag
---------------------- x 450 punten x 2 WU’s ~~ 350 pts / dag
100 x 37 minuten
Conclusie
Kortom; QMD's draaien zonder HT levert op de langere tijd gezien dus gewoon meer punten op, en dus is HT duidelijk in het nadeel.
Let wel, het geld alleen voor QMD's, en specifiek de 450 punten QMD’s, de 125-punters daarentegen scoren volgens een zelfde berekening dan weer gemiddeld vrij slecht.
En ook is het bij de meeste andere WU's op Folding@Home juist weer voordeliger om met HT te draaien. Dus deze berekening laat weer eens duidelijk zien dat er bij Folding@Home duidelijk grote verschillen zitten in de soorten onderzoeken die ze doen. Wat zich uit in een redelijk groot verschil in gedrag van de WU's/cores.
Overigens wordt e.a. mbt de QMD's ook ondersteunt door meldingen op het forum, waaruit blijkt dat QMD WU’s zonder HT sneller draaien. Er wordt ook gesuggereerd dat de QMD-core SMP gecompileerd is, maar da’s mij nog niet helemaal duidelijk / zeker. Want daan zou ik een groot verschil moeten zien met bv één QMD-WU op mijn dual Xeon. Dat zou dan nl significant sneller moeten draaien dan één QMD op mijn P4, maar dat significante verschil is er dus niet
Gemiddelde tijd
=> Zonder HT, 1 QMD 450-punter per CPU
Tijd per frame ca 15 minuten.
=> Met HT, 2 QMD 450-punters per CPU
Tijd per frame snel ca 37 minuten (of zelfs nog langer).
berekening
Zonder HT; punten per dag:
1440 min. P. dag
---------------------- x 450 punten ~~ 432 pts / dag
100 x 15 minuten
Met HT punten per dag:
1440 min. P. dag
---------------------- x 450 punten x 2 WU’s ~~ 350 pts / dag
100 x 37 minuten
Conclusie
Kortom; QMD's draaien zonder HT levert op de langere tijd gezien dus gewoon meer punten op, en dus is HT duidelijk in het nadeel.
Let wel, het geld alleen voor QMD's, en specifiek de 450 punten QMD’s, de 125-punters daarentegen scoren volgens een zelfde berekening dan weer gemiddeld vrij slecht.
En ook is het bij de meeste andere WU's op Folding@Home juist weer voordeliger om met HT te draaien. Dus deze berekening laat weer eens duidelijk zien dat er bij Folding@Home duidelijk grote verschillen zitten in de soorten onderzoeken die ze doen. Wat zich uit in een redelijk groot verschil in gedrag van de WU's/cores.
Overigens wordt e.a. mbt de QMD's ook ondersteunt door meldingen op het forum, waaruit blijkt dat QMD WU’s zonder HT sneller draaien. Er wordt ook gesuggereerd dat de QMD-core SMP gecompileerd is, maar da’s mij nog niet helemaal duidelijk / zeker. Want daan zou ik een groot verschil moeten zien met bv één QMD-WU op mijn dual Xeon. Dat zou dan nl significant sneller moeten draaien dan één QMD op mijn P4, maar dat significante verschil is er dus niet
[ Voor 4% gewijzigd door Verwijderd op 30-08-2005 21:25 ]
Verwijderd
Werkt met UD primaBlue_man schreef op maandag 29 augustus 2005 @ 12:34:
Bij UD levert doet de pc er wel dubbel zo lang over om een WU af te ronden, maar aangezien je tijd meetelt bij UD ... krijg je dus ook meer punten.
Maar het tool dat ervoor zorgt dat UD tweemaal opstart (per virtuele cpu) is niet getest en het kan dus zijn dat de WU's die je instuurt kapotski zijn.
Op sommige projecten moet je het echter wel anders instellen.
Neem je b.v. een Dual bak met HT (windows ziet 4 procs) dan kan het zijn voor b.v. Dpad dat het beter is om 2 clients te staren met beide 2 cores i.p.v. 1 client met 4 cores.
Ook bij SoB kun je beter 3 clients starten in zoon geval dan 4.
Lijkt erg vaag, maar dan loopt het echt harder
Ben blij om het een en ander te lezen hier
Van RC5 wist ik niet dat zonder HT het beter was en de rest is ook wel prettig om te weten.
Bedankt
hm... meteen ff een client anders instellen, meer keys/s is altijd beterWitlof schreef op dinsdag 30 augustus 2005 @ 19:23:
Ben blij om het een en ander te lezen hierVan RC5 wist ik niet dat zonder HT het beter was en de rest is ook wel prettig om te weten.
Bedankt
Draadje maar ff bookmarken.
WebsterR: thread met m'n HT rc5 gegevens (client versie 4.94 of eerder)
[rml]Loco-Motiv in "[ RC5-72] hitparade van 17 januari"[/rml]
[rml]Loco-Motiv in "[ RC5-72] hitparade van 17 januari"[/rml]
[ Voor 108% gewijzigd door D2DM op 31-08-2005 00:00 ]
R7 5700x, B350 Prime Plus, 32GB ddr4 op 3333Mt/s, 960Pro, Ultrastar He10, rx6700xt, uwqhd.
* Pim. heeft het draadje even aan de FAQ toegevoegd
"The trouble with quotes from the Internet is that you can never know if they are genuine." - Elvis Presley | Niet met me eens ? DM ME
Dudes, nog even wat bevindingen die ik al eerder had gedaan in een topic over de P4 met HT en OGR.
Da's zoals ik het heb gemeten. Het hangt er dus vanaf welke client je gebruikt (bij de 496 gebruik je standaard de core #2 (GARSP 6.0-asm-rt1-gen). Deze is bij mij met een test P4 3,0Ghz dus sneller.Ik heb hier getest met verschillende P4's. Mijn conclusie hier, voor o.a. een P4 3,0Ghz, is dat het beter is om je core (als die HT ondersteund) slechts 1 thread te laten draaien. Als ik mijn P4 twee threads laat draaien zakt ie terug naar 16Mkeys.
Standaard haalt ie 11Mkeys (494client) met HT (496) 16, zonder HT (496) 21,5Mkeys....
If it bleeds, we can kill it!! |Werkbak specs|CCNP, bezig met Master.
Je kunt natuurlijk ook gewoon je pc op HT laten staan, en je dnetclient instellen dat hij maar 1 thread start, ipv automatisch 2
Ik zorg er meestal op dat er maar 1 thread start op ene HT cpu, systeem lijk wel 'meer responsive' op die manier. Bij gebruik van verschillende clients (vooral 1 die integer berekeningen doet en 1 die progressive of lineare berekeningen doet) tegelijk is HT wel sneller.
Pagina: 1