Hoofdcategorieën
Topicacties

[Dnet] GPU Client

Pagina: 1 2 3 4 5 6 7 8 9 10 11 last

Reageer Nieuw Topic
Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

De site waar de client gemaakt is :

http://episteme.arstechni.../122097561/m/766004683831
quote:
purchased an 8800 GTX a little while back (after watching Ian Buck's presentation on CUDA {Stanford Univ. EE380 video}).

I initially focused my efforts toward accelerating xvid. I implemented the half-pel and quarter-pel interpolation algorithms and found that the overhead of moving data to and from the GPU was killing the performance gain.

So, I started looking at the motion compensation routines (where xvid spends most of it's time). The current MC code has a large number of conditionals and I was weary to attempt any kind of implementation without having a reasonably good ideal of what all of the conditional paths are for.

I decided to look for an algorithm that has a relatively small kernel and is seriously compute bound. RC5 fit the bill. I started hacking a CUDA core into dnetc on Sat. afternoon and finally got things working smoothly an hour ago.

The CUDA core is totally UN-optimized and still manages to be well over 12x the performance of the next fastest core on my E4300 (stock speed).

I have posted the sources in my mercurial repo.

http://dungeon.darktech.org/hg/dnetc_cuda/

Because I used the public dnetc snapshot, it is not possible to build an official client with this code. Also, I hacked up the configure script, so I doubt it is even sane on any archs other than x86-linux with CUDA and nvcc present. But, if you are an enterprising hacker, have fun with the code.


paul@sr71 ~/code/dnetc_cuda $ ./dnetc -test RC5-72 10

distributed.net client for Linux Copyright 1997-2006, distributed.net
Please visit http://www.distributed.net/ for up-to-date contest information.


dnetc v2.9012-497-CFR-06032022 for Linux (Linux 2.6.20).
Please provide the *entire* version descriptor when submitting bug reports.
The distributed.net bug report pages are at http://www.distributed.net/bugs/

[Mar 12 04:15:42 UTC] Automatic processor type detection did not
recognize the processor (tag: "6547:06F2")
[Mar 12 04:15:42 UTC] RC5-72: using core #10 (CUDA 1-pipe).
[Mar 12 04:15:42 UTC] RC5-72: Test 01 passed: C9:0C0353C04E1FE85-C9:0C0353C04E1FE85
[Mar 12 04:15:42 UTC] RC5-72: Test 02 passed: DE:EE0C6279:BF66F898-DE:EE0C6279:BF66F898
[Mar 12 04:15:42 UTC] RC5-72: Test 03 passed: 0F:556979E7:6C009260-0F:556979E7:6C009260
[Mar 12 04:15:42 UTC] RC5-72: Test 04 passed: 9E8B648C6:00003A3C-9E8B648C6:00003A3C
[Mar 12 04:15:42 UTC] RC5-72: Test 05 passed: C8:B3631100:0000EAF0-C8:B3631100:0000EAF0
[Mar 12 04:15:42 UTC] RC5-72: Test 06 passed: FE:40080000:00006F64-FE:40080000:00006F64
[Mar 12 04:15:42 UTC] RC5-72: Test 07 passed: 28:69000000:0000204D-28:69000000:0000204D
[Mar 12 04:15:42 UTC] RC5-72: Test 08 passed: 6E:00000000:0000172F-6E:00000000:0000172F
[Mar 12 04:15:42 UTC] RC5-72: Test 09 passed: C6:E9386A44:C0F9D107-C6:E9386A44:C0F9D107
[Mar 12 04:15:42 UTC] RC5-72: Test 10 passed: 2B:E01C5B9D65CCAD7-2B:E01C5B9D65CCAD7
[Mar 12 04:15:42 UTC] RC5-72: Test 11 passed: 97:2C0F244D:EFC54E4F-97:2C0F244D:EFC54E4F
[Mar 12 04:15:42 UTC] RC5-72: Test 12 passed: A8:8960B40B:1F46AD1F-A8:8960B40B:1F46AD1F
[Mar 12 04:15:42 UTC] RC5-72: Test 13 passed: B1:FFE95917:B38E4396-B1:FFE95917:B38E4396
[Mar 12 04:15:42 UTC] RC5-72: Test 14 passed: C6:46E7E19D:9CD65C85-C6:46E7E19D:9CD65C85
[Mar 12 04:15:42 UTC] RC5-72: Test 15 passed: E3686400B:7EFB2180-E3686400B:7EFB2180
[Mar 12 04:15:42 UTC] RC5-72: Test 16 passed: 85:EA3678CF:91DB0D2C-85:EA3678CF:91DB0D2C
[Mar 12 04:15:42 UTC] RC5-72: Test 17 passed: D6:BE71026E:348165EE-D6:BE71026E:348165EE
[Mar 12 04:15:42 UTC] RC5-72: Test 18 passed: 5F:71AD1E37:82BC4D50-5F:71AD1E37:82BC4D50
[Mar 12 04:15:42 UTC] RC5-72: Test 19 passed: 11:4134BDB0:175A077F-11:4134BDB0:175A077F
[Mar 12 04:15:42 UTC] RC5-72: Test 20 passed: 94:888FF8CB:282E6E5F-94:888FF8CB:282E6E5F
[Mar 12 04:15:42 UTC] RC5-72: Test 21 passed: D9:48A2E6E4:CD610000-D9:48A2E6E4:CD610000
[Mar 12 04:15:42 UTC] RC5-72: Test 22 passed: E5:71448E830860001-E5:71448E830860001
[Mar 12 04:15:42 UTC] RC5-72: Test 23 passed: 3E:ED6D9F85:A6D70002-3E:ED6D9F85:A6D70002
[Mar 12 04:15:42 UTC] RC5-72: Test 24 passed: 2504F6B0E:16AD0003-2504F6B0E:16AD0003
[Mar 12 04:15:42 UTC] RC5-72: Test 25 passed: 05:45C2E10D:273D0000-05:45C2E10D:273D0000
[Mar 12 04:15:42 UTC] RC5-72: Test 26 passed: 56:30E19DF4:8C460000-56:30E19DF4:8C460000
[Mar 12 04:15:42 UTC] RC5-72: Test 27 passed: 85:3B37FFD3:9F140000-85:3B37FFD3:9F140000
[Mar 12 04:15:42 UTC] RC5-72: Test 28 passed: 80:B75263C5:41660000-80:B75263C5:41660000
[Mar 12 04:15:42 UTC] RC5-72: Test 29 passed: 03:52A1DF428A30000-03:52A1DF428A30000
[Mar 12 04:15:42 UTC] RC5-72: Test 30 passed: 87:23A58F8F5940000-87:23A58F8F5940000
[Mar 12 04:15:42 UTC] RC5-72: Test 31 passed: CC:9661BA34:7604002A-CC:9661BA34:7604002A
[Mar 12 04:15:42 UTC] RC5-72: Test 32 passed: 21:E765D2F6:C6110000-21:E765D2F6:C6110000
[Mar 12 04:15:42 UTC] RC5-72: 32/32 Tests Passed (0.064004 seconds)


paul@sr71 ~/code/dnetc_cuda $ ./dnetc -bench RC5-72

distributed.net client for Linux Copyright 1997-2006, distributed.net
Please visit http://www.distributed.net/ for up-to-date contest information.


dnetc v2.9012-497-CFR-06032022 for Linux (Linux 2.6.20).
Please provide the *entire* version descriptor when submitting bug reports.
The distributed.net bug report pages are at http://www.distributed.net/bugs/

[Mar 12 04:11:47 UTC] Automatic processor type detection did not
recognize the processor (tag: "6547:06F2")
[Mar 12 04:11:47 UTC] RC5-72: using core #0 (SES 1-pipe).
[Mar 12 04:12:07 UTC] RC5-72: Benchmark for core #0 (SES 1-pipe)
0.00:00:17.08 [3,716,277 keys/sec]
[Mar 12 04:12:07 UTC] RC5-72: using core #1 (SES 2-pipe).
[Mar 12 04:12:27 UTC] RC5-72: Benchmark for core #1 (SES 2-pipe)
0.00:00:17.25 [6,228,036 keys/sec]
[Mar 12 04:12:27 UTC] RC5-72: using core #2 (DG 2-pipe).
[Mar 12 04:12:45 UTC] RC5-72: Benchmark for core #2 (DG 2-pipe)
0.00:00:16.59 [4,967,345 keys/sec]
[Mar 12 04:12:45 UTC] RC5-72: using core #3 (DG 3-pipe).
[Mar 12 04:13:05 UTC] RC5-72: Benchmark for core #3 (DG 3-pipe)
0.00:00:16.57 [6,231,719 keys/sec]
[Mar 12 04:13:05 UTC] RC5-72: using core #4 (DG 3-pipe alt).
[Mar 12 04:13:24 UTC] RC5-72: Benchmark for core #4 (DG 3-pipe alt)
0.00:00:17.46 [5,665,622 keys/sec]
[Mar 12 04:13:24 UTC] RC5-72: using core #5 (SS 2-pipe).
[Mar 12 04:13:43 UTC] RC5-72: Benchmark for core #5 (SS 2-pipe)
0.00:00:16.30 [5,274,208 keys/sec]
[Mar 12 04:13:43 UTC] RC5-72: using core #6 (GO 2-pipe).
[Mar 12 04:14:03 UTC] RC5-72: Benchmark for core #6 (GO 2-pipe)
0.00:00:17.11 [6,207,954 keys/sec]
[Mar 12 04:14:03 UTC] RC5-72: using core #7 (SGP 3-pipe).
[Mar 12 04:14:22 UTC] RC5-72: Benchmark for core #7 (SGP 3-pipe)
0.00:00:16.63 [6,567,384 keys/sec]
[Mar 12 04:14:22 UTC] RC5-72: using core #8 (MA 4-pipe).
[Mar 12 04:14:42 UTC] RC5-72: Benchmark for core #8 (MA 4-pipe)
0.00:00:16.95 [5,364,069 keys/sec]
[Mar 12 04:14:42 UTC] RC5-72: using core #9 (MMX 4-pipe).
[Mar 12 04:15:01 UTC] RC5-72: Benchmark for core #9 (MMX 4-pipe)
0.00:00:16.64 [4,298,758 keys/sec]
[Mar 12 04:15:01 UTC] RC5-72: using core #10 (CUDA 1-pipe).
[Mar 12 04:15:19 UTC] RC5-72: Benchmark for core #10 (CUDA 1-pipe)
0.00:00:16.28 [84,343,980 keys/sec]
Het begin is er nu nog de optimalisaties :D :D

EDIT : Totally unoptimized... Linux only...!!!

Cpt00kirk wijzigde dit bericht 12-03-2007 08:53 (94%)

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

Fear teh birdeh again :P

Dat is ronduit eng :P
Hoeveel watt gebruikt die core eig?

Gele banaan is overleden, stop met toeteren!!! || Op zoek naar servies?
"My software never has bugs, it just develops random features."

Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

quote:
BaBoOn schreef op maandag 12 maart 2007 @ 08:56:
Dat is ronduit eng :P
Hoeveel watt gebruikt die core eig?
zo ongeveer 170 WATT @ full 8)

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

TeamBVD rulez

Hopen dat dnet ook gebruik gaat maken van de code en het in de officiele client bakt. Dan zal rc5 ook eens lekker gaan opschieten :)

84 mkey's is ongeveer 10 AMD XP3000. Dat is erg snel.

www.dutchpowercows.org | Member of TeamBVD

Berichten: 76
Reg. datum: 24 maart 2003

Hopen dat OGR ook wordt ondersteund binnenkort :)
 
Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

wie heeft zon kaartje (of in SLI ) en wil dit wel eens gaan testen.. :9~

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

't zal wel
Berichten: 3.774
Reg. datum: 01 februari 2001

quote:
Henry_ schreef op maandag 12 maart 2007 @ 09:24:
Hopen dat OGR ook wordt ondersteund binnenkort :)
Dat hoop ik ook.
OGR + ATI based power lijkt mij ook wel wat >:)

Acties: [view][quote]


Door: Pim.
Moderator NOS/BV
EnCE

Holy crap !!!!!!!

84 Mkeys.... dat is erg ranzig.... :) :)

* Pim. wannahave !

Never attribute to malice that which can be adequately explained by stupidity | Niet met me eens ? DM ME

*zucht*
Berichten: 4.655
Reg. datum: 17 oktober 2001

Als men inderdaad de tijd vind en er een stabiele core van kan maken voor dnetc, dan zal het aantal keys wat verwerkt wordt snel toenemen. En komen we toch een aantal jaren dichterbij de juiste key :+
Even wachten dus nog. Bij D.net is men wel al op de hoogte gebracht?

Ohh mooie meid, Erzsébet Bathory
Smakelijke recepten op HeidiHo.eu - iPod mini met 16GB

IP in your face !

Vond het nogal laag klinken. maar toen ik zag dat het RC5 was.. was mijn reactie net als Pim..

MAAR.. zolang ie niet geoptimaliseerd is is de prestatie/watt nog net niet gunstiger..

Op mijn bak haal ik ~74 Mkeys maar mijn verbruik is dan 150 Watt (volgens BMC)

8800GTX: 2,024 Watt per Mkey
E5345: 2,027 Watt per Mkey

exit();

TeamBVD rulez

quote:
Qwerty-273 schreef op maandag 12 maart 2007 @ 10:37:
Als men inderdaad de tijd vind en er een stabiele core van kan maken voor dnetc, dan zal het aantal keys wat verwerkt wordt snel toenemen. En komen we toch een aantal jaren dichterbij de juiste key :+
Even wachten dus nog. Bij D.net is men wel al op de hoogte gebracht?
Ik heb Floppus geatendeerd op dit topic en hij is van D.net. :)

www.dutchpowercows.org | Member of TeamBVD

Berichten: 1.687
Reg. datum: 27 februari 2002

Yes, eindelijk ... kan niet wachten totdat er een officiele GPU client is voor RC5/OGR :+
Hopelijk is het aandeel dikke GPUs in NL groter dan in moedertje Rusland ;)
Berichten: 1.668
Reg. datum: 09 augustus 2005

quote:
SKiLLa schreef op maandag 12 maart 2007 @ 10:56:
Yes, eindelijk ... kan niet wachten totdat er een officiele GPU client is voor RC5/OGR :+
Hopelijk is het aandeel dikke GPUs in NL groter dan in moedertje Rusland ;)
Dat weet ik wel zeker. als dit gaat werken koop ik er twee!

Cow Frontier Society

Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

quote:
CFS schreef op maandag 12 maart 2007 @ 11:03:
[...]

Dat weet ik wel zeker. als dit gaat werken koop ik er twee!
dat bedoel ik !!! laat het vakantiegeld maar komen >:) >:)

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

Berichten: 1.622
Reg. datum: 05 april 2005

quote:
DukeBox schreef op maandag 12 maart 2007 @ 10:38:
Vond het nogal laag klinken. maar toen ik zag dat het RC5 was.. was mijn reactie net als Pim..

MAAR.. zolang ie niet geoptimaliseerd is is de prestatie/watt nog net niet gunstiger..

Op mijn bak haal ik ~74 Mkeys maar mijn verbruik is dan 150 Watt (volgens BMC)

8800GTX: 2,024 Watt per Mkey
E5345: 2,027 Watt per Mkey
jouw bak gecombineerd met 2 8800 GTX'en geeft dan maar effe 250 MKeys (2x 80 + 1x 70): netjes 8)

Als dit in de officiele client komt zou het een enorme boost geven en extra goede reclame zijn voor nvidia. (had seti geen cpu+ati versie ?)

//nee, ik doe niet mee met DPC of andere teams, maar ik volg zulks nieuws wel mee.
(ik lurk nog en mss dat ik toch eens een steentje toe draag zodra ik helemaal stats verslaafd ben)

soulrider wijzigde dit bericht 12-03-2007 11:08 (11%)

 
2 the resQ
Berichten: 3.674
Reg. datum: 01 juni 2001

Nee, het was een andere @home: Folding@Home. Die heeft inderdaad een optimized client voor de laatste Ati kaarten (welke volgens hun ongeveer 40x zo snel zou zijn als de meeste hedendaagse cpu's).

PC Specs
Nikon D60 18-55 VR kit | Nikon AF 50mm f/1.8D | Sigma 50-200mm F4-5.6 DC OS HSM | nog wat voorzetglas
Vouw mee bij Fatal Error Group! - F@H: #3

IP in your face !

quote:
soulrider schreef op maandag 12 maart 2007 @ 11:05:
jouw bak gecombineerd met 2 8800 GTX'en geeft dan maar effe 250 MKeys (2x 80 + 1x 70): netjes 8)
Als er x16 sloten in gezeten hadden.. maar helaas moet ik het doen met 4*8 en 4*4..

exit();

Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

is er niet iemand die deze client kan downloaden en deze geschikt kan maken onder windows??

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

Berichten: 1.622
Reg. datum: 05 april 2005

quote:
Cpt00kirk schreef op maandag 12 maart 2007 @ 11:30:
is er niet iemand die deze client kan downloaden en deze geschikt kan maken onder windows??
de core kan misschien, maar voor de client moet je eerst die core voorstellen aan D.net zodat zij hem in hun client kunnen opnemen.

hun beschikbare code levert namelijk geen werkende client op.
enkel een off-line versie waarmee je je core kunt testen.
 
Rabbit PowerT
Berichten: 3.495
Reg. datum: 05 april 2005

offtopic:
[quote]Adm.Spock schreef op maandag 12 maart 2007 @ 22:37:
Cirkey! :P
[/quote]

hey Spock..... naar welk schip ben jij verhuist ?? kan je niet meer vinden... :P


zo effe weer ontopic... hebben we bij DPC nou niemand met linux en een 8800 GTX?? die effe kan testen :'(

Cpt00kirk wijzigde dit bericht 13-03-2007 08:08 (19%)

__-=Team NGS=-__ #1 SoB - #1 TSC2 - #3 DPAD - #6 F@H - #7 LC - #10 RC5 - #12 µFluids - #15 CP

A.K.A. RHarmsen

quote:
Cpt00kirk schreef op dinsdag 13 maart 2007 @ 08:07:
offtopic:
[quote]Adm.Spock schreef op maandag 12 maart 2007 @ 22:37:
Cirkey! :P
[/quote]

hey Spock..... naar welk schip ben jij verhuist ?? kan je niet meer vinden... :P


zo effe weer ontopic... hebben we bij DPC nou niemand met linux en een 8800 GTX?? die effe kan testen :'(
iemand met een 8800 GTX en een Linux Live CDtje zou eventueel ook genoeg zijn.
ik heb geen 8800 GTX
Dope Rapper
Berichten: 2.750
Reg. datum: 14 december 2003

Als jullie mij een toffe boot-cd en een tutorial voor de installatie van dpc op linux hebben dan wil ik wel even testen, ik heb een 8800 GTX.

:)

Heephstan wijzigde dit bericht 13-03-2007 10:19 (4%)

Berichten: 13
Reg. datum: 13 maart 2007

gaat dit ook werken met een 8800GTS dan wil ik het ook wel ff testen

Pagina: 1 2 3 4 5 6 7 8 9 10 11 last



VNU Media logo Powered by True

© 1998 - 2009 Tweakers.net - Alle rechten voorbehouden - Uw Privacy - Algemene Voorwaarden

Uitgever van: