Hi,
In m'n vrije tijd knutsel ik een beetje aan cryptomining kernels. Nu kwam ik laatst een probleem tegen bij Nvidia kaarten, waardoor deze bij zgn. "memory hard kernels" waarbij gebruik wordt gemaakt van zeer grote (> 1GB) GPU buffers, last krijgen van "TLB trashing". Hierdoor zakt de performance van deze kernels in als een pudding. De ontdekking van dit euvel heeft kennelijk inmiddels bij Nvidia zelf al enige onrust veroorzaakt
.
Zonder al te ver in details te treden, is dit een voorbeeld van wat er gebeurd met de bandbreedte van een GTX780 als je random (coalesced) reads doet, met de buffergrootte in MB op de x as:

Bij GTX750Ti begint de ellende al op 512MB onder Windows 8 en 1GB onder Windows 7 en Linux.
Ik ben benieuwd naar het gedrag van AMD kaarten, want die heb ik niet. In het bijzonder GCN 1.0, 1.1 en 1.2 (HD 7xxx t/m R9 300 series). GTX900 series zijn ook wel interessant, al vermoed ik dat die net als de GTX780 tot 2GB prima werken.
De executables en broncode is hier te vinden:
https://github.com/Genoil/dagSimCL (code)
https://github.com/Genoil/dagSimCL/archive/master.zip (zip met code en binaries)
Binaries zitten in x64/Release. Extra info (cmd line params) via README.
De resultaten worden weggeschreven in een CSV bestand. Overigens is het normaal dat niet de volle geadverteerde bandbreedte van je kaart wordt gehaald. Dat heeft met het hashing algoritme te maken.
Ik ben benieuwd naar jullie resultaten.
In m'n vrije tijd knutsel ik een beetje aan cryptomining kernels. Nu kwam ik laatst een probleem tegen bij Nvidia kaarten, waardoor deze bij zgn. "memory hard kernels" waarbij gebruik wordt gemaakt van zeer grote (> 1GB) GPU buffers, last krijgen van "TLB trashing". Hierdoor zakt de performance van deze kernels in als een pudding. De ontdekking van dit euvel heeft kennelijk inmiddels bij Nvidia zelf al enige onrust veroorzaakt
Zonder al te ver in details te treden, is dit een voorbeeld van wat er gebeurd met de bandbreedte van een GTX780 als je random (coalesced) reads doet, met de buffergrootte in MB op de x as:

Bij GTX750Ti begint de ellende al op 512MB onder Windows 8 en 1GB onder Windows 7 en Linux.
Ik ben benieuwd naar het gedrag van AMD kaarten, want die heb ik niet. In het bijzonder GCN 1.0, 1.1 en 1.2 (HD 7xxx t/m R9 300 series). GTX900 series zijn ook wel interessant, al vermoed ik dat die net als de GTX780 tot 2GB prima werken.
De executables en broncode is hier te vinden:
https://github.com/Genoil/dagSimCL (code)
https://github.com/Genoil/dagSimCL/archive/master.zip (zip met code en binaries)
Binaries zitten in x64/Release. Extra info (cmd line params) via README.
De resultaten worden weggeschreven in een CSV bestand. Overigens is het normaal dat niet de volle geadverteerde bandbreedte van je kaart wordt gehaald. Dat heeft met het hashing algoritme te maken.
Ik ben benieuwd naar jullie resultaten.
[ Voor 5% gewijzigd door Genoil op 28-11-2015 19:37 ]