Toon posts:

Krachtige Linux machine DNA / statistische analyses advies

Pagina: 1
Acties:

Verwijderd

Topicstarter
Beste Tweakers,

Graag zou ik wat advies willen omtrent het maken van een computer configuratie, dit aangezien ik het fijne er niet zo goed meer van af weet en twijfel of ik de juiste componenten in gedachten heb.

Wat wil je doen met je nieuwe systeem? (welke programma's wil je gebruiken)?

Op dit moment zijn wij bezig een computer-configuratie (voor minimaal 2 systemen) te maken voor een machine die veel rekenkracht nodig heeft en schijfruimte voor het doen van statistische berekeningen op DNA data. Programma's zullen zijn o.a. STATA, R, veel in bash voor bewerken van data.

Wat mag het systeem gaan kosten?
€ +/- 2500,-

Zijn er componenten of randapparatuur die je al hebt en mee wil nemen naar je nieuwe systeem?
Nee, niets.

Wat denk je allemaal nodig te hebben?
  • Antec Performance One P280
  • Corsair RM Series RM750
  • MSI X79A-GD65 (8D)
  • Intel Core i7 3930K / 3.2 GHz
  • Cooler Master Hyper 412S
  • Crucial Ballistix Tactical 2 x 16GB
  • Adaptec RAID 6805E
  • StarTech.com SFF-8087 to 4x SATA
  • OCZ Vector 150 Series 240GB
  • WD Black WD3003FZEX 3xgb
  • Sapphire RADEON HD 5450
  • Dell UltraSharp U2713HM
  • Dell P2214H
  • Apple Keyboard with Numeric Keypad
  • Logitech M318e
Heb je nog bepaalde (merk)voorkeuren? Waarom?
Nee in principe niet.

Heb je nog bepaalde eisen/wensen?
Graag een stille PC.

Bovenstaande configuratie hadden we ongeveer in gedachten. Echter er zijn een aantal dingen die we nog niet geheel zeker weten.

Ten eerste, klopt überhaupt de gehele configuratie wel zijn alle onderdelen compatibel met elkaar. Moederbord, cpu, koeler, geheugen, etc….

Ten aanzien van de hardeschijven was het idee om het besturingssyteem op de SSD HD (OCZ Vector 150 Series) te installeren. En t.a.v. de opslag van data willen we de Adaptec RAID 6805 RAID kaart i.c.m. 3x WD Black WD3003FZEX in RAID 5 configuratie gebruiken.
  • Is bovenstaande een goede keuze t.a.v. performance
  • Is deze adaptec kaart compatibel met deze schijven en Linux als besturingssysteem
Betreffende de monitoren en de videokaart. We hebben gekozen voor de Dell UltraSharp U2713HM monitor plus als tweede monitor de Dell P2214H met als videokaart de Sapphire RADEON HD 5450.
  • Is bovenstaande qua aansturing mogelijk tegelijk door de videokaart. (2560 *1440) + (1920 * 1080) 2 monitoren.
  • Is de videokaart compatibel met Linux?
Mocht jullie aanvullingen tips of suggesties hebben hoor ik het graag.

Alvast bedankt voor de moeite.

Groetjes,

Ruben

Verwijderd

Topicstarter
Zelf dacht ik dat misschien voor de SSD de Samsung 840 Pro Series MZ-7PD256 een beter alternatief is?

  • Sebas1979
  • Registratie: Juni 2004
  • Laatst online: 12:25
Leg eens wat meer uit over het gebruik.

Gaat die machine één keer opgestart worden, en dan fulltime (24x7) berekeningen maken? Of moet je dat af en toe doen, en zet je hem dan aan?
Hoe veel data moet je verwerken? (in termen van giga-, tera- of petabytes)

I like my men like I like my coffee


Verwijderd

Topicstarter
Beste Sebas,

De machine staat constant aan maar hoeft niet constant berekeningen te maken. Data verwerking zal ongeveer 4GB per file maximaal zijn. Het is voornamelijk meer data manipulatie en statistische berekeningen dus regressie analyses. GWAS analyses en Meta-analyses. Persoonlijk denk ik dat de machine zeker krachtig genoeg zou moeten zijn zoals deze nu geconfigureerd is.

  • maratropa
  • Registratie: Maart 2000
  • Niet online
Is het goed ge-thread, dus 6 cores zinvol? Is er tijdens het rekenen veel geheugen in gebruik? Hoe snel moet je data wegschrijven en lezen? Is die data sequentieel of random van karakter?

Voor niet veel meer geld heb je een e5 1650 met c602 moederbord en ECC/REG ram. Dat heeft als voordeel de ECC foutcorrectie wat de boel stabieler moet houden. In jullie geval vind ik dat wel een logische overweging, vooral als hij altijd aan staat.

Op socket 2011 heb je altijd 4 ram latjes nodig zodat je quad channel hebt. Bij dit soort dingen vaker nuttig dan normaal.

Raid 5 zou ik eigenlijk niet meer doen, maar dan raid 1 of 10 oid. Opslag is toch niet zo duur meer. Waarom een aparte controller en niet aan de intel controller?

specs


  • manzonderdas
  • Registratie: Juni 2006
  • Nu online
Doe hetzelfde op mijn eigen pc.

Beetje advies
1. R is perfect multithreaded te krijgen, maar helaas zijn veel van de recentere dingen nog single threaded + hebben ze gruwelijk veel ram nodig (SKAT gebruikt 55 GB bij mij... met een dataset van 5 GB). Omdat die dingen ook LANG draaien (imputatie = 24 u per 5 Mb als je imputeert op 1000 genomes op basis van 1k samples - tenzij jouw code efficiënter is dan de mijne), zou ik aanraden om voor een Xeon te gaan, ECC ram en een C6xx chip moederbord.
2. Bij de Xeon, overweeg de 1650 v2 - moeilijk te vinden maar dat gaat
3. Ik weet niet of je systeem latjes van 16 GB aankan, dus zou voor 8*8 GB gaan. Voor mij is ECC een must. Quad channel is ook aan te raden.
4. intel SSD ipv vertex, overweeg 2 SSD's omdat sommige programma's nog altijd naar de schijf schrijven. Of een ramdisk, wat ik in windows gebruik.
5. Liever nvidia - vind dat beter in linux, maar als je permutaties zou doen (en als je een titan neemt) zou je dat via cuda kunnen doen - R kan dat als je genoeg kunt programmeren.
6. Liever 2 schijven in RAID 1 dan RAID 5 - recovery gaat véél te lang duren. Persoonlijk vind ik harde schijf zelden een bottleneck, en als dat zo is, zie punt 4.


In elk geval veel succes, en kijk ook naar http://gettinggeneticsdone.blogspot.be/

[ Voor 4% gewijzigd door manzonderdas op 04-06-2014 18:03 ]


  • The Eagle
  • Registratie: Januari 2002
  • Laatst online: 02-04 15:52

The Eagle

I wear my sunglasses at night

Ik ken je progsels niet, maar als het om pure power gaat zou ik ook voor Xeon's gaan ipv i7's.
Qua ram geldt simpelweg: meer is beter.
Qua diskspace: als het een rekenunit wordt, is het wellicht een optie om hem vanaf een centrale NAS oid te laten lezen?

Waar ik zelf aan zit te denken is een cluster met shared storage. Mocht het dan nodig zijn, kun je altijd power bijprikken :)

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


Verwijderd

Topicstarter
Beste tweakers,

Het beste in jullie optiek is dus om te gaan voor een Intel Xeon E5-1650 v2 CPU. I.c.m. een C602 (intel) chipset moederbord.

Vraag: Is dan bijv. een goede keuze het INTEL Supermicro X9SRL-F moederbord en heeft iemand misschien ervaring met de "ingebouwde" raid controller op het MB werkt deze bijv. goed met linux? Ik kan hier weinig zinnigs over vinden of is het verstandig om toch een losse raid controller aan te schaffen.

Is als alternatief voor het MB de ASUS P9X79 - Socket 2011 - ATX (chipset: Intel X79) een goede keuze en heeft iemand daar misschien ervaring mee. Dit bord heeft echter niet de c602 chipset.

Verder is het strikt noodzakelijk om ECC geheugen te gebruiken?

Alvast bedankt voor de reactie!

  • mirp
  • Registratie: Januari 2013
  • Laatst online: 31-07-2022
http://www.pugetsystems.c...ntages-of-ECC-Memory-520/

http://www.pugetsystems.com/all_articles.php

http://techreport.com/rev...960x-processor-reviewed/8

http://www.anandtech.com/...4690-and-i3-4360-tested/4

http://www.techpowerup.co...acturer=&pp=25&order=date

http://nl.hardware.info/p...ngen?tcId=283&specId=8873

Nieuwe Workstation graag advies

(ASUS P9X79 kan ook)

http://www.tweaktown.com/...ance_analysis/index3.html

http://techreport.com/rev...andy-bridge-performance/2

http://www.hardwaresecret...emory-Architectures/133/8

http://www.overclockers.c...dr3-2133-quad-channel-ram

[BBG] High-end workstation juli 2014

opmerkingen:

-je hebt nu een vrij oude kast uitgekozen

- als je gaat overklokken (meer power voor hetzelfde geld) neem dan een dikke koeler

-kijk naar de samsung en crucial ssd's http://www.hardware.fr/articles/920-7/ssd.html

-kijk naar een nas (even surfen op de site van synology) voor je externe opslag

-kijk ook naar een 1080p 27 scherm. ik gebruik ze zelf ook en ik vind ze goed.

-ik weet niet wat voor jouw belangrijk is: heel veel cores die lager geklokt zijn voor 24/7 of iets minder cores die hoger geklokt zijn voor meer single core performance

  • Thralas
  • Registratie: December 2002
  • Laatst online: 11:07
Verwijderd schreef op vrijdag 20 juni 2014 @ 11:43:
Is als alternatief voor het MB de ASUS P9X79 - Socket 2011 - ATX (chipset: Intel X79) een goede keuze en heeft iemand daar misschien ervaring mee. Dit bord heeft echter niet de c602 chipset.

Verder is het strikt noodzakelijk om ECC geheugen te gebruiken?
Als je voor de Xeon gaat zou ik 't wel netjes matchen met een bord dat zeker ECC memory ondersteunt (de Supermicro). Bij de 'desktopborden' is dat nog maar de vraag.

Over het nut van ECC: veel betere resistentie tegen geheugenfouten, en daarmee een (theoretisch) stabieler en betrouwbaarder systeem. De kans dat een van je berekeningen een onjuist resultaat oplevert is ermee kleiner, wat de kans daarop is (en de impact) kan ik niets over zeggen.

Als je niet voor ECC kiest zou ik die 3930K overigens inruilen voor een 4930K, icm. een desktopboard. Of de dan P9X79 ook goed is? Waarschijnlijk, maar waarom dan niet deze: pricewatch: MSI X79A-GD45 Plus ?

Betreft RAID: heb je een overtuigend argument mbt. waarom je die raidcontroller nodig hebt? Nee? Dan zou ik gewoon md-raid gebruiken onder Linux.

Qua SSD: Crucial MX100 series lijkt de best-buy

  • johnkeates
  • Registratie: Februari 2008
  • Laatst online: 04-07-2025
Ga voor ECC; met dit soort zaken wil je ten eerste een zo betrouwbaar mogelijk systeem, en ten tweede ga je dat makkelijk terugverdienen als je een paar uur rekenen opnieuw zou moeten doen, of data gebruikt wordt die achteraf incorrect blijkt te zijn en dus een compleet proces weggegooid geld is.

  • Thralas
  • Registratie: December 2002
  • Laatst online: 11:07
johnkeates schreef op zaterdag 21 juni 2014 @ 03:39:en ten tweede ga je dat makkelijk terugverdienen als je een paar uur rekenen opnieuw zou moeten doen, of data gebruikt wordt die achteraf incorrect blijkt te zijn en dus een compleet proces weggegooid geld is.
Daar kun je helemaal geen uitspraken over doen zonder kennis van de impact van een crash of andere failure, hoewel ik ook neig naar ECC memory als je toch 2500,- uitgeeft.

Als 't echt zo kritisch zou zijn als jij stelt zou TS z'n geld moeten uitgeven bij Dell, dan heb je tenminste een supportcontract. Momenteel valt ECC (qua continuiteit) een beetje in het niet vs. de tijd die je potentieel kwijt bent aan het debuggen van andere spontaan optredende hardwareproblematiek.

  • maratropa
  • Registratie: Maart 2000
  • Niet online
Gezien de wat oudere chipsets en dat socket 2011 bijna overgaat in socket 2011 v3 zou ik zelf nu niet snel meer investeren in 2011 spullen.

Als je perse ECC wilt dan is wel de vraag of er snel een upgrade van het xeon platform komt met 2011 v3. Als je ECC wilt en nu wat wilt kopen dan zit je er aan vast.

Maar in q3 zou Haswell-E er moeten zijn, dan kun je toch voor een hele goede prijs een 6 core met 64gb aanschaffen, dat is best interessant. Maar geen ECC.

specs

Pagina: 1