Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien
Toon posts:

Text mining / nlp

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ben als PhD veel bezig met text mining en NLP. Ik werk nu op een 21,5" iMac (late 2015), maar merk dat bijvoorbeeld het creëren van grote sparse matrices veel tijd kost, laat staan de analyse ervan met random forests en neural networks. Werk vooral in R en een beetje Python.

Wat wil je doen met je nieuwe systeem?
Naast wat internetten en tekstverwerken dus vooral text mining en een beetje machine learning.

Wat mag het systeem gaan kosten?
1000,- .

Wat denk je allemaal nodig te hebben?
Vooral veel cores en RAM. Is een krachtige GPU nu wel of niet nodig?

Wat verwacht je van ons?
Antwoord op de vragen: is een krachtige GPU nu wel of niet wenselijk? Machine learning wordt vaak gelijkgesteld aan het nodig hebben van veel GPU power. Alleen: volgens mij werken de R en python packages die ik gebruik nauwelijks op de GPU. En verder: Zijn bijv. 8 CPU-cores geen overkill? Samenvattend: ik ben er vooral nog niet over uit welke combinatie CPU/GPU ik moet nemen. Neig nu naar Ryzen met 8 cores en 16GB RAM.

[ Voor 16% gewijzigd door Verwijderd op 24-10-2017 11:11 ]


Verwijderd

#ProductPrijsSubtotaal
1AMD Ryzen 7 1700 Boxed Wraith Spire koeler€ 295,49€ 295,49
1MSI B350 PC Mate€ 79,95€ 79,95
1MSI GeForce GTX 1050 TI GAMING X 4G€ 169,90€ 169,90
1Fractal Design Focus G Zwart€ 45,95€ 45,95
1Microsoft Windows 10 Pro NL 64bit OEM€ 129,95€ 129,95
1Corsair Vengeance LPX CMK16GX4M2B3200C16€ 182,-€ 182,-
1Seasonic G-series 450 watt€ 68,50€ 68,50
1Crucial MX300 2,5" 525GB€ 141,95€ 141,95
Bekijk collectie
Importeer producten
Totaal€ 1.113,69

Verwijderd

die windows is een foutje :-)

  • johnkeates
  • Registratie: Februari 2008
  • Laatst online: 04-07 16:30
Kan je dit niet beter op een server doen? Heeft weinig met je desktop te maken denk ik, tenzij je alles met een GUI probeert te doen.

Servers kan je on-demand huren, dus je kan ook als je iets groots wil doen of nog niet aan optimalisatie toe komt eerst wat duurdere instances nemen en dan later goedkoper gaan. Bijvoorbeeld bij AWS, als je een paar uurtjes wil rekenen kost dat misschien een tientje. Pas als je het meer dan 200 uur per maand nodig hebt heeft fysieke hardware weer zin.

[ Voor 9% gewijzigd door johnkeates op 24-10-2017 15:05 ]


  • breew
  • Registratie: April 2014
  • Laatst online: 23:43
Volgens mij maakt R niet zo sterk gebruik van meerdere cores, en al helemaal niet/nauwelijks van de GPU. Het kàn allemaal wel, maar het is een hoop extra werk.
RAM daarentegen is wel erg boeiend. Ik zou dan ook eerder 32GB nemen, dan 16.

Als je grote datasets vaak moet inlezen / wegschrijven, is de snelheid van de HDD interessant.

Als het dan allemaal nog niet (vlot genoeg) werkt, en je komt niet verder met efficiënter coden, dan zul je denk ik ene uitstapje moeten maken richting een hadoop-cluster.

[ Voor 37% gewijzigd door breew op 24-10-2017 15:12 ]


  • zakalwe
  • Registratie: Juni 2000
  • Laatst online: 22-11 15:03
Wat is je uiteindelijke oplossing geworden @Verwijderd ?

Mocht je je iMac nog gebruiken, misschien kan je nagaan waar je code de meeste tijd spendeert en wat mogelijke bottlenecks zouden kunnen zijn.

Van welke NLP python packages maak je gebruik?

Er zijn ondertussen ook steeds meer cloud aanbieders van AI/ML diensten.
Ik vond Algorithmia (https://www.algorithmia.com) wel sympathiek, makkelijk starten door kant en klare modellen en elke maand 5000 credits (~= 5000 sec compute time). Support voor R, Python en meer. Je kan je eigen code draaien of kant en klare modellen gebruiken.

Ik heb ook wel eens gekeken naar de programmeertaal Julia (https://juliacomputing.com/products/juliapro.html). Als grote voordeel heeft men het daar over Python-flexibiliteit met C-snelheid. Er is echter nog maar een kleine community, en daardoor moet je veel zelf uitzoeken (weinig tutorials). Daardoor minder geschikt voor beginners.

[ Voor 5% gewijzigd door zakalwe op 26-03-2018 23:52 ]

Pagina: 1