Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie
Toon posts:

Beginnen met python? (ux research)

Pagina: 1
Acties:

Vraag


Anoniem: 264566

Topicstarter
Ben een UX designer die meer de UX research kant op wilt gaan, daarvoor moet je quantitative data analyses kunnen doen. Daarnaast lijkt het me ook leuk om de manier van denken te leren, en wie weet meer met programmeren in de toekomst te doen. Al is het maar voor handelingen automatiseren.

Na redelijk wat onderzoek leek Python een goede begintaal, is een duidelijke taal die voor mijn doeleinden gebruikt kan worden en met die kennis zou ik altijd nog verder kunnen in een andere taal. (later misschien R en/of SQL)

Ik dacht aan codeacedemy basis cursus om syntaxen e.d. te leren en daarna misschien kleine opdrachtjes op codewars. Misschien nog een boek erbij.

Is dit een goed idee of moet ik een andere kant op?

Beste antwoord (via Anoniem: 264566 op 28-05-2020 22:31)


  • Morrar
  • Registratie: juni 2002
  • Laatst online: 23:39
Puur voor data analyse denk ik dat Python of R wel de meest voor de hand liggende keuzes zijn. Er zijn nogal wat online oorlogen over welke het beste is, maar beiden hebben sowieso veel te bieden. Mijn kijk erop is als volgt:

Python:
- Meer general puprose (bv ook webontwikkeling)
- Meer production ready; logging, testing, packaging
- Eenvoudiger structuur aan te brengen
- Focus op big data, machine learning, minder op statistiek
- Eenvoudig te leren, maar wel een uitdaging om zo efficient mogelijk mee te werken
- Enorme community en ecosysteem

R:
- Volledig gericht op data, statistiek en visualisatie / reporting
- Minder production ready dan Python, wordt veelal academisch gebruikt
- Extreem sterk voor statistiek, maakt inhaalslag op big data / ML
- Syntax iets minder intutief, maar packages al dplyr maken een hoop mogelijk
- Eveneens een grote (academische) community en ecosysteem

Persoonlijk is mijn voorkeur Python, maar ook R heeft sterke kanten. Beiden hebben quirks waar je een hekel aan kunt hebben en valkuilen waar je als beginner in zult vallen.

Codecademy is verder leuk om de basis syntax te leren, maar is niet toegespitst op data analyse. Daarvoor zijn meer gespecialiseerde cursussen te vinden op Coursera of DataCamp etc. Voor R is Roger Peng nog wel een bekende: https://www.cs.upc.edu/~r...adistica/rprogramming.pdf

Voor Python zou ik sowieso ervaring op gaan doen met de volgende packages:
- numpy; efficiente numerieke bewerkingen in Python (omdat Python zelf traag is)
- pandas; data verwerking in tabulaire structuren (DataFrames) - bread and butter package ETL!
- scikit-learn; belangrijkste Machine Learning framework
- scipy / statsmodels; voor als je statistiek nodig hebt.
- matplotlib; voor het maken van plotjes / grafieken (zelf prefereer ik overigens plotnine)

Voor R zijn alle packages uit het tidyverse zeker de moeite waard. Wat bekende packages:
- dplyr; beetje de tegenhanger van pandas voor tabulaire data en SQL-achtige operaties.
- ggplot; zeer sterk package voor grafieken - plotnine is de Python implementatie ervan
- shiny; interactieve dashboarding; leuk maar wordt vrij snel onoverzichtelijk
- rmarkdown; reporting in markdown met R integratie.

Verder zijn er talloze packages in R beschikbaar voor individuele analyses; o.a. RandomForest of bijvoorbeeld forecast voor time-series data. Het is bij R wat meer zoeken naar goede packages, waar het bij Python wat meer is georganiseerd in frame works.

Voor R zou ik sowieso RStudio pakken als IDE voor Python is de keuze wat breder. Voor "normaal" ontwikkelwerk zou ik VS Code aanraden of PyCharm (meer features, maar ook zwaarder). Daarnaast zijn Jupyter Notebook / Lab zeer goed te gebruiken voor interactieve data analyse. Hier kun je een stukje Python code typen, runnen en meteen de output (bv een plotje) bekijken. Ideaal dus voor data exploratie!

[Voor 19% gewijzigd door Morrar op 28-05-2020 19:41]

Alle reacties


  • RobIII
  • Registratie: december 2001
  • Laatst online: 00:30

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Dit valt een beetje onder Welke programmeertaal moet ik leren?; voor iedereen werkt een andere leermethode het best. Dat verschilt van persoon tot persoon en van cursus tot cursus. Codeacademy is in ieder geval een reputable leerschool en als dat voor jou werkt moet je 't lekker doen. Heel veel meer is er, eigenlijk, niet over te zeggen.

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Roses are red Violets are blue, Unexpected ‘{‘ on line 32.

Over mij


Anoniem: 264566

Topicstarter
RobIII schreef op woensdag 27 mei 2020 @ 10:03:
Dit valt een beetje onder Welke programmeertaal moet ik leren?; voor iedereen werkt een andere leermethode het best. Dat verschilt van persoon tot persoon en van cursus tot cursus. Codeacademy is in ieder geval een reputable leerschool en als dat voor jou werkt moet je 't lekker doen. Heel veel meer is er, eigenlijk, niet over te zeggen.
Ik was wel iets specifieker, dus dacht misschien kan ik nog wat input krijgen.

Acties:
  • Beste antwoord
  • 0Henk 'm!

  • Morrar
  • Registratie: juni 2002
  • Laatst online: 23:39
Puur voor data analyse denk ik dat Python of R wel de meest voor de hand liggende keuzes zijn. Er zijn nogal wat online oorlogen over welke het beste is, maar beiden hebben sowieso veel te bieden. Mijn kijk erop is als volgt:

Python:
- Meer general puprose (bv ook webontwikkeling)
- Meer production ready; logging, testing, packaging
- Eenvoudiger structuur aan te brengen
- Focus op big data, machine learning, minder op statistiek
- Eenvoudig te leren, maar wel een uitdaging om zo efficient mogelijk mee te werken
- Enorme community en ecosysteem

R:
- Volledig gericht op data, statistiek en visualisatie / reporting
- Minder production ready dan Python, wordt veelal academisch gebruikt
- Extreem sterk voor statistiek, maakt inhaalslag op big data / ML
- Syntax iets minder intutief, maar packages al dplyr maken een hoop mogelijk
- Eveneens een grote (academische) community en ecosysteem

Persoonlijk is mijn voorkeur Python, maar ook R heeft sterke kanten. Beiden hebben quirks waar je een hekel aan kunt hebben en valkuilen waar je als beginner in zult vallen.

Codecademy is verder leuk om de basis syntax te leren, maar is niet toegespitst op data analyse. Daarvoor zijn meer gespecialiseerde cursussen te vinden op Coursera of DataCamp etc. Voor R is Roger Peng nog wel een bekende: https://www.cs.upc.edu/~r...adistica/rprogramming.pdf

Voor Python zou ik sowieso ervaring op gaan doen met de volgende packages:
- numpy; efficiente numerieke bewerkingen in Python (omdat Python zelf traag is)
- pandas; data verwerking in tabulaire structuren (DataFrames) - bread and butter package ETL!
- scikit-learn; belangrijkste Machine Learning framework
- scipy / statsmodels; voor als je statistiek nodig hebt.
- matplotlib; voor het maken van plotjes / grafieken (zelf prefereer ik overigens plotnine)

Voor R zijn alle packages uit het tidyverse zeker de moeite waard. Wat bekende packages:
- dplyr; beetje de tegenhanger van pandas voor tabulaire data en SQL-achtige operaties.
- ggplot; zeer sterk package voor grafieken - plotnine is de Python implementatie ervan
- shiny; interactieve dashboarding; leuk maar wordt vrij snel onoverzichtelijk
- rmarkdown; reporting in markdown met R integratie.

Verder zijn er talloze packages in R beschikbaar voor individuele analyses; o.a. RandomForest of bijvoorbeeld forecast voor time-series data. Het is bij R wat meer zoeken naar goede packages, waar het bij Python wat meer is georganiseerd in frame works.

Voor R zou ik sowieso RStudio pakken als IDE voor Python is de keuze wat breder. Voor "normaal" ontwikkelwerk zou ik VS Code aanraden of PyCharm (meer features, maar ook zwaarder). Daarnaast zijn Jupyter Notebook / Lab zeer goed te gebruiken voor interactieve data analyse. Hier kun je een stukje Python code typen, runnen en meteen de output (bv een plotje) bekijken. Ideaal dus voor data exploratie!

[Voor 19% gewijzigd door Morrar op 28-05-2020 19:41]


Anoniem: 264566

Topicstarter
Morrar schreef op donderdag 28 mei 2020 @ 19:34:
Puur voor data analyse denk ik dat Python of R wel de meest voor de hand liggende keuzes zijn. Er zijn nogal wat online oorlogen over welke het beste is, maar beiden hebben sowieso veel te bieden. Mijn kijk erop is als volgt:

Python:
- Meer general puprose (bv ook webontwikkeling)
- Meer production ready; logging, testing, packaging
- Eenvoudiger structuur aan te brengen
- Focus op big data, machine learning, minder op statistiek
- Eenvoudig te leren, maar wel een uitdaging om zo efficient mogelijk mee te werken
- Enorme community en ecosysteem

R:
- Volledig gericht op data, statistiek en visualisatie / reporting
- Minder production ready dan Python, wordt veelal academisch gebruikt
- Extreem sterk voor statistiek, maakt inhaalslag op big data / ML
- Syntax iets minder intutief, maar packages al dplyr maken een hoop mogelijk
- Eveneens een grote (academische) community en ecosysteem

Persoonlijk is mijn voorkeur Python, maar ook R heeft sterke kanten. Beiden hebben quirks waar je een hekel aan kunt hebben en valkuilen waar je als beginner in zult vallen.

Codecademy is verder leuk om de basis syntax te leren, maar is niet toegespitst op data analyse. Daarvoor zijn meer gespecialiseerde cursussen te vinden op Coursera of DataCamp etc. Voor R is Roger Peng nog wel een bekende: https://www.cs.upc.edu/~r...adistica/rprogramming.pdf

Voor Python zou ik sowieso ervaring op gaan doen met de volgende packages:
- numpy; efficiente numerieke bewerkingen in Python (omdat Python zelf traag is)
- pandas; data verwerking in tabulaire structuren (DataFrames) - bread and butter package ETL!
- scikit-learn; belangrijkste Machine Learning framework
- scipy / statsmodels; voor als je statistiek nodig hebt.
- matplotlib; voor het maken van plotjes / grafieken (zelf prefereer ik overigens plotnine)

Voor R zijn alle packages uit het tidyverse zeker de moeite waard. Wat bekende packages:
- dplyr; beetje de tegenhanger van pandas voor tabulaire data en SQL-achtige operaties.
- ggplot; zeer sterk package voor grafieken - plotnine is de Python implementatie ervan
- shiny; interactieve dashboarding; leuk maar wordt vrij snel onoverzichtelijk
- rmarkdown; reporting in markdown met R integratie.

Verder zijn er talloze packages in R beschikbaar voor individuele analyses; o.a. RandomForest of bijvoorbeeld forecast voor time-series data. Het is bij R wat meer zoeken naar goede packages, waar het bij Python wat meer is georganiseerd in frame works.

Voor R zou ik sowieso RStudio pakken als IDE voor Python is de keuze wat breder. Voor "normaal" ontwikkelwerk zou ik VS Code aanraden of PyCharm (meer features, maar ook zwaarder). Daarnaast zijn Jupyter Notebook / Lab zeer goed te gebruiken voor interactieve data analyse. Hier kun je een stukje Python code typen, runnen en meteen de output (bv een plotje) bekijken. Ideaal dus voor data exploratie!
Bedankt hier heb ik wat aan! Zit te twijfelen om deze te doen, om iets dieper te gaan dan gewoon een coursera.

https://www.edx.org/cours...science-and-programming-7

  • Morrar
  • Registratie: juni 2002
  • Laatst online: 23:39
thorthor schreef op donderdag 28 mei 2020 @ 22:32:
[...]


Bedankt hier heb ik wat aan! Zit te twijfelen om deze te doen, om iets dieper te gaan dan gewoon een coursera.

https://www.edx.org/cours...science-and-programming-7
Weinig info over de topics die aan bod komen in die cursus; sowieso ook gericht op algemeen gebruik van Python en niet specifiek voor data analyse. Maar dat kan natuurlijk een prima start zijn.

Vraag is natuurlijk ook waar je nu staat:

- Heb je al enige ervaring met programmeren (in een andere taal) of helemaal niet?

- Wil je vooral leren programmeren met data analyse als extra of juist andersom? M.a.w. waar ligt je focus?

- Hoe zit het met je kennis van statistiek?

- Leer je beter via lesstof of ben je meer een hacker die liever zelf prutst?

Misschien goed om dat soort vragen ook ff te stellen / beantwoorden.

Overigens is alles gratis, dus ik zou ook gewoon beginnen. Codecademy is kort en simpel en in de browser; kun je meteen mee aan de slag! Die EDX cursus kun je ook gratis aan beginnen en vereist hooguit dat je Python werkend krijgt.

Python kun je op Windows het makkelijkste installeren via Anaconda. Is vrij eenvoudig en icm bijvoorbeeld VS Code kun je binnen het uur aan de slag. Merk je snel genoeg of je het leuk vindt.

Dus: gewoon beginnen is zeker ook een optie ;)

[Voor 22% gewijzigd door Morrar op 28-05-2020 23:01]

Pagina: 1


Apple iPhone 12 Microsoft Xbox Series X LG CX Google Pixel 5 Black Friday 2020 Samsung Galaxy S20 4G Sony PlayStation 5 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2020 Hosting door True