Ongeveer 3 jaar aan het werk als analist; SQL gebruik ik bijna dagelijks, maar meestal alleen om data bij elkaar te krijgen. Daarna gaat het direct R of Python in om een analyse of model mee te voeden. Geavanceerde data prep dingen zou ik liever niet in SQL doen, tenzij het niet anders kan.
In SQL doe ik meestal alleen 1) het aan elkaar joinen van tabellen 2) het selecteren van kolommen cases, o.a. door samplen van grote datasets 3) soms een enkele hercodering of vullen van ontbrekende waardes 4) berekenen van de meest eenvoudige statistieken, zoals tellingen of gemiddelden. Dit zijn zaken die denk ik in de meeste SQL cursussen wel aan bod komen, zie bijvoorbeeld codecademy.
Ik kende SQL overigens al van eerdere werkzaamheden als webdeveloper. Voor mij werkte het overigens het beste om er gewoon mee aan de slag te gaan. Installeer bijvoorbeeld PostgreSQL en maak een testdatabase. Laadt wat publiek beschikbare data (bijvoorbeeld CBS, Kaggle of KNMI data) en ga daarop oefenen.
Wil je echt dieper de analyse kant op dan zou ik R of Python aanraden. Python is wat breder inzetbaar en R is wat verder qua statistische modellen (mijn mening in het kort).
Tools als Tableau (prijzig) en PowerBI zijn vooral geschikt om snel descriptieve statistieken en dashboards mee te maken (vind management leuk). Voor modelleerwerk heb je er weinig aan. In Python (bv Jupiyter notebooks) en R (bv R Markdown en Shiny) kun je ook rapportages en dashboards bouwen, maar dat is (veel) meer werk.
Overigens zijn tools als Knime, RapidMiner en SPSS Modeller ook nog het overwegen waard als je een visuele modelleer ongeving zoekt. Deze kun je ook vrij eenvoudig koppelen aan relationele databases.
[
Voor 25% gewijzigd door
Morrar op 28-08-2017 01:18
]