BramVroy schreef op zaterdag 15 augustus 2020 @ 16:53:
Je begrijpt me verkeerd. Ik stel niet in vraag of de steekproef representatief is (hoewel ik daar ook grote twijfels over heb), maar wel dat de dataset te klein is om een representatief resultaat te krijgen door een gemiddelde te nemen. Dat zijn twee verschillende dingen. Ook met normaal-verdeelde data is dat een probleem, los van je skew en kurtosis. Zelfs bij een representatief sample, moet je erg oppassen met hoe je dat presenteert omdat je data punt (of zelfs bin) te weinig values hebt. Het probleem dat ik heb is, samengevat, dat het effect van schaarse data voelbaarder is in een gemiddelde dan in een mediaan. Je zal bij een (te klein) sample vaak verder van het gemiddelde van de volledige populatie zitten dan van de mediaan.
Als je dataset te klein is en je bang bent voor een niet representatief sample, dan heb je zowel met mean als median een probleem met weergave. Het wisselen van mean naar median levert dan niets op, behalve als je onderliggende data niet normaal verdeeld is. Dat is hier geen probleem, want dat heb ik dus gecheckt

Wel met de disclaimer uiteraard dat we er vanuit gaan dat de populatie-data dezelfde onderliggende verdeling heeft, al heb ik geen redenen om daar aan te twijfelen gezien het type data waar we mee te maken hebben.
Let wel, we hebben het hier niet over een n=3 oid, maar over 15 meetpunten en dat lijkt me voor zo'n artikel als deze voldoende om gewoon het gemiddelde te gebruiken, zeker omdat er best wel een rudimentaire normaalverdeling in is te ontdekken. Een gemiddelde heeft dan ook de voorkeur, omdat het voor de gemiddelde lezer gemakkelijker te interpreteren is.
Nee, ideaal is dit niet, maar kom op, dit is geen wetenschappelijk paper.
Al ken ik ook wetenschappers die roepen "N=3 is voldoende want dan kun je een T-toets doen"
Een mediaan is zeker ook niet wetenschappelijk de metriek bij uitstek, en ik zou als wetenschapper gewoon geen uitspraken doen over dit soort sample vanwege de schaarste. Ik heb reeds menig reviewer over de vloer gehad die me op hetzelfde probleem wees m.b.t. de grootte van je sample tegenover je populatie en hoe je dit moet weergeven. Maar als je op een populaire manier aan lezers toch informatie moet geven, is een mediaan de betere keuze tegenover het gemiddelde in dit geval. IQR zou misschien inderdaad de beste optie zijn, maar dat is bij Jan Modaal niet gekend vandaar dat ik mediaan voorstel.
Klopt, IQR kennen mensen niet, maar een range wel, en die staat al in het artikel en nota bene in de kop