In een review als reviews: De MacBook Pro 13" en 15" tegen elkaar afgezet valt me op dat jullie vermelden dat benchmarks bijvoorbeeld "driemaal gedraaid zijn" (p. 3) of "meerdere malen uitgevoerd zijn" (p. 5) ten behoeve van wat jullie zelf nauwkeurigheid noemen. Zijn de scores die daar staan dan ook gemiddelden van die drie getallen, of is er voor iets anders gekozen?
Zo'n gemiddelde schiet je namelijk niet heel veel mee op: er is geen foutenmarge bij vermeld. Voor mij als lezer is het nu onmogelijk te beoordelen of het gemiddelde is bepaald uit allerlei uitschieters naar boven en beneden met bijbehorend hoge standaarddeviatie, of dat het apparaat juist heel erg betrouwbaar is met σ vrijwel nul.
Een tweede aspect is dat de scores soms marginaal uit elkaar liggen, en toch wordt gezegd dat A beter is dan B. Dat kan inderdaad waar zijn, maar dan moeten de foutenmarges elkaar ook niet overlappen wil je die conclusie kunnen trekken (3300 +/- 100 en 3350 +/- 70 zijn bijvoorbeeld niet significant verschillend).
Al met al: kunnen er in het vervolg foutenmarges bij dergelijke gemiddelden vermeld worden wanneer ze gebruikt worden binnen een review? Het zou de reviews een stuk "harder" maken, met name om als lezer onderlinge scores en resultaten met elkaar te kunnen vergelijken.
Zo'n gemiddelde schiet je namelijk niet heel veel mee op: er is geen foutenmarge bij vermeld. Voor mij als lezer is het nu onmogelijk te beoordelen of het gemiddelde is bepaald uit allerlei uitschieters naar boven en beneden met bijbehorend hoge standaarddeviatie, of dat het apparaat juist heel erg betrouwbaar is met σ vrijwel nul.
Een tweede aspect is dat de scores soms marginaal uit elkaar liggen, en toch wordt gezegd dat A beter is dan B. Dat kan inderdaad waar zijn, maar dan moeten de foutenmarges elkaar ook niet overlappen wil je die conclusie kunnen trekken (3300 +/- 100 en 3350 +/- 70 zijn bijvoorbeeld niet significant verschillend).
Al met al: kunnen er in het vervolg foutenmarges bij dergelijke gemiddelden vermeld worden wanneer ze gebruikt worden binnen een review? Het zou de reviews een stuk "harder" maken, met name om als lezer onderlinge scores en resultaten met elkaar te kunnen vergelijken.