Ik ben bezig met een script wat per pagehit allerlei gegevens gaat opslaan, Nu is het natuurlijk vreselijk interesant om alle views op te slaan, maar dat vreet natuurlijk al snel veel te veel ruimte.
Ik had bedacht dat het waarschijnlijk het zo veel waard is om naar gelang de groei van het aantal bezoekers in verhouding steeds minder data op te slaan, (zeg maar een soort van steekproefen), maar ik heb geen idee hoe ik dat het beste (en het liefst een beetje dynamisch) kan bouwen.
Stel dat ik 100 views heb, dan is het interesant om van ongeveer 15 bezoekers alle gegevens te weten. (15%)
Als ik echter 100000 views heb is het natuurlijk niet interesant om daarvan (15%) procent op te slaan. dat zouden immers 15000 records zijn.
Ik dacht dat een omgekeerd logarithmische steekproef veel beter zou zijn, dan heb je de volgende staffel:
Maar dat is natuurlijk wel weer erg weinig, en niet erg aanpasbaar (per site bijvoorbeeld)
Heeft iemand hier toevallig als eens over nagedacht? ik kan me voorstellen dat een wiskundige hier binnen no time een variabele (x,y) formule bij heeft bedacht waarbij het aantal steekproefen aanpasbaar is.
Ik had bedacht dat het waarschijnlijk het zo veel waard is om naar gelang de groei van het aantal bezoekers in verhouding steeds minder data op te slaan, (zeg maar een soort van steekproefen), maar ik heb geen idee hoe ik dat het beste (en het liefst een beetje dynamisch) kan bouwen.
Stel dat ik 100 views heb, dan is het interesant om van ongeveer 15 bezoekers alle gegevens te weten. (15%)
Als ik echter 100000 views heb is het natuurlijk niet interesant om daarvan (15%) procent op te slaan. dat zouden immers 15000 records zijn.
Ik dacht dat een omgekeerd logarithmische steekproef veel beter zou zijn, dan heb je de volgende staffel:
code:
1
2
3
4
5
| views, steekproefen 10 , 1 100, 2 1000, 3 10000, 4 |
Maar dat is natuurlijk wel weer erg weinig, en niet erg aanpasbaar (per site bijvoorbeeld)
Heeft iemand hier toevallig als eens over nagedacht? ik kan me voorstellen dat een wiskundige hier binnen no time een variabele (x,y) formule bij heeft bedacht waarbij het aantal steekproefen aanpasbaar is.
openkat.nl al gezien?