Het volgende, op een site houd ik per bezoeker bij welke pagina's hij bezoekt in een sessie. Dat wordt vervolgens opgeslagen in een sessietabel, en dat ziet er ongeveer zo uit:
22-08-2005 11:13: 2,12,24,12,12,45,85,65,12,45
22-08-2005 12:12: 2,123,112,2,12,24,46,96,54,87,54
22-08-2005 13:00: 114,2,123,3,4,14,15,32,12,45,78
22-08-2005 13:01: 2,12,15,45,78,95,54
Van deze gegevens heb ik dus een hele rits. Om nu de navigatie van mensen te analyseren wil ik op zoek naar patronen binnen de navigatie. In bovenstaand lijstje komt bijvoorbeeld "2,12" 3 keer voor.
Ik heb zelf hetvolgende bedacht om deze gegevens te verwerken, maar dat duurt écht heel lang.
Uit alleen al de 1e sessie haal ik de volgende reeksen (met max van 4 pagina's):
2,12
12,24
24,12
12,12
12,45
45,85
85,65
65,12
2,12,24
12,24,12
24,12,12
12,45,85
45,85,65
85,65,12
65,12,45
2,12,24,12
12,24,12,12
24,12,12,45
12,12,45,85
12,45,85,65
45,85,65,12
85,65,12,45
Nu wil ik per sessie gaan kijken of er nieuwe combi's zijn, en als er een al in mn lijstje staat deze gaan tellen. Zo wil ik kijken welke navigatiepatronen er vaker voorkomen. Ik heb dit zelf wel eens in PHP gemaakt, maar dat is erg traag (gewoon alles afgaan). Weet iemand misschien een slimere manier of wiskundige truuk om deze reeksen te analyseren?
22-08-2005 11:13: 2,12,24,12,12,45,85,65,12,45
22-08-2005 12:12: 2,123,112,2,12,24,46,96,54,87,54
22-08-2005 13:00: 114,2,123,3,4,14,15,32,12,45,78
22-08-2005 13:01: 2,12,15,45,78,95,54
Van deze gegevens heb ik dus een hele rits. Om nu de navigatie van mensen te analyseren wil ik op zoek naar patronen binnen de navigatie. In bovenstaand lijstje komt bijvoorbeeld "2,12" 3 keer voor.
Ik heb zelf hetvolgende bedacht om deze gegevens te verwerken, maar dat duurt écht heel lang.
Uit alleen al de 1e sessie haal ik de volgende reeksen (met max van 4 pagina's):
2,12
12,24
24,12
12,12
12,45
45,85
85,65
65,12
2,12,24
12,24,12
24,12,12
12,45,85
45,85,65
85,65,12
65,12,45
2,12,24,12
12,24,12,12
24,12,12,45
12,12,45,85
12,45,85,65
45,85,65,12
85,65,12,45
Nu wil ik per sessie gaan kijken of er nieuwe combi's zijn, en als er een al in mn lijstje staat deze gaan tellen. Zo wil ik kijken welke navigatiepatronen er vaker voorkomen. Ik heb dit zelf wel eens in PHP gemaakt, maar dat is erg traag (gewoon alles afgaan). Weet iemand misschien een slimere manier of wiskundige truuk om deze reeksen te analyseren?
Koop of verkoop je webshop: ecquisition.com