Beste tweakers,
Ik ben bezig met een statistieken systeem, nu heb ik mezelf de volgende eisen gesteld welke uit de database moeten worden uitgelezen:
Opties:
# Per dag/Maand
# Unieke bezoekers
# Totaal aantal views
# Refferer's
# Zoekmachine bot's/crawlers
Veel meer informatie wil ik op dit moment niet opslaan. Voor deze informatie heb ik de volgende tabbellen:
Stats_unique bevat het IP. Ip_id uit de navolgende tabellen is de link terug naar Stats_unique. Via de timestamp kan ik dus in de query uitmaken of ik ze van een bepaalde datum wil of van een bepaalde maand. Iedere maand worden de oude statistieken gedumpt naar een andere tabel/xml file om zo de SQL server minder tot last te zijn, zo kan ik dus ook diep terug in de tijd.
Nu wil ik graag van jullie weten of deze tabellen goed zijn, met oog op performance en de eisen die ik mezelf heb gesteld. Ik sta altijd open voor kritiek dus brand los.
Vriendelijke Groet,
Ik ben bezig met een statistieken systeem, nu heb ik mezelf de volgende eisen gesteld welke uit de database moeten worden uitgelezen:
Opties:
# Per dag/Maand
# Unieke bezoekers
# Totaal aantal views
# Refferer's
# Zoekmachine bot's/crawlers
Veel meer informatie wil ik op dit moment niet opslaan. Voor deze informatie heb ik de volgende tabbellen:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
| Stats_unique +----+---------------------+ | id | IP | +----+---------------------+ | 1 | 84.104.141.94 | +----+---------------------+ | 51 | 81.68.193.58 | +----+---------------------+ | 52 | 840.104.141.950 | +----+---------------------+ Stats_hits +----+-------+---------------------+ | id | ip_id | times | +----+-------+---------------------+ | 50 | 1 | 2006-04-22 15:55:36 | +----+-------+---------------------+ | 51 | 51 | 2006-04-22 15:56:12 | +----+-------+---------------------+ | 52 | 1 | 2006-04-22 15:56:41 | +----+-------+---------------------+ Stats_refferer +----+-------+---------------------+ | id | ip_id | refferer | +----+-------+---------------------+ | 50 | 1 | - | +----+-------+---------------------+ | 51 | 51 | tweakers.net | +----+-------+---------------------+ | 52 | 1 | google.nl | +----+-------+---------------------+ Stats_crawler +----+-------+---------------------+ | id | ip_id | crawler | +----+-------+---------------------+ | 50 | 1 | - | +----+-------+---------------------+ | 51 | 51 | googlebot | +----+-------+---------------------+ | 52 | 52 | msnbot | +----+-------+---------------------+ |
Stats_unique bevat het IP. Ip_id uit de navolgende tabellen is de link terug naar Stats_unique. Via de timestamp kan ik dus in de query uitmaken of ik ze van een bepaalde datum wil of van een bepaalde maand. Iedere maand worden de oude statistieken gedumpt naar een andere tabel/xml file om zo de SQL server minder tot last te zijn, zo kan ik dus ook diep terug in de tijd.
Nu wil ik graag van jullie weten of deze tabellen goed zijn, met oog op performance en de eisen die ik mezelf heb gesteld. Ik sta altijd open voor kritiek dus brand los.
Vriendelijke Groet,