[PHP] http_referer

Pagina: 1
Acties:
  • 1.186 views sinds 30-01-2008
  • Reageer

Onderwerpen


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Beste mensen,

Ik gebruik voor een zelfgemaakte statistiekentool op een specifieke subpagina van mn site $_SERVER['HTTP_REFERER'].

Ik weet dat veel browsers e.d. HTTP_REFERER niet (goed) doorgeven en misschien kan een site zelf ook wel zorgen dat ie niet in http_referer doorgegeven wordt, dat weet ik niet, maar niet relevant.

De pagina waarop ik de referer opsla, kan maar via 2 andere paginas bezocht worden. Een pagina binnen hetzelfde domein en een pagina op een ander domein. Ik weet ook zeker dat 99% van de bezoekers via die 2 paginas komen.

Nu blijkt dat maar 25% van alle referers opgeslagen wordt en de overige 75% leeg is.
Dit vind ik erg vreemd. Als ik zelf het test met Explorer en Firefox werkt het prima. Zou het dan kunnen zijn dan 75% van de mensen die mijn site bezoeken rare browsers hebben of extreem oude versies die de referer niet opslaan? Dat kan ik me haast niet voorstellen. (het gaat om +/- 300 bezoekers per dag) Het is ook niet zo dat de link met javascript geopend wordt ofzo.

Iemand een idee hoe dit komt? Ik mag toch aannemen dat 90% van de bezoekers een redelijk actuele versie van explorer of firefox heeft en niks raar ingesteld heeft. Het publiek is trouwens gemiddeld nederland, dus geen typische IT-ers ofzo

Acties:
  • 0 Henk 'm!

  • AtleX
  • Registratie: Maart 2003
  • Niet online

AtleX

Tyrannosaurus Lex 🦖

Veel firewalls, ao ZoneAlarm als ik het mij goed herinner, halen ook referers uit requests.

Sole survivor of the Chicxulub asteroid impact.


Acties:
  • 0 Henk 'm!

  • gorgi_19
  • Registratie: Mei 2002
  • Laatst online: 20-09 08:50

gorgi_19

Kruimeltjes zijn weer op :9

Een firewall kan de boel ook blokkeren.

Digitaal onderwijsmateriaal, leermateriaal voor hbo


Acties:
  • 0 Henk 'm!

Verwijderd

Firewall of bot's misschien?

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ik wist neit dat firewalls ook http_referer leegt. Crap zeg wat irritant!

Acties:
  • 0 Henk 'm!

  • Snake
  • Registratie: Juli 2005
  • Laatst online: 07-03-2024

Snake

Los Angeles, CA, USA

Verwijderd schreef op maandag 23 juli 2007 @ 11:27:
Ik wist neit dat firewalls ook http_referer leegt. Crap zeg wat irritant!
Inderdaad, soms wel handig zo.

Maar waarom werk je niet met een sessie? Alleen toegang tot die pagina als je via die of die pagina, waar je dan die sessie creëert, binnenkomt?

[ Voor 6% gewijzigd door Snake op 23-07-2007 11:40 ]

Going for adventure, lots of sun and a convertible! | GMT-8


Acties:
  • 0 Henk 'm!

  • Grijze Vos
  • Registratie: December 2002
  • Laatst online: 28-02 22:17
Bookmarks heb je ook nog natuurlijk. (naast firewalls.)

[ Voor 20% gewijzigd door Grijze Vos op 23-07-2007 11:48 ]

Op zoek naar een nieuwe collega, .NET webdev, voornamelijk productontwikkeling. DM voor meer info


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Snake schreef op maandag 23 juli 2007 @ 11:40:
[...]
Maar waarom werk je niet met een sessie? Alleen toegang tot die pagina als je via die of die pagina, waar je dan die sessie creëert, binnenkomt?
Omdat het ook vanaf een heel ander domein komt. Is het dan mogelijk een sessie te maken bij een domein X en vanaf domein Y bij die sessie te komen?

Acties:
  • 0 Henk 'm!

  • gorgi_19
  • Registratie: Mei 2002
  • Laatst online: 20-09 08:50

gorgi_19

Kruimeltjes zijn weer op :9

Verwijderd schreef op maandag 23 juli 2007 @ 13:24:
[...]


Omdat het ook vanaf een heel ander domein komt. Is het dan mogelijk een sessie te maken bij een domein X en vanaf domein Y bij die sessie te komen?
Nee

Digitaal onderwijsmateriaal, leermateriaal voor hbo


Acties:
  • 0 Henk 'm!

  • marko77
  • Registratie: Februari 2002
  • Laatst online: 06-05 19:41
Je zou je logfiles kunnen nalopen (mits je daarbij kunt komen) en kijken wat voor user agents er gebruikt zijn.

Mijn rig


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
marko77 schreef op maandag 23 juli 2007 @ 13:31:
Je zou je logfiles kunnen nalopen (mits je daarbij kunt komen) en kijken wat voor user agents er gebruikt zijn.
En dan? Matchen op UserAgent :X Dat gaat natuurlijk never nooit niet werken ;)

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Fuzzillogic
  • Registratie: November 2001
  • Laatst online: 01-07 22:34
RobIII schreef op maandag 23 juli 2007 @ 13:32:
[...]

En dan? Matchen op UserAgent :X Dat gaat natuurlijk never nooit niet werken ;)
Spiders van SE's zoals googlebot geven ook geen referrer mee, maar kunnen wel voor een groot deel van de hits verantwoordelijk zijn. Door te filteren met een combinatie van whitelist/blacklist kun je vrij aardig alleen de echte browsers eruit pikken, en dan zul je zien dat het percentage referrers veel hoger is. Daarbij is het imo wel schijtirritant dat veel bots ook onder de Mozilla/4.0 of Mozilla/5.0-vlag spideren. :(

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Fuzzillogic schreef op maandag 23 juli 2007 @ 13:37:
[...]

Spiders van SE's zoals googlebot geven ook geen referrer mee, maar kunnen wel voor een groot deel van de hits verantwoordelijk zijn. Door te filteren met een combinatie van whitelist/blacklist kun je vrij aardig alleen de echte browsers eruit pikken, en dan zul je zien dat het percentage referrers veel hoger is. Daarbij is het imo wel schijtirritant dat veel bots ook onder de Mozilla/4.0 of Mozilla/5.0-vlag spideren. :(
Nee dat kan niet. Ik sla de referer pas op na een offerteaanvraag op de betreffende paginas. En ik denk dat ons product niet heel interessant is voor een bot :P Het is dus niet zo dat elke willekeurige bezoeker direct opgeslagen wordt.

Acties:
  • 0 Henk 'm!

  • japsai
  • Registratie: Augustus 2003
  • Niet online
Misschien niet heel elegant, maar je zou die twee 'referring' pagina's een query variabele mee kunnen laten geven à la ?referrer=domain1 (GET of als hidden form variabele).

Acties:
  • 0 Henk 'm!

  • BasieP
  • Registratie: Oktober 2000
  • Laatst online: 22-07-2024
Fuzzillogic schreef op maandag 23 juli 2007 @ 13:37:
[...]

Spiders van SE's zoals googlebot geven ook geen referrer mee, maar kunnen wel voor een groot deel van de hits verantwoordelijk zijn. Door te filteren met een combinatie van whitelist/blacklist kun je vrij aardig alleen de echte browsers eruit pikken, en dan zul je zien dat het percentage referrers veel hoger is. Daarbij is het imo wel schijtirritant dat veel bots ook onder de Mozilla/4.0 of Mozilla/5.0-vlag spideren. :(
als je iets als browscap.ini hebt kan je heel simpel zien of iets een crawler is.

if ($hit['crawler'] = 1) {
...
}

sowieso is dat wel handig voor stats...

This message was sent on 100% recyclable electrons.

Pagina: 1