google indexeer bot

Pagina: 1
Acties:

  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
Wij hebben een forum waar alleen geregistreerde kunnen lezen en posten.
Verder hebben we een forumgedeelte genaamd 'modjes only' dat alleen zichtbaar is voor modjes en beheerders.
Het viel op dat een 'gast' alle forum-onderwerpen aan het doorzoeken was en zelfs op 'modjes only' gedeelte kwam.
We hebben direkt het IP getraced en het bleek dat het om een Google-bot ging.

Op zich prima dat google ons forum indexeerd maar hoe kan het botje op het afgeschermde gedeelte komen?

  • pven
  • Registratie: Oktober 1999
  • Niet online
Blijkbaar is het toch niet goed afgeschermd? :Y)

Heb je al op Google gekeken wat je eraan kunt doen om te voorkomen dat hij bepaalde pagina's indexeert?

|| Marktplaats-meuk. Afdingen mag! ;-) || slotje.com for sale || Dank pven! ||


  • Evos
  • Registratie: Januari 2002
  • Nu online
Die kun je doen met robot.txt

http://www.robotstxt.org/wc/norobots.html

En zoals hier boven hier staat zelfs iets over geschreven op de google site

[ Voor 35% gewijzigd door Evos op 18-09-2005 17:51 ]


  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
pven schreef op zondag 18 september 2005 @ 17:49:
Blijkbaar is het toch niet goed afgeschermd? :Y)

Heb je al op Google gekeken wat je eraan kunt doen om te voorkomen dat hij bepaalde pagina's indexeert?
Het afgeschermde gedeelte is echt afgeschermt voor andere gebruikers dan modjes.

  • MisterICE
  • Registratie: April 2004
  • Laatst online: 12-09-2025
Waar heb je gekeken, apache logs ?

Het kan best zijn dat hij alleen de url aanroept maar telkens een access denied krijgt

  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
MisterICE schreef op zondag 18 september 2005 @ 17:53:
Waar heb je gekeken, apache logs ?

Het kan best zijn dat hij alleen de url aanroept maar telkens een access denied krijgt
Het forum is van messageboard.nl

Het 'modjes ony' gedeelte is niet zichtbaar voor gewone gebruikers. Dus lijkt me dat het botje helemaal niet de url kan aanroepen, hij ziet het helemaal niet?

  • Osiris
  • Registratie: Januari 2000
  • Niet online
MisterICE schreef op zondag 18 september 2005 @ 17:53:
Waar heb je gekeken, apache logs ?

Het kan best zijn dat hij alleen de url aanroept maar telkens een access denied krijgt
Mwah, afgeschermde fora zijn meestal ookgewoon niet zichtbaar, net zoals hier op GoT.. Dus in principe zou de Google-bot er geen weet van mogen hebben neem ik aan.

  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
interesante pagina. Maar het botje mag best indexeren. Vind het alleen heel merkwaardig dat hij ook op een 'onzichbaar' afgeschermd gedeelte kan komen.

  • pven
  • Registratie: Oktober 1999
  • Niet online
Heb je al gekeken of er daadwerkelijk iets met Google te vinden is wat niet voor een-ieder beschikbaar zou mogen zijn?

|| Marktplaats-meuk. Afdingen mag! ;-) || slotje.com for sale || Dank pven! ||


  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Net op m'n eigen forum gekeken. Met FireFox ingelogt, en een link naar een Members-Only onderwerp gekopieerd, daarna met Explorer (niet aangemeld, dus als gast) de link geopent.

Krijg dus netjes het inlog scherm te zien in IE, terwijl ik via de Admin in FireFox zie dat er een gast in het Members-Only gedeelte zit.

Google zal dus ook een inlog-pagina zien lijtk me.

Alleen de vraag, hoe komt google aan de url die afgeschermd is? Kan op een publieke pagina natuurlijk op verwezen worden.

[ Voor 16% gewijzigd door RaZ op 18-09-2005 17:59 ]

Ey!! Macarena \o/


  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Artwido schreef op zondag 18 september 2005 @ 17:57:
[...]


interesante pagina. Maar het botje mag best indexeren. Vind het alleen heel merkwaardig dat hij ook op een 'onzichbaar' afgeschermd gedeelte kan komen.
Als er ergens een linkje staat naar zo'n URL dan kan hij dus naar die URL gaan en die pagina indexeren, of dat nu nuttig is of niet (een foutmelding).

  • DeMoN
  • Registratie: Maart 2001
  • Laatst online: 06-01 23:13

DeMoN

Pastafari

Het kan ook nog zijn dat jouw beveiliging ook naar de user agent kijkt en als hij als user agent de googlebot ziet langskomen hem doorlaat.

nieuws: Omzeilen van registratie en betaling van sites dankzij Google

[ Voor 3% gewijzigd door DeMoN op 18-09-2005 18:00 ]

Gamertag: Cosmicv0id
"Het woord Gods is voor mij niets meer dan een expressie en het product van menselijke zwakheid. De Bijbel is een verzamelwerk van legendes die achtenswaardig zijn maar ook primitief en kinderachtig.'' - Albert Einstein


  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
DeMoN schreef op zondag 18 september 2005 @ 18:00:
Het kan ook nog zijn dat jouw beveiliging ook naar de user agent kijkt en als hij als user agent de googlebot ziet langskomen hem doorlaat.

nieuws: Omzeilen van registratie en betaling van sites dankzij Google
lekker lek dus.

Verwijderd

Erkens schreef op zondag 18 september 2005 @ 17:59:

Als er ergens een linkje staat naar zo'n URL dan kan hij dus naar die URL gaan en die pagina indexeren, of dat nu nuttig is of niet (een foutmelding).
Kleine aanvulling hierop: als je ervoor zorgt dat er bij zo'n foutmelding ook een zinvolle HTTP status code in de headers wordt meegestuurd (401 of misschien 403), neemt Google die pagina's waarschijnlijk ook niet op. Dat zou je moeten uitzoeken.

  • Artwido
  • Registratie: Maart 2001
  • Laatst online: 08-02 09:08
Erkens schreef op zondag 18 september 2005 @ 17:59:
[...]

Als er ergens een linkje staat naar zo'n URL dan kan hij dus naar die URL gaan en die pagina indexeren, of dat nu nuttig is of niet (een foutmelding).
Er staat nergens een linkje naar dit gedeelte, ook niet in een topic ofzo gebruikt.
Maar het antwoord van DeMoN verklaart een hoop. :)

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Artwido schreef op zondag 18 september 2005 @ 18:07:
[...]


Er staat nergens een linkje naar dit gedeelte, ook niet in een topic ofzo gebruikt.
Maar het antwoord van DeMoN verklaart een hoop. :)
hoe weet je dat zo zeker? weet je hoe groot internet is? Het is _altijd_ mogelijk dat er ergens een linkje staat, nu is die kans vrij klein, maar hij is er wel.

Verwijderd

Dat kun je natuurlijk nagaan door met Google te zoeken naar link:http://url
Pagina: 1