Hoe vindt Google nieuwe site(s) zonder links?

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Misschien een beetje een vreemde titel, maar hoe presteert Google het om site te indexeren waarvan geen publieke link beschikbaar is?

Voor het testen van nieuwe hosting opties heb ik een aantal VPS-en afgenomen en ben daarop aan het testen gegaan. Hierop heb ik een kopie (via Directadmin) van een user van mij geplaatst en een subdomein van mij (user-hoster.mijndomein.nl) aan het pakket gekoppeld. Op die manier kon ik de prestatie van de site op de betreffende VPS testen.

Echter nu heeft Google het gepresteerd om deze site te indexeren, terwijl ik de links alleen maar voor mezelf gebruikt hebt.

Hetzelfde geld voor een ander hostingpakket waar ik vorige week pas een website op heb gezet. Hier gaat het om een simpele (geautomatiseerde) Wordpress installatie. Deze heb ik alleen naar nog een persoon meer gestuurd, maar deze is verder ook niet publiekelijk bekend gemaakt.

Zelf zat ik te denken dat Google het adres achterhaalt heeft omdat er de Google Analytics scripts zijn toegevoegd (echter niet van het betreffende user-hoster.mijndomein.nl, maar van websiteklant.nl). Echter dan zou ik verwachten de andere test VPS-en ook geïndexeerd zouden zijn, en ten tweede heeft de 2e website geen Google Analytics.

Dus dan blijft het voor mij toch een raadsel hoe en op welke basis de betreffende sites heeft gevonden. Nu is het an sich geen big issue, maar ik ben toch wel benieuwd hoe deze adressen bij Google terecht zijn gekomen.

Acties:
  • 0 Henk 'm!

  • I-King
  • Registratie: Maart 2003
  • Laatst online: 12:23
Wordpress kan zich bij Google aanmelden voor zover ik weet.

Edit: Mmm ik ben er nu toch niet meer zeker van. Dacht dat het een optie bij installatie was, maar dat is blijkbaar alleen of Google mag indexeren.

[ Voor 56% gewijzigd door I-King op 26-04-2012 13:06 ]


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Dat is een robots.txt inderdaad, maar die heb ik bij beide site niet in gebruik (TYPO3 en Wordpress).

Dus dan blijft het nog een raadsel.

Acties:
  • 0 Henk 'm!

  • Xanland
  • Registratie: Oktober 2007
  • Laatst online: 09:36
Welke browser heb je momenteel in gebruik?

RobIII: Ik probeer als ik wil stoppen met mijn auto ook altijd de sigarettenaansteker, de airco, 3 radioknoppen en de binnenverlichting en dan de rem :P


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Dat zou inderdaad ook nog kunnen, ik gebruik namelijk Chrome op XP/W7 en Android. Daarbij maak ik ook gebruik van synchronisatie van bookmarks, geschiedenis etc.

Zou het van daaruit kunnen komen?

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
bartbh schreef op donderdag 26 april 2012 @ 19:50:
Zou het van daaruit kunnen komen?
Analytics, "domain check" (anti-virus gedoe), google-toolbar (pagerank gedoe e.d.) en zo zijn er nog wel wat zaken die allemaal richting Google etc. gaan waarbij je domein/referer zal "lekken". En ik zou er raar van staan kijken als ze die info niet gebruiken om hun crawler van nieuwe url's te voorzien. Als je niet wil dat er iets gespiderd wordt zet je 't achter een login, ip-restrictie, intern-netwerk, whatever. Anders wordt 't geheid geïndexeerd op den duur.

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • McCandless
  • Registratie: April 2011
  • Laatst online: 12-05-2021

McCandless

I'm supertramp

Volgens keer bij een Wordpress-site even een noindex en nofollow plugin en een under construction plugin downloaden, dat zou moeten helpen.

Acties:
  • 0 Henk 'm!

  • KeRsTmAnNeKe
  • Registratie: Februari 2001
  • Laatst online: 17-09 14:04
robots.txt met Disallow / in de root?

Acties:
  • 0 Henk 'm!

  • Compizfox
  • Registratie: Januari 2009
  • Laatst online: 17-09 21:30

Compizfox

Bait for wenchmarks

Google DNS?

Gewoon een heel grote verzameling snoertjes


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Het punt is niet dat ik het erg vind dat Google de sites heeft geïndexeerd, als ik dat echt niet wil moet ik er inderdaad maar een robots.txt of andere restrictie op zetten.

Was vooral benieuwd via welke manieren Google dat nog meer zou kunnen achterhalen. In deze gevallen zal het wel via Chrome en/of Google Analytics komen, aangezien ik Google DNS, pagerank, domaincheck of andere tools (nog) niet heb gebruikt op deze domeinen.

Acties:
  • 0 Henk 'm!

  • Boelie-Boelie
  • Registratie: November 2004
  • Laatst online: 26-09-2020
Analytics en Search staan volledig los van elkaar, dat hebben ze diverse malen nadrukkelijk aangegeven op het Youtube-kanaal van Google Analytics. Die toolbar, da's misschien een ander verhaal. Maar ook daar zit het 'm hoogstwaarschijnlijk niet in...

Want bij WordPress 'Instellingen > Schrijven' staat bij de onderste optie:
Update services
Als je een nieuw bericht publiceert, zal WordPress automatisch de volgende site update services inlichten. Bezoek Update Services op de Codex voor meer informatie. Meerdere service-URLs scheiden met een nieuwe regel.
M.a.w. als je de privacysettings bij 'Instellingen > Privacy' op 'openbaar' zet en de updateservice laat staan, helpt WordPress je bij het wereldkundig maken van je site met die updateservice.

Cogito ergo dubito


Acties:
  • 0 Henk 'm!

  • Jasper
  • Registratie: Juni 1999
  • Laatst online: 17-09 18:13
bartbh schreef op donderdag 26 april 2012 @ 19:50:
Dat zou inderdaad ook nog kunnen, ik gebruik namelijk Chrome op XP/W7 en Android. Daarbij maak ik ook gebruik van synchronisatie van bookmarks, geschiedenis etc.
Het zal mij niets verbazen dat het door het gebruik van Chrome komt ja.

Acties:
  • 0 Henk 'm!

  • IIsnickerII
  • Registratie: December 2010
  • Laatst online: 16-06 14:41

IIsnickerII

Docent Software Dev

Just curious, maar waarom zou je eigenlijk "niet" willen dat google jou website spidert? Je wilt toch wel bezoekers hebben, of niet?

Kast: Cooler Master Q330L V2 | CPU: AMD Ryzen 7 7800X3D | CPU Cooler: Thermalright Peerless Assassin 120 SE | MEM: Corsair Vengeance 2x 16GB @ 6000MHz | GPU: XFX Speedster MERC 6800XT | SSD: Samsung 980 PRO 1TB | Scherm: Samsung LC24RG50FQU 144hz


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
IIsnickerII schreef op zaterdag 28 april 2012 @ 12:38:
Just curious, maar waarom zou je eigenlijk "niet" willen dat google jou website spidert? Je wilt toch wel bezoekers hebben, of niet?
Omdat 't een test betrof:
bartbh schreef op donderdag 26 april 2012 @ 13:01:
Voor het testen van nieuwe hosting opties heb ik een aantal VPS-en afgenomen en ben daarop aan het testen gegaan. Hierop heb ik een kopie (via Directadmin) van een user van mij geplaatst en een subdomein van mij (user-hoster.mijndomein.nl) aan het pakket gekoppeld. Op die manier kon ik de prestatie van de site op de betreffende VPS testen.

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • likewise
  • Registratie: Augustus 2000
  • Laatst online: 09-08 09:08
Was vooral benieuwd via welke manieren Google dat nog meer zou kunnen achterhalen.
Als je een web site URL A bezoekt, en daarna jouw (geheime) URL B intoetst, zie je dan in de HTTP request niet URL A staan in de HTTP_REFERER (sic)?

Idem als je daarna Google bezoekt, daarmee lekt je URL B naar Google.

Tenminste, dit soort leks heb ik in een lang verleden gezien.

Wikipedia: HTTP referer

Acties:
  • 0 Henk 'm!

  • Boelie-Boelie
  • Registratie: November 2004
  • Laatst online: 26-09-2020
Een referrer krijg je alleen als de ene site een link heeft naar een andere site en de bezoeker dan op de link klikt (dan ziet de tweede site referrer-informatie). Typt de bezoeker een site in de adresbalk, is er geen referrer.

Cogito ergo dubito


Acties:
  • 0 Henk 'm!

  • Remy
  • Registratie: Februari 2002
  • Laatst online: 11-06 08:13

Remy

I usually get 100% accuracy

Via de Twitterz heb ik het even nagevraagd bij André: hij gaf aan wat RobIII al zei: de Google Toolbar en een eventuele handmatige submit :)

LinkedIn
Instagram


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Bedankt voor de input. De Wordpress-sites vallen dus te verklaren doordat deze automatisch nieuwe blogposts bij Google aanmeld. Echter vind ik het dan frappant dat ook een TYPO3-testdomein bekend is bij Google.

Ik maak namelijk geen gebruik van de Google Toolbar of andere meuk en een handmatige submit heb ik uiteraard ook niet gedaan. Dus de link hiervan moet Google toch via een andere weg hebben verkregen, dit zij of via Chrome of toch via refer(r)ers van de Google Analytics. Aangezien het een 1-op-1-kopie is van de bestaande site, is het GA-script uiteraard ook meegekopieerd naar het testdomein.

Acties:
  • 0 Henk 'm!

  • biglia
  • Registratie: Februari 2012
  • Laatst online: 22-07 17:10
Mogelijk bij het registreren van de nieuwe (sub)domein. Als ik een nieuw domain registreer en een week later erop google, vind ik deze domeinnaam vaak terug op vreemde websites die dat soort dingen bijhouden.

Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Een subdomein is niks meer dan een extra dns-record en die worden nergens geregistreerd/publiceerd, dus via die weg zal Google er niet aangekomen zijn.

Acties:
  • 0 Henk 'm!

  • Precision
  • Registratie: November 2006
  • Laatst online: 12-08 21:08
bartbh schreef op woensdag 02 mei 2012 @ 15:03:
Een subdomein is niks meer dan een extra dns-record en die worden nergens geregistreerd/publiceerd, dus via die weg zal Google er niet aangekomen zijn.
Maar google kan wel alle dns-records opvragen ;) dus een (sub)domeinnaam is genoeg om de rest van de subdomeinnamen te weten te komen. Als er al een site gekend is bij google zou het mij niet verbazen moest google periodiek alle subdomeinnamen opvragen.

[ Voor 13% gewijzigd door Precision op 23-05-2012 19:02 ]

Crisis? Koop slim op Dagoffer - Op zoek naar een tof cadeau?


Acties:
  • 0 Henk 'm!

  • bartbh
  • Registratie: Maart 2004
  • Niet online
Is dat zo? Dat is dan wat nieuws voor mij! In mijn veronderstelling kun je alleen een ip zoeken/vinden bij een (sub)domein of een PTR-record bij een IP-adres.

Hoe kun je subdomeinen opvragen dan?

edit:
Ik maak gebruik van een wildcard, dus dan zijn die subdomeinen toch nooit op te vragen?

Fout, deze betreffende subdomeinen zijn uiteraard wel vastgelegd in een dns-record aangezien ze verwijzen naar een ander ip.

[ Voor 37% gewijzigd door bartbh op 23-05-2012 19:46 ]

Pagina: 1