[Javascript] URL's niet indexeren

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Taro
  • Registratie: September 2000
  • Niet online

Taro

Moderator General Chat / Wonen & Mobiliteit
Topicstarter
Google indexeert URL's die in Javascript code genoemd staan, nagenoeg iedereen zal dat willen, maar ik juist niet. Ik heb op redelijk veel plaatsen gezocht, maar kan alleen noindex/nofollow opties vinden voor links en metatags, maar nergens een optie om bijvoorbeeld dit niet te laten indexeren:


<script type="text/javascript">
linkmanager.addblock(
'naam1',
'/:eenlink'
);
linkmanager.addblock(
'naam2',
'/:nogeenlink'
);


Google pakt /:eenlink en /:nogeenlink dus op en daardoor komen deze subonderdelen van de website als losse URL: www.domeinnaam.nl/:eenlink in Google terug, terwijl alleen de URL van de betreffende pagina opgenomen zou moeten worden. Het commenten met <!-- ervoor heeft ook geen zin.

Nou verwacht ik natuurlijk een antwoord dat ik dit anders moet oplossen, maar het verwijderen van bijvoorbeeld de / is geen optie en al deze mogelijke links (5000+ opties) in een robots.txt opnemen is ook niet mogelijk. Ik wil me dus ook echt beperken tot het gewoon niet opnemen van links in Javascript.

Heeft iemand een idee hoe ik dat zou kunnen oplossen? Bedankt.

Replace fear of the unknown with curiosity | 54 kWh thuisaccu's | Tesla Model Y LR & Model 3 SR+ | Totaal 190 kWh opslag | 10.660 Wp zonnepanelen | 3xMHI WP


Acties:
  • 0 Henk 'm!

  • .oisyn
  • Registratie: September 2000
  • Laatst online: 02:49

.oisyn

Moderator Devschuur®

Demotivational Speaker

En als je gewoon '/' + ':eenlink' doet? Het lijkt me dat de crawler gewoon zoekt naar strings die op paths lijken in je javascript. ':eenlink' lijkt er niet op. Een '/' natuurlijk wel, maar de root van je domain werd toch al geïndexeerd :)

Give a man a game and he'll have fun for a day. Teach a man to make games and he'll never have fun again.


Acties:
  • 0 Henk 'm!

  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Maak er een extern script van:
HTML:
1
<link href="/js/scriptje.js" type="javascript" />

En in robots.txt:
code:
1
2
User-Agent: *
Disallow: /js/*

Dan verbiedt je simpelweg dat het script geindexeerd wordt.

Andere optie is om die links een niveau dieper te zetten: domein.ltd/user/naam
En dan /user/ Disallowen.

[ Voor 19% gewijzigd door RaZ op 15-04-2010 16:55 ]

Ey!! Macarena \o/


Acties:
  • 0 Henk 'm!

  • Taro
  • Registratie: September 2000
  • Niet online

Taro

Moderator General Chat / Wonen & Mobiliteit
Topicstarter
.oisyn schreef op donderdag 15 april 2010 @ 16:48:
En als je gewoon '/' + ':eenlink' doet? Het lijkt me dat de crawler gewoon zoekt naar strings die op paths lijken in je javascript. ':eenlink' lijkt er niet op. Een '/' natuurlijk wel, maar de root van je domain werd toch al geïndexeerd :)
Bedankt, deze gaan we proberen.
RaZ schreef op donderdag 15 april 2010 @ 16:53:
Maak er een extern script van:
HTML:
1
<link href="/js/scriptje.js" type="javascript" />

En in robots.txt:
code:
1
2
User-Agent: *
Disallow: /js/*

Dan verbiedt je simpelweg dat het script geindexeerd wordt.

Andere optie is om die links een niveau dieper te zetten: domein.ltd/user/naam
En dan /user/ Disallowen.
Dat is helaas geen optie, het gaat om inline Javascript, die inline moet blijven en via de URL geen JS oproept, maar PHP. Wat ik wel kan proberen is *:* in de robots.txt uit te sluiten.

Ik ga ermee aan de slag en laat even weten wat de uitkomst is, als Google langs is geweest, bedankt.

Replace fear of the unknown with curiosity | 54 kWh thuisaccu's | Tesla Model Y LR & Model 3 SR+ | Totaal 190 kWh opslag | 10.660 Wp zonnepanelen | 3xMHI WP