deel van een pagina verbergen voor zoekmachines

Pagina: 1
Acties:
  • 1.261 views sinds 30-01-2008
  • Reageer

Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
Ik vraag me af of het mogelijk is een deel van de pagina (met voor zoekmachines niet relevante content) niet te laten indexeren (iets als rel="nofollow" zeg maar, maar dan voor stukken content)

Bij google zelf vond ik er iig niets over, dus ik heb er een hard hoofd in dat er een class ofzo is die daarvoor zorgt (class="noIndex" ofzo zou wel geinig zijn)

Maar misschien zijn er andere creatieve oplossingen? Ik kan natuurlijk de UA checken, maar ik wil weer niet dat het me penalties op gaat leveren eigenlijk (loop ik daar kans op?)

Acties:
  • 0 Henk 'm!

  • McVirusS
  • Registratie: Januari 2000
  • Laatst online: 11-04 11:09
1) Waarom zou je dit willen?
2) Volgens Google richtlijnen zouden de searchengines precies hetzelfde moeten zien als Google zelf. Gelukkig kunnen ze dat niet "helemaal" controlleren.
3) Misschien met javascript document.write doen?

Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 10:29

André

Analytics dude

Even een gedachtenspinsel, wat nou als je dat stuk omzet naar hun unicode equivalent. Dus André wordt dan:

André

[ Voor 13% gewijzigd door André op 22-06-2005 14:03 ]


Acties:
  • 0 Henk 'm!

  • McVirusS
  • Registratie: Januari 2000
  • Laatst online: 11-04 11:09
André schreef op woensdag 22 juni 2005 @ 14:01:
Even een gedachtenspinsel, wat nou als je dat stuk omzet naar hun unicode equivalent. Dus André wordt dan:

André
Ik denk dat Google die code wel "begrijpt".

Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 10:29

André

Analytics dude

McVirusS schreef op woensdag 22 juni 2005 @ 14:04:
[...]


Ik denk dat Google die code wel "begrijpt".
Tja, ik vraag het me af want google ziet alleen &#nummer; en niet de output denk ik? En anders kun je het stukje tekst toch altijd met javascript in je document plaatsen?

Acties:
  • 0 Henk 'm!

Anoniem: 39949

Anoniem: 9542 schreef op woensdag 22 juni 2005 @ 13:55:
Ik vraag me af of het mogelijk is een deel van de pagina (met voor zoekmachines niet relevante content) niet te laten indexeren (iets als rel="nofollow" zeg maar, maar dan voor stukken content)

Bij google zelf vond ik er iig niets over, dus ik heb er een hard hoofd in dat er een class ofzo is die daarvoor zorgt (class="noIndex" ofzo zou wel geinig zijn)

Maar misschien zijn er andere creatieve oplossingen? Ik kan natuurlijk de UA checken, maar ik wil weer niet dat het me penalties op gaat leveren eigenlijk (loop ik daar kans op?)
enige oplossing die ik kan verzinnen is de tekst in een gif-bestandje plaatsen
kost wel wat meer kb's

Acties:
  • 0 Henk 'm!

  • Mayco
  • Registratie: Augustus 2002
  • Laatst online: 06-05 21:37
zoals al gezegt, gewoon met javascript als je het percee niet wil, desnoods haal je het uit een externe .js file, dan ben je zeker.

Acties:
  • 0 Henk 'm!

  • BtM909
  • Registratie: Juni 2000
  • Niet online

BtM909

Watch out Guys...

Er staat me iets van bij dat het in een toekomstige spec opgenomen zou gaan worden, maar begin nu aan mezelf te twijfelen :P

Iets met HTML5 oid :?

Ace of Base vs Charli XCX - All That She Boom Claps (RMT) | Clean Bandit vs Galantis - I'd Rather Be You (RMT)
You've moved up on my notch-list. You have 1 notch
I have a black belt in Kung Flu.


Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
mja, javascript is idd wel een slimme insteek, alleen dan sluit ik ook non js gebruikers uit (hoewel dat er vermoedelijk niet zoveel zijn) (en ik moet even kijken hoe goed dat gaat in een xhtml omgeving)

Ik wil het omdat ik onderaan mijn artikelen een lijstje referrers heb staan, waarvan ik de titel opneem.
Deze info is voor bezoekers wel interessant (vaak is bij de referrers gerelateerde info te vinden), maar voor google absoluut niet. Check bijv dit search result

De snippet bevat nu info uit m'n referrerlijst, buiten dat dit al helemaal niets zegt, bevat die text ook geen info over de content van mij pagina, alleen maar over de pagina's waar de links naar verwijzen. Dus eigenlijk hoeft deze info helemaal niet geindexeerd te worden (de links mogen overigens wel weer gevolgd worden)

edit: zelfs hier sta ik tussen, da's toch echt niet de bedoeling vind ik

[ Voor 15% gewijzigd door Anoniem: 9542 op 22-06-2005 14:27 ]


Acties:
  • 0 Henk 'm!

  • McVirusS
  • Registratie: Januari 2000
  • Laatst online: 11-04 11:09
Meta-tag description toevoegen? Of bedoel je dat niet? :)

Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
ik heb nu toch maar gediscrimineerd op ua string.

Alles waar /bot|crawl/ inzit krijgt de pagina zonder referrers. Nu weet ik wel dat google bv ook een undercover bot er opuit stuurt, maar goed, ik zal over een tijdje de resultaten wel zien.

[ Voor 5% gewijzigd door Anoniem: 9542 op 26-06-2005 10:52 ]


Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Er zijn mensen die in hun browser de UA wijzigen naar 'Googlebot' ;)

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Wacky
  • Registratie: Januari 2000
  • Laatst online: 06-05 15:57

Wacky

Dr. Lektroluv \o/

Volgens mij hebben ze hier robots.txt voor uitgevonden :?

code:
1
2
User-agent: * (of googlebot)
Disallow: /dir/naar/het/gedeelte/wat/niet/geindexeerd/mag/worden


Oeps, het ging op inhoud binnen 1 pagina 8)7

[ Voor 13% gewijzigd door Wacky op 26-06-2005 19:35 ]

Nu ook met Flickr account


Acties:
  • 0 Henk 'm!

Anoniem: 14124

Er zijn bepaalde tags die je om je source kunt zetten waarbij Google dat stuk niet indexeert. Ik heb het ooit eens ergens gezien maar weet echt zo 123 niet meer waar. Er bestaat dus wel iets ervoor, en ik herinner me iets dat de invoering ervan een reactie was op het indexeren van informatie van blogs. Dus dat men op blogs informatie voor een zoekmachine kon verbergen zoals de lijst met email adressen in comments.

Hier wordt gespeeld met een robots comment, maar ze vermelden er wel bij dat zoekmachines worden "encouraged" tot gebruik ervan. Of het dus ook echt in de praktijk zo werkt weet ik niet.

http://www.xav.com/scripts/search/help/1048.html

edit:
En ik weet niet in hoeverre dit werkt, maar:
<!--googleon: index-->
<!--googleoff: index-->

Dit wordt ook bij Macromedia op de home gebruikt.

[ Voor 80% gewijzigd door Anoniem: 14124 op 26-06-2005 21:02 ]


Acties:
  • 0 Henk 'm!

  • Vae Victis
  • Registratie: April 2001
  • Laatst online: 07-05 22:36

Vae Victis

Dark Lord of the Sith

Waarom de lijst met referrers niet in een iframe?
En de script die de referrers uitpoept in een dir met een robots.txt.

Acties:
  • 0 Henk 'm!

  • yohan
  • Registratie: April 2002
  • Laatst online: 05-05 07:30
Werk gewoon met een iframe waarin de niet te indexeren tekst komt te staan.
De html in de iframe laat je vervolgens niet indexeren door em te disallowen in robots.txt

"I'm not a cynic. I get up every morning hoping to find an honest man." - [Jack McCoy, Law & Order]


Acties:
  • 0 Henk 'm!

Anoniem: 14124

Dat zijn toch kansloze oplossingen, wie gaat er nu alle soorten content die je niet wil indexeren in een iframe stoppen :>

[ Voor 20% gewijzigd door Anoniem: 14124 op 26-06-2005 21:31 ]


Acties:
  • 0 Henk 'm!

  • Vae Victis
  • Registratie: April 2001
  • Laatst online: 07-05 22:36

Vae Victis

Dark Lord of the Sith

Anoniem: 14124 schreef op zondag 26 juni 2005 @ 21:31:
Dat zijn toch kansloze oplossingen, wie gaat er nu alle soorten content die je niet wil indexeren in een iframe stoppen :>
Tja kansloos, je schat die van jezelf ook al niet hoog in. ;)

Ben het met je stelling eens dat je niet alle content in een iframe kunt stoppen om die reden.
Maar een lijstje met referrers wat verder geen relatie heeft met rest van pagina, waarom niet?
Als dat werkt zie ik er geen probleem in.

Ik zie ook meer heil in een 'tag' die een searchbot kan zeggen dat deze content niet geindexeerd mag worden, maar het werkt jammer genoeg niet bij elke bot.

Acties:
  • 0 Henk 'm!

  • aex351
  • Registratie: Juni 2005
  • Laatst online: 08-05 13:09

aex351

I am the one

Met php, je checked of the agent .. google.. is zoja niet laten zien etc. :9

< dit stukje webruimte is te huur >


Acties:
  • 0 Henk 'm!

  • yohan
  • Registratie: April 2002
  • Laatst online: 05-05 07:30
Anoniem: 14124 schreef op zondag 26 juni 2005 @ 21:31:
Dat zijn toch kansloze oplossingen, wie gaat er nu alle soorten content die je niet wil indexeren in een iframe stoppen :>
Zolang er geen waterdichte oplossingen zijn, lijkt me dat een aardige work-a-round. Maar als jij betere suggesties hebt :)

"I'm not a cynic. I get up every morning hoping to find an honest man." - [Jack McCoy, Law & Order]


Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
crisp schreef op zondag 26 juni 2005 @ 18:39:
Er zijn mensen die in hun browser de UA wijzigen naar 'Googlebot' ;)
die mensen vind ik een beetje raar. En dan nog missen ze niet de meest belangrijke info

Alle js/iframe oplossingen vind ik niet echt super eigenlijk, dus ik hou het maar bij ua discriminatie. Wellicht levert het panelties op, maar dat zien we dan wel weer. Het is iig wel de meest logische manier denk ik.

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Anoniem: 9542 schreef op maandag 27 juni 2005 @ 01:55:
[...]


die mensen vind ik een beetje raar. En dan nog missen ze niet de meest belangrijke info
Het idee er achter is dat sommige news-sites waarbij de content achter een (al dan niet betaald) account zit searchbots vaak wel doorlaten. Op ruim 30.000 sessies zijn er bij ons ongeveer 50 van clients die zich als 'Googlebot' identificeren (dat zijn dus ingelogde sessies, dus dat kan nooit Google zelf zijn).

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • aex351
  • Registratie: Juni 2005
  • Laatst online: 08-05 13:09

aex351

I am the one

crisp schreef op maandag 27 juni 2005 @ 08:55:
[...]

Het idee er achter is dat sommige news-sites waarbij de content achter een (al dan niet betaald) account zit searchbots vaak wel doorlaten. Op ruim 30.000 sessies zijn er bij ons ongeveer 50 van clients die zich als 'Googlebot' identificeren (dat zijn dus ingelogde sessies, dus dat kan nooit Google zelf zijn).
dat zijn mensen die gratis nieuws willen lezen :9

< dit stukje webruimte is te huur >


Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
even een update, 't werkt iig, getuige deze cache pagina

heb nog niet iets gemerkt van verminderde resultaten ofzo, de snippet is er nu 1 uit m'n eigenlijke content en van penalties ofzo merk ik vooralsnog ook niks.

De tijd zal het leren

Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
Ok, for the record: de tijd heeft het geleerd:

sinds enkele dagen is m'n traffic vanaf google compleet gedropt. Dus ik denk dat ik ergens een penalty heb ontvangen. Iemand enig idee of dit ergens te controleren valt?

Ik heb iig de log weer aangezet voor bots, jammer dat de zoekresultaten erdoor een beetje verstoord worden.

Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 10:29

André

Analytics dude

Dit gedrag heb ik onlangs vaker gezien, als jij iets anders aan de spider voorschotelt dan aan een gewone gebruiker dan krijg je een penalty. Is op zich wel terecht aangezien jij je op je pagina zaken weglaat voor de zoekmachine en op die manier de zoekmachines dus niet de 'echte' pagina kan indexeren en dus ook niet kan bepalen of de 'echte' pagina wel relevant is. Dit neigt ontzettend naar cloaking technieken, ook al is het in jouw geval legale cloaking.

De enige manier waarop je dit kunt verhelpen is door die refferers met JS in je pagina te zetten.

Maar de regel is: alles wat je bezoekers zien moet de zoekmachine ook kunnen zien om op hun eigen manier te kunnen bepalen wat relevant is of niet.

Acties:
  • 0 Henk 'm!

Anoniem: 9542

Topicstarter
vind ik eigenlijk raar, als de regel omgedraait werd maakt het veel meer sense: alles wat de zoekmachine ziet moeten de bezoekers ook kunnen zien (dus geen hidden content aan de zoekmachine aanbieden om je rank op te krikken)

Acties:
  • 0 Henk 'm!

Anoniem: 35978

aex351 schreef op maandag 27 juni 2005 @ 11:10:
[...]

dat zijn mensen die gratis nieuws willen lezen :9
Nee, dat kunnen mensen zijn die geen trek hebben om overal maar te registreren voor gratis content. Hoewel misschien niet echt gratis, omdat je geacht wordt met je persoonsgegevens te "betalen"

Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 10:29

André

Analytics dude

Dat komt eigenlijk op hetzelfde neer: wat je bezoekers zien is alleen het gedeelte dat ze zien en niet de hidden content, dus zoekmachines zouden dan ook alleen dat moeten zien.

Het komt er in ieder geval op neer dat pagina's voor beiden gelijk zouden moeten zijn.

Acties:
  • 0 Henk 'm!

  • Willem
  • Registratie: Februari 2001
  • Laatst online: 22-01-2021
Was laatst een artikel over op nu.nl of webwereld.. 1 van de twee.
Deze komt er ook wel een beetje bij in de buurt

http://www.webwereld.nl/articles/35412

Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 10:29

André

Analytics dude

En natuurlijk het gevolg: de schorsingen van Tribal en Checkit die opgelegd zijn door het IAB omdat zij bepaalde technieken hadden gebruikt.
Pagina: 1