Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

T.net beschrijving op FB

Pagina: 1
Acties:

  • Xirt
  • Registratie: December 2003
  • Laatst online: 21-09 09:14
Ik kopieerde zojuist deze link naar een post op FB en toen kreeg ik een heel rare beschrijving van de website:

Afbeeldingslocatie: http://www.xirtcms.com/prive_docs/fb_tnet.jpg

Ik heb al gekeken in de broncode van T.net of er per abuis een rare tekst in stond, maar op dit moment was dit niet het geval (lijkt dus op een probleem in de cache van FB). Waarschijnlijk ligt dit dus niet aan T.net, maar gaat er iets goed fout bij FB: bij twee willekeurig gekozen andere topics kreeg ik namelijk geen beschrijving. Misschien de moeite waard om eens achteraan te gaan als meer mensen dit blijvend kunnen reproduceren?

Steps for reproduction:
1) Nieuwe statusupdate op FB
2) Copy + paste de link van hierboven in de statusupdate
3) Wacht tot FB de site-informatie geladen heeft

  • AtleX
  • Registratie: Maart 2003
  • Niet online

AtleX

Tyrannosaurus Lex 🦖

Het staat wel in de source hoor, kijk maar naar de sig van Hillie in Hillie in "Wat verdient de ICT'er / GOT'er? (deel 11)". ;)

Sole survivor of the Chicxulub asteroid impact.


  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

Als de signature als beschrijving wordt genomen, zo lijkt het althans, waarom dan die van de 2e post en niet van de startpost?

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde


  • Misha
  • Registratie: Augustus 2010
  • Laatst online: 18-11 12:58
Ik heb geen flauw idee waarop Facebook bepaalt welk onderdeel ze gebruiken voor de tekst. Ik zal er eens induiken. Dat is nu wel een erg rare snippit

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Misha schreef op donderdag 23 februari 2012 @ 14:09:
Ik heb geen flauw idee waarop Facebook bepaalt welk onderdeel ze gebruiken voor de tekst. Ik zal er eens induiken. Dat is nu wel een erg rare snippit
https://developers.facebook.com/docs/opengraphprotocol/

  • Firesphere
  • Registratie: September 2010
  • Laatst online: 18-11 21:56

Firesphere

Yoshis before Hoshis

Meestal pakken ze toch de website description als de OG data mist?

Deze is wel heel creatief van FB...

I'm not a complete idiot. Some parts are missing.
.Gertjan.: Ik ben een zelfstandige alcoholist, dus ik bepaal zelf wel wanneer ik aan het bier ga!


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Mja, maar om elke pagina nu te gaan vervuilen met nutteloze meta-tags alleen voor feestboek... :N

Intentionally left blank


  • Touchdomex
  • Registratie: April 2005
  • Nu online

Touchdomex

Moderator General Chat / Wonen & Mobiliteit

Poke of the QueenSlow

crisp schreef op donderdag 23 februari 2012 @ 15:07:
[...]

Mja, maar om elke pagina nu te gaan vervuilen met nutteloze meta-tags alleen voor feestboek... :N
Ach het is facebook maar :+

_@/' _@/' _@/' _@/' _@/' _@/' _@/' Bombus Flavifrons adoratie _@/' _@/' _@/' _@/' _@/' _@/'? '\@_ || Let's Play: Paradox-billiards-vostroyan-roulette-fourth dimensional-hypercube-chess-strip-poker


  • Firesphere
  • Registratie: September 2010
  • Laatst online: 18-11 21:56

Firesphere

Yoshis before Hoshis

crisp schreef op donderdag 23 februari 2012 @ 15:07:
[...]

Mja, maar om elke pagina nu te gaan vervuilen met nutteloze meta-tags alleen voor feestboek... :N
Lijkt mij een kwestie van een paar templates, als't handig is aangepakt zelfs 1 template (<insert header>) aan te passen.

Weinig vervuiling volgens mij hoor.

I'm not a complete idiot. Some parts are missing.
.Gertjan.: Ik ben een zelfstandige alcoholist, dus ik bepaal zelf wel wanneer ik aan het bier ga!


Verwijderd

Van alle ondertitels komt ook net deze er dan te staan :D . Toevallig een van de weinigen die ik me kan herinneren wel eens vaker gelezen te hebben.

  • Erkens
  • Registratie: December 2001
  • Niet online

Erkens

Fotograaf

Firesphere schreef op donderdag 23 februari 2012 @ 15:11:
[...]

Lijkt mij een kwestie van een paar templates, als't handig is aangepakt zelfs 1 template (<insert header>) aan te passen.

Weinig vervuiling volgens mij hoor.
Tuurlijk is dat wel vervuiling, je moet voor 1 website moet je maar je eigen code gaan vervuilen met die meuk.

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

En vele extra bytes die bijna elke pageview nutteloos moeten worden verstuurd. Think about the trees! :P

Intentionally left blank


  • azerty
  • Registratie: Maart 2009
  • Laatst online: 12:34
crisp schreef op donderdag 23 februari 2012 @ 21:05:
En vele extra bytes die bijna elke pageview nutteloos moeten worden verstuurd. Think about the trees! :P
Heb juist een korte check gedaan op facebook, en blijkbaar haalt facebook zelf de informatie op:

(de rare beschrijving kwam terug via aanroep van deze url):

http://www.facebook.com/a...t_composer&__user=xxxxxxx

Volgens mij moet het dus mogelijk zijn om bijvoorbeeld alleen voor facebook deze extra tags te zetten (ga er hierbij wel vanuit dat de scraper identificeerbaar is)

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Overigens vermoed ik dat de Facebook scraper <table>'s negeert. Het eerste echte stuk content van meer dan 2 woorden op de pagina is dan inderdaad de signature van Hillie...

Intentionally left blank


  • Xirt
  • Registratie: December 2003
  • Laatst online: 21-09 09:14
Dat is nou niet bepaald relevante content te noemen als het gaat om forumposts: net zoals in mijn voorbeeld wijkt de beschrijving dan behoorlijk af van de echte content van de pagina... De oplossing die wsitedesign geeft is misschien inderdaad wel een optie, aangezien de meeste scrapers wel een unieke user agent header meersturen.

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Xirt schreef op vrijdag 24 februari 2012 @ 00:56:
Dat is nou niet bepaald relevante content te noemen als het gaat om forumposts: net zoals in mijn voorbeeld wijkt de beschrijving dan behoorlijk af van de echte content van de pagina...
De relevante content zit hier natuurlijk grotendeels in de startpost, maar is semantisch gezien niet relevant omdat het in een <table> staat (net als alle andere hip opgemaakte startposts van grote topics). Daar zit 'm eigenlijk in mijn ogen ook het probleem. Misschien moeten we toch eens gaan kijken naar andere methoden om in RML opmaak te kunnen verzorgen zonder [table] te hoeven gebruiken...

Intentionally left blank


  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

crisp schreef op vrijdag 24 februari 2012 @ 00:33:
Overigens vermoed ik dat de Facebook scraper <table>'s negeert. Het eerste echte stuk content van meer dan 2 woorden op de pagina is dan inderdaad de signature van Hillie...
Dus Facebook pakt gewoon random iets wat interessant lijkt en uit meer dan 2 woorden bestaat? Of denk ik nu te simpel :P

ps. Congrats ;)

[ Voor 4% gewijzigd door Raven op 25-02-2012 10:22 ]

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde


  • Megamind
  • Registratie: Augustus 2002
  • Laatst online: 10-09 22:45
Misschien over de top, maar als je geen facebook meta data in wilt voegen, check dan of je request van facebook.com komt, dan alle zooi eruit gooien en alleen de TS teruggeven?

  • Roeligan
  • Registratie: December 2001
  • Laatst online: 22-07 11:37

Roeligan

Feyenoord

Gebeurt mij net ook:

Afbeeldingslocatie: http://tweakers.net/ext/f/D86LrTfhXzPkHMtS8aNgEIUv/full.png

A real man fears not mortality for it's death, he fears mortality for it's lack of life!
RatPack #814

Pagina: 1