[bug?] Google image search linkt naar verkeerde GoT-pagina

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

Topicstarter
Geen idee of dit aan Google ligt of aan Tweakers, maar wil het wel even melden.

Zo nu en dan kom ik bij een Google image search plaatjes tegen die hier op GoT zijn geplaatst. Google geeft daarbij een link naar een topic, met pagina nummer in de url.

Het probleem? Het paginanummer klopt niet. Rara hoe kan dat.
En waarom vermeld Google geen directe link naar het bericht met het plaatje?

https://www.google.nl/sea...1153365%252F3%3B451%3B800
Klik op een plaatje, dan de vermelde link naar het topic waar het plaatje zou moeten staan en zie hoe je op de verkeerde pagina uitkomt ;)

[ Voor 4% gewijzigd door Raven op 23-03-2013 19:24 ]

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde


Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

Wellicht moeten we dan overwegen om het aantal ppp weer in de url te zetten; dat kan immers per persoon afwijken aangezien het ook gewoon een pref is.

Losse berichten sluiten we uit van indexering aangezien dat gewoon way too much wordt voor Google om te behappen.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Onbekend
  • Registratie: Juni 2005
  • Laatst online: 20-09 19:14

Onbekend

...

Misschien is het een suggestie om als de bezoeker vanaf Google komt een aantal instellingen, zoals het aantal berichten per pagina, aan te passen naar het zelfde als wat de Googlebot ziet.
Een ingelogde bezoeker vind op dat moment het zoekresultaat zeer waarschijnlijk belangrijker dan zijn eigen alternatieve instellingen.

Speel ook Balls Connect en Repeat


Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

Je weet niet altijd of een bezoeker van Google afkomt, referrers zijn compleet onbetrouwbaar. Daarbij is de standaard ppp instelling al een paar keer gewijzigd de afgelopen jaren en weten we dus niet eens met zekerheid welke Google heeft gekregen toen deze de pagina voor het laatst heeft geindexeerd...

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

Topicstarter
crisp schreef op zaterdag 23 maart 2013 @ 22:07:
Wellicht moeten we dan overwegen om het aantal ppp weer in de url te zetten; dat kan immers per persoon afwijken aangezien het ook gewoon een pref is.

Losse berichten sluiten we uit van indexering aangezien dat gewoon way too much wordt voor Google om te behappen.
Zou dat kunnen? Maar hoe gaat dat dan met de plaatjes/pagina's die Google al geïndexeerd heeft? :S

Ah okee, daar had ik niet aan gedacht, dat dat zelfs voor Google te veel zou kunnen zijn :P

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde


Acties:
  • 0 Henk 'm!

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

(jarig!)
Raven schreef op zondag 24 maart 2013 @ 09:33:
Ah okee, daar had ik niet aan gedacht, dat dat zelfs voor Google te veel zou kunnen zijn :P
Google doet een beperkt aantal requests per seconde, per domein... als we het aantal url's dat geindexeerd moet worden ineens vertienvoudigen, zal Google over het forum als geheel 10x zo lang doen om te (her)indexeren ;)

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

op verzoek -> Stoute Bugs

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Raven
  • Registratie: November 2004
  • Niet online

Raven

Marion Raven fan

Topicstarter
crisp schreef op zaterdag 23 maart 2013 @ 22:34:
Je weet niet altijd of een bezoeker van Google afkomt, referrers zijn compleet onbetrouwbaar. Daarbij is de standaard ppp instelling al een paar keer gewijzigd de afgelopen jaren en weten we dus niet eens met zekerheid welke Google heeft gekregen toen deze de pagina voor het laatst heeft geindexeerd...
Voorbeeldje: http://www.google.nl/imgr...3&ndsp=20&biw=980&bih=814
Die linkt naar pagina 8 , terwijl die hier (25 ppp) op pagina 32 is te vinden.

After the first glass you see things as you wish they were. After the second you see things as they are not. Finally you see things as they really are, and that is the most horrible thing in the world...

Oscar Wilde


Acties:
  • +1 Henk 'm!

  • mathias82
  • Registratie: April 2017
  • Laatst online: 18-09 10:24
Sorry dat ik een (heel) oud topic terug omhoog schop, maar ik erger mij soms ook aan deze bug. Niet zozeer wat plaatjes betreft, maar wel wat tekst betreft.

Soms zoek ik iets op op Google, en Google geeft dan een zoekresultaat op het Tweakers forum. Ik weet al op voorhand dat wanneer ik dit zoekresultaat aanklik, ik dit niet zal aantreffen op de getoonde pagina (tenzij het toevallig op de eerste pagina staat).

Neem als voorbeeld deze (gefabriceerde) zoekopdracht:
code:
1
site:gathering.tweakers.net "3D ghosting/crosstalking"


De zoekopdracht retourneert 1 link, namelijk [LG OLED] Ervaringen & Discussie Op die pagina is echter niets te vinden over "3D ghosting/crosstalking", dit staat namelijk op pagina 51 ([LG OLED] Ervaringen & Discussie).

Er zal ongetwijfeld wel een technische uitleg voor zijn, maar het is gewoon heel irritant. Ik heb dit ook nog nooit voorgehad met zoekresultaten van andere websites, enkel met Tweakers.
Zo heeft Google ook geen nut op het forum, dan kan je het even goed niet laten indexeren door Google. Je vindt toch niet terug wat je zoekt.

Acties:
  • +1 Henk 'm!

  • DaFeliX
  • Registratie: December 2002
  • Laatst online: 18-09 12:50

DaFeliX

Tnet Devver
mathias82 schreef op dinsdag 23 maart 2021 @ 19:57:
[...]
Er zal ongetwijfeld wel een technische uitleg voor zijn, maar het is gewoon heel irritant. Ik heb dit ook nog nooit voorgehad met zoekresultaten van andere websites, enkel met Tweakers.
Zo heeft Google ook geen nut op het forum, dan kan je het even goed niet laten indexeren door Google. Je vindt toch niet terug wat je zoekt.
De uitleg staat hierboven al door @crisp, maar het komt doordat jij een andere hoeveelheid posts per pagina ziet dan Google heeft "ingesteld"; waardoor paginanummers niet absoluut zijn.

Bij mij heeft het [LG OLED] Ervaringen & Discussie topic bijvoorbeeld 38 pagina's, dus de pagina 51 die jij noemt heb ik niet eens. De eenvoudigste oplossing zou zijn om voor iedereen het aantal posts per pagina op dezelfde waarde te zetten, maar dan is het dus niet meer mogelijk dit te customizen. Ik denk dat veel gebruikers daar niet op zitten te wachten :\

Het is dus niet echt eenvoudig op te lossen helaas. zie hieronder

Einstein: Mijn vrouw begrijpt me niet


Acties:
  • +4 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

Het is op te lossen door voor searchengines expliciet het aantal posts per pagina (weer) op te nemen in de url: gathering.tweakers.net/forum/list_messages/1773999/12/50 - waarbij het laatste getal dan het aantal posts per pagina is. Dat kunnen we dan als 'canonical' url in de meta-tags instellen zodat Google deze expliciet gebruikt in plaats van de versie zonder ppp.

Vraag is wel of dat niet verwarrend is voor de gebruiker die dan via Google op een pagina terecht kan komen waarbij het aantal posts op die pagina niet overeenkomt met zijn eigen voorkeur. Ook moet natuurlijk de support voor de url-parameter dan weer ingebouwd worden en indien aanwezig voorgaan op de ingestelde voorkeur.

Ik zal hier eens een ticket voor maken en het intern eens voorleggen.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • mathias82
  • Registratie: April 2017
  • Laatst online: 18-09 10:24
DaFeliX schreef op woensdag 24 maart 2021 @ 07:50:
[...]


De uitleg staat hierboven al door @crisp, maar het komt doordat jij een andere hoeveelheid posts per pagina ziet dan Google heeft "ingesteld"; waardoor paginanummers niet absoluut zijn.

Bij mij heeft het [LG OLED] Ervaringen & Discussie topic bijvoorbeeld 38 pagina's, dus de pagina 51 die jij noemt heb ik niet eens. De eenvoudigste oplossing zou zijn om voor iedereen het aantal posts per pagina op dezelfde waarde te zetten, maar dan is het dus niet meer mogelijk dit te customizen. Ik denk dat veel gebruikers daar niet op zitten te wachten :\

Het is dus niet echt eenvoudig op te lossen helaas. zie hieronder
Dat begrijp ik hoor. Maar ik heb bijvoorbeeld nooit het aantal posts per pagina aangepast in mijn account, ik zou zelfs niet weten waar ik heb moet gaan zoeken. Het zou mij dan logisch lijken dat Google ook de "standaard" waarde gebruikt, dan klopt het voor het merendeel van de gebruikers. Tenzij de standaardwaarde in het verleden veranderd is geweest, dan wordt het moeilijker.
crisp schreef op woensdag 24 maart 2021 @ 08:21:
Het is op te lossen door voor searchengines expliciet het aantal posts per pagina (weer) op te nemen in de url: gathering.tweakers.net/forum/list_messages/1773999/12/50 - waarbij het laatste getal dan het aantal posts per pagina is. Dat kunnen we dan als 'canonical' url in de meta-tags instellen zodat Google deze expliciet gebruikt in plaats van de versie zonder ppp.

Vraag is wel of dat niet verwarrend is voor de gebruiker die dan via Google op een pagina terecht kan komen waarbij het aantal posts op die pagina niet overeenkomt met zijn eigen voorkeur. Ook moet natuurlijk de support voor de url-parameter dan weer ingebouwd worden en indien aanwezig voorgaan op de ingestelde voorkeur.

Ik zal hier eens een ticket voor maken en het intern eens voorleggen.
Kan je dan geen vertaalslag doen van een pagina met het aantal posts naar de juiste pagina zonder het aantal posts?
Laten we voor het gemak stellen dat ppp = posts per pagina. Stel de gebruiker heeft dit ingesteld op 25 ppp, en google op 50 ppp. Bij het opvragen van een pagina kijk je eerst of het aantal ppp in de url staat. Is dit het geval, dan kijk je of de gebruiker ingelogd is. Is dit het geval, dan kijk je hoevel ppp de gebruiker heeft. Je doet dan (ppp_url / ppp_gebruiker * paginanummer) en je doet een redirect naar die pagina, zonder ppp in de URL. De formule zal wat gefinetuned moeten worden, maar je snapt het principe.

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

mathias82 schreef op woensdag 24 maart 2021 @ 09:08:
[...]


Dat begrijp ik hoor. Maar ik heb bijvoorbeeld nooit het aantal posts per pagina aangepast in mijn account, ik zou zelfs niet weten waar ik heb moet gaan zoeken. Het zou mij dan logisch lijken dat Google ook de "standaard" waarde gebruikt, dan klopt het voor het merendeel van de gebruikers. Tenzij de standaardwaarde in het verleden veranderd is geweest, dan wordt het moeilijker.
Dat is in het verleden inderdaad aangepast (van 25 naar 50 meen ik), en er zit ook nog ergens een lelijke check voor mobiel (die wat mij betreft weg moet).
[...]


Kan je dan geen vertaalslag doen van een pagina met het aantal posts naar de juiste pagina zonder het aantal posts?
Laten we voor het gemak stellen dat ppp = posts per pagina. Stel de gebruiker heeft dit ingesteld op 25 ppp, en google op 50 ppp. Bij het opvragen van een pagina kijk je eerst of het aantal ppp in de url staat. Is dit het geval, dan kijk je of de gebruiker ingelogd is. Is dit het geval, dan kijk je hoevel ppp de gebruiker heeft. Je doet dan (ppp_url / ppp_gebruiker * paginanummer) en je doet een redirect naar die pagina, zonder ppp in de URL. De formule zal wat gefinetuned moeten worden, maar je snapt het principe.
Zo'n vertaalslag kan alleen als het aantal PPP van de gebruiker hoger is dan de default, en daar ook precies een veelvoud van is. Anders heb je geen garantie dat de post die de gebruiker in de zoekresultaten zag ook daadwerkelijk op de pagina staat na de 'herberekening'.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Dirk
  • Registratie: November 2004
  • Laatst online: 20-09 19:02

Dirk

Coördinator frontpagemoderatie
Is er geen optie te verzinnen waarbij google reactie-urls (crisp in "[bug?] Google image search linkt naar verkeerde GoT-pagina") krijgt in plaats van pagina-urls?

All statements are true in some sense, false in some sense, meaningless in some sense, true and false in some sense, true and meaningless in some sense, false and meaningless in some sense, and true and false and meaningless in some sense.


Acties:
  • 0 Henk 'm!

  • .oisyn
  • Registratie: September 2000
  • Laatst online: 03:42

.oisyn

Moderator Devschuur®

Demotivational Speaker

mathias82 schreef op woensdag 24 maart 2021 @ 09:08:
Je doet dan (ppp_url / ppp_gebruiker * paginanummer) en je doet een redirect naar die pagina, zonder ppp in de URL. De formule zal wat gefinetuned moeten worden, maar je snapt het principe.
Dat principe werkt niet. De content staat niet per se in de eerste post van de pagina, maar *ergens op de pagina*. Als je niet de specifieke post weet die wordt bedoeld, kun je nooit de juiste pagina tonen met de content waar men naar gezocht heeft, tenzij de user ppp gegarandeerd een veelvoud is van de Google ppp. Anders zit er dus niets anders op dan de pagina laten zien zoals Google hem gezien heeft.

Voorbeeldje, mijn ppp is bijvoorbeeld 40, die van Google is 25. Als de content in post 28 staat, dan is dat dus pagina 2 voor Google maar pagina 1 voor mij. Staat de content daarentegen in post 44, dan is dat nog steeds pagina 2 voor Google maar ook pagina 2 voor mij.

.edit: oh dat zei crisp al in minder woorden :P

Give a man a game and he'll have fun for a day. Teach a man to make games and he'll never have fun again.


Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

Dirk schreef op woensdag 24 maart 2021 @ 12:26:
Is er geen optie te verzinnen waarbij google reactie-urls (crisp in "[bug?] Google image search linkt naar verkeerde GoT-pagina") krijgt in plaats van pagina-urls?
Nee, voor zover ik weet kan je niet delen van een pagina voor Google een andere url geven. Daarbij zou het ook een beetje neerkomen op het indexeren van losse reacties wat denk ik ook niet wenselijk is.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • mathias82
  • Registratie: April 2017
  • Laatst online: 18-09 10:24
crisp schreef op woensdag 24 maart 2021 @ 09:25:
[...]

Dat is in het verleden inderdaad aangepast (van 25 naar 50 meen ik), en er zit ook nog ergens een lelijke check voor mobiel (die wat mij betreft weg moet).

[...]

Zo'n vertaalslag kan alleen als het aantal PPP van de gebruiker hoger is dan de default, en daar ook precies een veelvoud van is. Anders heb je geen garantie dat de post die de gebruiker in de zoekresultaten zag ook daadwerkelijk op de pagina staat na de 'herberekening'.
.oisyn schreef op woensdag 24 maart 2021 @ 12:35:
[...]


Dat principe werkt niet. De content staat niet per se in de eerste post van de pagina, maar *ergens op de pagina*. Als je niet de specifieke post weet die wordt bedoeld, kun je nooit de juiste pagina tonen met de content waar men naar gezocht heeft, tenzij de user ppp gegarandeerd een veelvoud is van de Google ppp. Anders zit er dus niets anders op dan de pagina laten zien zoals Google hem gezien heeft.

Voorbeeldje, mijn ppp is bijvoorbeeld 40, die van Google is 25. Als de content in post 28 staat, dan is dat dus pagina 2 voor Google maar pagina 1 voor mij. Staat de content daarentegen in post 44, dan is dat nog steeds pagina 2 voor Google maar ook pagina 2 voor mij.

.edit: oh dat zei crisp al in minder woorden :P
Jullie hebben uiteraard gelijk. Ik had het vanmorgen snel opgeschreven voor ik moest vertrekken en er niet goed over nagedacht.
crisp schreef op woensdag 24 maart 2021 @ 12:50:
[...]

Nee, voor zover ik weet kan je niet delen van een pagina voor Google een andere url geven. Daarbij zou het ook een beetje neerkomen op het indexeren van losse reacties wat denk ik ook niet wenselijk is.
Wou ik ook net zeggen: zet de ppp van Google op 1, maar dat gaat waarschijnlijk (te) veel verkeer naar de server geven.
Misschien valt er iets te verzinnen met anchors op de pagina of metadata? Ik weet niet hoe Google juist indexeert, maar er moet toch iets op de verzinnen zijn...

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

mathias82 schreef op woensdag 24 maart 2021 @ 13:22:
[...]

Misschien valt er iets te verzinnen met anchors op de pagina of metadata? Ik weet niet hoe Google juist indexeert, maar er moet toch iets op de verzinnen zijn...
Ja dit: crisp in "[bug?] Google image search linkt naar verkeerde GoT-pagina" ;)

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • mathias82
  • Registratie: April 2017
  • Laatst online: 18-09 10:24
Ja dat had ik begrepen, maar dat lost het probleem van het variabel aantal posts per pagina nog niet op. Als je op de een of andere manier te weten kan komen (via een anchor of metadata) naar welke post Google linkt in plaats van naar welke pagina, dan is het probleem uiteraard opgelost. Maar ik weet niet of dat mogelijk is...

Acties:
  • +1 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 01:22

crisp

Devver

Pixelated

mathias82 schreef op woensdag 24 maart 2021 @ 14:44:
[...]


Ja dat had ik begrepen, maar dat lost het probleem van het variabel aantal posts per pagina nog niet op. Als je op de een of andere manier te weten kan komen (via een anchor of metadata) naar welke post Google linkt in plaats van naar welke pagina, dan is het probleem uiteraard opgelost. Maar ik weet niet of dat mogelijk is...
Het resultaat van een zoekterm in Google hoeft natuurlijk niet 1 specifieke post te zijn. Sterker nog, dat zal meestal ook niet zo zijn. Met specifieke meta-tags geven we ook aan dat pagina's binnen een post onderdeel zijn van een topic. Ook dat zal Google waarschijnlijk wel op 1 of andere manier in ogenschouw nemen. Maar forums zijn sowieso notoir lastig voor searchengines.

Intentionally left blank

Pagina: 1