[Google] cache link verwijderen als pagina's er naar linken

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • acq
  • Registratie: Mei 2000
  • Laatst online: 30-03-2023

acq

ing. en dan? :D

Topicstarter
FF vooraf: ja ik heb Google gebruikt, de search hier (niet meer dan standaard handelswijze dunkt me zo) en de FAQ's maar weer eens opnieuw gelezen, aangezien ik hier al een tijd niet meer actief las. Verder twijfelde ik of ie hier of in webdesign moest, maar goed, de site bestaat allang en andere topics over google vond ik ook hier tussen. Mocht ie verkeerd staan, move em dan s.v.p..

Ik word als admin van een website geconfronteerd met het feit dat een gebruikster ooit haar voor- en achternaam ingevuld heeft op een pagina die door Google geindexeerd wordt. Die achternaam heb ik een jaar geleden op haar verzoek er al uitgesloopt (privacy staat bij ons hoog in het vaandel). Edoch: als je google raadpleegt op haar voor en achternaam, dan komt ie met de cache aan van die pagina waarin alleen haar voornaam te vinden is (de pagina zelf levert een melding van ons op dat het betreffende verhaal niet gevonden kon worden). Standaard log ik dan in op het webmaster geneuzel van Google en doe een handmatig verwijderingsverzoek.

In dit geval, echter, werd die geweigerd. Met als kennelijke reden dat er pagina's ergens op het internet zijn, die verwijzen naar de pagina zoals deze gecached was. Voor Google schijnt dat een reden te zijn om de cache niet te verwijderen. Los van het feit dat dat erg irritant is en in mijn bescheiden optiek compleet nutteloos, is het voor de persoon in kwestie erg vervelend gezien haar openbare leven. Nu heb ik al geprobeerd contact met Google op te nemen, maar da's gewoon schier onmogelijk, men reageert ook niet bepaald, helaas.

Verder heb ik uiteindelijk haar verhaal (het betreft hier verhalen die men instuurt en die dan uit een database gelezen worden) een andere ID gegeven in de database, zodat je gewoon echt niet meer bij dat van haar kunt komen op het oude ID. Was te proberen dat ie dan misschien de oude weg zou gaan gooien naar verloop van tijd. Spijtig genoeg is er nu anderhalve maand voorbij en is het nog steeds hetzelfde liedje.

Ik ben nu aan het eind van mijn oplossingen en zit in mijn maag met het feit dat ik dus een gebruikster heb, wier verhaal vindbaar is in Google door cache, wijl dat slecht uitkomt i.v.m. haar openbare leven tegenwoordig. Heeft er iemand enig idee:

- hoe ik er achter kan komen welke sites linken naar de originele pagina (wellicht dat ik ze aan kan schrijven)
- een ander idee om het op te lossen
- of een ander contactpunt van Google of iets in die trant?


Ik hoop dat ik het zo duidelijk genoeg verwoord heb, maar mochten er nog onduidelijkheden zijn, laat het dan s.v.p. weten.

Na 5 jaar toch maar eens een nieuwe sig :X | Roze nerdjes; ze bestaan ;P | All we need is one world wide vision - Queen | Novell servers reboot je om 11 uur, logisch toch? |:(


Acties:
  • 0 Henk 'm!

  • Mijzelf
  • Registratie: September 2004
  • Niet online
- hoe ik er achter kan komen welke sites linken naar de originele pagina (wellicht dat ik ze aan kan schrijven)
Je kunt met google zoeken naar link:<url>.

Acties:
  • 0 Henk 'm!

  • temp00
  • Registratie: Januari 2007
  • Niet online

temp00

Als het kan ben ik lam

Sorry even een snelle reactie. Later misschien meer :). Wat betreft deze vraag:
- hoe ik er achter kan komen welke sites linken naar de originele pagina (wellicht dat ik ze aan kan schrijven)
Is de link operator misschien wat voor je?
http://www.google.com/help/operators.html

♠ REPLY CODE ALPHA ♠ 9800X3D, 32GB @ 6000, 980 Pro 2TB, RTX 5070Ti, MPG271QRX OLED @ 360HZ ♠ Overwatch


Acties:
  • 0 Henk 'm!

  • acq
  • Registratie: Mei 2000
  • Laatst online: 30-03-2023

acq

ing. en dan? :D

Topicstarter
Dank, heren :)

Zoeken met die operatoren geeft geen hits, spijtig genoeg. Vandaar dat ik ook werkelijk niet begrijp waarom ze dat als reden aanvoeren om de gecachte pagina te bewaren.

Na 5 jaar toch maar eens een nieuwe sig :X | Roze nerdjes; ze bestaan ;P | All we need is one world wide vision - Queen | Novell servers reboot je om 11 uur, logisch toch? |:(


Acties:
  • 0 Henk 'm!

  • GlowMouse
  • Registratie: November 2002
  • Niet online
Er een lege pagina neerzetten met daarin een noindex header, en die pagina korte tijd ergens vanaf de frontpage linken zodat Google hem snel zal bezoeken een optie?

Acties:
  • 0 Henk 'm!

  • acq
  • Registratie: Mei 2000
  • Laatst online: 30-03-2023

acq

ing. en dan? :D

Topicstarter
GlowMouse schreef op vrijdag 15 augustus 2008 @ 16:55:
Er een lege pagina neerzetten met daarin een noindex header, en die pagina korte tijd ergens vanaf de frontpage linken zodat Google hem snel zal bezoeken een optie?
Dat is dan inderdaad nog het enige wat ik zou kunnen proberen voor zover ik weet. Probleempje daarbij is dat het betreffende verhaal ingevoegd wordt in een andere pagina. Dus als ik een noindex wil meegeven dan gaat dat voor de gehele sectie van de site. Maar als dat de enige mogelijkheid is, dan moet dat maar en dan zal ik dat ook doen; privacy gaat voor.

Vraag is dan alleen of dat ook ervoor zorgt dat het uit de cache verwijderd wordt en blijft, wanneer ik na een maand de noindex weer verwijder, zodat alles weer werkt als vanouds? Weet iemand dat?

Na 5 jaar toch maar eens een nieuwe sig :X | Roze nerdjes; ze bestaan ;P | All we need is one world wide vision - Queen | Novell servers reboot je om 11 uur, logisch toch? |:(


Acties:
  • 0 Henk 'm!

  • acq
  • Registratie: Mei 2000
  • Laatst online: 30-03-2023

acq

ing. en dan? :D

Topicstarter
Ik heb nogmaals uitgezocht hoe de site exact in elkaar zit qua php. Tot mijn spijt blijkt dat de sectie die dan met noindex geblokkeerd zou moeten worden, ook aangeroepen wordt vanuit dezelfde index, welke op haar beurt weer een template aanroept waarin de header gedefinieerd wordt. Dat zou dus betekenen dat wanneer ik een noindex erin wil hebben, de hele site niet langer geindexeerd wordt :o Daar krijg ik natuurlijk dik last mee als ik dat doe :o

Knap irritant dat Google...

Tuurlijk zou ik dat wel eventjes kunnen doen, maar de vraag is dan natuurlijk hoe snel alles weer geindexeerd is, wanneer het doel bereikt is. Iemand een idee?

Want voor zover mij bekend kun je niet aan een samengestelde pagina (door het includen van php files) nog toevoegingen voor de header opgeven, laat staan dat die dan alleen gelden voor de bewuste geinclude pagina :/

In de hoop dat dit nog werkt heb ik de robots.txt uitgebreid met

code:
1
Disallow: /*&


wat dan weer inhoudt dat Google niet links mag volgen met "&" in de link achter het domeinnaam. De bewuste link bevat meerdere "&" tekens, dus wellicht dat dat nog helpt, hoewel ik las dat noindex veel meer effect heeft.

[ Voor 15% gewijzigd door acq op 16-08-2008 14:44 ]

Na 5 jaar toch maar eens een nieuwe sig :X | Roze nerdjes; ze bestaan ;P | All we need is one world wide vision - Queen | Novell servers reboot je om 11 uur, logisch toch? |:(


Acties:
  • 0 Henk 'm!

  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Zo irritant is Google niet. Het is een irritant gebruiker die achteraf loopt te mauwen.

Een pagina verwijderen van je systeem (of verplaatsen naar een andere URL) was niet echt een slimme zet. Het duurt gewoon een tijd voordat Google die ook echt verwijderd.

Je kan natuurlijk ook de noarchive gebruiken (wat ik standaard doe), en zo niet toestaan dat pagina's in de cache komen. Als ik een pagina weghaal van een site, heeft dat een reden.

Ik zou de gebruiker op de hoogte stellen van het feit dat jij er niet zoveel aan kan doen, behalve door te wachten tot de pagina opnieuw wordt bezocht, en dus ook de cache wordt overschreven. Wilt ze dat eerder, moet ze maar met Google gaan praten.

Ey!! Macarena \o/


Acties:
  • 0 Henk 'm!

  • acq
  • Registratie: Mei 2000
  • Laatst online: 30-03-2023

acq

ing. en dan? :D

Topicstarter
RaZ schreef op zaterdag 16 augustus 2008 @ 14:59:
Zo irritant is Google niet. Het is een irritant gebruiker die achteraf loopt te mauwen.

Een pagina verwijderen van je systeem (of verplaatsen naar een andere URL) was niet echt een slimme zet. Het duurt gewoon een tijd voordat Google die ook echt verwijderd.

Je kan natuurlijk ook de noarchive gebruiken (wat ik standaard doe), en zo niet toestaan dat pagina's in de cache komen. Als ik een pagina weghaal van een site, heeft dat een reden.

Ik zou de gebruiker op de hoogte stellen van het feit dat jij er niet zoveel aan kan doen, behalve door te wachten tot de pagina opnieuw wordt bezocht, en dus ook de cache wordt overschreven. Wilt ze dat eerder, moet ze maar met Google gaan praten.
Je hebt gelijk qua gebruiker. Spijtig genoeg staat de meerderheid van de internetters er niet bij stil (of pas jaren later) dat wat ze aan het net toevertrouwen er ook heel lang op blijft staan. Ik doe mijn deel door mensen daarop te wijzen in het kader van de site waar ik voor werk, maar ja, lijken in de kast houd je altijd ;) (in dit kader overigens erg grappig :+ Ja, ik schaam me al ;))

Dat van dat verplaatsen was in zoverre slim dat ik al maanden wachtte voor het eruit ging en het voordeel is dat men nu in ieder geval een "Bestaat niet meer" melding krijgt als men op de link in google klikt. Da's voor de meesten genoeg. Stap twee is dan inderdaad de cache.

De noarchive tip is een hele goed, dank! Die kan ik met gemak aanzetten voor die site; dat hoeft van mij niet in allerhande archieven. The waybackmachine vindt ook al zat ;)

Dank voor de tip!

Na 5 jaar toch maar eens een nieuwe sig :X | Roze nerdjes; ze bestaan ;P | All we need is one world wide vision - Queen | Novell servers reboot je om 11 uur, logisch toch? |:(


Acties:
  • 0 Henk 'm!

  • _JGC_
  • Registratie: Juli 2000
  • Laatst online: 09:22
Wat over het algemeen ook helpt is een 404 header meesturen op het moment dat er een ongeldige pagina wordt opgevraagd. Google verwijdert dan veel sneller informatie uit zijn index. Geef je alleen een melding dat de opgevraagde pagina niet beschikbaar is zonder 404 header, dan zal google dat ding niet uit de index verwijderen, en het updaten van de cache kan een hele tijd duren.
Pagina: 1