Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[Google] Problemen na mod_rewrite

Pagina: 1
Acties:

  • Sjoerd
  • Registratie: December 2003
  • Niet online
Eventjes toelichten:

Vroeger werkte mijn site op de volgende manier:
url/index.php?pag=home

Dit is nu geworden:
url/page/home (wat ik zelf een stuk netter vond)

Het probleem is echter dat google zelfs na ongeveer 5 sitecrawls (webmasterhulp programma's elke dag bekeken)
Nog altijd in de zoekresultaten mijn site weergeeft als url/index.php?pag=home
(die url werkt wel, die komt gewoon uit bij www.url.be)
Ik vermoed dus ook dat daarom google de zoekresultaten niet aanpast...

Ik heb al geprobeerd om een sitemap te uploaden met alle urls in (wordt ook geaccepteerd door google) echter zonder resultaat...

Wat kan ik nog meer proberen?

Iemand tips?

[ Voor 15% gewijzigd door Sjoerd op 06-04-2008 14:17 ]

Modelbouw - Alles over modelbouw, van RC tot diorama


  • benoni
  • Registratie: November 2003
  • Niet online
Zoek even op '301' en/of 'Redirect permanent'.

Onder Apache zowel als losse directive toe te passen (RedirectPermanent) of als flag bij mod_rewrite (RewriteRule ^dit /dat [R=301]).

  • Sjoerd
  • Registratie: December 2003
  • Niet online
benoni schreef op donderdag 03 april 2008 @ 09:24:
Zoek even op '301' en/of 'Redirect permanent'.

Onder Apache zowel als losse directive toe te passen (RedirectPermanent) of als flag bij mod_rewrite (RewriteRule ^dit /dat [R=301]).
Voor dat ik het probeer is dit dan goed?

Redirect 301 /index.php?pag /

Dus index.php?pag wordt veranderd naar de 'root' mijn url dus...

verder staat dit nog in men htacces

code:
1
2
3
4
5
6
7
8
RewriteEngine On
RewriteBase /

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d

RewriteRule ^page/(.*)/(.*)/?$ /index.php?page=$1&editor=$2
RewriteRule ^page/(.*)/?$ /index.php?page=$1


Waar moet ik de regel bij plaatsen om geen foute volgorde te krijgen?

Modelbouw - Alles over modelbouw, van RC tot diorama


  • Salandur
  • Registratie: Mei 2003
  • Laatst online: 11:45

Salandur

Software Engineer

gewoon toevoegen als eerste rewrite rule regel en er voor zorgen dat er verder geen regelsm eer uitgeveord worden [R=301,L] geloof ik

Assumptions are the mother of all fuck ups | iRacing Profiel


  • benoni
  • Registratie: November 2003
  • Niet online
Wacht even, gegevens uit een query string (die achter het vraagteken) rewriten naar een link zonder query string gaat niet met een gewone rewrite rule, omdat Apache de query door een ander proces laat verwerken.

Gegevens uit de query string verwerken kun je met de 'RewriteCond' directive, dat wordt zoiets:
code:
1
2
    RewriteCond %{QUERY_STRING} ^pag=(.*)$
    RewriteRule ^.*index\.php$ /page/%1 [R=301,L]


Je moet even goed testen, pas op dat het geen vicieuze doorverwijs cirkel wordt. Het is de bedoeling dat met een permanente verwijzing de oude query string gebaseerde URLs worden herschreven naar de korte URLs, en dat de korte URLs intern worden terug-herschreven naar de lange query URLs. De rest van de directives moet dus in .htaccess blijven staan.

  • Sjoerd
  • Registratie: December 2003
  • Niet online
benoni schreef op donderdag 03 april 2008 @ 10:22:
Wacht even, gegevens uit een query string (die achter het vraagteken) rewriten naar een link zonder query string gaat niet met een gewone rewrite rule, omdat Apache de query door een ander proces laat verwerken.

Gegevens uit de query string verwerken kun je met de 'RewriteCond' directive, dat wordt zoiets:
code:
1
2
    RewriteCond %{QUERY_STRING} ^pag=(.*)$
    RewriteRule ^.*index\.php$ /page/%1 [R=301,L]


Je moet even goed testen, pas op dat het geen vicieuze doorverwijs cirkel wordt. Het is de bedoeling dat met een permanente verwijzing de oude query string gebaseerde URLs worden herschreven naar de korte URLs, en dat de korte URLs intern worden terug-herschreven naar de lange query URLs. De rest van de directives moet dus in .htaccess blijven staan.
Maar die var/query string, hoeft niet herschreven te worden, als alles van index.php?pag=iets uitkomt bij www.url.be ben ik al blij genoeg ;)

Modelbouw - Alles over modelbouw, van RC tot diorama


  • benoni
  • Registratie: November 2003
  • Niet online
Oh, ik nam aan dat je oude links in de Google hits netjes wilde laten omzetten naar de nieuwe links. Als je alles naar dezelfde pagina laat verwijzen, dan dropt Google deze zoekresultaten denk ik.

  • Sjoerd
  • Registratie: December 2003
  • Niet online
benoni schreef op donderdag 03 april 2008 @ 10:28:
Oh, ik nam aan dat je oude links in de Google hits netjes wilde laten omzetten naar de nieuwe links. Als je alles naar dezelfde pagina laat verwijzen, dan dropt Google deze zoekresultaten denk ik.
Dat is op zich niet zo erg, ik hoop zelfs dat op deze manier die "you have a sql error...." uit de zoekresultaten gaat ;),

edit: eigenlijk nu ik er over denk, momenteel komen alle index.php?pag=iets al aan bij url...

[ Voor 10% gewijzigd door Sjoerd op 03-04-2008 10:39 ]

Modelbouw - Alles over modelbouw, van RC tot diorama


  • benoni
  • Registratie: November 2003
  • Niet online
Kijk 't even aan... anders kun je altijd nog iets verzinnen dat specifiek voor Google een '410 Gone' status geeft :P

[ Voor 8% gewijzigd door benoni op 03-04-2008 10:40 ]


  • Sjoerd
  • Registratie: December 2003
  • Niet online
benoni schreef op donderdag 03 april 2008 @ 10:39:
Kijk 't even aan... anders kun je altijd nog iets verzinnen dat specifiek voor Google een '410 Gone' status geeft :P
Oke, ik wacht nog even dan...

En voor de

"You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near line..." ?

Ook gewoon wachten?

Als ik de in cache pagina opvraag in google staat er bovenaan:

Dit is een versie van www.url.be zoals opgeslagen in het cachegeheugen van G o o g l e op 30 maart 2008 05:27:28 GMT.
G o o g l e's cache is de momentopname die we van deze pagina hebben gemaakt toen we het web doorzochten....


Echter weet ik zeker dat op 30 maart er geen enkel probleem was met de site, ook gewoon af wachteN?

Modelbouw - Alles over modelbouw, van RC tot diorama


  • benoni
  • Registratie: November 2003
  • Niet online
Je moet wel een verwijzing maken, of een verandering in de pagina. Als de Google spider de eerstvolgende keer een '301 Permanent redirect' header of in ieder geval een '200 OK' terugkrijgt in plaats van een '304 Not Modified' of zo, dan moet er heus wel wat worden geupdate lijkt me...

Check anders de headers in de Apache logbestanden (als je daarbij kunt).

[ Voor 11% gewijzigd door benoni op 03-04-2008 10:58 ]


  • Sjoerd
  • Registratie: December 2003
  • Niet online
benoni schreef op donderdag 03 april 2008 @ 10:56:
Je moet wel een verwijzing maken, of een verandering in de pagina. Als de Google spider de eerstvolgende keer een '301 Permanent redirect' header of in ieder geval een '200 OK' terugkrijgt in plaats van een '304 Not Modified' of zo, dan moet er heus wel wat worden geupdate lijkt me...

Check anders de headers in de Apache logbestanden (als je daarbij kunt).
De inhoud van de site is reeds veranderd eveneens de titel maar dus zonder resultaat

Het volgende in mijn pagina's zetten, zou dat helpen?
PHP:
1
header("HTTP/1.0 200 OK")


Overigens ook het volgende toegevoegd:

<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">


Na het nogmaals bestuderen van de Google help ;)
In de hoop dat zo de pagina met die "sql error..." verdwijnt...

[ Voor 14% gewijzigd door Sjoerd op 03-04-2008 12:46 ]

Modelbouw - Alles over modelbouw, van RC tot diorama


  • benoni
  • Registratie: November 2003
  • Niet online
Sjoerd schreef op donderdag 03 april 2008 @ 12:12:
Het volgende in mijn pagina's zetten, zou dat helpen?
PHP:
1
header("HTTP/1.0 200 OK")
Weet ik niet precies, het kan zijn dat ie dan alleen de header stuurt en geen pagina erachteraan.

Kun je bij de logfiles van Apache? Daar kun je de laatste visits van de Googlebot opzoeken en kijken of er een '200' terug werd gegeven na de "GET .....":

code:
1
crawl-66-249-67-208.googlebot.com - - [02/Apr/2008:17:28:00 +0200] "GET /home/blah/index.php/articles/pictures/c40/?startnum=13 HTTP/1.1" 200 12796 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"


Heb je al in een Sitemaps account je website opgevoerd? Daar kun je een optie vinden om regelmatiger te laten spideren, die zou je kunnen gebruiken om het probleem met de SQL sneller uit de cache te krijgen.
Pagina: 1