Ik ben momenteel aan het nadenken over een blog in Flash, waarbij de volgende zaken gehandhaafd moeten worden tov van een normale HTML blog:
Maar nu het probleem. Ik heb begrepen dat Google en andere zoekmachines het gedeelte na de # niet indexeren. Zowieso indexeren ze Flash content niet goed, dus moet er voor zoekmachines een HTML versie van de blog bestaan met normale urls, zoals
http://blog.example.com/
http://blog.example.com/?p=1
http://blog.example.com/?p=2
Wat ik nu wil doen (of eigenlijk gedaan heb) is het volgende: Ik heb een Wordpress blog gemaakt die in eerste instantie normale URLs genereert zoals hierboven. Alleen check ik met Javascript vlak voor dat de pagina gerenderd wordt of er een 'p' in de url variablen zit. De waarde van p zet ik vervolgens in een cookie en replace ik de URL op deze manier:
http://blog.example.com/?p=1
http://blog.example.com/#/p=1
Op http://blog.example.com/#/p=1 zou je dan normaalgesproken weer de homepage zien, alleen had ik vlak voor de redirect een cookie gezet met de waarde van p. Die cookie vang ik op in PHP en zet zo de waarde van p weer in de request variables (GET). Daardoor krijg je na de redirect exact hetzelfde te zien als daarvoor.
Op zich zou ik het ook zo kunnen maken zonder de redirect, maar als je dan via Google landt op http://blog.example.com/?p=1
en je navigeert via Flash naar de 2e pagina, dan wordt de URL http://blog.example.com/?p=1#p=2. Op zich niet erg, maar niet bepaalt een eenduidige URL. Als zo'n link gekopieerd wordt door een gebruiker en op zijn eigen blog zet, komen alle mensen die de link volgen op pagina 2 uit (via Flash) en alle bots op pagina 1. Als ik mijn truucje uithaal wordt de URL gewoon http://blog.example.com/#/p=2. Ook niet optimaal, want hiermee komen gebruikers op pagina 2 en robots op de homepage. Maar aangezien bots alles na de # toch niet zien, kan dit nooit voor cloaking worden aangezien. De ranking zal hooguit wat lager worden omdat er geen deeplinks geindexeerd worden maar homepage links. Afijn, je kunt niet alles hebben ;-)
Mijn vraag is of dit nou toch door searchbots wordt gezien als cloaking en of ik nou eigenlijk beter of slechter af ben met de replace. Als zo'n bot wel een redirect snapt maar niet cookie-aware is, ben ik de pineut met m'n truuc
Een demootje kun je bekijken op http://blog.meneer.net (zonder Flash nog, het gaat om het replace scriptje).
- Having Google index the articles properly
- Being able to deeplink into the correct article
- Not breaking back-button functionality
- Create HTML output from a system like Wordpress that the Flash frontend is able to read and parse
Maar nu het probleem. Ik heb begrepen dat Google en andere zoekmachines het gedeelte na de # niet indexeren. Zowieso indexeren ze Flash content niet goed, dus moet er voor zoekmachines een HTML versie van de blog bestaan met normale urls, zoals
http://blog.example.com/
http://blog.example.com/?p=1
http://blog.example.com/?p=2
Wat ik nu wil doen (of eigenlijk gedaan heb) is het volgende: Ik heb een Wordpress blog gemaakt die in eerste instantie normale URLs genereert zoals hierboven. Alleen check ik met Javascript vlak voor dat de pagina gerenderd wordt of er een 'p' in de url variablen zit. De waarde van p zet ik vervolgens in een cookie en replace ik de URL op deze manier:
http://blog.example.com/?p=1
http://blog.example.com/#/p=1
Op http://blog.example.com/#/p=1 zou je dan normaalgesproken weer de homepage zien, alleen had ik vlak voor de redirect een cookie gezet met de waarde van p. Die cookie vang ik op in PHP en zet zo de waarde van p weer in de request variables (GET). Daardoor krijg je na de redirect exact hetzelfde te zien als daarvoor.
Op zich zou ik het ook zo kunnen maken zonder de redirect, maar als je dan via Google landt op http://blog.example.com/?p=1
en je navigeert via Flash naar de 2e pagina, dan wordt de URL http://blog.example.com/?p=1#p=2. Op zich niet erg, maar niet bepaalt een eenduidige URL. Als zo'n link gekopieerd wordt door een gebruiker en op zijn eigen blog zet, komen alle mensen die de link volgen op pagina 2 uit (via Flash) en alle bots op pagina 1. Als ik mijn truucje uithaal wordt de URL gewoon http://blog.example.com/#/p=2. Ook niet optimaal, want hiermee komen gebruikers op pagina 2 en robots op de homepage. Maar aangezien bots alles na de # toch niet zien, kan dit nooit voor cloaking worden aangezien. De ranking zal hooguit wat lager worden omdat er geen deeplinks geindexeerd worden maar homepage links. Afijn, je kunt niet alles hebben ;-)
Mijn vraag is of dit nou toch door searchbots wordt gezien als cloaking en of ik nou eigenlijk beter of slechter af ben met de replace. Als zo'n bot wel een redirect snapt maar niet cookie-aware is, ben ik de pineut met m'n truuc
Een demootje kun je bekijken op http://blog.meneer.net (zonder Flash nog, het gaat om het replace scriptje).