[SEO] Het "waarom" van gebruiksvriendelijke URLs

dinsdag 9 september 2008 17:23

Acties:

Es gibt keine kleinen Punkte!

Topicstarter

Reeds geruime tijd houd ik me bezig met de materie gebruiksvriendelijke / zoekmachine vriendelijke urls. Alhoewel zoekmachines tegenwoordig ook de minder "mooie" urls indexeren wil ik bezoekers een zo leesbaar mogelijk adres voor schotelen. Dit is allemaal geen probleem, maar er is een vraag waar ik geen antwoord op het kunnen vinden (of de link van het artikel werkte niet meer)

Waarom hanteert bijvoorbeeld tweakers.net de volgende structuur:
xxxx/dit_is_het_nieuws.html i.p.v xxxx/dit_is_het_nieuws/

Vinden zoekmachines .html "leuker", was de programmeur van opvatting dat .html leesbaarder is of is er een andere reden om .html te gebruiken?

[ Voor 11% gewijzigd door DerKleinePunkt op 09-09-2008 17:26 ]

Ein kleiner Punkt in einer grossen Welt

dinsdag 9 september 2008 17:26

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

DerKleinePunkt schreef op dinsdag 09 september 2008 @ 17:23:
Alhoewel zoekmachines tegenwoordig ook de minder mooie url's indexeren

Whut? Dat is al sinds dag 1 zo hoor

DerKleinePunkt schreef op dinsdag 09 september 2008 @ 17:23:
Waarom hanteert bijvoorbeeld tweakers.net de volgende structuur:
xxxx/dit_is_het_nieuws.html en niet xxx/dit_is_het_nieuws/. Vinden zoekmachines .html "leuker", is was de programmeur van opvatting dat .html leesbaarder is of is het een heel andere reden?

De enige 'reden' die ik ken is dat .html (in principe) statisch is (i.t.t. .php of .asp bijv.) en dus minder vaak wijzigt en dus de kans dat tegen de tijd dat de zoeker de pagina zal bekijken het resultaat relevanter (of: nog relevant) zal zijn. Maar met allerlei trucs die we allemaal kennen weten we ook dat een extensie dus eigenlijk geen kont zegt en het dus net zo goed .php kan zijn achter de schermen. Of het ooit iets uitgemaakt heeft weet ik niet, maar tegenwoordig geloof ik niet dat het nog uit maakt voor de ranking. Ik kan me wel voorstellen dat minder capabele searchengines (en dan bedoel ik dus echt de amateurdingen, niet google/altavista/live/ilse/whatever) een voorkeur kunnen hebben voor .html maar ook dan moet ik héél hard mijn best doen om me daar wat bij voor te stellen

Een kleine kanttekening: /blah.html of /blah en /blah/ is nogal een verschil. De eerste is een 'file', de tweede idem (zonder extensie) en de derde (zoals jij die gebruikt in je voorbeeld) is in principe een directory; dat kan ook nog verschil uitmaken natuurlijk voor een zoekmachine. En het is op voorhand natuurlijk wel een leuk teken dat je HTML kunt verwachten i.p.v. een JPG, RSS Feed of whatever.

[ Voor 27% gewijzigd door RobIII op 09-09-2008 17:35 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

dinsdag 9 september 2008 17:30

Acties:

DerKleinePunkt

Es gibt keine kleinen Punkte!

Topicstarter

RobIII schreef op dinsdag 09 september 2008 @ 17:26:

Whut? Dat is al sinds dag 1 zo hoor

Ik omschreef het niet goed. Google kan een /123/ toch makkelijker koppelen aan een trefwoord 123 dan index.php?id=123.

[ Voor 4% gewijzigd door DerKleinePunkt op 09-09-2008 17:31 ]

Ein kleiner Punkt in einer grossen Welt

dinsdag 9 september 2008 17:38

Acties:

NMe

Quia Ego Sic Dico.

Pagina's met ?id=123 vindt Google sowieso niet lief. Waarom weet ik zo niet, maar die worden volgens mij nog steeds niet goed geïndexeerd. Andere GET-variabelen zijn volgens mij geen probleem.

Verder is dit topic meer iets voor Webdesign, Markup & Clientside Scripting. Ik zal het even verplaatsen.

PRG>>WEB

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.

dinsdag 9 september 2008 17:42

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

-NMe- schreef op dinsdag 09 september 2008 @ 17:38:
Pagina's met ?id=123 vindt Google sowieso niet lief. Waarom weet ik zo niet, maar die worden volgens mij nog steeds niet goed geïndexeerd.

Dat stond ooit wel op de Google webmaster guidelines uitgelegd als ik het me goed herinner, maar dat kan ik zo snel niet meer vinden. Weet eerlijk gezegd ook niet of dat nog steeds zo is...

Zie ook Creating a Google-friendly URL structure

Lees trouwens hier gerust wat meer over het onderwerp: Creating a Google-friendly site: Best practices

[ Voor 83% gewijzigd door RobIII op 09-09-2008 17:54 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

dinsdag 9 september 2008 17:45

Acties:

-FoX-

Carpe Diem!

Ik dacht dat de score op Google voor /123 hoger lag dan /123.html

Dit kan ik echter niet onderbouwen, alleen lijkt het me dat statische pagina's een nadeel hebben tov dynamische pagina's, en Google hiermeer rekening houdt aan de hand van de extensie?

dinsdag 9 september 2008 17:47

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

-FoX- schreef op dinsdag 09 september 2008 @ 17:45:
Ik dacht dat de score op Google voor /123 hoger lag dan /123.html

Dit kan ik echter niet onderbouwen, alleen lijkt het me dat statische pagina's een nadeel hebben tov dynamische pagina's

Voor de zoekmachine/bezoeker hebben statische pagina's lijkt me juist meer voordeel; de kans dat ze nog hetzelfde zijn als na het bezoek van de spider (xxx dagen geleden) zal groter zijn dan bij dynamische pagina's en dus zullen de zoekresultaten "betrouwbaarder" zijn bij "statische pagina's". Dat is dus goede reclame voor de zoekmachine (=betrouwbaar) en de bezoeker is blij omdat 'ie vindt wat 'ie zocht.

Maar linksom of rechtsom: dit is pielen in de marge. Ik kan me niet voorstellen dat de 'extensie' (zeker anno nu, nu jan-en-alleman aan url rewriting doet) überhaupt nog invloed van enige significantie heeft. Misschien leuk als 'laatste loodje' als het een nek-aan-nek-race is met je concurrent en je hebt alle SEO mogelijkheden al uitgeput... Ik gebruik het zelf ook vaak, maar dat is meer omdat het in mijn eigen URL-rewrite engine toch standaard in zit en ik er geen extra moeite voor hoef te doen

In mijn websites zijn overigens de ID's dan vaak ook helemaal uit de URL "geoptimaliseerd"

Dan krijg je dus: http://domein.tld/nieuws/jantje-is-jarig.html en dus niet http://domein.tld/nieuws/12387/jantje-is-jarig.html. Dat vergt dan wel weer wat extra (denk)werk bij het kiezen van een titel/url/alias of whatever.

[ Voor 45% gewijzigd door RobIII op 09-09-2008 17:59 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

dinsdag 9 september 2008 18:04

Acties:

Civil

Een url met de titel erin geeft de gebruiker een bepaald idee over de pagina die waarschijnlijk zal verschijnen als hij er op klikt. Dus het geeft in ieder geval meer informatie. Zeker als deze urls als links aan minder betekenisvolle teksten worden gehangen als [klik hier].

Het hoe het waarom van de .html extensie, simpelweg omdat het een html pagina is. Je geeft dus het documenttype aan, het is niet nodig, maar geeft extra informatie.

Eindigen met een slash zou de verwachting wekken dat het een directory is in plaats van een document.

Ik ga ervanuit dat het een zoekmachine niet veel uitmaakt of je de .html extensie gebruikt of niet, die haalt zijn informatie vooral uit de headers (content-type, etc). URL's zijn veel te beïnvloedbaar om je door die info te laten leiden.

De waarde van betekenisvolle url's is er dus wel vanwege de match van de keywords op de content van de pagina. Maar verder heeft het vooral een informatieve waarde voor de potentiële bezoeker.

dinsdag 9 september 2008 18:19

Acties:

RaZ

Funky Cold Medina

Google heft in z'n webmaster guidelines staan ze ze liever geen sessie-id's in de URL's zien, zoals vele forumsoftware doen.

Als Google vandaag op zo'n forum komt, worden de sessie-id's achter de url geplakt, en blijft zo tot de spider weer weg is. Dat ID kan een uur later dus anders zijn, terwijl de bezochte pagina identiek is aan het vorige bezoek:

viewtopic.php?thread=1&session-id=2456245658 voor nu, en morgen:
viewtopic.php?thread=1&session-id=56ygetryrd5

Zelfde thread, andere URL. Dat is duplicating content, en zien de zoekmachines liever niet.

Dat is de reden dat men die id's niet zo tof vind.

Gebruik dus id= zo min mogenlijk.

Mooie URL's zijn inderdaad mooi. Maar als je keywords in je url zet, zoals in het voorbeeld van RobIII zijn dat extra wegende woorden. Het komt namelijk vaker voor als het in de URL staat.

Het gebruiken van categoriën in de URL's is ook een toegevoegd waarde Zo kan je dus zoeken op verschillende soorten content. Nieuws, Reviews, Producten, etc..etc.. Zolang het in de URL staat (en in de titel en in een hoge h (zo'n laag mogelijk getal)) zijn dat allemaal extra toevoegingen.

Persoonlijk stoor ik me niet aan om ID's op te nemen in URL's. Het kan zeer goed gebruikt worden als je bijvoorbeeld wel eens iets aanpast.

Met het voorbeeld van RobIII, wel of geen ID in de URL.....

/nieuws/123/jantje-is-jarig.html t/o
/nieuws/jantje-is-jarig.html

Beide zullen prima scoren, maar ik ben iemand die wel eens wat veranderd, ook in de titel. Dus morgen is jantje niet meer jarig, maar het was wel gezellig op z'n koekhap feesje.

/nieuws/123/jantje-was-jarig.html t/o
/nieuws/jantje-was-jarig.html

Het artikel is dus geupdate. /nieuws/jantje-is-jarig.html bestaat niet meer, en gaat 404. Bij het gebruik van het ID: /nieuws/123/jantje-was-jarig.html kan je het nog wel terug vinden. Je hebt namelijk het ID.

Ik check dus over mijn titel klopt met wat er in de url staat. Ik krijg van een bezoeker dus binnen: 123 & jantje-is-jarig
artikel 123 heet: jantje was jarig, dus ik zie dat het niet klopt, en de URL verkeerd is. Dan stuur ik een 301-redirect met de juiste URL, en zo blijven je backlinks, en dus je PR in tact.

Ey!! Macarena \o/

dinsdag 9 september 2008 18:21

Acties:

leuk_he

1. Controleer de kabel!

Of het nog steeds zoveel invloed heeft weet ik niet , maar in het verleden hadden de keywords in je url een grotere invloed op je ranking.

e.g.
Do keywords in URL influence your rank? Research by Web CEO Team.

Need more data. We want your specs. Ik ben ook maar dom. anders: forum, ff reggen, ff topic maken
En als je een oplossing hebt gevonden laat het ook ujb ff in dit topic horen.

dinsdag 9 september 2008 18:25

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

RaZ schreef op dinsdag 09 september 2008 @ 18:19:
Google heft in z'n webmaster guidelines staan ze ze liever geen sessie-id's in de URL's zien, zoals vele forumsoftware doen.

Session-id's staan idd nog steeds expliciet in de guidelines (en terecht inderdaad om de reden die je uitlegt), maar er stond ooit ook in dat je allerlei soorten parameters (?blah=23&foo=231&bar=appel&w00t=!@@) mocht gebruiken maar specifiek de "id" parameter moest vermijden waar mogelijk. Ik kan het nu niet meer vinden, dus ik weet niet of het nog steeds van toepassing is.

news.php?id=231 zal morgen (in principe) dus nog steeds news.php?id=231 zijn en de content (grotendeels) hetzelfde. Toch werd specifiek de "id" parameter afgeraden.

[ Voor 17% gewijzigd door RobIII op 09-09-2008 18:30 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

dinsdag 9 september 2008 18:36

Acties:

ACM

Software Architect

Werkt hier

Je beantwoord je vraag deels zelf al, door het gebruiksvriendelijke url's te noemen

Zelfs als het voor SEO niet zo veel uitmaakt, is het voor de gebruiker duidelijker waar iets heen linkt.

De .html-extensie is een tijd gesuggereerd geweest om te gebruiken omdat dat beter zou zijn, bovendien geeft ook dat weer informatie over wat er te verwachten is (er staat tenslotte geen .txt of .pdf). Of die argumenten allemaal nog steeds van toepassing zijn is natuurlijk maar afwachten en zal ook van zoekmachine tot zoekmachine varieren.

Waar wij met google nog wel tegenaan liepen is dat hun crawler niet in staat was om de base href te herkennen en fatsoenlijk - zoals alle browsers wel konden - te gebruiken. Google had (en heeft geloof ik nog steeds) de neiging om links naar 'nieuws/123' op de 'nieuws/123'-pagina te vertalen naar 'nieuws/123/nieuws/123'. Uiteindelijk hebben we daarom maar zo veel mogelijk absolute urls in de html verwerkt. Later zag ik dat ie die neiging niet had als er .html achter een url stond, dan vond ie het blijkbaar duidelijk een bestand ipv directory en werd een en ander beter aan elkaar geplakt.

Dat van die id= heb ik ook een paar keer zien staan. Maar inderdaad geen idee of dat nog steeds onverstandig is of niet. Het ging er over dat men dat associeerde met een sessie en dus maar negeerde, als ik het goed herinner. Maar gezien het feit dat Google gewoon urls met ID= opvraagt bij ons, lijkt me dat iets uit het verleden.

dinsdag 9 september 2008 19:17

Acties:

Civil

ACM schreef op dinsdag 09 september 2008 @ 18:36:
Dat van die id= heb ik ook een paar keer zien staan. Maar inderdaad geen idee of dat nog steeds onverstandig is of niet. Het ging er over dat men dat associeerde met een sessie en dus maar negeerde, als ik het goed herinner. Maar gezien het feit dat Google gewoon urls met ID= opvraagt bij ons, lijkt me dat iets uit het verleden.

Zou het nog zo kunnen zijn dat Google er vanuit RSS feeds en Sitemaps eerder vanuit gaat dat het unieke pagina's zijn, maar dat de spider wel zijn vraagtekens zal zetten bij dergelijke URL's ?

Die vraagtekens kunnen opgelost worden zodra er meerdere url's naar die pagina gevonden worden waardoor de uniekheid wat duidelijker wordt

Onderwerpen