Speciale karakters in URL behouden

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Als ik dit woord in een formulier invul en vervolgens submit:

çösâkı

dan krijg ik op de target page een url als deze:

example.org/test?woord=%E7%F6s%E2k%FD

terwijl ik graag zou willen zien:

example.org/test?woord=çösâkı

Is er een manier om die encoding van letters naar hexacodes uit te zetten? Heb al aardig wat gezocht via Google, maar kom niet verder dat encoding uitzetten niet kan, maar dat is onzin want ik zie vaak genoeg URL's met exotische karakters.

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Verwijderd schreef op vrijdag 13 januari 2012 @ 23:37:
Is er een manier om die encoding van letters naar hexacodes uit te zetten?
Nee. Punt. Daarom.
Dat de browser het 'mooi' weergeeft is puur iets van de browser; wat er naar de server gaat dient encoded te zijn.

[ Voor 89% gewijzigd door RobIII op 14-01-2012 00:43 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • P_de_B
  • Registratie: Juli 2003
  • Niet online
Waarom zou je dit willen? Misschien snap je iets niet helemaal goed en wil je om de foute redenen die encoding niet toepassen?

Oops! Google Chrome could not find www.rijks%20museum.nl


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ga eens naar deze link:

wikipedia.org/wiki/Sør-Trøndelag

Dan zul je bovenin in de adresbalk precies hetzelfde zien, in plaats van dit:

wikipedia.org/wiki/S%C3%B8r-Tr%C3%B8ndelag

Kort samengevat: ik wil het woord (precies) zoals ik 't invoer in de form, terugzien op de andere pagina in de URL, zonder encoding dus. Er moet een manier zijn, ik heb suf gezocht op Google op termen als display special characters in URL, disable URL encoding for special characters... maar niets te vinden... hoe flikt wikipedia het dan...

Acties:
  • 0 Henk 'm!

  • NeFoRcE
  • Registratie: Mei 2004
  • Laatst online: 16:11

NeFoRcE

Hallo? Bent u daar?

Verwijderd schreef op zaterdag 14 januari 2012 @ 00:24:
Ga eens naar deze link:

wikipedia.org/wiki/Sør-Trøndelag

Dan zul je bovenin in de adresbalk precies hetzelfde zien, in plaats van dit:

wikipedia.org/wiki/S%C3%B8r-Tr%C3%B8ndelag

Kort samengevat: ik wil het woord (precies) zoals ik 't invoer in de form, terugzien op de andere pagina in de URL, zonder encoding dus. Er moet een manier zijn, ik heb suf gezocht op Google op termen als display special characters in URL, disable URL encoding for special characters... maar niets te vinden... hoe flikt wikipedia het dan...
[avondmode]
Gewoon... omdat zij het kunnen
[/avondmode]

OT:
Ik ben er ook wel benieuwd naar eigenlijk. Nooit echt in verdiept.. omdat ik het niet nodig had..

Professioneel Heftruck Syndroom


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
UTF8 gebruiken

[ Voor 199% gewijzigd door RobIII op 14-01-2012 00:39 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
P_de_B schreef op zaterdag 14 januari 2012 @ 00:15:
Waarom zou je dit willen? Misschien snap je iets niet helemaal goed en wil je om de foute redenen die encoding niet toepassen?
In zoekresultaten lijkt me een dergelijke link (dus waar geen %E7%F6s%E2k%FD in voorkomt) vriendelijker voor het oog, vandaar dat ik ze op die manier wil laten indexeren.

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Dat doe ik al (denk ik), ik heb de meta charset op utf-8 gezet op de form pagina. De mysql connection character _set en collation_connection staat eveneens op utf-8 ingesteld op de target pagina.

Acties:
  • 0 Henk 'm!

  • RangedNeedles
  • Registratie: Juli 2009
  • Niet online
Of mod rewrite van Apache (ofzoiets) gebruiken? Je weet wel, dat ie alle URLs gaat herschrijven en dat de URL die je ziet, niet de 'echte ' URL is :)

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Verwijderd schreef op zaterdag 14 januari 2012 @ 00:24:
Ga eens naar deze link:

wikipedia.org/wiki/Sør-Trøndelag

Dan zul je bovenin in de adresbalk precies hetzelfde zien, in plaats van dit:

wikipedia.org/wiki/S%C3%B8r-Tr%C3%B8ndelag
Da's een browser-feature. Het laatste is wel wat je browser doorstuurt naar de server.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Afbeeldingslocatie: http://tweakers.net/ext/f/QWEJ9kThsIKLsptCXcEh5qMb/thumb.png

;)

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Als het inderdaad een browser feature is, dan zou je toch immer de 'genormaliseerde' versie van de URL in de adresbalk moeten zie? Daartegen zie ik vaag genoeg termen als %E7%F6s%E2k%FD in de adresbalk, en soms zie ik dus ook: çösâkı in de adresbalk staan. Ook in zoekresultaten.

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
http://www.w3.org/International/articles/idn-and-iri/

The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

Ik denk dat je ergens een verschil/probleem hebt met je encoding tussen document en address bar ofzo :?

Testcase: http://got.devcorner.nl/testcases/1487731/

[ Voor 7% gewijzigd door RobIII op 14-01-2012 00:49 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Bijvoorbeeld:

Afbeeldingslocatie: http://img850.imageshack.us/img850/1217/corek.png

Is dit bijvoorbeeld een browserfeature? Of is de link daadwerkelijk zo? Als ik erop klik, krijg ik precies dezelfde link in de adresbalk te zien.

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Verwijderd schreef op zaterdag 14 januari 2012 @ 00:51:
Is dit bijvoorbeeld een browserfeature? Of is de link daadwerkelijk zo?
:X Je hebt wel eens gehoord van HTML? :P Je weet dat een anchor een href en text heeft en dat die niet per-se overeen hoeven komen? -> http://www.google.com :Y)

<a href="http://foo.net/.../%C3%87%C3%B6rek">foo.net/.../Çörek</a>

Of:

<a href="http://foo.net/.../%C3%87%C3%B6rek">foo.net/.../&#199;&#246;rek</a>

Of:

<a href="http://foo.net/.../%C3%87%C3%B6rek">Appelflap</a>

Het rode is wat er in de HTML staat (of kan staan, de foo.net/.../Çörek variant kan er net zo goed staan, maar het zal altijd percent-encoded naar de webserver verstuurd worden), het groene is wat jij ziet (en omcirkeld hebt), waarbij de 2e variant HTML encoded is en de eerste niet.

Heb je m'n testcase uit m'n vorige post al eens goed bekeken? Je zult zien dat ze beiden exact dezelfde HTML (qua URL) voorgeschoteld krijgen; het énige verschil tussen de pagina's is de charset.

[ Voor 83% gewijzigd door RobIII op 14-01-2012 02:40 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Goed, het is me nu duidelijk de boel 'percent-encoded' naar de webserver worden verstuurd, superveel dank voor je uitleg Rob! :) Niettemin is het voor mij nog steeds een mysterie hoe je in de adresbalk die speciale characters kunt weerwegeven. Ik wil namelijk dat als iemand een woord met special characters invoert in een formulier en dit submit, dat op de target pagina (waar gebruik wordt gemaakt van een get request), dit woordje exact in de adresbalk zo weergegeven wordt, ipv 'percent-encoded'. Ik heb de testcase van Rob bekeken, en bij UTF-8 krijg je inderdaad geen percent-encoded adres, resteert mij de vraag hoe ik UTF-8 'kan gebruiken' op mijn website... Ik heb op de form pagina de meta charset op utf-8 gezet, moet dit ook op de target pagina? Of moet ik überhaupt niet in termen van metadata denken?

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Yessssssss, het is gelukt!

Lekker dom, ik had utf8 geschreven in de meta-charset ipv utf-8 8)7

Super bedankt Rob! _/-\o_

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Misschien een handige link (inzake speciale karakters) voor anderen:

http://www.atto.nl/utf8/

(geschreven in het Nederlands, met praktijkvoorbeelden)

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Hoky shit; dat artikel bevat zoveel fouten en verkeerde practices dat ik niet weet waar te beginnen :X Doe jezelf een lol en laat die pagina voor wat 't is...

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • wackmaniac
  • Registratie: Februari 2004
  • Laatst online: 10:21

Read the code, write the code, be the code!


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • wackmaniac
  • Registratie: Februari 2004
  • Laatst online: 10:21
Ai, dat is een klein faaltje ... maarja, zo te zien had de TS de pagina nog niet gelezen, dus laten we het op een herhaling houden :D

Read the code, write the code, be the code!

Pagina: 1