URL-parser heeft een hekel aan België

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • burne
  • Registratie: Maart 2000
  • Niet online

burne

Mine! Waah!

Topicstarter
Ik plakte lui een URL in een reactie, en de URL-parser knipt de ë op het einde van de URL af.

Da's een bug.. 🐛

I don't like facts. They have a liberal bias.

Beste antwoord (via burne op 11-06-2019 08:58)


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

burne schreef op zaterdag 8 juni 2019 @ 15:45:
Maar, je knipt nu een karakter van de URL af, en maakt het restant onbruikbaar. Ik vind het een bug omdat de URL-parser iets doet, maar niet het goede ding. Of hij zou 'm niet moeten parsen en niet klikbaar maken, of hij zou de urlencoding voor je moeten doen.
Als je een url binnen [url]-tags gebruikt dan fixen we eventuele encoderingsproblemen ook wel voor je, maar bij het herkennen van url's in tekst is dat een ander verhaal; daar moet eerst een afweging gemaakt worden wat eventueel bij een url kan horen en wat niet. Er wordt dan uitgegaan van valide syntax omdat anders in principe alle tekst volgend op een valide protocol+hostname wel als onderdeel van een url gezien kan worden, mits je alles maar correct encodeert :P

Ergo: als je problemen ondervind met dergelijke url's, gebruik dan de [url]-tag.
Overigens is dit in eerste instantie een browserprobleem; sommige browsers geven wel de correct geëncodeerde url bij copy/pasten vanuit de adresbalk, maar andere niet... :(

Intentionally left blank

Alle reacties


Acties:
  • +2 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Nee, dat is geen bug. De ë hoort url-encoded te zijn voor een geldige url.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • burne
  • Registratie: Maart 2000
  • Niet online

burne

Mine! Waah!

Topicstarter
Maar, je knipt nu een karakter van de URL af, en maakt het restant onbruikbaar. Ik vind het een bug omdat de URL-parser iets doet, maar niet het goede ding. Of hij zou 'm niet moeten parsen en niet klikbaar maken, of hij zou de urlencoding voor je moeten doen.

Dit

https://nl.wikipedia.org/wiki/Geschiedenis_van_achternamen_in_Nederland_en_België
of
https://nl.wikipedia.org/wiki/Geschiedenis_van_achternamen_in_Nederland_en_België is wat ik verwacht, niet

https://nl.wikipedia.org/...men_in_Nederland_en_België

En daarom vind ik het een bug :)

I don't like facts. They have a liberal bias.


Acties:
  • 0 Henk 'm!

  • Pjottski
  • Registratie: Maart 2001
  • Laatst online: 22:36

Pjottski

🦍 Monkey 🦍

Bij het rechtstreeks kopiëren van de link uit de adresbar kan ik de hyperlink direct goed parsen. Zie onderstaande.

https:// nl.wikipedia.org/wiki/Geschiedenis_van_achternamen_in_Nederland_en_Belgi%C3%AB

Dit is mijn uitspraak en daar zult u het mee moeten doen


Acties:
  • Beste antwoord
  • +1 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

burne schreef op zaterdag 8 juni 2019 @ 15:45:
Maar, je knipt nu een karakter van de URL af, en maakt het restant onbruikbaar. Ik vind het een bug omdat de URL-parser iets doet, maar niet het goede ding. Of hij zou 'm niet moeten parsen en niet klikbaar maken, of hij zou de urlencoding voor je moeten doen.
Als je een url binnen [url]-tags gebruikt dan fixen we eventuele encoderingsproblemen ook wel voor je, maar bij het herkennen van url's in tekst is dat een ander verhaal; daar moet eerst een afweging gemaakt worden wat eventueel bij een url kan horen en wat niet. Er wordt dan uitgegaan van valide syntax omdat anders in principe alle tekst volgend op een valide protocol+hostname wel als onderdeel van een url gezien kan worden, mits je alles maar correct encodeert :P

Ergo: als je problemen ondervind met dergelijke url's, gebruik dan de [url]-tag.
Overigens is dit in eerste instantie een browserprobleem; sommige browsers geven wel de correct geëncodeerde url bij copy/pasten vanuit de adresbalk, maar andere niet... :(

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • JeroenE
  • Registratie: Januari 2001
  • Niet online
crisp schreef op dinsdag 11 juni 2019 @ 08:42:
Als je een url binnen [url]-tags gebruikt dan fixen we eventuele encoderingsproblemen ook wel voor je
Als ik deze url wil gebruiken wordt hij niet herkent:
code:
1
[url="https://stromzähler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93"]kWh meter[/url]

Test: [url="https://stromzähler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93"]kWh meter[/url]


Als ik hem door diverse online URL encoders heen haal dan krijg ik voor die a-umlaut de waarde %C3%A4 terug. Dat helpt echter niet:

code:
1
[url="https://stromz%C3%A4hler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93]kWh meter[/url]

Test: [url="https://stromz%C3%A4hler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93]kWh meter[/url]


Werkt dit nog steeds niet goed of moet ik nog wat anders doen?

Acties:
  • 0 Henk 'm!

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Als ik hem door diverse online URL encoders heen haal dan krijg ik voor die a-umlaut de waarde %C3%A4 terug. Dat helpt echter niet:

code:
1
[url="https://stromz%C3%A4hler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93]kWh meter[/url]

Test: [url="https://stromz%C3%A4hler.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93]kWh meter[/url]
Dat is inderdaad niet goed, je moet er in dit geval een ander type encoding ("puny coding") gebruiken omdat het om de domeinnaam gaat.

code:
1
https://xn--stromzhler-v5a.eu/stromzaehler/drehstromzaehler/fuer-hutschiene-ungeeicht/129/sdm530d-3-ph.-dsz-fuer-din-hutschiene?c=93

Je kan dit uit je browser vissen via het netwerk-tabje van de developer tools. Of via online conversie-tools. Die xn-- geeft aan dat er 'punycoding' in zit en die -v5a verteld vziw dat er op de Xe plek (dus tussen z en h) en a-umlaut moet komen. Hoe het exact gedefinieerd is weet ik niet :P

Dat geeft dan deze url, die je browser er uit laat zien als een a-umlaut:

Als je in de broncode van die site kijkt (doe bijv inspect element op een linkje), zal je zien dat zij ook daar punycoding toepassen. En dus niet de urls die jij hier effectief plakt.
Werkt dit nog steeds niet goed of moet ik nog wat anders doen?
Een url met non-ascii karakters is gewoon invalid. Er zijn allerlei opties gekomen om toch non-ascii te kunnen zien, maar uiteindelijk converteren ze dat onderhuids dus naar ascii.
De procent-encoding is natuurlijk al heel lang mogelijk en punycoding is wat recenter, maar browsers zijn dat steeds vaker als 'de werkelijke waarde' gaan tonen, en doen dat (eigenlijk onterecht) ook bij copy&paste.

Dus "werkt niet goed"; volgens de url-specificatie, waar wij ons aan houden, voer je een ongeldige url in... Dit wel ondersteunen betekent voor ons helaas ook een niet-triviale klus omdat we dan deze strict genomen incorrecte urls moeten accepteren, herkennen en daarna omzetten naar een correcte.

En dan tegelijkertijd wel andere urls, die wel echt fout zijn, alsnog blijven weigeren omdat daar problemen mee kunnen ontstaan.

Acties:
  • 0 Henk 'm!

  • Proton_
  • Registratie: November 2011
  • Laatst online: 09:35

Proton_

Moderator Wonen & Mobiliteit 

Team Welles

ACM schreef op woensdag 24 juli 2019 @ 08:05:
[...]
Een url met non-ascii karakters is gewoon invalid. Er zijn allerlei opties gekomen om toch non-ascii te kunnen zien, maar uiteindelijk converteren ze dat onderhuids dus naar ascii.
De procent-encoding is natuurlijk al heel lang mogelijk en punycoding is wat recenter, maar browsers zijn dat steeds vaker als 'de werkelijke waarde' gaan tonen, en doen dat (eigenlijk onterecht) ook bij copy&paste.

Dus "werkt niet goed"; volgens de url-specificatie, waar wij ons aan houden, voer je een ongeldige url in... Dit wel ondersteunen betekent voor ons helaas ook een niet-triviale klus omdat we dan deze strict genomen incorrecte urls moeten accepteren, herkennen en daarna omzetten naar een correcte.

En dan tegelijkertijd wel andere urls, die wel echt fout zijn, alsnog blijven weigeren omdat daar problemen mee kunnen ontstaan.
Vanuit het oogpunt van gebruiksvriendelijkheid kun je wel overwegen in ieder geval via de url-dialoog de punycode en urlencoding te doen, zodat er betrouwbaar via de adresbalk geknipt en geplakt kan worden. Dat is voor de meeste users de enige manier om aan een url te komen :)

Zie ook
https://gathering.tweaker...version/75064192/17560146
Denken jullie dat [url="https://stromzähler.eu/media/pdf/1a/86/62/SDM630CT-MBus-V2.pdf"]dit ding[/url] dit kan monitoren?
(geen idee waarom dat geen nette link wordt)
Merk op dat zowel de ä als de - een escape nodig hadden.

Het ik-wil-een-warmtepomp FAQ topic- '23 MG5, douchen met wtw en Auer Edel Eau, verwarming met Vaillant Arotherm Plus.

Pagina: 1