[bug] URL met niet-NL accent op letter wordt niet herkend

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 06:45
In deze post van @ucsdcom staat een URL die niet goed wordt herkend door de code die er een link van probeert te maken. Dit komt doordat er een letter met een Scandinavisch accent in zit (å). Als gevolg hiervan is alleen het deel van de link vóór deze letter klikbaar en leidt het naar een 404.

Het gaat om deze URL: https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

(Na posten van dit bericht kunnen we gelijk zien of het alleen een frontpage bug is of ook op het forum :9)
(EDIT: Het probleem blijkt ook op het forum aanwezig :) )

De oplossing ligt vermoedelijk in het aanpassen van de regex die URLs moet herkennen, bijvoorbeeld door \w te vervangen door [A-Za-zÀ-ÖØ-öø-ÿ].

Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 13:46

crisp

Devver

Pixelated

Wikipedia: Spoorlijn Luleå - Narvik ;)

Gewoon copy/paste vanuit de adresbalk van het wikipedia-artikel gaat hier goed, met de juiste url-encoding zodat het ook een valide url is.

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 06:45
Hmm, inderdaad, als ik hem copy/paste vanuit de URL-balk van Firefox doet Firefox alvast de URL encoding. Zelfde met Edge. Geen idee welke browser @ucsdcom dan gebruikte voor zijn post, maar in ieder geval gaat het op Tweakers dus mis als je niet bij het posten zelf zorgt dat het alvast encoded is.

Maakt het probleem gelukkig wel ietsje kleiner :) Ik zou immers niet weten wat de encoding voor "å" is, maar zolang de browser dat voor me doet bij kopiëren heb ik geen last van deze bug :Y)

[ Voor 16% gewijzigd door Jerrythafast op 14-01-2023 20:01 ]


Acties:
  • 0 Henk 'm!

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 13:46

crisp

Devver

Pixelated

Feit is dat een å niet unencoded in een url voor mag komen. Dan kunnen we de url-detectie wel meer toegevend maken, maar dan loop je ook kans op meer fouten. Bij dit soort 'problemen' kan je dan beter expliciet aangeven dat het geheel een url is, dan fixen wij zelf de encoding:
code:
1
[url]https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik[/url]

https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

Intentionally left blank


Acties:
  • 0 Henk 'm!

  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 06:45
Daar heb je een goed punt natuurlijk, hij moet niet te gretig worden.

Ook de Samsung browser op mijn S10e encodeert vanzelf bij kopiëren uit de URL balk. Dus misschien is het toch een beetje een non issue }:O

Acties:
  • +2 Henk 'm!

  • Wild Chocolate
  • Registratie: Januari 2014
  • Nu online
https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

Vanuit de adresbalk kopiëren in Opera (94.0.4606.54) geeft bovenstaand resultaat, die doet dat dus kennelijk niet.

iRacing Profiel

Pagina: 1