Toon posts:

[bug] URL met niet-NL accent op letter wordt niet herkend

Pagina: 1
Acties:

  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 04-02 18:47
In deze post van @ucsdcom staat een URL die niet goed wordt herkend door de code die er een link van probeert te maken. Dit komt doordat er een letter met een Scandinavisch accent in zit (å). Als gevolg hiervan is alleen het deel van de link vóór deze letter klikbaar en leidt het naar een 404.

Het gaat om deze URL: https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

(Na posten van dit bericht kunnen we gelijk zien of het alleen een frontpage bug is of ook op het forum :9)
(EDIT: Het probleem blijkt ook op het forum aanwezig :) )

De oplossing ligt vermoedelijk in het aanpassen van de regex die URLs moet herkennen, bijvoorbeeld door \w te vervangen door [A-Za-zÀ-ÖØ-öø-ÿ].

  • crisp
  • Registratie: Februari 2000
  • Laatst online: 12:38

crisp

Devver

Pixelated

Wikipedia: Spoorlijn Luleå - Narvik ;)

Gewoon copy/paste vanuit de adresbalk van het wikipedia-artikel gaat hier goed, met de juiste url-encoding zodat het ook een valide url is.

Intentionally left blank


  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 04-02 18:47
Hmm, inderdaad, als ik hem copy/paste vanuit de URL-balk van Firefox doet Firefox alvast de URL encoding. Zelfde met Edge. Geen idee welke browser @ucsdcom dan gebruikte voor zijn post, maar in ieder geval gaat het op Tweakers dus mis als je niet bij het posten zelf zorgt dat het alvast encoded is.

Maakt het probleem gelukkig wel ietsje kleiner :) Ik zou immers niet weten wat de encoding voor "å" is, maar zolang de browser dat voor me doet bij kopiëren heb ik geen last van deze bug :Y)

[Voor 16% gewijzigd door Jerrythafast op 14-01-2023 20:01]


  • crisp
  • Registratie: Februari 2000
  • Laatst online: 12:38

crisp

Devver

Pixelated

Feit is dat een å niet unencoded in een url voor mag komen. Dan kunnen we de url-detectie wel meer toegevend maken, maar dan loop je ook kans op meer fouten. Bij dit soort 'problemen' kan je dan beter expliciet aangeven dat het geheel een url is, dan fixen wij zelf de encoding:
code:
1
[url]https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik[/url]

https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

Intentionally left blank


  • Jerrythafast
  • Registratie: September 2012
  • Laatst online: 04-02 18:47
Daar heb je een goed punt natuurlijk, hij moet niet te gretig worden.

Ook de Samsung browser op mijn S10e encodeert vanzelf bij kopiëren uit de URL balk. Dus misschien is het toch een beetje een non issue }:O

  • Wild Chocolate
  • Registratie: Januari 2014
  • Laatst online: 11:57
https://nl.wikipedia.org/wiki/Spoorlijn_Luleå_-_Narvik

Vanuit de adresbalk kopiëren in Opera (94.0.4606.54) geeft bovenstaand resultaat, die doet dat dus kennelijk niet.

iRacing Profiel

Pagina: 1


Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee