Mijn vraag
Hey mensen, ik probeer een regex te bouwen die geocoordinaten moet vangen.
Een van de voorbeelden bevat een string als
Het lukt om degrees te vangen, maar de quote wordt niet opgepikt. Deze heeft URL encoding: %E2%80%99 en als ik het goed heb gevonden een alt-2019 code.
Relevante software en hardware die ik gebruik
Vermoedelijk een C++ implementatie van RegEx
Het vervelende is dat we de regex expressie moeten definiëren in een XML bestand. Daarmee zitten we potentiëel met een dubbele encodering (zie hieronder).
Wat ik al gevonden of geprobeerd heb
We hebben al verschillende manieren van escapen of rechstreeks copy-pasten van het karakter geprobeerd, maar hij vind hem niet.
Omdat we verschillende schrijfwijzen willen vangen maken we gebruik van een groep:
Daarbij wordt de schrijfwijze
wel gevonden maar de versie met de right single quotes niet.
Volgens de XML documentatie zou de right single quote ook niet xml escaped hoeven te worden en zou deze dus als zodanig in de RegEx opgenomen moeten kunnen worden. Toch wordt de string niet gevangen. Iemand hier ideeën over?
Hey mensen, ik probeer een regex te bouwen die geocoordinaten moet vangen.
Een van de voorbeelden bevat een string als
code:
1
| 23°14’34’E |
Het lukt om degrees te vangen, maar de quote wordt niet opgepikt. Deze heeft URL encoding: %E2%80%99 en als ik het goed heb gevonden een alt-2019 code.
Relevante software en hardware die ik gebruik
Vermoedelijk een C++ implementatie van RegEx
Het vervelende is dat we de regex expressie moeten definiëren in een XML bestand. Daarmee zitten we potentiëel met een dubbele encodering (zie hieronder).
Wat ik al gevonden of geprobeerd heb
We hebben al verschillende manieren van escapen of rechstreeks copy-pasten van het karakter geprobeerd, maar hij vind hem niet.
Omdat we verschillende schrijfwijzen willen vangen maken we gebruik van een groep:
code:
1
| ["’ ] |
Daarbij wordt de schrijfwijze
code:
1
| 23°14'34'E |
wel gevonden maar de versie met de right single quotes niet.
Volgens de XML documentatie zou de right single quote ook niet xml escaped hoeven te worden en zou deze dus als zodanig in de RegEx opgenomen moeten kunnen worden. Toch wordt de string niet gevangen. Iemand hier ideeën over?
[ Voor 3% gewijzigd door ElCondor op 13-05-2024 11:55 ]
Hay 365 dias en un año y 366 occasiones para festejar (Boliviaans spreekwoord)