Na lang stoeien toch maar besloten mijn probleem met jullie te delen. Ik ben erg dichtbij gekomen, maar het lukt me net niet.
Momenteel ben ik bezig een MSSQL-tabel met gebruikergegevens (NL & BE) te converteren naar een MySQL-tabel, en ik probeer meteen zoveel mogelijk data via een PHP-script op te schonen of te splitsen naar verschillende velden.
Momenteel loop ik vast bij het veld 'city', waar onze zuiderburen vaak iets als "Brussel, België" ingevuld hebben.
Ik probeer nu met een regex het volgende voor elkaar te krijgen:
Brussel (België) => Group 2: Brussel, Groep 3: België
Antwerpen [Belgie) => Group 2: Antwerpen, Groep 3: Belgie
Brussel, belgië => Group 2: Brussel, Groep 3: België
Brussel (BELGIE => Group 2: Brussel, Groep 3: Belgie
deurne,belgie => Group 2: deurn, Group 3: belgie
Ik ben een heel eind gekomen met de volgende regex:
Maar ik heb nu nog het probleem dat de komma in de capturing group terecht komt.
Op de een of andere manier heb ik altijd ruzie met regex-en, dus ik zal wel weer iets heel simpels of stoms verkeerd doen.. maar wat?
Overigens check ik verderop in m'n script of Groep 3 gevuld is met iets. Zoja, dan ga ik er vanuit dat het om een Belgisch-persoon gaat.
Momenteel ben ik bezig een MSSQL-tabel met gebruikergegevens (NL & BE) te converteren naar een MySQL-tabel, en ik probeer meteen zoveel mogelijk data via een PHP-script op te schonen of te splitsen naar verschillende velden.
Momenteel loop ik vast bij het veld 'city', waar onze zuiderburen vaak iets als "Brussel, België" ingevuld hebben.
Ik probeer nu met een regex het volgende voor elkaar te krijgen:
Brussel (België) => Group 2: Brussel, Groep 3: België
Antwerpen [Belgie) => Group 2: Antwerpen, Groep 3: Belgie
Brussel, belgië => Group 2: Brussel, Groep 3: België
Brussel (BELGIE => Group 2: Brussel, Groep 3: Belgie
deurne,belgie => Group 2: deurn, Group 3: belgie
Ik ben een heel eind gekomen met de volgende regex:
PHP:
1
| ^(([\w\W]+)+(?:[, ]+)?\(\[?(België|Belgie|belgie|belgië)\)\]?)$ |
Maar ik heb nu nog het probleem dat de komma in de capturing group terecht komt.
Op de een of andere manier heb ik altijd ruzie met regex-en, dus ik zal wel weer iets heel simpels of stoms verkeerd doen.. maar wat?
Overigens check ik verderop in m'n script of Groep 3 gevuld is met iets. Zoja, dan ga ik er vanuit dat het om een Belgisch-persoon gaat.