Ik ben op zoek naar een zo goed mogelijk algoritme om huisnummers uit straatnamen te herkennen. 'Niks aan' zou je op eerste gezicht zeggen, maar het algoritme moet - naast de eenvoudige Kerkstraat 1 - kunnen functioneren met o.a. de volgende mogelijkheden:
Ik heb een tabel tot mijn beschikking met daarin alle voorkomende postcode/huisnummer combinaties van Nederland (ZONDER straatnaam, alleen huisnummer en postcode), maar een opzoekactie kost tijd (bijna 10 miljoen records), dat moet dus geminimaliseerd worden.
Momenteel heb ik een algoritme wat het volgende principe toepast:
Maar dit algoritme is dus vooral op dit punt niet waterdicht en ik ben dus op zoek naar mogelijke uitbreidingen/verbeteringen op dit algoritme.
            - Kerkstraat 1 3 hoog
 - Kerkstraat 14-16
 - Plein 40-45 5
 - Plein 40-45 5 2hg
 - 3de van der Helststraat 5
 - Rijksweg N73 10
 
Ik heb een tabel tot mijn beschikking met daarin alle voorkomende postcode/huisnummer combinaties van Nederland (ZONDER straatnaam, alleen huisnummer en postcode), maar een opzoekactie kost tijd (bijna 10 miljoen records), dat moet dus geminimaliseerd worden.
Momenteel heb ik een algoritme wat het volgende principe toepast:
- Alle nummersequenties uit een straatnaam halen
 - Indien er te weinig voor het eerste nummer staat, deze weggooien (de 3 uit 3de van der Helststraat)
 - Alle numerieke waarden tegen de tabel houden en de eerste hit accepteren
 
Maar dit algoritme is dus vooral op dit punt niet waterdicht en ik ben dus op zoek naar mogelijke uitbreidingen/verbeteringen op dit algoritme.