Wij krijgen een bestand met 18.000 namen die we nodig hebben voor koppelingen. Heel leuk alleen is dat bestand zo slecht gevuld dat de dat het tegelijkertijd zo goed als waardeloos is.
Wat is namelijk het geval de namen worden blijkbaar door iedereen ingebracht en zijn de ene keer echte namen en de andere keer gebouwsnamen en ze staan allemaal in één veld.
Wat is het eindresultaat?
A.B.C. de Graaf-Boer
ABC de boer
A. Karper
Graaf-Boer, A.B.C. de
Shell Olie
Bestaan er slimme algoritmen om de namen voorin te krijgen en voorletters achterin? Eventueel punten tussen de hoofdletters zetten als dat niet het geval is.
Dus:
Graaf-Boer, A.B.C de
Karper, A
Boer, A.B. de
Shell Olie
Sorry dit is een onzin vraag, het moet natuurlijk zijn is de naam ontleden en in 3 velden stoppen indien mogelijk, namelijk voorletters, voorvoegsels en achternaam cq naam.
Iemand hier al eens mee te maken gehad? De externe partij opvoeden hebben we al opgegeven.
Wat is namelijk het geval de namen worden blijkbaar door iedereen ingebracht en zijn de ene keer echte namen en de andere keer gebouwsnamen en ze staan allemaal in één veld.
Wat is het eindresultaat?
A.B.C. de Graaf-Boer
ABC de boer
A. Karper
Graaf-Boer, A.B.C. de
Shell Olie
Bestaan er slimme algoritmen om de namen voorin te krijgen en voorletters achterin? Eventueel punten tussen de hoofdletters zetten als dat niet het geval is.
Dus:
Graaf-Boer, A.B.C de
Karper, A
Boer, A.B. de
Shell Olie
Sorry dit is een onzin vraag, het moet natuurlijk zijn is de naam ontleden en in 3 velden stoppen indien mogelijk, namelijk voorletters, voorvoegsels en achternaam cq naam.
Iemand hier al eens mee te maken gehad? De externe partij opvoeden hebben we al opgegeven.
[ Voor 4% gewijzigd door ErikRo op 10-08-2005 20:29 ]
"I don't have any solution but I certainly admire the problem." -- Ashleigh Brilliant