Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[PHP][MySQL]Veel data vergelijken met similar_text

Pagina: 1
Acties:

  • ursel
  • Registratie: Augustus 2001
  • Laatst online: 16-09-2021
De situatie is als volgt. We hebben in de database een klanten bestand van zo'n 10.000 namen staan.
1x per maand zal er een bestand verstuurd gaan worden waarin ook zo'n 10.000 namen staan.
We hebben momenteel al een generiek systeem dat de CSV files ophaalt en de file per line inleest en een array met alle lines retourneerd. Pas hierna wordt er gekeken wat voor een file het is en zal de betreffende functie aangeroepen worden.

Ik heb dus in het geheugen al een redelijke array opgeslagen staan.

Wat moet er gebeuren:
- Alle gegevens uit de CSV moeten opgeslagen worden in de DB
- Alle klanten moeten vergeleken worden met gegevens uit de CSV file middels bijv. similar_text.
- Bij een match van 90% of hoger moet de naam opgeslagen worden in een lijst en aan het eind van het gehele vergelijk proces moet er een mail uit met een lijst met gevonden resultaten.


Nu zit ik dus een beetje in dubio wat ik het beste kan doen, ook qua performance. Denk dat het beste is om eerst de CSV op te gaan slaan in de DB. Maar dan moet ik geavanceerd gaan queriën. Met de LIKE kan ik maar 1 kant op vergelijkingen gaan ophalen.

Wat zijn voor jullie de beste suggesties?

  • Elledan
  • Registratie: Maart 2008
  • Laatst online: 17-11-2013
Wat bedoel je precies met een match van 90%?

www.mayaposch.com


  • pedorus
  • Registratie: Januari 2008
  • Niet online
Het lijkt me handig om in ieder geval een tabel bij te houden met fout gespelde klantnamen en bijbehorende juiste namen of klantid's. Ik neem aan dat dezelfde fout vaak gaat voorkomen.

Voor de nieuwe klantnamen die niet matchen lijkt mij een snelle oplossing om soundex/sounds like te gebruiken, en daarna eventueel later de resultaten te sorteren op similar_text. Direct similar_text toepassen op 10.000 namen zou ik eerst even benchmarken, ik vraag me af hoe snel dat gaat. Aan de andere kant moet dat makkelijk kunnen, als het toch maar 1x per maand is.

(NB: ik kan de TS ook niet 100% volgen)

Vitamine D tekorten in Nederland | Dodelijk coronaforum gesloten