[SQL] Spel/Typ fouten herkennen

Pagina: 1
Acties:

  • maurad3r
  • Registratie: Oktober 2004
  • Laatst online: 28-04 08:44
Hey mensen.

Ik heb een vraagje omtrend het herkennen van Spel- en/of Typfouten.
Ik beschik over een grote database met daarin de namen van artiesten, van deze gegevens weet ik dat ze (vrijwel allemaal) correct geschreven zijn.

Nu komt het probleem: Ik heb een andere lijst met artiest- en albumnamen. Deze gegevns zijn ingevoerd door een mens en zijn nooit gecontroleerd op juistheid: en deze gegevens staan dan ook vol met spel en typfouten! Ik wil deze (mogelijk foutgeschreven) gegevens koppelen aan mijn andere (goedgetypte) database op basis van de artiestnaam.

Het idee is dus dat ik alle artiestnamen uit mijn (foutgetypte lijst) doorloop: en voor iedere artiestnaam kijk of zijn gelijke in de database aanwezig is!

Nu de vraag: HOE kan ik dit vergelijken van artiestnamen het beste aanpakken? Ik heb al gezocht: maar als je niet weet waar je naar zoek is dit vrijwel niet te doen!

Is er iemand die me kan helpen??

Alvast hartelijk bedankt _/-\o_

  • Slagroom
  • Registratie: Juni 2001
  • Laatst online: 04-12-2025

  • whoami
  • Registratie: December 2000
  • Laatst online: 13:16
Over welk DBMS hebben we het hier ?

In Sql Server kan de 'difference' en 'soundex' functie je misschien helpen.

[ Voor 61% gewijzigd door whoami op 17-09-2005 17:47 ]

https://fgheysels.github.io/


Verwijderd

Gokje

http://dev.mysql.com/doc/mysql/en/string-functions.html

[ Voor 8% gewijzigd door Verwijderd op 17-09-2005 18:04 ]


  • maurad3r
  • Registratie: Oktober 2004
  • Laatst online: 28-04 08:44
PERFECT!!
Hij herkent (vrijwel) alles! _/-\o_ _/-\o_
Danku hartelijk!

De andere oplossingen ga ik ook nog even bekijken, wie weet brengen die nog betere resultaten met zich mee :)!

  • NMe
  • Registratie: Februari 2004
  • Laatst online: 15-04 22:07

NMe

Quia Ego Sic Dico.

Maurad3r schreef op zaterdag 17 september 2005 @ 18:34:
[...]

PERFECT!!
Hij herkent (vrijwel) alles! _/-\o_ _/-\o_
Danku hartelijk!

De andere oplossingen ga ik ook nog even bekijken, wie weet brengen die nog betere resultaten met zich mee :)!
Die SOUNDEX-functie werkt ook in MySQL, dus als je gegevens uit een database komen, dan kun je waarschijnlijk beter daarmee werken. :)
SQL:
1
2
3
SELECT *
FROM `tabel`
WHERE SOUNDEX('ingevoerde string') = SOUNDEX(`jouwveldindedatabase`)

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.


  • TutanRamon
  • Registratie: Februari 2001
  • Laatst online: 21-04 13:31
Ik heb zojuist ook gebruikt gemaakt van deze code maar ik krijg telkens de volgende foutmelding in SQL:

#1267 - Illegal mix of collations (utf8_general_ci,COERCIBLE) and (latin1_swedish_ci,IMPLICIT) for operation '='

We see things as we are, not as they are

Pagina: 1