[Suggestie] Verbeterde automatische koppeling

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Balance
  • Registratie: Januari 2013
  • Laatst online: 18-09 18:23
Je zou toch zeggen dat je dit soort koppelingen automatisch moet kunnen laten gebeuren. Of er in ieder geval voor zorgen dat ergens een melding komt dat deze twee producten toch wel heeeel veel op elkaar lijken.

Afbeeldingslocatie: http://tweakers.net/ext/f/xCq7NOgKyEmZ9jKV7UvzeQi1/full.png

Ik denk dat er eens goed nagedacht moet worden over een algoritme dat strings tekst en eventueel zelfs prijzen met elkaar vergelijkt om dit soort koppelingen automatisch te laten gaan.

Acties:
  • 0 Henk 'm!

  • Balance
  • Registratie: Januari 2013
  • Laatst online: 18-09 18:23
Hier nog een beter voorbeeld: Totaal onvindbaar behalve als je in de ongesorteerde producten gaat kijken.

Afbeeldingslocatie: http://tweakers.net/ext/f/qDNbJRgHkMjh6XTAV2SjkakL/full.png

Acties:
  • 0 Henk 'm!

  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Dat automatisch koppelen is niet zo simpel als jullie nu suggereren. Wanneer lijken productnamen veel op elkaar? En wanneer is het een compleet ander product?

Er zijn zat producten waarvan de naam een beetje afwijkt, maar het iets heel anders is. Bij beide voorbeelden zou je kunnen zeggen dat 'toevoegingen' kunnen worden genegeerd. Maar dan zouden we ook de Samsung Galaxy S5 Neo hebben samengevoegd met de gewone Samsung Galaxy S5. En er zijn vziw ook wel producten (geweest) met een naam als 'USB', zouden we dan alle andere producten waar het woord USB in voorkomt automatisch moeten samenvoegen?

Ook 'spelfouten' kun je niet zomaar aannemen, er is bijvoorbeeld ook een Asus RT-AC68U.

Wij (mensen) zijn vrij goed in dat uit elkaar houden, vooral ook omdat we weten welke elementen wel en niet relevant zijn uit een naam of welke synoniemen er zijn (zilver vs silver bijvoorbeeld). En wellicht ook omdat wij behoorlijk zeker weten dat er maar één "Gear 360"-product is, ipv dat er eentje van Samsung is en dat daarnaast het merk Gear een product "360" heeft gemaakt.

Maar ik zie niet hoe we dat succesvol kunnen programmeren, althans niet zodanig dat de hitrate significant hoger wordt dan het huidige matchen op EAN/SKU en we toch nooit onterecht verschillende producten samenvoegen.
Dat onterecht samenvoegen zou tenslotte zeer lastig te herkennen zijn nadat dat automatisch is gedaan en daarna eigenlijk alleen nog te herleiden zijn doordat er prijsfouten bij het ten onrechte samengestelde product staan.

En ook die kunnen we daarna niet meer zomaar automatisch herkennen, want volgens ons systeem kloppen die prijzen precies met wat op de site van de winkelier staat... alleen is dat voor ons mensen weer een overduidelijke fout want het is een ander product; die zouden we toch automatisch moeten kunnen herkennen? Want de naam is toch duidelijk anders? ;)

Kortom, als iemand een goed idee heeft om dit te automatiseren, dan hoor ik het graag. Maar ik zie zo snel geen oplossing die geen false positives oplevert (onterecht koppelen), false negatives zullen er sowieso wel blijven (onterecht niet koppelen).

Die losse producten komen overigens alleen als winkeliers andere (EAN's of SKU's) gebruiken dan wij kennen. Wij kunnen dergelijke missende EAN's en SKU's bij dat ene product toevoegen, waardoor dit fenomeen in ieder geval heel eenvoudig handmatig is op te lossen.

Mocht je zoiets dan ook tegenkomen, dan zouden we het enorm op prijs stellen als je de koppeling handmatig wilt toevoegen via de melding die je bovenin bij die 'Ongesorteerd'-producten krijgt. En zo te zien is dat hier reeds gedaan, dus dank daarvoor :)