Dat automatisch koppelen is niet zo simpel als jullie nu suggereren. Wanneer lijken productnamen veel op elkaar? En wanneer is het een compleet ander product?
Er zijn zat producten waarvan de naam een beetje afwijkt, maar het iets heel anders is. Bij beide voorbeelden zou je kunnen zeggen dat 'toevoegingen' kunnen worden genegeerd. Maar dan zouden we ook de Samsung Galaxy S5 Neo hebben samengevoegd met de gewone Samsung Galaxy S5. En er zijn vziw ook wel producten (geweest) met een naam als 'USB', zouden we dan alle andere producten waar het woord USB in voorkomt automatisch moeten samenvoegen?
Ook 'spelfouten' kun je niet zomaar aannemen, er is bijvoorbeeld ook een Asus
RT-AC68U.
Wij (mensen) zijn vrij goed in dat uit elkaar houden, vooral ook omdat we weten welke elementen wel en niet relevant zijn uit een naam of welke synoniemen er zijn (zilver vs silver bijvoorbeeld). En wellicht ook omdat wij behoorlijk zeker weten dat er maar één "Gear 360"-product is, ipv dat er eentje van Samsung is en dat daarnaast het merk Gear een product "360" heeft gemaakt.
Maar ik zie niet hoe we dat succesvol kunnen programmeren, althans niet zodanig dat de hitrate significant hoger wordt dan het huidige matchen op EAN/SKU en we toch nooit onterecht verschillende producten samenvoegen.
Dat onterecht samenvoegen zou tenslotte zeer lastig te herkennen zijn nadat dat automatisch is gedaan en daarna eigenlijk alleen nog te herleiden zijn doordat er prijsfouten bij het ten onrechte samengestelde product staan.
En ook die kunnen we daarna niet meer zomaar automatisch herkennen, want volgens ons systeem kloppen die prijzen precies met wat op de site van de winkelier staat... alleen is dat voor ons mensen weer een overduidelijke fout want het is een ander product; die zouden we toch automatisch moeten kunnen herkennen? Want de naam is toch duidelijk anders?
Kortom, als iemand een goed idee heeft om dit te automatiseren, dan hoor ik het graag. Maar ik zie zo snel geen oplossing die geen false positives oplevert (onterecht koppelen), false negatives zullen er sowieso wel blijven (onterecht niet koppelen).
Die losse producten komen overigens alleen als winkeliers andere (EAN's of SKU's) gebruiken dan wij kennen. Wij kunnen dergelijke missende EAN's en SKU's bij dat ene product toevoegen, waardoor dit fenomeen in ieder geval heel eenvoudig handmatig is op te lossen.
Mocht je zoiets dan ook tegenkomen, dan zouden we het enorm op prijs stellen als je de koppeling handmatig wilt toevoegen via de melding die je bovenin bij die 'Ongesorteerd'-producten krijgt. En zo te zien is dat hier reeds gedaan, dus dank daarvoor