Heel kort:
Tabel in mySQL
Moet worden:
Ofwel: heeft iemand iets gekocht dan komt er een 1 onder het product, bij die klant. Heeft iemand een product nog niet gekocht dan komt er een 0 onder het product, voor die klant.
Met deze gegevens kan ik dan weer verder om wat Collaborative Filtering toe te passen en uiteindelijk aanbevelingen te doen voor producten die wellicht ook interessant zijn voor klanten, op basis van wat andere klanten met een vergelijkbaar kooppatroon gekocht hebben (kNN-based methode via WEKA, voor een onderzoek wat ik doe).
Ik moet dus van de gegevens zoals die in de database staan (zie boven) naar een formaat zoals daaronder aangegeven. Dat hoeft niet binnen SQL te gebeuren, het mag ook gewoon geexporteerd worden naar een andere programma als het daar mee kan. Het gaat er uiteindelijk om dat ik de data op de geschetste manier heb, zodat ik ermee naar het volgende programma (WEKA dus) kan.
Tabel in mySQL
| id | product |
| 1 | aa |
| 1 | ab |
| 2 | aa |
| 3 | aa |
| 3 | ac |
Moet worden:
| id/product | aa | ab | ac |
| 1 | 1 | 1 | 0 |
| 2 | 1 | 0 | 0 |
| 3 | 1 | 0 | 1 |
Ofwel: heeft iemand iets gekocht dan komt er een 1 onder het product, bij die klant. Heeft iemand een product nog niet gekocht dan komt er een 0 onder het product, voor die klant.
Met deze gegevens kan ik dan weer verder om wat Collaborative Filtering toe te passen en uiteindelijk aanbevelingen te doen voor producten die wellicht ook interessant zijn voor klanten, op basis van wat andere klanten met een vergelijkbaar kooppatroon gekocht hebben (kNN-based methode via WEKA, voor een onderzoek wat ik doe).
Ik moet dus van de gegevens zoals die in de database staan (zie boven) naar een formaat zoals daaronder aangegeven. Dat hoeft niet binnen SQL te gebeuren, het mag ook gewoon geexporteerd worden naar een andere programma als het daar mee kan. Het gaat er uiteindelijk om dat ik de data op de geschetste manier heb, zodat ik ermee naar het volgende programma (WEKA dus) kan.