Hallo,
Ik heb een database van 50 gig en daar wil ik wat informatie uithalen. Ik heb alleen maar leesrecht. Bij andere opdrachten trek ik zo'n database naar mijn lokale pc, en haal er vervolgens uit wat ik nodig heb (voor statistische modelletjes), echter, nu trek ik liever geen 50 gig door een 10Mbit lijntje.
Normaal gesproken is mijn beperkte databasekennis geen probleem voor het verkrijgen van data, echter nu, na wat speurwerk met Google, ben ik er nog niet uit.
De database heeft de volgende simpele platte structuur:
Merk nogmaals op dat ik alleen leesrechten heb!
Ik wil producten A&B categoriseren als productgroep A* en product C als C*.
Vervolgens wil ik de volgende lijst:
Ik wil dus een lijst met unieke bedrijf* product combinaties, waarbij de orginele producten zijn gegroepeerd in nieuwe productgroepen.
Even voor de beeldvorming: er zijn zo'n 1200 verschillende producten, over 6 maanden en een 1.000.000 bedrijven. Ik wil de 1200 producten terugbrengen tot 30 categorieen.
Iemand een idee? Waar moet ik op zoeken in Google?
Ik heb een database van 50 gig en daar wil ik wat informatie uithalen. Ik heb alleen maar leesrecht. Bij andere opdrachten trek ik zo'n database naar mijn lokale pc, en haal er vervolgens uit wat ik nodig heb (voor statistische modelletjes), echter, nu trek ik liever geen 50 gig door een 10Mbit lijntje.
Normaal gesproken is mijn beperkte databasekennis geen probleem voor het verkrijgen van data, echter nu, na wat speurwerk met Google, ben ik er nog niet uit.
De database heeft de volgende simpele platte structuur:
code:
1
2
3
4
5
6
7
8
| bedrijf maand product andere_vars X 1 A .. X 1 B .. X 2 A .. X 2 B .. Y 1 C Y 2 C Y 3 C |
Merk nogmaals op dat ik alleen leesrechten heb!
Ik wil producten A&B categoriseren als productgroep A* en product C als C*.
Vervolgens wil ik de volgende lijst:
code:
1
2
3
| bedrijf product X A* .. Y C* .. |
Ik wil dus een lijst met unieke bedrijf* product combinaties, waarbij de orginele producten zijn gegroepeerd in nieuwe productgroepen.
Even voor de beeldvorming: er zijn zo'n 1200 verschillende producten, over 6 maanden en een 1.000.000 bedrijven. Ik wil de 1200 producten terugbrengen tot 30 categorieen.
Iemand een idee? Waar moet ik op zoeken in Google?