Combinaties vinden in data

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • Beneveerg
  • Registratie: Augustus 2011
  • Laatst online: 30-09 21:37
Mijn vraag

Ik wil graag weten hoe vaak opties worden gecombineerd met andere opties. Bijvoorbeeld. Ik heb 100 schilders. Zij kiezen allen 6 kleuren uit. Er zijn z'n 600 kleuren om uit te kiezen.

Ik zou graag willen weten hoe ik kan zien hoevaak de kleur blauw samen met kleur rood wordt gekozen en hoevaak blauw met zwart wordt gekozen maar ook hoevaak oranje en paar samen gaan.

Om het nog mooier te maken zou ik willen weten hoevaak de combinatie rood, blauw, zwart voorkomt

Het doel is om niet vooraf op te geven welke combinatie er gezocht moet gaan worden, maar dat het programma/script zelf de combinaties zoek

Relevante software en hardware die ik gebruik

De gegevens heb ik nu in Excel staan. Het lijkt mij niet dat Excel dat kan. Ik zou graag willen leren hoe dit in Python werkt.

Wat ik al gevonden of geprobeerd heb

In Python ben ik aan de gang geweest met Pandas.Ik heb het voor elkaar gekregen om als ik
ingeef als Kleur 1: Rood en Kleur 2: Blauw dat het script dan laat zien hoevaak rood en blauw samen komen.

Nu zoek ik een manier om het script zelf de meest voorkomende combinaties te vinden.

Ik zoek niet naar een kant en klare code, maar meer naar een goede duw in de juiste richting.

Afbeeldingslocatie: https://tweakers.net/i/mKlQJgQPTG3OIVCkjPjaiRzQmCA=/800x/filters:strip_exif()/f/image/g5hUboLaPW09A0JIBcyeAi8P.png?f=fotoalbum_large

Het leven is te kort om te testen

Beste antwoord (via Beneveerg op 28-10-2022 16:37)


  • HenkDePoema
  • Registratie: Oktober 2005
  • Laatst online: 10:43
Heel simpel gezegd:
1. Bepaal hoeveel unieke combinaties er in 1 rij mogelijk zijn (afhankelijk van de datastructuur is dit meer of minder ingewikkeld. Kan in jouw voorbeeld bijv. 1 kleur vaker voorkomen per schilder?)
2. Ga voor elk van deze combinaties na hoe vaak die in de hele dataset voorkomen (sla bijv. per combinatie de 'count' op)
3. Sorteer de lijst met mogelijke combinaties op de 'count' uit stap 2. Van hoog naar laag: de eerste waarde in die lijst is je antwoord

Alle reacties


Acties:
  • Beste antwoord
  • 0 Henk 'm!

  • HenkDePoema
  • Registratie: Oktober 2005
  • Laatst online: 10:43
Heel simpel gezegd:
1. Bepaal hoeveel unieke combinaties er in 1 rij mogelijk zijn (afhankelijk van de datastructuur is dit meer of minder ingewikkeld. Kan in jouw voorbeeld bijv. 1 kleur vaker voorkomen per schilder?)
2. Ga voor elk van deze combinaties na hoe vaak die in de hele dataset voorkomen (sla bijv. per combinatie de 'count' op)
3. Sorteer de lijst met mogelijke combinaties op de 'count' uit stap 2. Van hoog naar laag: de eerste waarde in die lijst is je antwoord

Acties:
  • 0 Henk 'm!

  • fopjurist
  • Registratie: Mei 2021
  • Niet online

fopjurist

mr.drs. fopjurist

Beneveerg schreef op dinsdag 25 oktober 2022 @ 18:07:
De gegevens heb ik nu in Excel staan. Het lijkt mij niet dat Excel dat kan. Ik zou graag willen leren hoe dit in Python werkt.
De stapjes die HenkDePoema noemt, kunnen ook in Excel:

Stap 1 met https://www.howtoexcel.or...-of-items-from-two-lists/
Stap 2 met AANTAL.ALS
Stap 3 met de standaard sorteerfunctie

Beschermheer van het consumentenrecht


Acties:
  • +2 Henk 'm!

  • Freeaqingme
  • Registratie: April 2006
  • Laatst online: 15:13
Bedenk ook even of de combinatie rood-blauw, hetzelfde is als rood-blauw.

EDIT: Ik bedoelde natuurlijk:
Bedenk ook even of de combinatie rood-blauw, hetzelfde is als blauw-rood.

[ Voor 42% gewijzigd door Freeaqingme op 28-10-2022 16:47 ]

No trees were harmed in creating this message. However, a large number of electrons were terribly inconvenienced.


Acties:
  • +2 Henk 'm!

  • pagani
  • Registratie: Januari 2002
  • Niet online
En bedenk je dat alleen al voor combinaties van twee kleuren je 600!/2 opties hebt (als blauw - rood en rood-blauw gelijk zijn)

Het wordt al snel handiger om een slimmer tabelletje/algoritme te bedenken.

Acties:
  • 0 Henk 'm!

  • Beneveerg
  • Registratie: Augustus 2011
  • Laatst online: 30-09 21:37
Elke schilder heeft maar 1 maal de keuze voor een kleur. Je kan dus geen 2 keer blauw hebben. Rood-Blauw is het zelfde als Blauw-Rood

In dit geval komt Blauw-Rood 3 keer voor. Rood-Groen en Blauw-Groen komen ook 3 keer voor.

Groen-Beige is in dit geval geen combinatie die voorkomt. Met zoveel mogelijke kleuren lijkt alle mogelijke combinaties checken niet te doen?

Het leven is te kort om te testen


Acties:
  • +1 Henk 'm!

  • Klaasvaak
  • Registratie: Maart 2010
  • Laatst online: 25-09 21:53
Je hoeft niet te kijken naar hoeveel combinaties je uit 600 kleuren kan maken. Alleen de gekozen kleuren zijn van belang.

Per schilder: 6 uit 6, 5 uit 6, enz. Dat dan keer 100 levert 13800 5700 combinaties op.

Als je de kleuren per schilder eerst sorteert staan ze altijd als de combinatie blauw-rood.

[ Voor 1% gewijzigd door Klaasvaak op 26-10-2022 13:47 . Reden: rekenfoutje ]


Acties:
  • 0 Henk 'm!

  • Beneveerg
  • Registratie: Augustus 2011
  • Laatst online: 30-09 21:37
Bedankt voor de hulp. Het script zoekt nu alle mogelijke combinaties op en telt daarna hoevaak de combinaties voorkomen.

Het leven is te kort om te testen

Pagina: 1