Toon posts:

ontbrekende waarden en datamining

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik volg op dit moment een vak over datamining. Het lijkt allemaal wel leuk, maar in de praktijk werken dingen natuurlijk vaak anders. Nou hadden we de volgende discussie:

wat zijn de gevolgen voor het ontbreken van waarden voor de volgende methoden:

- algoritmes voor associatie regels
- het k-NN classificatie algorithme
- het k-gemiddelde clusterings algorithme
- het algorithme om beslissingsbomen te construeren

En als je daar dan achter bent, wat voor alleen dan een mogelijke oplossing van ontbrekende waarden zou zijn.

Ben erg benieuwd wat hier jullie mening over is.

  • Opi
  • Registratie: Maart 2002
  • Niet online

Opi

De ontbrekende waarden worden ingevuld door naar de rest van je data set te kijken (middelen (interpolatie) door te kijken hoe andere niet ontbrekende features zich verhouden tot desbetreffend datapoint). Hierdoor wordt de invloed van het gebruiken van informatie die aanwezig is in de data set naar mijn mening geminimaliseerd. (edit) dit is bijvoorbeeld het geval voor k-NN en k-mean. Wat betreft boomstructuren weet ik het niet zeker, maar ik vermoed dat iets soortgelijks geld.

Wat is overigens je eigen mening en in hoeverre heb je zelf naar de invloed van deze missing values gezocht? (edit) Je vraag namelijk niet echt naar onze mening, maar hoe dit op te lossen is.

[ Voor 23% gewijzigd door Opi op 25-02-2003 11:10 ]


Verwijderd

Topicstarter
Het punt is een beetje dat we er wel een mening over hebben, maar dat voor ons hier niet echt duidelijk is wat het verschil is bij de gebruikten methoden. Dat er naar de andere waarden gekeken moet worden, dat is natuurlijk wel duidelijk, alleen zoeken we dus naar de specifieke manieren waarop dit moet gebeuren.