Extrapoleren bij een polynoom regressie model

Pagina: 1
Acties:
  • 584 views sinds 30-01-2008
  • Reageer

Acties:
  • 0 Henk 'm!

  • Frunnik
  • Registratie: Juni 2006
  • Laatst online: 02-04 11:20
Wil graag de omzet van 2007 extrapoleren.

1996 € 11.082
1997 € 11.698
1998 € 12.437
1999 € 12.930
2000 € 13.299
2001 € 13.545
2002 € 13.484
2003 € 13.299
2004 € 13.053
2005 € 12.683
2006 € 12.314
2007

y = -72,418x2 + 289936x - 3E+08
R2 = 0,9906


Ik blijft maar op een raar negatief getal uitkomen. (Heb de formule laten maken met excel mbv spreiding diagram)

Ik heb al gezocht op internet, alleen overal wordt het uitgelegd hoe het kan met een lineair verband. Dit is een sterk polynomisch verband!!

Wie o wie, weet welke functie ik moet gebruiken?!

Ik gebruik windowsXP, excell 2003

Acties:
  • 0 Henk 'm!

  • QuaQu
  • Registratie: Oktober 2002
  • Laatst online: 18-08-2021
De methode is verder wel prima hoor, maar daar kan je uiteraard niet bij iemand mee uitkomen :"Ja ik heb op wat knopjes in excel gedrukt". Daarvoor kan je bijvoorbeeld de sum-of-squares methode gebruiken om de parameters te schatten. Daar heb je wel de solver-add-in voor nodig, maar die kan je zelf makkelijk installeren.
Maar misschien is het ook handig je af te vragen of een 2e graads vergelijking wel klopt, misschien is het 4e graads of een andere niet-lineaire functie.
Aan het mooie verband te zien, zou het wel eens huiswerk kunnen zijn en heb je dan niet ergens een boek waar het in uitgelegd staat?
Ik heb er even naar gekeken met matlab en de coefficienten lijken gewoon te kloppen hoor en ook voor het extrapoleren naar 2007 krijg ik er gewoon een waarde uit. Met de functie lijkt dus niks mis. Misschien raakt excel in de war van de hoge derde coefficient (3e8 = 3 x 108)... Als dat het is, kan je al je omzetten eens delen door 1000, en dan kijken hoe het gaat.
Wat je anders evt. nog zou kunnen proberen te doen is om een lineair verband tussen de laatste twee of drie jaar te nemen en dat maar door te trekken.... Dat is ook wel nergens op gebaseerd, maar ik heb het idee dat de kwadratische vergelijking dat ook niet is.

[ Voor 5% gewijzigd door QuaQu op 22-05-2007 17:07 ]

"Ik heb een boel geld uitgegeven aan drank, vrouwen en snelle auto's. De rest heb ik over de balk gesmeten." - George Best


Acties:
  • 0 Henk 'm!

  • Frunnik
  • Registratie: Juni 2006
  • Laatst online: 02-04 11:20
Het is een project voor school (HBO sales and marketing management). Er zijn dus helaas geen uitwerkingen.

Ik heb in excel de assen aangepast (y) en bij "trendlijn opmaken" "opties", "voorspelling"
met vooruit 1 eenheid verhoogt.

Daarna heb ik de grafiek enorm uitgerekt (enkele 100e regels) om de grafiek af te kunnen lezen, omdat ik de y schaalverdeling op 20 heb gezet.

Ik lees dan ongeveer €11.530.000 af?

Excell breekt zijn nek, als ik de formule probeer... krijg een raar hoog negatief getal!
---------------

Het is dus een tijdelijke oplossing, wat erg slordig is.
Krijg het met de formule nog steeds niet goed aan de gang!

[ Voor 11% gewijzigd door Frunnik op 22-05-2007 17:17 ]


Acties:
  • 0 Henk 'm!

  • QuaQu
  • Registratie: Oktober 2002
  • Laatst online: 18-08-2021
Heb er nog even in matlab naar gekeken en iig de coefficenten kloppen ongeveer en ook wat je er zo uitkrijgt lijkt wel te kloppen.
Maar belangrijker wat die waarde al dan niet is; is kwadratisch wel ergens op gebaseerd; lijkt met niet een heel vaak voorkomend model; over een paar jaar is er dan nl niet veel meer over van de omzet.
Het probleem komt verder van de grote getallen zo lijkt het, of een toch niet echt optimale schatting, waardoor door de grote getallen en de macht 2 er iets heftigs uitkomt.
Misschien nog iets; met Matlab kreeg ik de volgende waarschuwing:
code:
1
2
3
Warning: Polynomial is badly conditioned. Add points with distinct X
         values, reduce the degree of the polynomial, or try centering
         and scaling as described in HELP POLYFIT.

Zou ook nog wel eens aanleiding voor de rare getallen kunnen zijn, succes verder.

"Ik heb een boel geld uitgegeven aan drank, vrouwen en snelle auto's. De rest heb ik over de balk gesmeten." - George Best


Acties:
  • 0 Henk 'm!

  • Henk007
  • Registratie: December 2003
  • Laatst online: 06-04 00:29
Ontwikkel eerst eens een onderliggend model, dat het mechanisme van de omzetverandering als funktie van de tijd verklaart. Vervolgens kun de de parameters in dit model fitten met je data.
Iedere andere 'willekeurige' kromme door je grafiek heeft geen enkele voorspellende waarde.
Ik kan bijvoorbeeld prima een derdegraadsfunktie verzinnen die na 2006 weer gaat stijgen.
Of is (bedrijfs)-economie inderdaad geen echte wetenschap?

[ Voor 13% gewijzigd door Henk007 op 22-05-2007 19:03 ]


Acties:
  • 0 Henk 'm!

  • sam.vimes
  • Registratie: Januari 2007
  • Laatst online: 08-06 08:44
Als ik de meetwaarden in een grafiekje zet, ziet het er op het oog heel sterk uit als de linkerhelft van een derdegraads functie (y=a+bx+cx^2+dx^3 met positieve d). Ik zou dat als model nemen en een kleinstekwadratenschatting van (a,b,c,d) uitrekenen. Om absurd grote waarden in de coëfficiëntenmatrix te voorkomen is het verstandig om de x-waarden met (ongeveer) 2000 te verminderen.

Een snelle berekening geeft dan:
code:
1
2
3
4
5
a = 13266.9837
b =   243.3862
c =   -76.1603
d =     1.2473
R^2 = 0.992

De correlatiecoëfficiënt is 0.992, wat op een goede passing duidt en invullen van x=7 (komt overeen met jaar 2007) levert y = 11666.65, helemaal niet zo onwaarschijnlijk.

Edit:
Overigens, een kk-fit met model y = a + bx + cx^2 levert:
code:
1
2
3
4
a =   13246.0294
b =     261.8459
c =     -72.4184
R^2= 0.991

met een bijna even goede correlatiecoëfficiënt. Invullen van x = 7 geeft dan y = 11530. Dit was ook af te leiden uit de relatief kleine waarde van d.

Het derdegraadsmodel heeft als voordeel dat je het management kunt voorspiegelen dat vanaf 2040 de omzet weer omhoog zal gaan en vanaf 2054 weer positief zal zijn, terwijl bij het tweedegraadsmodel de omzet alleen maar zal dalen (wegens c<0). ;)

[ Voor 28% gewijzigd door sam.vimes op 23-05-2007 10:57 ]


Acties:
  • 0 Henk 'm!

  • Clock
  • Registratie: Maart 2005
  • Laatst online: 16-10 06:42
sam.vimes schreef op woensdag 23 mei 2007 @ 09:16:
Het derdegraadsmodel heeft als voordeel dat je het management kunt voorspiegelen dat vanaf 2040 de omzet weer omhoog zal gaan en vanaf 2054 weer positief zal zijn, terwijl bij het tweedegraadsmodel de omzet alleen maar zal dalen (wegens c<0). ;)

Even offtopic, maar ik heb me hier al vaker over verbaasd. Tuurlijk kan ik een kromme bedenken die door een x-aantal punten gaat. En dat kan idd een tweedegraads functie zijn, en een derdegraads functie, en wellicht ook nog wel een vierdegraads functie. Maar zoals je ook al zegt: deze verschillende functies lopen allemaal verschillend nadat ze door de gedefineerde punten zijn gegaan. Hoe kan je daar in vredesnaam nou fatoenlijk conclusies uittrekken? Het is toch net welke functie je kiest.

Ikzelf heb het extrapoleren alleen gebruikt in de natuurkunde, waar je in sommige situaties echt kan spreken van een liniair of kwadratisch verband. Daar kan je dan ook niet zomaar even een willekeurige functie doorheen trekken.

Acties:
  • 0 Henk 'm!

  • Frunnik
  • Registratie: Juni 2006
  • Laatst online: 02-04 11:20
Het management verwacht 5% daling!
Moet dit weerleggen met enkele mogelijkheden, dit model houdt natuurlijk niet rekening met de economie welvaart en andere aspecten. Het verloopt dus heel erg star.

Ik houd het bij €11530 (-6,4%)!

Bedankt voor de hulp!
Pagina: 1