Hur man beräknar restvariationen

Innehållsförteckning:

Anonim

Investerare använder modeller för rörelse av tillgångspriser för att förutsäga var priset på en investering kommer att vara vid en viss tidpunkt. De metoder som används för att göra dessa förutsägelser är en del av ett fält i statistik som kallas regressionsanalys. Beräkningen av restvariation av en uppsättning värden är ett regressionsanalysverktyg som mäter hur exakt modellens förutsägelser matchar de faktiska värdena.

Regressionslinje

De regressionslinjen visar hur tillgångens värde har förändrats på grund av förändringar i olika variabler. Även känd som a trendlinje, visar regressionslinjen "trend" av tillgångens pris. Regressionslinjen representeras av en linjär ekvation:

Y = a + bX

där "Y" är tillgångsvärdet, "a" är en konstant, "b" är en multiplikator och "X" är en variabel som är relaterad till tillgångsvärdet.

Till exempel, om modellen förutspår att ett hus med ett sovrum säljer för 300.000 dollar, säljer ett hus med två sovrum för 400.000 dollar och ett hus med tre sovrum säljer för 500.000 dollar kommer regressionslinjen att se ut:

Y = 200.000 + 100.000X

där "Y" är hemmets försäljningspris och "X" är antalet sovrum.

Y = 200 000 + 100 000 (1) = 300 000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200 000 + 100 000 (3) = 500 000

Scatterplot

en spridningsdiagram visar punkterna som representerar de faktiska korrelationerna mellan tillgångsvärdet och variabeln. Termen "scatterplot" härrör från det faktum att när dessa punkter är ritade på ett diagram verkar de vara "spridda" runt, istället för att ligga perfekt på regressionslinjen. Med hjälp av exemplet ovan kan vi få en scatterplot med dessa datapunkter:

Punkt 1: 1BR såld för 288.000 dollar

Punkt 2: 1BR såld för $ 315,000

Punkt 3: 2BR såldes för 395.000 dollar

Punkt 4: 2BR såldes för 410.000 dollar

Punkt 5: 3BR såld för $ 492,000

Punkt 6: 3BR såld för $ 507.000

Beräkning av restvariationer

Den resterande variansberäkningen börjar med summan av kvadrater av skillnader mellan tillgångens värde på regressionslinjen och varje motsvarande tillgångsvärde på scatterplot.

Kvadraterna av skillnaderna visas här:

Punkt 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12.000)2 = 144,000,000

Punkt 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (15 tusen)2 = 225,000,000

Punkt 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5000)2 = 25,000,000

Punkt 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10 tusen)2 = 100,000,000

Punkt 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8000)2 = 64,000,000

Punkt 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (7000)2 = 49,000,000

Summan av kvadraterna = 607,000,000

Den återstående variansen finns genom att ta summan av kvadraterna och dela den med (n-2), där "n" är antalet datapunkter på scatterplot.

RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.

Användar för återstående varians

Medan varje punkt på scatterplot inte stämmer perfekt med regressionslinjen, kommer en stabil modell att ha scatterplot-punkterna i en regelbunden fördelning runt regressionslinjen. Återstående varians kallas också "felvariation". En hög kvarvarande varians visar att regressionslinjen i den ursprungliga modellen kan vara felaktig. Vissa kalkylbladsfunktioner kan visa processen bakom att skapa en regressionslinje som passar närmare scatterplot-data.

Rekommenderad