Investerare använder modeller för rörelse av tillgångspriser för att förutsäga var priset på en investering kommer att vara vid en viss tidpunkt. De metoder som används för att göra dessa förutsägelser är en del av ett fält i statistik som kallas regressionsanalys. Beräkningen av restvariation av en uppsättning värden är ett regressionsanalysverktyg som mäter hur exakt modellens förutsägelser matchar de faktiska värdena.
Regressionslinje
De regressionslinjen visar hur tillgångens värde har förändrats på grund av förändringar i olika variabler. Även känd som a trendlinje, visar regressionslinjen "trend" av tillgångens pris. Regressionslinjen representeras av en linjär ekvation:
Y = a + bX
där "Y" är tillgångsvärdet, "a" är en konstant, "b" är en multiplikator och "X" är en variabel som är relaterad till tillgångsvärdet.
Till exempel, om modellen förutspår att ett hus med ett sovrum säljer för 300.000 dollar, säljer ett hus med två sovrum för 400.000 dollar och ett hus med tre sovrum säljer för 500.000 dollar kommer regressionslinjen att se ut:
Y = 200.000 + 100.000X
där "Y" är hemmets försäljningspris och "X" är antalet sovrum.
Y = 200 000 + 100 000 (1) = 300 000
Y = 200 000 + 100 000 (2) = 400 000
Y = 200 000 + 100 000 (3) = 500 000
Scatterplot
en spridningsdiagram visar punkterna som representerar de faktiska korrelationerna mellan tillgångsvärdet och variabeln. Termen "scatterplot" härrör från det faktum att när dessa punkter är ritade på ett diagram verkar de vara "spridda" runt, istället för att ligga perfekt på regressionslinjen. Med hjälp av exemplet ovan kan vi få en scatterplot med dessa datapunkter:
Punkt 1: 1BR såld för 288.000 dollar
Punkt 2: 1BR såld för $ 315,000
Punkt 3: 2BR såldes för 395.000 dollar
Punkt 4: 2BR såldes för 410.000 dollar
Punkt 5: 3BR såld för $ 492,000
Punkt 6: 3BR såld för $ 507.000
Beräkning av restvariationer
Den resterande variansberäkningen börjar med summan av kvadrater av skillnader mellan tillgångens värde på regressionslinjen och varje motsvarande tillgångsvärde på scatterplot.
Kvadraterna av skillnaderna visas här:
Punkt 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12.000)2 = 144,000,000
Punkt 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (15 tusen)2 = 225,000,000
Punkt 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5000)2 = 25,000,000
Punkt 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10 tusen)2 = 100,000,000
Punkt 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8000)2 = 64,000,000
Punkt 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (7000)2 = 49,000,000
Summan av kvadraterna = 607,000,000
Den återstående variansen finns genom att ta summan av kvadraterna och dela den med (n-2), där "n" är antalet datapunkter på scatterplot.
RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.
Användar för återstående varians
Medan varje punkt på scatterplot inte stämmer perfekt med regressionslinjen, kommer en stabil modell att ha scatterplot-punkterna i en regelbunden fördelning runt regressionslinjen. Återstående varians kallas också "felvariation". En hög kvarvarande varians visar att regressionslinjen i den ursprungliga modellen kan vara felaktig. Vissa kalkylbladsfunktioner kan visa processen bakom att skapa en regressionslinje som passar närmare scatterplot-data.