Hur man beräknar variation i statistik

Innehållsförteckning:

Anonim

En av de mest grundläggande begreppen i statistiken är medelvärdet, eller aritmetisk medelvärde, av en uppsättning siffror. Medlet betyder ett centralt värde för datasatsen. De variation av en dataset mäter hur långt elementen i den datasatsen sprids ut från medelvärdet. Dataset där siffrorna är alla nära medelvärdet kommer att ha en låg varians. De uppsättningar där siffrorna är mycket högre eller lägre än medelvärdet kommer att ha en hög varians.

Beräkna medelvärdet för datasatsen

Beräkna kvadratiska skillnader

Nästa steg innebär att beräkna skillnaden mellan varje element i datasatsen och medelvärdet. Eftersom vissa element kommer att vara högre än medelvärdet och vissa kommer att vara lägre använder variansberäkningen kvadraten av skillnaderna.

Dag 1 Försäljning - Genomsnittlig försäljning: $ 62,000 - $ 65414,29 = (- $ 3,414,29); (-3,414.29)2 = 11,657,346.94

Dag 2 Försäljning - Genomsnittlig försäljning: $ 64.800- $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94

Dag 3 Försäljning - Genomsnittlig försäljning: $ 62,600 - $ 65414,29 = (- $ 2,814,29); (-2,814.29)2 = 7,920,204.08

Dag 4 Försäljning - Genomsnittlig försäljning: $ 69,200 - $ 65414,29 = (+ $ 3,785,71); (+3,785.71)2 = 14,331,632.65

Dag 5 Försäljning - Genomsnittlig försäljning: $ 66.000 - $ 65414.29 = (+ $ 585.71); (585,71)2 = 343,061.22

Dag 6 Försäljning - Genomsnittlig försäljning: $ 63,900 - $ 65414,29 = (- $ 1,514,29); (-1,514.29)2 = 2,293,061.22

Dag 7 Försäljning - Genomsnittlig försäljning: $ 69,400 - $ 65414,29 = (+ $ 3,985,71); (+3,985.71)2 = 15,885,918.37

NOTERA: Kvadrerade skillnaderna mäts inte i dollar. Dessa siffror används i nästa steg för att beräkna variansen.

Varians och standardavvikelse

Variansen definieras som medelvärdet för de kvadratiska skillnaderna.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Eftersom variansen använder kvadraten av skillnaden kommer kvadratroten av variansen att ge en tydligare indikation av den faktiska spridningen. I statistiken kallas kvadratroten av variansen standardavvikelse.

SQRT (7,544,081,63) = $ 2,746,65

Användning för variation och standardavvikelse

Både varians och standardavvikelse är mycket användbara i statistisk analys. Variansen mäter den totala spridningen av en dataset från medelvärdet. Standardavvikelsen hjälper till att upptäcka outliers, eller element i datasatsen som avviker för långt från medelvärdet.

I datasättningen ovan är variansen ganska hög, med endast två dagliga försäljnings totals upp till $ 1000 av medelvärdet. Datasättningen visar också att två av de sju dagliga försäljningsintäkterna är mer än en standardavvikelse över medelvärdet, medan två andra är mer än en standardavvikelse under medelvärdet.