Hur man beräknar precisionen av data

Innehållsförteckning:

Anonim

Data precision är en av de viktigaste övervägandena vid genomförande av vetenskaplig eller statistisk analys. Vanligtvis förväxlas med lika viktigt begrepp om noggrannhet visar dartkortanalogen som formuleras av University of Hawaii att relationen är: exakta datapunkter är i genomsnitt lika stora som de förväntade resultaten, medan exakta datapunkter klarar sig nära varandra, även om de inte ligger nära varandra förväntade resultat. Enligt Dartmouth College är precision ett mått på reproducerbarheten av en uppsättning resultat. Precision i dataset är ett viktigt begrepp även i teknikrelaterade ansträngningar, vilket framgår av Kenneth E. Foote och Donald J. Huebner vid University of Texas-Austin i en analys av Geographic Information Systems. Beräkning av precision är en ganska enkel men något subjektiv övning.

Föremål du behöver

  • Grafisk representation av en dataset

  • Information om relevanta enheter uttryckta i data

  • Minsta tillåtna felmarginal i experimentet

Utveckla en visuell representation av datapunkter som en scatterplot. En mycket enkel visuell representation innebär att man skriver ut motsvarande beroende och oberoende variabla värden för varje datapunkt på ett kartesiskt koordinatsystem.

Bedöm grupperingarna av datapunkter och leta efter mönster. Exakta data manifestationer i kluster av datapunkter, vilket indikerar att liknande inmatningsvariabler korrelerar med liknande utgångsvariabler.

Använd information om måttenheter som används för att samla in data för att bestämma det genomsnittliga avståndet mellan datapunkter. En enkel linjalmätning kan användas för att bestämma avståndet mellan punkterna i diagrammet och sedan konverteras med en godtycklig, bekväm skala som motsvarar måttenheterna som används för att generera datapunkterna. Detta gör det möjligt att beräkna datapunkternas precision i förhållande till varandra genom att ta medeltalet av avstånden.

Jämför den minsta tillåtna felmarginalen i experimentet och medelprecisionen för datapunkterna för att bestämma den relativa totala precisionen för experimentet. Olika typer av experiment kommer att ha större eller mindre fel tolerans: ett tekniskt projekt kommer sannolikt att kräva precision till mycket små enheter, medan ett socialt experiment sannolikt kommer att tolerera mer variation.

tips

  • Försök att bedöma den sannolika enhetsskalan innan du skapar den grafiska representationen för datapunkterna. Detta gör det lättare att bedöma precision visuellt för att identifiera områden med särskilt märkbar precision eller oriktighet.

    Tydliga datamönster som förekommer på en visuell representation är mycket vägledande för precision och repeterbarhet av ett experiment. Fortsatt experiment bör lägga till ytterligare datapunkter i exakta kluster nära de som redan existerar.

Varning

Förvirra inte precisionen med precision. Om målet med ett experiment är att uppnå ett genomsnittligt utmatningsvärde för ge för alla ingångar, och detta uppnås med medelvärden som sträcker sig från -12 till 14, är det osannolikt att det är en exakt mätning, även om det kan vara korrekt. En exakt mätning kan leda till att alla datapunkter kluster kring 17, vilket skulle vara felaktigt men exakt och därför förutsägbart.