Vad är rätt och vad är fel?

Relevanta dokument
Några vanliga fördelningar från ett GUM-perspektiv

Forskningsmetodik 2006 lektion 2

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Kort om mätosäkerhet

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Ingenjörsmetodik IT & ME 2011 Föreläsning 11

Grundläggande matematisk statistik

Uppgift 1. f(x) = 2x om 0 x 1

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Realtidsuppdaterad fristation

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Experimentella metoder, FK3001. Datorövning: Finn ett samband

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Lektionsanteckningar 11-12: Normalfördelningen

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Ingenjörsmetodik IT & ME 2010 Föreläsning 5

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F9 Konfidensintervall

Hur skriver man statistikavsnittet i en ansökan?

Kvantitativ strategi Univariat analys 2. Wieland Wermke

F9 SAMPLINGFÖRDELNINGAR (NCT

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Experimentella metoder 2014, Räkneövning 1

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Tentamen i Matematisk statistik Kurskod S0001M

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

13.1 Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

SF1901 Sannolikhetsteori och statistik I

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Grundläggande matematisk statistik

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Mätning av fokallängd hos okänd lins

Mer om konfidensintervall + repetition

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Nr 1 (10p) a) En affär har två kylskåp i lager när den öppnar måndag morgon. Ytterligare skåp kan inte erhållas förrän på onsdagen.

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

LMA521: Statistisk kvalitetsstyrning

LMA522: Statistisk kvalitetsstyrning

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 7: Punktskattningar

Medicinsk statistik II

Parade och oparade test

Föreläsning 11: Mer om jämförelser och inferens

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Realtidsuppdaterad fristation

Tentamen i Matematisk statistik Kurskod S0001M

Hur måttsätta osäkerheter?

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Vetenskaplig metod och statistik

a = a a a a a a ± ± ± ±500

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hypotestestning och repetition

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Avd. Matematisk statistik

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Studietyper, inferens och konfidensintervall

Realtidsuppdaterad fristation

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Mätosäkerhet. Tillämpningsområde: Laboratoriemedicin. Bild- och Funktionsmedicin. %swedoc_nrdatumutgava_nr% SWEDAC DOC 05:3 Datum Utgåva 2

F3 Introduktion Stickprov

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Vetenskaplig metod och statistik

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Stockholms Universitet Fysikum Tentamensskrivning i Experimentell fysik för lärare 7.5 hp, för FK2004. Onsdagen den 14 december 2011 kl 9-14.

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 12, FMSF45 Hypotesprövning

F10 Problemlösning och mer om konfidensintervall

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen i Matematisk statistik Kurskod S0001M

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Föreläsning 7: Punktskattningar

Statistisk försöksplanering

Experimentella metoder 2013, Räkneövning 3

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Matematisk statistik KTH. Formelsamling i matematisk statistik

Systemkonstruktion Z3 (Kurs nr: SSY-046)

BEHANDLING AV MÄTDATA

Vetenskaplig metod och Statistik

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Föreläsning 7: Punktskattningar

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Transkript:

Vad är rätt och vad är fel? Inledning - Mikael Lilje, Lantmäteriet I vår verksamhet ingår troligen att vi utnyttjar inmätt geografisk information. För att kunna hantera informationen på ett så korrekt sätt som möjligt är det viktigt att känna till att alla mätningar som görs är behäftade med fel. Vi kan inte bestämma vår position så exakt så att vi kan anse den vara felfri. Varje geografiskt objekt har, eller borde ha, en kvalitetsuppgift kopplad till sig. Denna uppgift skulle kunna vara någon typ av medelfel. Genom att jämföra kvalitetsuppgiften mot uppställda felgränser kan vi dra slutsatser om vårt objekt håller tillräckligt hög noggrannhet eller inte för ändamålet. Felkällorna vid en mätning är många och de är av de mest varierande sorter. De kan vara av mänsklig karaktär, instrumentfel, påverkade av omgivningen eller ej optimala mätningsrutiner. Detta gör också att även om vi upprepar mätningarna antingen direkt efter varandra eller med flera timmars eller dagars mellanrum får vi inte samma resultat. Varje mätning påverkas på olika sätt av felkällorna. Till en inmätt detalj bör alltså om möjligt knytas en noggrannhetsupplysning för att säkerställa att dess användning görs på ett korrekt sätt. Denna uppgift hjälper användaren, om det är så att objektet ska utnyttjas som utgångspunkt för andra mätningsuppdrag eller om objektet ska läggas in i ett GIS, att kunna värdera kvaliteten på detaljen. Denna artikel är tänkt att översiktligt beskriva felbegreppet och hur olika noggrannhetsuppgifter ska tolkas. Artikeln är inte tänkt att vara en fullständig stringent beskrivning av felbegreppet utan är mer tänkt att öka förståelsen och kunskapen kring vad som menas med noggrannhet. Dessutom har målsättningen varit att försöka beskriva detta ämnesområde utan att blanda in matematiska formler. Det är viktigt att vara kritisk och kunna tolka när vi läser en noggrannhetsbeskrivning som att positioneringstjänsten ger en noggrannhet i plan på 3 cm (2 ). Om vi inte kan tolka en sådant påstående, hur ska vi då kunna veta om vårt mätningsresultat är rimligt eller inte?

VAD ÄR ETT FEL? Ett fel definieras som skillnaden mellan uppskattat eller mätt värde och det sanna värdet, dvs. mätt minus sant. Att detta värde ibland är negativt och ibland positivt är oftast ointressant, det är storleken på felet som diskuteras. De fel som uppstår brukar normalt delas in i tre olika kategorier som var och en för sig har sina egenskaper och metoder för att minmeras. Systematiska fel. Dessa fel kan beskrivas med någon form av matematisk formel och följer oftast en fysikalisk lag och påverkar mätningarna systematiskt. Systematiska fel undviks oftast genom att - använda kalibrerade instrument och kontrollera dessa innan mätning - använda en utvecklad mätmetod som minimerar eller utesluter risken att begå systematiska fel. - korrigera mätningar i efterhand om det systematiska felet har kunnat beskrivas. Grova fel. Dessa fel införs då vi slarvar, hanterar instrument på felaktigt sätt eller om det är fel på instrumentet. Grova fel följer inga matematiska regler och kan inte behandlas med statistiska metoder. Denna typ av fel undviker vi enklast genom att vara noggrann, mäta med överbestämningar eller använder ett mätningsförfarande där vi hela tiden kan kontrollera vad vi gör och att resultatet är rimligt. Om vi ska läsa av ett måttband kan det vara lämpligt att göra det två gånger för att vara säker på att avläsningen är gjord korrekt. Tillfälliga eller slumpmässiga fel. Dessa fel uppträder slumpmässigt och inte på ett systematiskt sätt. Felorsakerna är många och kan t.ex. vara mänskliga faktorer, instrumentfel, omgivningen och mätningsproceduren. Felteori behandlar i det närmaste uteslutande denna typ av felkälla då de andra feltyperna ska kunna undvikas genom att vara noggrann, använda felfria instrument och ett mätningsförfarande som undviker dessa feltyper. Genom att studera ett stort underlag av mätningar har det visat sig att de tillfälliga felen har vissa karakteristika som kännetecknar dem och det är att - ju fler mätningar vi gör för att bestämma en storhet, desto mindre blir det genomsnittliga felet. Med det menas att mätningarna samlas runt ett visst värde, vilket vi kan anta vara det sanna värdet. - lika många gånger mäter vi för litet som för stort värde. Alltså, ska vi mäta en sträcka med ett måttband så kommer vi lika många gånger att avläsa ett för litet värde som ett för stort. Våra mätningar fördelas kring medelvärdet. - felen vi gör är oftast små, dvs. ska vi mäta av 10 meter med ett måttband så ligger vi oftast precis runt 10 metersstrecket och sällan en bra bit därifrån.

En annan viktig förutsättning är att våra mätningar ska vara oberoende. Med det menas att upprepade mätningar inte ska vara upprepade avläsningar utan hela mätningensproceduren eller delar av den bör göras på nytt. Kriterierna som beskrivs ovan kännetecknar normalfördelningen inom statistiken och därför brukar de mätfel som görs anses tillhöra denna fördelning. Dock så förutsätts då grova och systematiska fel ej finnas med bland mätfelen. Notera alltså att vi endast antar att våra mätvärden är normalfördelade, det är alltså en approximation som har visat sig stämma ganska bra. PRECISION, NOGGRANNHET OCH RIKTIGHET Begreppen precision, noggrannhet och riktighet kan betraktas som kvalitativa noggrannhetstermer. Precision och noggrannhet är begrepp som har hängt med i många år medan riktighet är ett nyare begrepp. Hur dessa tre begrepp hänger ihop kan åskådliggöras i en figur. Riktighet anger mätvärdenas genomsnittliga överensstämmelse med det sanna värdet. Noggrannhet anger spridningen kring det sanna värdet. Här är komplikationen att vi oftast inte känner till det sanna värdet i vår verksamhet. Precision anger spridningen kring mätseriens medelvärde eller tyngdpunkt, dvs. mot ett okänt värde. Precision visar hur de tillfälliga felen fördelar sig, dvs. spridningen kring medelfelet. Detta innebär att om riktigheten är hög har förekomsten av systematiska och grova fel minimerats. Dessutom innebär det att noggrannheten och precisionen är den högsta tänkbara. Eftersom detta oftast är förutsättningen pratas det generellt mest om begreppet noggrannhet.

MEDELFEL Noggrannhet brukar vanligen uttryckas med någon form av medelfel. Lite slarvigt skulle medelfel vara ett mått på det genomsnittliga felet i en mätning eller flera mätningar. Den grekiska bokstaven (sigma) brukar användas för att beteckna medelfel. Begreppet varians ( 2 ) beräknas som kvadraten på medelfelet och används som ett spridningsmått. Det finns flera olika typer av medelfel. Inom geodesin är vi vana att redovisa osäkerhet som medelfel i mätning (längd- eller vinkelenhet), som grundmedelfel i utjämning och som punktmedelfel efter utjämning. Det sista beräknas traditionellt som σ r = (σ x 2 + σ y2 ). Ett medelfel som uppskattas i förväg och som bygger på erfarenheter från liknande mätningar kallas apriorimedelfel. Medelfel från beräkningsresultat benämns aposteriorimedelfel. Ett punktmedelfel anger osäkerheten i koordinaterna för punkten efter beräkningen. Denna redovisas ofta också som en felellips. Grundmedelfelet är en storhet som brukar redovisas tillsammans med resultatet från en utjämning. Grundmedelfelet är sortlös vilket innebär att den är enhetslös. Detta medelfel kan användas för att ge en allmän uppfattning om den faktiska mätnoggrannheten i ett mätprojekt i förhållande till vad man trodde innan mätningen påbörjades. Medelfelet kan sedan kontrolleras mot uppställda felgränser för att kunna göra en bedömning om mätningen eller mätprojektet håller den kvalitet som eftersöktes. Det är viktigt att poängtera att ett medelfel är alltså inte det största felet som anses vara tillåtet utan det anger det genomsnittliga felet. Senare återkommer vi till att diskutera normalfördelningen och hur felen är distribuerade. Det är inte lämpligt att prata om en noggrannhetsupplysning som att min noggrannhet är 1 cm. Dels så kan noggrannhet innebära flera olika saker som medelfel, största tillåtna fel etc och dels måste 1 cm relateras till någonting. En korrekt beskrivning bör därför innehålla Vad som ingår (koordinat(er), punkt, höjd, avstånd etc.) Dimension Typ av noggrannhetsmått (medelfel etc.) Metod för noggrannhetsuppskattning (apriori antagen, skattad ur utjämning etc.) Noggrannhet i förhållande till vad (fasta punkter i utjämningen etc) Exempel på en korrekt noggrannhetsuppskattning kan vara: Ur ett antal tur- och returmätningar har medelfelet i en enkelmätt höjdskillnad före utjämning uppskattats till σ 0 =1 mm/(km) ½.

Nypunkternas noggrannhet relativt de fasta punkterna i utjämningen av triangelnätet är i genomsnitt 15 mm (1σ, 2D) MEDELFELETS FORTPLANTNINGSLAG En avläsning av t.ex. ett avstånd med ett måttband brukar kallas för en direkt mätning. Det kan ibland vara tvunget att göra flera mätningar för att kunna bestämma en storhet. Ett exempel skulle kunna vara att flera avläsningar på ett måttband behövs för att bestämma avståndet mellan två punkter beroende på hur terrängen ser ut eller avståndet mellan punkterna. Då gör vi alltså flera direkta mätningar som var för sig är behäftade med ett fel. Slutresultatets medelfel påverkas av varje mätnings fel på ett speciellt sätt och detta brukar beskrivas med medelfelets fortplantningslag. NORMALFÖRDELNINGSKURVAN Tidigare i artikeln har det diskuterats att upprepade mätningar, som ej är behäftade med systematiska eller grova fel, kan anses vara normalfördelade. Det innebär att våra mätningar endast får innehålla tillfälliga fel. Normalfördelning innebär att mätvärdena är koncentrerade kring medelvärdet eller det sanna värdet. Dessutom är det lika vanligt att mätvärdet ligger under detta värdet som över. Antag att vi samlar alla mätvärdena i ett diagram där y-värdet representerar antalet och x-axeln storleken på avvikelsen från medelvärdet så kommer fördelningen bli enligt figuren nedan. I figurens underkant finns 1, 2 och 3 representerade. Antalet mätvärden som bör hamna inom 1 från medelvärdet är 68 %, inom 2 är det 95 % och inom 3 hela 99,7 %. Dessa kallas också för konfidensgrader. Strikt så gäller dessa värden för endimensionella storheter som längd eller höjd. Skall en tvådimensionell storhet som position i planet eller en tredimensionell storhet som position i rymden beskrivas så skiljer sig procentsatserna åt något.

Sigmagänserna används också i mätningssammanhang som kontroll om mätning bör göras om eller inte. 3σ eller Kassaktionsgräns. Mätningar som leder till ett resultat som överstiger denna gräns förkastas oftast då vi brukar anta att dessa är behäftade med grovt fel. Om vi tittar strikt statistiskt på våra mätningar så är det ändå så att några av våra mätningar kan hamna här utan att vara behäftade med fel. Det finns med andra ord en liten risk att vi slänger bort en mätning utan att det är något fel på det. 2σ eller Varningsgräns: Alla mätningar som överstiger 2σ kontrolleras noggrant och går det inte att hitta en bakomliggande orsak så använder man mätvärdet ändå. 1σ: 68% av alla fel skall vara mindre än 1σ. Ett problem med detta resonemang är att sigmanivån och procentsatsen inte är så starkt knutet till varandra som man skulle kunna tro. Som nämnts ovan så skiljer det sig åt om vi arbetar i olika dimensioner. Dessutom kommer det att variera om vi istället antar att mätvärdena tillhör en annan fördelning. Ett sätt att komma runt detta skulle kunna vara om vi i fortsättningen enbart pratade om procentsatser och inte om sigmanivåer. Då skulle vi t.ex. kunna presentera noggrannheten hos ett instrument med att 95% av mätningarna ligger under x cm i plan. Mer om felteori Vad vi har gjort hittills är att vi översiktligt har diskuterat felbegreppet och medelfel. Vad vi inte har diskuterat är t.ex. viktsättning, felgränser, felellipser, hur vi upptäcker grova fel, resultatets påverkan av grova fel, andra statiska fördelningar, konfidensintervall m.m. Det överlämnar vi åt en senare artikel Tack Jag skulle vilja tacka de kollegor vid den Geodetiska Utvecklingsenheten vid Lantmäteriet som har hjälp till med att granska texten så att den blev någorlunda läsbar och korrekt. Referenslista Fan H. (1997): Theory of Errors and Least Squares Adjustment, Division of Geodesy Report No. 2015, TRITA-GEOFOTO 1997:21, ISBN 91-7170-200-8, 1997. HMK-Geodesi Stommätning (1993), ISBN 91-7774-041-6