Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Relevanta dokument
Forskningsmetodik 2006 lektion 2

Lektionsanteckningar 11-12: Normalfördelningen

Fysikexperiment, 7.5 hp 1

Kort om mätosäkerhet

Föreläsning G60 Statistiska metoder

Grundläggande matematisk statistik

Ingenjörsmetodik IT & ME 2011 Föreläsning 11

Experimentella metoder 2014, Räkneövning 1

F9 SAMPLINGFÖRDELNINGAR (NCT

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

1 Mätdata och statistik

Ingenjörsmetodik IT & ME 2010 Föreläsning 5

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

FÖRELÄSNING 7:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR

Föreläsning 12: Regression

Experimentella metoder, FK3001. Datorövning: Finn ett samband

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

LMA522: Statistisk kvalitetsstyrning

Vetenskaplig metod och statistik

Vetenskaplig metod och statistik

LMA521: Statistisk kvalitetsstyrning

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Statistik 1 för biologer, logopeder och psykologer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Hur måttsätta osäkerheter?

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Demonstration av laboration 2, SF1901

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Introduktion till statistik för statsvetare

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

4 Diskret stokastisk variabel

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Studietyper, inferens och konfidensintervall

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Arbeta med normalfördelningar

TAMS79: Föreläsning 6. Normalfördelning

FÖRELÄSNING 8:

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Monte Carlo-metoder. Bild från Monte Carlo

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 4. Kapitel 5, sid Stickprovsteori

F9 Konfidensintervall

SF1901: Sannolikhetslära och statistik

19.1 Funktioner av stokastiska variabler

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 11: Mer om jämförelser och inferens

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Thomas Önskog 28/

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Vetenskaplig metod och Statistik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

a = a a a a a a ± ± ± ±500

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

2 Dataanalys och beskrivande statistik

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

bli bekant med summor av stokastiska variabler.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

LKT325/LMA521: Faktorförsök

Parade och oparade test

Introduktion till statistik för statsvetare

Föreläsning 7: Punktskattningar

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Mer om konfidensintervall + repetition

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

F13 Regression och problemlösning

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 7: Punktskattningar

TMS136. Föreläsning 10

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

TMS136. Föreläsning 4

Kap 2. Sannolikhetsteorins grunder

Föreläsning 5. Kapitel 6, sid Inferens om en population

1.1 Diskret (Sannolikhets-)fördelning

SF1901 Sannolikhetsteori och statistik I

Tentamen i Matematisk statistik Kurskod S0001M

Del A: Begrepp och grundläggande förståelse

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Transkript:

När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning? Svaret ges av en vid första påseende märklig sats: Centrala Gränsvärdessatsen: Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! Så vad är denna normalfördelning, och vad har den med mätningar att göra? Normalfördelningen: f(x; µ,σ ) = 2 1 (x µ) exp 2 2πσ 2σ 2 2σ x Forskningsmetodik HT 24 1

Egenskaper Maximum vid x = µ Symmetrisk runt x = µ När σ är litet så blir exponenten stor -> lutningen blir större När σ är litet så blir normaliseringskonstanten större -> höjden vid toppen blir relativt sett högre Ytan under kurvan är lika med 1- kurvan är normaliserad. 2 1.8 sigma=1 sigma=.5 sigma=.1 1.6 1.4 1.2 1.8.6.4.2-3 -2-1 1 2 3 Normalfördelningen har normaliseringen 1. Utryckt på vanlig svenska betyder det att ytan under kurvan alltid är lika med ett, det är därför topppen blir högre när vidden blir smalare. För att förstå hur centralvärdessatsen sats kan hjälpa oss så kan vi betrakta resultatet av en mätning som beroende av det sanna värdet till vilket har adderats slumpvisa bidrag från ett stort antal okända (och en del kända) felkällor. Det totala felet i mätningen är då summan av alla dessa bidrag. Enligt centrala gränsvärdessatsen är då denna summa (= det totala mätfelet) normalfördelat. Resultatet av ett stort antal mätningar kommer då att spridas runt det sanna värdet, och fördelningen av mätningarna runt detta kommer att ha en form som ges av normalfördelningen. Forskningsmetodik HT 24 2

Exempel: Summera tal slumpvis fördelade mellan och 1: Den ursprungliga fördelningen: 12 1 Se figur 5.27 sidan 212! 8 6 4 2.1.2.3.4.5.6.7.8.9 1 Summan av 2 tal: 5 termer 2 termer 1 14 9 9 8 7 6 5 4 3 2 1 12 1 8 6 4 2 8 7 6 5 4 3 2 1.2.4.6.8 1 1.2 1.4 1.6 1.8 2-2 -1 1 2 3 4 5 6-1.5-1 -.5.5 1 1.5 2 2.5 3 3.5 Exempel 3 s 193 När kan man förvänta sig en normalfördelning? 1. De flesta värdena skall ligga nära medelvärdet. 2. Positiva avvikelser är lika vanliga som negativa. 3. Stora avvikelser är mindre sannolika än små. 4. Den totala avvikelsen för ett mätvärde är summan av en mängd slumpmässiga bidrag. (Strikt matematiskt kommer punkt 4, tack vare centrala gränsvärdessatsen leda till de övrig punkterna) När vi gör en mätning kan vi under förutsättning att negativa och positiva mätfel är lika vanliga förvänta oss att summan av det mätfel som adderas till det sanna värdet har ett medelvärde som är noll Alltså kan vi förvänta oss att våra mätresultat följer en normalfördelning, centrerad på det sanna värdet (om vi bortser från eventuella systematiska fel). Forskningsmetodik HT 24 3

Eftersom normalfördelningen är normaliserad - så kan man tolka ytan under kurvan mellan två x- värden som den relativa frekvensen för att mätvärdena skall hamna I detta intervall. Uttrycker man integrationsgränser i parametern σ så har alla normalfördelningar samma area inom dessa gränser - oberoende av vilka exakta värden µ och σ antar. Integrerar man en normalfördelning mellan till exempel -σ och +σ så är arean 68% av hela arean. Detta har betydelse när vi tolkar f(x) som en sannolikhetsfördelning - sannolikheten att hamna i intervallet [µ-2σ, µ+2σ] är 95% och så vidare. Exempel mitt på sid 2 Exempel 5 sid 22 Ett standardiserat mått på avvikelsen ges av (mätvärdet - medelvärdet) / standardavvikelsen. I boken kallas detta mått standard score eller z-score. Vanligare I naturvetenskap är kanske termen pull Med hjälp av tabeller som t.ex. tabell 5.1 på sidan 25 I läroboken kan man enkelt gå ifrån percentiler till pull och vice versa. Exempel 7&8 på sid 24 Vi kan nu ge en kvantitativ uppskattning av osäkerheten I ett mätvärde: ger vi en uppskattning av mätvärdet som µ ± σ så antar vi om vi gör ett stort antal mätningar så kommer det sanna värdet att täckas in av vårt intervall I 68% av fallen. Ofta säger man att det är 68% sannolikhet att det sanna värdet ligger inom ±1 sigma, det räcker för vårt bruk, men det finns en subtil matematisk skillnad. Forskningsmetodik HT 24 4

Tillbaks till vår mätsituation: Om det inte finns stora systematiska effekter så kan vi alltså förvänta oss att våra mätresultat - efter ett stort antal mätningar och under förutsättning att det inte finns systematiska effekter - beskrivs av en normalfördelning. Vi förväntar oss att µ svarar mot det sanna värdet för den parameter vi vill mäta, vi kommer snart att se att σ säger oss någonting om mätmetodens precision. Givet mätdata, hur uppskattar vi parametrarna µ och σ? Man kan strikt matematiskt visa att medelvärdet är den bästa uppskattningen av µ och att variansen är den bästa uppskattningen av σ. Forskningsmetodik HT 24 5

Har man gjort många mätningar är normalfördelningen relativt väl bestämd: 35 3 3 25 25 2 2 15 15 1 1 5 5-4 -3-2 -1 1 2 3 4-4 -3-2 -1 1 2 3 4 Gausskurvan på den vänstra grafen stämmer alldeles klart bättre med data än den till höger. Men samma skillnad I centrum för Gaussfördelningen ger två kurvor som ser ganska likvärdiga ut om vi har färre mätpunkter, och därmed ojämnare distributioner. 25 25 2 2 15 15 1 1 5 5-4 -3-2 -1 1 2 3 4-4 -3-2 -1 1 2 3 4 Det går att visa att skillnaden mellan det sanna värdet och det som uppskattas genom att ta medelvärdet av datapunkterna har en normalfördelning centrerad på noll med en vidd som ges av: σ µ = σ N Det vill säga standardavvikelsen hos normalfördelningen I fråga (uppskattad med variansen av datapunkterna) dividerad med kvadratroten ur antalet mätvärden). De stora talens välsignelse Ex 1 och 2 sidan 213 Forskningsmetodik HT 24 6