Några vanliga fördelningar från ett GUM-perspektiv

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Thomas Önskog 28/

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

TMS136. Föreläsning 10

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901 Sannolikhetsteori och statistik I

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

Föreläsningsanteckningar till kapitel 8, del 2

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Avd. Matematisk statistik

Föreläsning 11: Mer om jämförelser och inferens

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Uppgift 1. f(x) = 2x om 0 x 1

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1901: Medelfel, felfortplantning

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

(a) Vilket av följande alternativ är sannolikheten för JACKPOT: P (A \ B), P A C \ B, P (A \ B), P A C \ B C?

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 4: Konfidensintervall (forts.)

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik KTH. Formelsamling i matematisk statistik

TENTAMEN Datum: 14 feb 2011

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Lektionsanteckningar 11-12: Normalfördelningen

MSG830 Statistisk analys och experimentplanering

HMK. Standardosäkerheter, konfidensintervall m.m. vid positionsbestämning i 1D, 2D och 3D. Teknisk rapport 2016:2. Clas-Göran Persson

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

FÖRELÄSNING 7:

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Lycka till!

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

F3 Introduktion Stickprov

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

TMS136. Föreläsning 4

TMS136. Föreläsning 13

Tentamen i Matematisk statistik Kurskod S0001M

SF1901 Sannolikhetsteori och statistik I

F9 Konfidensintervall

AMatematiska institutionen avd matematisk statistik

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

4 Diskret stokastisk variabel

Grundläggande matematisk statistik

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen MVE301 Sannolikhet, statistik och risk

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Hur måttsätta osäkerheter?

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 8:

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 7: Punktskattningar

ÖVNINGSUPPGIFTER KAPITEL 9

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Tentamen i statistik och sannolikhetslära för BI2 den 27 maj 2010

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Stockholms Universitet Statistiska institutionen Termeh Shafie

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

Avd. Matematisk statistik

9. Konfidensintervall vid normalfördelning

Uppgift a b c d e Vet inte Poäng

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

HMK SyostGIS

Statistiska metoder för säkerhetsanalys

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Introduktion till statistik för statsvetare

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1901: Sannolikhetslära och statistik

0 om x < 0, F X (x) = c x. 1 om x 2.

Vad är rätt och vad är fel?

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Härledning av Black-Littermans formel mha allmänna linjära modellen

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

SF1911: Statistik för bioteknik

Transkript:

Några vanliga fördelningar från ett GUM-perspektiv I denna PM redovisas några av de vanligaste statistiska fördelningarna och deras hantering inom ramen för GUM: Guide to the Expression of Uncertainty in Measurement. Den 1-dimensionella normalfördelningen N(, ) betecknar en 1-dimensionell normalfördelning med väntevärdet och medelfelet 1. I HMK finns ett koncept för felgränser som baseras på 1,, 3 och som har sitt ursprung i denna fördelning: Fel större än 3 betraktas som grova fel. Därför är 3 -gränsen att betrakta som en ren kassationsgräns och ommätning krävs. används som varningsgräns. Om felen överskrider denna gräns bör den bakomliggande orsaken analyseras. Denna gräns överensstämmer med den konfidensnivå som är dominerande inom statistiken, nämligen 95 %. 1 -gränser används för ett test av att antagandet om normalfördelade fel är korrekt ett fördelningstest. /3 av mätmaterialet bör ha fel som är mindre än 1. Konfidensnivåerna för normalfördelningen är 3 99,7 %, mycket osannolikt 95,5 % (1, 96 95 %) 1 68,3 % ( /3) varur relationen till ovanstående felgränser tydligt framgår. Exempel: Bestäm ett konfidensintervall på nivån 95 % för väntevärdet av en normalfördelad stokastisk variabel X N(, ) med det kända medelfelet. Ur 8 st. oberoende mätningar har medeltalet beräknats till x 4,00. Standardosäkerheten för medeltalet ges av uttrycket / n / 8 0, u x 50 Normalfördelningens täckningsfaktor på konfidensnivån 95% k95 95 1, 96 ger sedan P x 1,96* u( x) P 4, 00 0,98 P 3, 0; 4,98 95% t-fördelningen Den vanligaste tillämpningen av t-fördelningen är vid konstruktion av konfidensintervall för väntevärdet av normalfördelade stokastiska variabler där även är okänt (jfr. föregående exempel). Standardosäkerheten skattas då med standardavvikelsen n ( i ) /( i1 s x x n1) 1 Det teoretiska spridningsmåttet benämner vi medelfel, med beteckningen, till skillnad mot standardosäkerheten som är kopplad till den reella mätningen. Ibland beräknas dock standardosäkerheten ur.

där n 1 är antalet frihetsgrader (överbestämningar). I analogi med normalfördelningsexemplet ovan får vi vidare täckningsfaktorn k t ( n 1 ) där är konfidensnivån, och medeltalets standardosäkerhet skattas av ux ( ) s/ n I tabellen nedan ser vi att t-fördelningen konvergerar mot normalfördelningen när antalet frihetsgrader ökar. Frihetsgrader = f 3 7 15 30 50 80 10 t ( ) 95 f 3,18,365,131,04,009 1,990 1,980 1,960 Exempel: Bestäm ett konfidensintervall på nivån 95 % för väntevärdet av en normalfördelad stokastisk variabel X N(, ) där medelfelet är okänt. Ur 8 st. oberoende mätningar har medeltalet beräknats till x 4,00 och standardavvikelsen till s 1, 4. Standardosäkerheten för medeltalet ges av uttrycket u x s/ n 0,495 och t-fördelningens täckningsfaktor för n 1 7 frihetsgrader på 95 % nivå blir k t (7),365 95 95 Sammantaget får vi P x,365* u( x) P 4, 00 1,17 P,83;5,17 95% Normalfördelningen i två och tre dimensioner Eftersom positioner redovisas i D eller 3 D så är även normalfördelningen i två och tre dimensioner av intresse. Dessa fördelningar ser ganska annorlunda ut jämfört med motsvarande 1-dimensionella fördelning, se figur på nästa sida. Eftersom de - och 3-dimensionella fördelningarna endast antar positiva värden så representeras den 1-dimensionella fördelningen i figuren av absolutbeloppet av en normalfördelning; man så att säga viker ihop den karaktäristiska Gauss-klockan. Så här distinkta är dock fördelningarna endast i teorin om samtliga komponenter är lika stora och om inga korrelationer föreligger mellan komponenterna. Så är det inte i verkligheten, och då blir gränserna mellan olika dimensioner mer diffusa. Om osäkerheten är större i en av komponenterna t.ex. höjdkomponenten i en 3-dimensionell position så beter sig fördelningen nästan som om den vore 1-dimensionell. Om osäkerheten i två av komponenterna i en 3-dimensionell fördelning är större än den tredje så får fördelningen egenskaper som liknar den -dimensionella.

1, 1 0,8 0,6 1D D 3D 0,4 0, 0 0 0,5 1 1,5,5 3 3,5 Teoretiskt gäller för 1,, 3 i 1 D, D och 3 D : 1 3 1D 68,7% 95,45% 99,73% D 63,1% 98,17% 99,99% 3D 60,80% 99,30% 100 % Men mot bakgrund av ovanstående resonemang så vet man inte i det verkliga fallet var i respektive kolumn man ska läsa av %-värdet. Man får vanligen nöja sig med att konstatera att: 3 nära 100 %, mycket osannolikt minst 95 % (95-99 %) 1 ca. /3 (61-68 %) Dvs. HMK-konceptet fungerar rätt bra i samtliga dimensioner, och t.ex. täckningsfaktorn ( ) ger minst 95 % konfidensnivå i såväl 1 som i och 3. D D D Triangelfördelningen Tbd (, ), en (symmetrisk) triangelfördelning i intervallet bd,, har följande egenskaper: Väntevärde: b d / Varians: d b Fördelningen kan även uttryckas a där a d b / d b / 4 /4. Det ger oss medelfelet: a / 6

1 har konfidensnivån 64,98 %, har konfidensnivån 96,63 % och 3 ligger utanför fördelningens gränser (se figuren). 1, 90 är triangelfördelningens täckningsfaktor på 95 % k 95 konfidensnivå. Triangelfördelning ±a 1/a -a +a -3 Exempel: Bestäm medelfelet för - -1 +1 + +3 T (8,10), dvs. en triangelfördelning i intervallet8,10. Vi har b 8, 10 och därmed a 10 8 / 1. Det ger oss d 10 8 / 4 1/ 6 0, 41 Rektangelfördelningen R(, bd ), en rektangelfördelning i intervallet bd,, har följande egenskaper: Väntevärde: b d / Varians: d b Fördelningen kan även uttryckas a där a d b / d b / 1 /1. Det ger oss medelfelet: a / 3 1 har konfidensnivån 57,7 %. Såväl som 3 ligger utanför fördelningens gränser (se figuren). k95 1, 65 är rektangelfördelningens täckningsfaktor på 95 % konfidensnivå. Rektangelfördelning ±a 1/a -a +a -3 - -1 +1 + +3

Exempel: Bestäm medelfelet för en rektangelfördelning i intervallet -3 till +5, R( 3,5). Vi har b 3, 5 och därmed a 53 / 4. Det ger oss d 5 3 / 1 4 / 3,309 Sammanställning Slutligen görs följande jämförelse mellan den 1-dimensionella normalfördelningen, triangelfördelningen och rektangelfördelningen: Fördelning 1 3 k 95 Normalfördelning (1D) 68,3 % 95,5 % 99,7 % 1,96 Triangelfördelning 65,0 % 96,6 % 100 % 1,90 Rektangelfördelning 57,7 % 100 % 100 % 1,65 /Clas-Göran Persson