TMS136. Föreläsning 10

Relevanta dokument
TMS136. Föreläsning 13

TMS136. Föreläsning 11

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

FÖRELÄSNING 7:

Thomas Önskog 28/

9. Konfidensintervall vid normalfördelning

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

FÖRELÄSNING 8:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Föreläsning 11: Mer om jämförelser och inferens

SF1901 Sannolikhetsteori och statistik I

TMS136. Föreläsning 7

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 12: Repetition

TMS136. Föreläsning 4

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 3: Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

F9 Konfidensintervall

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Föreläsning G60 Statistiska metoder

Konfidensintervall, Hypotestest

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Grundläggande matematisk statistik

10. Konfidensintervall vid två oberoende stickprov

Tenta i Statistisk analys, 15 december 2004

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 12, FMSF45 Hypotesprövning

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 5. Kapitel 6, sid Inferens om en population

F3 Introduktion Stickprov

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11, FMSF45 Konfidensintervall

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Föreläsning 12: Linjär regression

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Lektionsanteckningar 11-12: Normalfördelningen

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift a b c d e Vet inte Poäng

Avd. Matematisk statistik

Föreläsning 5: Hypotesprövningar

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Samplingfördelningar 1

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Föreläsning 12: Regression

Föreläsning 11, Matematisk statistik Π + E

Repetitionsföreläsning

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Statistik 1 för biologer, logopeder och psykologer

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen MVE302 Sannolikhet och statistik

Mer om konfidensintervall + repetition

Föreläsning 8: Konfidensintervall

TENTAMEN I STATISTIKENS GRUNDER 2

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

F10 Problemlösning och mer om konfidensintervall

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Avd. Matematisk statistik

Formel- och tabellsamling i matematisk statistik

, s a. , s b. personer från Alingsås och n b

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsning G60 Statistiska metoder

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Lufttorkat trä Ugnstorkat trä

Studietyper, inferens och konfidensintervall

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

LKT325/LMA521: Faktorförsök

Tentamen i Matematisk statistik Kurskod S0001M

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F22, Icke-parametriska metoder.

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Tentamen MVE302 Sannolikhet och statistik

TENTAMEN I STATISTIKENS GRUNDER 2

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Matematisk statistik Kurskod S0001M

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Transkript:

TMS136 Föreläsning 10

Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis kvalificerad) gissning av ett parametervärde Vi vill kanske få en uppfattning om vilken precision en punktskattning skattning har, alltså troliggöra att den ligger i en viss härad Nedan ska vi kika på hur man gör konfidensintervall för parametrar

Konfidensintervall Givet stickprovet X 1,, X n från en normalfördelning med (okänt) väntevärde μ och (känd) varians σ 2 vet vi att X μ σ n är standard normalfördelad

Konfidensintervall Det betyder ju exempelvis att P 1.96 X μ σ n 1.96 = 0.95 vilket ju efter lite ommöblering ger att P X 1.96 σ n μ X + 1.96 σ n = 0.95

Konfidensintervall Vi kallar X ± 1.96 σ n ett 95%-igt konfidensintervall för μ Som vi ser blir precisionen bättre med ett större stickprov, vilket ju borde vara fallet

Konfidensintervall Om vi observerar x 1,, x n från en normalfördelning med känd standardavvikelse σ observerar vi också det 95%-iga konfidensintervallet x ± 1.96 σ n för μ Om vi observerar 1.3, 1.4, 1.5, 1.1, 1.2 från en normalfördelning med σ = 0.5 observerar vi alltså det 95%-iga konfidensintervallet eller [0.86, 1.74] 1.3 ± 1.96 0.5/ 5

Konfidensintervall Det är frestande att tolka detta som att [0.86, 1.74] med 95% sannolikhet täcker in μ Denna tolkning är FEL eftersom det inte finns någon slump kvar, det är ju intervallgränserna i härledningen som är stokastiska inte de observerade intervallgränserna och μ är ju deterministisk

Konfidensintervall Den korrekta tolkningen är att om vi gör/observerar många 95%-iga konfidensintervall (inte bara i situationen ovan utan allmänt) kommer 95% av dessa att täcka parametrarna de uttalar sig om Om vi vill kan vi säga att vi täcker parametern med 95% konfidens, men att efter att man observerat ett stickprov göra ett utlåtande om med vilken sannolikhet man täcker parametern är alltså inte möjligt

Konfidensintervall Det är vanligt att man gör 95%-iga konfidensintervall men om vi i situationen med ett okänt väntevärde för en normalfördelning med känd varians vill göra ett 1 α 100%-igt konfidensintervall får vi detta genom att ersätta 1.96 med z α 2 där Φ z α 2 = 1 α/2 Konfidensintervallet blir då x ± z α 2 σ n Om konfidensgraden ökas blir alltså intervallet bredare

Konfidensintervall Det finns alltså en trade-off mellan konfidensgrad och stickprovsstorlek Om vi i situationen ovan och för en given konfidensgrad vill ha en viss bredd på vårt konfidensintervall kan vi räkna ut hur stort stickprov som behövs Låt E = z α 2 σ n. Då har vi ju att n = z α 2σ E 2

Exempel Om vi i situationen ovan vill göra ett 95%-igt konfidensintervall med bredd 0.4 har vi alltså E = 0.2, z α 2 = 1.96, σ = 0.5 får vi n = 1.96 0.5 0.2 2 24.01 Vi avrundar uppåt till 25

Ensidiga konfidensgränser De konfidensintervall vi hittills sett är tvåsidiga, de har alltså både undre och övre gräns Vi kan också göra ensidiga konfidensintervall, eller konfidensgränser som har antingen en undre eller en övre gräns

Ensidiga konfidensgränser I situationen ovan får vi en övre 95%-ig konfidensgräns ur x + 1.64 σ En undre 95%-ig konfidensgräns ges av n x 1.64 σ n

Observation Vi har alltså lagt hela α på ena sidan, minns att Φ 1.64 = 0.95 Om vi istället vill göra ensidiga 1 α 100%-iga konfidensgränser ersätter vi 1.64 med z α där Φ z α = 1 α

Om variansen är okänd då? Om man har stora stickprov (typ n = 100) får man ett 1 α 100%-igt konfidensintervall för μ i normalfördelningen ur x ± z α 2 s n där s är den observerade stickprovsstandardavvikelsen, alltså s = 1 n 1 n x i 2 i=1 n x 2

Mer allmänt vid stora stickprov Om den skattare θ man använder för att punktskatta sin parameter θ är approximativt normafördelad, asymptotiskst vvr och har en standardavvikelse som kan skattas från data med skattaren σ θ får vi vid ett stort stickprov ett 1 α 100%-igt konfidensintervall för θur θ ± z α 2 σ θ

Om variansen är okänd då? Om man har små stickprov (typ n < 100) får man ett 1 α 100%-igt konfidensintervall för μ i normalfördelningen ur x ± t α 2,n 1 s n Och nu undrar ni: vad är t α 2,n 1?!?!

t-fördelning Givet stickprovet X 1,, X n från en normalfördelning med (okänt) väntevärde μ och (okänd) varians σ 2 säger man att X μ S n är t-fördelad med n 1 frihetsgrader

t-fördelning t-fördelningen uppkommer alltså då vi byter ut populationsstandardavvikelsen mot stickprovsstandardavvikelsen i kvoten t-fördelningen påminner om standard normalfördelningen eftersom täthetsfunktionen är en symmetrisk (runt y- axeln) klockform

t-fördelning Täthetsfunktionen för t-fördelning med 1, 2, 5 och väldigt många frihetsgrader

t-fördelning Vi ser alltså att t-fördelningen (för låga frihetsgrader) har tyngre svansar än standard normal, den ger alltså större sannolikhet (än standard normal) åt utfall långt ifrån noll Det är ju rimligt att S (i någon mening) konvergerar mot σ då stickprovet växer och detta avspeglas i t-fördelningen med att den konvergerar mot standard normal då stickprovet växer

t-fördelning Talet t α 2,n 1 är alltså det tal sådant att P T n 1 t α 2,n 1 = 1 α/2 där T n 1 är t-fördelad med n 1 frihetsgrader Det finns inga slutna uttryck för sannolikheter av typ den ovan men vi finner talen t α 2,n 1 i appendix

Exempel Om vi återigen observerar 1.3, 1.4, 1.5, 1.1, 1.2 från en normalfördelning fast nu med okänd varians och vill göra ett 95%-igt konfidensintervall behöver vi alltså beräkna s Vi har att s 2 = 1 4 1.32 + 1.4 2 + 1.5 2 + 1.1 2 + 1.2 2 5 1.3 2 = 0.025

Exempel Så vi har alltså s 0.158 Vi finner t 0.025,4 = 2.78 i appendix Vi får alltså konfidensintervallet 1.3 ± 2.78 0.158/ 5 eller [1.10, 1.50]

Viktigt Observera att intervallet för väntevärdet då variansen är okänd och stickprovet är litet förutsätter normalfördelade data Man måste alltså verifiera att data kan anses normalfördelade om det ska vara meningsfullt att konsturera ett sådant intervall