Samplingfördelningar 1

Relevanta dokument
Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Lektionsanteckningar 11-12: Normalfördelningen

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning G60 Statistiska metoder

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

TMS136. Föreläsning 7

TMS136. Föreläsning 11

Föreläsning 4. Kapitel 5, sid Stickprovsteori

FÖRELÄSNING 8:

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

FÖRELÄSNING 7:

Föreläsning 12: Regression

F3 Introduktion Stickprov

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

, s a. , s b. personer från Alingsås och n b

Formel- och tabellsamling i matematisk statistik

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Kap 3: Diskreta fördelningar

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 13

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

2. Test av hypotes rörande medianen i en population.

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 4

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Föreläsning 7: Punktskattningar

Jörgen Säve-Söderbergh

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistik 1 för biologer, logopeder och psykologer

TMS136. Föreläsning 10

Föreläsning 12: Repetition

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 7: Punktskattningar

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Statistik 1 för biologer, logopeder och psykologer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Repetitionsföreläsning

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

MVE051/MSG Föreläsning 7

Föreläsning 7: Punktskattningar

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 4: Konfidensintervall (forts.)

Studietyper, inferens och konfidensintervall

Föreläsning 6, Repetition Sannolikhetslära

Föreläsning 7. Statistikens grunder.

F9 Konfidensintervall

Introduktion till statistik för statsvetare

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

(a) Anta att Danmarksprojektet inte lyckas hålla budgeten. Vad är då sannolikheten att Sverigeprojektet inte heller lyckas hålla budgeten? Motivera!

0 om x < 0, F X (x) = c x. 1 om x 2.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

F10 Problemlösning och mer om konfidensintervall

Uppgift a b c d e Vet inte Poäng

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Jämförelse av två populationer

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

8 Inferens om väntevärdet (och variansen) av en fördelning

Mer om konfidensintervall + repetition

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Matematisk statistik KTH. Formelsamling i matematisk statistik

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Sannolikhet och statistik med Matlab. Måns Eriksson

Föreläsning 11: Mer om jämförelser och inferens

4 Diskret stokastisk variabel

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

FÖRELÄSNING 3:

F22, Icke-parametriska metoder.

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Några extra övningsuppgifter i Statistisk teori

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 4 mars 2006, kl

Summor av slumpvariabler

Grundläggande matematisk statistik

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Lösningstips till de flesta uppgifterna i fjärde upplagan av Statistisk dataanalys

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Transkript:

Samplingfördelningar 1

Parametrar och statistikor En parameter är en konstant som karakteriserar en population eller en modell. Exempel: Populationsmedelvärdet Parametern p i binomialfördelningen 2

Vi har hittills berört problem av följande typ: Antag att proportionen moderater i en population är 0.20. Vad är sannolikheten att få två moderater om vi slumpmässigt väljer tio individer ur populationen? 3

När vi kommer över till statistikteorin (inferensteorin) handlar det i stället om att utifrån ett stickprov dra slutsatser om en population. 4

Estimation: Vi vill med hjälp av ett stickprov skatta proportionen moderater i populationen. Hur gör vi detta på bästa sätt och hur säker är vår uppskattning? Hypotesprövning: Vår hypotes är att proportionen moderater i populationen är minst 0.25. Hur skall vi med hjälp av ett stickprov avgöra om hypotesen är falsk eller ej? 5

Vid såväl estimation som hypotesprövning använder vi observationerna i stickprovet för att räkna fram numeriska värden av olika slag. Exempel: Vi använder kanske stickprovsproportionen för att uppskatta populationsproportionen. 6

Numeriska värden som på detta sätt beräknas med hjälp av observationerna i ett stickprov kallas för statistikor. Observera att en statistika är en slumpvariabel eftersom dess värde bestäms av ett slumpmässigt försök och varierar från stickprov till stickprov. Exempel på statistikor: Stickprovsmedelvärdet, stickprovsstandardavvikelsen 7

Statistikor som används för estimation kallas för estimatorer. Observationer på estimatorer kallas för estimat. Statistikor som används vid hypotesprövning brukar kallas för teststatistikor. 8

Samplingfördelningar och centrala gränsvärdessatsen En samplingfördelning är en sannolikhetsfördelning för en statistika. En viktig samplingfördelning är den för stickprovsmedelvärdet som anger vilka värden som kan antas av stickprovsmedelvärdet och sannolikheten för dessa olika värden. 9

Centrala gränsvärdessatsen (CGS) Oavsett formen på den populationsfördelning ett slumpmässigt stickprov hämtas från, förutsatt att fördelningen har ändligt väntevärde och varians, så går fördelningen för stickprovsmedelvärdet mot normalfördelningen då stickprovsstorleken ökar. 10

Ett exempel Likformigt (uniformt)-fördelade tal mellan 1 och 8: UniformDistribution(1,8) 0.2 P ( ) 0.1 0.0 E() = = 4.5 V() = 2 = 5.25 SD() = = 2.2913 1 2 3 4 5 6 7 8 11

Ett exempel (forts.) Ta ett stickprov med n=2. 8*8 = 64 olika utfall 1 2 3 4 5 6 7 8 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 7 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 8 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 Medevärdet av dessa 2: 1 2 3 4 5 6 7 8 1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 2 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 3 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 4 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 6 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 12

Ett exempel (forts.) SamplingDistributionof themean P ( ) 0.10 0.05 0.00 E ( ) V ( ) 2 SD( ) 16202. 4.5 2.625 1.01.52.02.53.03.54.04.55.05.56.06.57.07.58.0 13

Ett exempel (forts.) Jämför! Samma medelvärde P ( ) UniformDistribution(1,8) SamplingDistributionof themean 0.2 0.10 Mindre varians Mer klockformad P ( ) 0.1 0.0 1 2 3 4 5 6 7 8 0.05 0.00 1.01.52.02.53.03.54.04.55.05.56.06.57.07.58.0 14

Illustration:CGS Population n = 2 n = 30 15

Centrala gränsvärdessatsen är även tillämpbar på summor av oberoende slumpvariabler. Exempel: En binomialfördelad variabel, som består av en summa av oberoende bernoullifördelade variabler, tenderar att bli normalfördelad då n ökar. 16

Hur stort stickprov som behövs för att normalfördelningen skall kunna användas som en approximativ modell beror på hur populationsfördelningen ser ut. Tumregel: I de flesta fall är normalfördelningen en tillräckligt god approximation redan vid stickprovsstorleken 30. 17

Fördelningen för stickprovsmedelvärdet Om vi samplar från en normalfördelning är stickprovsmedelvärdet alltid normalfördelat oavsett stickprovsstorlek. Om vi samplar från någon annan fördelning är stickprovsmedelvärdet approximativt normalfördelat om stickprovet är stort. 18

Stickprovsmedelvärdets väntevärde och varians Låt n vara stickprovsstorleken och låt och 2 vara medelvärdet och variansen i den population vi tar stickprovet ifrån (samplar ur) Väntevärde: E Varians: V n 2 19

Exempel: Fördelningen för stickprovsproportionen Tag ett stickprov av n st individer och sätt man=1 och kvinna=0. Vi har då observationer på n st bernoullifördelade variabler, 1,..., n. Om vi antar oberoende mellan variablerna är summan av dem, dvs. antalet män i stickprovet, binomialfördelad. 20

Bilda andelen män i stickprovet, dvs. stickprovsproportionen: Pˆ i n 1 n i 21

Som vi ser i exemplet är stickprovsproportionen inget annat än ett stickprovsmedelvärde där variablerna i summan i täljaren är bernoullifördelade. Om stickprovet är stort kan vi, med stöd av centrala gränsvärdessatsen, hävda att stickprovsproportionen är approximativt normalfördelad. Tumregel: np 5 n 1 p 5 och 22

Väntevärde och varians Vi såg tidigare att väntevärdet och variansen för stickprovsmedelvärdet var lika med populationens medelvärde och populationens varians dividerad med stickprovsstorleken. När populationen är bernoullifördelad är populationens medelvärde p och populationens varians p(1-p). 23

Väntevärdet för stickprovsproportionen: E P ˆ p Variansen för stickprovsproportionen: V Pˆ p 1 n p 24