Föreläsning 5. Kapitel 6, sid Inferens om en population

Relevanta dokument
Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Föreläsning G60 Statistiska metoder

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Föreläsning G60 Statistiska metoder

Föreläsningsanteckningar. Grundläggande statistik 732G01/732G40

Föreläsning G60 Statistiska metoder

F3 Introduktion Stickprov

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsningsanteckningar till kapitel 9, del 2

TMS136. Föreläsning 11

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

2. Test av hypotes rörande medianen i en population.

Kapitel 10 Hypotesprövning

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

TMS136. Föreläsning 13

Hur man tolkar statistiska resultat

Studietyper, inferens och konfidensintervall

Föreläsning 12, FMSF45 Hypotesprövning

, s a. , s b. personer från Alingsås och n b

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Samplingfördelningar 1

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TAMS65 - Föreläsning 6 Hypotesprövning

Lektionsanteckningar 11-12: Normalfördelningen

TMS136. Föreläsning 10

FÖRELÄSNING 8:

TAMS65 - Föreläsning 6 Hypotesprövning

Parade och oparade test

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Stockholms Universitet Statistiska institutionen Termeh Shafie

Konfidensintervall, Hypotestest

Föreläsning G70 Statistik A

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

F9 Konfidensintervall

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsning 5: Hypotesprövningar

FÖRELÄSNING 7:

F22, Icke-parametriska metoder.

Hur skriver man statistikavsnittet i en ansökan?

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Thomas Önskog 28/

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

732G01/732G40 Grundläggande statistik (7.5hp)

Föreläsning G60 Statistiska metoder

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotestestning och repetition

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TENTAMEN I STATISTIKENS GRUNDER 2

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 7: Punktskattningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

TMS136. Föreläsning 7

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Om statistisk hypotesprövning

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Föreläsning 11: Mer om jämförelser och inferens

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Transkript:

Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population

2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning

Statistisk inferens om populationsmedelvärde

4 Punktskattning Att använda en stickprovsstatistika som en uppskattning av motsvarande parameter Stickprovsstatistikor är slumpvariabler och antar olika värden för varje stickprov Hur ska vi hantera osäkerheten?

5 Krav för konfidensintervall för medelvärde 1. Stickprovet är draget som ett OSU Garanterar oberoende mellan observationerna 2. Samplingfördelningen för stickprovsmedelvärdet kan betraktas som normalfördelad Antingen genom centrala gränsvärdessatsen, n 30 Populationen kan betraktas som normalfördelad Om kraven är uppfyllda kan vi skatta osäkerheten genom ett så kallat konfidensintervall

6 Punktskattning och intervallskattning Om kraven är uppfyllda kan vi bilda ett konfidensintervall för populationsmedelvärdet: vi lägger ett osäkerhetsintervall kring punktskattningen vilket tillåter oss att med en viss säkerhet säga att den okända populationsparametern täcks av intervallet.

7 Dubbelsidigt konfidensintervall för populationsmedelvärde när σ är okänd Givet de två antaganden bildas ett dubbelsidigt konfidensintervall för μ enligt: x ҧ ± t α n 1;1 2 s n Värdet på t hämtas från t-fördelningen, där n 1 är frihetsgrader och α är signifikansnivån

t-fördelningen 8 Fördelningen liknar normalfördelningen men beror på frihetsgrader Används om stickprovet är litet och om σ är okänd Frihetsgrader bestäms av hur mycket data (n) man har Frihetsgrader 5 50 5000 Fördelningen konvergerar mot normalfördelningen Approximativt normal då n 30-5 -4-3 -2-1 0 1 2 3 4 5

9 Exempel Ett slumpmässigt urval om 40 studenter vid Linköpings universitet ger medelåldern 21.2 år och standardavvikelsen 4.4 år. Bestäm ett intervall som med 95 procents säkerhet täcker den sanna medelåldern bland studerande vid Linköpings universitet.

10 Enkelsidiga konfidensintervall (KI) Nedåt begränsat KI: μ > xҧ t n 1;1 α s n Uppåt begränsat KI: μ < x ҧ + t n 1;1 α s n

11 Exempelfråga Styrelsen i en bostadsrättsförening får in klagomål på att golvvärmen i badrummen är för låg. Man drar ett OSU om 30 badrum bland de omkring 400 badrum som finns i föreningens fastigheter och mäter golvvärmen där. Medeltemperaturen beräknas till 21 grader och standardavvikelsen till 1.6 grader. Energimyndigheten rekommenderar att golvvärmen ska ligga på minst 20 grader för att man ska undkomma problem med fuktskador. Föreligger risk för fuktskador i föreningens badrum?

Hypotesprövning för populationsmedelvärde när σ är okänd Förutsätts åter att 1. stickprovet är draget som ett OSU 2. samplingfördelningen för stickprovsstatistikan kan betraktas som normalfördelad 12 En hypotesprövning testar om ett påstående (en hypotes) är förenlig med ett observationerna i ett stickprov En hypotesprövning kan utföras i 4 steg

13 Exempel I ett OSU omfattande 40 personer bland medlemmarna i ett politiskt parti i en region är medelåldern 42.3 år och standardavvikelsen 7.1 år. Testa på 5 procents signifikansnivå om medelåldern bland medlemmarna i partiet överstiger 45 år.

14 Hypotesprövning Steg 1: Formulera hypoteser och välj signifikansnivå H 0 : μ = μ 0 H a : μ > μ 0 H a : μ < μ 0 H a : μ μ 0 Valet av mothypotes, H a, bestäms av frågeställningen α = signifikansnivån = risken att förkasta H 0 trots att H 0 är sann Vanliga värden är 1%, 5%, 10%

15 Hypotesprövning Steg 2: Bestäm testvariabeln t test = xҧ μ 0 s n

16 Hypotesprövning Steg 3: Beräkna det kritiska området Om H a : <, till vänster om t krit = t n 1;1 α Om H a : >, till höger om t krit = t n 1;1 α Om H a :, på båda sidor om t krit = ±t n 1;1 α 2 Visualisera detta med ett diagram!

17 Hypotesprövning Steg 4: Dra slutsatser och tolka Besluta att förkasta/inte förkasta H 0 Besvara frågeställningen i ord

18 Om σ är känd Väldigt ovanligt att σ är känd I detta fallet byts t-fördelningen ut mot normalfördelningen (ex. byts t n 1;1 α ut mot z 1 α ) i formlerna. s byts ut mot σ.

Inferens om populationsandel

20 Konfidensintervall för populationsandel Givet att: 1. Stickprovet är draget som ett OSU 2. np 1 p > 5 bildas ett dubbelsidigt KI för π enligt: p ± z 1 α 2 p 1 p n Där värdet på z hämtas ur normalfördelningstabellen

21 Enkelsidiga intervall Nedåt begränsat KI: π > p z 1 α p 1 p n Uppåt begränsat KI: π < p + z 1 α p 1 p n

22 Exempel I en hälsoenkät tillfrågades 100 slumpmässigt utvalda anställda vid ett stort företag om huruvida man regelbundet motionerar eller ej. Svar erhölls från 84 anställda och av dessa svarade 65 ja. Bestäm ett 95-procentigt konfidensintervall för andelen av de anställda vid det stora företaget som regelbundet motionerar.

23 Hypotesprövning Förutsätter att kraven för andelar är uppfyllda Steg 1: H 0 : π = π 0 H a : π > π 0 H a : π < π 0 H a : π π 0

24 Hypotesprövning Steg 2: Steg 3: z test = p π 0 π 0 1 π 0 n Beror på H a z krit = z 1 α ; z 1 α ; z 1 α 2

25 Hypotesprövning Steg 4: Dra slutsats och tolka

26 Exempel I en hälsoenkät tillfrågades 100 slumpmässigt utvalda anställda vid ett stort företag om huruvida man regelbundet motionerar eller ej. Svar erhölls från 84 anställda och av dessa svarade 65 ja. Undersök om det på 5 procents signifikansnivå finns belägg för påståendet att andelen regelbundna motionärer bland de anställda vid företaget understiger 85 procent.

Ytterligare om inferens

28 p-värdesmetoden Som ett alternativt steg 3 och 4 i en hypotesprövning p-värdet är sannolikheten att testvariabeln ska anta ett värde som det vi observerat eller ännu längre ifrån μ 0 sett i den riktning som mothypotesen pekar Om p-värdet är litet är H 0 osannolik Beslutsregel: om p-värdet < signifikansnivån α så förkastas H 0 Vid dubbelsidig mothypotes beräknas p-värdet multiplicerat med 2

29 Exempel I en hälsoenkät tillfrågades 100 slumpmässigt utvalda anställda vid ett stort företag om huruvida man regelbundet motionerar eller ej. Svar erhölls från 84 anställda och av dessa svarade 65 ja. Undersök om det på 5 procents signifikansnivå finns belägg för påståendet att andelen regelbundna motionärer bland de anställda vid företaget understiger 85 procent genom att beräkna testets p-värde.

30 Relation mellan hypotesprövning och KI Om μ 0 el. π 0 täcks av intervallet kan H 0 inte förkastas Vid H a : < beräknas ett uppåt begränsat KI Vid H a : > beräknas ett nedåt begränsat KI Vid H a : beräknas ett dubbelsidigt KI http://rpsychologist.com/d3/ci/

31 Feltyper och styrka Typ I-fel: att förkasta H 0 fastän den är sann Typ II-fel: att inte förkasta H 0 fastän den är falsk α är sannolikheten (risken) för typ I-fel

32 Feltyper och styrka Beslut baserat på stickprov Sanning om populationen H 0 sann H a sann Förkasta H 0 Typ I-fel Korrekt beslut Inte förkasta H 0 Korrekt beslut Typ II-fel Det råder ett motsatsförhållande mellan risken för typ I-fel och risken för typ II-fel Inom samhällsvetenskaperna brukar man ange α = 0.05; 0.01; 0.10 som ger en bra avvägning mellan typerna av fel