Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Relevanta dokument
Föreläsning 5. Kapitel 6, sid Inferens om en population

8 Inferens om väntevärdet (och variansen) av en fördelning

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistik 1 för biologer, logopeder och psykologer

Hur man tolkar statistiska resultat

FÖRELÄSNING 8:

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Konfidensintervall, Hypotestest

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

F3 Introduktion Stickprov

TMS136. Föreläsning 11

Kapitel 10 Hypotesprövning

TMS136. Föreläsning 13

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

, s a. , s b. personer från Alingsås och n b

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TMS136. Föreläsning 10

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning G60 Statistiska metoder

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 12, FMSF45 Hypotesprövning

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Hypotestestning och repetition

Matematisk statistik för B, K, N, BME och Kemister

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Statistik och epidemiologi T5

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsningsanteckningar till kapitel 9, del 2

Samplingfördelningar 1

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Parade och oparade test

2. Test av hypotes rörande medianen i en population.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

a) Facit till räkneseminarium 3

Thomas Önskog 28/

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 5: Hypotesprövningar

Matematisk statistik för B, K, N, BME och Kemister

Formler och tabeller till kursen MSG830

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

FACIT (korrekta svar i röd fetstil)

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Matematisk statistik TMS064/TMS063 Tentamen

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Studietyper, inferens och konfidensintervall

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

9. Konfidensintervall vid normalfördelning

FÖRELÄSNING 7:

Laboration 4: Hypotesprövning och styrkefunktion

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Övningstenta för MSG830

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Hur skriver man statistikavsnittet i en ansökan?

TAMS65 - Föreläsning 6 Hypotesprövning

Introduktion till statistik för statsvetare

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 4: Konfidensintervall (forts.)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Matematisk statistik för D, I, Π och Fysiker

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

TAMS65 - Föreläsning 6 Hypotesprövning

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Matematisk statistik KTH. Formelsamling i matematisk statistik

Sannolikheter och kombinatorik

Tentamen MVE302 Sannolikhet och statistik

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Om statistisk hypotesprövning

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 7: Punktskattningar

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Föreläsning G60 Statistiska metoder

Transkript:

Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas med s/ n SD eller SE Standardavvikelsen (SD) är alltså ett mått variabiliteten i stickprovet och därmed en skattning på variabiliteten i populationen. Som sådan är den alltid intressant. Standardfelet (SE) beskriver precisionen av skattningen av populationsmedelvärdet. Intervallskattning Orimligt att tänka sig att stickprovmedel sammanfaller med µ, men troligt att det ligger nära. Anta ett stickprov från en normalfördelning. Vi konstruerar ett konfidensintervall (CI) som säger att i 100(1-α)% (oftast 95%) av alla stickprov från en normalfördelning så finns populationsmedelvärdet µ i det stokastiska intervallet Staffan Nilsson, Chalmers 1

Intervallskattning Man säger att konfidensgraden är 95%, vilket motsvarar α=0.05. Konstanten ska då vara z 0.025 = 1.96. Oftast känner man förstås inte till σ utan skattar det med s. Om n är stort så gör det inte så stor skillnad. Om n är stort spelar också fördelningen mindre roll eftersom stickprovsmedelvärdet ändå är ungefär normalfördelad. Intervallskattning exempel Av 717 kvinnor skattades medellängden till 164.60 cm med s=6.05cm Ett 95% CI för populationsmedel (µ) är 164.6±1.96 x 6.05/ 717 (164.16,165.04) Z 0.05/2 T fördelning Z är standard normalfördelad om X är normalfördelad, men det kan ju inte gärna T vara eftersom σ är en konstant, medan s är en stokastisk variabel. T har istället en t-fördelning med n-1 frihetsgrader (på eng degrees of freedom, df) Staffan Nilsson, Chalmers 2

Students t-fördelning (familj) N(0,1) t with df t (5) t (1) Intervallskattning med t-förd T-fraktilen beror precis som z-fraktilen av α, men även av n. Ju större n desto lägre värde. Värdena kan avläsas i Table A5 för några värden på α. Hypotesprövning Formulera två hypoteser: H a (el H 1 ): Alternativhypotesen el Mothypotesen el Forskningshypotesen. Typiskt det vi vill påvisa. (t ex en behandling har effekt) H 0 : Nollhyposen (t ex en behandling har ingen effekt) Med parametrar t ex H 0 :µ=0 vs H a :µ 0 Staffan Nilsson, Chalmers 3

Beslut Baserat på insamlade data ska vi fatta ett av två beslut - Förkasta H 0 om starka bevis emot - Acceptera H 0 om inga starka bevis emot Test statistika En test statistika är en funktion av observationerna som används för att fatta beslut om att förkasta eller acceptera H 0. För de värden som mest tyder på H a kan vi förkasta H 0 Ex: Vi förkastar H 0 att en tärning är OK om det blir för många sexor Beslutskonsekvenser Beslut Acceptera Förkasta H 0 H 0 H 0 sann OK Typ I fel Tillstånd H 1 sann Typ II fel OK Staffan Nilsson, Chalmers 4

Fel Beteckna de två felsannolikheterna α=p(typ I fel), β=p(typ II fel) Den vetenskapliga traditionen är att första fokusera på att α ska vara litet och därefter bekymra sig om β. jmf P(döma en oskyldig) mot P(fria en skyldig) Signifikansnivå När beslutsregeln är fastställd kallas α= P(Typ I fel)=p(förkasta H 0 H 0 sann) Traditionellt väljer man ett litet önskat α, oftast 0.05, sen anpassar man regeln så P(Typ I fel)=α eller P(Typ I fel) α Enstickprovs t-test Teststatistika: Förkasta om Staffan Nilsson, Chalmers 5

Enstickprovs t-test -exempel Önskad Glycerol conc 4 mg/ml. Välj α=0.05 H 0 : µ=4, H a µ 4 X: 2.67, 4.62, 4.14, 3.81, 3.83 Kritiskt värde: Vi kan ej förkasta H 0 på nivå 0.05, ty 0.58<2.776 P-värde Definition: p-värdet är sannolikheten, under antagandet att H 0 är sann, att få ett värde på teststatistikan som talar minst lika mycket emot H 0 som det vi observerat. P-värde exempel Låt b vara sannolikheten att en färgblind person är en pojke H 0 :b = ½ (dvs inga könsskillnader) H 1 :b ½ I ett stickprov på 10 färgblinda personer räknar vi antalet pojkar B. Vi har att B~bin(10,b) och om H 0 är sann B~bin(10,½). Vi får resultatet B=9 och p-värde = p(9)+p(10)+p(1)+p(0)=0.0215 Staffan Nilsson, Chalmers 6

Test av proportioner (stora n) H 0 : p=p 0 testas med Som är approximativt standard normalfördelad om n min(p 0,1-p 0 )>=10 Dualitet mellan test och CI Vi kan förkasta H 0 :µ=µ 0 vs H 1 :µ µ 0 på α=0.05 Om och endast om 95% CI för µ inte täcker µ 0. medel µ 0 CI Styrka Det är viktigt att undvika typ I fel, men vi måste bry oss om typ II felen också. β är en funktion av parametern β(µ). Man pratar oftast om testets styrka (1- β), som man vill ska vara hög. Vetenskap handlar om att skaffa ny kunskap! Staffan Nilsson, Chalmers 7

Tvåsidigt vs enkelsidigt test Alternativhypotesen måste bestämmas innan man tittat på data. Använd enkelsidiga test om den andra riktningen är - omöjlig - otrolig - ointressant I annat fall använd ett tvåsidigt test Språklig anmärkning Bara läroböcker i statistik skriver Vi kunde förkasta nollhypotesen att Demidekk och Nordsjö har samma torktid på signifikansnivå 5%. I en vetenskaplig artikel skriver man nåt i stil med Det var signifikant snabbare torktid med Demidekk (20h) jämfört med Nordsjö (36h) (p=0.004). Staffan Nilsson, Chalmers 8