Föreläsning 11: Mer om jämförelser och inferens

Relevanta dokument
Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

Föreläsning 12: Regression

9. Konfidensintervall vid normalfördelning

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12: Linjär regression

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11, Matematisk statistik Π + E

Föreläsning 11, FMSF45 Konfidensintervall

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsningsanteckningar till kapitel 8, del 2

SF1901 Sannolikhetsteori och statistik I

TMS136. Föreläsning 10

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

F9 Konfidensintervall

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

TMS136. Föreläsning 13

Mer om konfidensintervall + repetition

FÖRELÄSNING 8:

Föreläsning 4: Konfidensintervall (forts.)

FÖRELÄSNING 7:

Lufttorkat trä Ugnstorkat trä

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Jämförelse av två populationer

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Matematisk statistik KTH. Formelsamling i matematisk statistik

TMS136. Föreläsning 11

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Uppgift 1. f(x) = 2x om 0 x 1

Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 7. Statistikens grunder.

Matematisk statistik för D, I, Π och Fysiker

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik för B, K, N, BME och Kemister

10. Konfidensintervall vid två oberoende stickprov

Avd. Matematisk statistik

Föreläsning 12, FMSF45 Hypotesprövning

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen i Matematisk Statistik, 7.5 hp

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 7: Punktskattningar

SF1901: Medelfel, felfortplantning

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Avd. Matematisk statistik

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Avd. Matematisk statistik

Avd. Matematisk statistik

Föreläsning 6: Hypotestester (forts.)

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsning 15: Faktorförsök

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Grundläggande matematisk statistik

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Repetitionsföreläsning

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 7: Punktskattningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

f(x) = 2 x2, 1 < x < 2.

Föreläsning 12: Repetition

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

MVE051/MSG Föreläsning 14

Föreläsning 8: Konfidensintervall

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Avd. Matematisk statistik

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Avd. Matematisk statistik

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Konfidensintervall, Hypotestest

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Tentamen MVE301 Sannolikhet, statistik och risk

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

MVE051/MSG Föreläsning 7

Föreläsningsanteckningar till kapitel 9, del 2

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Transkript:

Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014

Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer X 11, X 12,..., X 1n1 från N(µ 1, σ 2 1 ). n 2 observationer X 21, X 22,..., X 2n2 från N(µ 2, σ 2 2 ). Den intressanta parametern är nu θ = µ 1 µ 2 som vi skattar med θ = X 1 X 2 och vi vill nu bilda ett konfidensintervall för θ samt testa hypotesen H 0 : θ = 0, vilket är samma sak som att testa µ 1 = µ 2, mot H 1 : θ 0 eller någon ensidig hypotes, θ > 0 (som motsvarar µ 1 > µ 2 ) eller θ < 0 (som motsvarar µ 1 < µ 2 ). Vi skiljer på tre fall: 1 σ 1 och σ 2 är kända. 2 σ 1 = σ 2 = σ där σ är okänd. 3 σ 2 och σ 2 är okända och ej säkert lika. Repetition Jämförelser David Bolin 2/10

Kända σ 1 och σ 2 Om σ 1 och σ 2 är kända gäller att V(θ ) = V( X 1 X 2 ) = σ2 1 n 1 + σ2 2 n 2. Vi kan nu direkt använda detta för att bilda ett konfidensintervall för θ ( ) σ I θ = θ ± z α/2 V(θ 1 ) = x 2 1 x 2 ± z α/2 + σ2 2 n 1 Vill vi göra ett hypotestest kan vi använda detta konfidensintervall eller använda att T = X 1 X 2 V(θ ) är N(0, 1)-fördelad. Det vill säga, med denna teststorhet beräknar vi p-värdet som p = 2(1 Φ( T obs )), precis som för ett vanligt normalbaserat test. Ensidiga test görs analogt. Repetition Jämförelser David Bolin 3/10 n 2

Poolad skattning av en gemensam varians Om vi kan anta att varianserna är lika kan vi vinna en del precision på att använda data från båda stickproven för att skatta den gemensamma variansen. En skattning när vi använder data från flera stickprov för att skatta variansen brukar kallas för pooled estimate på engelska. Sats En väntevärdesriktig skattning av ett gemensamt σ 2 från k olika normalfördelningar N(µ j, σ 2 ) fås genom den sammanvägda skattningen s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 + + (n k 1)s 2 k. (n 1 1) + (n 2 1) + + (n k 1) Dessutom gäller att (N k)s 2 p/σ 2 är χ 2 (N k)-fördelad, där N = k i=1 n i. Repetition Jämförelser David Bolin 4/10

σ 1 = σ 2 = σ där σ är okänd Enligt satsen får vi att den sammanvägda skattningen av σ 2 ges av s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 (n 1 1) + (n 2 1) och vi skattar variansen av θ med s 2 p(1/n 1 + 1/n 2 ). Detta ger att är t(n 1 + n 2 2)-fördelad. T = X 1 X 2 θ s p 1/n1 + 1/n 2 Vi kan nu bilda konfidensintervall och göra hypotestest för θ som tidigare. Repetition Jämförelser David Bolin 5/10

Okända σ 1 och σ 2 där σ 1 σ 2 Att testa om två väntevärden är lika i fallet med olika och okända varianser visar sig vara komplicerat. Följande sats presenterar en approximativ metod. Sats Om σ 1 och σ 2 är okända och σ 1 σ 2 så gäller att T = X 1 X 2 θ s1 /n 1 + s 2 /n 2 är approximativt t(f)-fördelad där f = (s2 1 /n 1 + s 2 2 /n 2) 2 (s 2 1 /n 1) 2 n 1 1 + (s2 2 /n 2) 2 n 2 1 Vi kan nu bilda konfidensintervall och utföra hypotestest på samma sätt som tidigare. Repetition Jämförelser David Bolin 6/10

Jämförelse av variansen för oberoende stickprov För att jämföra de två varianserna inför vi teststorheten T = s2 1 /σ2 1 s 2 2 /σ2 2 Vi vet sedan tidigare att (n i 1)s 2 i /σ2 i är χ 2 (n i 1)-fördelad om observationerna är normalfördelade, och vi inför nu F-fördelningen som beskriver hur kvoten av χ 2 -variabler beter sig. Definition Om V 1 χ 2 (f 1 ) och V 2 χ 2 (f 2 ) är oberoende så gäller att V 1 /f 1 V 2 /f 2 är F (f 1, f 2 )-fördelad ( F-fördelad med f 1 och f 2 frihetsgrader ) Repetition Jämförelser David Bolin 7/10

Jämfördelse av variansen (forts.) Enligt definitionen har vi att T är F (n 1 1, n 2 1)-fördelad. Vi låter F α (f 1, f 2 ) beteckna α-kvantilen i F-fördelningen och får att ett konfidensintervall för σ1 2/σ2 2 ges av [ I σ 2 1 /σ2 2 = s 2 1 /s2 2 F α/2 (n 1 1, n 2 1), s 2 ] 1 /s2 2 F 1 α/2 (n 1 1, n 2 1) För hypotestest av σ1 2/σ2 2 = 1 bildar vi teststorheten T = s 2 1/s 2 2 som under H 0 är F (n 1 1, n 2 1)-fördelad. Repetition Jämförelser David Bolin 8/10

Stickprov i par En annan vanlig situation är att mätningarna uppkommer i par, till exempel om Man vill studera hur mycket rökare går upp i vikt när de slutar röka. Man mäter då vikten före och efter för varje person före och efter den slutar röka och jämförelsen sker för varje person. Man vill studera systematiska skillnader mellan två mätmetoder och använder varje metod på var och ett av ett antal prover och jämför de två metoderna för varje prov. Modellen vi nu ansätter är att vi har n observationer i två stickprov X 1, X 2,..., X n Y 1, Y 2,..., Y n För varje mätning bildar vi differensen som antas vara normalfördelad: D i = X i Y i N(, σ 2 ) Vi vill nu testa om = 0, vilket görs som vanligt för normalfördelade mätningar. Repetition Jämförelser David Bolin 9/10

För och nackdelar med stickprov i par Ofta är det mer effektivt att använda stickprov i par än oberoende stickprov, särskilt om variationen mellan mätningarna är stor. Vi kan dela upp variationen i D i som σ 2 = σ 2 0 + σ2 där σ2 0 beskriver variationen mellan objekten. Vid stickprov i par har vi V( D) = 2σ 2 /n medan om vi antar modellen oberoende stickprov så har vi V( X Ȳ ) = 2(σ2 0 + σ 2 )/n. Alltså vinner vi något på analysen om σ 0 > 0. Det vi förlorar på att använda modellen är att vi minskar antal frihetsgrader i skattningen av variansen. För oberoende stickprov använder vi 2n 2 frihetsgrader vid test, medan vi använder n 1 frihetsgrader vid stickprov i par. Alltså ska man vara försiktig med att använda modellen då vi har få observationer eftersom varianssskattningen då blir osäkrare. Repetition Jämförelser David Bolin 10/10