F11 Två stickprov. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 26/2 2013 1/11



Relevanta dokument
Mer om konfidensintervall + repetition

F10 Problemlösning och mer om konfidensintervall

F9 Konfidensintervall

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

F13 Regression och problemlösning

Föreläsning 7. Statistikens grunder.

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik för D, I, Π och Fysiker

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 11, Matematisk statistik Π + E

10. Konfidensintervall vid två oberoende stickprov

Diskussionsproblem för Statistik för ingenjörer

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Binomialfördelning, två stickprov

Mer om slumpvariabler

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

9. Konfidensintervall vid normalfördelning

Thomas Önskog 28/

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Föreläsning 12: Regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

FÖRELÄSNING 7:

SF1901 Sannolikhetsteori och statistik I

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

TENTAMEN I STATISTIKENS GRUNDER 2

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

FACIT: Tentamen L9MA30, LGMA30

TMS136. Föreläsning 10

Statistisk försöksplanering

Matematisk statistik för B, K, N, BME och Kemister

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 12: Repetition

Summor av slumpvariabler

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Föreläsning G60 Statistiska metoder

Föreläsning 7: Punktskattningar

Föreläsning 4: Konfidensintervall (forts.)

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Statistisk försöksplanering

Jämförelse av två populationer

Matematisk statistik för B, K, N, BME och Kemister

Stockholms Universitet Statistiska institutionen Termeh Shafie

F3 Introduktion Stickprov

FMSF 30/35/40 Matematisk statistik Grundläggande sannolikhetsteori Sannolikhetsteori och diskret matematik

Föreläsning 12: Linjär regression

Medicinsk statistik II

TMS136. Föreläsning 7

TMS136. Föreläsning 13

Formel- och tabellsamling i matematisk statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TAMS65 - Föreläsning 6 Hypotesprövning

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Avd. Matematisk statistik

MVE051/MSG Föreläsning 7

Examinationsuppgifter del 2

TAMS65 - Föreläsning 6 Hypotesprövning

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Repetitionsföreläsning

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 12, FMSF45 Hypotesprövning

Avd. Matematisk statistik

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistik för teknologer, 5 poäng Skrivtid:

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

FÖRELÄSNING 8:

Laboration 4: Intervallskattning och hypotesprövning

Extrauppgifter - Statistik

Tentamen i Matematisk statistik Kurskod S0001M

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

FACIT: Tentamen L9MA30, LGMA30

Laboration 4: Intervallskattning och hypotesprövning

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Uppgift 1. f(x) = 2x om 0 x 1

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Föreläsning 7: Punktskattningar

Transkript:

1/11 F11 Två stickprov Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 26/2 2013

2/11 Dagens föreläsning Konfidensintervall när man har ihopparade stickprov Att väga samman skattningar Konfidensintervall när man har två oberoende stickprov För µx µ y För p1 p 2

3/11 Stickprov i par I många situationer där man har samlat in två datamaterial har man studerat samma försöksenheter (personer, föremål...) under olika förutsättningar, som man vill jämföra. I sådana situationer kan man utnyttja att observationerna hör ihop parvis när man vill konstruera konfidensintervall för skillnaden mellan resultaten under de olika förutsättningarna. Exempel: dragstyrkan hos en viss typ av metallstänger undersöks. Stängerna klyvs i två delar och den ena delen utsätts för en härdande behandling. Man mäter sedan dragstyrkan för bägge delarna och vill få ett konfidensintervall för skillnaden mellan dragstyrkan före och efter härdningen. Se tavlan!

4/11 Oberoende stickprov: att väga ihop skattningar I en stad finns två sjukhus som oberoende av varandra har undersökt hur vanlig en viss sjukdom är. Det första sjukhuset undersökte n 1 = 500 patienter och fann att x 1 = 52 led av sjukdomen. Det andra sjukhuset undersökte n 2 = 750 personer och fann x 2 = 87. Alla personer antas vara oberoende av varandra och sjukhusen undersökte samma population. (a) Ange punktskattningar av andelarna p 1 och p 2 för respektive sjukhus. (b) Det är rimligt att anta p 1 = p 2 = p. Hur ska p skattas? Två förslag ges: antingen 1 2 (ˆp 1 + ˆp 2 ) eller (500ˆp 1 + 750ˆp 2 )/1250. Vilket av dessa är bäst?

Sammanvägd variansskattning Givet ett stickprov x 1,..., x n från en fördelning med varians σ 2 är ˆσ 2 = s 2 = sx 2 = 1 n (x i x) 2. n 1 Men hur gör vi om vi vill skatta variansen givet flera stickprov? Antag att vi har två stickprov x 1,..., x nx och y 1,..., y ny, av storlek n x respektive n y, från fördelningar med samma varians σ 2 men olika väntevärden µ x och µ y. Man kan då visa att den sammanvägda variansskattningen sp 2 (p kommer från engelskans pooled) är väntevärdesriktig: sp 2 = (n x 1)sx 2 + (n y 1)sy 2 nx i=1 = (x i x) 2 + n y i=1 (y i ȳ) 2, (n x 1) + (n y 1) n x + n y 2 i=1 Om man har tre stickprov med samma varians så blir den sammanvägda skattningen istället s 2 p = (n x 1)s 2 x + (n y 1)s 2 y + (n z 1)s 2 z (n x 1) + (n y 1) + (n z 1) och så vidare... 5/11

Oberoende stickprov: jämförelse av två datamaterial Ett svenskt företag utvecklar gruvborrar och vill jämföra två olika material för hårdmetallstift på borrkronor. Man gör provborrningar i en gruva, dels med det material som används idag och dels med det nya testmaterial som man utvecklat. Vid provborrningarna mäter man dels hur långt man lyckas borra (borrmeter) och dels nötningen på stiften (i mikrometer/borrad meter). Jämförelse av borrar Nötning (mikrometer/borrmeter) 25 30 35 40 45 50 55 Standard Test 40 60 80 100 120 140 6/11

Jämförelse av två datamaterial Man vill nu undersöka om nötningen per borrad meter skiljer sig åt mellan de två materialen. Standard 1 2 3 4 5 6 Borrmeter (m) 44.0 123.2 66.7 122.7 69.4 92.0 Nötning (µm/m) 27.3 52.8 31.5 39.1 40.4 39.1 Test 1 2 3 4 5 6 7 Borrmeter (m) 109.8 113.3 122.4 99.6 146.1 121.0 117.0 Nötning (µm/m) 36.4 45.0 38.4 54.2 37.0 27.3 27.4 Standardmaterial Testmaterial Jämförelse av material Frequency 0.0 0.5 1.0 1.5 2.0 Frequency 0.0 0.5 1.0 1.5 2.0 2.5 3.0 30 35 40 45 50 55 25 30 35 40 45 50 55 x 25 30 35 40 45 50 55 y 7/11

8/11 Jämförelse av två datamaterial Modell: utifrån histogrammen och lådagrammen på förra sidan så verkar följande modell någorlunda rimlig. Låt X 1,..., X 6 vara mätningarna för standardmaterialet och antag att X i N(µ X, σ 2 ) samt att mätningarna är oberoende. Låt Y 1,..., Y 7 vara mätningarna för standardmaterialet och antag att Y i N(µ Y, σ 2 ) samt att mätningarna är oberoende. För standardmaterialet får man x = 38.37 och s 2 x = 76.63. För testmaterialet får man ȳ = 37.96 och s 2 y = 90.33. Hur kan vi utifrån detta få fram ett konfidensintervall för µ X µ Y? Hur kan vi skatta σ 2?

9/11 Skillnader i väntevärde Konfidensintervallet för skillnaden µ x µ y är x ȳ ± t (n 1+n 2 2) α/2 s p 1 n x + 1 n y Se borrexempel på tavlan!

10/11 Skillnader i andelar Ett företag som tillverkar solcellskomponenter genomför en kvalitetskontroll av 400 slumpmässigt utvalda komponenter och finner att 20 av dessa är undermåliga. De anser att andelen undermåliga komponenter är för hög och genomför därför en rad förändringar i tillverkningsprocessen. Efter förändringarna tas ett nytt stickprov om 400 komponenter. Av dessa är 12 stycken undermåliga. Har förändringarna lett till att andelen undermåliga komponenter har minskat?

11/11 Skillnader i andelar Vi vill jämför två andelar p 1 och p 2 givet en observation vardera av X 1 Bin(n 1, p 1 ) och X 2 Bin(n 2, p 2 ). Ett konfidensintervall för differensen p 1 p 2 med approximativ konfidensgrad 1 α ges av ˆp 1 (1 ˆp 1 ) ˆp 1 ˆp 2 ± λ α/2 + ˆp 2(1 ˆp 2 ). n 1 n 2 Här krävs att de två tumreglerna ˆp 1 (1 ˆp 1 )n 1 > 10 och ˆp 2 (1 ˆp 2 )n 2 > 10 ska vara uppfyllda för att intervallet ska få användas. Se solcellskomponentexempel på tavlan!