Mer om konfidensintervall + repetition

Relevanta dokument
F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

F10 Problemlösning och mer om konfidensintervall

F9 Konfidensintervall

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 11: Mer om jämförelser och inferens

Thomas Önskog 28/

F13 Regression och problemlösning

Summor av slumpvariabler

Föreläsning 7. Statistikens grunder.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Formel- och tabellsamling i matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Föreläsningsanteckningar till kapitel 8, del 2

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

FÖRELÄSNING 7:

Matematisk statistik för B, K, N, BME och Kemister

9. Konfidensintervall vid normalfördelning

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Repetitionsföreläsning

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 7: Punktskattningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 7: Punktskattningar

SF1901 Sannolikhetsteori och statistik I

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 7: Punktskattningar

10. Konfidensintervall vid två oberoende stickprov

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Kurssammanfattning MVE055

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TMS136. Föreläsning 7

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11, FMSF45 Konfidensintervall

TMS136. Föreläsning 10

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Matematisk statistik för D, I, Π och Fysiker

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik TMS064/TMS063 Tentamen

FÖRELÄSNING 8:

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

F3 Introduktion Stickprov

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12: Regression

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Tentamen i Matematisk Statistik, 7.5 hp

FACIT: Tentamen L9MA30, LGMA30

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Lufttorkat trä Ugnstorkat trä

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Demonstration av laboration 2, SF1901

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tentamen L9MA30, LGMA30

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Föreläsning 4: Konfidensintervall (forts.)

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning 12: Repetition

0 om x < 0, F X (x) = c x. 1 om x 2.

Mer om slumpvariabler

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Samplingfördelningar 1

Grundläggande matematisk statistik

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 5. Kapitel 6, sid Inferens om en population

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 12: Linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

SF1901: Medelfel, felfortplantning

Stickprovsvariabeln har en fördelning / sprindning

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 8: Konfidensintervall

Transkript:

1/14 Mer om konfidensintervall + repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 23/2 2011

2/14 Dagens föreläsning Skattningar som slumpvariabler Väntevärde Varians Konfidensintervall Approximation p i Bin(n, p) Jämförelse av två datamaterial Stickprov i par

3/14 Skattningar som slumpvariabler I ett försök mätte man tryckhållfastheten hos fyra olika cementblandningar: M20, M25, M30 och M40. Data för M20 (enhet: MPa): 35.50, 27.80, 35.80, 30.10, 27.60, 32.45, 30.20, 26.85, 31.10, 19.20, 25.86, 31.20, 25.60, 31.15, 35.80 27.50, 28.73, 23.20, 18.95, 24.50, 22.45, 29.80, 35.65, 30.80, 24.01, 25.25, 27.55, 30.15, 24.50, 22.60. Material med högre M-värde ska i genomsnitt ha högre tryckhållfasthet. Man beräknar respektive stickprovs medelvärde för att få ett mått på den genomsnittliga tryckhållfastheten för blandningen. Se exempel med R!

4/14 Väntevärdesriktighet Vi vill nu skatta väntevärdet µ för tryckhållsfastheten hos M20-blandningen. Två skattningar föreslås: ˆµ 1 = X och ˆµ 2 = min(x 1,..., X n ) + max(x 1,..., X n ) 2 Se tavlan och exempel med R!

5/14 Skattningar med olika varians Vi jämför nu två andra skattningar av µ för tryckhållsfastheten hos M20-blandningen. Vi använder n = 5 observationer: ˆµ 1 = X = X 1 + X 2 + X 3 + X 4 + X 5 5 ˆµ 3 = X 1 + X 2 + X 3 X 4 X 5 och Se tavlan och exempel med R!

6/14 Punktskattningar och konfidensintervall Problem 4 från inlämningsuppgift 2: I hissarna på Ångströmlaboratoriet står högst 8 personer eller 630 kg. Personvikten i kg hos en slumpvis uttagen person är normalfördelad. Gör antaganden om väntevärde och varians för fördelningen och beräkna utifrån detta sannolikheten att 8 personer överbelastar hissen genom att tillsammans väga mer än 630 kg. Lösning: låt X = en slumpmässigt vald (vuxen) persons vikt. Vi antar att X N(µ, σ 2 ). Väntevärdet µ är vikten på en genomsnittlig person och för normalfördelningen så vet vi att sambandet P(µ 2σ X µ + 2σ) 0.95 gäller, vilket innebär att σ säger något om i vilket intervall 95% av vikterna kommer att hamna. Utifrån den kunskapen får vi försöka göra antaganden om µ och σ.

Punktskattningar och konfidensintervall Antag exempelvis att µ = 75 och σ = 12.5. Då väger en genomsnittlig person 75 kg och 95% av alla personer väger mellan 50 och 100 kg, vilket verkar någorlunda rimligt. Låt Y vara den totala vikten för 8 personer. Antag att de åtta personernas vikter, X 1,..., X 8 är oberoende. Räknereglerna för summor av normalfördelade slumpvariabler ger att Y = X 1 + X 2 +... + X 8 N(8 75, 8 12.5 2 ) = N(600, 1250). Vi får därmed att ( Y 600 P(Y > 630) = P > 8 12.5 630 600 8 12.5 ) 1 Φ(0.85) = 0.20. Om vi istället antar att µ = 70 så får vi sannolikheten 0.02 och om vi antar att µ = 80 så får vi sannolikheten 0.61. Olika uppskattningar av µ kan ge vitt skilda slutsatser! Därför vill vi när vi skattar µ utifrån data få en uppfattning om osäkerheten i skattningen. 7/14

8/14 Konfidensintervall för µ Ett konfidensintervall för parametern m med konfidensgrad 1 α är ett intervall med slumpmässiga gränser, som med sannolikhet 1 α innehåller det sanna värdet på m. Under förra föreläsningen så härledde vi konfidensintervall för parametern µ i normalfördelningen N(µ, σ 2 ): σ känd: ( x λ α/2 σ n, x + λ α/2 σ n ) σ okänd: ( x t α/2 s n, x + t α/2 s n ) De här intervallen kommer att innehålla det korrekta värdet på µ 100 (1 α) % av gångerna då de beräknas.

Konfidensintervall genom approximation Låt X 1,..., X n vara oberoende och likafördelade slumpvariabler med väntevärde E[X ] = µ och varians V[X ] = σ 2. Medelvärdesversionen av centrala gränsvärdessatsen säger att då n är stort så är X N (µ, σ2 ). n För stora n så är t α λ α, så vi får att ur vilket det följer att ( P λ α/2 X µ ) s/ n λ α/2 1 α ( x λ α/2 s s, x + λ n α/2 ) n är ett konfidensintervall för µ med approximativ konfidensgrad 1 α. 9/14

10/14 Konfidensintervall för p När vi hade en obeservation x av X Bin(n, p), där antalet försök n var känt så skattade vi p med ˆp = x/n. Vi kom fram till att ˆp har medelfelet d(ˆp) = ˆp(1 ˆp). Man kan visa att då n är stort så ˆp p N(0, 1) 1 n ˆp(1 ˆp) ur vilket det på samma sätt som tidigare följer att ( 1 1 ) ˆp λ α/2 n ˆp(1 ˆp), ˆp + λ α/2 n ˆp(1 ˆp) är ett konfidensintervall för p med approximativ konfidensgrad 1 α. 1 n

Jämförelse av två datamaterial Ett svenskt företag utvecklar gruvborrar och vill jämföra två olika material för hårdmetallstift på borrkronor. Man gör provborrningar i en gruva, dels med det material som används idag och dels med det nya testmaterial som man utvecklat. Vid provborrningarna mäter man dels hur långt man lyckas borra (borrmeter) och dels nötningen på stiften (i mikrometer/borrad meter). Jämförelse av borrar Nötning (mikrometer/borrmeter) 25 30 35 40 45 50 55 Standard Test 40 60 80 100 120 140 11/14

Jämförelse av två datamaterial Man vill nu undersöka om nötningen per borrad meter skiljer sig åt mellan de två materialen. Standard 1 2 3 4 5 6 Borrmeter (m) 44.0 123.2 66.7 122.7 69.4 92.0 Nötning (µm/m) 27.3 52.8 31.5 39.1 40.4 39.1 Test 1 2 3 4 5 6 7 Borrmeter (m) 109.8 113.3 122.4 99.6 146.1 121.0 117.0 Nötning (µm/m) 36.4 45.0 38.4 54.2 37.0 27.3 27.4 Standardmaterial Testmaterial Jämförelse av material Frequency 0.0 0.5 1.0 1.5 2.0 Frequency 0.0 0.5 1.0 1.5 2.0 2.5 3.0 30 35 40 45 50 55 25 30 35 40 45 50 55 x 25 30 35 40 45 50 55 y 12/14

13/14 Jämförelse av två datamaterial Modell: utifrån histogrammen och lådagrammen på förra sidan så verkar följande modell någorlunda rimlig. Låt X 1,..., X 6 vara mätningarna för standardmaterialet och antag att X i N(µ X, σ 2 ) samt att mätningarna är oberoende. Låt Y 1,..., Y 7 vara mätningarna för standardmaterialet och antag att Y i N(µ Y, σ 2 ) samt att mätningarna är oberoende. För standardmaterialet får man x = 38.37 och s 2 x = 76.63. För testmaterialet får man ȳ = 37.96 och s 2 y = 90.33. Hur kan vi utifrån detta få fram ett konfidensintervall för µ X µ Y? Se tavlan!

14/14 Stickprov i par I många situationer där man har samlat in två datamaterial så har man studerat samma försöksenheter (personer, föremål...) under olika förutsättningar, som man vill jämföra. I sådana situationer kan man utnyttja att observationerna hör ihop parvis när man vill konstruera konfidensintervall för skillnaden mellan resultaten under de olika förutsättningarna. Se tavlan!