9. Konfidensintervall vid normalfördelning

Relevanta dokument
Thomas Önskog 28/

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TMS136. Föreläsning 10

Föreläsning 11: Mer om jämförelser och inferens

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

10. Konfidensintervall vid två oberoende stickprov

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 4: Konfidensintervall (forts.)

Föreläsningsanteckningar till kapitel 8, del 2

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

F9 Konfidensintervall

Föreläsning 3: Konfidensintervall

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

FÖRELÄSNING 7:

Föreläsning 11, Matematisk statistik Π + E

TMS136. Föreläsning 11

Föreläsning 12, FMSF45 Hypotesprövning

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Stokastiska vektorer

TMS136. Föreläsning 13

FACIT: Tentamen L9MA30, LGMA30

Formel- och tabellsamling i matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Matematisk statistik för B, K, N, BME och Kemister

Repetitionsföreläsning

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Uppgift 1. f(x) = 2x om 0 x 1

F9 SAMPLINGFÖRDELNINGAR (NCT

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FÖRELÄSNING 8:

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Lufttorkat trä Ugnstorkat trä

Föreläsning 12: Linjär regression

Mer om konfidensintervall + repetition

Föreläsningsanteckningar till kapitel 9, del 2

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

SF1901: Sannolikhetslära och statistik

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Grundläggande matematisk statistik

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Grundläggande matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

Stickprovsvariabeln har en fördelning / sprindning

Formler och tabeller till kursen MSG830

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Tenta i Statistisk analys, 15 december 2004

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

Avd. Matematisk statistik

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Matematisk statistik för D, I, Π och Fysiker

Tentamen i Matematisk Statistik, 7.5 hp

TMS136. Föreläsning 4

Avd. Matematisk statistik

Enkel och multipel linjär regression

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för B, K, N, BME och Kemister

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

TMS136. Föreläsning 7

Föreläsning 12: Regression

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Matematisk statistik KTH. Formelsamling i matematisk statistik

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

SF1901: Medelfel, felfortplantning

Föreläsning 7. Statistikens grunder.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Avd. Matematisk statistik

F10 Problemlösning och mer om konfidensintervall

Avd. Matematisk statistik

F3 Introduktion Stickprov

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I

Avd. Matematisk statistik

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Väntevärde och varians

Avd. Matematisk statistik

Lösningsförslag till Matematisk statistik LKT325 Tentamen

f(x) = 2 x2, 1 < x < 2.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Transkript:

TNG006 F9 09-05-016 Konfidensintervall 9. Konfidensintervall vid normalfördelning Låt x 1, x,..., x n vara ett observerat stickprov av oberoende s.v. X 1, X,..., X n var och en med fördelning F. Antag att fördelningen F innehåller en okänd parameter θ. Nedan ska vi konstruera ett intervall, ett s.k. konfidensintervall I θ, som med sannolikheten 1 α innehåller θ. Vi säger då att I θ är ett konfidensintervall för θ med konfidensgraden 1 α. 9.1. Konfidensintervall för µ då σ är känt Vi vill bestämma ett konfidensintervall I µ för µ. Vi vet att för stickprovetsmedelvärdet X gäller att X = 1 n X j Nµ, σ/ n n Om vi bildar en ny s.v. j=1 Z = X µ σ/ n N0, 1, kan vi ur tabellen för N0, 1 hitta talen 1.96 och 1.96, så att P 1.96 Z 1.96 = 1.96 1.96 f Z z dz = 1.96 f Z z dz 1.96 f Z z dz = Φ1.96 Φ 1.96 = Φ1.96 1 = 0.9750 1 = 0.95. 1. P 1.96 Z 1.96 = 0.95 N0,1. P Z 1.96 = P Z 1.96 = 0.05 3. P Z 1.96 = P Z 1.96 = 0.975 0.05 0.95 0.05 1.96 1.96 1

Detta betyder att med sannolikheten 95% gäller att 1.96 Z = X µ σ/ n 1.96, X 1.96 σ n µ X + 1.96 σ n, I µ = [ x 1.96 σ, x + 1.96 σ ] n n är ett 95% konfidensintervall för µ. För allmänna fallet har man valt att tabellera normalfördelningens kvantiler P Z > λ α = α. Detta gör att vi ur tabell kan finna kvantilen λ α/, så att sannolikheten är 1 α att λ α/ Z = X µ σ/ n λ α/, P λ α/ Z = X µ σ/ n λ α/ = 1 α σ σ ] I µ = [ x λ α/ n, x + λ α/ n är ett konfidensintervall för µ med konfidensgraden 1 α. N0,1 1. P λ α/ Z λ α/ = 1 α. P Z λ α/ = P Z λ α/ = α/ 3. P Z λ α/ = P Z λ α/ = 1 α/ "/ 1 " "/! "/! "/

Exempel 9.1. Följande värden är oberoende observationer som är Nµ, 4 47.6 55.6 51.3 46.1 64.9 Bestäm ett 95% tvåsidigt konfidensintervall för µ. Hur många mätningar minst måste man göra för att konfidensintervallet för µ skall få längden högst 5 med konfidensgraden 0.95? 9.. Konfidensintervall för σ då µ är okänt Antag att stickprovet kommer från Nµ, σ, där både µ och σ är okända. Låt oss påminna om att stickprovets varians s = 1 n X j n 1 X j=1 är väntesvärdesriktig och konsistent skattning med avseende på σ. Nedan kommer vi att använda denna skattning för att finna ett konfidensintervall I σ för σ. För att göra detta behöver vi χ -fördelningen. Definition 9.. Om den s.v. X har täthetsfunktionen f X x = c n x n 1 e x/, x > 0, där c n > 0 är en normeringskonstant, säges X vara χ -fördelad med n frihetsgrader. Vi skriver X χ n. Följande sats följer. Sats 9.3. Antag att X 1, X,..., X n är oberoende och N0, 1. Låt X = X 1 + X + X n. Då gäller att X χ n. Bevis: Vi visar fallet då n =. Låt X = X1 + X. Då är F X x = P X x = P X1 + X x = f X1 X x 1, x dx 1 dx X1 +X x 3

= f X1 f X x 1, x dx 1 dx = 1 e x 1 +x/ dx 1 dx X1 +X x π X1 +X x = 1 π π x θ=0 r=0 e r / r drdθ = 1 e x/. Om vi nu deriverar med avseende på x får vi täthetsfunktionen f X x = 1 e x/. Här är c =. I fallet n = 3 är variabelbytet ovan till sfäriska koordinater med funktionaldeterminanten r sin θ. Motsvarande byte finns för n > 3. Följande räknelagar gäller för χ -fördelningen. Sats 9.4. Antag att X 1, X,..., X n är oberoende och N0, 1. Sätt X = X1 + X + Xn. Då gäller att 1. EX = n. V X = n Bevis: 1. Eftersom EX j = 0, j = 1,,... n, följer att EXj = V X j + EX j = 1 = 1, och därmed n EX = E Xj = j=1 j=1 j=1 j=1 n EXj = n.. På grund av oberoende följer att n n V X = V X j = V Xj = nv X1. Vi behöver alltså bestämma V X1. Vi har sett i beviset ovan att varaiabeln Y = X1 + X har täthetetsfunktionen f Y y = 1 e y/, y > 0. Detta ger att V Y = EY EY = EY = f Y y dy = 1 Eftersom 4 = V Y = V X1 + X = V X1 + V X = V X1, 4 0 e y/ dy = 4.

så är Alltså har vi att V X 1 =. V X = n. Av satsen ovan följer följande resultat som vi kommer att använda vid intervallskattningen av σ då µ är okänt. Sats 9.5. Antag att X 1, X,..., X n är oberoende och Nµ, σ. Då gäller att n 1s σ = 1 σ n X j X χ n 1. j=1 Man har valt att tabellera χ -fördelningens kvantiler P X > χ α = α! n 1 F X χ α = P X χ α = 1 P X > χ α = 1 α 1 " "! " I tabellen för χ n 1-fördelningen hittar man kvantilerna χ 1 αn 1 och χ αn 1 så att! n 1 1 " "/ "/! 1 "/! "/ n 1s 1. P σ > χ α/ n 1 = α/. n 1s. P σ χ α/ n 1 = 1 α/. 5

3. P χ n χ 1s 1 α/ n 1 < σ < χ α/ n 1 α/ n 1 = f X x dx χ 1 α/ n 1 = χ α/ n 1 0 f X x dx χ 1 α/ n 1 0 f X x dx = F χ α/ n 1 F χ 1 α/ n 1 = 1 α/ α/ = 1 α. Exempel 9.6. Följande värden är oberoende observationer som är Nµ, σ 47.6 55.6 51.3 46.1 64.9 1. Bestäm ett 95% tvåsidigt konfidensintervall för σ.. Bestäm ett 99% ensidigt uppåt begränsat intervall för σ.! 4 0.95 0.05 0.05! 0.975! 0.05 6

9.3. Konfidensintervall för µ då σ är okänt Antag att stickprovet kommer från Nµ, σ, där både µ och σ är okända och vi vill finna ett konfidensintervall I µ för µ. Den tidigare bildade s.v. Z = X µ σ/ n duger inte längre då σ är okänt. Vi ersätter σ med stickprovets standardavvikelse s = 1 n X j n 1 X. j=1 och bildar en ny s.v. T = X µ s/ n. Med en viss möda kan man visa att s.v. T är t-fördelat med n 1 frihetsgrader, T = X µ s/ n tn 1. Definition 9.7. Om den s.v. T har täthetsfunktionen ges av f T x = c n 1 + x n/, < x <, n 1 säges T vara t-fördelat med n 1 frihetsgrader. Vi skriver T tn 1. 7

Eftesom f T x = f T x, så är t-fördelningen symmetrisk kring origo och bevöver inte tabelleras för alla värden. Man valt att tabellera t-fördelningens kvantiler P T > t α n 1 = α, F t α n 1 = P T t α n 1 = 1 P T > t α n 1 = 1 α. Vi kan således ur tabell hitta kvantilen t α/ n 1, så att 1. P t α/ n 1 < T = X µ s/ n < t α/n 1 = = tα/ n 1 t α/ n 1 tα/ n 1 f T x dx f T x dx tα/ n 1 = F t α/ n 1 F t α/ n 1 f T x dx = F t α/ n 1 1 F t α/ n 1 = F t α/ n 1 1 = 1 α 1 = 1 α. t n 1!/ 1!!/ t!/ t!/. P T t α/ n 1 = P T t α/ n 1 = α/. 3. P T t α/ n 1 = P T t α/ n 1 = 1 α/. 8

Exempel 9.8. Följande värden är oberoende observationer som är Nµ, σ 47.6 55.6 51.3 46.1 64.9 Bestäm ett 95% tvåsidigt konfidensintervall för µ. t 4 0.05 0.95 0.05 t 0.05 t 0.05 =.78 9

Exempel 9.9. Man har gjort 8 upprepade bestämningar av samma fysikaliska storhet X Nµ, σ och därvid erhållit följande mätvärden: 5.9 5.7 6. 5.8 5.6 6.0 6.1 6. 1. Beräkna ett 99% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ.. Beräkna ett 95% tvåsidigt konfidensintervall för variansen σ. Lösning: Låt X och s vara stickprovets medelvärde respektive standardavvikelse. Då är X µ s/ 8 t7. Ur tabell finner vi t 0.0057 = 3.50, så att P t 0.005 X µ s/ 8 t 0.005 = 0.99. Eftersom x = 5.9375 och s = 0.64, så ges ett 99%-konfidensintervall för µ av I µ = [ x s t 0.005, x+ s ] [ t 0.005 = 5.9375 0.64 3.50, 5.9375+ 0.64 ] 3.50 = [5.66, 6.]. 8 8 8 8 Vidare är variabeln 7S σ χ 7. Ur tabell finner vi χ 0.957 = 1.69 och χ 0.057 = 16.0 så att P χ 0.9757 7s σ χ 0.057 = P 1.69 7s σ 16.0 = 0.95, Ett 95%-konfidensintervall för σ ges därmed av [ I σ = 7s χ 0.05 7 σ 7s ] [ 7s χ 0.975 7 = 16.0 σ 7s ] = [0.0, 0.1]. 1.69 Exempel 9.10. Livslängden X timmar hos en viss typ av komponenter antas vara Nµ, σ. Vid undersökning av livslängden hos 10 komponenter erhålls följande mätvärden: 1051 101 987 1004 998 975 991 10 1005 1041 1. Ge en väntevärdesriktig och konsistent skattning på µ resp. σ.. Skatta sannolikheten att en komponent fungerar efter 1000 timmar. 3. Beräkna ett 95% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ. Lösning: a x = 1009 resp. s = 565.6. X 1009 b P X > 1000 = 1 P X 1000 = 1 P 33.6 Φ0.36 = 0.64. 1000 1009 = 1 Φ 0.36 = 33.6 10

c Eftersom X µ s/ t9 och 9 P t 0.05 9 X µ s/ 9 t 0.059 = 0.95, där t 0.05 9 =.6, så ges ett 95%-konfidensintervall för µ av [ I µ = x s t 0.05 9, x + s ] t 0.05 9 = [990, 106]. 9 9 Exempel 9.11. Vikten i gram hos en tillverkad komponent antas vara Nµ, σ. Man mäter vikten hos sex komponenter och erhåller 9.8, 10.6, 10., 10., 9.8, 10.0 1. Beräkna ett 99% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ. Lösning: a Eftersom X µ s/ 6 t5 och P t 0.005 5 X µ s/ 6 t 0.0055 = 0.99, där t 0.005 5 = 4.03, så ges ett 99% konfidensintervall för µ av [ I µ = x s t 0.005 5, x + s ] t 0.005 5 = [9.6, 10.6], 6 6 där x = 10.1, s = 0.3033 och t 0.005 5 = 4.03. b Eftersom 5S σ χ 5 och χ 0.955 = 1.15, så är 5s 0.95 = P σ χ 0.955 = P σ 5s χ 0.95 5 Alltså, ges ett uppåt begränsat 95% konfidensintervall för σ av I σ = [0, 0.63]. = P σ 0.63. 11