TNG006 F9 09-05-016 Konfidensintervall 9. Konfidensintervall vid normalfördelning Låt x 1, x,..., x n vara ett observerat stickprov av oberoende s.v. X 1, X,..., X n var och en med fördelning F. Antag att fördelningen F innehåller en okänd parameter θ. Nedan ska vi konstruera ett intervall, ett s.k. konfidensintervall I θ, som med sannolikheten 1 α innehåller θ. Vi säger då att I θ är ett konfidensintervall för θ med konfidensgraden 1 α. 9.1. Konfidensintervall för µ då σ är känt Vi vill bestämma ett konfidensintervall I µ för µ. Vi vet att för stickprovetsmedelvärdet X gäller att X = 1 n X j Nµ, σ/ n n Om vi bildar en ny s.v. j=1 Z = X µ σ/ n N0, 1, kan vi ur tabellen för N0, 1 hitta talen 1.96 och 1.96, så att P 1.96 Z 1.96 = 1.96 1.96 f Z z dz = 1.96 f Z z dz 1.96 f Z z dz = Φ1.96 Φ 1.96 = Φ1.96 1 = 0.9750 1 = 0.95. 1. P 1.96 Z 1.96 = 0.95 N0,1. P Z 1.96 = P Z 1.96 = 0.05 3. P Z 1.96 = P Z 1.96 = 0.975 0.05 0.95 0.05 1.96 1.96 1
Detta betyder att med sannolikheten 95% gäller att 1.96 Z = X µ σ/ n 1.96, X 1.96 σ n µ X + 1.96 σ n, I µ = [ x 1.96 σ, x + 1.96 σ ] n n är ett 95% konfidensintervall för µ. För allmänna fallet har man valt att tabellera normalfördelningens kvantiler P Z > λ α = α. Detta gör att vi ur tabell kan finna kvantilen λ α/, så att sannolikheten är 1 α att λ α/ Z = X µ σ/ n λ α/, P λ α/ Z = X µ σ/ n λ α/ = 1 α σ σ ] I µ = [ x λ α/ n, x + λ α/ n är ett konfidensintervall för µ med konfidensgraden 1 α. N0,1 1. P λ α/ Z λ α/ = 1 α. P Z λ α/ = P Z λ α/ = α/ 3. P Z λ α/ = P Z λ α/ = 1 α/ "/ 1 " "/! "/! "/
Exempel 9.1. Följande värden är oberoende observationer som är Nµ, 4 47.6 55.6 51.3 46.1 64.9 Bestäm ett 95% tvåsidigt konfidensintervall för µ. Hur många mätningar minst måste man göra för att konfidensintervallet för µ skall få längden högst 5 med konfidensgraden 0.95? 9.. Konfidensintervall för σ då µ är okänt Antag att stickprovet kommer från Nµ, σ, där både µ och σ är okända. Låt oss påminna om att stickprovets varians s = 1 n X j n 1 X j=1 är väntesvärdesriktig och konsistent skattning med avseende på σ. Nedan kommer vi att använda denna skattning för att finna ett konfidensintervall I σ för σ. För att göra detta behöver vi χ -fördelningen. Definition 9.. Om den s.v. X har täthetsfunktionen f X x = c n x n 1 e x/, x > 0, där c n > 0 är en normeringskonstant, säges X vara χ -fördelad med n frihetsgrader. Vi skriver X χ n. Följande sats följer. Sats 9.3. Antag att X 1, X,..., X n är oberoende och N0, 1. Låt X = X 1 + X + X n. Då gäller att X χ n. Bevis: Vi visar fallet då n =. Låt X = X1 + X. Då är F X x = P X x = P X1 + X x = f X1 X x 1, x dx 1 dx X1 +X x 3
= f X1 f X x 1, x dx 1 dx = 1 e x 1 +x/ dx 1 dx X1 +X x π X1 +X x = 1 π π x θ=0 r=0 e r / r drdθ = 1 e x/. Om vi nu deriverar med avseende på x får vi täthetsfunktionen f X x = 1 e x/. Här är c =. I fallet n = 3 är variabelbytet ovan till sfäriska koordinater med funktionaldeterminanten r sin θ. Motsvarande byte finns för n > 3. Följande räknelagar gäller för χ -fördelningen. Sats 9.4. Antag att X 1, X,..., X n är oberoende och N0, 1. Sätt X = X1 + X + Xn. Då gäller att 1. EX = n. V X = n Bevis: 1. Eftersom EX j = 0, j = 1,,... n, följer att EXj = V X j + EX j = 1 = 1, och därmed n EX = E Xj = j=1 j=1 j=1 j=1 n EXj = n.. På grund av oberoende följer att n n V X = V X j = V Xj = nv X1. Vi behöver alltså bestämma V X1. Vi har sett i beviset ovan att varaiabeln Y = X1 + X har täthetetsfunktionen f Y y = 1 e y/, y > 0. Detta ger att V Y = EY EY = EY = f Y y dy = 1 Eftersom 4 = V Y = V X1 + X = V X1 + V X = V X1, 4 0 e y/ dy = 4.
så är Alltså har vi att V X 1 =. V X = n. Av satsen ovan följer följande resultat som vi kommer att använda vid intervallskattningen av σ då µ är okänt. Sats 9.5. Antag att X 1, X,..., X n är oberoende och Nµ, σ. Då gäller att n 1s σ = 1 σ n X j X χ n 1. j=1 Man har valt att tabellera χ -fördelningens kvantiler P X > χ α = α! n 1 F X χ α = P X χ α = 1 P X > χ α = 1 α 1 " "! " I tabellen för χ n 1-fördelningen hittar man kvantilerna χ 1 αn 1 och χ αn 1 så att! n 1 1 " "/ "/! 1 "/! "/ n 1s 1. P σ > χ α/ n 1 = α/. n 1s. P σ χ α/ n 1 = 1 α/. 5
3. P χ n χ 1s 1 α/ n 1 < σ < χ α/ n 1 α/ n 1 = f X x dx χ 1 α/ n 1 = χ α/ n 1 0 f X x dx χ 1 α/ n 1 0 f X x dx = F χ α/ n 1 F χ 1 α/ n 1 = 1 α/ α/ = 1 α. Exempel 9.6. Följande värden är oberoende observationer som är Nµ, σ 47.6 55.6 51.3 46.1 64.9 1. Bestäm ett 95% tvåsidigt konfidensintervall för σ.. Bestäm ett 99% ensidigt uppåt begränsat intervall för σ.! 4 0.95 0.05 0.05! 0.975! 0.05 6
9.3. Konfidensintervall för µ då σ är okänt Antag att stickprovet kommer från Nµ, σ, där både µ och σ är okända och vi vill finna ett konfidensintervall I µ för µ. Den tidigare bildade s.v. Z = X µ σ/ n duger inte längre då σ är okänt. Vi ersätter σ med stickprovets standardavvikelse s = 1 n X j n 1 X. j=1 och bildar en ny s.v. T = X µ s/ n. Med en viss möda kan man visa att s.v. T är t-fördelat med n 1 frihetsgrader, T = X µ s/ n tn 1. Definition 9.7. Om den s.v. T har täthetsfunktionen ges av f T x = c n 1 + x n/, < x <, n 1 säges T vara t-fördelat med n 1 frihetsgrader. Vi skriver T tn 1. 7
Eftesom f T x = f T x, så är t-fördelningen symmetrisk kring origo och bevöver inte tabelleras för alla värden. Man valt att tabellera t-fördelningens kvantiler P T > t α n 1 = α, F t α n 1 = P T t α n 1 = 1 P T > t α n 1 = 1 α. Vi kan således ur tabell hitta kvantilen t α/ n 1, så att 1. P t α/ n 1 < T = X µ s/ n < t α/n 1 = = tα/ n 1 t α/ n 1 tα/ n 1 f T x dx f T x dx tα/ n 1 = F t α/ n 1 F t α/ n 1 f T x dx = F t α/ n 1 1 F t α/ n 1 = F t α/ n 1 1 = 1 α 1 = 1 α. t n 1!/ 1!!/ t!/ t!/. P T t α/ n 1 = P T t α/ n 1 = α/. 3. P T t α/ n 1 = P T t α/ n 1 = 1 α/. 8
Exempel 9.8. Följande värden är oberoende observationer som är Nµ, σ 47.6 55.6 51.3 46.1 64.9 Bestäm ett 95% tvåsidigt konfidensintervall för µ. t 4 0.05 0.95 0.05 t 0.05 t 0.05 =.78 9
Exempel 9.9. Man har gjort 8 upprepade bestämningar av samma fysikaliska storhet X Nµ, σ och därvid erhållit följande mätvärden: 5.9 5.7 6. 5.8 5.6 6.0 6.1 6. 1. Beräkna ett 99% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ.. Beräkna ett 95% tvåsidigt konfidensintervall för variansen σ. Lösning: Låt X och s vara stickprovets medelvärde respektive standardavvikelse. Då är X µ s/ 8 t7. Ur tabell finner vi t 0.0057 = 3.50, så att P t 0.005 X µ s/ 8 t 0.005 = 0.99. Eftersom x = 5.9375 och s = 0.64, så ges ett 99%-konfidensintervall för µ av I µ = [ x s t 0.005, x+ s ] [ t 0.005 = 5.9375 0.64 3.50, 5.9375+ 0.64 ] 3.50 = [5.66, 6.]. 8 8 8 8 Vidare är variabeln 7S σ χ 7. Ur tabell finner vi χ 0.957 = 1.69 och χ 0.057 = 16.0 så att P χ 0.9757 7s σ χ 0.057 = P 1.69 7s σ 16.0 = 0.95, Ett 95%-konfidensintervall för σ ges därmed av [ I σ = 7s χ 0.05 7 σ 7s ] [ 7s χ 0.975 7 = 16.0 σ 7s ] = [0.0, 0.1]. 1.69 Exempel 9.10. Livslängden X timmar hos en viss typ av komponenter antas vara Nµ, σ. Vid undersökning av livslängden hos 10 komponenter erhålls följande mätvärden: 1051 101 987 1004 998 975 991 10 1005 1041 1. Ge en väntevärdesriktig och konsistent skattning på µ resp. σ.. Skatta sannolikheten att en komponent fungerar efter 1000 timmar. 3. Beräkna ett 95% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ. Lösning: a x = 1009 resp. s = 565.6. X 1009 b P X > 1000 = 1 P X 1000 = 1 P 33.6 Φ0.36 = 0.64. 1000 1009 = 1 Φ 0.36 = 33.6 10
c Eftersom X µ s/ t9 och 9 P t 0.05 9 X µ s/ 9 t 0.059 = 0.95, där t 0.05 9 =.6, så ges ett 95%-konfidensintervall för µ av [ I µ = x s t 0.05 9, x + s ] t 0.05 9 = [990, 106]. 9 9 Exempel 9.11. Vikten i gram hos en tillverkad komponent antas vara Nµ, σ. Man mäter vikten hos sex komponenter och erhåller 9.8, 10.6, 10., 10., 9.8, 10.0 1. Beräkna ett 99% tvåsidigt konfidensintervall för mätvärdenas väntevärde µ. Lösning: a Eftersom X µ s/ 6 t5 och P t 0.005 5 X µ s/ 6 t 0.0055 = 0.99, där t 0.005 5 = 4.03, så ges ett 99% konfidensintervall för µ av [ I µ = x s t 0.005 5, x + s ] t 0.005 5 = [9.6, 10.6], 6 6 där x = 10.1, s = 0.3033 och t 0.005 5 = 4.03. b Eftersom 5S σ χ 5 och χ 0.955 = 1.15, så är 5s 0.95 = P σ χ 0.955 = P σ 5s χ 0.95 5 Alltså, ges ett uppåt begränsat 95% konfidensintervall för σ av I σ = [0, 0.63]. = P σ 0.63. 11