Föreläsningsanteckningar till kapitel 8, del 2 Kasper K. S. Andersen 4 oktober 208 Jämförelse av två väntevärden Ofte vil man jämföra två eller fler) produkter, behandlingar, processer etc. med varandra. Vi behandler de två fall stickprov i par och två oberoende stickprov där man utifrån vissa förutsättningar kan uttala sig om eventuella skillnader. Vi gör bland annat antaganden om normalfördelning: Delvis för att normalfördelningen är matematisk enkel att hantera och delvis för att man åtminstone för stora datamaterial) kan approximera med en normalfördelning enligt centrala gränsvärdesatsen. Låt oss illustrera de två situationer genom ett konkret exempel: Vi önsker att undersöka effekten av en viss typ medicin på blodtrycket. Vi kan organisera experimentet på ett av följanda sätt: Man tar n personer och mäter blodtrycket hos varje person före och efter behandling med medicinen. Stickprov i par ) Man tar två grupper personer och behandler personerna i den ena grupp med medicinen. Man mäter då blocktrycket på personerna i de två grupperna. Två oberoende stickprov ) Vi betraktar endast tvåsidiga konfidensintervall, men ensidiga konfidensintervall konstrueras från dessa på samma sätt som tidigare.. Stickprov i par Den statistiska modellen är som följer: Vi har n personer. Blodtrycket före och efter behandling hos person i kan ses som stokastiska variabler ξ i Nµ i, σ ) respektiva η i Nµ i +, σ 2 ). Vi tillåter alltså att väntevärdet beror på personen. Parametern anger den systematiska påverkning av medicinen på blodtrycket vi antar att denna är ens för alla jfr Figur 8.8). För att säga att medicinen påverkar blodtrycket skall vi kunna påstå att 0. Vi antar också att standardavvikelsen σ före behandling är samma för alla personer och också att standardavvikelsen σ 2 efter behandling är samma för alla personer. De två standardavvikelser σ och σ 2 kan dock vara olika. Vi antar dessutom att paren ξ, η ),..., ξ n, η n ) är oberoende. Sätt ζ i η i ξ i. Då blir ζ,..., ζ n oberoende. Enligt Sats 6B gäller ) ζ i N, σ 2 + σ2 2.
Alltså är ζ,..., ζ n ett stickprov från N, ) σ 2 + σ2 2. Denna situation är känd från tidigare, vi har två fall beroende på om σ och σ 2 är kända eller okända. Sats: Låt ξ i Nµ i, σ ) och η i Nµ i +, σ 2 ) för i,..., n och anta att paren ξ, η ),..., ξ n, η n ) är oberoende. Sätt ζ i η i ξ i och ζ n ζ +... + ζ n ). En intervallskattning för med konfidensgrad α ges av σ och σ 2 kända: där σ σ 2 + σ2 2. I ζ λ α/2 σ n, ζ + λ α/2 ] σ n σ och σ 2 okända: ] I ζ t α/2 n ) σ, ζ + t α/2 n ) σ n n där σ n n i ζi ζ ) 2 är punktskattningen av σ med s-metoden. Exempel: Vi mäter blodtryck före och efter användning av någon medicin på 5 personer. Vi antar att blodtrycketpå person i före och efter är normalfördelade: Nµ i, σ ) respektiva Nµ i +, σ 2 ). Ange ett 95% konfidensintervall för. Person 2 3 4 5 Blodtryck före, x i 75 70 75 65 95 Blodtryck efter, y i 85 75 80 80 00 Lösning: Vi får med z i y i x i i 2 3 4 5 z i 0 5 5 5 5 Vi har n 5 och 5 i z i 40 varav z 40 5 8. Då σ och σ 2 är okända beräknes också 5 i z2 i 400, vilket ger s n ) zi 2 n ) 2 n n z i i ) 400 402 20. 4 5 Då α 0.05 ger tabell att t α/2 n ) t 0.025 4) 2.776445. Konfidensintervallet blir då ] 20 20 I,obs 8 2.776445, 8 + 2.776445 2.4, 3.6]. 5 5 Då I innehåller med 95% sannolikhet så verkar medicinen ha blodtryckshöjande effekt. i 2
.2 Två oberoende stickprov Den statistiska modellen är som följer: Vi har två grupper med n respektiva personer, där personerna i grupp inte blir behandlad medan personerna i grupp 2 blir behandlad med någon medicin. Blodtrycket hos personerne i grupp ses som stokastiska variabler ξ,..., ξ n från Nµ, σ ). Motsvarende ses blodtrycket hos personerne i grupp 2 ses som stokastiska variabler η,..., η n2 från Nµ 2, σ 2 ). För att säga att medicinen påverkar blodtrycket skall vi kunna påstå att µ µ 2. Alltså är parametern µ µ 2 ett mått för den systematiske påverkning av medicinen på blodtrycket. Vi antar som i fallet Stickprov i par ) att standardavvikelsen σ utan behandling är samma för alla personer i grupp och också att standardavvikelsen σ 2 med behandling är samma för alla personer i grupp 2. De två standardavvikelser σ och σ 2 kan dock vara olika om båda är kända. Om båda är okända måste vi anta att σ σ 2! Se mera nedan). Vi antar dessutom att alle de stokastiska variablernerna ξ,..., ξ n, η,..., η n2 är oberoende. Man vill jämföra µ och µ 2 genom att göra en intervallskattning av µ µ 2. Vi användar punktskattningerna µ ξ ξ +... + ξ n n och µ 2 η η +... + η n2 av µ respektiva µ 2. Enligt Sats 6D gäller ) σ ξ N µ, och n η N ) σ 2 µ 2,. n2 Sats 6B ger då σ ξ η N µ 2 µ 2, + σ2 2 n..2. σ och σ 2 kända Sats: Låt ξ,..., ξ n Nµ, σ ) och η,..., η n2 Nµ 2, σ 2 ) och anta att ξ,..., ξ n, η,..., η n2 är oberoende. Sätt ξ ξ +... + ξ n n och η η +... + η n2. En intervallskattning av µ µ 2 med konfidensgrad α ges av σ I µ µ 2 ξ 2 η λ α/2 + σ2 2 σ 2, ξ η + λ α/2 + σ2 2. n n.2.2 σ och σ 2 okända I detta fall måste σ och σ 2 skattas. Låt σ n ξi n ξ ) 2 och σ2 η i η) 2 i i 3
vara punktskattningerna av σ respektiva σ 2 med s-metoden. Tyvärr är fördelningen av ξ η µ µ 2 ) σ 2 n + σ2 2 komplicerad Behrens-Fishers problem ) och en exakt lösning är inte känd! Om man antar σ σ 2 kan man dock visa att ξ η µ µ 2 ) t n ) + )) σ n + där σ n ) σ 2 + ) σ 2 n ) + ) är en sammanvägd punktskattning av σ σ 2. Man kan dessutom visa att σ 2 är en väntevärdesriktig punktskattning av σ 2 σ 2 2. Sats: Låt ξ,..., ξ n Nµ, σ ) och η,..., η n2 Nµ 2, σ 2 ) och anta att ξ,..., ξ n, η,..., η n2 är oberoende. Sätt ξ ξ +... + ξ n n och η η +... + η n2. Anta dessutom att σ σ 2 är okänd. Ett konfidensintervall I µ µ 2 för µ µ 2 med konfidensgrad α ges av I µ µ 2 ξ η t α/2 n + 2) σ +, ξ η + t α/2 n + 2) σ + ]. n n Exempel: Vi mäter blodtryck hos två grupper personer där grupp 2 behandlas med någon medicin. Vi får följande resultater Grupp : n 6, x 7.5, s 9.7 Grupp 2: 4, y 26.8, s 2 2.0 Observationerna anses komma från Nµ, σ) respektiva Nµ 2, σ). Bestäm ett 95% konfidensintervall för µ µ 2. Lösning: Den sammanvägda punktskattning av σ blir σobs n ) s 2 + ) s 2 2 n ) + ) 6 ) 9.7 2 + 4 ) 2.0 2 6 ) + 4 ) 902.45 0.6203. 8 4
Vi har α 0.05 varav t α/2 n ) + )) t 0.025 8) 2.306004. Insättning ger då konfidensintervallet ] I µ µ 2,obs 7.5 26.8 ± 2.306004 0.6203 6 + 4 25.52, 6.92]. Då 0 ligger inom I µ µ 2,obs verkar medicinen inte påverka blodtrycket. 8.4 8.5 ingår inte 5