LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB ÖVNING 7 (25-4-29) OCH INFÖR ÖVNING 8 (25-5-4) Aktuella avsnitt i boken: 6.6 6.8. Lektionens mål: Du ska kunna sätta upp lämpliga hypoteser utifrån en given situation genomföra ett hypotestest för väntevärdet i en normalfördelning förstå sambandet mellan konfidensintervall och hypotestest. Teoriavsnittet om hypotestest finns också presenterat med ett antal inspelningar som du kan hitta på kurshemsidan. Börja med att se filmen Hypotestest I (Grundbegreppen) som studerar frågan Ska vi döma Kalle för rattfylleri? I ett hypotestest börjar man med att ansätta en modell. Sedan sätter man upp lämpliga hypoteser, nollhypotes respektive mothypotes, kring en av modellens okända paremetrar. Nollhypotesen är det man ifrågasätter kring parametern och mothypotesen är det man försöker troliggöra. Gör 85(a) samt minst två av Dig-Dig4 i bifogade blad. 3 Återvänd till uppgift 85 och gör 85(b) och 85(d)-(e). Illustrera gärna med en figur som liknar den du ser i Dig6 (du har då för hand gjort det som R gör i kommandothypotes i (c)-uppgiften).) 4 Gör uppgifterna Dig6 och Dig7 för att träna på vilka slutsatser man kan dra från en hypotstest (och vilka slutsatser man inte kan dra). 5 Gör uppgift 88(a). 6 Spara detta om ni inte hinner vid första genomgången: Läs om styrkan hos ett test i kapitel 6.7 på s. 44 och studera figuren på s. 45. Begreppet styrka och styrkefunktion är viktigt i all praktisk forskning för den används bl.a. för att svara på frågan Hur många mätningar ska jag göra i min undersökning? I filmen Hypotes II (Styrkefunktionen), som ligger på kurshemsidan, kan ni se en alternativ framställning till bokens. Uppgifterna 88(b)-(c) kommer ni att få fundera på vid nästa labbtillfälle. 7 Läs om hur man kan utföra testet genom att utgå från x och standardisera på s. 38 39. Gör uppgift 9 och kontrollera att ni är säkra på kopplingen mellan konfidensintervall och test som finns beskrivet på s. 39. Gör även Dig2 och Dig4. 8 Ni har arbetat med konfidensintervall och testkvantitet för att utföra ett test. En tredje variant att göra en hypotesprövning är att beräkna det s.k. P-värdet (prob-värdet). Utgå ifrån att H gäller. Beräkna sedan, under denna förutsättning, sannolikheten att få det resultat på data som vi fick eller ett ännu mer extremt resultat. Om denna sannolikhet (P-värdet) är liten drar vi slutsatsen att vårt ursprungliga antagande att H gäller inte är sann. Vi förkastar alltså H och vår felrisk i det fallet är precis P-värdet. Observera att man med denna metoden räknar ut testets exakta signifikansnivå direkt (ibland kallas metoden därför direktmetoden ). I filmen Hypotes III (Direktmetoden), som ligger på kurshemsidan, kan ni se en alternativ framställning till bokens. Gör uppgift 95 och beräkna P-värdet. Vad är ert resultat? Utryck ert resultat i stjärnsystemet som beskrivs på s. 4. Gör även 96 samt Dig6 för att träna på tolkningen av ett tests P-värde. VÄND!
Biostatistisk grundkurs, VT-5, VT2 2 9 Vad händer omσinormalfördelningen är okänd och måste skattas med s? Jo, samma sak som tidigare byt utσmot s och normalfördelningens kvantil z α/2 mot t-kvantil. Läs om detta på s. 42 43. Gör uppgift 223. Om du vill träna mer på detta avsnitt eller när du repeterar är följande uppgifter lämpliga att titta på: Samtliga Dig-uppgifter, 87(a), 23(a) Inför övning 8 (25-5-4): Aktuella avsnitt i boken är kapitel 7. A Studera exemplen på s. 59 och figuren på s. 6. B Läs om matchade data i avsnitt 7. och observera att när man väl bildat differenser används exakt samma metoder som för ett stickprov i kapitel 6. C Läs om principer på s. 63 i fallet då vill jämföra två oberoende stickprov. I de följande beskrivs de två fallen samma varians och olika varianser läs igenom! Observera hur man skattarσ 2 med en gemensam skattning baserade på de två stickprovsvarianserna. D Läs igenom avsnitt 7.3 och observera att när man vill undersöka om två varianser är lika dyker en ny typ av fördelning F-fördelningen upp. Hypotestest, digitala frågor Grundläggande begrepp. I en undersökning på slumpmässigt utvalda manliga lastbilschaufförer med hjärt- och kärlbesvär mätte man deras kolesterolhalt (mmol/l). Ett normalt kolesterolvärde ska ligga under 5. mmol/l men man misstänkte att denna grupp hade en högre kolesterolhalt. Beteckna väntevärdet av kolesterolhalten med μ. Vilken uppsättning av hypoteser bör man studera för att undersöka om misstanken är befogad? (a) H :μ=5; H :μ 5 (b) H :μ 5; H :μ=5 (c) H :μ 5; H :μ>5 (d) H :μ 5; H :μ<5 2. Aluminium har smältpunkt 66 C. På ett ämne görs mätningar av smältpunkten, beteckna mätningarnas väntevärde med μ. Man misstänker att ämnet inte är ren aluminium, vilken uppsättning av hypoteser bör ställas upp? (a) H :μ=66; H :μ 66 (b) H :μ 66; H :μ=66 (c) H :μ 66; H :μ>66 (d) H :μ 66; H :μ<66 3. Gränsvärdet för asbest är. fibrer/cm 3 i luften. På en arbetsplats där man river ner rör isolerade med material innehållande asbest mäts halten. Om μ betecknar mätningarnas väntevärde, vilka hypoteser bör man ställa upp för att förvissa sig att genomsnittshalten av asbest är säkert under gränsvärdet? (a) H :μ=.; H :μ.
Biostatistisk grundkurs, VT-5, VT2 3 (b) H :μ.; H :μ=. (c) H :μ.; H :μ>. (d) H :μ.; H :μ<. 4. Då patienter får en viss typ av medicinsk behandling vet man av erfarenhet att 6 % av dem får biverkan. En ny medicin är utvecklad och prövas på 2 slumpmässigt utvalda patienter. Låt p vara P(en patient får biverkan). Vilka hypoteser bör man ställa upp om man vill påvisa att den nya medicinen ger färre patienter biverkan än den traditionella behandlingen? (a) H : p =.6; H : p.6 (b) H : p.6; H : p =.6 (c) H : p.6; H : p >.6 (d) H : p.6; H : p <.6 5. Låt x,...,x n vara observationer från X som är normalfördelad N(μ,σ) därσanses vara känd. Nedan anges ett antal uppsättningar av hypoteser kring μ. Para ihop de olika uppsättningarna med rätt testregel då man vill utföra testet med felriskenα. Hypoteser:. H :μ μ ; H :μ>μ 2. H :μ=μ ; H :μ μ 3. H :μ μ ; H :μ<μ Testregler: Förkasta H på nivåαom (a) x <μ λ α/2 (b) x >μ +λ α (c) x >μ +λ α/2 σ (d) x <μ +λ α/2 (e) x >μ +λ α/2 (f) x >μ λ α (g) x μ σ n < λ α 6. I en undersökning på lastbilschaufförer ansåg man att kolesterolhalten varierar enligt en normalfördelning med väntevärde μ och standardavvikelse. Man misstänkte att denna grupp hade en högre kolesterolhalt än det normala 5. mmol/l och ville testa hypotesen H :μ 5 mot H :μ>5 på signifikansnivå.5. Medelvärdet av de kolesterolhalterna blev x = 5.7. Nedan visas en figur över det kritiska området där k = 5+λ.5 = 5.52. Kritiskt område, H : µ = 5., H : µ > 5..8.6.4.2.8.6 H: µ = 5. H: µ > 5. n = σ =. α =.5.4.2 4 4.5 5 5.5 6 k = 5.52
Biostatistisk grundkurs, VT-5, VT2 4 Avgör om följande påståenden är sanna eller falska: (a) H kan ej förkastas på signifikansnivå.5. (b) H kan förkastas på signifikansnivå.5. (c) H kan förkastas på signifikansnivå.5. (d) Testet baserar sig på för få mätningar för att man ska kunna dra någon slutsats Testet innebär att H kan förkastas på signifikansnivå.5. Avgör om följande slutsatser är sanna eller falska. (e) Risken är 5 % att chaufförernas genomsnittliga kolesterolhalt är för hög. (f) Risken är 5 % att vi felaktigt påstår att chaufförer med en genomsnittlig normal kolesterolnivå har för hög halt. (g) Risken är 5 % att vi felaktigt påstår att chaufförer med en genomsnittlig hög kolesterolhalt har en normal halt. (h) Enbart 5 % av chaufförerna har normal kolesterolhalt. 7. En tillverkare påstår att μ, förväntad livslängd hos en viss komponent är minst timmar. Du misstänker att livslängden är kortare än så och sätter upp hypoteserna H :μ ; H :μ<. Slutsatsen från testet blev att H KAN EJ förkastas på nivå 5 %. Vilket av alternativen nedan är en korrekt tolkning av detta resultat? (a) Vi har visat att H gäller, d.v.s. genomsnittlig livslängd för komponenterna är minst timmar. (b) Livslängderna i denna undersökning var inte tillräckligt låga för att visa att H är falsk. (c) Vi har visat att H gäller. (d) Vi har visat att för 5 % av komponenterna gäller H. 8. Ett företag köper regelbundet stora leveranser av en viss enhet från en tillverkare. Vid varje leverans görs en kvalitetskontroll och 2 partier väljs slumpmässigt ut från partiet. På dessa 2 enheter mäts en storhet som inte bör understiga mm. Man utför därför ett test på nivå 5 % och testar H = mot H <. Om H förkastas anser man partiet vara dåligt och det skickas tillbaka till tillverkaren. Vilket av följande alternativ kommer att gälla i det långa loppet? (a) 5 % av alla partier skickas tillbaka. (b) 5 % av alla bra partier kommer att skickas tillbaka. (c) 5 % av alla dåliga partier kommer att accepteras. (d) 5 % av alla bra partier kommer att accepteras. 9. Kolesterolhalten hos lastbilschaufförer anses variera enligt en normalfördelning med väntevärde μ och standardavvikelse mmol/l. Baserat på mätningar vill man testa hypotesen H :μ=5 (normal kolesterolhalt) mot H :μ>5 (ökad halt) på signifikansnivå.5. Antag attμ, chaufförernas verkliga genomsnittliga kolesterolhalt, är 5.8. Använd figuren nedan för att svara på frågorna.
Biostatistisk grundkurs, VT-5, VT2 5 Kritiskt område, H : µ = 5., H : µ > 5..5.5 H: µ = 5. H: µ > 5. n = σ =. α =.5 4 4.5 5 5.5 6 k = 5.52 Sannolikheter för fel av typ och typ 2; Styrka då µ = 5.8.5.5 4 4.5 5 5.5 6 α =.5 (röd), β =.88 (blå); S(5.8) = β =.82 (a) Hur stor är risken att man i testet inte upptäcker att chaufförernas genomsnittliga kolesterolhalt överstiger 5 när den i själva verket är 5.8? (b) Hur stor är chansen att man i testet verkligen upptäcker att chaufförernas genomsnittliga kolesterolhalt överstiger 5 när den är 5.8?. I en undersökning på slumpmässigt utvalda manliga lastbilschaufförer med hjärt- och kärlbesvär mätte man bl.a. deras kolesterolhalt (mmol/l). Ett normalt kolesterolvärde ska ligga under 5. mmol/l men man misstänkte att denna grupp hade en högre kolesterolhalt. Därför ville man testa hypotesen H :μ=5 mot H :μ>5 på signifikansnivåα. Antag att halten hos chaufförerna varierar enligt en normalfördelning med väntevärdeμoch standardavvikelse mmol/l. Testet är: Förkasta H på nivåαom x > k = 5+λ α. Man ville undersöka testets styrka för olika värden på μ, chaufförernas verkliga genomsnittliga kolesterolhalt, och ritade därför upp testets styrkfunktion, S(μ), då testet utförs på signifikansnivåα. Använd figuren nedan för att svara på frågorna. H: µ = 5. S(µ) = P(förkasta H).8.6.4 H: µ > 5. n = σ =. α =.5.2 5 5.5 6 µ (a) Antag attμär 5.4, vad är sannolikheten att vi i testet upptäcker att den genomsnittliga kolesterolhalten överstiger 5? (b) Om vi tycker att sannolikheten i förra deluppgiften är för låg, vilka av följande strategier kommer att göra sannolikheten (d.v.s. styrkan) högre? i. Öka antalet mätningar och mät på fler än personer. ii. Minska antalet mätningar och mät på färre än personer. iii. Försöka öka variationen i populationen, d.v.s. ökaσ. iv. Försöka minska variationen i populationen, d.v.s. minskaσ. v. Öka testets signifikansnivåα. vi. Minska testets signifikansnivåα.. Ett företag köper regelbundet stora leveranser av en viss enhet från en tillverkare. Vid varje leverans görs en kvalitetskontroll och 2 partier väljs slumpmässigt ut från partiet. På dessa 2 enheter mäts en storhet som inte bör understiga mm. Man utför därför ett test på nivå 5 % och testar H = mot H <.
Biostatistisk grundkurs, VT-5, VT2 6 Om H förkastas anser man partiet vara dåligt och det skickas tillbaka till tillverkaren. Vilket av följande alternativ är felaktigt angående testets styrkefunktion S(μ)? (a) Dåμ = gäller att S() =.5. (S/F) (b) Ju mindreμär i förhållande till, desto större vill man att styrkefunktionen S(μ) ska vara. (S/F) (c) Om S(9.6) =.8 innebär det att ett dåligt parti därμ = 9.6 kommer att accepteras med sannolikhet.2. (S/F) (d) Om S(9.3) =.9 innebär det attμär 9.3 med sannolikhet.9. (S/F) Samband med konfidensintervall 2. Ett konfidensintervall för μ med konfidensgrad.99 angavs till (2.5, 28.8). Vilka av följande påstående är korrekta? (a) H :μ=3 kan förkastas på nivå.. (b) Det är inte troligt attμär 2, 99 % säkerhet (c) Vi kan inte förkasta hypotesen attμär 25 på nivå.. 3. Asbest är förbjudet sedan länge, men finns framförallt kvar i äldre byggnader och är en risk för de som arbetar i byggbranschen. Gränsvärdet för asbest är. fibrer/cm 3 i luften. På en rivningsarbetsplats gjordes 5 mätningar av mängden fibrer (fibrer/cm 3 ) och x =.9 och s =.2. Antag att för mätningarna på fiberhalten gäller en normalfördelning med väntevärdeμoch standardavvikelseσ. (a) För att testa hypoteserna H :μ=.; H. kan man beräkna ett konfidensintervall förμ. Vilken typ av intervall är det intressanta? (Tvåsidigt/Ensidigt övre begränsat/ensidigt undre begränsat) (b) För att testa hypoteserna H :μ=.; H <. kan man beräkna ett konfidensintervall förμ. Vilken typ av intervall är det intressanta? (Tvåsidigt/Ensidigt övre begränsat/ensidigt undre begränsat) (c) För att testa hypoteserna H :μ=.; H >. kan man beräkna ett konfidensintervall förμ. Vilken typ av intervall är det intressanta? (Tvåsidigt/Ensidigt övre begränsat/ensidigt undre begränsat) (d) Vilken uppsättning av hypoteser är intressanta för arbetarna på rivningsplatsen? i. H :μ=.; H. ii. H :μ=.; H <. iii. H :μ=.; H >. 4. Nedan anges tre uppsättningar av hypoteser kringμien normalfördelning. Para ihop hypoteserna med de intervall som är intressanta att studera. Hypoteserna:. H :μ=3; H 3 2. H :μ 3; H :μ<3 3. H :μ 3; H :μ>3 Intervallen: (a) (, 4.7) (b) (2.3, 2.9) (c) (.7, ) Antag att samtliga intervall har konfidensgrad.99. I vilken av de tre uppsättningarna av hypoteser är slutsatsen att H förkastas på nivå %?
Biostatistisk grundkurs, VT-5, VT2 7 Direktmetoden 5. Vid ett test beräknades P-värdet =.36. Vilka av följande slutsatser är sanna? (a) H kan förkastas på nivå 5%. (b) H kan förkastas på nivå %. (c) H kan förkastas på nivå 3.6%. (d) H kan förkastas på samtliga nivåer som understiger 3.6%. 6. Ett företag köper stora leveranser av en viss enhet från en tillverkare. Vid kvalitetskontrollen mäts en storhet hos 2 enheter och medelvärdet blev 9.5. Man utför ett test på nivå 5 % där man testar H :μ (enhet ok) mot H :μ< (enhet felaktig). Om H förkastas anser man partiet vara dåligt och det skickas tillbaka till tillverkaren. Vid testet redovisas P-värdet som beräknades till.2. 2.5.5 2.5.5 H: µ =. H: µ <. n = 2 σ =. α =.5 Test med fixt α värde Medel = 9.5 medel < k <=> H förkastas 9.2 9.4 9.6 9.8.2.4.6.8 k = 9.6 Test med direktmetoden Medel = 9.5 P =.2 P < α <=> H förkastas 9.2 9.4 9.6 9.8.2.4.6.8 Ange om följande påstående angående P-värdet är sanna eller falska. (a) Eftersom P-värdet är mindre än.5 kan vi förkasta H på nivå 5 %. (b) H kan förkastas på nivå 2. %. (S/F) (c) Sannolikheten att H är falsk är 2. %. (S/F) (d) Sannolikheten att H är sann är 2. %. (S/F) (e) Sannolikheten att H är falsk är 2. %. (S/F) (f) Sannolikheten att H är sann är 2. %. (S/F) (g) H kan inte förkastas på nivå %. (S/F) (h) Det är 2. % risk att vi skickar tillbaka ett parti som är ok. (S/F) (i) Sannolikheten är.2 att medelvärdet är högst 9.5 då partiet är ok. (S/F) 7. Nedan anges två uppsättningar hypoteser rörande μ med tillhörande 95 % konfidensintervall. Para ihop med motsvarande P-värde. Hypoteser och intervall: (.) H :μ=2; H :μ 2; I μ = (.67, 2.98) (2.) H :μ ; H :μ<; I μ = (, 9.5) P-värde: (a) P-värde =.4 (b) P-värde =.
Biostatistisk grundkurs, VT-5, VT2 8 Lösning till digitala frågor. Rätt svar är H :μ 5; H :μ>5. Som nollhypotes sätter man upp det man ifrågasätter och som mothypotes det man vill troliggöra. Observera att hypoteserna H :μ 5; H :μ>5 är i detta fall identiska med H :μ=5; H :μ>5, d.v.s. leder till samma test. 2. Rätt svar är alternativet i (a): H :μ=66; H :μ 66. Som nollhypotes sätter man upp det man ifrågasätter och som mothypotes det man vill troliggöra. 3. Rätt svar är H :μ.; H :μ.. Som nollhypotes sätter man upp det man ifrågasätter och som mothypotes det man vill troliggöra. Om H förkastas till förmån för H har vi troligjort att förväntad asbesthalt ligger under gränsvärdet. 4. Rätt svar är H : p.6; H : p.6. Som nollhypotes sätter man upp det man ifrågasätter och som mothypotes det man vill troliggöra. Om H förkastas till förmån för H har vi troligjort att P(biverkan) med den nya medicinen understiger 6 %. 5.. För hypoteserna H :μ μ ; H :μ>μ gäller testregeln i (b), förkasta H om x >μ +λ α 2. För hypoteserna H :μ=μ ; H :μ μ gäller testregeln i (e), förkasta H om x >μ +λ α/2 σ n 3. För hypoteserna H :μ μ ; H :μ<μ gäller testregeln i (g), förkasta H om x μ σ n σ är ekvivalent med att x <μ λ α n < λ α vilket 6. Av de fyra första påståenden är enbart(b) sant. Eftersom x = 5.7 > k = 5.52 kan H förkastas på signifikansnivå.5. Av de fyra sista påståenden är det enbart (f) som stämmer. Signifikansnivån α tolkas som P(förkasta H H sann)=p(påstå att förarna har högre halt när de i själva verket har normal). 7. Det är enbart påstående (b) som är sant. Observera att det inte är tillåtet att dra den slutsats som finns i (a), att H ej kan förkastas innebär inte att H är sann. 8. Eftersomα=P(H förkastas (parti avskiljs) då H är sann (parti är ok))= gäller att, i det långa loppet, kommer 5 % av alla bra partier kommer att skickas tillbaka. 9. (a) Detta ärβ=p(fel av typ II) vilket är markerat med blå färg i figuren. Risken är alltså.88. (b) Detta är testets styrka i punkten 5.8, vilket är S(5.8) = β =.88 =.82.. (a) I grafen avläses att styrkefunktionens värde i punkten 5.4 är ungefär.35. Sannolikheten att vi med detta test upptäcker att den genomsnittliga kolesterolhalten överstiger 5 är alltså.35 då verklig genomsnittlig kolesterolhalt är 5.4. (b) Styrkefunktionen kommer att få ett brantare utseende, d.v.s. styrkan ökar i en fix punktμom vi: ökar antalet mätningar lyckas minskaσ ökar testets signifikansnivå Observera alltså att, för ett fixtμ, innebär en minskning avαattβ ökas och därmed minskar styrkan S(μ) = β.. Det är det sista alternativet som är felaktigt. Styrkefunktionen talar om för oss hur bra vårt test är, och ingenting om hur troligt attμskulle vara ett visst värde. 2. Samtliga påståenden är korrekta. 3. (a) Hypoteserna H :μ=.; H :μ. kan testas genom att beräkna ett tvåsidigt konfidensintervall förμ.
Biostatistisk grundkurs, VT-5, VT2 9 (b) Hypoteserna H :μ=.; H :μ<. kan testas genom att beräkna ett ensidigt, uppåt begränsat, konfidensintervall förμ. (c) Hypoteserna H :μ=.; H :μ>. kan testas genom att beräkna ett ensidigt, nedåt begränsat, konfidensintervall förμ. (d) Det är uppsättningen H : μ =.; H : μ <. eftersom de är intresserade att påvisa att gränsvärdet verkligen är understiget. 4.. H :μ=3; H :μ 3ska paras ihop med intervallet i (b), (2.3, 2.9). 2. H :μ 3; H :μ<3ska paras ihop med intervallet i (a),(, 4.7). 3. H :μ 3; H :μ>3ska paras ihop med intervallet i (c),(.7, ). Eftersom intervallet i (b) ej täcker över 3 förkastas H i den första uppsättningen av hypoteser och vi har troliggjort attμär skilt från 3. 5. Det är enbart slutsatsen i (b) som är felaktig, de övriga tre är korrekta. 6. (a) SANT (b) SANT, 2. % är testets exakta felrisk (c)-(f) FALSKT! Detta är inte tolkningen av P-värdet men tyvärr ser man ofta detta fel i texter av olika slag (rapporter, avhandlingar, böcker). (g) SANT (h) SANT (i) SANT 7. Det är (.) som hör ihop med (b) och (2.) med (a). I den första uppsättningen av hypoteser täcker tillhörande intervall äver nollhypotesens värde 2. H kan alltså inte förkastas på nivå.5 och motsvarande P-värde måste då vara större än.5. I den andra uppsättningen av hypoteser täcker intervallet ej över nollhypotesens värde på. Motsvarande P-värde måste alltså understiga.5.