LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) Aktuella avsnitt i boken: Kap 61 65 Lektionens mål: Du ska förstå begreppet skattning av en parameter, kunna redogöra för vilka egenskaper en bra skattning bör ha, förstå begreppet konfidensintervall för en parameter, kunna beräkna tvåsidiga och ensidiga konfidensintervall för μ i en normalfördelning, både i fallen känt eller okäntσ 1 Studera figur 61 och gör er bekanta med beteckningarna i tabell 61 Det är viktigt att ni har helt klart för er skillnaden mellan storheter i populationen och storheter i stickprovet, tex skillnaden mellan populationsmedelvärdet (väntevärdet)μoch stickprovsmedelvärdet x 2 Det första steget när man vill dra slutsatser från data är ofta att man vill uppskatta värdet på en okänd populationsparameter tex ett okänt populationsmedelvärde μ Då använder man observationer i stickprovet, x 1,,x n, och bildar en estimator (ibland säger man skattning) tex är medelvärdet x är en bra estimator avμ För att skatta populationsvariansenσ 2 används oftast stickprovsvariansen s 2, gå tillbaka till s 19 20 om ni har glömt hur s 2 beräknades Gör uppgift 162(a) i studiematerialet och utnyttja de färdiga rutiner för beräkning av x och s som finns på de flesta miniräknare 3 Det är viktigt att inse att värdet på estimatorn tex ˆμ = x ändrar sig från stickprov till stickprov och alltså själv kan betraktas som en slumpvariabel Då kan vi, genom att använda resultat från sannolikhetsteorin, göra beräkningar på hur estimatorn kommer att variera och vad som är troliga resultat på estimatorn Gör uppgift 162(b)-(c); kommentar: medelfelet d(μ ) betecknas i boken som standard error of mean 4 En bra estimator ska vara väntevärdesriktig (unbiased) dvs i genomsnitt verkligen skatta rätt sak Den ska dessutom variera så lite som möjligt, dvs vi eftersträvar att variansen för estimatorn ska vara låg Studera figur 62 på s 129 i boken vilken estimator är bäst? Gör uppgift 164(a)-(b) Om du hinner gör du även (c)-uppgiften och fundera gärna på hur konstanterna c 1 och c 2 bör väljas 5 Oftast är man inte nöjd med att bara ange en estimator för en okänd populationsparameter I stället vill man hitta gränser där man, med viss säkerhet, kan stänga in parametern man gör ett konfidensintervall I dag ska vi koncentrera oss på att göra konfidensintervall för μ i en normalfördelning Studera hur intervallet ser ut då standardavvikelsenσantas vara känd på s 130 131 Gör uppgift 175 i studiematerialet 6 Läs om tolkning av konfidensintervall på s 135 figuren på s 136 är bra att ha som minnesbild när man tänker på begreppet konfidensintervall Gör uppgiften Dig1 i bifogade blad samt uppgift 181 i studiematerialet Fortsätter på nästa sida! VÄND!
Biostatistisk grundkurs, VT-15, VT2 2 7 På s 133 anges hur konfidensintervall förμska bildas dåσär okänd i intervallet bytsσut mot estimatorn ˆσ = s samtidigt som kvantilen i normalfördelningen, z 1 α/2 byts mot t-fördelningens kvantil t 1 α/2,n 1 Gör uppgifterna 179 och 180 i studiematerialet samt Dig6 8 Ibland vill man ha intervall som bara är begränsade åt ett håll läs om ensidiga konfidensintervall på s 134 Gör uppgift 184 i stuiematerialet samt Dig9 Om du vill träna mer på detta avsnitt eller när du repeterar är följande uppgifter lämpliga att titta på: 176, 197, 198, 201 samt övriga Dig-uppgifter i bifogade blad Inför övning 7 (2015-04-29): Aktuella avsnitt i boken är 66 69 A B C D Teoriavsnittet om hypotestest finns också presenterat med ett antal inspelningar som du kan hitta via kurshemsidan Börja med att se filmen Hypotestest I med frågan Ska vi döma Kalle för rattfylleri? Avsnitt 66 är i särklass viktigast inför nästa lektion Läs det noga speciellt exempel 613 och avsnitt 661 där alla viktiga begrepp inom hypotesprövning introduceras Styrkan hos ett test (avsnitt 67) är visserligen viktigt men kan med fördel läsas mer kursivt vid en första genomläsning vi återkommer till detta senare Avsnitt 69 behandlar hur man gör intervall och hypotestest kringσ 2 i en normalfördelning Läs mer översiktligt, vi kommer att stöta på metoderna vid datorlaborationerna DIGITALA UPPGIFTER, konfidensintervall förμ 1 Väntetiden (min) i ett sjukhus akutrum en tisdag förmiddag anses vara normalfördelat med väntevärde μ Baserat på 25 oberoende väntetider beräknas ett 95 % konfidensintervall förμ, I μ = (23, 55) Avgör om följande påståenden är falska eller sanna: (a) Sannolikheten är 095 att en patients väntetid ligger i intervallet (b) Intervallet ger oss en uppfattning om hur stor den förväntade väntetiden är (c) 95 % av alla patienter har en väntetid som ligger i intervallet (d) Medelvärdet av de 25 väntetiderna var 39 minuter (e) Det är inte speciellt troligt att påståendet Patienterna får i genomsnitt vänta 20 minuter är korrekt 2 Avståndsmätningar med ett instrument är normalfördelade med väntevärdeμ Baserat på 7 mätningar beräknas ett 95 % konfidensintervall förμ, I μ = (25, 27) Avgör om följande påståenden är falska eller sanna: (a) Intervallets bredd påverkas av variationen hos mätningarna (b) Om du ökar konfidensgraden till 099 blir intervallet smalare (c) Ett 95 % ensidigt, nedåt begränsat, intervall förμär (25, ) (d) Om du ökar antalet observationer till 10 kommer intervallet att bli smalare
Biostatistisk grundkurs, VT-15, VT2 3 (e) Det är inte så troligt attμär 29 (f) Om man vill halvera intervallets bredd måste man ta ungefär 4 gånger så många mätningar 3 Ett 99 % konfidensintervall förμien normalfördelning beräknades och man fick I μ = (45, 75) Vad är x, medelvärdet av mätningarna? 4 Med hjälp av n observationer vill man beräkna ett tvåsidigt 95 % konfidensintervall förμien normalfördelning därσanses vara känd Intervallet ska byggas upp enligt principen I μ = (A±kvantil B) Två av följande påståenden är felaktiga, vilka? (a) A är medelvärdet av mätningarna (b) A är en väntevärdesriktig skattning avμ (c) kvantilen ärλ 0025 (d) kvantilen är t 0025 (n 1) (e) B är medelfelet avμ (f) B är σ n (g) B är s n 5 Med hjälp av n observationer vill man beräkna ett tvåsidigt 95 % konfidensintervall förμien normalfördelning därσär känd Intervallet ska byggas upp enligt principen I μ = (A±kvantil B) Två av följande påståenden är felaktiga, vilka? (a) A är medelvärdet av mätningarna (b) A är en väntevärdesriktig skattning avμ (c) kvantilen ärλ 0025 (d) kvantilen är t 0025 (n 1) (e) B är medelfelet avμ (f) B är σ n (g) B är s n 6 Mätningar av kopparhalten i trä anses vara normalfördelade Man ville ha information om μ, den verkliga halten av koppar i träbiten Baserat på 9 mätningar beräknas x = 35, s = 07 och det s 95 % intervallet ( x ± t 0025 (9 1) 9 ) = (35 ± 231 07 3 ) = (296, 404) Sedan insåg man att mätinstrumentet hade ett systematiskt fel påδ = 01 enheter Para ihop nedanstående storheter med rätt numeriska värden 1 Konfidensintervall för μ + Δ 2 Konfidensintervall förμ 3 Skattad standardavvikelse för mätningar utan systematiskt fel 4 Skattning av μ + Δ 5 Skattning avμ Numeriska värden: (a) 35 (b) (296, 404)
Biostatistisk grundkurs, VT-15, VT2 4 (c) 34 (d) 07 (e) (286, 394) 7 Ett konfidensintervall för μ, avståndet i meter mellan två punkter är beräknat till (027, 034) Man ville uttrycka konfidensintervallet i mm i stället, ange detta intervalls (a) undre gräns (b) övre gräns (c) Vilket av alternativen nedan uttrycker vad det nya intervallet ett konfidensintervall för? i 1000 μ ii 0001 μ iii μ+0001 8 På en rivningsarbetsplats gjordes 5 mätningar av mängden asbestfibrer (fibrer/cm 3 ) som är tunnare än tre mikrometer i diameter Från mätningarna fick man x = 009 och s = 002 Ett uppåt begränsat 95 % konfidensintervall förμ, förväntad halt, blev (0, 011) Gränsvärdet för asbest är 010 fibrer/cm 3, vilken slutsats drar du från ditt ensidiga intervall? (a) Genomsnittlig asbetshalt är troligen för hög på arbetsplatsen (b) Med dessa data har vi inte kunnat påvisa att genomsnittlig asbetshalt understiger gränsvärdet (c) Genomsnittlig asbetshalt är troligen under gränsvärdet på arbetsplatsen (d) Gränsvärdet är understiget eftersom x = 009 < 010 9 Avgör i följande situationer vilken typ av intervall som är lämpligt att beräkna för respektive parameter: ett nedåt begränsat intervall, ett tvåsidigt intervall eller ett uppåt begränsat intervall Lösningar (a) Parameternμär förväntad blyhalt på ett daghem nära en trafikled Man vill förvissa sig om attμ understiger ett gränsvärde (b) Parametern μ är förväntad effekt efter en medicinsk behandling Man vill förvissa sig om att behandlingen ger positiv effekt som överstiger ett visst värde (c) Parametern Δ uttrycker det systematiska felet hos ett instrument Man vill undersöka om det existerar ett systematisk fel, dvs omδär 0 (d) Parametern μ är den förväntade längden hos fyraåriga flickor Man vill ha en uppfattning om vad μ är (e) Parametern p är andelen pojkar som föds med klumpfot Man vill påvisa att pojkar har större tendens än flickor att ha denna medfödda defekt 1 (a) Falskt, ett konfidensintervall talar inte om vad en enstaka mätning kommer att hamna 2 (a) Sant (b) Falskt
Biostatistisk grundkurs, VT-15, VT2 5 (f) Sant 3 Medelvärdet ligger mitt i intervallet och är 45+75 2 = 6 4 (a) Sant (c) Sant (d) Falskt (f) Sant (g) Falskt 5 (a) Sant (f) Falskt (g) Sant 6 1 Konfidensintervall för μ + Δ ges av (296, 404) 2 Konfidensintervall förμges av (296, 404) 3 Skattad standardavvikelse för mätningar utan systematiskt fel är 07 4 Skattning av μ + Δ är 35 5 Skattning avμär 34 7 (a) Undre gräns är 270 (b) Övre gräns är 340 (c) 1000 μ 8 Korrekt slutsats är: Med dessa data har vi inte kunnat påvisa att genomsnittlig asbetshalt understiger gränsvärdet 9 (a) Uppåt begränsat intervall (b) Nedåt begränsat intervall (c) Tvåsidigt intervall (d) Tvåsidigt intervall (e) Nedåt begränsat intervall