Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Relevanta dokument
Laboration 4 Statistiska test

1 Grundläggande begrepp vid hypotestestning

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Hur man tolkar statistiska resultat

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

2. Test av hypotes rörande medianen i en population.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Laboration 4: Hypotesprövning och styrkefunktion

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Laboration 2: Statistisk hypotesprövning

Hypotestestning och repetition

Hur skriver man statistikavsnittet i en ansökan?

Medicinsk statistik II

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 12, FMSF45 Hypotesprövning

Parade och oparade test

Statistik 1 för biologer, logopeder och psykologer

F22, Icke-parametriska metoder.

Matematisk statistik för B, K, N, BME och Kemister

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

TAMS65 - Föreläsning 6 Hypotesprövning

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Examinationsuppgift 2014

8 Inferens om väntevärdet (och variansen) av en fördelning

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift a b c d e Vet inte Poäng

FACIT (korrekta svar i röd fetstil)

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Gamla tentor (forts) ( x. x ) ) 2 x1

F3 Introduktion Stickprov

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Kapitel 10 Hypotesprövning

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

a) Facit till räkneseminarium 3

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 5: Hypotesprövningar

Avd. Matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Introduktion och laboration : Minitab

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

, s a. , s b. personer från Alingsås och n b

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Fråga nr a b c d 2 D

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 12: Regression

Föreläsning 11: Mer om jämförelser och inferens

7.3.3 Nonparametric Mann-Whitney test

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Föreläsningsanteckningar till kapitel 8, del 2

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

TMS136. Föreläsning 11

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

TMS136. Föreläsning 13

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Föreläsning G60 Statistiska metoder

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tenta i Statistisk analys, 15 december 2004

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Avd. Matematisk statistik

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Laboration 4 R-versionen

7.5 Experiment with a single factor having more than two levels

Statistik och epidemiologi T5

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Transkript:

Matematikcentrum Matematisk statistik Lunds universitet MASB11 VT15, lp3 Laboration 4 Statistiska test 2015-03-06 Del I: Standardtest Del II: Styrkefubktion

Syftet med laborationen är att ni ska bekanta er med olika typer av hypotestest och dess egenskaper: Ni skall bekanta er med lite av de funktioner som finns i R vad det gäller olika grundläggande statistiska test, främst parametriska men i viss mån även ickeparametriska test (del II av handledningen). Till varje parametriskt test ges också motsvarande icke-parametriska alternativ. Se kapitel 6.6, 7.1-3, kap. 12.1-2 samt kap. 9.1-4 i läroboken. Ni ska träna på de grundläggande begreppen inom hypotesprövning (t.ex. signifikansnivå och styrka) samt vilka slutsatser man kan dra från analysen (del I av handledningen). Se kapitel 6.6-6.8 i läroboken. Del I: Statistiska standardtest i R Kortfattade svar till frågorna som ställs i uppgifterna finns i slutet på handledningen. På kursens hemsida hittar ni de fem datamaterial som används i denna del av handledningen. Datamaterialen som används är Albumin, Median, Klorofyll, Dammar och Gråsparvar. 1 Test av medelvärde/median från en population. Använd datamaterialet Albumin.RData. a) t-test. En blandning av blodserum innehåller exakt 42 g albumin per liter. Två laboratorier (A och B) får göra sex bestämningar var av koncentrationen. Vi vill undersöka om det finns någon systematisk avvikelse från det sanna värdet (42 g/l) (tvåsidig mothypotes). I R gör man två t-test med nedanstående kommandon i kommandofönstret (glöm inte att spara det som, t.ex. lab3.r) och kör dem. t.test(albumina, mu=42) t.test(albuminb, mu=42) Tolka utskriften. Hur stora är p-värdena och vad blir slutsatserna? Vad blir konfidensintervallen för medelkoncentrationerna? b) Test av median. Tillämpning av Binomialfördelningen. Använd datamaterialet Median.RData. I materialet finns total längd för ett stickprov om 16 gråsparvar. Vi vill testa om populationens medianlängd är större än 160 mm. Detta kan göras genom att undersöka hur många gråsparvar i stickprovet som är längre än 160 mm. Under H 0 är dessa antal Bin(n, 0.5). Detta innebär att vi kan använda ett test för p i en binomialfördelning. Vi behöver då n (=16) och beräkna x = antal som är längre än 160 mm och testa H 0 : p=0.5: antal <- length(median) stora <- sum(median > 160) binom.test(x=stora, n=antal, p=0.5) Lägg märke till att det p-värde vi får gäller ett tvåsidigt test. Om vi vill ha ett ensidigt test får vi använda ett av kommandona binom.test(x=stora, n=antal, p=0.5, alternative= less ) binom.test(x=stora, n=antal, p=0.5, alternative= greater ) 2

Om vi vill testa om medianen är större än 160, vilket alternativ ska vi då använda? Vad blir resultatet om vi vill ha ett ensidigt test? Hur stort är p-värdet och vad blir slutsatsen? c) Rang-test. Alternativ variant av mediantestet är att använda ranger istället. När vi bara undersöker hur stor andel av värdena som ligger över resp. under den önskade medianen förlorar vi informationen om hur långt från medianen de ligger. Om de värden som ligger över 160 dessutom ligger längre från 160 än vad de värden som ligger under 160 gör tyder det ju på att medianen borde vara större än 160. Detta utnyttjar man i ett Wilcoxon signed rank-test: wilcox.test(median, mu=160) wilcox.test(median, mu=160, alternative= less ) wilcox.test(median, mu=160, alternative= greater ) Vad blir slutsatsen nu? Om vi vill testa om medianen är större än 160, vilket ensidigt alternativ ska vi välja? (Ignorera varningarna om cannot compute exact test with ties.) 2 Test vid jämförelse av två populationer. Använd datamaterialet Klorofyll.RData. a) t-test (oberoende grupper). Alger fick växa under ljusa respektive mörka förhållanden. Undersök med ett t-test om det finns skillnader i förväntad klorofyllhalt mellan de två grupperna genom att använda t.test igen men nu genom att lägga till gruppvariabeln (jämför Lab1 där vi delade upp överlevnaden på hannar och honor med ~): t.test(klorofyll$klorofyll ~ Klorofyll$Grupp) Tolka utskriften. Om vi inte säger något annat förutsätter t.test att varianserna i de två grupperna är olika och kompenserar för det. Om vi vet (eller antar) att varianserna är lika kan vi utnyttja det: t.test(klorofyll$klorofyll ~ Klorofyll$Grupp, var.equal=true) Blev det någon skillnad? För säkerhets skull är det bäst att verkligen testa om varianserna är olika: var.test(klorofyll$klorofyll ~ Klorofyll$Grupp) Är varianserna olika? Vilket av de två t-testen ska vi använda? Slutsatser? Vi kan få en grafisk beskrivning av skillnaderna med en boxplot: plot(klorofyll$klorofyll ~ Klorofyll$Grupp) Verkar det stämma med slutsatsen ovan? b) Rangsummetest. Gör nu om testet i 2(a) som ett rangsummetest genom 3

wilcox.test(klorofyll$klorofyll ~ Klorofyll$Grupp) Hur stort är p-värdet och vad blir slutsatsen? Jämför resultatet med t-testet som ni gjorde i (a)-uppgiften. 3 Test vid matchade data. Använd datamaterialet Dammar.RData. a) t-test. Jämför om det finns någon skillnad i kvävebelastning mellan vår och sommar. Vi måste nu tala om för t.test att vi har två variabler som är parade: t.test(dammar$n_belast_v, Dammar$N_belast_S, paired=true) Finns det några skillnader mellan vår och sommar? b) Teckentest. Gör nu motsvarande analys som ett icke-parametriskt test med ett teckentest som räknar hur ofta vår-värdet överstiger motsvarade sommar-värde: antal <- nrow(dammar) stora <- sum(dammar$n_belast_v > Dammar$N_belast_S) binom.test(x=stora, n=antal, p=0.5) Finns det några skillnader? Jämför resultatet med t-testet som ni gjorde i (a)-uppgiften. c) Rangsummetest. Utnyttja nu storleken på värdena med ett rangsummetest istället: wilcox.test(dammar$n_belast_v, Dammar$N_belast_S, paired=true) Vad blir slutsatsen nu? 4 Test av kategoridata. Använd datamaterialet Gråsparvar.RData. a) χ2-test. Vi vill nu testa om vi har en jämn könsfördelning i materialet. Om man gör en enkel tabell på variabeln kön får man följande resultat: antal <- table(grasparvar$kön) andel <- prop.table(antal) cbind(antal, andel) antal andel Hane 87 0.6397059 Hona 49 0.3602941 Vi kan utföra testet på flera olika sätt. För det första kan vi göra et χ 2 -test där vi jämför den observerade fördelningen med den förväntade under hypotesen om jämn könsfördelning. Detta görs med chisq.test(antal) 4

Hur stort är p-värdet och vad blir slutsatsen? Om man inte säger något annat testar R om andelarna är lika. Vill man t.ex. testa om det kan vara 60 % hanar och 40 % honor får man göra så här: chisq.test(antal, p=c(0.6,0.4)) Vad blir slutsatsen nu? b) Test av ett proportionstal. Vi kan också göra samma test med hjälp av binomialfördelningen: antal <- nrow(grasparvar) hannar <- sum(grasparvar$kön=="hane") binom.test(x=hannar, n=antal, p=0.5) Gör testet. Ändrar sig slutsatsen? En fördel här är att vi på köpet fick ett konfidensintervall för andelen. Men å andra sidan fungerar det bara när vi har två kategorier. Har vi fler måste vi använda χ2-testet. c) Test av två proportionstal. Testa nu om andelen som överlever är lika stor bland honor som bland hanar. Detta görs med med hjälp av ett χ2-test på en korstabell: tabell <- table(grasparvar$kön, Grasparvar$Överlevnad) prop.table(tabell, margin=1) chisq.test(tabell) Hur stort är p-värdet och vad blir slutsatsen? Svar: 1. a) A: p=0.033; B: p=0.081; Vi kan påvisa en skillnad för A men inte för B. 95% KI A: (42,06, 42.94); B: (35.69, 42.51) b) p=0.038; Vi kan påvisa att Md>160 c) p=0.00024; Vi kan påvisa att Md>160. 2. a) Varianserna är inte olika (p=0.48); t-test: p=0.009; Vi kan påvisa en skillnad i klorofyll. b) p=0.015; Vi kan påvisa en skillnad. Samma slutsats men inte lika signifikant. 3. a) p=0.262 Vi kan inte påvisa någon skillnad b) p=0.070; Vi kan inte påvisa någon skillnad c) p=0.195; Vi kan inte påvisa någon skillnad. 4. a) p=0.0011; Vi kan påvisa en avvikelse från jämn könsfördelning; p=0.345: könsfördelningen skulle kunna vara 60/40. b) p=0.0014: Vi kan påvisa en avvikelse från jämn könsfördelning c) p=0.112: Vi kan inte påvisa någon skillnad i andelen som dör Del II: Grundläggande begrepp vid hypotesprövning 5

Denna del av laborationen fokuserar på de grundläggande egenskaperna hos ett hypotestest; felrisker, signifikansnivå samt styrka. Det finns också tre videoinspelningar på kursens hemsida som presenterar begreppen. Exempel: Muntorrhet Läkemedel kan ge en nedsatt salivkörtelfunktion, vilket är en riskfaktor för karies och andra sjukdomar i munhålan. På 7 slumpmässigt utvalda patienter som alla fick samma medicin mätte man under 5 minuter den så kallade tuggstimulerade saliven. Normal mängd saliv under dessa förhållanden är 1 ml/min och muntorrhet anses föreligga när mängden saliv understiger 0.7 ml/min. Som modell antog man att salivmängden är normalfördelad med väntevärde µ och standardavvikelse σ, där σ anses vara 0.5 ml/min. Intressanta frågeställningar är t.ex.: Stöder data vår misstanke att medicinen sänker salivproduktionen? Om medicinen ger upphov till en genomsnittlig salivproduktion på 0.8 ml/min, hur troligt är det att vi kommer att missa den nedsatta salivproduktionen med vårt test? Hur många patienter ska vi mäta på om vi vill att testet ska upptäcka en nedsatt salivproduktion på 0.7 ml/min med sannolikheten 0.95? På kursens hemsida hittar ni data i filen Saliv.RData. Kopiera också ner rutinerna Hypotes.R och Styrkefkn.R från kursens hemsida. Kortfattade svar till frågorna som ställs i uppgifterna finns i slutet på Del I av handledningen. 1. De grundläggande begreppen med rutinen Hypotes.R a) Först vill man undersöka om data från de 7 patienterna stöder vår misstanke att medicinen sänker salivproduktionen Ställ upp lämpliga hypoteser. b) Beräkna medelvärdet av mätningarna. c) Använd rutinen Hypotes.R för att illustrera testets kritiska område då testet utförs på signifikansnivå α = 0.05. Det aktuella kommandot är hypotes1(σ, n, µ 0, α, H 1 -riktn), så om hypoteserna är H 0 : µ = 1; H 1 : µ < 1 blir kommandot hypotes1(0.5, 7, 1, 0.05, < ). d) Rutinen markerar det kritiska området och anger ett värde k som är gränsen till området. Hur har k beräknats? e) Använd ditt beräknade medelvärde för att utföra testet. Vad är din slutsats om H 0? f) Vad är din konkreta tolkning av signifikansnivån α = 0.05 i detta exempel? g) Undersök hur det kritiska området (gränsen k) ändras då du ändrar signifikansnivån till α = 0.01. Vad blir din slutsats nu? 2. Testets styrka och styrkefunktion med rutinerna Hypotes.R och Styrkefkn.R a) Antag nu att genomsnittlig salivutsöndring i riskgruppen i själva verket är 0.8. Då är förstås H 0 : µ = 1 falsk och vi vill att vårt test ska upptäcka detta och förkasta denna hypotes till förmån för hypotesen H 1 : µ < 1. Sannolikheten att testet verkligen klarar av detta kallas för testets styrka i punkten 0.8. Använd rutinen Hypotes.R för att illustrera testets styrka i punkten 0.8. Kommandot är nu hypotes1(σ, n, µ 0, α, H 1 -riktn, sant µ), så i detta fall skriver du hypotes1(0.5, 7, 1, 0.05, <, 0.8). Rutinen ger dig ytterligare en figur som, förutom signifikansnivån α (felrisk av typ I), även visar β (felrisk av typ II). Vad är den konkreta tolkningen av β i detta exempel? Hur hänger β ihop med testets styrka? 6

b) Mer generellt, testets styrka i punkten µ, är P(H 0 förkastas då µ är verklig genomsnittlig salivutsöndring i riskgruppen). Observera att styrkan beror på värdet µ. I detta exempel gäller att ju mindre µ är i förhållande till µ 0 = 1 desto större är chansen att testet ska upptäcka att H 0 inte gäller. Därför är det intressant att studera styrkan som en funktion av µ, denna funktion betecknas ofta S(µ), (eller h(µ)). Rutinen Styrkefkn.R ritar upp styrkefunktionen, kommandot är styrka1(σ, n, µ 0, α, H 1 - riktn, sant µ) om du vill rita upp funktionen och markera ett speciellt µ-värde. Använd alltså kommandot styrka1(0.5, 7, 1,0.05, <, 0.8), vilket ger dig den tidigare figuren plus styrkan som en funktion av µ. Uppskatta utifrån styrkefunktionen hur stor sannolikheten är att vi med vårt test kommer att upptäcka att en grupp som bör klassas som muntorra (µ= 0.7) har en sänkt salivproduktion. Hur många patienter bör vi mäta på om vi med sannolikheten 0.95 verkligen ska upptäcka att muntorra har en sänkt salivproduktion? Svar: 1a) H 0 : µ = 1; H 1 : µ < 1 1d) k=µ 0 - λ α σ/ n = 1-1.6445 0.05/ 7=0.689 1e) Eftersom medelvärdet < 0.689 förkastas H 0 på nivå 0.05 1f) Det är 5% risk att vi påstår att riskgruppen har en sänkt salivproduktion när den i själva verket är normal 1g) H 0 kan ej förkastas på nivå 0.01 2a) β=p(ej förkasta H 0 då verklig genomsnittlig salivproduktion i riskgruppen är 0.8). β=1- S(0.8), d.v.s. β är 1- styrkan i punkten 0.8 2b) Styrkan i punkten 0.7 är S(0.7) vilket enligt figuren kan uppskattas till 0.48. Det krävs n=30 patienter för att styrkan ska vara 0.95 i punkten 0.7. 7