Laboration 2: Statistisk hypotesprövning

Relevanta dokument
Laboration 3: Enkel linjär regression och korrelationsanalys

Laboration 1: Introduktion till R och Deskriptiv statistik

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

F22, Icke-parametriska metoder.

TMS136. Föreläsning 13

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

2. Test av hypotes rörande medianen i en population.

Laboration 4: Hypotesprövning och styrkefunktion

Lektionsanteckningar 11-12: Normalfördelningen

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Laboration 4 Statistiska test

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Föreläsning 11: Mer om jämförelser och inferens

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Statistik 1 för biologer, logopeder och psykologer

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Introduktion och laboration : Minitab

8 Inferens om väntevärdet (och variansen) av en fördelning

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

FÖRELÄSNING 8:

TMS136. Föreläsning 11

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

F3 Introduktion Stickprov

Laboration 1: Icke-parametriska enstickprovstest

Föreläsningsanteckningar till kapitel 9, del 2

F9 Konfidensintervall

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

MVE051/MSG Föreläsning 14

Föreläsning 5 och 6.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Examinationsuppgift 2014

Föreläsningsanteckningar till kapitel 8, del 2

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 7: Punktskattningar

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Föreläsning 12, FMSF45 Hypotesprövning

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Laboration 4: Intervallskattning och hypotesprövning

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

4 Diskret stokastisk variabel

Uppgift a b c d e Vet inte Poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

Föreläsning 12: Regression

Laboration 4: Intervallskattning och hypotesprövning

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistisk försöksplanering

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Laboration 3 Inferens fo r andelar och korstabeller

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

a) Facit till räkneseminarium 3

Föreläsning 7: Punktskattningar

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

1 Grundläggande begrepp vid hypotestestning

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Matematisk statistik för B, K, N, BME och Kemister

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Föreläsning 4: Konfidensintervall (forts.)

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning G60 Statistiska metoder

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Stockholms Universitet Statistiska institutionen Termeh Shafie

, s a. , s b. personer från Alingsås och n b

Hypotestestning och repetition

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning G60 Statistiska metoder

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

7.3.3 Nonparametric Mann-Whitney test

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Laboration 2 Inferens S0005M VT18

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Transkript:

STOCKHOLMS UNIVERSITET 13 februari 2009 Matematiska institutionen Avd. för matematisk statistik Gudrun Brattström Laboration 2: Statistisk hypotesprövning Huvudsyftet med denna andra datorlaboration är att träna förmågan att genomföra statistiska test genom att sätta upp lämpliga hypoteser och välja ett bra test baserat på beskrivning av ett visst problem och egenskaperna hos ett datamaterial. Laborationen består av ett avsnitt där det beskrivs hur man använder R för några av de statistiska test som vi har gått igenom i kursen. Sedan följer två uppgifter som skall genomföras. Varje uppgift består av en teoridel som skall lösas innan man sätter sig framför datorn och en praktisk del som skall lösas i R. 1 Statistisk hypotesprövning i R Börja som i första laborationen med att skapa ett nytt underbibliotek för den här laborationen och flytta sedan dit genom kommandona $ mkdir statan2 $ cd statan2 Om ni måste avbryta laborationen så sparas samtliga variabler i detta bibliotek. När ni sedan vill återuppta arbetet så hoppa direkt till underbiblioteket genom $ cd statan2 och starta sedan R. Jag rekommenderar även att ni, som i första laborationen, öppnar en hjälpsida för R genom kommandot > help.start() Om ni inte redan har en webbläsare i gång så kommer R att starta en, där ni kan klicka er fram till hjälpsidor för alla funktioner genom länken Packages. De flesta fördefinierade statistiska funktionerna hittar ni under länken stats. Ni kan också öppna en hjälpsida i själva R genom att skriva? följt av namnet på funktionen. Exempelvis kan ni få upp hjälpsidan för t-test genom att skriva >?t.test 1

1.1 Test av väntevärdet för ett stort stickprov Om n är tillräckligt stort för ett stickprov X 1, X 2,..., X n, bestående av oberoende och likafördelade stokastiska variabler, kan man använda teststatistikan Z = X µ s/ n approx. N(0, 1) för test av väntevärdet µ. Kritiska gränser för standardnormalfördelningen kan fås i R med funktionen qnorm(a) som ger kvantilen i punkten a. Vill man exempelvis få kritiska gränsen för ett tvåsidigt test på 5 %-nivån skriver man alltså > qnorm(0.975) [1] 1.959964 För kritiska gränser för ensidiga test skriver man > qnorm(0.95) [1] 1.644854 eller > qnorm(0.05) [1] -1.644854 beroende på riktning på mothypotesen. P -värden kan också enkelt beräknas med funktionen pnorm(z) där z är det observerade värdet på teststatistikan Z. Om vi exempelvis har fått z = 1.72 för vi p-värdet för ett tvåsidigt test enligt > 2*(1-pnorm(1.72)) [1] 0.08543244 och ett ensidigt test enligt > 1-pnorm(1.72) [1] 0.04271622 Observera att vi måste ta 1-pnorm(Z) för att få rätt värde, vilket beror på att pnorm ger fördelningsfunktionen för normalfördelningen. Om ni klickar på länken Normal under stats eller skriver?normal får ni mer detaljerad information om dessa funktioner och några till för normalfördelningen. 2

1.2 Test av väntevärdet för ett normalfördelat stickprov Om stickprovet kan antas följa en normalfördelning bör vi i stället genomföra ett t-test utgående från teststatistikan T = X µ s/ n t n 1 I R finns funktionen t.test som underlättar genomförandet av alla former av t-test. Som ni ser finns det en lång rad argument som kan användas för att specificera saker som värdet på µ 0, vilka typer av hypoteser man vill testa, konfidensgrad och mycket annat. Om man exempelvis har lagrat stickprovet i vektorn x och vill testa hypoteserna på 10 %-nivån skriver man H 0 : µ = 4.5 H 1 : µ > 4.5 > t.test(x,alternative="greater",mu=4.5,conf.level=0.90) Vill man ha en ensidig mothypotes åt andra hållet så byter man ut strängen greater mot less och vill man ha en tvåsidig mothypotes byter man ut den mot two.sided. Som en bonus får man även motsvarande konfidensintervall på köpet. 1.3 Test av skillnader i väntevärden för två oberoende stora stickprov Om vi har två oberoende stickprov X 1, X 2,..., X n1 med väntevärde µ 1 och Y 1, Y 2,..., Y n2 med väntevärde µ 2 och vill testa skillnaden µ 1 µ 2 använder vi för stora stickprov teststatistikan Z = ( X Ȳ ) (µ 1 µ 2 ) approx. N(0, 1) S1/n 2 1 + S2/n 2 2 Kritiska gränser och p-värden beräknas på samma sätt som i avsnitt 1.1. 1.4 Test av skillnader i väntevärden för två oberoende normalfördelade stickprov För att få R att genomföra t-test för två stickprov räcker det att anropa funktionen t.test med två datavektorer x och y enligt > t.test(x,y,alternative="greater",mu=0,conf.level=0.90) Här anger argumentet mu=0 att skillnaden mellan väntevärdena är noll under nollhypotesen. Om man inte särskilt specificerar något annat så använder R teststatistikan T = ( X Ȳ ) (µ 1 µ 2 ) S 2 1/n 1 + S 2 2/n 2 approx. t ν 3

där antal frihetsgrader ν beräknas med Welch-Satterthwaites metod. För att få ett exakt t-test under förutsättningen att varianserna σ 2 1 och σ 2 2 är lika baserat på teststatistikan måste man ange det särskilt enligt T = ( X Ȳ ) (µ 1 µ 2 ) t n1 +n 2 2 S 1/n 1 + 1/n 2 > t.test(x,y,alternative="greater",mu=0,var.equal=true,conf.level=0.90) 1.5 Test av skillnader i väntevärden för två parvist beroende stickprov Om vi har två lika stora stickprov X 1, X 2,..., X n och Y 1, Y 2,..., Y n där X i och Y i är beroende för alla i = 1, 2,..., n kan man betrakta problemet som ett enstickprovsproblem baserat på de parvisa skillnaderna D i = X i Y i. I R kan man hantera detta genom att först beräkna > d <- x-y och sedan hantera problemet som i avsnitt 1.1 eller 1.2 beroende på vilka förutsättningar som är uppfyllda. Man kan även genomföra ett t-test på parvist beroende stickprov genom att lägga till argumentet paired=true enligt > t.test(x,y,alternative="greater",mu=0,paired=true,conf.level=0.90) 1.6 Wilcoxons teckenrangtest Om man har ett stickprov som inte kan anses vara normalfördelat bör man i stället genomföra ett icke-parametriskt test. Vi kommer att hoppa över teckentestet i den här laborationen, på grund av att det inte finns någon färdig funktion i R för detta test och att det blir svårt att hantera när vi har många ties. I stället koncentrerar vi oss på Wilcoxons teckenrangtest av medianen. I R kan vi använda funktionen wilcox.test. Klicka på länken wilcox.test eller skriv?wilcox.test för en detaljerad beskrivning av hur denna funktion används. Som ni ser finns liknande argument som för t.test plus några till som styr approximativ beräkning av kritiska gränser och p-värde. Dessutom måste man specifikt ange om man vill ha ett konfidensintervall för medianen genom argumentet conf.int=true. 1.7 Wilcoxon-Mann-Whitneytest Samma funktion wilcox.test kan användas för test av två stickprov på liknande sätt som för t.test genom att ange två datavektorer i stället för en som argument. 4

2 Uppgift 1: Cloud seeding i Arizona Under somrarna 1957-60 genomfördes ett antal försök i Arizonas bergstrakter för att se om så kallad cloud seeding kunde öka mängden nederbörd i torra ökenområden. Cloud seeding innebär att man beströr moln från flygplan med kristaller bestående av kolsyresnö. Meteorologerna som ansvarade för försöket hade anledning att tro att kolsyran skulle öka kondensationen i molnen och att detta skulle framkalla regn. Försöket lades upp på så sätt att försöksperioden under varje sommar delades in i ett antal mindre tvådagarsperioder. Under varje sådan tvådagarsperiod valde man en av dagarna slumpmässigt då man genomförde cloud seeding, och lät bli den andra dagen för att få ett jämförelsematerial. De dagar då cloud seeding genomfördes startade man klockan 12 och beströdde molnen under två timmar och mätte sedan nederbörden under eftermiddagen med hjälp av 29 stycken mätstationer. I filen arizona.txt på kursens hemsida finns resultatet (i inches) av dessa mätningar i kronologisk ordning. Varje rad avser en tvådagarsperiod där första kolumnen anger årtal, andra kolumnen anger nederbörd under den dag då cloud seeding genomfördes och tredje kolumnen anger nederbörd under den dag då cloud seeding inte genomfördes. 2.1 Teoretisk uppgift 1. Vad är vitsen med att dela in hela sommaren i tvådagarsperioder i stället för att från början bestämma vilka dagar man skall genomföra cloud seeding? Ett alternativt tillvägagångssätt skulle ju ha kunnat vara att man varje morgon singlade slant och genomförde cloud seeding om man fick klave. 2. Varför väljer man vilken dag i en tvådagarsperiod man skall genomföra cloud seeding slumpmässigt i stället för att alltid välja exempelvis den första dagen? 3. Vilket eller vilka test är lämpliga att använda för att testa om cloud seeding ökar mängden nederbörd? 2.2 Praktisk uppgift Börja med att spara filen arizona.txt i underbiblioteket statan2 genom att högerklicka på filen på hemsidan och välja Copy Link Target As.... Eventuellt ger datorn filen ett annat namn i den dialogruta som visas; döp i så fall om den till arizona.txt. Filen kan nu läsas in i R genom > arizona <- read.table("arizona.txt", header=false) Skapa sedan variablerna > year <- arizona$v1 > seed <- arizona$v2 > unseed <- arizona$v3 5

Undersök data grafiskt med hjälp av histogram, boxplottar och normalfördelningsplottar för att få en uppfattning om eventuell fördelning. Genomför sedan ett (eller flera) lämpliga hypotestest för att avgöra om det kan anses statistiskt säkerställt att cloud seeding ökar nederbörden. 3 Uppgift 2: Cloud seeding i Oregon Ett annat försök med cloud seeding under ungefär samma period genomfördes i delstaten Oregon på ett något annorlunda sätt. Varje morgon fick en meteorolog göra en bedömning om förutsättningarna för nederbörd var lämpliga senare under dagen. Om så var fallet fattades beslut med hjälp av slumptalsgenerator om att genomföra ett försök den aktuella dagen, där sannolikheten för försök var 2/3 och sannolikheten för att avstå från försök 1/3. Detta resulterade i 22 dagar då cloud seeding genomfördes och 13 dagar då man avstod. Nederbörden mättes sedan i tre olika områden, där data från två av områdena finns med i datamaterialet. Den första typen av område var stora områden i vindriktningen från de moln som behandlades och den andra typen av område var mindre delområden som av olika skäl ansågs särskilt känsliga för cloud seeding. I filen oregon.txt på kursens hemsida finns data över försöket. I första kolumnen anger 1 att cloud seeding inte genomfördes och 2 att det genomfördes, andra kolumnen anger nederbörd i områden av första typen och tredje kolumnen nederbörd i områden av andra typen. 3.1 Teoretisk uppgift 1. Varför använder man en slumptalsgenerator i stället för att låta exempelvis meteorologen avgöra när ett försök skall genomföras? 2. Vilket eller vilka test är lämpliga att använda för att testa om cloud seeding ökar mängden nederbörd? 3.2 Praktisk uppgift Börja med att spara filen oregon.txt i underbiblioteket statan2 på samma sätt som tidigare och läs in filen i R. Skapa sedan variablerna > trial <- oregon$v1 > typ1 <- oregon$v2 > typ2 <- oregon$v3 För att få data för dagar då försök genomfördes och dagar då försök inte genomfördes måste vi dela upp variablerna typ1 och typ2 enligt följande > unseed1 <- typ1[trial==1] > seed1 <- typ1[trial==2] 6

> unseed2 <- typ2[trial==1] > seed2 <- typ2[trial==2] Att skriva ett logiskt uttryck inom hakparenteser efter en variabel i R medför att endast de värden i variabeln där det logiska uttrycket är sant tas med. Undersök även dessa data grafiskt med hjälp av histogram, boxplottar och normalfördelningsplottar för att få en uppfattning om eventuell fördelning. Genomför sedan ett (eller flera) lämpliga hypotestest för att avgöra om det kan anses statistiskt säkerställt att cloud seeding ökar nederbörden. 4 Skriftlig laborationsrapport Uppgift 1 och 2 ovan skall redovisas skriftligt i en strukturerad och genomtänkt laborationsrapport försedd med ett titelblad där kursens namn, laborationens nummer och ert/era namn tydligt skall anges. Handskrivna rapporter kommer inte att godkännas. För lämpliga ordbehandlingsprogram, se instruktionerna till Laboration 1! Redogör ordentligt för era svar på de teoretiska frågorna och motivera ordentligt vilket eller vilka test ni har valt att använda i de båda uppgifterna. Bifoga gärna någon eller några illustrativa figurer, men inte för många och referera ordentligt i texten vilka slutsatser ni drar av respektive figur. Sammanfatta de viktigaste resultaten från körningar av testen i R och de slutsatser ni kan dra från dem. Oavsett om ni kommer att arbeta som statistiker, matematiker, datalog eller något annat kommer ni att få skriva många rapporter i era yrkesliv. Därför är det bra att börja träna ordentligt på detta redan nu. Det kommer ni att ha stor nytta av i framtiden. 7