Laboration 4: Hypotesprövning och styrkefunktion

Relevanta dokument
TAMS65 - Föreläsning 6 Hypotesprövning

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning 5: Hypotesprövningar

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Föreläsning 12, FMSF45 Hypotesprövning

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Kapitel 10 Hypotesprövning

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

8 Inferens om väntevärdet (och variansen) av en fördelning

Matematisk statistik för B, K, N, BME och Kemister

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

TMS136. Föreläsning 11

SF1901: Övningshäfte

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

1 Grundläggande begrepp vid hypotestestning

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hur man tolkar statistiska resultat

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

, s a. , s b. personer från Alingsås och n b

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

TMS136. Föreläsning 13

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Hur skriver man statistikavsnittet i en ansökan?

Laboration 5: Intervallskattning och hypotesprövning

Föreläsning G60 Statistiska metoder

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Konfidensintervall, Hypotestest

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

FÖRELÄSNING 8:

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Tentamen i Matematisk statistik Kurskod S0001M

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Avd. Matematisk statistik

Laboration 2: Statistisk hypotesprövning

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Laboration 4 Statistiska test

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Avd. Matematisk statistik

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning G60 Statistiska metoder

Om statistisk hypotesprövning

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Laboration 2: Styrkefunktion samt Regression

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

TENTAMEN I STATISTIKENS GRUNDER 2

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning 12: Regression

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Föreläsningsanteckningar till kapitel 9, del 2

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

F3 Introduktion Stickprov

Stockholms Universitet Statistiska institutionen Termeh Shafie

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Avd. Matematisk statistik

Uppgift a b c d e Vet inte Poäng

LABORATION 3 - Regressionsanalys

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 11: Mer om jämförelser och inferens

Laboration 4: Intervallskattning och hypotesprövning

F22, Icke-parametriska metoder.

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Laboration 2 Inferens S0005M VT18

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Medicinsk statistik II

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Laboration 4: Lineär regression

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

bli bekant med summor av stokastiska variabler.

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Transkript:

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR L, FMS 032, HT-07 Laboration 4: Hypotesprövning och styrkefunktion 1 Syfte I denna laboration skall vi studera hypotesprövning och de i hypotesprövningssammanhang fundamentala begreppen fel av typ I och fel av typ II samt styrka. 2 Förberedelseuppgifter Du skall ha löst förberedelseuppgifterna innan du kommer till laborationen. Hemuppgift 1: För att belysa begreppen nollhypotes, mothypotes och signifikansnivå: läs igenom exemplet med hastighetskontroll i föreläsningsmanus. Om vi, rent allmänt, ställer upp en hypotes H 0 som vi vill pröva, kan vi hamna i någon av de situationer som beskrivs i tabellen nedan. H 0 sann H 0 falsk H 0 förkastas fel typ I OK H 0 förkastas ej OK fel typ II Antag att en person, Ada, blir testad i domstolen under de hypoteser, H 0 och H 1, som ges i exemplet. Ada kan då råka ut för någon av de fyra händelserna ovan. Vad innebär det för Ada om: A. H 0 förkastas och att H 0 är sann, dvs fel typ I? C. H 0 förkastas inte och H 0 är sann? D. H 0 förkastas inte och H 0 är falsk, dvs fel typ II? Ett tests signifikansnivå kan utttryckas som sannolikheten för en av de fyra händelserna A D ovan. Vilken? I föreläsningsmanus står om teststorhet och kritiskt område. Vilken är teststorheten och vilket är det kritiska området, C, i exemplet. Förbered dig för avsnitt 3 i laborationen genom att läsa om styrkefunktionen som finns definierad på sidan 238 i Vännman och genom att läsa igenom laborationshandledningen. Antag nu att H 0 är falsk och att i själva verket är det rätta värdet (till exempel att H 1 är sann.) Testets styrka i punkten är sannolikheten att förkasta H 0 när är det sanna värdet. Styrkan kan också uttryckas som sannolikheten för händelsen B ovan beräknad för något givet. Fundera över och diskutera: är det bra eller dåligt om denna sannolikhet är stor? B. H 0 förkastas och att H 0 är falsk? Styrkan för olika värden på utgör en funktion, h( ), den så kallade styrkefunktionen.

Hemuppgift 2: Räkna följande två uppgifter. (a) En läkemedelstillverkare använder ibland en viss livsmedelsfärg. Man vill veta hur färgen påverkar utseendet hos det framställda läkemedlet. Ur tillverkningen tar man därför på måfå tio förpackningar och mäter grumligheten i innehållet efter n tids lagring. Resultat: 3.9 4.1 4.4 4.0 3.8 4.0 3.9 4.3 4.2 4.4 Utan färgtillsats brukar grumligheten vara i medeltal 4.0. Man undrar nu om resultaten tyder på att grumligheten ökar. Modell: Materialet anses vara ett slumpmässigt stickprov från N(Ñ, 0.2). Pröva hypotesen mot H 0 : Ñ = 4.0 H 1 : Ñ > 4.0 med ett test på nivån 0.01. (b) Vilken styrka har testet för Ñ = 3.8? För Ñ = 4.3? Kanske har du hjälp av nedanstående synpunkter: Modellval I förutsättningarna nämns att datamaterialet är normalfördelat, dvs mätningarna x 1,..., x 10 är observationer av stokastiska variabler X 1,..., X 10 där X i N (Ñ, 0.2). Nollhypotesen är H 0 : Ñ0 = 4.0. Vi skall göra ett ensidigt test eftersom mothypotesen är att Ñ > Ñ0. Metod, hypotestest I boken rekommenderas då följande: Bilda u = x Ñ 0 och förkasta H 0 om (1) u > Ð (2) där är den valda signifikansnivån. Teststorheten i (1), u, är ju en observation av en stokastisk variabel: Om nu H 0 är sann, dvs Ñ = Ñ0, så är fördelningen för (3) helt känd, nämligen: Metod om styrkan dessutom skall beräknas Om man skall beräkna styrka är det bra att skriva om händelsen (2), u > Ð, så att man får x ensamt på samma sätt som i hastighetsexemplet. H 0 förkastas då om x > Ð + Ñ0 (4) Högerledet är den kritiska gränsen kallad c1 i uppgift 3.6 i denna laboration. Genom (4) är det tydligt definierat för vilken händelse som H 0 förkastas. Det går också bra att räkna ut sannolikheten för denna händelse, P(X > Ð + Ñ0) (5) för olika värden på m. Detta blir den efterfrågade styrkefunktionen. Den kan beräknas eftersom X :s fördelning är känd för de olika m, 3.8 respektive 4.3, som vi vill beräkna styrkan för: Sannolikheten för händelsen (4) givet att Ñ = 3.8, dvs P(X > Ð + Ñ0 Ñ=3.8 ) kan ju lika gärna skrivas P( X 3.8 > Ð + Ñ0 3.8 ) = P(Y > Ð + Ñ0 3.8 ), där ju Y N (0, 1) om 3.8 är det sanna värdet på m. Alltså blir den sökta sannolikheten 1 ( Ð + Ñ0 3.8 ) (6) Se till att du förstår alla leden ovan. Härled sedan själv beräkningen av styrkan för Ñ = 4.3, förklara med egna ord och skriv ut alla led som behövs. Beräkna förutom c1 samt styrkan i punkterna 3.8 och 4.3 också den kritiska gränsen c2, se uppgift 3.11 i laborationshandledningen. Man gör som i (4), men antalet observationer (x i ) skall vara 20 istället för 10. Hur skulle (2) och (4) formuleras om mothyposen, H 1, var att Ñ < Ñ0? X Ñ0 (3) 2

3 Laboration: Styrkefunktionen Vid hypotesprövning finns det sålunda två typer av fel som man riskerar begå. Detta är oundvikligt så snart man har med osäkra data att göra. Man kan förkasta nollhypotesen, trots att den är sann, och man har då fått ett fel av typ I. Om man däremot underlåter att förkasta nollhypotesen, trots att den är falsk, så har man råkat ut för ett fel av typ II. För att kunna mäta kvaliteten hos ett hypotestest använder man motsvarande felrisker, = P(fel typ I) = P(fel typ II). Om man kan rita styrkefunktionen h( ) = P(förkasta H 0 ; är rätt parametervärde), så får man en bra bild av testets urskiljningsförmåga. I en praktisk hypotesprövningssituation blir det ofta fråga om en avvägning mellan felriskerna och. I det följande skall vi undersöka samspelet mellan och och även vad stickprovsstorleken n har för inflytande. Låt oss knyta an till uppgifterna (a) och (b) i hemuppgift 2, och börja med en liten uppvärmningsfråga: Uppgift 3.1: Vad har styrkefunktionen för värde för Ñ = 4.0? Plotta sedan styrkefunktionen för testet i uppgiften. För att rita ett diagram över ovan nämnda styrkefunktion ger du kommandona, som motsvarar ekvation (6), >> m1 = %lämpligt intervall som >> %innehåller 3.8 och 4.3 >> s1 =... >> normcdf((m1-4.0)*sqrt(n)/sigma-1.64,0,1); >> plot(m1,s1) du inte har färgskärm bör du ge kurvorna olika signatur, så att du kan identifiera dem efteråt). Uppgift 3.2: Vilken lösning väljer du? Uppgift 3.3: Kan du förklara varför kurvorna hamnar i denna ordning? Uppgift 3.4: Vad har de olika kurvorna gemensamt? De hypoteser vi arbetar med nu handlar om väntevärdet m i den antagna fördelningen N (m, 0.2). I testproceduren ingår att vi skattar m med x, som vi betraktar som en observation av motsvarande stokastiska variabel X. Uppgift 3.5: Plotta (i en ny figur) fördelningarna för X för de tre fallen ovan och jämför med figuren med styrkefunktionerna (tänk på att välja färger/signaturer så att jämförelsen underlättas). Det är lätt att förledas att tro att testet som helhet blir bättre, bara man minskar felrisken. Vi skall nu undersöka hur det egentligen förhåller sig med den saken. Låt = 0.2 och stickprovsstorleken n = 10 och plotta (i samma figur) styrkefunktionerna då = 0.05 respektive = 0.025. Vad händer? Antag nu att du vill ha ett test med större styrka, varvid följande möjligheter står till buds: du kan använda dig av en ny och bättre mätmetod som halverar, men som är dubbelt så dyr, eller du kan utföra dubbelt så många mätningar, vilket även det kostar dubbelt så mycket. Plotta styrkefunktionerna för dessa två tester i samma figur som den första styrkefunktionen (om Uppgift 3.6: Vad är priset för att minska? 3

Låt oss avslutningsvis se studera styrkan med hjälp av täthetsfunktion, dels då m ges av H 0 dels då m uppfyller mothypotesen. I din senaste figur kunde du avläsa sannolikheten att förkasta H 0 om, till exempel, Ñ = 4.1 (i fortsättningen betraktar vi endast fallet = 0.05). Plotta nu istället täthetsfunktionen för X under H 0, det vill säga, med Ñ = 4.0. Använd gärna subplot 211. Antag sedan att m i själva verket är lika med 4.1 och plotta i samma figur den täthetsfunktion som då beskriver fördelningen för X. När vi utför vårt test motsvarar detta att vi betraktar stickprovsmedelvärdet x och förkastar nollhypotesen om x hamnar i det kritiska området C. Beräkna den undre gränsen för det kritiska området för testet i vår undersökning. Om vi kallar denna gräns c1, kan vi markera den som ett lodrät linje i vår figur med kommandot plot(c1*[1 1],[0 10]). Uppgift 3.7: (det vill säga, då vi utgår från att H 0 är sann)? Uppgift 3.8: (då Ñ = 4.1)? Uppgift 3.9: Vad händer med då du ökar? Vi har tidigare undersökt vilka medel som står till buds för att förbättra styrkan i ett test, nämligen minska variansen 2 eller öka stickprovsstorleken n. Ofta befinner man sig i den situationen att man inte kan påverka, och då återstår bara att öka n. Uppgift 3.10: Vad händer med fördelningen för den (i detta fall normalfördelade) stokastiska variabeln X då stickprovsstorleken n ökar? Uppgift 3.11: Vad kommer detta att innebära för den undre gränsen för det kritiska området? (Vi antar att vi behåller samma signifikansnivå som tidigare.) Vi skall nu se vad som händer, om vi fördubblar stickprovsstorleken. Plotta i samma figur som ovan, men i subplot 212, täthetsfunktionerna för X då n = 20 och Ñ = 4.0 respektive 4.1. Bestäm sedan den undre gränsen, c2 säg, för det kritiska området för det nya testet och markera den med kommandotplot(c2*[1 1],[0 10]). Uppgift 3.12: i detta test? Uppgift 3.13: (då Ñ = 4.1)? Uppgift 3.14: Kan du utifrån figuren säga något om det nya jämfört med det gamla? 4

4 Avslutning 4.1 Åter till hastighetsexemplet Uppgift 4.1: Skissera (OK för hand) täthetsfunktionen och markera det kritiska området för test som formulerats i hastighetsexemplet. Antag att Ada istället hade levt i ett samhälle där det var upp till henne att bevisa sin oskuld. Hur skulle då nollhypotesen, H 02 och mothypotesen, H 12 ha formulerats? Skissera nu täthetsfunktionen och markera det kritiska området för detta test, dvs H 12 versus H 02. Uppgift 4.2: Diskutera konsekvensen av att domstolen skulle få välja hypotesformulering, till exempel efter att ha sett mätresultaten. Uppgift 4.3: På vilket stadium i en forskningsprocess bör hypotesformuleringen ske? 4.2 Kommentar I vissa fall kan man utifrån teoretiska överväganden eller tidigare erfarenheter ställa upp en hypotes angående värdet av en viss parameter. Genom att på ett välövervägt sätt samla in ett stickprov kan man sedan använda detta för att pröva sin hypotes med ett hypotestest. På samma sätt som säkerheten i en intervallskattning anges av konfidensgraden 1, använder man felrisken för att beskriva säkerheten i ett hypotestest. Det nära samband, som råder mellan hypotesprövning och intervallskattning, har vi tyvärr inte funnit utrymme att utforska närmare i denna laboration. Det kan därför varmt rekommenderas att du läser det avsnitt i kursboken som handlar om detta samband, och att du sedan försöker sätta det i relation till dina erfarenheter från denna laboration. Hur kommer in när man gör konfidensintervall tas inte upp i denna kurs. Om du är intresserad av detta rekommenderas kursen MAS207, http://www.maths.lth.se/matstat/kurser/mas207/. 5 Stixbox Den som inte har Statistics toolbox installerad får använda Stixbox istället. Gå till http://www.maths.lth.se/matstat/stixbox/contents.html och hämta det som behövs. Observera att m-filen styrka kräver pnorm och qnorm. Istället för används normpdf(x,m, ) dnorm(x,m, ) norminv(p,m, ) qnorm(p,m, ) 5