1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Relevanta dokument
Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Uppgift 1. Produktmomentkorrelationskoefficienten

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

4. Kunna orientera sig mellan de olika fönstren

Lösningar till SPSS-övning: Analytisk statistik

7.3.3 Nonparametric Mann-Whitney test

Laboration 2 Inferens S0005M VT18

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Följande resultat erhålls (enhet: 1000psi):

F3 Introduktion Stickprov

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

DATORÖVNING 3: MER OM STATISTISK INFERENS.

, s a. , s b. personer från Alingsås och n b

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Laboration 2 Inferens S0005M VT16

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Samplingfördelningar 1

OBS! Vi har nya rutiner.

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Metod och teori. Statistik för naturvetare Umeå universitet

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tentamen i matematisk statistik

Hypotestestning och repetition

F9 SAMPLINGFÖRDELNINGAR (NCT

Tentamen i matematisk statistik

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Statistik 1 för biologer, logopeder och psykologer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistik för teknologer, 5 poäng Skrivtid:

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

2.1 Minitab-introduktion

F22, Icke-parametriska metoder.

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

OBS! Vi har nya rutiner.

Datorlaboration 2 Konfidensintervall & hypotesprövning

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Medicinsk statistik II

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

ANOVA Mellangruppsdesign

Jämförelse av två populationer

Inferensstatistik. Hypostesprövning - Signifikanstest

FACIT (korrekta svar i röd fetstil)

Lektion 1: Fördelningar och deskriptiv analys

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Forsknings- och undersökningsmetodik Skrivtid: 4h

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Styr- och kontrolldiagram ( )

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Laboration med Minitab

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Introduktion och laboration : Minitab

SOPA62 - Kunskapsproduktion i socialt arbete

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Laboration 3 Inferens fo r andelar och korstabeller

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

MVE051/MSG Föreläsning 7

OBS! Vi har nya rutiner.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Introduktion till Biostatistik. Hans Stenlund, 2011

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

Hur man tolkar statistiska resultat

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Medicinsk statistik II

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 5. Kapitel 6, sid Inferens om en population

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

7.5 Experiment with a single factor having more than two levels

Lektionsanteckningar 11-12: Normalfördelningen

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

TAMS28 DATORÖVNING VT1

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Transkript:

Datorövning 3 Statistikens Grunder 2 Syfte 1. Lära sig utföra hypotestest för populationsproportionen 2. Lära sig utföra test för populationsmedelvärdet 3. Lära sig utföra test för skillnaden mellan två populationsparametrar då det är parvisa observationer 4. Lära sig utföra test för skillnaden mellan två populationsparametrar för två oberoende stickprov Exempel Utföra hypotestest för populationsproportionen Utgå från övning 17.2 i kompendiet, kapitel 17. Vi läser in datat data work.ovn172; input quality$ count; datalines; defect 10 good 150 ; Vi testar om datat verkar komma från en population med proportionen defekta = 0:08 proc freq data=work.ovn172 order=data; weight count; tables quality / binomial(p=0.08); Kommandot "/binomial( p = 0:08)" skriver vi för att utföra testet H 0 : = 0:08 1

Kommandot "order=data" använder vi för att datat ska komma i den ordning som vi läste in det. Detta ger utskriften: The FREQ Procedure Cumulative Cumulative quality Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ defect 10 6.25 10 6.25 good 150 93.75 160 100.00 Binomial Proportion for quality = defect ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Proportion 0.0625 ASE 0.0191 95% Lower Conf Limit 0.0250 95% Upper Conf Limit 0.1000 Exact Conf Limits 95% Lower Conf Limit 0.0304 95% Upper Conf Limit 0.1119 Test of H0: Proportion = 0.08 ASE under H0 0.0214 Z 0.8159 One sided Pr < Z 0.2073 Two sided Pr > Z 0.4145 Sample Size = 160 Vi ser i utskriften att proportionen defekta i stickprovet blev 0:0625. De två första kon densintervallgränserna är framräknade med formeln r 0:0625(1 0:0625) p 1:96 160 De mått på teststatistikan vi är intresserade av är de tre sista; "Z ", "one sided" och "two sided". "Z " anger det observerade z-värdet från testet. Det vill säga, SAS använder formeln p 0 Z = p 0 (1 0 )=n (Jämför värdet på utskriften med era egna uträkningar.) "One sided" och "two sided" anger p-värdet för ett enkelsidigt test H 0 : = 0:08 H A : < 0:08 2

respektive dubbelsidigt test H 0 : = 0:08 H A : 6= 0:08 Vi ska i uppgiften testa om < 0:08 och därför bör vårt beslut tas genom att titta på p-värdet 0.2073. Ska vi förkasta H 0? Utföra test för populationsmedelvärdet Utgå från övning 17.4 i kompendiet, kapitel 17. Vi läser in datat data work.ovn174; input livslangd; datalines; 2970 3020 3005 2900 2940 2925 ; Nu ska vi använda proceduren "proc ttest" för att testa Vi använder koden H 0 : = 3000 H A : < 3000 proc ttest data=work.ovn174 H0=3000; 3

Vi skriver "H0=3000 " för att ange vår nollhypotes. Vi får utskriften The TTEST Procedure Variable: livslangd N Mean Std Dev Std Err Minimum Maximum 6 2960.0 46.7974 19.1050 2900.0 3020.0 Mean 95% CL Mean Std Dev 95% CL Std Dev 2960.0 2910.9 3009.1 46.7974 29.2113 114.8 DF t Value Pr > t 5 2.09 0.0905 Utskriften ger oss olika mått. Intressant för hypotestestning av är det som står i raden längst ner. Vi ser att teststatistikan är t fördelad med 5 frihetsgrader. Värdet på teststatistikan är 2:09 och p-värdet för ett dubbelsidigt test är 0:0905. P-värdet för det enkelsidiga testet är således 0:0905 2 = 0:04525. Ska vi förkasta H 0? Vad innebär p värdet? Utföra test för skillnader mellan två populationsparametrar då det är parvisa observationer Utgå från övning 17.9 i kompendiet. Vi läser in datat data work.ovn179; input pulsfore pulsefter; datalines; 81 105 81 91 68 87 61 86 67 82 74 78 75 87 64 94 70 93 60 90 ; Vi vill nu testa H 0 : f ore efter = D = 0 H A : f ore efter = D < 0; 4

det vill säga om pulsen är lägre innan man snusar. För att testa detta skriver vi koden proc ttest data=work.ovn179 H0=0; paired pulsfore*pulsefter; Vi anger kommandot "paired" för att tala om för SAS att vi har beroende mellan observationerna, det vill säga att vi vill använda parvisa observationer. (Kommandot "H0=0 " kan bortses från, då det är default när vi använder kommandot "paired".) Vi får utskriften The TTEST Procedure Difference: pulsfore pulsefter N Mean Std Dev Std Err Minimum Maximum 10 19.2000 8.7534 2.7681 30.0000 4.0000 Mean 95% CL Mean Std Dev 95% CL Std Dev 19.2000 25.4618 12.9382 8.7534 6.0209 15.9803 DF t Value Pr > t 9 6.94 <.0001 Värdet på teststatistikan är 6:94 och p-värdet för ett dubbelsidigt test är mindre än 0:0001. Bör vi förkasta H 0? Utföra ett test för skillnader mellan två populationsparametrar från två oberoende stickprov Har vi inte parvisa observationer, utan oberoende observationer i två stickprov och vill testa om det nns skillnader i medelvärden mellan populationerna, använder vi "proc ttest" även här. Data len "bromssträcka" innehåller observationer av bromssträcka för två biltyper, A och B. Antag att variabeln "bromssträcka" är normalfördelad. Ladda ner len från hemsidan och läs in datat i SAS. Vi vill testa H 0 : A B = 0 H A : A B 6= 0 det vill säga om bromssträckan för biltyp A är lika som för biltyp B. 5

Vi skriver koden proc ttest data=work.broms; class biltyp; var bromsstracka; Kommandot "class biltyp" anges för att tala om att variabeln "biltyp" delar upp hela datamaterialet i två stickprov. Att generera och tolka utskriften nns som en övning nedan. Uppgifter Basuppgifter 1. Ladda ner len "rökdata" från hemsidan. Andelen rökare är p = 0:6. Använd koden i exempel "Utföra hypotestest för populationsproportionen" för att testa H 0 : = 0:5 H A : 6= 0:5 Fundera över om kommandot "weight..." i exemplet behöver vara med. Tolka utskriften. Ska vi förkasta H 0? 2. Utgå från övning 17.6 i kompendiet. Läs in datat och testa sedan H 0 : = 800 H A : 6= 800 Tolka utskriften. Ska vi förkasta H 0? 3. Utgå från övning 17.10 i kompendiet. Läs in datat och testa sedan H 0 : D = 0 H A : D 6= 0 Tolka utskriften. Ska vi förkasta H 0? 4. Tolka utskriften i exempel "Utföra ett test för skillnader mellan två populationsparametrar från två oberoende stickprov". Gör nödvändiga antaganden. Att fundera på: Kan varianserna i de båda populationerna antas vara lika? 6