Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet. Laboration 2. Statistiska test

Relevanta dokument
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 3. Variansanalys

Laboration 4 Statistiska test

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

7.3.3 Nonparametric Mann-Whitney test

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 4. Regressionsanalys

Mata in data i Excel och bearbeta i SPSS

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

En kort instruktion för arbete i SPSS

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Richard Öhrvall, 1

Marknadsinformationsmetodik Inlämningsuppgift

2. Test av hypotes rörande medianen i en population.

1 Grundläggande begrepp vid hypotestestning

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Uppgift 1. Produktmomentkorrelationskoefficienten

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

7.5 Experiment with a single factor having more than two levels

FACIT (korrekta svar i röd fetstil)

Introduktion och laboration : Minitab

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

a) Facit till räkneseminarium 3

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Kort manual till SPSS 10.0 för Mac/PC

2.1 Minitab-introduktion

OBS! Vi har nya rutiner.

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet Per-Erik Isberg. SPSS for Windows 12 - a guided tour

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

LABORATIONER. Det finns en introduktionsfilm till Minitab på

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Intro till SPSS Kimmo Sorjonen (0811)

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

LABORATION 1. Syfte: Syftet med laborationen är att

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Statistik för teknologer, 5 poäng Skrivtid:

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Marknadsinformationsmetodik Inlämningsuppgift

Laboration 3 Inferens fo r andelar och korstabeller

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Medicinsk statistik II

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Föreläsning G60 Statistiska metoder

Laboration 2: Statistisk hypotesprövning

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Laboration med Minitab

SOPA62 - Kunskapsproduktion i socialt arbete

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Metod och teori. Statistik för naturvetare Umeå universitet

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Parade och oparade test

8.1 General factorial experiments

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Forsknings- och undersökningsmetodik Skrivtid: 4h

Föreläsning G60 Statistiska metoder

Hypotestestning och repetition

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Analytisk statistik. Tony Pansell, optiker Universitetslektor

En introduktion till och första övning for Excel

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

SOPA62 - Kunskapsproduktion i socialt arbete

Datorlaboration 2 Konfidensintervall & hypotesprövning

*****************************************************************************

Föreläsning 12: Regression

DATORÖVNING 2: STATISTISK INFERENS.

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

Tentamen i matematisk statistik

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F22, Icke-parametriska metoder.

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Att välja statistisk metod

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Laboration med MINITAB, Del 2 Om Fyris ns global uppv rmning

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Transkript:

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Laboration 2 Statistiska test HT 2007

2 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns i SPSS vad det gäller olika grundläggande statistiska test. Den första delen av laborationen är en introduktion och behöver inte redovisas. Däremot skall den andra delen (Inlämningsuppgifter) redovisas i en skriftlig rapport som skall vara inlämnad senast fredagen den 14 december 2007. Introduktion - Statistiska test i SPSS Genom hela introduktionen ställs frågor i anslutning till analyserna. Kortfattade svar finns i slutet på introduktionen. På kursens hemsida under rubriken Kursmaterial hittar du de fem datamaterial som används i introduktionen. Hämta hem dessa datamaterial till din dator. Datamaterialen som används är Albumin, Median, Klorofyll, Dammar och Gråsparvar. 1. Test av medelvärde/median från en population. a) T-test. Använd datamaterialet Albumin. En blandning av blodserum innehåller exakt 42 g albumin per liter. 2 laboratorium (A och B) får göra sex bestämningar var av koncentrationen. Vi vill undersöka om det finns någon systematisk avvikelse från det sanna värdet (42 g/l) (tvåsidig mothypotes). Gå in under Analyze>Compare Means>One-Sample T test. Lägg in AlbuminA och AlbuminB som Test Variable och ange 42 som Test Value. Tolka utskriften. Hur stora är p-värdena och vad blir slutsatserna? Pröva att få fram fler decimaler på p-värdet genom att dubbelklicka på resultattabellen, högerklicka på p-värdet och gå in under Cell Properties. Vill man få fram ett konfidensintervall för medelkoncentrationen så bör man göra om körningen och ändra Test Value till noll (0). Vilka blir intervallets gränser? Kommentar: Test för medelvärden vid stora stickprov (Centrala GränsvärdesSatsen) finns inte direkt i SPSS utan man får använda sig av t-test även i dessa fall. b) Test av median. Använd datamaterialet Median. I materialet finns total längd för ett stickprov om 16 gråsparvar. Antag att vi vill testa om populationens medianlängd är större än 160 mm. På föreläsningen gjorde vi detta genom att undersöka hur många gråsparvar i stickprovet som var längre/kortare än 160 mm. Under H 0 är dessa antal Bin(n,0.5). Detta innebär att vi kan använda Analyze>Nonparametric Tests>Binomial. Lägg in Längd på Test Variable List och ange 160 som Cutpoint. Lägg märke till att det p-värde vi får gäller ett tvåsidigt test. Vad blir resultatet om vi vill ha ett ensidigt test? Hur stort är p-värdet och vad blir slutsatsen?

3 2. Test vid jämförelse av två populationer. Använd datamaterialet Klorofyll. a) T-test (oberoende grupper). Vi skall nu börja med att jämföra medelklorofyllhalten för de alger som fick växa under ljusa respektive mörka förhållanden. Analyze>Compare Means>Independent-Samples T test. Ange Klorofyll som Test Variable och Grupp som Grouping Variable. Tryck sedan på knappen Define Groups och ange koderna på de två grupperna som skall jämföras (1/2). Gör testet. Försök tolka utskriften. Längst till vänster kommer ett test av om varianserna är lika (Levene s test). Sedan kommer två rader där den översta är resultatet från det vanliga t-test. Den undre raden är från det modifierade testet som inte bygger på något antagande om lika varianser. Är varianserna lika? Vilket test bör användas? Slutsatser? En grafisk beskrivning av skillnaderna kan man få genom att använda Graphs>Error Bar>Simple>Define. Lägg in Klorofyll som Variable och Grupp som Category Axis. Pröva också Graphs>Boxplot>Simple>Define. När du gjort diagrammet så kan du enkelt vända på det genom att dubbelklicka på diagrammet och sedan gå in under Options>Transpose Chart. b) Rangsummetest. Gör nu om testet i 2 a) som ett rangsummetest genom att ge Analyze> Nonparametric Tests>2 Independent Samples. Markera Mann-Whitney U. I övrigt definieras variablerna analogt med t-testet. Hur stort är p-värdet och vad blir slutsatsen? 3. Test vid matchade data. Använd datamaterialet Dammar. a) T-test. Jämför om det finns någon skillnad i kvävebelastning mellan vår och sommar. Gå in under Analyze>Compare Means>Paired-Samples T test. Markera de två variablerna så att de syns under Variable Selection nederst till höger innan de klickas in i rutan Paired Variables. Finns det några skillnader? b) Teckentest. Gör nu motsvarande analys som ett icke-parametriskt test. Menysekvensen blir då Analyze>Nonparametric Tests>2 Related Samples. Markera sedan Sign. Finns det några skillnader?

4 4. Test vid kategoridata. Använd datamaterialet Gråsparvar. a) χ 2 -test. Vi vill nu testa om vi har en jämn könsfördelning i materialet. Om man gör en enkel tabell på variabeln kön får man följande resultat: Kön Male Female Total Frequency Percent 87 64.0 49 36.0 136 100.0 Vi kan utföra testet på flera olika sätt. För det första kan vi göra en χ 2 -test där vi jämför den observerade fördelningen med den förväntade under hypotesen om jämn könsfördelning. Detta görs genom att man anger Analyze>Nonparametric Tests>Chi- Square. Lägg in KÖN på Test Variable List. Observera att man själv kan lägga in förväntade frekvenser under Expected Values. Men i vårt fall fungerar det bra med det markerade alternativet All categories equal. Gör testet. Hur stort är p-värdet och vad blir slutsatsen? b) Test av ett proportionstal. Vi kan också göra samma test med hjälp av binomialfördelningen. Gå då in under Analyze>Nonparametric Tests>Binomial. Lägg in KÖN på Test Variable List och ange Test Proportion som 0.50. Gör testet. Kommentar: Det finns inga direkta beräkningar av konfidensintervall för proportionstal i SPSS. c) Test av två proportionstal. Testa nu om andelen som överlever är lika stor bland honor som bland hanar. Detta görs som en biprodukt när man tar fram en korstabell. Ge därför Analyze> Descriptive Statistics>Crosstabs. Definiera nu tabellen genom att lägga den ena variabeln i raden och den andra i kolumnen. Gå sedan in under Statistics och markera Chi-square. Avsluta med att räkna fram lämpliga procenttal under Cells. Hur stort är p-värdet och vad blir slutsatsen?

5 Svar: 1. a) A: p=0,033 / B: p=0,081 Vi kan påvisa en skillnad för A men inte för B 95% KI A: 42,060-42,940 / B: 35,687-42,513 b) p=0,077/2=0,0385 Vi kan påvisa att Md>160 2. a) Varianserna är lika (p=0,307) p=0,009 Vi kan påvisa en skillnad b) p=0,015 Vi kan påvisa en skillnad 3. a) p=0,262 Vi kan inte påvisa någon skillnad b) p=0,070 Vi kan inte påvisa någon skillnad 4. a) p=0,001 Vi kan påvisa en avvikelse från jämn könsfördelning b) p=0,001 Vi kan påvisa en avvikelse från jämn könsfördelning c) p=0,077 Vi kan inte påvisa någon skillnad i andelen som dör Sammanfattning SPSS Transform>Compute Graphs>Error Bar Graphs>Boxplot Graphs> Histogram Bilda nya variabler Plot av konf. int Boxplot (lådagram) Histogram Analyze>Compare Means>One-Sample T test t-test (en population) Analyze>Compare Means>Independent-Samples T test t-test (två populationer) Analyze>Compare Means>Paired-Samples T test t-test (matchade data) Analyze>Nonparametric Tests>Chi-Square χ 2 -test (en pop.) Analyze>Nonparametric Tests>Binomial Median-test (en pop.) Analyze>Nonparametric Tests>2 Independent Samples Rangsumme-test Analyze>Nonparametric Tests>2 Related Samples Teckentest (sign-test) Analyze>Descriptive Statistics>Crosstabs>Statistics χ 2 -test (två population)

6 Inlämningsuppgifter Dessa uppgifter skall redovisas i form av en skriftlig rapport som skall vara inlämnad senast fredagen den 14 december 2007. På kursens hemsida hittar du de datafiler som behövs för att lösa uppgifterna. Skriv din redovisning som den skulle publicerats i fyra vetenskapliga rapporter, bara mer kortfattat. Det vill säga strukturerad enligt följande: a) Introduktion (inklusive hypoteser) b) Material och metoder (speciellt statistiska metoder) c) Resultat (tolkningar och slutsatser) 1. Ward & Quinn (1988) collected 37 egg capsules of the intertidal predatory gastropod Lepsiella vinosa from the littorinid zone on a rocky intertidal shore and 42 capsules from the mussel zone. Other data indicated that rates of energy consumtion by Lepsiella vinosa were much greater in the mussel zone so there was interest in differences in fecundity between the zones. Investigate if we can show any differences between the zones. The analysis should include both a parametric and a non-parametric test. Use dataset Ward. Reference: Ward, S & Quinn, G.P. (1988) Preliminary investigations of the ecology of the predatory gastropod Lepsiella vinosa (Lamarck) (Gastropoda Muricidae). Journal of Molluscan Studies 54: 109-117. 2. French & Westoby (1996) cross-classified plant species following fire by two variables: whether they regenerated by seed only or vegetatively and whether they were ant or vertebrate dispersed. Results: Count Regeneration Total Seed only Vegetative Dispersal mechanism Ant Vertebrate Total 25 6 31 36 21 57 61 27 88 Investigate if regeneration method and dispersal mechanism are independent. Use dataset French. Reference: French, K. & Westoby, M. (1996) Vertebrate-dispersed species in fire-prone environment. Australian Journal of Ecology 21: 379-385.

7 3. Elgar et al (1996) exposed 17 orb spiders to both dim and light conditions and recorded two aspects of web structure under each condition. Observe that the same spider spun her web in both light conditions. Analyze if there any differences between dim and light conditions for the two variables (vertical diameter and horizontal diameter of the orb web). Create a crude measure of the area of the web (vertical horizontal) and repeat the analysis. The analysis should include both a parametric and a non-parametric test. Check the assumptions in your analysis. Use dataset Elgar. Reference: Elgar, M.A., Allan, R.A. & Evans, T.A. (1996) Foraging strategies in orbspinning spiders: ambient light and silk decorations in Argiope aetherea Walckenaer (Araneae: Araneoidea). Australian Journal of Ecology 21: 464-467. 4. Furness & Bryant (1996) studied energy budgets of breeding northern fulmars (Fulmarus glacialis) in Shetland. As part of their study they recorded various characteristics of individually labeled male and female fulmars. Investigate if you can find any difference between sexes in metabolic rate. The analysis should include both a parametric and a non-parametric test. Make a graphical presentation of your results. Also check the assumptions in your analysis. Use dataset Furness. Reference: Furness, R.W. & Bryant, D.M. (1996) Effect of wind on field metabolic rates of breeding Northern Fulmars. Ecology 76: 1181-1188. General reference: Datasets in exercises 1-4 comes from Quinn, G.P. & Keough, M.J. (2002) Experimental Design and Data Analysis for Biologists, Cambridge University Press. Sammanfattning SPSS Transform>Compute Graphs>Error Bar Graphs>Boxplot Graphs> Histogram Graphs>Q-Q plot Bilda nya variabler Plot av konf. int Boxplot (lådagram) Histogram Q-Q plot Analyze>Compare Means>One-Sample T test t-test (en population) Analyze>Compare Means>Independent-Samples T test t-test (två populationer) Analyze>Compare Means>Paired-Samples T test t-test (stickprov i par) Analyze>Nonparametric Tests>Chi-Square χ 2 -test (en pop.) Analyze>Nonparametric Tests>Binomial Median-test (en pop.) Analyze>Nonparametric Tests>2 Independent Samples Rangsumme-test Analyze>Nonparametric Tests>2 Related Samples Teckentest (sign-test) Analyze>Descriptive Statistics>Crosstabs>Statistics χ 2 -test (två population)