Datorlaboration 7. Simuleringsbaserade tekniker

Relevanta dokument
FACIT (korrekta svar i röd fetstil)

Datorlaboration 2 Konfidensintervall & hypotesprövning

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

*****************************************************************************

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

En introduktion till och första övning for Excel

samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

Excel-guide. Introduktion

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

INSPIRA. Microsoft. Excel 2007 Grunder

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Manual till funktionen Rapport/Export (beta) i Compos - Föräldrastöd February 2, 2016

Introduktion till PAST

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Datorövning 1 Enkel linjär regressionsanalys

EXAMINATION KVANTITATIV METOD vt-11 (110204)

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Stora talens lag eller det jämnar ut sig

Handledning för konstruktion av tabeller och diagram med Excel

Arbeta med normalfördelningar

KALKYL OCH DIAGRAM. Kalkylbladet. 170 Datorkunskap Kalkyl och diagram

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Statistik och epidemiologi T5

Hur man tolkar statistiska resultat

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Kapitel 10 Matriser. Beräkning med hjälp av matriser. Redigering av matriser

Mata in data i Excel och bearbeta i SPSS

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

EXAMINATION KVANTITATIV METOD

INNEHÅLL EXCEL 2000 FORTSÄTTNING...

Examinationsuppgift 2014

Manual Betongindustris kundportal

Uppgift 1. Produktmomentkorrelationskoefficienten

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Datorövning 1 Calc i OpenOffice 1

Laboration med Minitab

Datoro vning 1-2 Statistisk analys av kodade svar

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Laboration 2 Inferens S0005M VT18

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

I dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning.

Extramaterial till Matematik Y

Lägga till bild i e- handeln

TAMS28 DATORÖVNING VT1

4 Kolumn Kalkylbladet är uppdelat i rader (horisontellt) och kolumner (vertikalt). Där dessa möts finns alltid en cell.

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Anvisningar för att fylla i djur-och medlemsregister Det är mycket viktigt att du inte ändrar någonting i rubrikraden i mallen!

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

1. DEFINIERADE TABELLER. 1.1 Definiera en Excel-tabell

Din guide till. Klientinstallation MS Driftservice

Laboration 3: Urval och skattningar

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Manual för Excelprogrammet

DATORÖVNING 2: TABELLER OCH STANDARD-

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Diagram för olika situationer

Laboration 6 Formulär och stränghantering övningar/uppgifter

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

TMS136. Föreläsning 13

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Guide till att använda Audacity för uttalsövningar

Medicinsk statistik II

Följande resultat erhålls (enhet: 1000psi):

Lärarhögskolan i Stockholm Högskoleförvaltningen Högskoleledningens kansli Magnus Mörck/Katharina Soffronow Katharina.Soffronow@lhs.

Från vilka klasser hämtas eleverna till undervisningsgrupperna? Vilka undervisningsgrupper kan schemaläggas samtidigt?

Manual för att skicka mejl via medlemsregistret på webben

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Flytt av. Vitec Mäklarsystem

Pivottabeller. Del 2. Dan-Rune Hanssen

Hur gör jag för att ladda ner kemidata och använda dem i MS Excel?

Intro till SPSS Kimmo Sorjonen (0811)

Datorlaboration 5: Genetisk populationsstruktur

19. Skriva ut statistik

1 Ändra kolumnbredd och radhöjd

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Inlä sning äv bokfo ringsorder viä Excelerätor

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Svensk Dialysdatabas. Fosfat och PTH HD och PD. Klinikdata hösten 2005 Översikt åren

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Uppgift a b c d e Vet inte Poäng

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

OBS! Vi har nya rutiner.

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Handledningsmaterial Visio 2010

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Importera och använda en textdatabas i Excel

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

TENTAMEN I STATISTIKENS GRUNDER 2

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Säkerhetsinställningar, websolen. Innehåll

Transkript:

Datorlaboration 7 Simuleringsbaserade tekniker

2. DATORLABORATION 7 Under denna laboration ska ni få prova några enklare datorbaserade statistiska tester. Vi använder PopTools - en så kallad "add-in" till MS Excel som finns på datorerna i datorsalen. Skulle ni vilja prova programmet hemma, finns det att ladda ner utan kostnad på Internet på följande länk: http://www.cse.csiro.au/poptools/ Innan ni börjar måste ni kontrollera om PopTools är aktiverat. I så fall finns en meny med detta namn i överkanten av Excel. Om inte, följ nedanstående instruktioner: Verktyg - Tillägg - Bläddra - C:\Program Files\PopTools. Filformat = Tillägg Klicka på filen PopTools och se till att PopTools är förkryssat som "Tilläggsmakro" Vi inleder labben med en medelvärdesjämförelse. För denna första uppgift ges detaljerade instruktioner så att ni kommer i gång. Be er lärare om hjälp om ni har frågor. Randomiseringstest (medelvärdesjämförelse - två stickprov) Ni ska jämföra längder hos käkben (mandibula) hos hanar och honor av guldschakal (Canis aureus) skiljer sig könen med avseende på medellängd?. Följande data (mm) har uppmätts: Hanar: 120, 107, 110, 116, 114, 111, 113, 117, 114, 112 Honor: 110, 111, 107, 108, 110, 105, 107, 106, 111, 111 1. Öppna Excel och mata in ovanstående data i två intilliggande kolumner i ett kalkylblad. 2. Börja med att beskriva de båda stickproven med avseende på stickprovsstorlek, medelvärde, och varians. Vilket stickprov uppvisar längst medellängd? Räkna ut medellängdsskillnaden. 3. Genomför ett "traditionellt" t-test (ex. med hjälp av dataanalysmodulen i Excel). Spara data, medelvärden, p-värde mm. i ert kalkylblad. 4. Genomför nu istället ett så kallat randomiseringstest a. Börja med att välja Resample under menyn PopTools b. I fältet Input range markerar ni era data (de två intilliggande kolumnerna). c. I fältet Output range markerar ni ett område exakt lika stort som "input range" (välj ett område strax intill era data) d. Se därefter till att knapparna Without replacement (Shuffle) samt Both är förprickade. Dessa båda val innebär att programmet slumpmässigt kommer att blanda om (permutera) era data så att värdena kan hamna på vilken rad/ kolumn som helst. e. Det bör nu se ut som i figuren nedan (bortsett från att ni förmodligen skrivit in era data i andra celler). Tryck därefter på Go!

3. f. Kontrollera att samtliga värden från tidigare finns kvar (men hamnat på nya platser). Prova att kopiera det nya (permuterade) cellområdet för att därefter klistra in det på samma plats igen. Vad händer? g. Det är nu dags att ta reda på om den ursprungliga medellängsskillnaden är osedvanligt stor (eller liten, beroende på om ni uttryckt skillnaden som hanarnas medelvärde minus honornas, eller tvärtom). För att angripa denna fråga ska vi konstruera en referensfördelning bestående av ett stort antal randomiserade (slumpmässiga) medelvärdesskillnader. h. Börja med att, i ert kalkylblad, skriva en formel som räknar ut medelvärdesskillnaden för de båda randomiserade kolumnerna. Denna differens utgör vår test-statistika. i. Välj Monte Carlo analysis vilket återfinns under menyn PopTools, samt undermenyn Simulation tools j. I fältet Dependent range markerar ni den cell som innehåller den randomiserade medelvärdesskillnaden. k. I fältet Test values markerar ni cellen som innehåller den ursprungligen observerade medelvärdesskillnaden l. Välj antal replikat: Number of replicates. Defaultvärdet är 100. Detta är ett ganska lågt tal - höj värdet till 1000, eller ännu högre. m. I fältet Output (choose 1 cell) väljer ni en tom cell i ert kalkylblad, förslagsvis någonstans till höger (eller nedanför) de tidigare ifyllda cellerna. n. Välj typ av "test" genom att pricka i knappen ">=" under Test criterion. Tryck därefter på Go!

4. o. Resultatet av randomiseringstestet presenteras i form av en liten tabell, av vilken det (bland annat) framgår i hur många av upprepningarna som den randomiserade medelvärdesskillnaden befanns vara lika stor, eller större, än den ursprungligen observerade skillnaden. Detta antal delat med antalet upprepningar (vilket ni får räkna ut själva) utgör testets p-värde. Vad blev resultatet? Jämför med p-värdet från ert tidigare t-test slutsats? p. Avsluta genom att upprepa randomiseringstestet. Denna gång kan ni även bocka i rutan Keep results. Nu sparas samtliga randomiserade medelvärdesskillnader i ett eget kalkylblad. Använd dessa värden och konstruera, med hjälp av datanalys-modulen, ett histogram som grafiskt illustrerar er referensfördelning och innebörden av p-värdet. Konfidensintervall med hjälp av "bootstrapping" Använd åter era data för käkbenslängder. Denna gång ska ni, utifrån samtliga värden (båda könen), konstruera ett konfidensintervall inom vilket det sanna populationsmedelvärdet ligger med en viss sannolikhet. 1. Börja med att, som repetition, beräkna ett traditionellt 95%-konfidensintervall med hjälp av t- fördelningen. Spara resultatet för kommande jämförelse. Formeln är som bekant följande: 2. Konstruera ett motsvarande konfidensintervall med hjälp av dragning med återläggning ("bootstrap") i PopTools.

a. Gör inledningsvis som i föregående uppgift (välj Resample etc.). Till skillnad mot tidigare ska ni dock denna gång markera alternativet som innebär dragning med återläggning (With replacement). Välj vidare alternativet Both, innan ni trycker på Go. b. Räkna ut medelvärdet för de "resamplade" värdena. Detta utgör den test-statistika som bildar referensfördelning då konfidensintervallet skall konstrueras. c. Använd åter Monte Carlo analysis för att återupprepa dragningen med återläggning (samt beräkning av medelvärdet) ett stort antal gånger. I fälten Lower Percentile och Upper percentile är markerat vilka konfidensgränser som ni vill få rapporterade. Defaultvärden är 0.025 och 0.975, d.v.s. ett 95%-interval. Vad blev resultatet? d. Kör om analysen några gånger och jämför resultaten varför varierar de? e. Avsluta med att, med hjälp av PopTools, istället konstruera ett 50%-konfidensintervall för samma data. Hur skiljer sig detta intervall från det tidigare? Varför? 5. Korrelationstest baserat på permutationer Följande data utgörs av ålder (X) och leverstorlek (Y) uttryckt som volym (milliliter) per enhet kroppsvikt (kilogram) hos femton friska, slumpvis valda, barn: Ind. X Y 1 0.5 41 2 0.7 55 3 2.5 41 4 4.1 39 5 5.9 50 6 6.1 32 7 7.0 41 8 8.2 42 9 10.0 26 10 10.1 35 11 10.9 25 12 11.5 31 13 12.1 31 14 14.1 29 15 15.0 23 1. Mata in dessa data i ett nytt kalkylblad i två intilliggande kolumner (kontrollera först om Windows på er dator är inställt för decimalpunkt eller decimalkomma ) 2. Räkna ut korrelationskoefficienten för X och Y. För detta används excel-kommandot =PEARSON(array1;array2), där array1 och array2 utgör cellreferenserna för X- och Y- kolumnerna. Illustrera även era data grafiskt med hjälp av en xy-plot. 3. Konstruera nu ett permutationsbaserat korrelationstest med hjälp av PopTools och det ni lärt er tidigare. Vad utgör noll-hypotesen? Vad kommer ni fram till?

6. Extrauppgift Konstruera ett permutationstest som utgör ett alternativ till vanlig variansanalys. Tabellen innehåller uppmätt stressminskning vid tre olika behandlingar (A-C). Treatment Subject A B C 1 16 26 22 2 16 20 23 3 17 21 22 4 28 29 36 Jämför resultatet med det från en vanlig ANOVA (tips: i PopTools, under Extra stats, finns en rutin för detta som ni kan använda).