Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Relevanta dokument
Att göra före det schemalagda labpasset.

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys

TVM-Matematik Adam Jonsson

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 2 Inferens S0005M VT16

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik, Föreläsning 5

Tentamen i Matematisk statistik Kurskod S0001M

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Studiehandledning S0001M Matematisk statistik Läsperiod 2, HT 2017

Föreläsning 12: Regression

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 2 Inferens S0005M VT18

, s a. , s b. personer från Alingsås och n b

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i Matematisk statistik Kurskod S0001M

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsningsanteckningar till kapitel 8, del 2

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

7.3.3 Nonparametric Mann-Whitney test

Tentamen i Matematisk statistik Kurskod S0001M

TMS136. Föreläsning 10

Studiehandledning S0001M Matematisk statistik Läsperiod 2, Ht 2013

Tentamen i Matematisk statistik Kurskod S0001M

Studiehandledning S0001M Matematisk statistik Läsperiod 4, VT 2017

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Obligatorisk uppgift, del 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Stockholms Universitet Statistiska institutionen Termeh Shafie

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Lektionsanteckningar 11-12: Normalfördelningen

Medelvärde, median och standardavvikelse

Studiehandledning S0008M Sannolikhetslära och statistik Läsperiod 1, HT 2017

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Laboration 3: Parameterskattning och Fördelningsanpassning

Tentamen i Matematisk statistik Kurskod S0001M

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Laboration 3 Inferens fo r andelar och korstabeller

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

TENTAMEN I STATISTIKENS GRUNDER 2

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

1 10 e 1 10 x dx = e 1 10 T = p = P(ξ < 3) = 1 e P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0.

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Avd. Matematisk statistik

F22, Icke-parametriska metoder.

Tentamen i Matematisk statistik Kurskod S0001M

2. Test av hypotes rörande medianen i en population.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Föreläsning 12: Repetition

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Kompletterande kursmaterial till kursen Matematisk statistik.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Föreläsningsanteckningar till kapitel 9, del 2

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Beskrivande statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Demonstration av laboration 2, SF1901

Tentamen i Matematisk statistik Kurskod S0001M

Diskussionsproblem för Statistik för ingenjörer

F3 Introduktion Stickprov

Jämförelse av två populationer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 11: Mer om jämförelser och inferens

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

Transkript:

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2 Laborationen avser att illustrera användandet av normalfördelningsdiagram, konfidensintervall vid jämförelser samt teckentest. En viktig del av laborationen är liksom i laboration 1 att på egen hand tillgodogöra sig nytt stoff i statistik och sedan tillämpa det. På den schemalagda tiden i datorsalen beräknas du hinna med de Minitabkörningar som ska göras, förutsatt att du är väl förberedd innan du kommer dit. Dessutom måste du avsätta tid både före och efter den schemalagda tiden för att genomföra laborationen. Labredogörelsen skall lämnas in i pdf format via Fronter senast en vecka efter KGB 2 oavsett om du deltar på KGB eller ej. Litteratur: Vännman, Matematisk statistik, kap 8.3, 9.5 och 10.1. Handledning för MINITAB. Innehåll Att göra före det schemalagda labpasset. Läs först noggrant igenom kap 8.3, 9.5 och 10.1 i kursboken. Läs sedan noggrant igenom hela laborationshandledningen och lämpliga delar av MINITAB-handledningen (finns i mappen Kompletterande materia i Fronter) innan du börjar göra uppgifterna. 1 Normalfördelningsdiagram 2 1.1 Användning av fördelningsdiagram i MINITAB........ 2 2 Jämförelse mellan kvinnor och män (två stickprov) 3 2.1 Jämförelser utan normalfördelningsantagande......... 3 2.2 Konfidensintervall under normalfördelningsantagande..... 4 3 Jämförelser mellan dominant och icke-dominant (stickprov i par) 5 3.1 Teckentest............................. 5 3.2 Konfidensintervall under normalfördelningsantagande..... 5 4 Redovisningen 6

1 Normalfördelningsdiagram Laboration 2 är en fortsättning på laboration 1. Du ska börja med att undersöka om kropps-måttet som du studerade i laboration 1 kan antas vara normalfördelat. Redan genom att studera lådagrammen från laboration 1 kan du få en idé om normalfördelningen är rimlig som modell. Om lådagrammen är ganska symmetriska så kan eventuellt normalfördelningen vara en rimlig stokastisk modell medan om lådagrammen visar tydlig snedhet så är den inte det. Normalfördelningsdiagram är en ofta använd grafisk metod för att undersöka om det är rimligt med antagandet att mätvärden är normalfördelade. Denna metod ska du använda här. 1.1 Användning av fördelningsdiagram i MINITAB I MINITAB finns ett kommando som gör ett normalfördelningsdiagram och prickar in observationerna på detta. Dessutom anpassas en linje till punkterna. Se Handledning för MINITAB. För att få en viss intuitiv förståelse för normalfördelningsdiagram så ska du börja med att simulera observationer från en normalfördelning för att se hur det kan se ut när man prickar in dessa i normalfördelningsdiagram. Sedan ska du simulera ett stort antal observationer från en normalfördelning och jämföra med resultaten man får om man prickar in rektangelfördelade eller exponentialfördelade variabler. Se häftet Handledning för MINITAB för instruktioner om hur simuleringarna ska göras. (a) Simulera en variabel (kolumn) med 10 värden från en normalfördelning med väntevärde 1 och standardavvikelse 2, d v s N(1,2). Lägg värdena i kolumn C1 och sätt namnet N10 på C1. Gör normalfördelningsdiagram i MINITAB över N10. (b) Simulera först en variabel (kolumn) med 500 värden från en normalfördelning med vänte-värde 1 och standard-avvikelse 2, d v s N(1,2). Lägg värdena i en kolumn med namnet N500. Gör ett normalfördelningsdiagram i MINITAB över N500. Simulera sedan en variabel (kolumn) med 500 värden från en rektangelfördelning. Låt parametrarna i rektangelfördelningen vara: undre gräns 0 och övre 2, dvs R(0, 2). Lägg värdena i en kolumn med namnet R500. Gör ett normalfördelningsdiagram i MINITAB över R500. Simulera därefter en variabel (kolumn) med 500 värden från en exponentialfördelning med väntevärde (mean) 1, dvs Exp(1). Lägg värdena i en kolumn med namnet E500. Använd MINITAB för att göra ett normalfördelningsdiagram över E500. Jämför de tre normalfördelnings-diagrammen med varandra. Uttryck med egna ord skillnaden mellan de 3 diagrammen.! Du ska innan du går vidare till uppgift (c) göra simuleringar av stickprov av storlek 18 från en normalfördelning för att få en känsla för hur 2 (6)

en stickprov från en normal-fördelning ser ut i ett normalfördelningsdiagram. (Anledningen till att du ska ha ett stickprov av storlek 18 är att du har samma storlek på dina egna mätserier för män respektive kvinnors mått). Dessa nya simuleringar skall enbart studeras på skärmen och skall alltså inte ingå i rapporten. Simulera 5 stickprov av storlek 18 från N(0,1)-fördelningen och plotta dessa i normalfördelningsdiagram. Reflektera över resultaten. Det är viktigt att du gör dessa simuleringar för att kunna tolka normalfördelningsdiagrammen nedan. (c) Du ska här studera de två datamaterial som beskriver ditt studerade kroppsmått för kvinnors respektive mäns dominanta sida. Ange vilket kroppsmått du har valt och hur du definierat det. Undersök med hjälp av normalfördelningsdiagram om normalfördelningen är lämplig som stokastisk modell för kroppsmåttet för kvinnors respektive mäns dominanta sida. Du kan med fördel plotta båda materialen i ett och samma diagram. Motivera tydligt om du tycker att normalfördelningen är lämplig som stokastisk modell för kroppsmåttet eller ej. 2 Jämförelse mellan kvinnor och män (två stickprov) Lådagrammen i uppgift g) i laboration 1 kan mer eller mindre tydligt ha indikerat att det finns skillnader i genomsnitt mellan kvinnor och män för ditt studerade kroppsmått. För att kunna påvisa en eventuell skillnad så måste man göra ett modell antagande. Du skall först och främst anta att dina observationer av kroppsmåttet är ett stickprov från någon kontinuerlig fördelning. Om det är rimligt att anta att denna fördelning är en normalfördelning så kan du använda konfidensintervall för två stickprov för att påvisa eventuella skillnader. Se kapitel 8.3.2 i kursboken. Men om normalfördelningsantagandet inte är rimligt så kan du istället använda lådagram med konfidensintervall kring medianen. Se avsnitt 2.1 nedan. Du skall använda båda metoderna oavsett om du har dragit slutsatsen att normalfördelningen är lämplig eller ej. 2.1 Jämförelser utan normalfördelningsantagande Du ska först undersöka om kroppsmåttet skiljer sig i genomsnitt mellan kvinnor och män utan att göra något antagande om normalfördelning. Då är det rimligt att tolka genomsnitt som median och lådagram med medianintervall är en tänkbar metod att använda. Observera att uppgift (d) ska göras även om ditt datamaterial kan antas vara normalfördelat. Konfidensintervallet för medianvärdet beräknas med hjälp av MINITAB. (Observera att det är fördelningarnas medianer som konfindensintervaller beräknas för, och inte stickprovsmedianerna!) MINITAB använder samma metod som användes på ektion 11 (Kapitel 8.1 i kursboken), dvs metoden med teckenintervall, som inte förutsätter något speciellt antagande om fördelningen förutom att den är en kontinuerlig. För vart och ett av materialen kommer ett 95 % konfidensintervall att räknas ut. Denna konfidensgrad 3 (6)

är satt som standard i MINITAB. Om de två konfidensintervallen inte överlappar varandra är det rimligt att dra slutsatsen att det finns en skillnad mellan medianerna. För att testa om medianen i fördelningen för kvinnornas mätvärden är densamma som medianen för männens fördelning använder vi därför följande beslutsregel: Beslutsregel: Medianerna skiljer sig åt om de två intervallen inte överlappar varandra. Man kan visa att signifikansnivån, som hör till den beslutsregeln, är högst 10 % om de en-skilda konfidensintervallen har konfidensgrad 95%. (d) Undersök, med hjälp av lådagram med medianintervall och beslutsregeln ovan, om ditt studerade kroppsmått för den dominanta sidan skiljer sig i genomsnitt mellan kvinnor och män på högst 10 % signifikansnivå. En beskrivning av hur man får lådagram med medianintervall finns i häftet Handledning för MINITAB. Vilka slutsatser drar du? På vilken risknivå? (Med risknivå menas signifikansnivå.) Motivera tydligt ditt svar. 2.2 Konfidensintervall under normalfördelningsantagande Om det är rimligt att anta att observationsvärdena kommer från en normalfördelning finns en effektivare metod än lådagram med medianintervall att använda för att undersöka om det finns genomsnittliga skillnader. Då kan man även uppskatta, med en given säkerhet, hur pass stor skillnaden är. Det man använder är då metoden för två stickprov. Se kapitel 8.3.2 i kursboken. Under antagande om normalfördelning så är median och väntevärde lika och genomsnitt tolkas som väntevärde. Du ska anta att variansen är lika i de två stickproven. Observera att uppgifterna (e) och (f) ska göras även om ditt datamaterial inte kan antas vara normalfördelat. (e) Undersök, med hjälp av konfidensintervall för två stickprov, om ditt studerade kroppsmått för den dominanta sidan skiljer sig i genomsnitt mellan kvinnor och män med 90 % säkerhet. Gör beräkningarna i MINITAB. En beskrivning av hur det går till finns i häftet Handledning för MINITAB. Vilka slutsatser kan du dra? Tolka resultatet av konfidensintervallet i ord. I tolkningen ska ingå om det finns någon påvisbar skillnad och, i så fall, hur stor den är. (f) Ange tydligt de normalfördelningsantaganden som gäller vid två stickprov. Tänk på att definiera dina införda beteckningar. Beräkna därefter konfidensintervallet i uppgift e) för hand och verifiera att du får samma intervall som MINITAB. Redovisa formeln du an-vänder. Använd MINITAB för att beräkna medelvärdena och standardavvikelserna för de två stickproven och bifoga utskriften därifrån. Är normalfördelningsantagandena rimliga för dina observationer? Jämför med uppgift (c). 4 (6)

3 Jämförelser mellan dominant och icke-dominant (stickprov i par) Du ska nu studera genomsnittliga skillnader mellan dominant och ickedominant sida och se om några sådana skillnader kan beläggas med test eller konfidensintervall. När du jämförde kvinnor med män så använde du metoden för två stickprov. Vid jämförelser mellan dominant och icke-dominant sida så kan den metoden inte användas. Istället ska metoden för stickprov i par användas. För varje person finns ett par av observationer, från dominant och icke-domi-nant sida. För att eliminera variationer mellan olika individer så bildar man differensen mellan de två sidorna för varje individ, på samma sätt som i laboration 1, uppgift (h). Se även kapitel 8.3.1 i kursboken. 3.1 Teckentest Du ska först undersöka om ditt kroppsmått skiljer sig i genomsnitt mellan dominant och icke-dominant sida utan att göra något antagande om normalfördelning. Om det inte är rimligt med normalfördelningsantagande så kan teckentest användas. Se kapitel 9.5 i kursboken. (g) Undersök, med hjälp av teckentest för hand, om det finns en genomsnittlig skillnad mellan dominant och icke-dominant sida för antingen kvinnor eller män. Välj själv vilket av de två fallen (kvinnor eller män) som du vill studera. Bifoga utskriften av differensvärdena från det fall som du har valt. Använd 10 % signifikansnivå. Ange tydligt hypoteser, testvariabel och beslutsregel. Observera att du ska testa en tvåsidig mothypotes. Se exempel 9.14 i kursboken. Om nå-got eller några differensvärden är exakt 0 så uteslut dessa värden från de fortsatta beräkningarna. I så fall minskas antalet differensvärden så att du inte längre har 18 värden. Vilka slutsatser drar du? Motivera tydligt ditt svar. 3.2 Konfidensintervall under normalfördelningsantagande Du ska nu tillämpa metoden som bygger på normalfördelningsantagande, dvs stickprov i par, enligt kapitel 8.3.1 i kursboken. Vi vet (Sats 6B) att differensen av två oberoende normalfördelade variabler är normalfördelad. Här gör vi inte antagandet att måtten på dominant och icke-dominant sida är oberoende. I praktiken gäller det ofta att differenser av normalfördelade variabler är normalfördelade. Du skall anta att så är fallet här. Dvs för att kontrollera normalfördelningsantagandet för differensvärdena skall du göra en normalfördelningsplot för måttet på icke-dominant sida och en för måttet på dominant sida. (h) Undersök med normalfördelningsdiagram om normalfördelningen är lämplig som stokastisk modell för differensvärdena, genom att göra en normalfördelningsplot för måttet på icke-dominant sida och en för måttet på dominant sida. Om det är rimligt att anta att observationsvärdena är normalfördelade så är konfidensintervall för stickprov i par, som beskrivs i kapitel 8.3.1, en 5 (6)

effektivare metod än teckentest för att undersöka om det finns genomsnittliga skillnader. Då kan man även upp-skatta, med en given säkerhet, hur pass stor skillnaden är. Du ska nu beräkna ett konfidensintervall för den genomsnittliga skillnaden mellan domi-nant och icke-dominant sida för antingen kvinnor eller män. Välj själv vilket av de två fallen (kvinnor eller män) som du vill studera. Observera att uppgifterna i) och j) ska göras även om dina differensvärden inte kan antas vara normalfördelade. (i) Undersök i MINITAB, med hjälp av konfidensintervall för stickprov i par, om det finns genomsnittliga skillnader mellan dominant och icke-dominant sida i ditt valda fall. Använd 90 % konfidensgrad. En beskrivning av hur det går till finns i Handledning för MINITAB. Vilka slutsatser kan du dra? Tolka resultatet av konfidensintervallet i ord. I tolkningen ska ingå om det finns någon påvisbar skillnad och, i så fall, hur stor den är. För exempel på tolkningar se exempel 8.6, sidan 210, och exempel 8.9, sidan 215, i kursboken. (j) Ange tydligt de normalfördelningsantaganden som gäller vid stickprov i par. Tänk på att definiera dina införda beteckningar. Beräkna därefter konfidensintervallet i uppgift (i) för hand och verifiera att du får samma intervall som MINITAB. Redovisa formeln du använder. OBS! Du kan anvvända MINITAB för att beräkna medelvärdet och standardavvikelsen för differenserna på samma sätt som på Lab 1. Bifoga då MINITAB utskriften som ger medelvärdet och standardavvikelsen för differenserna. 4 Redovisningen Redovisningen av resultaten ska göras så att det till det KGB-pass då laborationen diskuteras finns en överskådlig sammanställning av resultaten. Ett bra sätt att göra detta är att klista in Minitabutskrifter, tabeller och diagram i Word och sedan skriva kommentarerna i direkt anslutning till respektive tabell eller diagram. Numrera uppgifterna på samma sätt som i labinstruktionen. Tänk på följande: Det ska tydligt framgå till vilken uppgift varje utskrift hör. Gör en snygg, överskådlig och läslig redogörelse, inklusive försättsblad och namn på laboratner. En slarvigt gjord redogörelse får göras om helt. Definiera alla införda beteckningar i uppgifterna (f),(g) och (j). Motivera tydligt alla dina slutsatser. presentera tydliga lösningar och redovisa dina beräkningar i uppgifterna (f),(g) och (j). 6 (6)