Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2 Laborationen avser att illustrera användandet av normalfördelningsdiagram, konfidensintervall vid jämförelser samt teckentest. En viktig del av laborationen är liksom i laboration 1 att på egen hand tillgodogöra sig nytt stoff i statistik och sedan tillämpa det. På den schemalagda tiden i datorsalen beräknas du hinna med de Minitabkörningar som ska göras, förutsatt att du är väl förberedd innan du kommer dit. Dessutom måste du avsätta tid både före och efter den schemalagda tiden för att genomföra laborationen. Labredogörelsen skall lämnas in i pdf format via Fronter senast en vecka efter KGB 2 oavsett om du deltar på KGB eller ej. Litteratur: Vännman, Matematisk statistik, kap 8.3, 9.5 och 10.1. Handledning för MINITAB. Innehåll Att göra före det schemalagda labpasset. Läs först noggrant igenom kap 8.3, 9.5 och 10.1 i kursboken. Läs sedan noggrant igenom hela laborationshandledningen och lämpliga delar av MINITAB-handledningen (finns i mappen Kompletterande materia i Fronter) innan du börjar göra uppgifterna. 1 Normalfördelningsdiagram 2 1.1 Användning av fördelningsdiagram i MINITAB........ 2 2 Jämförelse mellan kvinnor och män (två stickprov) 3 2.1 Jämförelser utan normalfördelningsantagande......... 3 2.2 Konfidensintervall under normalfördelningsantagande..... 4 3 Jämförelser mellan dominant och icke-dominant (stickprov i par) 5 3.1 Teckentest............................. 5 3.2 Konfidensintervall under normalfördelningsantagande..... 5 4 Redovisningen 6
1 Normalfördelningsdiagram Laboration 2 är en fortsättning på laboration 1. Du ska börja med att undersöka om kropps-måttet som du studerade i laboration 1 kan antas vara normalfördelat. Redan genom att studera lådagrammen från laboration 1 kan du få en idé om normalfördelningen är rimlig som modell. Om lådagrammen är ganska symmetriska så kan eventuellt normalfördelningen vara en rimlig stokastisk modell medan om lådagrammen visar tydlig snedhet så är den inte det. Normalfördelningsdiagram är en ofta använd grafisk metod för att undersöka om det är rimligt med antagandet att mätvärden är normalfördelade. Denna metod ska du använda här. 1.1 Användning av fördelningsdiagram i MINITAB I MINITAB finns ett kommando som gör ett normalfördelningsdiagram och prickar in observationerna på detta. Dessutom anpassas en linje till punkterna. Se Handledning för MINITAB. För att få en viss intuitiv förståelse för normalfördelningsdiagram så ska du börja med att simulera observationer från en normalfördelning för att se hur det kan se ut när man prickar in dessa i normalfördelningsdiagram. Sedan ska du simulera ett stort antal observationer från en normalfördelning och jämföra med resultaten man får om man prickar in rektangelfördelade eller exponentialfördelade variabler. Se häftet Handledning för MINITAB för instruktioner om hur simuleringarna ska göras. (a) Simulera en variabel (kolumn) med 10 värden från en normalfördelning med väntevärde 1 och standardavvikelse 2, d v s N(1,2). Lägg värdena i kolumn C1 och sätt namnet N10 på C1. Gör normalfördelningsdiagram i MINITAB över N10. (b) Simulera först en variabel (kolumn) med 500 värden från en normalfördelning med vänte-värde 1 och standard-avvikelse 2, d v s N(1,2). Lägg värdena i en kolumn med namnet N500. Gör ett normalfördelningsdiagram i MINITAB över N500. Simulera sedan en variabel (kolumn) med 500 värden från en rektangelfördelning. Låt parametrarna i rektangelfördelningen vara: undre gräns 0 och övre 2, dvs R(0, 2). Lägg värdena i en kolumn med namnet R500. Gör ett normalfördelningsdiagram i MINITAB över R500. Simulera därefter en variabel (kolumn) med 500 värden från en exponentialfördelning med väntevärde (mean) 1, dvs Exp(1). Lägg värdena i en kolumn med namnet E500. Använd MINITAB för att göra ett normalfördelningsdiagram över E500. Jämför de tre normalfördelnings-diagrammen med varandra. Uttryck med egna ord skillnaden mellan de 3 diagrammen.! Du ska innan du går vidare till uppgift (c) göra simuleringar av stickprov av storlek 18 från en normalfördelning för att få en känsla för hur 2 (6)
en stickprov från en normal-fördelning ser ut i ett normalfördelningsdiagram. (Anledningen till att du ska ha ett stickprov av storlek 18 är att du har samma storlek på dina egna mätserier för män respektive kvinnors mått). Dessa nya simuleringar skall enbart studeras på skärmen och skall alltså inte ingå i rapporten. Simulera 5 stickprov av storlek 18 från N(0,1)-fördelningen och plotta dessa i normalfördelningsdiagram. Reflektera över resultaten. Det är viktigt att du gör dessa simuleringar för att kunna tolka normalfördelningsdiagrammen nedan. (c) Du ska här studera de två datamaterial som beskriver ditt studerade kroppsmått för kvinnors respektive mäns dominanta sida. Ange vilket kroppsmått du har valt och hur du definierat det. Undersök med hjälp av normalfördelningsdiagram om normalfördelningen är lämplig som stokastisk modell för kroppsmåttet för kvinnors respektive mäns dominanta sida. Du kan med fördel plotta båda materialen i ett och samma diagram. Motivera tydligt om du tycker att normalfördelningen är lämplig som stokastisk modell för kroppsmåttet eller ej. 2 Jämförelse mellan kvinnor och män (två stickprov) Lådagrammen i uppgift g) i laboration 1 kan mer eller mindre tydligt ha indikerat att det finns skillnader i genomsnitt mellan kvinnor och män för ditt studerade kroppsmått. För att kunna påvisa en eventuell skillnad så måste man göra ett modell antagande. Du skall först och främst anta att dina observationer av kroppsmåttet är ett stickprov från någon kontinuerlig fördelning. Om det är rimligt att anta att denna fördelning är en normalfördelning så kan du använda konfidensintervall för två stickprov för att påvisa eventuella skillnader. Se kapitel 8.3.2 i kursboken. Men om normalfördelningsantagandet inte är rimligt så kan du istället använda lådagram med konfidensintervall kring medianen. Se avsnitt 2.1 nedan. Du skall använda båda metoderna oavsett om du har dragit slutsatsen att normalfördelningen är lämplig eller ej. 2.1 Jämförelser utan normalfördelningsantagande Du ska först undersöka om kroppsmåttet skiljer sig i genomsnitt mellan kvinnor och män utan att göra något antagande om normalfördelning. Då är det rimligt att tolka genomsnitt som median och lådagram med medianintervall är en tänkbar metod att använda. Observera att uppgift (d) ska göras även om ditt datamaterial kan antas vara normalfördelat. Konfidensintervallet för medianvärdet beräknas med hjälp av MINITAB. (Observera att det är fördelningarnas medianer som konfindensintervaller beräknas för, och inte stickprovsmedianerna!) MINITAB använder samma metod som användes på ektion 11 (Kapitel 8.1 i kursboken), dvs metoden med teckenintervall, som inte förutsätter något speciellt antagande om fördelningen förutom att den är en kontinuerlig. För vart och ett av materialen kommer ett 95 % konfidensintervall att räknas ut. Denna konfidensgrad 3 (6)
är satt som standard i MINITAB. Om de två konfidensintervallen inte överlappar varandra är det rimligt att dra slutsatsen att det finns en skillnad mellan medianerna. För att testa om medianen i fördelningen för kvinnornas mätvärden är densamma som medianen för männens fördelning använder vi därför följande beslutsregel: Beslutsregel: Medianerna skiljer sig åt om de två intervallen inte överlappar varandra. Man kan visa att signifikansnivån, som hör till den beslutsregeln, är högst 10 % om de en-skilda konfidensintervallen har konfidensgrad 95%. (d) Undersök, med hjälp av lådagram med medianintervall och beslutsregeln ovan, om ditt studerade kroppsmått för den dominanta sidan skiljer sig i genomsnitt mellan kvinnor och män på högst 10 % signifikansnivå. En beskrivning av hur man får lådagram med medianintervall finns i häftet Handledning för MINITAB. Vilka slutsatser drar du? På vilken risknivå? (Med risknivå menas signifikansnivå.) Motivera tydligt ditt svar. 2.2 Konfidensintervall under normalfördelningsantagande Om det är rimligt att anta att observationsvärdena kommer från en normalfördelning finns en effektivare metod än lådagram med medianintervall att använda för att undersöka om det finns genomsnittliga skillnader. Då kan man även uppskatta, med en given säkerhet, hur pass stor skillnaden är. Det man använder är då metoden för två stickprov. Se kapitel 8.3.2 i kursboken. Under antagande om normalfördelning så är median och väntevärde lika och genomsnitt tolkas som väntevärde. Du ska anta att variansen är lika i de två stickproven. Observera att uppgifterna (e) och (f) ska göras även om ditt datamaterial inte kan antas vara normalfördelat. (e) Undersök, med hjälp av konfidensintervall för två stickprov, om ditt studerade kroppsmått för den dominanta sidan skiljer sig i genomsnitt mellan kvinnor och män med 90 % säkerhet. Gör beräkningarna i MINITAB. En beskrivning av hur det går till finns i häftet Handledning för MINITAB. Vilka slutsatser kan du dra? Tolka resultatet av konfidensintervallet i ord. I tolkningen ska ingå om det finns någon påvisbar skillnad och, i så fall, hur stor den är. (f) Ange tydligt de normalfördelningsantaganden som gäller vid två stickprov. Tänk på att definiera dina införda beteckningar. Beräkna därefter konfidensintervallet i uppgift e) för hand och verifiera att du får samma intervall som MINITAB. Redovisa formeln du an-vänder. Använd MINITAB för att beräkna medelvärdena och standardavvikelserna för de två stickproven och bifoga utskriften därifrån. Är normalfördelningsantagandena rimliga för dina observationer? Jämför med uppgift (c). 4 (6)
3 Jämförelser mellan dominant och icke-dominant (stickprov i par) Du ska nu studera genomsnittliga skillnader mellan dominant och ickedominant sida och se om några sådana skillnader kan beläggas med test eller konfidensintervall. När du jämförde kvinnor med män så använde du metoden för två stickprov. Vid jämförelser mellan dominant och icke-dominant sida så kan den metoden inte användas. Istället ska metoden för stickprov i par användas. För varje person finns ett par av observationer, från dominant och icke-domi-nant sida. För att eliminera variationer mellan olika individer så bildar man differensen mellan de två sidorna för varje individ, på samma sätt som i laboration 1, uppgift (h). Se även kapitel 8.3.1 i kursboken. 3.1 Teckentest Du ska först undersöka om ditt kroppsmått skiljer sig i genomsnitt mellan dominant och icke-dominant sida utan att göra något antagande om normalfördelning. Om det inte är rimligt med normalfördelningsantagande så kan teckentest användas. Se kapitel 9.5 i kursboken. (g) Undersök, med hjälp av teckentest för hand, om det finns en genomsnittlig skillnad mellan dominant och icke-dominant sida för antingen kvinnor eller män. Välj själv vilket av de två fallen (kvinnor eller män) som du vill studera. Bifoga utskriften av differensvärdena från det fall som du har valt. Använd 10 % signifikansnivå. Ange tydligt hypoteser, testvariabel och beslutsregel. Observera att du ska testa en tvåsidig mothypotes. Se exempel 9.14 i kursboken. Om nå-got eller några differensvärden är exakt 0 så uteslut dessa värden från de fortsatta beräkningarna. I så fall minskas antalet differensvärden så att du inte längre har 18 värden. Vilka slutsatser drar du? Motivera tydligt ditt svar. 3.2 Konfidensintervall under normalfördelningsantagande Du ska nu tillämpa metoden som bygger på normalfördelningsantagande, dvs stickprov i par, enligt kapitel 8.3.1 i kursboken. Vi vet (Sats 6B) att differensen av två oberoende normalfördelade variabler är normalfördelad. Här gör vi inte antagandet att måtten på dominant och icke-dominant sida är oberoende. I praktiken gäller det ofta att differenser av normalfördelade variabler är normalfördelade. Du skall anta att så är fallet här. Dvs för att kontrollera normalfördelningsantagandet för differensvärdena skall du göra en normalfördelningsplot för måttet på icke-dominant sida och en för måttet på dominant sida. (h) Undersök med normalfördelningsdiagram om normalfördelningen är lämplig som stokastisk modell för differensvärdena, genom att göra en normalfördelningsplot för måttet på icke-dominant sida och en för måttet på dominant sida. Om det är rimligt att anta att observationsvärdena är normalfördelade så är konfidensintervall för stickprov i par, som beskrivs i kapitel 8.3.1, en 5 (6)
effektivare metod än teckentest för att undersöka om det finns genomsnittliga skillnader. Då kan man även upp-skatta, med en given säkerhet, hur pass stor skillnaden är. Du ska nu beräkna ett konfidensintervall för den genomsnittliga skillnaden mellan domi-nant och icke-dominant sida för antingen kvinnor eller män. Välj själv vilket av de två fallen (kvinnor eller män) som du vill studera. Observera att uppgifterna i) och j) ska göras även om dina differensvärden inte kan antas vara normalfördelade. (i) Undersök i MINITAB, med hjälp av konfidensintervall för stickprov i par, om det finns genomsnittliga skillnader mellan dominant och icke-dominant sida i ditt valda fall. Använd 90 % konfidensgrad. En beskrivning av hur det går till finns i Handledning för MINITAB. Vilka slutsatser kan du dra? Tolka resultatet av konfidensintervallet i ord. I tolkningen ska ingå om det finns någon påvisbar skillnad och, i så fall, hur stor den är. För exempel på tolkningar se exempel 8.6, sidan 210, och exempel 8.9, sidan 215, i kursboken. (j) Ange tydligt de normalfördelningsantaganden som gäller vid stickprov i par. Tänk på att definiera dina införda beteckningar. Beräkna därefter konfidensintervallet i uppgift (i) för hand och verifiera att du får samma intervall som MINITAB. Redovisa formeln du använder. OBS! Du kan anvvända MINITAB för att beräkna medelvärdet och standardavvikelsen för differenserna på samma sätt som på Lab 1. Bifoga då MINITAB utskriften som ger medelvärdet och standardavvikelsen för differenserna. 4 Redovisningen Redovisningen av resultaten ska göras så att det till det KGB-pass då laborationen diskuteras finns en överskådlig sammanställning av resultaten. Ett bra sätt att göra detta är att klista in Minitabutskrifter, tabeller och diagram i Word och sedan skriva kommentarerna i direkt anslutning till respektive tabell eller diagram. Numrera uppgifterna på samma sätt som i labinstruktionen. Tänk på följande: Det ska tydligt framgå till vilken uppgift varje utskrift hör. Gör en snygg, överskådlig och läslig redogörelse, inklusive försättsblad och namn på laboratner. En slarvigt gjord redogörelse får göras om helt. Definiera alla införda beteckningar i uppgifterna (f),(g) och (j). Motivera tydligt alla dina slutsatser. presentera tydliga lösningar och redovisa dina beräkningar i uppgifterna (f),(g) och (j). 6 (6)