UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk Statistik Statistiska Metoder 5MS010, 7.5 hp Kadri Meister Rafael Björk LABORATIONER Detta dokument innehåller beskrivningar av de tre laborationerna på kursen Statistiska metoder. För att bli godkänd på kursen krävs det att alla tre laborationerna är godkända. Syftet med laborationerna är dels att lära sig hantera ett statistiskt programpaket, i detta fall Minitab, samt att öva på några grundläggande statistiska begrepp. Under kursens gång ska ni göra en egen statistisk undersökning som ni ska analysera och presentera. Laborationerna är till stor del kopplade till denna statistiska underökning. I laborationerna ingår även en del kompletterande uppgifter. Programmet startas genom att man dubbelklickar på Minitab-ikonen. Vid start kommer ett datafönster, samt ett session -fönster att dyka upp. I datafönstret skriver man in datamaterial och namnger variabler. I sessionfönstret presenteras resultat. I menyerna högst upp finns de kommandon ni kommer att behöva för att bearbeta data. Det finns en introduktionsfilm till Minitab på http://www.screencast.com/t/izls2cuwl. Det går att ladda hem en gratis 30-dagars version på http://www.minitab.com/en- SE/products/minitab/free-trial.aspx. På följande adress står det mer om hur ni får access till datorlabben: http://www.math.umu.se/digitalassets/40/40871_info-lab-salar-och-behrigheter-ht09.pdf
TIDSPLAN Måndag 10/10 Utdelning av laborationsbeskrivning. Laborationerna sker i grupper om två. Ni gör själva denna gruppindelning. Torsdag 13/10 13-16 Handledning grupp 1 sal MA151 Laboration 1 Fredag 14/10 9-12 Handledning grupp 2 sal MA151 Laboration 1 13-16 Handledning grupp 3 sal MA141 Laboration 1 17.00 Sista inlämning av enkät + beskrivning Tisdag 18/10 Handledarnas kommentarer till enkäten delas ut skriftligt i samband med föreläsningen. Torsdag 20/10 9.00 Slutlig version av enkäten ska vara inskickad till laborationshandledarna. Ange ifall ni vill att handledarna ska kopiera upp enkäterna till er. Vid nästa labbtillfälle delar handledarna ut ca 40 kopior av enkäten till de grupper som har bett om det. 13-16 Handledning grupp 1 sal MA151 Laboration 2 Fredag 21/10 13-16 Handledning grupp 2 sal MA141 Laboration 2 Handledning grupp 3 sal MA151 Laboration 2 Onsdag 26/10 10.00 Sista inlämning av laboration 2. Fredag 28/10 8-10 Handledning grupp 2 sal MA141 Laboration 3 10-12 Handledning grupp 3 sal MA141 Laboration 3 10-12 Handledning grupp 1 sal MA151 Laboration 3 8-10 Möjlighet att jobba med laboration 3 i sal MA 151. Dock utan handledning. Måndag 31/10 13-15 Handledning alla sal MA151 Laboration 3 15-17 Möjlighet att jobba med laboration 3 i sal MA 151 för alla tre labbgrupper. Dock utan handledning. Tisdag 1/11 13-16 Datasalar MA141 och MA151 är bokade. Ingen handledning. 17.00 Inlämning av ett första utkast av rapporten. (Bör vara i princip fullständig.) Torsdag 3/11 13-16 Återlämning av rapporterna från laboration 2 samt utdelning av handledarnas kommentarer till första inlämningen av laboration 3. Fredag 4/11 10-12 Muntlig redovisning av laboration 3. Obligatoriskt moment. Redovisning sker i halvklass. 13-15 Labbsalarna är bokade för de som behöver göra ändringar i laboration 2 eller 3. Fredag 11/11 17.00 Sista inlämningsdag för laboration 3 och eventuella kompletteringar till laboration 2.
Inför laboration 1 Ni ska dela in er i par. I dessa par kommer ni sedan att jobba under de kommande tre laborationerna. Er första uppgift blir att ni ska bestämma er för en specifik sak som ni vill undersöka och fundera ut vilken population ni vill uttala er om. För att inte göra undersökningen alltför stor och tidskrävande bör ni formulera två till tre frågor som rör det område ni vill undersöka. Dessutom ska ni fundera på vilka bakgrundsfrågor ni vill ha med. (Bakgrundsfrågor syftar till t.ex. kön och ålder.) Enkätfrågorna ska rymmas på en A4-sida. Redan när ni konstruerar frågorna bör ni fundera över hur ni skulle vilja analysera resultatet. Vilka frågor vill ni besvara? Ni bör redan innan laboration 1 påbörja formuleringen av era enkätfrågor. I samband med laboration 1 ska ni lämna in ert förslag till enkät. Ni ska dessutom beskriva lite kort varför ni har valt dessa frågor och vad ni hoppas kunna visa med er undersökning. Denna beskrivning har ni stor nytta av när ni ska skriva er laborationsrapport i slutet av kursen. I er inlämning ska ni även ange vem som har beställt denna undersökning av er. Ni ska alltså tänka er att ni har en uppdragsgivare som vill att ni gör denna undersökning. Det är även till denna uppdragsgivare som er slutgiltiga rapport ska rikta sig. Ni kommer att få feedback på era frågor och ert upplägg av enkäten.
Laboration 1 För att bli godkänd på laboration 1 ska ni göra uppgifterna nedan. När ni har gjort uppgift 1-10 ska ni meddela handledarna. De kommer då att stämma av med er att ni har gjort uppgifterna. I väntan på denna avstämning kan ni göra uppgift 11. Uppgift 11 ska redovisas skriftligt och inlämning sker senast den 14/10 kl. 17.00. Er inlämning ska minst innehålla en framsida (se dokument om rapportskrivning för detaljer), er beskrivning av den undersökning ni vill göra samt er enkät. 1. Skriv in datamaterialet som finns i bilaga 1 i Minitab och namnge era variabler. File Save Project as används för att spara ditt arbete. 2. Rita ett histogram samt ett kumulativt histogram för längd. Graph Histogram (scale y-scale Type Kryssa för accumulate values across bins ) 3. Bestäm, med hjälp av ett histogram, ungefär hur många nyfödda barn som väger mer än 4000 g. Graph Histogram (Dubbelklicka sedan på staplarna i histogrammet. Gå till fliken Binning.). 4. Gör dotplottar för våra variabler längd och vikt, där ni tar hänsyn till vilket kön barnet har. Graph Dotplot Multiple Graphs (Fyll i kön på By variable ). 5. Gör en boxplot (lådagram) för både längd och vikt. Var verkar medianen, första kvartilen samt tredje kvartilen vara i de två fallen? Finns det några outliers? Graph Boxplot 6. Gör en Pie Chart för både längd och vikt. Tycker ni att detta är ett bra sätt att illustrera datat? Är det bättre för längd eller för vikt? Graph Pie Chart. 7. Beräkna nu sammanfattande mått för de båda variablerna, dvs. medelvärde, median, standardavvikelse samt kvartilerna. Verkar det stämma överens med det resultat ni fick i uppgift 5? Stat Basic Statistics Display Descriptive Statistics. 8. Hur stor är skillnaden mellan medelvikten för pojkar respektive flickor? Hur stor är skillnaden mellan medellängden för pojkar respektive flickor? 9. Om ni har något värde som är extremt stort eller extremt litet, dvs en outlier, och tar bort den observationen, vad blir då resultatet i uppgift 7?
10. Vid en undersökning har man tillfrågat 51 personer från en population hur de ställer sig i en viss fråga. Resultatet presenteras i tabellen nedan. Positiv Negativ Neutral Grupp A 10 8 7 Grupp B 7 12 7 Istället för att presentera dessa värden i en tabell kan grafiskt illustrera dem. Fundera först över hur du skulle vilja att denna graf skulle se ut. Gör sedan en bar chart i Minitab. Graph Bar chart (Ytterligare tips finns i bilaga 3) 11. Ni ska färdigställa er enkät och samt göra en skriftlig beskrivning av vad ni vill uppnå med er undersökning. Se Inför laboration 1 för mer detaljer.
Inför laboration 2 Innan laboration 2 ska ni ha färdigställt er enkät. Den ska vara inskickad till laborationshandledarna senast torsdag 20/10 kl. 9.00. I samband med laboration 2 kommer laborationshandledarna att dela ut 40 kopior av enkäten till de grupper som har sagt att de vill ha kopior. Om ni vill ha ett större stickprov än så får ni själva ordna fler exemplar.
Laboration 2 För att bli godkänd på laboration 2 ska ni göra uppgifterna nedan och lämna in en skriftlig rapport. Se dokumentet om rapportskrivning för närmare instruktioner. Onsdag 26/10 kl. 10.00 är sista inlämningstid för laborationsrapporten. Rapporten kommer att bedömas med ofullständig (O), kommentar (K) eller godkänd (G). Ofullständig innebär att något är felaktigt eller att något behöver kompletteras. Kommentar innebär att det är mindre felaktigheter eller oklarheter. Laborationshandledarna vill prata med er och få vissa förklaringar. Om de får förklaringar på sina frågor blir ni godkända. Godkänd innebär att ni är godkända direkt. Det kan dock finnas skriftliga kommentarer i rapporten som ni bör läsa igenom. Alla undersökningar är inte enkätundersökningar, utan man kan samla in data på andra sätt. I denna laboration ska ni bland annat analysera data från en provtagning i en sjö. 1) Denna uppgift handlar om linjär regression. Datamaterialet finns i bilaga 2. a) Anpassa en rät linje till datamaterialet. Hur beror den organiska halten av djupet? Plotta era observationer tillsammans med den skattade regressionslinjen. Kommentera. Vad kan ni utläsa från regressionsutskriften? Kan vi förkasta hypotesen att b är noll? Stat ->Regression -> Regression alt. Stat ->Regression -> Fitted Line Plot (Testa båda menyvägarna.) b) Vad är en residual? Förklara med ord och markera era residualer i grafen från a- uppgiften. c) Beskriv teoretiskt vad determinationskoefficienten r 2 är för någonting. Vilket värde vill man att r 2 ska ha? Vad har ni fått för värde i uppgift a? Tycker ni detta värde är bra? d) Vid regression gör man vissa antaganden om residualerna. Vilka? Kontrollera dessa antaganden. Verkar antaganden vara uppfyllda i detta fall? e) Om vi tittar på djup 10.5, vad är då den genomsnittliga organiska halten? Antag istället att vi tittar på djup 25, vad är då den genomsnittliga organiska halten? Är de båda prediktionerna lämpliga att göra? Motivera. 2. Av 300 nyskördade apelsiner vägde 50 stycken mindre än 220 gram. Andelen som väger mindre än 220 gram bör vara 10 1. Testa på 5%-nivån om andelen skiljer sig från 10 1. Stat->Basic Statistics -> 1-proportion (kryssa i Use test and interval based on normal distribution under Options ) 3. Använd samma datamaterial som i laboration 1. Testa om det är någon skillnad mellan flickor och pojkars medellängd. Använd signifikansnivån 5%. Sätt upp hypoteser och beskriv även vilka antaganden som görs vid detta test. Är det rimliga antaganden?
Inför laboration 3 Innan laboration 3 ska ni ha gjort er enkätundersökning. Ni ska ha samlat in det data ni ska analysera vid laborationstillfället. För att underlätta rapportskrivandet bör ni även, i anslutning till att ni samlar in era data, beskriva datainsamlingen. Exempel på frågor ni bör resonera kring är: - Hur valde ni ut vilka ni frågade? - Är de utvalda personerna ett slumpmässigt urval ur populationen? - Stötte ni på problem när ni gjorde enkätudersökningen? - Har ni kommentarer till era enkätfrågor? Fundera även på (och skriv ner) hur ni vill analysera era data. Vilka statistiska metoder vill ni använda? Ni skulle inför laboration 1 fundera över vilka frågor ni ville besvara. Hur ska ni uttala er om dessa frågor? Kan ni utifrån dessa frågor formulera hypoteser som ni kan testa?
Laboration 3 Under laboration 3 ska ni analysera de data ni har fått från er undersökning och presentera era resultat i en rapport. Rapporten ska rikta sig till den uppdragsgivare ni tänker er att ni har haft. Rapporten bör innehålla svar på bl.a. följande frågor: - Hur valde ni ut vilka ni frågade? - Eventuella problem ni stötte på när ni gjorde enkätundersökningen? - Kommentarer till era frågor. - Vilka frågeställningar ni utgick ifrån. - En beskrivning av hur ni hade planerat att analysera resultatet. - En beskrivning av hur ni analyserade resultatet. (Gjorde ni precis som ni planerade?) - Presentation av ert resultat. (Figurer, test m.m) - Vilka slutsatser drar ni av er undersökning? - Är era slutsatser tillförlitliga? Hade ni ett slumpmässigt stickprov? Hade ni bortfall? Ni ska även ta med enkäten, i den form ni delade ut den. Använd föreläsningsanteckningarna som stöd när ni gör er undersökning. När vi bedömer era rapporter kommer vi inte att lägga så stor vikt kring exakt vilka resultat ni har fått. Vi kommer att kolla vilka saker ni har tänkt på när ni har gjort er undersökning och ge er feedback på detta. Störst vikt kommer vi att lägga på hur ni har presenterat er undersökning och era resultat. Ni bör vara tydliga i era beskrivningar samt använda ett korrekt språk och en väl genomtänkt layout. Laboration 3 ska även presenteras muntligt den 4/11. Detta är ett obligatoriskt moment i kursen. Mer om den muntliga presentationen finns i bilaga 4. Redan i anslutning till laborationstillfället bör ni fundera på vilka saker ni ska ta upp i den muntliga redovisningen. Tisdag 1/11 kl. 17.00 ska ni lämna in ett första utkast (i princip fullständig) av rapporten. Innan den muntliga redovisningen får ni feedback från handledarna. En slutlig version av laborationsrapporten ska vara inlämnad den 11/11 kl 17.00.
Bilaga 1 Datamaterial till laboration 1 Datamaterialet består av längd, vikt och kön hos nyfödda barn. Materialet är hämtat från VK. 1 betyder att det är en flicka och 0 att det är en pojke. Kön Vikt Längd 1 3085 48 0 4225 51 1 3905 52 0 3670 53 0 3560 50 0 3360 50 1 3660 50 1 4005 51 1 3670 52 0 3945 53 0 3360 50 1 3150 48 1 3500 50 1 3725 51 0 3990 52 0 4070 51 0 4435 52 0 3700 53 0 4105 54 0 2635 47 1 3860 52 1 3490 49 1 3120 47 0 3375 53 0 3570 51 1 3085 48 1 910 35 Bilaga 2 Datamaterial till laboration 2 Djup Organisk halt 1 3.53 2 7.60 3 5.08 4 10.19 5 13.08 6 16.66 7 14.64 8 18.48 9 17.95 10 24.05 11 23.05 12 23.72 13 26.16 14 23.88 15 26.28
Bilaga 3. Hjälp till några av uppgifterna. I Minitab kan man skriva in värdena på olika sätt. I figuren nedan visas två sätt. Om man har skrivit in värdena enligt kolumn C1-C3 ska man under bars represent välja values from a table. Välj sedan Cluster under rubriken Two-way-table. Om man istället har valt att skriva in värdena som i kolumn C5-C6, så ska man välja Counts of unique values. Se figurerna nedan. Bilaga 4. Muntlig redovisning Den muntliga redovisningen sker i två redovisningsgrupper. Situationen är att ni ska presentera era resultat för er uppdragsgivare och ni har endast 5 minuter på er. Ni måste därför välja ut det viktigaste ur er rapport. Att hålla en tidsbegränsning på en presentation innebär att man måste ha ett genomtänkt upplägg och vara förberedd. Alla i gruppen ska vara delaktiga i presentationen. Ni kommer inte att få mer än 5 minuter för er presentation, efter dessa 5 minuter bryter vi. Det kommer att finnas några minuter för frågor efter presentationen.