Laboration 3: Urval och skattningar

Relevanta dokument
Laboration 3: Urval och skattningar

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Föreläsning G60 Statistiska metoder

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Slumpmässiga urval med Minitab LWn /

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Urvalsmetoder: Stratifierat urval (kap 9.5)

Laboration 3 Inferens fo r andelar och korstabeller

Introduktion till statistik för statsvetare

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Föreläsning G70 Statistik A

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

F9 SAMPLINGFÖRDELNINGAR (NCT

Laboration 2 Inferens S0005M VT18

Föreläsning G60 Statistiska metoder

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Lektionsanteckningar 11-12: Normalfördelningen

Laboration med Minitab

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Inferensstatistik. Hypostesprövning - Signifikanstest

Tidigare exempel. Några beteckningar. Stratifierat urval

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Föreläsning 1: Introduktion. Vad är statistik?

Läs noggrant informationen nedan innan du börjar skriva tentamen

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Handledning för konstruktion av tabeller och diagram med Excel

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

732G01/732G40 Grundläggande statistik (7.5hp)

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

*****************************************************************************

LABORATION 1. Syfte: Syftet med laborationen är att

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamen: Vetenskapliga perspektiv på studie- och yrkesvägledning, 7,5hp distans (D1) & campus (T1), ht12

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Statistik 1 för biologer, logopeder och psykologer

OBS! Vi har nya rutiner.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Att göra före det schemalagda labpasset.

Att välja statistisk metod

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

DATORÖVNING 2: STATISTISK INFERENS.

, s a. , s b. personer från Alingsås och n b

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Intro till SPSS Kimmo Sorjonen (0811)

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Mata in data i Excel och bearbeta i SPSS

Laboration 2 Inferens S0005M VT16

Kommun och landsting 2016

Bearbetning och Presentation

Läs noggrant informationen nedan innan du börjar skriva tentamen

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Studietyper, inferens och konfidensintervall

Datorlaboration 2 Konfidensintervall & hypotesprövning

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Samplingfördelningar 1

Examinationsuppgift 2014

Kvantitativ metod. Föreläsning Kristin Wiksell

FACIT (korrekta svar i röd fetstil)

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Statistik 1 för biologer, logopeder och psykologer

Marknadsinformationsmetodik Inlämningsuppgift

Föreläsning G60 Statistiska metoder

Marknadsinformationsmetodik Inlämningsuppgift

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Datoro vning 1-2 Statistisk analys av kodade svar

Richard Öhrvall, 1

Statistisk undersökningsmetodik (Pol. kand.)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Exempel i stickprovsteori

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Föreläsning G60 Statistiska metoder

Teknisk Rapport En beskrivning av genomförande och metoder

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Mobiltelefoner, datorer, läsplattor och andra kommunikationsmedel får inte användas.

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

OBS! Vi har nya rutiner.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Hur skriver man statistikavsnittet i en ansökan?

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Statistiska undersökningar

Transkript:

S0004M Statistik 1 Undersökningsmetodik. Laboration 3: Urval och skattningar Denna laboration handlar om slumpmässiga urval. Dessa urval ska användas för att uppskatta egenskaper hos en population. Statistiska programvaran Minitab kommer att användas. Den stora svårigheten vid urval är att det skall bli slumpmässigt och representativt för populationen. Det är oftast den praktiska situationen vid insamling av data som är den kritiska (t.ex att det är frivilligt att svara på frågor) vilket gör att det lätt skapas bias. Resultaten av alla uppgifter nedan tillsammans med efterfrågade kommentarer ska sammanställas i en kort skriftlig rapport. Lämna in rapporten (som en Gruppinlämning, med högst 3 studenter per labgrupp) i Canvas senast två veckor efter laborationstillfället. Rapporten ska vara kortfattad och bestå av: Titelblad med en beskrivande rubrik, namn på alla gruppmedlemmar, kurs, kurskod och datum. Inledning/Syfte några meningar om vad laborationen handlar om, vad som undersöks/studeras. Resultat som efterfrågas med kommentarer/diskussion. Sammanfattning vad är de viktigaste resultaten? Eventuella bilagor. Förberedelser: Kap. 3.1 3.4 i Moore samt Föreläsning 10 (repetera även 9). Påminn dig om hur vi har använt Minitab i tidigare laborationer. Läs igenom laborationens uppgiftsspecifikationer och Minitab tipsen som finns längst bak i detta dokument. Datamaterialet till Laboration 3 som skall användas hittar du i Canvas. Filen är i Excel format, vilket i Minitab läses in genom att i Open worksheet ändra filformat till Excel. 1

2

Uppgifter: Tänk dig att du ska intervjua ett antal individer i en population. Det enklaste slumpmässiga urvalet är ett så kallat obundet slumpmässigt urval (OSU), (eng: simple random sample (SRS)). För att välja ut personerna måste du ha en urvalsram, dvs. en förteckning över populationens individer och dessutom information om hur de kan nås adresser, telefonnummer eller annan kontaktväg. En sådan (fiktiv) urvalsram för en population på 3018 individer har konstruerats och ligger i Canvas. Den innehåller en numrerad lista över populationens individer med fiktiva data: Ordningsnummer För och efternamn Kön Åsikter om användning av kosttillskott (p=positiv, n=negativ, o=osäker) Hur mycket de kan tänka sig att betala för en ny musiktjänst till mobiltelefonen (kr/mån) Vilopuls 1. Obundet slumpmässigt urval a. Utgå från informationen i urvalsramen och ange vilken datatyp (skalnivå) som inryms i variablerna kön, kosttillskott, vilopuls och musiktjänst. Välj mellan Nominalskala, Ordinalskala, Intervallskala eller Kvotskala. Motivera dina val. b. Gör ett urval (OSU) av 130 individer ur urvalsramen: med hjälp av slumpgeneratorn i Minitab (se Minitabtips i slutet av detta dokument). Välj variablerna nr, kön, kosttillskott, musiktjänst och vilopuls eller alla. Redovisa ditt urval som en bilaga i rapporten. c. Använd Minitab för att sammanställa uppgifter om kön, åsikt om kosttillskott, betalning för musiktjänst och vilopuls för alla individer i urvalet, (t ex med tabeller och lämpliga grafer). d. Ange andelen i stickprovet som är positiva till kosttillskott. Validera resultatet genom att göra motsvarande för hela populationen och jämföra resultatet. e. Finns det samband mellan kön och åsikt om kosttillskott? Gör ett diagram (alt. korstabell) för stickprovet som visar på sambandet. (Använd Graph/Bar Chart alt. Stat/Tables/Cross Tabulation ). Validera resultatet, dvs jämför med motsvarande resultat för hela populationen. 3

2. Stratifierat urval Ett alternativ till OSU kan vara ett så kallat stratifierat urval. Det grundar sig på att populationen delas in i strata (latin för ʺskiktʺ) som är homogena med avseende på den variabel man studerar. Det viktigaste argumentet för stratifiering är att reducera urvalsfel. Stratifiering kan också minska konstnaden för datainsamling och förbättra precisionen. Indelningen i strata kräver dock både bakgrundsinformation och mer arbete i förväg. Antag att det finns anledning att tro att åsikten om kosttillskott skiljer sig mellan könen. Då är det lämpligt att göra separata stickprov i de två grupperna män och kvinnor. I detta fall är det 835 kvinnor och 2183 män i populationen. a. Antag att vi skall välja ut totalt 130 personer. Bestäm hur många kvinnor och män som ska väljas ut från de två undergrupperna. En enkel princip är att välja stickprovstorlekar i förhållande till undergruppernas storlekar i populationen. Använd slumpgeneratorn i Minitab för att göra ett urval med 130 personer där andelarna av män respektive kvinnor är lika som andelarna i hela populationen. Redovisa ditt urval som en bilaga i rapporten. (Ett tips är att först dela upp hela urvalsramen i två olika grupper genom att använda Data/Split Worksheet i Minitab). b. Räkna ut andelen i stickprovet som är positiva till kosttillskott. Beräkna även andelen positiva i stickprovet uppdelat på kön (dvs. för män respektive kvinnor). Validera dessa tre stickprovsberäknade skattningar genom att jämföra med hela populationens andelar. c. Vad är vilopulsen i det stratifierade urvalet? Besvara frågan med att ange medelvärdet i stickprovet och även uppdelat på kön. Jämför med medelvärde av populationens vilopuls samt motsvarande resultat i urvalet med OSU i föregående uppgift. 3. Stickprovsstorlekens betydelse för skattningen av populationens egenskaper För att beskriva en populations egenskaper är det viktigt att använda bra mätinstrument, som enkäter eller telefonintervjuer etc. Frågorna ska formuleras så att de inte kan tolkas olika vid olika tillfällen (tydliga i tid och rum) och där de fasta 4

svarsalternativen är uttömmande och ömsesidigt uteslutande. Frågorna är de variabler som används för att beskriva populationens egenskaper och ska helst ge en bra bild av populationens egenskaper trots att man inte har data från hela populationen utan bara från en mindre grupp. Resultaten från stickproven kallas i statistiksammanhang ofta för skattningar eller punktskattningar ( estimates ). Hur fungerar dessa i jämförelse med populationens resultat? I vilken grad kan man lita på att resultatet från ett urval beskriver populationsegenskapen i fråga? Sådana frågor besvaras genom att studera hur metoden uppför sig, eller med andra ord, metodens urvalsfördelning. Vi skall i denna del undersöka hur stickprovsmedelvärdet kan användas för att skatta medelvärdet hos en hel population. Vi tänker oss att vi gjort fem olika stickprov på vid olika tillfällen ur samma population och ska se hur resultaten varierar beroende på stickprovens storlek. a. Gör fem nya urval ur urvalsramen (OSU, ej stratifierat). Varje urval skall omfatta 7 individer. Beräkna för vart och ett av de fem stickproven/urvalen stickprovsmedelvärdet för vilopulsen. b. Jämför de fem ovanstående stickprovsmedelvärdena med hela populationens medelvärde och beräkna även spridningen bland de fem stickprovsmedelvärdena i form av en standardavvikelse. (Dvs sätt in de fem värdena i formeln för stickprovsstandardavvikelsen.) c. Gör om a b) men låt nu vart och ett av de fem urvalen innehålla 70 individer. d. Gör om a b) men låt nu vart och ett av de fem urvalen innehålla 350 individer. e. Sammanfatta era resultat, gärna med tydliga diagram (Minitab tips: Graph/Individual Value Plot), och besvara frågan hur stickprovens storlek påverkar: i) spridningen bland stickprovsmedelvärdena, ii) hur väl ett stickprovsmedelvärde kan användas till att skatta hela populationens medelvärde. 5

Minitab tips Så här gör du ett OSU (SRS) ur en population Gå till menyn Calc/Random Data/Sample From Columns. Då ska du få nedanstående fönster (första på nästa sida). I Number of rows to sample så anger du värdet på n. I rutan From columns anger du den population du ska göra urvalet ur. I rutan Store samples in anger du de kolumner som urvalet ska sparas i. Klicka sedan på OK. Hint: Man kan alltid prova på innan man börjar använda. Alltså skapa t.ex. en kolumn Heltal som har värde 1, 2, 3,, 10 och slumpa fyra tal m.h.a. den här menyn. Sedan skapa tre påhittade kolumner (blanda gärna kvantitativa och kvalitativa variabler) och testa att slumpa då. Observera att du kan lägga flera kolumner i rutan From columns i fönstret nedan.) Att dela upp kalkylbladet i delmaterial (split worksheet) Gå till menyn Data/Split Worksheet. I rutan By variables: ska du ange den variabel (OBS! Vanligtvis en kategorisk variabel) du vill göra uppdelningen efter genom att välja från variablerna i den vänstra kolumnen. Alternativt: Data/Unstack columns. Under subscripts ska stratifieringsvariabeln stå. Välj att spara data efter sista kolumnen som används istället för i ett nytt worksheet. Se nedan. 6

7