DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

Relevanta dokument
DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

DATORÖVNING 2: STATISTISK INFERENS.

DATORÖVNING 3: EXPERIMENT MED

DATORÖVNING 2: TABELLER OCH STANDARD-

DATORÖVNING 2: BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA. STATISTISK INFERENS.

Datorövning 1 Enkel linjär regressionsanalys

DATORÖVNING 3: MER OM STATISTISK INFERENS.

DATORÖVNING 4: DISKRETA

Laboration med Minitab

Slumpmässiga urval med Minitab LWn /

Laboration 3: Urval och skattningar

Datorövning 2 Multipel regressionsanalys, del 1

Laboration 3: Urval och skattningar

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Datorövning 5 Exponentiella modeller och elasticitetssamband

TAMS28 DATORÖVNING VT1

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

En introduktion till och första övning for Excel

Datorövning 1 Introduktion till Minitab och Excel

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

*****************************************************************************

Introduktion och laboration : Minitab

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

F9 SAMPLINGFÖRDELNINGAR (NCT

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Datorlaboration 7. Simuleringsbaserade tekniker

Arbeta med normalfördelningar

Obligatorisk uppgift, del 1

Konsolfönster i Windows Momentet ingår i kursen PDA DTR1206 Lab 1 DOS Konsolfönstret

Laboration: Grunderna i Matlab

Lektionsanteckningar 11-12: Normalfördelningen

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

LABORATION 1. Syfte: Syftet med laborationen är att

Laboration 1: Introduktion till R och Deskriptiv statistik

Automatisera uppgifter med Visual Basic-makron

Vilken version av Dreamweaver använder du?

2.1 Minitab-introduktion

Statistik för Brandingenjörer. Laboration 3

FK2002- FK2004 (HT2011)

4. Kunna orientera sig mellan de olika fönstren

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

F3 Introduktion Stickprov

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Software Translator 6.1 Manual

Föreläsning G60 Statistiska metoder

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Beskrivande statistik

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Manual för Typo3 version 4.2

Denna laboration skapades för elever vid Roslagens Högskola men kan användas av vem som helst. Namnen på servrarna måste i så fall ändras.

Instruktioner för att skapa konton i MV-login

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Programsnickaren. Grunderna för hur du kommer igång och arbetar med Programsnickaren till Micro Rolltalk. Habilitering & Hjälpmedel

Vanliga frågor för VoiceXpress

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Datorövning 1 Fördelningar

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Gör så här för att rapportera:

Introduktion till Matlab

AssiML. Användarbeskrivning

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide

PROGES PLUS THERMOSCAN RF. Instruktionsmanual V

Datorövning 1 Calc i OpenOffice 1

Medicinska Bilder, TSBB31. Lab: Mätvärden på Medicinska Bilder

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Extramaterial till Matematik Y

Grupper i Studentportalen

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Excel Övning 1 ELEV: Datorkunskap Sida 1 Niklas Schilke

Introduktion till Matlab

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.

Lathund - system för tillbud och arbetsskador

Manual för din hemsida

Manual Demoväska RFID. Manual Demoväska. Sara Svensson/Monika Lindgren/Fredrik Karlsson Version BnearIT AB 1(17)

Något om sannolikheter, slumpvariabler och slumpmässiga urval

KALKYL OCH DIAGRAM. Kalkylbladet. 170 Datorkunskap Kalkyl och diagram

Laborationer i statistik för A:1, Lab 1

Laboration 2 Inferens S0005M VT18

Automatisk start. Anne-Marie Mahfouf Översättare: Stefan Asserhäll

Lab 7, 48 steg till ett bättre liv i Unix-labbet

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Instruktion för laboration 1

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

För att använda budgetmodulen öppnas Budget fönstret. Välj Avdelning Ekonomihantering Redovisning Redovisningsbudgetar

Grundkurs 2 IKT. Dan Haldin Ålands lyceum

INSTALLATION...3 ATT KOMMA IGÅNG...3 PROGRAMMETS DESIGN...4 LÄGGA TILL TABELL...4 EDITERA TABELL...4 EDITERA RELATION...5 SPARA OCH AVSLUTA...

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Transkript:

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR STICKPROVSMEDELVÄRDEN I denna datorövning ska du använda Minitab för att slumpmässigt dra ett mindre antal observationer från ett större antal, och studera hur medeltalet i ett urval kan variera från urval till urval, dvs studera sannolikhetsfördelningar för stickprovsmedelvärden. START Logga in genom att skriva in ditt user name och ditt password och välja log on to: HELIX. Klicka på OK. Starta Minitab: 1. Öppna Start-menyn.. Välj All Programs och sök upp alternativet Minitab Solutions. 3. I undermenyn för Minitab Solutions, välj alternativet Minitab 15 Statistical Software English. Se till att du kan skriva Minitab-kommandon direkt i Session-fönstret: 1. Klicka i Session-fönstret så att det blir aktivt (titelraden tänds blå).. Öppna menyn Editor och välj alternativet Enable commands. KOMMANDOT SAMPLE Du ska i denna datorövning komma igång en aning med kommandot sample, men vi ska först se hur det egentligen genereras genom att välja det från en meny. Börja med att mata in följande 10 värden i kolumn C1 (ett värde per rad): 0, 0, 1, 3, 4, 4, 5, 7, 7, 8 Dessa data utgör för tillfället en minipopulation. Du ska nu slumpmässigt dra två observationer bland dessa. Öppna menyn Calc, välj undermenyn Random data och i denna alternativet Sample from Columns 1

I fältet Number of rows to sample: ska du skriva in det antal observationer du vill ha, dvs. I nästa fält ska du välja den kolumn från vilken observationerna skall dras. Här väljer du C1. Slutligen ska du i fältet Store samples in: skriva in en ny kolumn. Välj här C. Till att börja med ska du göra urval utan återläggning, så låt rutan Sample with replacement förbli omarkerad. Klicka på OK. Observera nu vad du fick för resultat i kolumn C (i Worksheet-fönstret). Verkar det stämma att dessa två värden har erhållits genom urval utan återläggning från C1? Titta nu i Session-fönstret. Har du gjort rätt skall det där ha skrivits ut MTB > Sample C1 C. Detta är Minitabs kommandosekvens för det du just har gjort. Ge nu följande kommando MTB > Sample C1 C (Avsluta med Enter.) I C har du förmodligen fått två nya värden (men det finns en liten chans att det blir samma värden). Du har nu utfört samma procedur som tidigare men med användning av kommandon. Fortsätt nu genom att ge kommandon att göra urval om 3, 4, 5, 8 resp. 10 observationer från C1. Fundera också i varje fall på hur många sätt man kan göra urvalet på. Gå tillbaka till meny-alternativet, dvs Calc>Random data>sample from Columns Fyll i samma antal och kolumner som tidigare, men välj denna gång att kryssa i rutan Sample with replacement (urval med återläggning). Klicka på OK.

Studera vad du får i C och titta sedan vad du har fått i Session-fönstret. Det senare bör ha blivit: MTB > Sample C1 C; SUBC> Replace. Efter det första kommandot har ett semikolon (;) skrivits ut. Det betyder att man skall lägga till ett underkommando, som i detta fall heter "Replace". Efter Replace finns en punkt, som avslutar kommandot och får prompten MTB > att skrivas ut igen. Observera också att det blir en annan prompt ( SUBC> ) där underkommandot (Subcommand) ska skrivas in. Pröva nu att göra urval med återläggning om 3, 4, 5, 8 resp. 10 observationer. Fundera även här över hur många sätt var och en av dessa kan göras på. Gör nu 10 urval utan återläggning om observationer från C1 och spara dessa i kolumnerna C- C11. Beräkna sedan medeltalet i varje sådan kolumn. Detta kan enkelt göras med kommandon. Skriv t ex mean C för att beräkna medeltalet i kolumn C. Lagra medeltalen successivt i kolumnen C1 med följande kommandostruktur: let c1(1)=mean(c) let c1()=mean(c3)... let c1(10)=mean(c11) dvs ge dessa kommandon ett i taget. Du har sedan de 10 medeltalen lagrade i C1. Beräkna nu medeltalet av kolumn C1 genom att ge kommandot mean c1. Jämför detta med medeltalet av kolumnen C1. Bör dessa stämma någorlunda överens? Gör även ett histogram (Graph> Histogram) över värdena i C1. Vad visar egentligen detta histogram? Gör nu om ovanstående men gör urvalen med återläggning istället. Använd dock andra kolumner till detta så att du kan jämföra med ovanstående. Upptäcker du några skillnader mellan histogrammen? Vad kan sådana skillnader i så fall bero på? URVALSFÖRDELNINGAR Antag att vi skulle vilja se hur stickprovsmedelvärdet kan variera när man gör ett urval utan resp. med återläggning av två observationer från de 10 i minipopulationen. Vi kan då förstås använda kommandot sample så många gånger som krävs för att skapa alla möjliga urval av två observationer. Det blir dock ganska många. För urval utan återläggning blir det 10 9/=45 stycken och för urval med återläggning 10 10=100 stycken 3

Visst kan vi göra 45 körningar med kommandot sample, men vi kan ju inte vara säkra på att vi får de 45 unika kombinationerna, utan en tidigare kombination kan mycket väl dyka upp igen. Vidare kommer det att bli ganska jobbigt att beräkna och organisera medeltalen från varje urval. För att lösa den här typen av problem krävs att vi skriver någon form av program (ett makro) som gör det hela mer automatiskt åt oss. På kurshemsidan kan du hämta fyra olika filer som har namnen sampling.mac, sampling3.mac, sampling_wr.mac resp. sampling3_wr.mac. Dessa filer är globala Minitab-makron. I dessa makron har Minitab-kommandon och en del programmeringstekniska kommandon kombinerats för att skapa just den typ av automatiserad kommandogivning som vi har sett exempel på behov av här. Kopiera dessa filer till din hemkatalog. Kopiera dock inte till någon underkatalog på er hemarea, för då kommer inte Minitab att hitta dem. Filen sampling.mac skapar samtliga urval utan återläggning av två observationer ur C1 och beräknar medeltalen i dessa. Medeltalen lagras i C (tidigare värden i C kommer att raderas), men däremot sparas inte själva urvalen i några kolumner. Det behövs ju egentligen inte. Kör makrot med MTB > %sampling Du kommer då att se att alla medelvärden lagras i kolumn C. Gör därefter ett histogram över dessa värden och beräkna också medeltalet för dem. Jämför det senare med medeltalet i C1. Vad skulle man kunna säga att histogrammet är en bra bild av? Beräkna vidare variansen för värdena i C. Detta kräver litet trixande. Minitab har ett kommando stdev som beräknar standardavvikelsen med n-1 i nämnaren. Du ska använda kommandot, men naturligtvis justera det. För att beräkna variansen med n i nämnaren ger du följande kommandon: MTB > let k=((stdev(c))**)*(44/45) MTB > print k Variansen sparas alltså i konstanten K, som sedan skrivs ut. Om du granskar kommandot ser du att du först beräknar standardavvikelsen (med n-1). Denna kvadreras sedan, vilket sker med uttrycket "**" (** betyder just "upphöjt till"). När standardavvikelsen är kvadrerad justeras den genom att multiplicera med 44 (som ju är n 1 i detta fall) och sedan dividera med 45 (som ju är n). Parenteserna behövs för att inte beräkningarna ska göras i fel ordning. Beräkna nu också variansen för värdena i C1 (minipopulationen). Med samma teknik som ovan kan du göra det med kommandona MTB > let k3=((stdev(c1))**)*(9/10) MTB > print k3 Observera bytet av 44/45 mot 9/10. Vi har ju n=10 för denna kolumn. 4

Jämför nu värdet på K med värdet på K3, dvs variansen i C med variansen i C1. Det går att visa att följande gäller: om σ =variansen i minipopulationen skall variansen i fördelningen för stickprovsmedelvärdena (låt oss kalla dem x ) bli σ x σ = n N n σ = N 1 10 10 1 Verkar detta stämma med de värden du har fått fram? UPPGIFT 1 Filen sampling_wr.mac gör motsvarande som filen sampling.mac men med återläggning. Den anropas med kommandot %sampling_wr. Filerna sampling3.mac och sampling3_wr.mac gör motsvarande som ovanstående filer, men med den skillnaden att här dras 3 observationer istället för två. Uppgiften är att enligt beskrivningen ovan ta fram sannolikhetsfördelningarna för stickprovsmedelvärdena i dessa tre fall, dvs genom att använda dessa tre filer på lämpligt sätt. Filerna är förprogrammerade till att ge medelvärden enligt: sampling3.mac: sampling_wr.mac: sampling3_wr.mac: medelvärden i C3 medelvärden i C4 medelvärden i C5 Följande ska i vart och ett av de tre fallen tas fram: Ett histogram över sannolikhetsfördelningen hos stickprovsmedelvärdet. Beräknade medeltal och varianser för stickprovsmedelvärdet. Jämförelse mellan variansen i fördelningen över stickprovsmedelvärdena och variansen hos populationen (se formel överst på denna sida). Det totala antalet möjliga urval. Försök också ange en formel för att beräkna detta. UPPGIFT I denna uppgift ska du försöka förstå uppbyggnaden hos de makron du använt. T ex ser makrot sampling ut så här: 5

GMACRO sampling erase k1 k0 k k3 k4 k5 c let k0=n(c1) let k1=0 let k4=k0-1 do k=1:k4 let k5=k+1 do k3=k5:k0 let k1=k1+1 let c(k1)=(c1(k)+c1(k3))/ enddo enddo ENDMACRO Gå igenom detta makro steg för steg och försök förstå vad som sker i de olika stegen. Alla Minitab-specifika ord kan du få hjälp med att förstå genom att i Session-fönstret använda kommandot help. Om du t ex undrar vad ordet erase innebär skriver du: MTB > help erase Minitabs hjälpfönster öppnas då och det bör gå att förstå vad som sägs där. Gå igenom makrot sampling3_wr på samma sätt. Avsluta alla program och logga ut. 6