1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Relevanta dokument
Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Demonstration av laboration 2, SF1901

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Obligatorisk uppgift, del 1

Samplingfördelningar 1

Lektionsanteckningar 11-12: Normalfördelningen

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

DATORÖVNING 2: STATISTISK INFERENS.

TMS136. Föreläsning 4

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

4. Kunna orientera sig mellan de olika fönstren

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Monte Carlo-metoder. Bild från Monte Carlo

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Datorövning 1: Fördelningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration med Minitab

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

F9 SAMPLINGFÖRDELNINGAR (NCT

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

FÖRELÄSNING 7:

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Introduktion och laboration : Minitab

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Lektion 1: Fördelningar och deskriptiv analys

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

bli bekant med summor av stokastiska variabler.

SF1901 Sannolikhetsteori och statistik: HT 2014 Lab 1 för CSAMHS, CINEKI, och CL

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Datorövning 1 Fördelningar

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

7.3.3 Nonparametric Mann-Whitney test

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Följande resultat erhålls (enhet: 1000psi):

Laboration 1: Introduktion till R och Deskriptiv statistik

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

LABORATION 1. Syfte: Syftet med laborationen är att

Datorövning 1: Fördelningar

Föreläsning G60 Statistiska metoder

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

F9 Konfidensintervall

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Normalfördelning. Modeller Vi har alla stött på modeller i olika sammanhang. Ex:

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Thomas Önskog 28/

Föreläsning 12: Repetition

MVE051/MSG Föreläsning 7

Grundläggande matematisk statistik

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

, s a. , s b. personer från Alingsås och n b

1 Sannolikhet enligt frekvenstolkningen Kast med tärning

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Studietyper, inferens och konfidensintervall

DATORÖVNING 2: SIMULERING

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Projekt 1: Om fördelningar och risker

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

(x) = F X. och kvantiler

Gamla tentauppgifter i kursen Statistik och sannolikhetslära (LMA120)

TMS136. Föreläsning 7

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

FACIT (korrekta svar i röd fetstil)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Laboration 3: Parameterskattning och Fördelningsanpassning

TAMS65 - Föreläsning 12 Test av fördelning

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

JavaScript Block Editor:

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Laboration 2 Inferens S0005M VT18

TAMS65 - Föreläsning 8 Test av fördelning χ 2 -test

1 Föreläsning V; Kontinuerlig förd.

Transkript:

Datorövning 2 Statistikens Grunder 2 Syfte 1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen Exempel Beräkna kon densintervall och täckningsgrad Vi börjar med att skapa 100 stickprov med 100 observationer i varje stickprov. Dessa observationer är slumptal som kommer från en likformig fördelning mellan 0 och 1. Vi gör det med koden: data work.random; do sample=1 to 100; do obs=1 to 100; x=ranuni(801120); if 0<= x <0.1 then nummer=1; if 0.1<= x <=1 then nummer=0; output; Vi kallar data-setet "work.random". Vi vill ha 100 stickprov ("sample") och 100 observationer ("obs"). Variabeln med slumptal kallar vi "x". Talet inom parantesen anger fröet (seed). Det behövs alltid ett frö för att generera slumptal, så att algoritmen har en startpunkt. Jag har använt mitt födelsenummer som frö och jag vill att ni ska använda ert födelsenummer som frö. Eftersom samma frö ger exakt samma slumptal, är det intressantare om alla får olika slumptal. Därefter skapar vi en variabel som heter "nummer" och som får värdet 1 om slumptalet ligger mellan 0 och 0.1, och värdet 0 för övrigt. Detta gör att variablen "nummer" kan ses som en observation från en population där = 0:1. Eftersom vi har två "do-" kommandon måste vi ha två "end". Nu vill vi beräkna medelvärdet av variabeln "nummer" i varje stickprov och dessutom göra ett kon densintervall. Vi skriver proc means data=work.random CLM mean alpha=0.05; output out=work.intervals LCLM=lower UCLM=upper; var nummer; by sample; run 1

Vi anger "CLM ", "mean" och "alpha=0.05 " för att SAS ska räkna ut ett 95%- igt kon densintervall och ett medelvärde för variabeln "nummer". Vi vill att SAS ska göra detta för varje stickprov, så vi skriver "by=sample". Vi speci cerar att vi vill spara nedre klassgränsen som "lower" och övre klassgränsen som "upper" i data-setet "work.intervals". Vi kommer nu att få 100 kon densintervall. Vi vet att populationsproportionen är 0.1 och vill därför att kon densintervallen täcker 0.1. Vi undersöker hur många av intervallen som täcker 0.1 med koden data work.intervals; set work.intervals; if lower<= 0.1 and upper =>0.1 then coverage=1; else coverage=0; Genom att använda "data...set..." kan man modi era variabler som man har i sitt data-set. Här bildar vi en ny variabel, som heter "coverage" (täckning), genom att använda oss av de be ntliga variablerna "lower" och "upper". Vi vill att variabeln "coverage" ska anta värdet 1 om intervallet täcker 0.1 och 0 annars. Nu vill vi räkna hur många av intervallen som täckte 0.1. Vi skriver proc freq data=work.intervals; tables coverage; Hur många intervall förväntas täcka 0.1? Rita en exponentialfördelning Vi vill nu rita en täthetsfunktion för en exponentialfördelning med parameter = 1. Vi gör på samma sätt som vi gjorde på Datorövning 2, Statistikens Grunder 1, när vi presenterade binomial- och normalfördelningen gra skt. data work.exp; do x = 0 to 15 by 0.05; pdf = pdf('expo',x,1); output work.exp; proc print; Med koden ovan skapar vi en variabel som går från 0 till 15 med stegen 0:05. Därefter talar vi om att vi vill beräkna värdet på täthetsfunktionen för varje x-värde. Efter "output" anger vi att vi vill spara dessa funktionsvärden i datasetet "work.exp". För att illustrera fördelningen använder vi koden proc gplot data=work.exp; plot pdf*x; 2

Vilket ger grafen pdf 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 som visar hur en exponentialfördelning med parameter = 1 ser ut. Illustrera centrala gränsvärdessatsen Vi vill nu skapa slumptal som kommer från en exponentialfördelning med parameter = 1. Med koden nedan skapar vi 1000 stickprov med 10 observationer i varje stickprov. data work.randomexp; do sample = 1 to 1000; do obs = 1 to 10; x = ranexp(801120)/1; output; Variabeln "x" ska innehålla alla våra värden. Vi skriver "ranexp" för att tala om att vi vill ha slumptal, "random numbers", från exponentialfördelningen. Talet inom parantesen anger återigen fröet (seed). Kommandot "/1 " talar om att parameterns värde är 1. Vi skriver "output" för att vi vill spara datat. Eftersom vi har två "do-" kommandon måste vi ha två "end". Vi ska nu beräkna medelvärde för varje stickprov. Vi kommer alltså få 1000 medelvärden. Vi skriver koden: proc means data=work.randomexp mean ; output out=work.exponential_means mean=xbar ; var x; by sample; x 3

Vi använder data-setet "work.randomexp". Vi beräknar endast medelvärden med "proc means". Vi vill spara dessa medelvärden i "work.exponential_means" och vi döper variabeln till "xbar" (x). Eftersom våra slumptal ligger i variabeln "x" skriver vi "var x". Vi skriver "by sample" för att vi vill beräkna ett medelvärde för varje stickprov. Vi ska nu standardisera medelvärdena. Vi gör det genom att tillämpa Z = X = p N(0; 1): n Om täthetsfunktionen för exponentialfördelningen ser ut så här f(x) = 1 e x för alla x 0 f(x) = 0 för alla x < 0 är = och 2 = 2 : I vårt fall ger det att = 1 och 2 = = 1. Vi skriver koden data work.exponential_means; set work.exponential_means; z = (xbar 1)/(1/sqrt(10)); Vi använder återigen "data...set..." för att modi era variabeln i data-setet. Vi vill nu de niera en variabel "z", som ska vara standard normalfördelad. Vi tittar på data-setet med "proc print". Nu är det dags att rita ett histogram för vår variabel "z". Vi skriver koden: proc univariate data=exponential_means; histogram z; Och får diagrammet 25 20 Percent 15 10 5 0 2.25 1.75 1.25 0.75 0.25 0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75 4.25 z Ser det ut som en standard normalfördelning? 4

Uppgifter Basuppgifter 1. Gör om exempel "Beräkna kon densintervall och täckningsgrad" och använd ett annat slumptalsfrö samt ändra antalet stickprov till 1000. Hur många kon densintervall innehåller 0.1? 2. Rita en exponentialfördelning med valfritt. 3. Använd koden i exemplet "illustrera centrala gränsvärdessatsen". Ändra stickprovsstorleken så att ni ser att fördelningen konvergerar mot standardnormalfördelningen. Vilken variabel är det som behöver bli större, "obs" eller "sample"? 5