Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Relevanta dokument
Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Laboration med Minitab

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Datorövning 1: Fördelningar

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Lektionsanteckningar 11-12: Normalfördelningen

Demonstration av laboration 2, SF1901

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

MVE051/MSG Föreläsning 7

Introduktion till statistik för statsvetare

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning G60 Statistiska metoder

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

TMS136. Föreläsning 4

Introduktion och laboration : Minitab

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

Stokastiska processer med diskret tid

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Datorövning 1 Fördelningar

Datorövning 1: Fördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Obligatorisk uppgift, del 1

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

F9 SAMPLINGFÖRDELNINGAR (NCT

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

4 Diskret stokastisk variabel

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

bli bekant med summor av stokastiska variabler.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

F13 Regression och problemlösning

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

DATORÖVNING 2: SIMULERING

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Tentamen MVE301 Sannolikhet, statistik och risk

1 Sannolikhet enligt frekvenstolkningen Kast med tärning

DATORÖVNING 2: STATISTISK INFERENS.

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Föreläsning 8: Konfidensintervall

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

4.1 Grundläggande sannolikhetslära

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

LKT325/LMA521: Faktorförsök

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

TMS136. Föreläsning 7

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Lektion 1: Fördelningar och deskriptiv analys

Statistik 1 för biologer, logopeder och psykologer

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

1.1 Diskret (Sannolikhets-)fördelning

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

4. Kunna orientera sig mellan de olika fönstren

FÖRELÄSNING 8:

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Kap 3: Diskreta fördelningar

Kapitel 5 Multivariata sannolikhetsfördelningar

Stokastiska signaler. Mediesignaler

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

LABORATION 1. Syfte: Syftet med laborationen är att

STATISTISK ANALYS AV KOMPLEXA DATA

SF1911: Statistik för bioteknik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Analys av egen tidsserie

Föreläsning 7. Statistikens grunder.

Mer om slumpvariabler

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

1 Syfte. 2 Förberedelseuppgifter DATORLABORATION 1 MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-03

Transkript:

Datorövning 2 Statistisk teori med tillämpningar Simulering i SAS Syfte Att simulera data är en metod som ofta används inom forskning inom ett stort antal ämnen, exempelvis nationalekonomi, fysik, miljövetenskap eller olika samhällsvetenskapliga ämnen. Inom statistisk forskning används simulering bland annat för att utvärdera modeller och för att få fram skattningar på parametrar när det inte är möjligt att hitta en analytisk lösning. Datorövning 2 går igenom hur man kan dra slumptal från olika kända sannolikhetsfördelningar och hur man kan jämföra dessa med förväntade resultat, både numeriskt och grafiskt. Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS På olika sätt jämföra simulerade resultat med de som förväntas enligt en teoretisk modell. Exempel Likformig fördelning All slumptalsdragning i SAS sker inuti ett DATA-steg. Vi börjar med att dra ett slumptal från en likformig (uniform) fördelning. Använd PROC PRINT för att se resultatet. 1

data uni; seed=4997; /* sets the starting value for the algorithm. Use any number, e.g. the last four digits of your phone number */ x=ranuni(seed); /* draw 1 random number from U[0,1] distribution */ seed= anger ett startnummer till SAS slumptalsgenerator. Detta gör det möjligt att upprepa försök som bygger på slumptalsdragning; om man använder samma startnummer kommer man att dra samma slumptal. I nedanstående exempel och uppgifter ska varje grupp använda olika startnummer (men det går bra att använda samma startnummer till flera uppgifter). Använd exempelvis de fyra sista siffrorna i en gruppmedlems telefonnummer. x=ranuni(seed) drar ett slumptal från en likformig [0,1] - fördelning och lägger värdet i variabeln x. För att dra flera slumptal man kan givetvis upprepa flera datasteg (med olika startnummer) och sedan slå ihop dataseten, men det är inte speciellt praktiskt om man behöver så många som 100 eller 1000 olika slumptal. Då kan man istället använda sig av en DO-loop. Nedan visas ett exempel på hur man drar 10 slumptal från en U[0, 1]-fördelning. data several; seed=110202; do i=1 to 10; /*We want 10 ~ U[0,1] numbers */ x=ranuni(seed); proc print; Loopen startas genom att man skriver do, därefter står i, som är en variabel som fungerar som räknare. I det här fallet, när SAS ska dra 10 slumptal ska räknaren gå från 1 till 10. Det talar man om för SAS genom att skriva i=1 to 10. Sedan dras slumptalen på samma sätt som när bara ett värde behövdes. Därefter skriver man output för att tala om att man vill att SAS ska skriva det värde man dragit till datasetet. DO-loppen avslutas alltid med 2

. Slutligen används kommandot drop för att slänga bort de variabler som inte behövs längre, i det här fallet i och seed. Normalfördelningen För att dra slumptal från standard normalfördelningen (N(0, 1)) kan man använda kommandot rand och sedan specificera normalfördelningen och dess parametrar. Exempel: data normal; seed=4997; do i=1 to 10; x=rand('normal',0,1); På motsvarande sätt kan man generera slumptal från de flesta fördelningar genom att specifiera deras namn (eller de fyra första bokstäverna i deras namn) samt önskade parametrar. Transformationer Ibland kan man vilja dra slumptal från en fördelning som är en transformering av en slumpvariabel med en känd fördelning, exempelvis från en U[2, 5]- fördelning. Detta görs genom att dra ett slumptal från U[0, 1]-fördelningen, multiplicera med 3 och addera 2, som i nedanstående exempel. data uniform25; seed=110202; do i=1 to 10; /*We want 10 ~ U[0,1] numbers */ x=2+3*ranuni(seed); /*Theta1=2, theta2=5 */ Använd som vanligt PROC PRINT för att se resultatet och till exempel PROC UNIVARIATE för att se deskriptiv statistik och rita ett histogram. 3

Tabell över SAS-kommandon för några vanliga fördelningar Som ett alternativ till att dra slumptal med rand( fördelning,...) enligt exemplet med normalfördelningen ovan, har några fördelningar egna kommandon. Nedanstående tabell innehåller SAS-kommandon för några vanliga sannolikhetsfördelningar. Fördelning SAS-kommando parametrar binomial ranbin(seed,n,p) n, p exponential ranexp(seed) / a a = 1 β likformig ranuni(seed) θ 1 = 0, θ 2 = 1 normal rannor(seed) µ = 0, σ = 1 poisson ranpoi(seed, a) λ = a Övningar I nedanstående övningar är n = gruppens nummer. 1. Antag att n% av alla datachips som tillverkas av en viss maskin är defekta. Antag sedan att maskinen producerar n + 10 datachip per timma. Sannolikheten att ett chip är defekt är oberoende av huruvida övriga chip är defekta eller felfria (a) Skriv upp sannolikhetsmodellen för antalet felaktiga chip tillverkade under en timme. (b) Använd SAS för att simulera antalet felaktiga chip för varje timme under ett dygn (24 timmar) (c) Använd PROC MEANS för att jämföra medelvärde och varians för den simulerade datan. Jämför med de teoretiska värdena. 2. Under ett år sker i genomsnitt n trafikolyckor på en viss vägsträcka. Låt Y vara antalet trafikolyckor under ett slumpvis utvalt år. Antag att antalet olyckor är oberoende av antalet olyckor under övriga år. (a) Definiera och skriv ner en sannolikhetsmodell för Y. 4

(b) Använd SAS för att simulera antalet olyckor under 20 år (c) Jämför resultatet med de teoretiska värdena. 3. Medellivslängden för ett visst märke på batterier är 10n timmar. Låt X vara livslängden för ett slumpvis utvalt batteri. (a) Föreslå en sannolikhetsmodell för X och skriv ner den. (b) Simulera livslängden för i) 10 ii)100 och iii) 1000 batterier. Jämför simulerade medelvärden och varianser med de teoretiska. (c) Plotta din data i tre histogram. Rita kurvan för den teoretiska sannolikhetfördelningen ovanpå histogrammet. Jämför resultaten i i), ii) och iii). Vad blir slutsatsen? 5