Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Relevanta dokument
Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Laboration 2: Sannolikhetsteori och simulering

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 2: Sannolikhetsteori och simulering

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Datorövning 1: Fördelningar

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

bli bekant med summor av stokastiska variabler.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Datorövning 1 Fördelningar

Datorövning 1: Fördelningar

Laboration 4: Intervallskattning och hypotesprövning

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

SF1901 Sannolikhetsteori och statistik I

Laboration 4: Hypotesprövning och styrkefunktion

Föreläsning 3, Matematisk statistik Π + E

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Demonstration av laboration 2, SF1901

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

SF1901 Sannolikhetsteori och statistik: HT 2014 Lab 1 för CSAMHS, CINEKI, och CL

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Laboration 3: Parameterskattning och Fördelningsanpassning

1 Syfte. 2 Förberedelseuppgifter DATORLABORATION 1 MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-03

TMS136. Föreläsning 4

Projekt 1: Om fördelningar och risker

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Föreläsning 4, Matematisk statistik för M

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

SF1901 Sannolikhetsteori och statistik I

Datorövning 1 Introduktion till Matlab Fördelningar

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Laboration 2: Sannolikhetsteori och simulering

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik för B, K, N, BME och Kemister

KURSPROGRAM HT-10 MATEMATISK STATISTIK AK FÖR CDI, FMS 012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

4 Diskret stokastisk variabel

Avd. Matematisk statistik

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Laboration 2: Styrkefunktion samt Regression

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDI, FMS012, HT09

SF1911: Statistik för bioteknik

3. Vad är ett prediktionsintervall och hur räknas det ut? 4. Vad är ett kalibreringsintervall och hur kan det konstrueras?

Stapeldiagram. Stolpdiagram

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

SF1910 Tillämpad statistik, HT 2016 Laboration 1 för CSAMHS, CLGYM-TEMI

Mer om slumpvariabler

Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

3. Vad är ett prediktionsintervall och hur räknas det ut? 4. Vad är ett kalibreringsintervall och hur kan det konstrueras?

SF1920/SF1921 Sannolikhetsteori och statistik, VT 2018 Laboration 1 för CELTE2/CMATD3

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Laboration 5: Intervallskattning och hypotesprövning

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

SF1901: Sannolikhetslära och statistik

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I

1 Förberedelser. 2 Teoretisk härledning av värmeförlust LABORATION 4: VÄRMEKRAFTVERK MATEMATISK STATISTIK AK, MAS 101:A, VT-01

Introduktion och laboration : Minitab

Föreläsning 7. Statistikens grunder.

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

SF1901 Sannolikhetsteori och statistik, VT 2017 Datorlaboration 1 för CELTE2, CTFYS2

Datorövning 2 med Maple, vt

Laboration 4: Intervallskattning och hypotesprövning

Laboration 1: Mer om Matlab samt Deskriptiv statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

SF1901: Sannolikhetslära och statistik

0 om x < 0, F X (x) = c x. 1 om x 2.

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Laboration 1: Introduktion till R och Deskriptiv statistik

Transkript:

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 1 MATEMATISK STATISTIK AK FÖR CDIFYSIKER, FMS012/MASB03, HT12 Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys Syftet med den här laborationen är att du skall bli mer förtrogen med några grundläggande områden inom matematisk statistik nämligen Betingade sannolikheter Stokastiska variabler och deras fördelningar. Simulering Dataanalys Vidare skall du lära dig lite om hur man kan använda Statistics toolbox i MATLAB. 1 Förberedelseuppgifter Som förberedelse till laborationen bör du läsa igenom Kapitel 3 och 8 samt hela laborationshandledningen. Repetera dessutom det som sades om normalfördelningsplot på föreläsning 3. Till laborationens start har du med dig lösningar till uppgifterna a) g), dessa kan komma att samlas in av handledaren. Observera att godkända uppgifter är ett krav för att bli godkänd på laborationen. a) Definiera den betingade sannolikheten för A givet B. (Behövs till avsnitt 4.2). b) Definiera följande funktioner: fördelningsfunktion, täthetsfunktion och sannolikhetsfunktion. Redogör för sambanden mellan dem. (Behövs till avsnitt 3). c) Ange täthetsfunktionerna för normalfördelning, Rayleighfördelning. Hur ser sannolikhetsfunktionen ut för en binomialfördelning? (Behövs till avsnitt 2). d) Definiera -kvantilen för en kontinuerlig s.v. X. (Behövs till avsnitt 2.5). e) Den stokastiska variabeln X har täthetsfunktionen f X (x) = x/2 för 0 x 2. Bestäm P(1 X 2). (Behövs till avsnitt 2). f) Låt X vara en diskret stokastisk variabel med sannolikhetsfunktion p X (k) = 0.6 0.4 k, k = 0, 1, 2... Bestäm P(1 X < 4). (Uppvärmning till avsnitt 2). g) Antag att du har tillgång till rektangelfördelade slumptal på intervallet (0, 1). Hur kan du med hjälp av inversmetoden generera slumptal från en exponentialfördelning med parameter Ð? (Behövs till avsnitt 3).

2 Laboration 1, Matstat AK för CDIfysiker, HT12 2 Introduktion till Statistics toolbox Här skall vi titta lite på vad man kan använda Statistics toolbox i MATLAB till. Statistics toolbox är ett programpaket till MATLAB som innehåller funktioner som är användbara inom statistikområdet. Om du skriver ÐÔ Ø Ø i Matlabs kommandofönster så skrivs en lista ut på skärmen innehållande alla de funktioner som programpaketet innehåller. I den här laborationen kommer vi främst att vara intresserade av funktionerna... Ô,...,... ÒÚ och... ÖÒ. För några fördelningarna har vi alltså följande funktioner (x) slumptal Normalförd. X N (Ñ, ) normpdf(x,ñ, ) normcdf(x,ñ, ) norminv(x,ñ, ) normrnd(ñ,,r,c) Exponentialförd. X Exp(Ð) exppdf(x,1/ð) expcdf(x,1/ð, ) expinv(x,1/ð) exprnd(1/ð,r,c) Binomialförd. X Bin(n, p) binopdf(k,n,p) binocdf(x,n,p) binoinv(x,n,p) binornd(n,p,r,c) Fördelning f X (x) eller p X (k) F X (x) F 1 X Om man sedan är intresserad av att se hur någon av funktionerna fungerar skriver du bara ÐÔ ÙÒ Ø ÓÒ Ò ÑÒ T.ex., du är intresserad av vad funktionen ÒÓÖÑ gör. Skriv ÐÔ ÒÓÖÑ Här nedan följer ett antal enkla uppgifter som ni skall lösa med hjälp av MATLAB. Kom ihåg att använda funktionen ÐÔ flitigt! 1. Beräkna P(X 5) då X är a) Normalfördelad med Ñ = 2, = 3, b) Exponentialfördelad med Ð = 1/3 2. Beräkna P(X > 57) då X Bin(200, 0.3). 3. Beräkna P(50 < X 90) då a) X N (100, 40), b) X Bin(200, 0.3). 4. Plotta täthetsfunktionen och fördelningsfunktionen för X N (3, 2). 5. Använd kommandot ÒÓÖÑ ÒÚ för att finna 5 %, 10 %, 25 %, 50 %, 75 % och 99 %-kvantilerna för X N (50, 10).

Laboration 1, Matstat AK för CDIfysiker, HT12 3 3 Simulering Det vanligaste sättet att simulera stokastiska variabler med en given fördelningsfunktion är att utgå från slumptal som är rektangelfördelade på (0, 1) och sedan transformera dem på lämpligt sätt. Vi skall i det följande koncentrera oss på simulering av kontinuerliga stokastiska variabler. Antag att vi vill simulera variabler med fördelningsfunktionen F(x) och att F(x) är inverterbar. Kalla inversen F 1 (x) och låt U vara en R(0,1)-fördelad stokastisk variabel. Om vi sätter X = F 1 (U ) visar räkningen P{X x} = P{F 1 (U ) x} = P{F(F 1 (U )) F(x)} = P{U F(x)} = F(x) att X har fördelningsfunktionen F. Observera att det är väsentligt att F(x) är växande för att räkningen ovan skall vara korrekt, och det är ju också fallet ty F(x) är en fördelningsfunktion. 6. Nu skall vi generera exponentialfördelade slumptal med parametern Ð, X Exp(Ð). Hur gör vi detta om vi utgår från U R(0, 1)? Svar: X =... Skapa sedan 1000 exponentialfördelade slumptal med parametern Ð = 1/3 med hjälp av Matlabs funktion Ö Ò och lagra dem i vektorn Ü. Det kan vara bra att veta att om man ger funktioner som ÜÔ, ÐÓ etc en vektor som inparameter så returnerar Matlab en vektor av samma storlek med funktionen utförd elementvis. Ett histogram över vektorn Ü med 30 klasser kan erhållas med ÐÔ Ø Ñ º ½ ¼ Ø Ü Ñ µ Vi vill dock också kunna jämföra histogrammet med den teoretiska täthetsfunktionen, och då blir det lite krångligare eftersom histogrammet måste skalas om för att vara jämförbart med en täthetsfunktion vars area under funktionen är 1. Ò Ñ Ø Ü Ñ µ Û Ø ½ Ö Ñ Ò»½¼¼¼»Û Ø µ ÓÐ ÓÒ ÜÜ Ð Ò Ô ¼ ¼µ ÔÐÓØ ÜÜ ½» ÜÔ ¹ÜÜ» µµ ÓÐ Ó Det första kommandot beräknar histogrammet, men det ritas inte upp utan istället lagras mittpunkterna för klasserna i vektorn Ñ och antalet observationer i respektive klass lagras i Ò. Med komandot Ö ritas histogrammet med klassbredden 1 upp. Den här gången normerar vi antalet observationer dels med det totala antalet, vilket ger den relativa andelen observationer i klassen, dels med klassbredden, vilket ger en uppskattning av täthetsfunktionens värde i mittpunkten, ty om är klassbredden så gäller f X (x) x+ /2 x /2 Slutligen ritas den exakta tätheten upp. f X (x) dx = F X (x + /2) F X (x /2) = P(x /2 < X < x + /2).

4 Laboration 1, Matstat AK för CDIfysiker, HT12 7. Ser det ut som om X är exponentialfördelad? På samma sätt som att histogrammet kan ses som en uppskattning av täthetsfunktionen för X så kan den s.k. empiriska fördelningsfunktionen F X (x) = {antal x i x; i = 1, 2,..., N} N ses som en uppskattning av fördelningsfunktionen för X, F X (x) = P(X x). Nu använder vi funktionen Ø Ö för att jämföra den empiriska fördelningsfunktionen med den teoretiska Ø Ö ÓÖØ ܵ ½ ½¼¼¼µ»½¼¼¼µ ÓÐ ÓÒ ÔÐÓØ ÜÜ ½¹ ÜÔ ¹ÜÜ» µµ ÓÐ Ó 8. Ser det ut som om X är exponentialfördelad? 4 Dataanalys - kvalitetskontroll på serieproducerade mobiltelefoner En GSM mobiltelefon måste uppfylla vissa krav (t.ex. mottagarkänslighet och störtålighet) som telebolagen har ställt upp. Därför måste alla serieproducerade telefoner testas för att se om de uppfyller kravspecifikationen. Det kan ju vara så att p.g.a. felaktiga/dåliga komponenter eller dåliga lödningar så klarar en serieproducerad mobiltelefon inte de givna kraven och måste kasseras, eller rättas till manuellt. I filerna Ô ÖÖÓÖºÑ Ø och Ò Ø Ú ØÝºÑ Ø finns uppmätta värden på två av de krav som ställs på radiomottagaren på ett antal serieproducerade mobiltelefoner från ett icke namngivet stort svenskt telekommunikationsföretag. Mätningarna gjordes under ett antal dagar i oktober 97. Filerna finns att hämta på kurshemsidan. 4.1 Beskrivning av fasfel- och känslighetskrav I Ô ÖÖÓÖºÑ Ø har man mätt upp fasfelet i radiomottagaren i telefonen. GSM har ett digitalt modulationssätt kallat Gaussian Minimum Shift Keying, GMSK. Mycket enkelt förklarat (och inte helt korrekt) bygger idén på att nollorna och ettorna kodas som sinusvågor med olika fas. Man kan tänka sig att en nolla kodas som A sin( 2Ô T b t), 0 t T b, medan en etta kodas som A sin( 2Ô T b t + Ô 2 ), 0 t T b. (För en mer korrekt förklaring av GMSK och andra digitala modulationssätt hänvisas du till kurser i digital transmissionsteori.) På grund av olineariteter och spridning i komponenter i telefonen kommer mottagna nollor och ettor att bli fasförskjutna, A sin(ût + 0 ), 0 t T b, respektive A sin(ût + Ô 2 + 1), 0 t T b, där :na kan ses som slumpmässiga, dvs fasförskjutningen blir olika för varje nolla och etta. Om fasfelet råkar bli för stort så kommer telefonen att kunna göra fel när den beslutar om det var en nolla eller en etta som sänts. Därför finns det ett test som kontrollerar hur stort fasfelet är i varje telefon. Testet går till på följande sätt. En lång känd testsekvens av nollor och ettor sänds. För varje nolla och etta som tas emot av telefonen mäts fasfelet. Kravet är att det maximalt uppmätta fasfelet för en telefon måste vara mindre än 20 grader samtidigt som det genomsnittliga absolutfasfelet (standardavvikelse eller RMS-värdet) får vara maximalt 5 grader. I Ò Ø Ú ØÝºÑ Ø har man mätt upp mottagarkänsligheten i telefonen. Det finns nämligen ett krav på att vid en mottagen signalstyrka (här kallad P in ) på 102 dbm in på antennen så skall avkodaren högst ge

Laboration 1, Matstat AK för CDIfysiker, HT12 5 2 % bitfel. Enheten dbm används ofta inom radiotekniken och definieras som 10 gånger 10-logaritmen av kvoten mellan en effekt (i Watt) och 1 mw. 102 dbm motsvarar alltså ( ) Pin 10 log 10 10 3 = 102 P in 63 fw. Normalt testar man just vid nivån 102 dbm och kontrollerar att bitfelen understiger 2 %, men i Ò Ø Ú ØÝºÑ Ø har man testat (för ett mindre antal telefoner) för vilken insignalnivå 2 % bitfel erhålles. Detta har gjorts både för en radiokanal i mitten på GSMs 900MHz-band, (kring 947.5 MHz) samt längst ned på 900MHz-bandet (935 MHz). 4.2 Fasfel Ladda in filen Ô ÖÖÓÖºÑ Ø. Detta görs med kommandot ÐÓ Ô ÖÖÓÖ. Mätvärdena för maximalt fasfel hittas i vektorn Ô Ô ÖÖÓÖ och standardavvikelsen för fasfelet finns i ÖÑ Ô ÖÖÓÖ. Börja titta på det maximala fasfelet. ÐÓ Ô ÖÖÓÖ ÖÔ ÖÑ Ô ÖÖÓÖ ÔÔ Ô Ô ÖÖÓÖ Ü º¾ º ¼ Ø ÔÔ Üµ Ö 9. Vilken fördelning kan det maximala fasfelet tänkas ha? Ser det normalfördelat ut? Här kan du t.ex. använda kommandot ÒÓÖÑÔÐÓØ. ÐÔ ÒÓÖÑÔÐÓØ ÒÓÖÑÔÐÓØ ÔÔ µ Hur många telefoner är testade totalt samt hur många klarar inte specifikationskraven? Tag reda på detta genom att använda kommandot Ð Ò Ø och Ò. ÐÔ Ð Ò Ø ÐÔ Ò 10. Gör en skattning av P(En telefons maximala fasfel > 20 grader) genom att utnyttja kommandona ovan. I fabriken kontrolleras först det maximala fasfelet. De telefoner som inte klarade kraven sorteras ut och för resten kontrollerar man standardavvikelsen på fasfelet. Titta nu på ÖÑ Ô ÖÖÓÖ. Ü º½ º¾ Ø ÖÔ Üµ 11. Vilken fördelning kan standardavvikelsen för fasfelet tänkas ha?

6 Laboration 1, Matstat AK för CDIfysiker, HT12 12. Utnyttja tidigare kommandon för att uppskatta P(standardavvikelsen för fasfelet > 5 grader maximala fasfelet < 20 grader) samt P(en telefon klarar båda fasfelstesterna). 13. Kan man vara nöjd med ovanstående kvalitet? 4.3 Mottagarkänslighet Ladda nu in Ò Ø Ú ØÝºÑ Ø ÐÓ Ò Ø Ú ØÝ I Ò Ø Ú ØÝ finns mätningar av mottagarkänsligheten på 76 telefoner för en radiokanal kring 935 MHz, kolonn 1, och för en radiokanal kring 947.5 MHz, kolonn 2. Titta på dem var för sig. Ð Ò Ø Ú ØÝ ½µ Ñ Ò Ø Ú ØÝ ¾µ Ü ¹½¼ º ¹½¼ ÙÖ ½µ Ø Ð Üµ ÙÖ ¾µ Ø Ñ Üµ 14. Klarar alla telefoner kravspecifikationen 102 dbm? 15. I teorin bör det vara så att känsligheten är sämre för kanaler nära frekvensbandets ändpunkter än kanaler i frekvensbandets mitt på grund av det bandpassfilter som filtrerar ut mottagarfrekvensbandet (935 960 MHz). Kontrollera det genom att titta på histogrammet och se om det verkar som om Ð är sämre än Ñ. Här uppkommer nu en mycket intressant fråga: Hur ser man om en datamängd skiljer sig från en annan datamängd? Man kan t.ex. testa med ett s.k. hypotestest om medelvärdena för olika datamängder skiljer sig åt. Hypotestest kommer du att lära dig lite senare i kursen. Svar till uppgift 1 5 1. a) 0.84, b) 0.81 2. 0.65 3. a) 0.30, b) 0.93 4. Ü Ð Ò Ô ¹ ¾¼¼µ ± (200 värden mellan -5 och 9) Ý ÒÓÖÑÔ Ü ¾µ ÔÐÓØ Ü Ýµ 5. 66.45, 62.82, 56.74, 50.00, 43.26, 26.74. ± Ó ÑÓØ Ú Ö Ò Ö Ö ÐÒ Ò ÙÒ Ø ÓÒ Òº