1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation



Relevanta dokument
1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Projekt 1: Om fördelningar och risker

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

TAIU07 Matematiska beräkningar med Matlab

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

ÖVNINGSUPPGIFTER KAPITEL 9

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

bli bekant med summor av stokastiska variabler.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Datorövning 1: Fördelningar

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Datorövning 1 Fördelningar

5 Kontinuerliga stokastiska variabler

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

TATA42: Föreläsning 10 Serier ( generaliserade summor )

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Datorlaboration 2 Konfidensintervall & hypotesprövning

Inlämningsuppgift 4 NUM131

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Omtentamen i DV & TDV

Signalanalys med snabb Fouriertransform

Summor av slumpvariabler

TMS136. Föreläsning 4

Demonstration av laboration 2, SF1901

Dekomponering av löneskillnader

Syftet med den här laborationen är att du skall bli mer förtrogen med några viktiga områden inom kursen nämligen

Avd. Matematisk statistik

Föreläsning 3, Matematisk statistik Π + E

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)


4 Diskret stokastisk variabel

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

1 Syfte. 2 Förberedelseuppgifter DATORLABORATION 1 MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-03

Datorövning 1 Statistik med Excel (Office 2007, svenska)

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: minuter beroende på variant Material: TI-82/83/84 samt tärningar

LABORATIONSHÄFTE NUMERISKA METODER GRUNDKURS 1, 2D1210 LÄSÅRET 03/04. Laboration 3 3. Torsionssvängningar i en drivaxel

MMA132: Laboration 1 Introduktion till MATLAB

Resultatet läggs in i ladok senast 13 juni 2014.

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Mer om slumpvariabler

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler

Att göra investeringskalkyler med hjälp av

Datorövning 1 Statistik med Excel (Office 2010, svenska)

13.1 Matematisk statistik

Laboration 4: Lineär regression

Lektion 1: Fördelningar och deskriptiv analys

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

Senaste revideringen av kapitlet gjordes , efter att ett fel upptäckts.

Statistik för Brandingenjörer. Laboration 1

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Dataprojekt. Nanovetenskapliga tankeverktyg. January 18, 2008

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Lektionsanteckningar 11-12: Normalfördelningen

Lennart Carleson. KTH och Uppsala universitet

Repetitionsuppgifter i Matematik inför Basår. Matematiska institutionen Linköpings universitet 2014

Statistisk undersökningsmetodik (Pol. kand.)

TAIU07 Matematiska beräkningar med Matlab

Laboration i Fourieroptik

Ickelinjära ekvationer

Uppgift 1. Deskripitiv statistik. Lön

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

R AKNE OVNING VECKA 1 David Heintz, 31 oktober 2002

LABORATION ENELEKTRONSPEKTRA

G VG MVG Programspecifika mål och kriterier

Miniprojektuppgift i TSRT04: Femtal i Yatzy

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

DATORÖVNING 4: DISKRETA

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Lösningar till linjära problem med MATLAB

Frågorna 1 till 6 ska svaras med sant eller falskt och ger vardera 1

Tentamen TANA17 Matematiska beräkningar Provkod: DAT1 Godkänd: 8p av totalt 20p Tid: 21:a April klockan

Textsträngar från/till skärm eller fil

TENTAMEN KVANTITATIV METOD (100205)

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

varandra. Vi börjar med att behandla en linjes ekvation med hjälp av figur 7 och dess bildtext.

SF1901 Sannolikhetsteori och statistik I

Datorövning 1: Fördelningar

FOURIERANALYS En kort introduktion

Transkript:

LUNDS TEKNISKA HÖSKOLA ATEATIKCENTRU ATEATISK STATISTIK ATEATISK STATISTIK, AK FÖR L, FS 33, HT-4!"$&' (*) 1 Syfte I den första delen av detta projekt skall vi försöka hitta begripliga tolkningar av begreppen väntevärde och varians, dels utifrån de teoretiska fördelningarna och dels utifrån datorsimuleringar. Vi skall också titta på några standardfördelningar och bland dessa välja en lämplig fördelning som passar till hastighetsmätningarna. Vi skall också studera fördelningarna för summor av stokastiska variabler och vad som händer när antalet termer i summan växer. Vi skall också fördjupa begreppet sannolikhet via frekvenstolkning genom att genomföra en enkel riskstudie dels via datorsimuleringar och dels genom teoretiska överläggningar. Projektet skall redovisas i form av en rapport. Rapporten skall omfatta vissa nyckelmoment så det är viktigt att du läser igenom projekthandledningen och gör upp en disposition för hur rapporten skall se ut innan du börjar själva arbetet. Tänk till exempel efter vilka frågor det är som skall besvaras och vilka figurer och histogram som då bör vara med i rapporten. 2 oment hos och faltning av fördelningar,,,. 2.1 Förberedelseuppgifter (a) Hur lyder definitionen av väntevärde? (b) Hur lyder definitionen av varians? (c) Hur kan variansen beräknas på annat sätt än direkt genom definitionen? (Det finns en omskrivning som ofta är mer användbar i praktiska sammanhang.) (d) Om E(X ) 2 och V(X ) 1-3, vad får då Y (X 1)- 3 för väntevärde respektive varians? (e) Om X är likformigt fördelad på intervallet (1/ 3), vilken fördelning får då Y, (X. 1)- 3? Vad har en sådan fördelning för väntevärde och varians? Vad har X för väntevärde och varians? Hur stämmer detta överens med föregående uppgift? (f) Låt X R(. 1/ 1) och beräkna 1, E(X ) och V(X ). Sätt Y, (X.21 ) 2. Kan man få fram täthetsfunktionen för Y på samma sätt som i förra uppgiften? Se efter i exempel sid. 9 i Blom hur man skall göra istället. Vad blir E(Y )? Jämför med V(X ). (g) Om X och Y är oberoende och P(X, ), 1-3/ P(X, 1), 1-2/ P(X, 2), 1-6/ medan Y kan anta värdena / 1/ 2/ 3 med lika sannolikheter, vad är då sannolikhetsfunktionen för den stokastiska variabeln Z, Y 3 X? 2.2 Angående grafisk presentation Först en liten kommentar angående stolpdiagram och histogram. Då vi arbetar med diskreta stokastiska variabler och vill plotta resultat från studier av dessa använder vi stolpdiagram, just för att understryka variablernas diskreta karaktär. I ett stolpdiagram är det höjden av varje stolpe som representerar den relativa frekvensen (se Fig. 1). Vid arbete med kontinuerliga stokastiska variabler är det mera ändamålsenligt att indela materialet i klasser och rita ett histogram. I ett histogram är

$! : $ det arean av varje stapel som representerar den relativa frekvensen (se Fig. 2). På detta sätt får histogrammet en viktig egenskap gemensam med täthetsfunktionen nämligen att den sammanlagda arean under grafen är lika med ett. (Se i övrigt avsnittet om beskrivande statistik i kursboken.).4.4.3.3.2.2.1.1 b v 1 2 3 4 6 Figur 1: Stolpdiagram 1 2 3 4 6 Figur 2: Histogram Slumptalsgeneratorn i ATLAB genererar slumptal från en rektangelfördelning över intervallet från noll till ett, dvs observationer av en stokastisk variabel X R(/ 1). "$ '&)(*,('*-.,('*! / 1 2436 7 9 : 2 < "$= < C 1 2 2A! /D C 1 2!B2A! 2;( ( (?> @A!B2@"! Uppgift 2.1: ger dis- Är den stokastiska variabeln X som kret eller kontinuerlig? Uppgift 2.2: Hur bär du dig åt för att plotta en diskret funktion i ATLAB? Uppgift 2.3: Hur bär du dig åt för att plotta en kontinuerlig funktion i ATLAB? Uppgift 2.4: Börja med att plotta täthetsfunktionen för X. "! enerera sedan, till exempel, hundra slumptal från denna fördelning och plotta histogrammet över de relativa frekvenserna för detta stickprov i samma figur som täthetsfunktionen: E7 /FH =6== "!BI E7 $ J14FK!BI E7 Eftersom ett histogram enligt definitionen i kursboken (och avsnitt 2.2 ovan) är arean av varje stapel som representerar den relativa frekvensen, använder vi 7 $ istället för den i ATLAB inbyggda 7 $ som använder absoluta frekvenser till staplarnas höjd. 2.3 Väntevärde ör om simuleringarna ovan men med 1 observationer från X R(/ 1) istället och rita om histogrammet tillsammans med täthetsfunktionen. Öppna sedan ett nytt grafikfönster med kommandot ;$L<9. I detta fönster skall du plotta de successiva medelvärdena, N 9B=9 4F"!O(4PO=RQS= "!, för de 1, 2, 3,..., 1 första observationerna tillsammans med den linje som anger vad medelvärdena bör konvergera mot: E 2

9 $ C C $ 9 : C & - D $= 1 = ; 9/9 Uppgift 2.: "! < 6 /D C 1 2 E7 E7 $ O 6! E7 4DK!K2A! Använd dina figurer och beräkningar för att förklara vad väntevärdet för den stokastiska variabeln X är. 2.4 Varians Vi skall nu titta på variansen för X. Eftersom V(X ) är definierad som E((X.!1 ) 2 ) där 1, E(X ) (X. 1 ) 2. Detta skall vi bilda slumptal från Y, görs genom kommandot 4F & 9!O( LJ D 9-?'FK! Plotta sedan, i ett annat fönster och på samma sätt som för väntevärdet, de successiva medelvärdena D N 9R=9 K!O('PO=,Q ;! tillsammans med en linje som anger vad de borde konvergera mot. Uppgift 2.6: Använd dina figurer och beräkningar för att förklara vad variansen för den stokastiska variabeln X är. Vi skall nu studera R(. 1/ 1)-fördelningen på samma sätt och sedan jämföra de två. enerera alltså, i en vektor F6, 1 slumptal från denna fördelning (uppgift 3 kanske kan ge en viss ledning) och plotta de successiva medelvärdena på sätt som ovan. Beräkna också 6 = (X 1.21 1) 2, där 1 1, E(X 1 ), och plotta de successiva medelvärdena. I förberedelseuppgift (f) beräknade du täthetsfunktionen för Y, (X. 1 ) 2 när X R(. 1/ 1). Plotta den tillsammans med ett histogram över de 1 Y 1-värdena. Detta görs genom kommandona: D )Q)(K,Q 6I D < 4D DK! 1 2436 7 L 9 : LC 1 2'D2A! 4DK! 'F;& 9! LJ12A! Uppgift 2.7: e en tolkning av väntevärde och varians för en R(. 1/ 1)-variabel. Hur förhåller sig dessa till väntevärde och varians för en R(/ 1)-variabel? 3 Simulering av stokastiska variabler, några statistiska standardfördelningar I den här delen av projektet kommer du att simulera slumptal från fördelningarna, rita histogram över slumptalen och även jämföra simulerade värden med motsvarande täthetsfunktioner. 3.1 Rektangelfördelning (likformig fördelning) Fördelningen, som är beskriven på sidan 62 i kursboken, är användbar för att till exempel beskriva avrundningsfel vid mätningar. Den är också grundfördelningen vid simulering av andra fördelningar och vid onte Carlo-metoder. Funktionen genererar rektangelfördelade slumptal i intervallet [/ 1). ed J=!BI genereras 2 rektangelfördelade slumptal i intervallet [/ 1) och läggs i en 2 1-matris. Ett rektangelfördelat slumptal i intervallet [a/ b) fås med! (tänk efter att det är rimligt!). Uppgift 3.1: enerera 1 slumptal från en rektangelfördelning med a, 2 och b, 1. Plotta data i ett histogram med hjälp av 7 $. Verkar det stämma med en rektangelfördelning? Öka antalet slumptal till 1, 1 och 1 och gör respektive normerade histogram. Vad händer? 3

!! 3.2 Weibullfördelning Weibullfördelningen är mycket användbar för att beskriva variationer i hållfasthetsdata, till exempel sträck-, brott-, och utmattningsgränser. Fördelningsfunktionen ges av F(x), 1. e (x a) c om x och där a och c är konstanter som kan ges olika värden. Slumptal från Weibullfördelningen med parametrar a och c läggs i en p q matris med hjälp av ATLAB-kommandot $=C = P! N N!. Om man använder STIXBOX blir kommandot istället $=C 1 N för en p q-matris eller $=C ) N för en vektor med p element. Uppgift 3.2: enerera 1 slumptal från en Weibullfördelning med a, och c, 7 och lägg dem i en vektor. Sätt alltså p, 1 och q, 1 i $=C -kommandot. Plotta data i ett histogram med hjälp av 7 $. Uppgift 3.4: enerera 1 slumptal från en Weibullfördelning med a, 2 och c, 1. Plotta data i ett histogram med hjälp av 7 $. ed konstanten c, 1 får man som specialfall exponentialfördelningen. Rita upp dess täthetsfunktion. 3.3 Normalfördelningen Täthetsfunktionen för en normalfördelad stokastisk variabel ges av f X (x), e (x ) 1 2 2 2 för 2. x. Den beror alltså på två parametrar 1 och där 1 är väntevärdet i fördelningen och är standardavvikelsen. Normalfördelningen är en av de fördelningar som används mest inom sannolikhets- och statistikteorin. Funktionen L ( L i STIXBOX) i AT- LAB genererar normalfördelade slumptal. Kommandot /DH L 1=6? "!KI Uppgift 3.3: Bestäm täthetsfunktionen för Weibullfördelningen genom att derivera fördelningsfunktionen F(x), 1. e (x a) c med a, och c, 7. Täthetsfunktionen blir f (x), Du kan rita ut täthetsfunktionen med kommandona )Q)(SRQI 2 &,2A! där ersätts med det uttryck som du just beräknat. Jämför täthetsfunktionen med histogrammet i föregående uppgift. Du kan plotta histogrammet i samma figur om du har skrivit 7;. löm inte att skriva 7 innan du fortsätter att rita figurer. genererar slumptal från en normalfördelning med väntevärdet 3 och standardavvikelsen 1 och placerar dem i matrisen D med dimensionen p q. (STIXBOX: O=! ) Uppgift 3.: enerera 1 slumptal från en normalfördelning med m, 2 och,. Plotta data i ett histogram med hjälp av 7 $ Uppgift 3.6: enerera 1 slumptal från en normalfördelning med m, 2 och, 2. Plotta data i ett histogram med hjälp av 7 $ J. Hur påverkar - värdet dina histogram?. 4

< < Normalfördelningens täthetsfunktion, f X (x) fås genom (STIXBOX: ). Rita ut normalfördelningar för olika värden på m och och se hur fördelningarna påverkas:?q)(s,q I 7 7 JO@('*;!! O@('*;!62 2A! *O J!B2 2A! *O@(S!624D12A! Fördelningsfunktionen, F X (x), för en normalfördelad stokastisk variabel fås med kommandot L N (STIXBOX: L ). Uppgift 3.7: Rita ut samma normalfördelningar som ovan men nu med hjälp av fördelningsfunktioner. Lägg märke till hur olika värden på 1 och påverkar fördelningsfunktionerna: N N N N?Q)(S,Q I 7 7 JO@('*;!! 3.4 Andra fördelningar O@('*;!62 2A! *O J!B2 2A! *O@(S!624D12A! Andra ATLAB-funktioner som genererar slumptal från olika fördelningar är listade i Appendix A. Ett generellt sätt att generera ett slumptal från en given fördelningsfunktion F(x) är att använda inversmetoden. Denna innebär att man löser ekvationen F(x), u där u är ett slumptal från en rektangelfördelning på intervallet (/ 1). Några fördelningar är lätta att invertera direkt, till exempel Exponentialfördelning F(x), 1. e x a x,. a ln(1. u) Weibullfördelning F(x), 1. e (x a) c x, a(. ln(1. u)) 1 c Extremvärdefördelning F(x), exp(. e (x b) a ) x, b. a ln(. ln(. u)) I andra fall, till exempel för normalfördelningen, måste inverteringen ske numeriskt. Det finns olika specialkonstruerade metoder för att simulera slumptal från sådana fördelningar. Det finns för normalfördelningen den så kallade Box-üllertransformationen samt arsaglias metod för generering av slumptal. Som beskrivs i kursboken är de relativa frekvenserna uppskattningar av ett antal areor under täthetsfunktionen. Om man har ett stort stickprov kan man välja en fin klassindelning och med ett histogram över de relativa frekvenserna få en god bild av täthetsfunktionens utseende. En naturlig fråga är om vi kan hitta någon statistisk standardfördelning som väl beskriver den variation som vi observerat? Vi skall undersöka detta på två sätt: med hjälp av empirisk fördelningsfunktion och med hjälp av sannolikhetspapper, att grafiskt jämföra en fördelning baserad på data med en hypotetisk fördelning. De två olika sätten som vi beskriver är egentligen i princip samma sak. 3.4.1 Empirisk fördelningsfunktion Från en dags produktion av tegelstenar tog man slumpmässigt ut 12 stycken och mätte deras vikt (kg). Vikterna är lagrade i filen <. Uppgift 3.: Ladda in data och gör ett histogram över vikterna. Beräkna även medelvärde L och standardavvikelse. Vilken fördelning tror du kan beskriva variationen i vikt? För att undersöka om du har rätt ska du jämföra den empiriska fördelningsfunktionen med din hypotetiska fördelningsfunktionen.

I Uppgift 3.9: Rita den empiriska fördelningsfunktionen för tegelstensvikterna med hjälp av följande ATLAB kommandon: " "$: K!6I H < 7? "!BI,Q P ;$L" "!BI Avläs från figuren vad medianvärdet är för vikterna, och vilken vikt som understigs av 9 av tegelstenarna. Använd kommandot för att se detaljer i plotten. En fördelningsfunktion för normalfördelningen kan plottas med funktionen N (normal cumulative distribution function) men kräver värden på parametrarna 1 och i fördelningen. Håll kvar den empiriska fördelningsfunktionen i figuren med 7; och rita in en normalfördelning 1,, med 1 och standardavvikelsen i figuren. N )Q)(",Q'JI Uppgift 3.1: =K4?(*!! Identifiera väsentliga avvikelser mellan de två fördelningarna. Relatera dessa avvikelser till dem som du sett i de tidigare plottarna. 4 Summor av stokastiska variabler faltning 4.1 Symmetrisk fördelning Börja med att hitta på en diskret sannolikhetsfunktion med några möjliga utfall, till exempel den likformiga fördelningen över 1,2,...,6, dvs ett tärningskast. ata sedan in denna sannolikhetsfunktion i form av en vektor. P Nollan finns där för att det blir lättare att hålla reda på saker och ting om det första elementet i vektorn är sannolikheten för att utfallet är noll. Rita upp sannolikhetsfunktionen med kommandot. @)Q' < 7) B! &;K K! Funktionen < 7 ger antalet element i en vektor. Som du vet beräknas sannolikhetsfunktionen för en summa av två oberoende diskreta stokastiska variabler genom en diskret faltning (se kursboken). I ATLAB finns en funktion, N, som utför just en sådan faltning (faltning heter convolution på engelska). E J- E E - N N N? B!BI ;J1 J!6I K!6I Här blir alltså sannolikhetsfunktionen för en summa av åtta stycken oberoende stokastiska variabler med sannolikhetsfunktionen. Rita upp var och en av dessa nya sannolikhetsfunktioner med hjälp av (om du använder =9C - kommandot kan du få plottarna i följd på ett överskådligt sätt). Nu kan vi också åstadkomma slumptal från fördelningen genom att generera åtta stycken slumptal från fördelningen och sedan lägga ihop dem. Om vi gör detta, till exempel, hundra gånger kan vi sedan rita ett stolpdiagram över de relativa frekvenserna och jämföra detta med sannolikhetsfunktionen för. I ATLAB gör vi detta lätt och snabbt genom att först generera en 1-slumptalsmatris 1!!, där vi kan betrakta varje kolonn som observationer av åtta stycken tärningskast. Ta, innan du går vidare, reda på hur funktionen =9 fungerar. =9 K!BI D D //7 $ 4DD;P ;! @)Q < 7) ;! &!6I Den andra inparametern till funktionen 7 $ är en vektor vars element anger klassmitten för respektive klass, och på detta sätt får vi samma indelning som i stolpdiagrammet över sannolikhetsfunktionen. Nu kan det vara dags att ta det lite lugnt ett slag och fundera över några frågor: 6

Uppgift 4.1: (a) Hur stämmer fördelningen för de simulerade värdena överens med den teoretiska fördelningen för? (b) Varför förskjuts den resulterande fördelningen allt längre mot höger för varje faltning? (c) Varför blir sannolikhetsfunktionen för den resulterande fördelningen bredare för varje faltning? (d) Kan du skönja någon tendens beträffande resultaten av de successiva faltningarna? 9 =9 $L<K @)Q!O( = 6! =9 @)Q ;! & 9!O( LJ( B!! Funktionen =9 ger summan av elementen i en vektor, notationen ( J betyder elementvis kvadrering av en vektor och är kvadratroten. Vi kan nu jämföra sannolikhetsfunktionen med den normalfördelning N(4m/ 4) som har samma väntevärde och varians/standardavvikelse som. 4)Q' < 7) "! & 6 "! E7 )Q)('*?Q E 9 E7 1 "! $=<"!! Sist, men inte minst, några frågor: 4.2 Skev fördelning Uppgift 4.3: Utför sedan ett antal faltningar på samma sätt som ovan, men med en skev fördelning, till exempel * J P väl av normalfördelning- (a) Approximeras en? (Vad skall vara?) Börja med att rita upp sannolikhetsfunktionen med hjälp av, så att du vet hur den ser ut. Uppgift 4.2: (a) Kan du se samma tendens här som du såg i föregående fall? (b) Om du svarat ja på ovanstående fråga, hur många faltningar tycker du behövs för att tydligt kunna se tendensen? Om du svarat nej, fortsätt med ett par faltningar till! (b) Hur stort måste antalet termer n i summan vara, för att approximationenskall bli bra? (Pröva med summor av fler och färre stokastiska variabler, och notera det värde på n, för vilket du tycker att approximationen är bra.) (c) Beror approximationen till normalfördelningen på något mer än antalet termer i summan? Jämför med den inritade normalfördelningen. 4.2.1 Jämförelse med normalfördelningen Vi skall nu avsluta denna seans med en liten jämförelse med normalfördelningen. Det kan kanske verka en aning långsökt, men det skall så småningom visa sig, att det ligger goda skäl bakom. Räkna först ut väntevärde och standardavvikelse för en stokastisk variabel med sannolikhetsfunktionen. Riskanalys Om igelkottar kilar över en väg vid n oberoende tillfällen och varje gång en igelkott passerar över vägen riskerar den att råka ut för en olycka med en sannolikhet som är 1- n, hur stor är då risken att någon av igelkottarna råkar ut för en olycka? 7

: Uppgift.1: (a) Simulera fram olycksrisken för några olika n. Du kan använda den färdigskrivna - filen $L<. (b) Beräkna olycksrisken då n, 1 exakt, med hjälp av oberoende händelser. (c) Om vi utsätter oss för små risker, så små att de nästan inte kan inträffa, många gånger, hur stor är då sannolikheten att vi någon gång råkar ut för denna olycka? Om du räknar med P(olycka en viss gång), 1- n, vad är då sannolikheten att olyckan inträffar någon gång av n? Vad händer då n? 6 Avslutning När man som ingenjör utför sina beräkningar, räcker det inte att de är formellt korrekta. Resultaten måste också sättas i relation till den omgivande verkligheten, tolkas i ett sammanhang. Väntevärde och varians är viktiga begrepp i sannolikhets- och statistikteorin, men de är abstraktioner som i varje enskilt fall måste tolkas för att få en mening. Den mekaniska analogin vid sannolikhets- eller täthetsfunktioner samt frekvenstolkningen är två möjliga vägar som illustrerats i första delen av denna laboration. I statistiken arbetar man ofta med summor av stokastiska variabler, inte minst när man bildar medelvärden. Avsnittet om faltning handlade just om detta, och de avslutande jämförelserna med normalfördelningen kan ses som en heuristisk härledning av centrala gränsvärdessatsen. Denna sats intar en central plats inom statistikteorin och förklarar också till viss del varför normalfördelningen är så ofta förekommande i statistiska sammanhang. I mitten av projektet fick du tillfälle att lite mera ingående studera några standardfördelningar och några av deras egenskaper. Varje fördelning har sina speciella egenskaper som gör den mer eller mindre användbar i olika sammanhang. För att kunna modellera den komplexa värld vi lever i behöver vi därför en bred repertoar av fördelningar, och vi skulle kunna underkasta var och en av de fördelningar som presenteras under kursens gång ett liknande specialstudium. Nu räcker inte den utmätta tiden till detta, och detta moment får därför samtidigt stå som ett exempel på hur man kan studera en fördelning och dess egenskaper för att kunna välja fördelning till ett specifikt problem. 7 Redovisning Rapport Projektet utförs i grupper om två eller tre personer och skall redovisas i form av en kort rapport koncentrerad kring de nyckelfrågor som är markerade med en bomb,. Figurer och histogram som kan förtydliga resonemang och slutsatser skall givetvis också vara med. Rapporten skall senast vara inlämnad den tid som meddelas på undervisningen. Du kan lämna den till antingen labbhandledaren eller sekreteraren. Om rapporten inte är inlämnad senast detta datum rättas den inte förrän nån gång i framtiden när vi har tid. Rättade rapporter delas ut på föreläsningarna och finns sedan i fack i korridoren på andra våningen i mattehuset. Icke godkända rapporter skall kompletteras och lämnas in igen så fort som möjligt. Utformningen av rapporten skall i görligaste mån följa instruktionerna i den utdelade promemorian angående redovisning av datorlaborationer. Rapporten skall bara omfatta väsentligheterna i projektet. Det finns delmoment och Uppgifter som är till för att stödja nyckelmomenten. Dessa behöver så klart ej redovisas i detalj och bör bara tas med för att stödja och förtydliga eventuella resonemang.

LUNDS TEKNISKA HÖSKOLA ATEATIKCENTRU ATEATISK STATISTIK REDOVISNIN AV PROJEKT 1: O FÖRDELNINAR OCH RISKER ATEATISK STATISTIK, AK FÖR L, FS 33, HT-4 Detta blad skall lämnas som försättsblad till rapporten. Checklista 1. Är alla momenten i projektet (inklusive förberedelseuppgifter) utförda? 2. Har rapporten blivit korrekturläst? Är språk- och skrivfel rättade? 3. Är figurer, tabeller och liknande försedda med figurtexter och tydlig numrering? 4. Har alla figurer storheter inskrivna på alla axlar?. Är de beräkningar som kan kontrollräknas kontrollräknade? 6. Har du gjort en rimlighetsbedömning av samtliga resultat? 7. Har eventuella orimliga resultat blivit vederbörligen kontrollerade och kommenterade?. Är den löpande texten väl strukturerad med tydliga avsnittsrubriker? 9. Är skriften försedd med: Sammanfattning? Innehållsförteckning? Referenslista? Sidnumrering? Datum? 1. Har förutsättningar, förenklingar och gjorda antaganden tydligt redovisats? 11. Är din rapport läsbar utan tillgång till laborationshandledningen? 12. Har ni samarbetat med annan grupp? I så fall vilken?.............................................................. 13. Är detta försättsblad med checklista fullständigt ifyllt? [ort och datum]............................................................................................ [underskrifter]............................................................................................ [namnförtydliganden]............................................................................................ Ja Nej Rättarens anteckningar Rättat av: odkänt (datum):