TAMS36 Matematisk statistik för IT: Vinjetter

Relevanta dokument
Stokastiska processer och simulering I 24 maj

1 Produktivitet kontra kvalitet vid tillverkning av bilar

Lunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5

Markovprocesser SF1904

Markovprocesser SF1904

TAMS65 - Seminarium 4 Regressionsanalys

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.

Tentamen MVE301 Sannolikhet, statistik och risk

Fö relä sning 2, Kö system 2015

Betingad sannolikhet och oberoende händelser

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Nu endast 1 timmas behandling! Barn och löss bör inte behandlas med vad som helst

SF1901: Sannolikhetslära och statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

1 Stokastiska processer. 2 Poissonprocessen

Lufttryck i ballong laboration Mätteknik

SF1901: Sannolikhetslära och statistik

40 5! = 1, ! = 1, Om man drar utan återläggning så kan sannolikheten beräknas som 8 19

Föreläsning 12: Linjär regression

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Lektionsanteckningar 11-12: Normalfördelningen

Lösningar till tentamen i Matematisk Statistik, 5p

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i Matematisk statistik Kurskod S0001M

SF1901: Sannolikhetslära och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

FFM234, Klassisk fysik och vektorfält - Föreläsningsanteckningar

Introduktion till statistik för statsvetare

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Härledning av Black-Littermans formel mha allmänna linjära modellen

Den bemannade rymdfartens historia

ANVISNINGAR TILL INLÄMNINGSUPPGIFTER I TILLFÖRLITLIGHETSTEORI. På inlämningsuppgiften ska alltid namn och elevnummer finnas med.

Statistiska metoder för säkerhetsanalys

1 Förberedelser. 2 Teoretisk härledning av värmeförlust LABORATION 4: VÄRMEKRAFTVERK MATEMATISK STATISTIK AK, MAS 101:A, VT-01

** a) Vilka värden ska vara istället för * och **? (1 p) b) Ange för de tre tillstånden vilket som svarar mot 0,1,2 i figuren.

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

Konvergens och Kontinuitet

Föreläsning 4: Konfidensintervall (forts.)

Tentamen LMA 200 Matematisk statistik,

Lotto, ett skicklighetsspel!

TAMS14/36 SANNOLIKHETSLÄRA GK Poissonprocessen (komplettering) Torkel Erhardsson 14 maj 2010

M/M/m/K kösystem. M/M/m/K kösystem

Matematisk statistik för B, K, N, BME och Kemister

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

3. Ljus. 3.1 Det elektromagnetiska spektret

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret Lektion 1

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

TENTAMEN I TILLÄMPAD VÅGLÄRA FÖR M

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Lutande torn och kluriga konster!

Föreläsning 13: Multipel Regression

I. Ordkunskap homonymer

Diskussionsproblem för Statistik för ingenjörer

2 (6) k 0 2 (7) n 1 F k F n. k F k F n F k F n F n 1 2 (8)

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

Resurscentrums matematikleksaker

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

TAMS65 - Föreläsning 6 Hypotesprövning

Bose-Einsteinkondensation. Lars Gislén, Malin Sjödahl, Patrik Sahlin

Tentamen LMA 200 Matematisk statistik,

Tentamen LMA 200 Matematisk statistik, data/elektro

bli bekant med summor av stokastiska variabler.

En utvärdering av validitet och reliabilitet för bedömningsinstrumentet uppföljning av insatser för vuxna missbrukare (UIV)

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Finansiell statistik FÖRELÄSNING 11

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Konvergens för iterativa metoder

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

TENTAMEN I SF1904 MARKOVPROCESSER TISDAGEN DEN 29 MAJ 2018 KL

Föreläsningsanteckningar till kapitel 8, del 2

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = ξ = 2ξ 1 3ξ 2

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i FMS180/MASC03 Markovprocesser

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Tentamen MVE301 Sannolikhet, statistik och risk

Diskreta slumpvariabler

Ordinära differentialekvationer (ODE) 1 1

Stokastiska processer med diskret tid

Fysikaliska modeller

Lösningar till tentamen i Matematisk Statistik, 5p

Föreläsning 7. Statistikens grunder.

Tentamensskrivning i stokastik MAGB64, 7.5 ECTS den 8 juni 2012 kl 14 19

17.10 Hydrodynamik: vattenflöden

D. x 2 + y 2 ; E. Stockholm ligger i Sverige; F. Månen är en gul ost; G. 3 2 = 6; H. x 2 + y 2 = r 2.

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Transkript:

TAMS36 Matematisk statistik för IT: Vinjetter Torkel Erhardsson 3 april 2016 1 Rymdfärjan Den 20 januari 1986 startade rymdfärjan Challenger sin 25:e flygning i National Aeronautics and Space Administration (NASA:s) rymdprogram. Mindre än två minuter efter start exploderade rymdfarkosten, och alla ombord dödades. President Reagan tillsatte en kommission ledd av f.d. utrikesminister William Rogers (kallad Rogerskommissionen), där flera framstående forskare och även några astronauter ingick. Den nu avlidne fysikern Richard Feynman spelade en viktig roll i arbetet. Kommissionen studerade olyckan och de händelser som ledde fram till den ödesdigra starten, fastställde orsaken till olyckan och skrev en två volymer lång Report of the Presidential Commission on the Space Shuttle Challenger Accident (1986). Först litet bakgrundsinformation: en rymdfärja använder två booster - raketer, som hjälper till att lyfta den till sin omloppsbana. Varje booster - raket består av flera delar, vars skarvar är tätade med o-ringar av gummi, vilka är utformade för att förhindra utsläpp av heta gaser som produceras genom förbränning. Varje booster innehåller tre primära o-ringar (totalt sex per farkost). I de tidigare 23 flygningar för vilka det fanns uppgifter (data för en flygning förlorades till sjöss) hade man undersökt o-ringarna för skador. Temperaturprognosen på dagen för Challengers 25:e flygning var 31 F. Den kallaste tidigare flygningen skedde vid 53 F. O-ringarnas känslighet för temperaturen var välkänd. En varm o-ring återfår snabbt sin form efter att en kompression upphör, men inte en kall. Oförmågan hos en o-ring att återfå sin form kunde leda till att skarvarna inte var täta, vilket kunde resultera i en gasläcka. Det var förbränningen av denna läckande gas som gav upphov till Challengerexplosionen. Richard Feynman demonstrerade på ett dramatiskt sätt o-ringarnas svaghet vid Rogerskommissionens hearing. Under en lunchrast gick Feynman ut 1

i Washington DC och köpte några o-ringar. Efter lunch tog han ett glas isvatten som han doppade o-ringarna i. När han tog upp dem hade de synbarligen mycket litet elasticitet kvar. Explosionen hade inträffat på grund av de dåliga materialegenskaperna hos o-ringar vid låg temperatur. Kunde detta ha förutsetts? Det diskuterades en hel del bland ingenjörerna strax före start om flygningen skulle genomföras som planerat eller inte. Inga statistiker var närvarande vid diskussionerna. Följande argument framfördes (något förenklat): vid sju tidigare flygningar hade åtminstone en o-ring skadats. Tabellen nedan ger, för dessa flygningar, temperaturen vid start och antalet o-ringar som skadats under flygningen. p är en skattning av sannolikheten, kallad p, att en o-ring ska skadas under en flygning. Närmare bestämt är p andelen av o-ringarna som skadats under flygningen: Temperatur Antal skadade o-ringar p 53 F 2.333 57 F 1.167 58 F 1.167 63 F 1.167 70 F 1.167 70 F 1.167 75 F 2.333 Resultaten i tabellen visar inte på någon uppenbar relation mellan temperaturen och sannolikheten för skador. Fler skador inträffade vid både lägre och högre temperaturer. Det ser ut som om det faktum att det var en kall dag inte innebar att flygningen borde ha inställts. Tyvärr omfattade diskussionen inte alla flygningar: sådana där inga skador hade inträffat inkluderades inte. Hela datamängden från alla 23 tidigare flygningar, ordnade efter temperatur, var följande. 53 57 58 63 66 67 67 67 68 69 70 70 2 1 1 1 0 0 0 0 0 0 0 0 70 70 72 73 75 75 76 76 78 79 81 1 1 0 0 0 2 0 0 0 0 0 Plotta antalet skadade ringar mot temperaturen och tänk över resultatet. Verkar det rimligt att rekommendera att flyga med rymdskytteln vid en temperatur på 31 F? Det verkar finnas flera problem. För det första, även om skattningarna av p är korrekta för de olika temperaturerna, ser man när man inkluderar 2

alla flygningar att fler ringar skadats vid låga temperaturer. För det andra: har man verkligen tillräckligt många observationer för att kunna skatta p för varje enskild temperatur, med tillräckligt god precision? Som ett resultat av undersökningarna var en av rekommendationerna i Rogerskommissionens rapport att statistiker ska ingå i markkontrollteamet vid alla flygningar. 2 Två problem med betingade sannolikheter 2.1 Tävlingsprogrammet Programledaren visar dig tre stängda dörrar. Bakom en dörr finns ett värdefullt pris; bakom de andra två finns det ingenting. Du ombeds att välja en dörr (UTAN att öppna den). När du har gjort ditt val, öppnar programledaren en av de andra två dörrarna (som INTE innehåller priset). Sedan frågar han dig om du vill byta den dörr du först valde mot den återstående dörren som inte har öppnats. Det som finns bakom den dörr du till slut har valt vinner du. Vilken är den bästa strategin för att vinna priset? 2.2 Familjen Du går förbi ett hus som tillhör en familj där du vet att det finns två barn. På verandan ser du en liten flicka. Givet denna observation, vad är sannolikheten att det andra barnet i familjen är en pojke? Blir svaret ett annat om du istället för att få se ett av barnen med egna ögon, får höra av en helt sanningsenlig vän att minst ett av familjens barn är en flicka? 3 Alohaprotokollet Protokollet kallas så, eftersom det först användes vid University of Hawaii. En server hanterar en kö av meddelanden som väntar på att skickas. Nya meddelanden anländer till servern i början av varje tidsenhet. Vid slutet av tidsenheten försöker servern att sända vart och ett av de nyligen anlända meddelandena, och samtidigt försöker den att sända vart och ett av meddelandena i kön med sannolikhet p, oberoende av varandra. Om servern försöker skicka exakt ett meddelande, så lyckas sändningen. Om servern försöker att skicka två eller flera meddelanden samtidigt, anses en kollision inträffa och ingen av sändningarna är framgångsrik. Meddelanden för vilka sändningsförsöket misslyckas placeras i kön. 3

Antag att antingen 0, 1 eller 2 meddelanden anländer vid början av en tidsenhet,medsannolikheternaa 0,a 1 ellera 2 respektive,dära 0 +a 1 +a 2 = 1. Man kan visa att om a 2 > 0, kommer med sannolikhet 1 endast ett ändligt antal meddelanden någonsin att lämna servern. D.v.s, med sannolikhet 1 kommer en oändlig kö att uppstå. Uppgiften är att simulera detta protokoll med hjälp av MATLAB och visa hur kön utvecklas. Kan du föreslå en ändring av protokollet som förhindrar att en oändlig kö byggs upp? 4 Arméers slagstyrka Lanchesters kvadratlag säger att den effektiva slagstyrkan hos en armé är proportionell mot kvadraten på antalet individuella stridsenheter. Lagen publicerades av F. W. Lanchester i artikeln The Concentration Principle i tidskriften Engineering år 1914. Ett sätt att förstå lagen är genom följande deterministiska modell av en strid mellan en GRÖN armé och en VIT armé: Vid varje tidpunkt t under slaget betecknas antalet överlevande GRÖNA stridsenheter med g(t) och antalet överlevande VITA stridsenheter med w(t); g(0) och w(0) är begynnelsevärdena. Antag att, vid tidpunkten t, de GRÖNA enheterna utraderas med intensiteten ρw(t) per tidsenhet, medan de VITA enheterna utraderas med intensiteten γg(t). Detta innebär att d d g(t) = ρw(t); dt w(t) = γg(t). dt Multiplicering a båda sidor av den första ekvationen med γg(t) och båda sidor av den andra med ρw(t) ger: γg(t) d dt g(t) = γρg(t)w(t) = ρw(t) d dt w(t), så att d dt (γg2 (t)) = d dt (ρw2 (t)), vilket innebär att storheten γg 2 (t) ρw 2 (t) är konstant under hela striden. Speciellt, om γ = ρ, kommer striden att avslutas med g 2 (0) w 2 (0) överlevande stridsenheter, alla tillhörande den armé som ursprungligen var starkast. I en verklig drabbning kommer naturligtvis händelseförloppet att i hög grad bero av slumpmässiga faktorer, som inte beaktats i den deterministiska modellen. För att studera hur slumpmässiga faktorer påverkar utgången, ska vi simulera följande probabilistiska modell av ett slag: 4

Låt den GRÖNA armén ha initialt N enheter, och den VITA armén M enheter. Simulera följande algoritm och se vem som vinner och hur många stridsenheter som blir kvar. 1. Antag att den GRÖNA armén har n enheter och den VITA armén har menheter.låtx Bin(n,1 (1 p 1 n ) m )ochy Bin(m,1 (1 p 2 m )n ). Här är p 1 sannolikheten att en VIT stridsenhet kommer att träffa (och utradera) den stridsenhet på den andra sidan som den siktar på under en viss omgång av slaget, och p 2 är motsvarande träffsannolikhet för en GRÖN stridsenhet. 2. Låt n := n X och m := m Y och gå tillbaka till 1. Hur många omgångar krävs för att avsluta slaget? Ser det ut som om Lanchesters kvadratlag gäller? Vilken är logiken bakom den föreslagna modellen? Kan du konstruera och simulera en mer realistisk modell? 5 En populationsmodell En enkel populationsmodell är den så kallade Galton-Watson-processen. Antag att varje individ i en population har k barn (där k = 0,1,2,...) med sannolikhet p k, oberoende av alla andra. Låt dessutom k 1 kp k = µ (med andra ord, det förväntade antalet barn för varje individ är µ). Låt Z n beteckna antalet individer i generation n. Antag att Z 0 = 1, d.v.s., hela populationen härstammar från en enda anfader. Kan du föreslå några verkliga fenomen för vilka detta skulle vara en realistisk modell? Det verkar rimligt att om µ < 1, så gäller att Z n 0 då n, med sannolikhet 1 (med andra ord, populationen dör så småningom ut). Det är mindre klart vad som kommer att hända om µ 1. Använd MATLAB (eller något annat programmeringsverktyg) för att undersöka dessa frågor. Kan du kanske bevisa att P(Z n > ε) 0 då n för varje ε > 0, om µ < 1? (Det är inte alldeles lätt. Visa först att följande samband gäller, för varje n = 1,2,3,...: Z n = Z n 1 där ξ i är antalet barn till den i:te individen i generation n 1. Visa sedan med hjälp av detta samband och betingning att E(Z n ) = µ n. Använd till slut Markovs olikhet för att hitta en övre begränsning till P(Z n > ε).) i=1 ξ i, 5