Om sannolikhet. Bengt Ringnér. August 27, Detta är introduktionsmaterial till kursen i matematisk statistik för lantmätarprogrammet

Relevanta dokument
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Bengt Ringnér. October 30, 2006

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Statistik 1 för biologer, logopeder och psykologer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Lektionsanteckningar 11-12: Normalfördelningen

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

4.1 Grundläggande sannolikhetslära

Kap 3: Diskreta fördelningar

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

4 Diskret stokastisk variabel

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

9 Geometriska begrepp

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

2. 1 L ä n g d, o m k r e t s o c h a r e a

Statistikens grunder HT, dagtid Statistiska institutionen

Matematisk statistik för D, I, Π och Fysiker

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

8-1 Formler och uttryck. Namn:.

Jörgen Säve-Söderbergh

Matematiska uppgifter

Föreläsning 12: Regression

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik - Slumpens matematik

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

1 Mätdata och statistik

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Föreläsning 6, Repetition Sannolikhetslära

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Lösningar till udda övningsuppgifter

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

TENTAMEN I STATISTIKENS GRUNDER 1

Föreläsning 4: Konfidensintervall (forts.)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning G70 Statistik A

Matematiska uppgifter

F2 SANNOLIKHETSLÄRA (NCT )

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

1.1 Diskret (Sannolikhets-)fördelning

Vektorgeometri för gymnasister

Högskoleprovet Kvantitativ del

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Geometri och statistik Blandade övningar. 1. Vid en undersökning av åldern hos 30 personer i ett sällskap erhölls följande data

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Stokastiska signaler. Mediesignaler

Matematiska uppgifter

Matematik CD för TB = 5 +

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Repetitionsuppgifter inför Matematik 1-973G10. Matematiska institutionen Linköpings universitet 2014

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Övning 1 Sannolikhetsteorins grunder

Gamla tentemensuppgifter

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Dagens tema är exponentialfunktioner. Egentligen inga nyheter, snarare repetition. Vi vet att alla exponentialfunktioner.

f(x) = 2 x2, 1 < x < 2.

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Kombinatorik och sannolikhetslära

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

NATIONELLT KURSPROV I MATEMATIK KURS B HÖSTEN Del I, 10 uppgifter utan miniräknare 3. Del II, 8 uppgifter med miniräknare 5

Repetitionsuppgifter inför Matematik 1. Matematiska institutionen Linköpings universitet 2013

Hur måttsätta osäkerheter?

TMS136. Föreläsning 1

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Optimering, exempel. Funktionens enda stationära punkt är alltså origo. Den ligger också i det inre av mängden.

SKOLORNAS MATEMATIKTÄVLING Svenska Matematikersamfundet. Lösningsförslag till naltävlingen den 20 november 2004

TATA42: Föreläsning 3 Restterm på Lagranges form

Kovarians och kriging

Oberoende stokastiska variabler

Undersökande arbetssätt i matematik 1 och 2

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Provet består av Del I, Del II, Del III samt en muntlig del och ger totalt 76 poäng varav 28 E-, 24 C- och 24 A-poäng.

Linnéuniversitetet Institutionen för datavetenskap, fysik och matematik Per-Anders Svensson

TMS136. Föreläsning 2

SF1901 Sannolikhetsteori och statistik I

Formelhantering Formeln v = s t

Lufttorkat trä Ugnstorkat trä

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Lokala mål i matematik

Lösningar kapitel 10

F9 SAMPLINGFÖRDELNINGAR (NCT

SF1669 Matematisk och numerisk analys II Lösningsförslag till tentamen DEL A

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Föreläsning 1, Matematisk statistik Π + E

Föreläsning 3. Sannolikhetsfördelningar

Transkript:

Om sannolikhet Bengt Ringnér August 27, 2007 1 Inledning Detta är introduktionsmaterial till kursen i matematisk statistik för lantmätarprogrammet vid LTH hösten 2007. 2 Sannolikhetsteori Sannolikhetsteori, eller snarare sannolikhetskalkyl, går ut på att man ur givna sannolikheter för vissa händelser räknar ut sannolikheter för andra händelser. Sannolikheten för en händelse skrivs P(händelsen), där P kommer av latinets motsvarighet till engelskans probability. Händelser kan sedan betecknas med bokstäver, t ex A, B, C, etc. Sannolikheter skall uppfylla följande axiom: 1. Sannolikheten för en händelse kan aldrig vara negativ. Detta skrivs P(A) 0. 2. Sannolikheten att en händelse inte inträffar är ett minus sannolikheten att den inträffar. I formelspråk: Av detta följer P(A) 1. P(A c ) = 1 P(A).. (a) Om två händelser, A och B, inte kan inträffa samtidigt, är sannolikheten att någon av dem inträffar lika med summan av de enskilda sannolikheterna, dvs P(A B) = P(A) + P(B). Av P(A A c ) = P(A) + P(A c ) = 1 följer att 1

i. en säker händelse har sannolikheten 1 och att ii. en omöjlig händelse har sannolikheten 1 1 = 0. (b) Om två händelser, A och B, har fått sannolikheter, måste också händelsen att bägge inträffar tilldelas sannolikhet, antingen genom P(A B) = P(A) P(B), om de är oberoende, eller P(A B) = 0, om de inte kan inträffa samtidigt, eller på något annat sätt. Om P(A B) är okänd kommer slutresultatet att bero på det okända värdet. 4. Ett tekniskt villkor 1 som vi inte går in närmare på. Exempel Om någon påstår att det är 70% sannolikhet för regn i morgon, har vederbörande indirekt sagt att med sannolikheten 0% kommer det inte att regna. Vidare, om hon säger att det kommer att blåsa med sannolikheten 50% och att det kommer att både regna och blåsa med sannolikheten 40%, får vi följande: Om man nu utbrister P(regnar) = 0.7 A P(blåser ) = 0.5 B P(regnar och blåser) = 0.4 A B P(regnar men blåser inte) = 0.7 0.4 = 0. A B c P(regnar inte men blåser) = 0.5 0.4 = 0.1 A c B Om det regnar eller blåser i morgon A B så går jag inte ut!, 1 Om man har en följd A 1, A 2,... av händelser som är sådana att det är omöjligt att alla händelserna inträffar samtidigt, så gäller då n. P(A 1 A 2... A n) 0 2

är det underförstått att om det både blåser och regnar, så går man naturligtvis inte heller ut. Med denna tolkning av eller, får vi Vidare är P(regnar eller blåser) = 0.4 + 0. + 0.1 = 0.8 A B P(det varken regnar eller blåser A c B c =(A b) c ) = 1 0.8 = 0.2 och P(det antingen regnar eller blåser) = 0. + 0.1 = 0.4 Genom att resonera som i exemplet får vi ett viktigt samband: Sats 1 För händelser, A och B, gäller Observera P(A B) = P(A) + P(B) P(A}{{ B} ). AB P(A eller B men inte bägge) = P(A) + P(B) 2P(AB). Som exempel på axiom b har vi, eftersom P(AB) 0, Följdsats 1 Booles olikhet P(A B) P(A) + P(B). För att kunna komma vidare behövs någon regel. Idén är följande: Om en händelse A medför en händelse B, så gäller Till exempel gäller i väderexemplet att P(A) P(B). P(regnar mycket) P(regnar). Exempel En punkt väljs på måfå i en kvadrat med sidan 1. I kvadraten har man ritat en cirkel med radien 1/2. Vad är sannolikheten att punkten hamnar inom cirkeln?

Förutsättningen tolkas så här: Om man delar in kvadraten i ett rutnät av lika stora kvadrater, så har dessa samma sannolikhet. Precis samma resonemang som används för att härleda att cirkelns area är πr 2, t ex genom att uppskatta med areorna av in- och omskrivna månghörningar, leder nu fram till P(hamna inom cirkeln) = cirkelns area kvadratens area = π(1/2)2 1 I grundläggande kurser räcker följande regel: = π 4. Om en händelse A kan approximeras genom att, som i cirkelexemplet, stänga in den mellan två händelser med givna sannolikheter på ett sådant sätt att det bara finns ett tänkbart värde på P(A), så tilldelar man P(A) detta värde. Hur man räknar.1 Ett exempel på problemställning Sannolikhetsteori handlar om att utgående från givna sannolikheter räkna ut andra. Tag som exempel att vi skall dimensionera hållfastheten hos en bro så att den tål den trafik den kommer att utsättas för. Hållfastheten hos just denna bro påverkas av slumpmässiga svagheter i materialet. Antag att man har kommit fram till att sannolikheten att bron håller för belastningen x ges av e x2 /100. Hur stor belastningen, som beror på trafiken, kommer att bli vet vi inte heller, men har fått uppgiften att sannolikheten att belastningen överstiger y ges av e y/5. Vår första regel är: Sannolikheten att en händelse inte inträffar är ett minus sannolikheten att den inträffar. Sannolikheten att belastningen är högst y ges alltså av 1 e y/5. Vidare är rimligtvis antalet bilar på bron och deras vikter oberoende av oupptäckta svagheter hos bron. Detta svarar matematiskt mot att händelsen att både hållfasthet större än x och belastning högst y har sannolikheten e x2 /100 (1 e y/5 ), dvs produkten av de enskilda sannolikheterna. Med hjälp av dessa uppgifter vill man beräkna sannolikheten att bron håller, dvs att hållfastheten är större än belastningen. 4

1 1 0.9 0.9 0.8 0.8 sannolikhet att hålla för x 0.7 0.6 0.5 0.4 0. sannolikhet att lasten överstiger y 0.7 0.6 0.5 0.4 0. 0.2 0.2 0.1 0.1 0 0 10 20 0 belastning x 0 0 10 20 0 belastning y Figure 1: Sannolikheten att bron håller för belastningen x är exp( x 2 /100) och sannolikheten att belastningen överstiger y är exp( y/5). Beteckningar: Slumpmässiga storheter som hållfasthet och belastning betecknas med X resp. Y, eller ξ (xi) resp. η (eta, uttalas äta), medan sannolikheten för en händelse skrivs som P(händelsen). Nu är P(X > x) = e x2 /100 P(Y > y) = e y/10 P(Y y) = 1 e y/10 P(X > x Y y) = P(X > x) P(Y y) eller P(ξ > x) = e x2 /100 där tecknet betyder och. Utgående från detta vill man beräkna med hjälp av räknereglerna och P(X > Y ) P(A c ) = 1 P(A) P(A B) = P(A) + P(B) P(A B) som kommer att förklaras senare. Problemet är ganska svårt och kan inte lösas förrän mot slutet av kursen Under tiden skall vi studera enklare exempel. 5

.2 Ett enklare exempel Man singlar slant två gånger. Det finns tre möjligheter till utfall: Krona bägge gångerna. Klave bägge gångerna. En av varje. För att räkna ut sannolikheterna resonerar man så här: Kalla mynten a och b. För mynt a finns det två möjligheter, bägge lika sannolika. Till var och en av dessa finns det två möjligheter för mynt b, återigen lika sannolika. ր ց Kr Kl ր ց ր ց Antal krona Kr 2 Kl Kr 1 Kl 0 Totalt finns det alltså fyra kombinationer, alla lika sannolika. Dessa har alltså sannolikheten 1/4. De ursprungliga utfallen har alltså sannolikheterna Krona bägge gångerna: Slh 1/4. Klave bägge gångerna: Slh 1/4. En av varje: Slh 1/4 + 1/4 = 1/2. Om antalet krona betecknas med X gäller alltså P(X = 0) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4. För antalet sexor vid två tärningskast är sannolikheterna P(X = 0) = 5 6 5 6 = 25 6, P(X = 1) = 5 6 1 6 +1 6 5 6 = 5 18 P(X = 2) = 1 6 1 6 = 1 6. Detta är exempel på binomialfördelning; man utgår från ett slumpmässigt försök som kan utfalla på två sätt och gör ett antal upprepningar av försöket, varefter man räknar antalet gånger det ena utfallet inträffat. Här är X ett exempel på en stokastisk variabel. Enligt gängse språkbruk står beteckningen X för två saker; i exemplet 6

1. dels förfarandet att räkna antalet gånger man får ett lyckat utfall, 2. dels ett tal som beror på slumpen, nämligen antalet lyckade utfall. En praktisk tillämpning av binomialfördelningen är vid opinionsundersökningar. Ur en stor population väljer man slumpmässigt ut ett antal personer och frågar om de är för eller emot i en viss fråga.. För varje person man väljer är sannolikheten att få en för -person lika med andelen för - personer i hela populationen. 4 Vad är sannolikheter? Nu har vi sett en del om hur man räknar med sannolikheter, men vad är sannolikhet egentligen? Rent matematiskt är sannolikhet ett mått. I analogi med att area är ett mått på hur stor en yta är, volym ett mått på hur stor en kropp är, vikt ett annat mått på hur stor en kropp är om man tar hänsyn till att tätheten (densiteten) varierar, kan man, grovt uttryckt, säga att sannolikhet ett mått på hur stor en händelse är med hänsyn till varierande trolighet. På samma sätt som man lär sig att handskas med derivator och integraler i matematiken för att sedan till exempel i fysiken använda dessa för att räkna på hastighet och tillryggalagd väg har räknandet med sannolikheter olika praktiska tolkningar: 1. Hur ofta en händelse inträffar i det långa loppet. Denna tolkning är den gängse i grundläggande kurser. 2. En mer eller mindre subjektiv bedömning av hur troligt det är att en händelse inträffar. Detta synsätt används i kurser i riskanalys.. Som ett konstruerat riskneutralt mått vid prissättning av finansiella derivat, t. ex. en option att på en marknad köpa en tillgång till ett i förväg fastställt pris. Detta finns på undervisningsprogram med finansiell avslutning. 5 Tillämpning på mätosäkerhet Som exempel skall vi ta minsta-kvadrat-metoden. 7

5.1 Oviktad minsta kvadrat Exempel: Man mäter de tre vinklarna i en triangel och får resultaten (uttryckta i gon).5 102.7 64.5 Att summan blir 200.7 och inte 200 beror på osäkerhet i mätningarna. För att justera resultatet betecknar man de teoretiska vinklarna med θ 1, θ 2 resp. 200 θ 1 θ 2 och använder minsta-kvadrat-metoden; välj θ:na så att Q = (.5 θ 1 ) 2 + (102.7 θ 2 ) 2 + (64.5 (200 θ 1 θ 2 )) 2 minimeras. För att söka minimum varierar man θ:na ett i taget och sätter derivatan lika med noll. Detta ger: Derivata när θ 1 varierar och θ 2 är fixt, Q θ 1 = 2(.5 θ 1 )( 1) + 2(64.5 200 + θ 1 + θ 2 ), och motsvarande när θ 2 varierar, Q θ 2 = 2(102.7 θ 2 )( 1) + (64.5 200 + θ 1 + θ 2 ). Sätter man derivatorna lika med noll och förenklar får man ekvationssystemet { 2θ1 + θ 2 =.5 + 200 64.5 θ 1 + 2θ 2 = 102.7 + 200 64.5. Lösningen är { θ1 =.5 200.7 200 θ 2 = 102.7 200.7 200. Den tredje vinkeln ges automatiskt av 200 θ 1 θ 2 = 64.5 200.7 200. Motsägelsen 200.7 200 = 0.7 fördelas alltså lika och subtraheras från mätvärdena. Vill man avrunda resultatet till en decimal subtraherar man lämpligen 0.2, 0., 0.2, så att summan av de utjämnade vinklarna blir exakt 200. Allmänt gäller att om de uppmätta vinklarna betecknas med x 1,x 2,x, ges den utjämnade vinkeln nr i av j=1 θ i = x i x j 200. 8

5.2 Viktad minsta kvadrat Man kan vikta på olika sätt; Ett exempel är: Längs en rät linje ligger punkterna A, B och C. Man har mätt sträckorna AB, BC och AC. Resultat: 4.5 46. 81. Här har vi motsägelsen 81. (4.5 + 46.) = 0.5 För längdmätningar är det vanligt att minimera Q = (4.5 θ 1) 2 4.5 + (46. θ 2) 2 46. Efter en del ganska trista räkningar får man 4.5 θ 1 = 4.5 + 4.5+46.+81. 0.5 46. θ 2 = 46. + 4.5+46.+81. 0.5 81. θ = 81. 4.5+46.+81. 0.5. + (81. (θ 1 + θ 2 )) 2. 81. Här korrigerar man tydligen proportionellt mot de uppmätta längderna. 5. Diskussion 1. Varför viktar man i andra fallet men inte i det första? (a) Har det något att göra med med att det är osäkrare att mäta långa längder än korta, medan osäkerheten i vinkelmätnigar är konstant? (b) Verkar ovanstående rimligt, med tanke på hur mätningar går till? (c) Varför viktar man just som man gör och hur beror osäkerheten på längden? För att svara på detta behövs sannolikhetsteori, speciellt standardavvikelse och varians. 2. Systematiska fel kontra slumpmässig osäkerhet.. Vad betyder θ? Längre fram kommer beteckningen θ att användas som beteckning på lösningen, t ex i första exemplet ges lösningen av { θ 1 = θ1 P = x 1 xi 200 =.5 200.7 200 θ 2 = θ2 P = x 2 xi 200 = 102.7 200.7 200. Detta för att man skall kunna beräkna hur de utjämnade värdena påverkas av osäkerhet i mätdata. 4. Derivata lika med noll är inte samma sak som minimum. 9

6 Gauss approximativa felfortplantningsformel Den anger hur osäkerhet i indata påverkar osäkerhet i utdata. Verktyg här är våntevärde och standardavvikelse som kommer i kursen, samt derivatan som ger hur mycket en liten förändring i indata påverkar utdata. 10