Om sannolikhet Bengt Ringnér August 27, 2007 1 Inledning Detta är introduktionsmaterial till kursen i matematisk statistik för lantmätarprogrammet vid LTH hösten 2007. 2 Sannolikhetsteori Sannolikhetsteori, eller snarare sannolikhetskalkyl, går ut på att man ur givna sannolikheter för vissa händelser räknar ut sannolikheter för andra händelser. Sannolikheten för en händelse skrivs P(händelsen), där P kommer av latinets motsvarighet till engelskans probability. Händelser kan sedan betecknas med bokstäver, t ex A, B, C, etc. Sannolikheter skall uppfylla följande axiom: 1. Sannolikheten för en händelse kan aldrig vara negativ. Detta skrivs P(A) 0. 2. Sannolikheten att en händelse inte inträffar är ett minus sannolikheten att den inträffar. I formelspråk: Av detta följer P(A) 1. P(A c ) = 1 P(A).. (a) Om två händelser, A och B, inte kan inträffa samtidigt, är sannolikheten att någon av dem inträffar lika med summan av de enskilda sannolikheterna, dvs P(A B) = P(A) + P(B). Av P(A A c ) = P(A) + P(A c ) = 1 följer att 1
i. en säker händelse har sannolikheten 1 och att ii. en omöjlig händelse har sannolikheten 1 1 = 0. (b) Om två händelser, A och B, har fått sannolikheter, måste också händelsen att bägge inträffar tilldelas sannolikhet, antingen genom P(A B) = P(A) P(B), om de är oberoende, eller P(A B) = 0, om de inte kan inträffa samtidigt, eller på något annat sätt. Om P(A B) är okänd kommer slutresultatet att bero på det okända värdet. 4. Ett tekniskt villkor 1 som vi inte går in närmare på. Exempel Om någon påstår att det är 70% sannolikhet för regn i morgon, har vederbörande indirekt sagt att med sannolikheten 0% kommer det inte att regna. Vidare, om hon säger att det kommer att blåsa med sannolikheten 50% och att det kommer att både regna och blåsa med sannolikheten 40%, får vi följande: Om man nu utbrister P(regnar) = 0.7 A P(blåser ) = 0.5 B P(regnar och blåser) = 0.4 A B P(regnar men blåser inte) = 0.7 0.4 = 0. A B c P(regnar inte men blåser) = 0.5 0.4 = 0.1 A c B Om det regnar eller blåser i morgon A B så går jag inte ut!, 1 Om man har en följd A 1, A 2,... av händelser som är sådana att det är omöjligt att alla händelserna inträffar samtidigt, så gäller då n. P(A 1 A 2... A n) 0 2
är det underförstått att om det både blåser och regnar, så går man naturligtvis inte heller ut. Med denna tolkning av eller, får vi Vidare är P(regnar eller blåser) = 0.4 + 0. + 0.1 = 0.8 A B P(det varken regnar eller blåser A c B c =(A b) c ) = 1 0.8 = 0.2 och P(det antingen regnar eller blåser) = 0. + 0.1 = 0.4 Genom att resonera som i exemplet får vi ett viktigt samband: Sats 1 För händelser, A och B, gäller Observera P(A B) = P(A) + P(B) P(A}{{ B} ). AB P(A eller B men inte bägge) = P(A) + P(B) 2P(AB). Som exempel på axiom b har vi, eftersom P(AB) 0, Följdsats 1 Booles olikhet P(A B) P(A) + P(B). För att kunna komma vidare behövs någon regel. Idén är följande: Om en händelse A medför en händelse B, så gäller Till exempel gäller i väderexemplet att P(A) P(B). P(regnar mycket) P(regnar). Exempel En punkt väljs på måfå i en kvadrat med sidan 1. I kvadraten har man ritat en cirkel med radien 1/2. Vad är sannolikheten att punkten hamnar inom cirkeln?
Förutsättningen tolkas så här: Om man delar in kvadraten i ett rutnät av lika stora kvadrater, så har dessa samma sannolikhet. Precis samma resonemang som används för att härleda att cirkelns area är πr 2, t ex genom att uppskatta med areorna av in- och omskrivna månghörningar, leder nu fram till P(hamna inom cirkeln) = cirkelns area kvadratens area = π(1/2)2 1 I grundläggande kurser räcker följande regel: = π 4. Om en händelse A kan approximeras genom att, som i cirkelexemplet, stänga in den mellan två händelser med givna sannolikheter på ett sådant sätt att det bara finns ett tänkbart värde på P(A), så tilldelar man P(A) detta värde. Hur man räknar.1 Ett exempel på problemställning Sannolikhetsteori handlar om att utgående från givna sannolikheter räkna ut andra. Tag som exempel att vi skall dimensionera hållfastheten hos en bro så att den tål den trafik den kommer att utsättas för. Hållfastheten hos just denna bro påverkas av slumpmässiga svagheter i materialet. Antag att man har kommit fram till att sannolikheten att bron håller för belastningen x ges av e x2 /100. Hur stor belastningen, som beror på trafiken, kommer att bli vet vi inte heller, men har fått uppgiften att sannolikheten att belastningen överstiger y ges av e y/5. Vår första regel är: Sannolikheten att en händelse inte inträffar är ett minus sannolikheten att den inträffar. Sannolikheten att belastningen är högst y ges alltså av 1 e y/5. Vidare är rimligtvis antalet bilar på bron och deras vikter oberoende av oupptäckta svagheter hos bron. Detta svarar matematiskt mot att händelsen att både hållfasthet större än x och belastning högst y har sannolikheten e x2 /100 (1 e y/5 ), dvs produkten av de enskilda sannolikheterna. Med hjälp av dessa uppgifter vill man beräkna sannolikheten att bron håller, dvs att hållfastheten är större än belastningen. 4
1 1 0.9 0.9 0.8 0.8 sannolikhet att hålla för x 0.7 0.6 0.5 0.4 0. sannolikhet att lasten överstiger y 0.7 0.6 0.5 0.4 0. 0.2 0.2 0.1 0.1 0 0 10 20 0 belastning x 0 0 10 20 0 belastning y Figure 1: Sannolikheten att bron håller för belastningen x är exp( x 2 /100) och sannolikheten att belastningen överstiger y är exp( y/5). Beteckningar: Slumpmässiga storheter som hållfasthet och belastning betecknas med X resp. Y, eller ξ (xi) resp. η (eta, uttalas äta), medan sannolikheten för en händelse skrivs som P(händelsen). Nu är P(X > x) = e x2 /100 P(Y > y) = e y/10 P(Y y) = 1 e y/10 P(X > x Y y) = P(X > x) P(Y y) eller P(ξ > x) = e x2 /100 där tecknet betyder och. Utgående från detta vill man beräkna med hjälp av räknereglerna och P(X > Y ) P(A c ) = 1 P(A) P(A B) = P(A) + P(B) P(A B) som kommer att förklaras senare. Problemet är ganska svårt och kan inte lösas förrän mot slutet av kursen Under tiden skall vi studera enklare exempel. 5
.2 Ett enklare exempel Man singlar slant två gånger. Det finns tre möjligheter till utfall: Krona bägge gångerna. Klave bägge gångerna. En av varje. För att räkna ut sannolikheterna resonerar man så här: Kalla mynten a och b. För mynt a finns det två möjligheter, bägge lika sannolika. Till var och en av dessa finns det två möjligheter för mynt b, återigen lika sannolika. ր ց Kr Kl ր ց ր ց Antal krona Kr 2 Kl Kr 1 Kl 0 Totalt finns det alltså fyra kombinationer, alla lika sannolika. Dessa har alltså sannolikheten 1/4. De ursprungliga utfallen har alltså sannolikheterna Krona bägge gångerna: Slh 1/4. Klave bägge gångerna: Slh 1/4. En av varje: Slh 1/4 + 1/4 = 1/2. Om antalet krona betecknas med X gäller alltså P(X = 0) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4. För antalet sexor vid två tärningskast är sannolikheterna P(X = 0) = 5 6 5 6 = 25 6, P(X = 1) = 5 6 1 6 +1 6 5 6 = 5 18 P(X = 2) = 1 6 1 6 = 1 6. Detta är exempel på binomialfördelning; man utgår från ett slumpmässigt försök som kan utfalla på två sätt och gör ett antal upprepningar av försöket, varefter man räknar antalet gånger det ena utfallet inträffat. Här är X ett exempel på en stokastisk variabel. Enligt gängse språkbruk står beteckningen X för två saker; i exemplet 6
1. dels förfarandet att räkna antalet gånger man får ett lyckat utfall, 2. dels ett tal som beror på slumpen, nämligen antalet lyckade utfall. En praktisk tillämpning av binomialfördelningen är vid opinionsundersökningar. Ur en stor population väljer man slumpmässigt ut ett antal personer och frågar om de är för eller emot i en viss fråga.. För varje person man väljer är sannolikheten att få en för -person lika med andelen för - personer i hela populationen. 4 Vad är sannolikheter? Nu har vi sett en del om hur man räknar med sannolikheter, men vad är sannolikhet egentligen? Rent matematiskt är sannolikhet ett mått. I analogi med att area är ett mått på hur stor en yta är, volym ett mått på hur stor en kropp är, vikt ett annat mått på hur stor en kropp är om man tar hänsyn till att tätheten (densiteten) varierar, kan man, grovt uttryckt, säga att sannolikhet ett mått på hur stor en händelse är med hänsyn till varierande trolighet. På samma sätt som man lär sig att handskas med derivator och integraler i matematiken för att sedan till exempel i fysiken använda dessa för att räkna på hastighet och tillryggalagd väg har räknandet med sannolikheter olika praktiska tolkningar: 1. Hur ofta en händelse inträffar i det långa loppet. Denna tolkning är den gängse i grundläggande kurser. 2. En mer eller mindre subjektiv bedömning av hur troligt det är att en händelse inträffar. Detta synsätt används i kurser i riskanalys.. Som ett konstruerat riskneutralt mått vid prissättning av finansiella derivat, t. ex. en option att på en marknad köpa en tillgång till ett i förväg fastställt pris. Detta finns på undervisningsprogram med finansiell avslutning. 5 Tillämpning på mätosäkerhet Som exempel skall vi ta minsta-kvadrat-metoden. 7
5.1 Oviktad minsta kvadrat Exempel: Man mäter de tre vinklarna i en triangel och får resultaten (uttryckta i gon).5 102.7 64.5 Att summan blir 200.7 och inte 200 beror på osäkerhet i mätningarna. För att justera resultatet betecknar man de teoretiska vinklarna med θ 1, θ 2 resp. 200 θ 1 θ 2 och använder minsta-kvadrat-metoden; välj θ:na så att Q = (.5 θ 1 ) 2 + (102.7 θ 2 ) 2 + (64.5 (200 θ 1 θ 2 )) 2 minimeras. För att söka minimum varierar man θ:na ett i taget och sätter derivatan lika med noll. Detta ger: Derivata när θ 1 varierar och θ 2 är fixt, Q θ 1 = 2(.5 θ 1 )( 1) + 2(64.5 200 + θ 1 + θ 2 ), och motsvarande när θ 2 varierar, Q θ 2 = 2(102.7 θ 2 )( 1) + (64.5 200 + θ 1 + θ 2 ). Sätter man derivatorna lika med noll och förenklar får man ekvationssystemet { 2θ1 + θ 2 =.5 + 200 64.5 θ 1 + 2θ 2 = 102.7 + 200 64.5. Lösningen är { θ1 =.5 200.7 200 θ 2 = 102.7 200.7 200. Den tredje vinkeln ges automatiskt av 200 θ 1 θ 2 = 64.5 200.7 200. Motsägelsen 200.7 200 = 0.7 fördelas alltså lika och subtraheras från mätvärdena. Vill man avrunda resultatet till en decimal subtraherar man lämpligen 0.2, 0., 0.2, så att summan av de utjämnade vinklarna blir exakt 200. Allmänt gäller att om de uppmätta vinklarna betecknas med x 1,x 2,x, ges den utjämnade vinkeln nr i av j=1 θ i = x i x j 200. 8
5.2 Viktad minsta kvadrat Man kan vikta på olika sätt; Ett exempel är: Längs en rät linje ligger punkterna A, B och C. Man har mätt sträckorna AB, BC och AC. Resultat: 4.5 46. 81. Här har vi motsägelsen 81. (4.5 + 46.) = 0.5 För längdmätningar är det vanligt att minimera Q = (4.5 θ 1) 2 4.5 + (46. θ 2) 2 46. Efter en del ganska trista räkningar får man 4.5 θ 1 = 4.5 + 4.5+46.+81. 0.5 46. θ 2 = 46. + 4.5+46.+81. 0.5 81. θ = 81. 4.5+46.+81. 0.5. + (81. (θ 1 + θ 2 )) 2. 81. Här korrigerar man tydligen proportionellt mot de uppmätta längderna. 5. Diskussion 1. Varför viktar man i andra fallet men inte i det första? (a) Har det något att göra med med att det är osäkrare att mäta långa längder än korta, medan osäkerheten i vinkelmätnigar är konstant? (b) Verkar ovanstående rimligt, med tanke på hur mätningar går till? (c) Varför viktar man just som man gör och hur beror osäkerheten på längden? För att svara på detta behövs sannolikhetsteori, speciellt standardavvikelse och varians. 2. Systematiska fel kontra slumpmässig osäkerhet.. Vad betyder θ? Längre fram kommer beteckningen θ att användas som beteckning på lösningen, t ex i första exemplet ges lösningen av { θ 1 = θ1 P = x 1 xi 200 =.5 200.7 200 θ 2 = θ2 P = x 2 xi 200 = 102.7 200.7 200. Detta för att man skall kunna beräkna hur de utjämnade värdena påverkas av osäkerhet i mätdata. 4. Derivata lika med noll är inte samma sak som minimum. 9
6 Gauss approximativa felfortplantningsformel Den anger hur osäkerhet i indata påverkar osäkerhet i utdata. Verktyg här är våntevärde och standardavvikelse som kommer i kursen, samt derivatan som ger hur mycket en liten förändring i indata påverkar utdata. 10