Matematisk statistik

Relevanta dokument
Grundläggande matematisk statistik

TAMS79: Föreläsning 1 Grundläggande begrepp

Sannolikhetsbegreppet

Kap 2: Några grundläggande begrepp

Matematisk statistik - Slumpens matematik

F2 SANNOLIKHETSLÄRA (NCT )

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

Matematisk statistik 9hp för: C,D,I, Pi

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Föreläsning 1, Matematisk statistik Π + E

Övning 1 Sannolikhetsteorins grunder

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

Kombinatorik och sannolikhetslära

TMS136. Föreläsning 1

TMS136. Föreläsning 2

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

Statistikens grunder HT, dagtid Statistiska institutionen

Föreläsning 1, Matematisk statistik för M

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

1 Mätdata och statistik

SF1901: Sannolikhetslära och statistik

Föreläsning 1. Grundläggande begrepp

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Föreläsning G70, 732G01 Statistik A

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

4 Diskret stokastisk variabel

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

3 Grundläggande sannolikhetsteori

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

Grundläggande matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

TMS136. Föreläsning 1

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning G70 Statistik A

Slumpförsök för åk 1-3

TMS136. Föreläsning 2

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Satsen om total sannolikhet och Bayes sats

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

Föreläsning 2, Matematisk statistik för M

F3 SANNOLIKHETSLÄRA (NCT ) För komplementhändelsen A till händelsen A gäller att

Statistik 1 för biologer, logopeder och psykologer

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

Betingad sannolikhet och oberoende händelser

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

FMS012/MASB03: Matematisk statistik 9.0 hp för F+fysiker Föreläsning 1: Sannolikhet

Om statistisk hypotesprövning

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

SF1914/SF1916: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Föreläsning 1: Introduktion

Stora talens lag eller det jämnar ut sig

Matematisk statistik för D, I, Π och Fysiker. Matematisk statistik slumpens matematik. Tillämpningar för matematisk statistik.

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Reliability analysis in engineering applications

Föreläsning 1: Introduktion

4.1 Grundläggande sannolikhetslära

Uppgifter 6: Kombinatorik och sannolikhetsteori

SF1901: Sannolikhetslära och statistik

Introduktion till statistik för statsvetare

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men

MATEMATIKENS SPRÅK. Avsnitt 1

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor

Mängdlära. Kapitel Mängder

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsning 2, FMSF45 Slumpvariabel

Lektionsanteckningar 11-12: Normalfördelningen

Om sannolikhet. Bengt Ringnér. August 27, Detta är introduktionsmaterial till kursen i matematisk statistik för lantmätarprogrammet

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Mängder, funktioner och naturliga tal

Matematisk statistik for B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale. Forel.

Matematisk statistik fo r B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale.

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Konvergens och Kontinuitet

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Mer om kontinuitet. Kapitel K. K.1 Övre och undre gräns

Föreläsning 1: Introduktion

Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden.

Experimentera i sannolikhet från teoretisk sannolikhet till data

Transkript:

Matematisk statistik för STS vt 2004 2004-03 - 23 Bengt Rosén Matematisk statistik Ämnet matematisk statistik omfattar de två delområdena Sannolikhetsteori Statistikteori Bloms A - bok behandlar sannolikhetsteori, och B - boken statistikteori. Det specifika för ämnet matematisk statistik, och det som knyter ihop ovanstående delområden, är begreppet slump. Kortfattat kan sägas att ämnet går ut på att tillhandahålla ; En matematisk apparat för att räkna på hur slumpen slår. Förfaranden som hjälper en att inte bli vilseledd av "slumpens spel" när man vill dra slutsatser från slumpstörda data. Om slump Att det finns något som vi kallar slump ingår i våra vardagserfarenheter och i vardagsspråket. Man behöver inte ha läst matematisk statistik för att följande utsagor skall låta meningsfulla. Sannolikheten att få en dubbelsexa när man kastar två tärningar är 2.8 %. Chansen att få 13 rätt på ett "sömmersketips" är 1 på 1.6 miljoner. Det är mer än 75 % risk att det regnar imorgon. Orden sannolikhet, chans och risk används fortsättningsvis som synonymer, men med litet nyansskillnad. Sannolikhet är det neutrala ordet. Risk används företrädesvis i anslutning till otrevliga händelser, och chans i anslutning till trevliga. Människan har ju länge tagit sig fram i en värld full av slump. Exempel ; Vädret om två dagar, Könet på ett nyfött barn, Antal kattungar i en kull, Var en pil träffar på en måltavla, Årets skördeutfall, Resultatet av en slantsingling. Vi har ju klarat oss rätt bra i denna värld full av slump. Då skulle man kunna tro att vi utvecklat god intuition för slumpens spel, att vi "känner på oss" hur slumpen slår. Gör vi det? Därom kan man kanske tvista, men det är nog faktiskt så att vi har förvånande dålig intuition för slumpens spel, att vi faktiskt är "lättlurade av slumpen". Det nyss sagda skall motiveras med ett par exempel, men först formuleras följande konsekvens av att vår intuition för "slumpens spel" är bräcklig. Sensmoral : Vill man undvika att bli "lurad av slumpen", måste man kunna räkna objektivt på hur den slår. Matematisk statistik tillhandahåller en begrepps - och metodvärld för detta. 1

Exempel 1 : En slant skall singlas 100 gånger, med "krona" och "klave" som möjliga utfall i en enskild slantsinglig. a) Hur många klave kommer man att få på ett ungefär? b) Hur stor är chansen att man får minst 57 klave? På fråga a) svarar de flesta utan längre betänketid : Cirka 50 (vilket är rätt svar). Så långt hänger intuitionen med. På b) - frågan brukar svaren bli rejält varierande, det mesta mellan 0 % och 100 % brukar förekomma. Den frågan klarar man inte av att besvara på ren intuition. Exempel 2 : Man har två likadana instrument, A och B, vilka används för samma slag av mätningar. Det ena används till att mäta "före" (behandling av något slag) och det andra till att mäta "efter". Instrumenten mäter inte perfekt, utan mätvärdena är förenade med slumpmässiga mätfel. Nivån på värdena antas spela mindre roll i sammanhanget, det viktiga är skillnaden mellan värdena före och efter. Det är därför viktigt att instrumenten mäter lika i genomsnitt. Det kan dock inträffa att deras mätnivåer förskjuts i förhållande till varandra. Vid ett tillfälle vill man utröna om förskjutning eventuellt inträffat. På en homogen lösning gjordes fyra oberoende mätningar med vart och ett av instrumenten med följande resultat : Mätvärden för instrument A : 10.8, 12.3, 9.6, 11.7, Mätvärden för instrument B : 13.1, 11.9, 14.3, 13.9, Fråga : Mäter instrumenten i genomsnitt lika? För att svara på frågan är det (väl?) naturligt att börja så här, och man behöver inte ha läst matematisk statistik för att tycka att det verkar allmänt vettigt. Medelvärde för A - mätningarna : (10.8 + 12.3 + 9.6 + 11.7) / 4 = 11.1. Medelvärde för B - mätningarna : (13.1 + 11.9 + 14.3 + 13.9) / 4 = 13.3. En tänkbar slutsats blir : B mäter i genomsnitt 13.3-11.1 = 2.2 enheter högre än A. Man får dock litet kalla fötter om man gör den utsagan till ett tvärsäkert påstående. Det finns ju slump med, som "stökar till", vilket illustreras i figuren nedan. Det är kanske bara en tillfällighet att medelvärdena blev olika. A - mätvärden B - mätvärden Som vi kommer att se i statistikteorin kan man räkna sig fram till följande slutsats. Det är till 95 % säkert att en B - mätning i genomsnitt ligger någonsans mellan 0.25 och 4.1 enheter högre än en A - mätning. Efter en sådan kalkyl känner man sig åtskilligt säkrare i ett påståendet om att instrumenten ligger fel i förhållande till varandra. Sensmoralen är en upprepning av den tidigare. Vill man undgå att bli vilseledd av slumpen, måste man kunna räkna på den. 2

Allmänt om matematiska modeller För att kunna räkna på ett skeende i "verkligheten" måste man först ställa upp en s. k. matematisk modell för skeendet ifråga. Vi är framför allt intresserade av matematiska modeller för slumpskeenden. Matematiska modeller är dock inte specifikt för slumpskeenden. Nuförtiden finns, och används, matematiska modeller för det mesta här i världen, väder, jordbävningar, trafikflöden, arternas uppkomst, och mycket mer. För att ge bakgrund för matematiska modeller för slumpskeenden börjar vi med några allmänna ord om matematiska modeller. Allra först skall sägas att en matematisk modell inte kan bekriva verkligheten i dess helhet, bara någon avgränsad aspekt på den. Annars blir modellen helt ohanterlig. Nedan illustreras högst allmänt hur modell och verklighet hänger ihop med varandra. Verkligheten "Lexikon" Anger hur verkligheten och de matemamatiska objekten i modellen relaterar till varandra. Matematisk modell Ingredienser En uppsättning matematiska objekt (funktioner, matriser, mängder, punkter, el. dyl.). Vissa (matematiska) samband mellan objekten i modellen förutsätts gälla. (Förutsättningar, antaganden, postulat, premisser, axiom är synonymer som används.) Spelregler Matematiska resonemang får användas för att härleda ytterligare egenskaper hos och samband mellan modellens objekt. Utsaga om verkligheten. Översätts med hjälp av lexikonet. Härlett värde, relation el. dyl. 3

Exempel. Matematisk modell för fallande kroppars rörelse Verklighet Matematisk modell "Lexikon" y(t) står för stenens höjd över marken t sekunder efter det att den släppts. T står för den tid det tar för stenen att slå i backen. Objekt y(t), 0 t T är en reellvärd funktion Samband y '' (t) = 9.81, 0 t T. (Newtons andra lag) y(0) = 50, y ' (0) = 0, Härledningar Med användande av integraloch differentialkalkyl fås t.ex följande : y(t) = 50-9.81 t 2 /2, t T, som ger att T satisfierar 0 = 50-9.81 T 2 /2, som ger Det tar 3.2 sekunder för stenen att falla till marken. T 50 2 / 9. 81 3.19 4

Allmän struktur för matematiska modeller för slumpskeenden De specifika förhållandena för ett skeende / försök där slumpen är med i spelet är : (i) Man kan inte med säkerhet säga vad resultatet / utfallet av försöket kommer att bli, flera olika utfall är möjliga. (ii) Till händelser som kan inträffa vid försöket kan associeras talvärda sannolikheter för att händelserna ifråga inträffar. Det är denna typ av situation vi vill beskriva inom den allmänna ramen för en matematisk modell. Det görs nedan. Verklighet För ett försök/skeende föreligger flera olika möjliga utfall. Olika händelser kan inträffa. Sannolikheter (chanser, risker) "Lexikon" listar / förtecknar alla utfall som är möjliga när försöket utförs En viss händelse inträffar om utfallet ingår i delmängden A. P(A) är sannolikheten för att händelsen A inträffar. Matematisk modell Objekt Utfallsrum. Som matematiskt objekt är det bara en angiven (grund)mängd. Delmängder av utfallsrummet. Betecknas typiskt A, B, C, Sannolikhetsmåttet (eller bara sannolikheten) P()ordnar ett tal till varje delmängd av. (Mer formellt : P() är en funktion med definitionsområde = alla delmängder av.) SAMBAND Samband som alltid skall vara uppfyllda är de s.k. Kolmogorovska sannolikhetsaxiomen. De formuleras och diskuteras nedan. 5

Vad skall man då ställa för krav på en funktion P() som skall återspegla begreppet sannolikhet? Det man har i tankarna när man talar om sannolikheten (chansen / risken) för en händelse är (väl?) någonting i följande stil. Sannolikheten för en händelse anger den andel gånger som händelsen inträffar om det aktuella försöket utförs många gånger under (åtminstone tillsynes) likadana betingelser. Med andra ord. Sannolikheten för en händelse är den relativa frekvensen för händelsens inträffande i det "långa loppet". Antal gånger händelsen A inträffar Relativ frekvens för händelsen A =. Antal utföranden av försöket Det kan verifieras empiriskt att sådana relativa frekvenser stabiliserar sig kring, eller synonymt konvergerar mot bestämda tal när antalet försök växer. Sådana gränsvärden uppfattar vi som sannolikheterna för händelserna ifråga. Saken illustreras i figuren nedan, som är hämtad från sida 22 i Blom. Litet oprecist talar man om att slumpen jämnar ut sig i det långa loppet. De Kolmogorovska axiomen När man nu vill att (den matematiska) sannolikheten P() skall återspegla "relativa frekvenser i långa loppet", vad ställer det för (minimi)krav på funktionen P()? Svaret ges av det som kallas Kolmogorovs axiomsystem, vilket formuleras nedan. Först preciseras en term. Händelser som inte kan inträffa samtidigt sägs vara oförenliga. Förekommande synonymer är ömsesidigt uteslutande och disjunkta. I den matematiska modellen formuleras detta som att A B = (= tomma mängden). Kolmogorovs axiomsystem (Blom sid 24) Axiom 1 : För varje händelse A gäller att 0 P(A) 1. Axiom 2 : För hela utfallsrummet (= den säkra händelsen) gäller P() = 1. Axiom 3 : ("Additionsformeln") För oförenliga händelser A och B gäller ; P(AB) = P(A) + P(B). 6

Vad innebär sannolikhetsaxiomen om P() tolkas som relativ frekvens (och antalet försök ännu inte hunnit till oändligheten)? Axiom 1 innebär att en relativ frekvens skall ligga någonstans mellan 0 och 1 (gränserna inklusive). Att så är fallet är väl självklart. Axiom 2 innebär att händelsen "utfallet blir något av de möjliga utfallen" har relativ frekvens = 1. Det har den naturligtvis, eftersom något av de möjliga utfallen måste inträffa varje gång försöket utförs. Härnäst några ord om Axiom 3. När händelserna A och B är oförenliga gäller ; Relativ frekvens för händelsen A B = Antal gånger A B inträffar = Antal utföranden av försöket (i detta steg kommer förutsättningen om oförenlighet in) = Antal gånger A inträffar Antal gånger B inträffar = Antal utföranden av försöket Antal gånger A inträffar + Antal utföranden av försöket Antal gånger A inträffar = Antal utföranden av försöket = Relativ frekvens för A + Relativ frekvens för B. Axiom 3 säger att ovanstående för relativa frekvenser självklara räkneregel också skall gälla för sannolikheter. Några kommentarer till sannolikhetsaxiomen Kommentar 1 : I den "riktigt stringenta" sannolikhetsteorin ges Axiom 3 en något skarpare form, enligt Axiom 3' på sida 24 i Blom. Vi kommer dock inte att bekymra oss om vad det egentligen är för skillnad på Axiomen 3 och 3'. Kommentar 2 : Varifrån skall då numeriska värden på sannolkheter P(A) hämtas? Det allmänna svaret på den frågan är att sannolikheter är empiriska storheter, som bara "verkligheten" kan tillhandahålla. I det allmänna fallet kan man inte kan sitta vid skrivbordet och spekulera sig fram till värden på sannolikheter. Under tilläggsantaganden kan man dock göra det, och det kommer vi till. Kommentar 3 : Det som hittills sagts om sannolikhetsrum (, P) har nästan karaktär "att krångla till det självklara". För att någonting rejält intressant skall kunna räknas fram, måste ytterligare antaganden om (, P) göras. Då handlar detframför allt om ytterligare antaganden om hur sannolikheterna för olika händelser är relaterade till varandra. Den viktigaste varianten härvidlag är att händelser inträffar oberoende av varandra. Vi kommer snart till det. Svar på fråga b) i Exempel 1. Svaret är 9.7 %. Det ges av nedanstående tämligen mystifika integral. För tillfället är syftet bara att illustrera att slumpen följer högst intrikata lagar, men ni kommer förhoppningsvis att begripa beräkningen om en månad. Sannolikheten att antalet klave 57 57 100 (1/ 2) 1/ 2 1 1 100 2 2 1 2 x / 2 e 2 dx 9.7 %. 7

Från de Kolmogorovska sannolikhetsaxiomen kan diverse följdsatser härledas. Sådana finns på sidorna 24-26 i Bloms bok. Sats 0 : För (parvis) oförenliga händelser A 1, A 2,, A n gäller P(A 1 A 2 A n ) = P(A 1 ) + P(A 2 ) + + P(A n ). Sats 1 (Komplementsatsen, Blom, sidan 24) : P(CA) = [kan också skrivas P(A*)] = 1 - P(A). Sats 1': P() = 0. Sats 2 (Additionssatsen för två händelser, Blom, sidan 24) : P(A B) = P(A) + P(B) - P(A B). Sats 2' (Additionssatsen för tre händelser, Blom, sidan 25) : P(A B C) = = P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) - P(A B C). Sats 3 (Booles olikhet, Blom, sida 25) : P(A B) P(A) + P(B). ---------------------------------- Slumpförsök med ändligt många möjliga utfall Hur kan då ett sannolikhetsmått P() egentligen se ut? Svaret är att det beror av hur utfallsrummet ser ut, särskilt av dess kardinalitet ( = hur många element det innehåller). Vi börjar med det enklaste fallet, och betraktar ett sannolikhetsrum (, P) där är en ändlig mängd, dvs. att slumpförsöket har ändligt många möjliga utfall ; = {u 1, u 2, u 3,..., u N }. Följande elementarsannolikheter p() för de enskilda utfallen införs ; p(u i ) = P({u i }). i = 1, 2, 3,..., N. Vad är det då för skillnad mellan funktionerna p() och P()? Den substantiella skillnaden är att P() är en funktion med delmängder av som definitionsområde, medan p() är en funktion som har självt som definitionsområde. Man kan (utan större svårighet) visa att när utfallsrummet är ändligt måste följande relation mellan sannolikheten P() och elementarsannolikheterna gälla ; För händelsea A gäller : Från (1) och Axiom 2 följer ; P(A) u i A p(u i ). (1) P() = p(u 1 ) + p(u 2 ) + p(u 3 ) +... + p(u N ) = 1. (2) Nyssnämnda stek (1) + (2) kan också vändas på, enligt nedan. Låt p(u 1 ), p(u 2 ),..., p(u N ) vara godtyckliga icke - negativa tal som satisfierar (2), och definiera P() via (1). Då blir P( ) en sannolikhet på, dvs. P( ) satisfierar Axiomen 1-3. 8

Likformig sannolikhetsfördelning En sannolikhet P() på ett ändligt utfallsrum = {u 1, u 2, u 3,..., u N } sägs vara en likformig sannolikhetsfördelning om alla elementarsannolikheter är lika stora, dvs. om vart och ett av de möjliga utfallen har samma sannolikhet. Under den förutsättningen följer från (2), med # för kardinalitet (= antal element i); 1 1 1 p(u i ), i = 1, 2,..., N. (3) # Antalet möjliga utfall N Från (1) och (3) följer resultatet (4) nedan, vilket kallas den klassiska sannolikhetsdefinitionen (Sats 4 på sidan 28 i Blom) ; # A Antalet för händelsen A gynnsamma utfall P(A) p(u i ). (4) # Antalet möjliga utfall ia ----------------- Kommentar : Förutsättningen om likformig sannolikhetsfördelning brukar på "vardagssvenska" formuleras som att ett av de möjliga utfallen väljs på måfå. Kommentar : Finns det skäl att tro att den likformiga sannolikhetsfördelningen ger realistisk beskrivning av vissa slumpskeenden i verkligheten? Ibland upplevs det som mer eller mindre självklart "av symmetriskäl" att så är fallet. Saken illustreras i exemplet nedan. Exempel : Betrakta kast med en perfekt kubiskt tärning. Här är alla sex sidorna "symmetriska", bortsett från att olika många prickar målats på dem). På grund av symmetrin finns inget skäl att någon viss av sidorna i långa loppet skulle komma upp oftare än någon annan. Om man kunde ge argument för att så vore fallet skulle, på grund av symmetrin, argumentet kunna användas för var och en av sidorna, och leda till slutsatsen att var och en av sidorna kommer upp oftare än de andra. Det går inte ihop, enda möjligen är att sidorna i långa loppet kommer upp lika ofta. Eftersom elementarsannolikheterna, enligt (2), skall summera sig till 1 måste var och en vara = 1 / (antalet sidor) = 1/6, vilket också stämmer med empirisk erfarenhet. Däremot, kastas en sned och vind tärning finns inte symmetriskäl för att elementarsannolikheterna skall vara lika stora, och brukar heller inte vara vid empirisk prövning. ------------------------- Om kombinatorik När man vill använda formeln (4) gäller det att beräkna # A och #, dvs. antalet utfall som ingår i händelsen A respektive i hela utfallsrummet. Att beräkna sådana antal kan ibland vara krångligt. Hjälp fås av det som sägs i Avsnitt 2.7 i Blom. Slumpförsök med uppräkneligt oändligt många möjliga utfall Det som sägs ovan om hur ett sannolikhetsmått kan se ut när utfallsrummet är ändlig generaliserar sig på högst naturligt sätt till fallet när är uppräkneligt oändligt. Exempel : Man registrerar antalet partiklar som sänds ut av ett radioaktivt ämne under en minut, och detta antal utgör utfallet av det aktuella slumpförsöket. De möjliga utfallen är då något av 0, 1, 2, osv. Man kan dock inte ange ett otvetydigt högsta möjliga värde för utfallet, utan håller öppet för alla eventualiteter genom att välja utfallsrummet som den (numrerbart) oändliga mängden = {0, 1, 2, 3, }. 9

Låt (, P) vara ett sannolikhetsrum där är en uppräkneligt oändlig mängd ; = {u 1, u 2, u 3,... }. Inför följande elementarsannolikheter (vilka bestäms av P) ; p(u i ) = P({u i }). i = 1, 2, 3,.... Då gäller att sannolikhetsmåttet P och elementarsannolikheterna satisfierar ; För händelsen A gäller : P(A) u i A Som konsekvens av (5) och Axiom 2 gäller ; p(ui ). (5) p(u 1 ) + p(u 2 ) + p(u 3 ) +... = 1. (6) Nyssnämnda stek kan också vändas på. Låt p(u 1 ), p(u 2 ), p(u 3 ),... vara godtyckliga icke - negativa tal som satisfierar (6) och definiera P() via (5). Då blir P( ) en sannolikhet på. Kommentar : Likformig sannolikhetsfördelning har dock ingen motsvarighet i fallet med uppräkneligt oändligt utfallsrum. Det går inte att fördela en total sannolikhet 1 lika på oändligt många möjligheter. Slumpförsök med kontinuerligt oändligt många möjliga utfall Här handlar det om frågeställningar som i enkel variant kan formuleras så här. Hur formulerar man en matematisk modell för att "helt på måfå" välja ett reellt tal mellan 0 och 1? Vad skall man mena med händelser, och hur skall man införa sannolikheter? Om man efterstävar full matematisk stringens i detta slags sammanhang råkar man ut för mycket krångliga saker. Så krångliga, att Blom väljer att inte säga någonting. Problematiken skjuts upp till avsnittet om stokastiska variabler. ----------------- Betingad sannolikhet och oberoende händelser Här införs ett par centrala begrepp inom sannolikhetsteorin, nämligen "oberoende händelser" och "betingad sannolikhet". Vi börjar vi med ett exempel, där begreppet sannolikhet konkretiseras på litet annorlunda sätt än tidigare, vilket varit som "relativa frekvenser i långa loppet". Denna alternativa konkretisering ansluter till den klassiska sannolikhetsdefinitionen, och lyder på följande sätt. När ett objekt dras på måfå från en stor population gäller ; Sannolikheten att en viss händelse inträffar = = den andel av objekten i populationen som gör att händelsen inträffar. Ett exempel Låt populationen vara "alla sysselsatta i Sverige, med ålder mellan 30 och 65 år", och låt frågan av intresse vara : Föreligger beroende mellan att vara chef (enligt någon definition på chef, som vi inte försöker precisera) och att vara kvinna? 10

Hur skulle man kunna besvara frågan om man hade all världens undersökningsresurser? Jo, genom att intervjua alla personer i populationen och sedan räkna fram följande storheter ; Antalet personer i populationen = N, Antalet kvinnor i populationen = N k, Antalet chefer i populationen = C, Antalet kvinnliga chefer i populationen = C k. Därefter skulle man kunna räkna ut följande saker ; C Andelen chefer i populationen a c. N C Andelen kvinnor i populationen a k. N Ck Andelen chefer bland kvinnorna i populationen a kc. N k Sedan skulle man kunna jämföra andelarna a c och a kc, och dra slutsats enligt nedan ; Om a kc = a c säger man att det föreligger oberoende mellan att vara kvinna och att vara chef. Om a kc < a c säger man att kvinnor är underrepresenterade som chefer. Om a kc > a c säger man att kvinnor är överrepresenterade som chefer. Än så länge har resonemanget inte haft något med sannolikheter att göra. Det har bara handlat om hur ord används, särskilt hur ordet "oberoende" används. Nu anlägger vi sannolikhetsaspekter, och betraktar situationen att en person väljs på måfå ur populationen. Då kan bl.a. följande händelser inträffa ; A: Den utvalda personen är chef, B: Den utvalda personen är kvinna. "På måfå" innebär att vi förutsätter att den klassiska sannolikhetsdefinitionen är tillämplig, vilket ger ; P(A) = N C, P(B) = N N k, P(A B) = N C k. Vid litet eftertanke inses att andelen a kc kan skrivas ; a kc = andel chefer givet att det handlar om kvinnor = C = N k k Ck/N P(A B). N /N P(B) Med den formeln som bakgrund görs följande allmänna definition. DEFINITION : (Blom sidan 33) Den betingade sannolikheten för händelsen A givet att händelsen B inträffar, betecknad P(A B), är ; P(A B) P(A B). P(B) k 11

Härnäst skall vi se hur villkoret a kc = a c, vilket vi uppfattar som att det föreligger oberoende (i vardagsspråklig mening) mellan "att vara kvinna" (A) och "att vara chef" (B), återspeglar sig i termer av sannolikheter. Från relationerna ; a kc Ck Ck /N P(A B) C och a P(A) N N / N P(B) c N k k fås att relationen a kc = a c är ekvivalent med P(A B) = P(A) P(B). Med den formeln som bakgrund görs följande allmänna definition. DEFINITION : (Blom sidan 37) Två händelser A och B sägs vara oberoende om ; P(A B) = P(A) P(B). Kommentar : Även om vi konkretiserade begreppen betingad sannolikhet och oberoende händelser i en situation där den klassiska sannolikhetsdefinitionen är tillämplig är ovanstående definitioner generella, dvs. de gäller oavsett om P() kan uppfattas enligt klassisk definition eller ej. Kommentar : (Ansluter till det Blom säger i Anmärkning 2 på sidan 21). Helt allmänt gäller när man "bygger" en matematisk modell att saker blir redigast om man använder olika ord för en företeelse i "verkligheten" och dess motsvarighet i den matematiska modellen. "Lexikonet" får sedan hjälpa en att korrespondera dem. Å andra sidan gäller också att en matematisk modell blir mer "livfull" om man använder verklighetens ord också i modellen, men risk uppstår då att man inte riktigt vet på vilken sida, i verkligheten eller i modellen, en utsaga är avsedd att höra hemma. Se upp! Ifråga om termen oberoende syndas mot rekommendationen att ha olika ord på de två sidorna. "Oberoende" ingår i vårt vardagsspråk (dvs. hör till "verkligheten") och dessutom införs det som teknisk term för att en viss matematisk relation är uppfylld, nämligen relationen P(A B) = P(A) P(B). Definitionen av oberoende händelser utvidgas på sidorna 38 och 39 i Blom till situationer med inte bara två händelser, utan godtyckligt många. För att tre händelser A, B och C skall vara oberoende (i sannolikhetsteoretisk mening) kräver man inte bara att följande relation P(A B C ) = P(A) P(B) P(C) är uppfylld, utan även att "parvis oberoende" skall föreligga, med vilket menas att följande relationer är uppfyllda ; P(A B) = P(A) P(B), P(A C) = P(A) P(C), P(B C) = P(B) P(C). För att en allmän uppsättning av händelser skall vara oberoende händelser krävs att "multiplikativitetsegenskapen" skall föreliga för vilket som helst utplock av av händelser från uppsättningen ifråga. Följande resultat gäller, och bevisas i Blom, sida 39. SATS : Om A, B, C,. är oberoende händelser så är också A*, B*, C*,. oberoende händelser.(* står för komplementhändelse) Likaså är A, B*, C*,. och A*, B, C*,. o.dyl. oberoende händelser. Man kan byta vilka som helst av händelserna mot sina komplementhändelser, och det handlar fortfarande om oberoende händelser. 12

SATS : Låt A 1, A 2,, A n vara oberoende händelser, och sätt P(A i ) = p i. Då är sannolikheten att minst en av dem inträffar ; 1 - (1 - p 1 ) (1 - p 2 ) (1 - p n ). För den sista satsen finns, som sagt, bevis i Blom. Den viktiga observationen är att händelsen "minst en av A 1, A 2,, A n inträffar" är komplementhändelsen till "ingen av A 1, A 2,, A n inträffar", vilken är A1* A* 2... A* n, samt att A 1 *, A 2 *,, A n * är oberoende händelser. Kommentar : När man skall ange en matematiska modell (, P) för ett empiriskt slumpförsök är det vanligt att man specificerar sannolikhetsmåttet P() genom att, förutom att kräva att P() skall satisfiera sannolikhetsaxiomen, förutsätter att vissa angivna händelser är (sannolikhetsteoretiskt) oberoende. Hur skall verklighetssituationen vara för att detta skall vara en realistisk förutsättning? Det är svårt att ge ett enkelt och precist svar på frågan. Litet svepande formulerat gäller följande. Om man anser att vissa händelser inträffar oberoende av varandra, med "oberoende" tolkat i vardagsspråkets mening (= händelserna har inte med varandra att göra), så får man en realistisk sannolikhetsmodell om man förutsätter att händelserna ifråga också är oberoende i sannolikhetsteoretisk mening. ------------------------- För betingade sannolikheter finns ett par viktiga resultat nämligen ; Satsen om totala sannolikheten. Sats 5 på sidan 35 i Blom. Bayes sats. Sats 6 på sidan 36 i Blom. 13