Bayes statistik - utan förkunskaper - utan tårar

Relevanta dokument
Probabilistisk logik 1

Bayesiansk sannolikhetsteori

HD-metoden och hypotesprövning. Vetenskapliga data

Subjektiva sannolikheter. Helge Malmgren Filosofidagarna, Umeå 2007

Artificiell Intelligens

information - kunskap - vetenskap - etik

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

TATM79: Föreläsning 1 Notation, ekvationer, polynom och summor

Likhetstecknets innebörd

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 1, OCH ÖVNING 2, SAMT INFÖR ÖVNING 3

Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden.

Bayesiansk statistik utan tårar

Föreläsning 5: Summor (forts) och induktionsbevis

Uppgift a b c d e Vet inte Poäng

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

MATEMATIKENS SPRÅK. Avsnitt 1

Klinisk medicin: Psykisk ohälsa och sjukdom 3,5 hp. Tentamenskod: (kod och kurs ska också skrivas längst upp på varje sida) Kurs: Kod:

Likhetstecknets innebörd

Filoson bakom Bayesiansk statistik med tillämpningar inom hjärnavbildning och budgivningar på ebay

Prototypbaserad Inkrementell Diagnos. Anders Holst SICS, Swedish Institute of Computer Science AB

Utsagor (Propositioner) sammansatta utsagor sanningstabeller logisk ekvivalens predikat (öppna utsagor) kvantifierare Section

Anna: Bertil: Cecilia:

Satslogik grundläggande definitioner 3. Satslogik. Uppgift 1. Satslogikens syntax (välformade formler) Satslogikens semantik (tolkningar)

QOL-E V. 3 HÄLSORELATERAD LIVSKVALITET FÖR PATIENTER MED MYELODYSPLASTISKT SYNDROM

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

D. x 2 + y 2 ; E. Stockholm ligger i Sverige; F. Månen är en gul ost; G. 3 2 = 6; H. x 2 + y 2 = r 2.

Differentiell psykologi

Statistik och epidemiologi T5

Vetenskapsteori Vad är kunskap. Vad är kunskap. Vad är kunskap. Propositionell kunskap. Olika typer av kunskap

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Nog är det tillräckligt!

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA

FACIT: Tentamen L9MA30, LGMA30

Mängdlära. Kapitel Mängder

Amerikanerna och evolutionen

Probabilistisk logik 2

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Hur måttsätta osäkerheter?

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

Om statistisk hypotesprövning

Explorativ övning 5 MATEMATISK INDUKTION

Övningshäfte 1: Logik och matematikens språk

Lingonvägen Är jag bjuden?

COMBINING THE OUTCOME OF DIAGNOSTIC INTERVIEW ASSESSMENTS IN INDIVIDUAL PATIENTS USING A NOMOGRAM BASED ON BAYESIAN LOGIC

Tentamen i TDDC75 Diskreta strukturer

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Induktion, mängder och bevis för Introduktionskursen på I

TATM79: Föreläsning 1 Notation, ekvationer, polynom och olikheter

Hälsobarometern Antal långtidssjuka privatanställda tjänstemän, utveckling och bakomliggande orsaker.

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Om konvergens av serier

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Diagnostiska metoder. Några reflektioner. Christina Lindh Odontologiska fakulteten Malmö högskola

Föreläsning 4. Positivistiska teorier 2

Explorativ övning 5 MATEMATISK INDUKTION

Svar och lösningar, Modul 1.

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men

Wilson's disease for younger people

Tentamen i Matematisk statistik Kurskod S0001M

GENOMBROTTSPROJEKTET Bättre vård Mindre tvång PIVA - Halmstad

Alva ordnar loppis Lärarmaterial

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Lingonvägen Jag vill också rida

Vad är risk? Exempel misslyckande. Olika synsätt och möjligheter för undersökning och efterbehandling. Vad är riskbaserad beslutsanalys?

Alva blir skadad Lärarmaterial

2 (6) k 0 2 (7) n 1 F k F n. k F k F n F k F n F n 1 2 (8)

Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar

2 Matematisk grammatik

Handledarsida. Två remisser till arbetsprov

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Kombinatorik och sannolikhetslära

Flera kvantifierare Bevis Direkt bevis Motsägelse bevis Kontrapositivt bevis Fall bevis Induktionsprincipen. x y (x > 0) (y > 0) xy > 0 Domän D = R

Information till eleverna

Vad är sanning? Vad är vetenskap? Vad är praxis? Hur kan dessa två områden samverka? Vad är en praktiker? INTRODUKTION TILL VETENSKAP I

Logik och kontrollstrukturer

Lite Kommentarer om Gränsvärden

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Övningstentamen i matematisk statistik

de var svåra att implementera och var väldigt ineffektiva.

Konfidensintervall, Hypotestest

Om a 2 är ett jämnt tal, så är också a ett jämt tal sant. = 4n 2 + 4n + 1

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Föreläsning 12: Repetition

Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3)

Delbarhet och primtal

Talmängder. Målet med första föreläsningen:

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Vad tycker du om öppenvården?

SF1911: Statistik för bioteknik

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

LINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1

SIDAN 1. Lgr 11 - Centralt innehåll och förmågor som tränas:

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret Lektion 4

Häggström om Swinburne och sannolikheten för Guds existens

information till barn/ungdomar/närstående Inför sövning den / 20 på dagoperation, centralsjukhuset Kristianstad

Transkript:

Bayes statistik - utan förkunskaper - utan tårar Lars Olsson Geostatistik AB 14-11-21 Bayes 1 1

Webbinariekurs Introduktionskurs för geotekniker Webbinarium 1. Fredagen den 21 nov 2014 kl 15:00 15:30 Vad säger mig det jag ser? En introduktion med illustrerande exempel ur medicinen där vi klargör grundprinciperna. Webbinarium 2. Torsdagen den 4 dec 2014 kl 15:00 15:30* Bayes och geotekniken Hur skall jag väga ihop geoteknisk ingenjörserfarenhet och fältmätningar? * 14:45 15:00 Kort statistikrepetition 14-11-21 Bayes 1 2

Sannolikhet I det här kursavsnittet behövs inga större förkunskaper i statistik. Vi kommer dock att använda ordet sannolikhet. Vi nöjer oss just nu med att säga: Sannolikhet är ett mått på hur troligt det är att ett påstående är sant Sannolikhet kan ta värden mellan 0 och 1 Gränsvärdena: 0 betyder att påståendet definitivt är falskt 1 betyder att påståendet definitivt är sant 14-11-21 Bayes 1 3

Vad säger mig det jag ser? Är det svaret på min fråga? En gång* kom en man till sin läkare och frågade: Jag har fullt med utslag i ansiktet. Är det smittkoppor?!? *För länge sedan, säg före 1960. Då var fortfarande smittkoppor fortfarande en realitet 14-11-21 Bayes 1 4

Hur troliga är utslagen? Läkaren svarar: Av dem som har smittkoppor får 90% utslag som ser ut som Era Den omedelbara patientreaktionen: Jag vet att jag har utslag! Vad jag vill veta är om jag har smittkoppor 14-11-21 Bayes 1 5

En annan möjlighet Men säger läkaren det kan också vara vattkoppor. Utslagen ser likadana ut. Av dem som fått vattkoppor får 80% sådana utslag Patienten: Men då är det väl troligare att jag har smittkoppor än vattkoppor! Det är ju fler som får utslag om de har smittkoppor 14-11-21 Bayes 1 6

Vad är troligast? Det är ungefär lika troligt att få utslagen när man har vattkoppor (80%) som när man har smittkoppor (90 %) Vad skall läkaren svara patienten? Sannolikheten att det är smittkoppor är: 90 % 90% /(90% + 80%) = 53 % Något annat, men vad? Kanske: Det är 90%/ 80% = 1,13 gånger troligare att du har smittkoppor än att du har vattkoppor 14-11-21 Bayes 1 7

Läkarens funderingar och svar Läkaren inser att man måste ta hänsyn till både o hur troligt det är med utslag om man har sjukdomen och till o hur vanlig sjukdomen är Efter att ha slagit upp lite data om sjukdomars förekomst (prevalens) och lite handräknande på ett papper svarar han: Sannolikheten att det är smittkoppor när man som Ni uppvisar symptomen är 1,1% 14-11-21 Bayes 1 8

Hur kommer man till det svaret? Sjukdomsstatistiken säger att sannolikheten för en slumpvist vald person att få smittkoppor är 0,001 och att sannolikheten för vattkoppor är 0,1. Intuitivt känns det som det vore troligare att det är vattkoppor. Vi väger sannolikheten att visa upp koppor (om man har sjukdomen) med sjukdomens sannolikhet 0,90 x 0,001 = 0,0009 (smittkoppor) 0,8 x 0,1 = 0,08 (vattkoppor) Vi vet att personer måste ha en av sjukdomarna, så summan av de respektive sannolikheterna måste bli 1. Vi normaliserar med summan av värdena ovan och får P(smittkoppor) = 0,0009/0,0809 = 0,011 P(vattkoppor) = 0,08/ 0,0809 = 0,989 14-11-21 Bayes 1 9

Beräkningsgången enligt Bayes observationer symptom förhandskunskap Likelihood P(symptom sjukdomen) àpriori-sannolikhet P(sjukdom) Bayes teorem Sammanvägning förhandskunskap och observationer àposteriori-sannolikhet P(sjukdomen symptomen) 14-11-21 Bayes 1 10

Beräkningsgången med formler Vi vill veta sannolikheten att vår hypotes (att man har smittkoppor) är sann om man har observerat utslagen: p(smittkoppor utslag) Vi kan ange sannolikheten att få utslagen om man har smittkoppor: p(utslag smittkoppor) Vi har en uppfattning om sannolikheten att en slumpvis vald person har smittkoppor: p(smittkoppor) Bayes teorem: likelihood àpriorisannolikhet P(smittkoppor utslag) = àposteriorisannolikhet (betingad på att vi observerat utslag) P(utslag smittkoppor)" P(smittkoppor) normaliseringskonst. Normaliseringskonstant 14-11-21 Bayes 1 11

Ibland behövs inte nämnaren* Om vi inte är intresserade av de absoluta sannolikheterna utan bara skall välja mellan alternativ behöver man inte alltid normaliseringskonstanten i nämnaren. Läkaren i vårt exempel skall ställa en diagnos: smittkoppor eller vattkoppor. Diagnosen bör baseras på den hypotes som är troligast. P(vattkoppor utslag) = 0,80 x 0,1/konstant P(smittkoppor utslag) = 0,90 x 0,001/konstant P(vattkoppor utslag)/ P(smittkoppor utslag) = (0,80 x 0,1)/ (0,90 x 0,001) = 88,9 Det är alltså betydligt troligare att det rör sig om vattkoppor, även om det inte är absolut uteslutet att det är smittkoppor *den kan ibland vara riktigt jobbig att beräkna 14-11-21 Bayes 1 12

Principerna i bayesiansk Vi har en utsaga (hypotes) statistik Om den är sann, så kan vi säga hur troligt det är att vi kommer att göra vissa observationer Vi har också en allmän uppfattning om hur troligt det är att utsagan är sann (àpriori-sannolikheten) När vi gjort observationer vill vi ha den sammanvägda sannolikheten för att utsagan är sann àposteriori = likelihood x àpriori x (1/k) 14-11-21 Bayes 1 13