Filoson bakom Bayesiansk statistik med tillämpningar inom hjärnavbildning och budgivningar på ebay Bertil Wegmann STIMA, IDA, Linköpings universitet October 5, 2017 Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 1 / 21
Thomas Bayes, 1702-1761 Engelsk matematiker, statistiker och presbyteriansk präst Thomas Bayes formulerade ett specikt fall av en sats som år 1763 generaliserades och publicerades av Richard Price. Namnet på satsen blev Bayes sats. Bayes sats blev därmed en av de fundamentala satserna inom sannolikhetslära. Bayes sats uppdaterar nuvarande apriori kunskap om en okänd kvantitet med information från data till kunskap aposteriori. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 2 / 21
Monty Hall-problemet Spelteoretiskt problem som bygger på sannolikheter om okända kvantiteter. Problemet har fått sitt namn från tv-prolen Monty Hall, som var programledare för spelet Let's make a deal. Bakom tre stängda dörrar nns 1 bil och 2 getter. Spelaren väljer en dörr, utan att öppna den. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 3 / 21
Monty Hall-problemet Presentatören (Monty Hall), som vet var de 2 getterna och bilen nns, öppnar en av de två resterande dörrarna där det nns 1 get. Presentatören frågar spelaren om denne vill byta valet av dörr. Ska spelaren göra det? Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 4 / 21
Monty Hall-problemet Svaret är JA! Spelaren har fördel av att byta dörr! Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 5 / 21
Monty Hall-problemet med Bayes sats Antag att spelaren först väljer en av dörrarna, säg dörr 1. Deniera händelserna D = presentatören väljer att öppna en dörr som har en get, säg dörr 3. B i = Bilen nns bakom dörr i, där i = 1, 2. Lösning med Bayes sats för händelser: P (B 1 D) = P (D B 1) P (B 1 ) P (D) P (B 2 D) = P (D B 2) P (B 2 ) P (D) = 1 1 2 3 1 2 = 1 1 3 1 2 = 1 3 = 2 3 Alltså, bäst att byta från dörr 1 till dörr 2! Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 6 / 21
Bayes sats Bayes sats för händelser B och D: P(B D) = P(D B)P(B). P(D) Ersätt händelsen B med den okända kvantiteten (parametern) θ. Ersätt händelsen D med data x 1, x 2,..., x n för n stycken antalet observationer. Bayes sats för en okänd kvantitet θ: p(θ x 1,...x n ) = p(x 1,..., x n θ)p(θ) p(x 1,..., x n ) p(x 1,..., x n θ)p(θ) Sannolikhet aposteriori för θ ges av Sannolikhet för data givet θ * Sannolikhet apriori för θ Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 7 / 21
Bayesiansk vs frekventistisk statistik Frekventistisk statistik använder endast data som information till statistisk slutledning: Frekventist : DATA Bayesiansk statistik adderar extra (prior) information till statistisk slutledning om en okänd kvantitet med hjälp av Bayes sats: Bayesian : PRIOR + DATA POSTERIOR I Bayesiansk statistik är sannolikhet subjektiv. Frekventister tolkar sannolikhet som den relativa frekvensen av en given händelse i ett stort antal liknande försök. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 8 / 21
Exempel: uppskattning av θ =andelen askor av typ A På ett stort lager vill man uppskatta θ = andelen askor av typ A. I ett litet urval av totalt 100 askor från 10 miljoner askor observerade man 60 askor av typ A. Frekventisten uppskattar då θ till 60 %. Kjell har jobbat i lagret i 20 år. Han tror sig ha bra koll på den okända kvantiteten θ. Kjell förväntar sig att 55 % av askorna är av typ A med en standardavvikelse på 0.05. Bayesianen använder priorinformationen från Kjell och uppdaterar Kjells prior m.h.a. data från urvalet till Kjells posterioruppfattning om θ. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 9 / 21
Exempel: uppskattning av θ =andelen askor av typ A Prior (grön) till Posterior (röd) uppdatering (Likelihood (blå) = funktion av θ givet data) Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 10 / 21
Exempel: uppskattning av θ =andelen askor av typ A Urval med 600 askor av typ A utav totalt 1000 askor. Prior (grön) till Posterior (röd) uppdatering (Likelihood (blå) = funktion av θ givet data) Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 11 / 21
Ifrågasättande av prior för okänd kvantitet θ Frekventist: 'Om priorn är subjektiv, så är statistisk slutledning subjektiv. Det kan inte vara rätt.' Bayesian: 'Vi har alla olika apriorikunskap och det enda ärliga är en subjektiv prior'. Bayesian: 'Den objektiva delen av statistisk slutledning är uppdateringen från priorn till posteriorn, som alltid görs med Bayes sats'. Bayesian: 'En prior kan göras minimalt informativ' (Objektiv). Bayesian: 'Icke-Bayesiansk slutledning är också subjektiv. Val av sannolikhetsmodell, val av statistiska test, etc är alla subjektiva val'. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 12 / 21
Prognoser av auktionspriser på ebay ebay är en websajt för internetauktioner. Budgivning under begränsad tid (1 dag - 1 vecka). Andra-pris auktion. Vinnaren betalar det näst högsta budet. Mål: prognos av slutpriset i en auktion. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 13 / 21
Prognoser av auktionspriser på ebay Data: Alla bud i ett stort antal auktioner Förklarande variabler, t ex objektets skick, säljarens ebay-betyg, säljarens försäljningsvolym, utropspris etc. Prior: Icke-informativ prior angående hur dom förklarande variablerna påverkar budgivarnas värderingar. Svårigheter vid statistisk modellering: Budgivare är smarta och vet att andra budgivare också är smarta. Spelteori. Nash-jämvikt. 'A Beautiful Mind' Bud = Värdering Vi vet inte hur många budgivare som kommer att deltaga. Vi observerar inte det högsta budet. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 14 / 21
Prognos av ett samlarmynts auktionspris Utropspris = $6. Expertvärdering: $9.5. Sannolikhet för inga bud = 1.4%. Sannolikhet att pris slutar på utropspris = 6.7%. Minst 2 bud prognosfördelning över priset. Faktiskt pris: $13 Fördelning - minst 2 bud Faktiskt pris Expertvärdering Utropspris 6 8 10 12 14 16 18 Pris Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 15 / 21
Vilket utropspris är optimalt för säljaren? 22 21 20 19 18 17 16 15 14 0 0.2 0.4 0.6 0.8 1 1.2 Utropspris / Expertvärdering Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 16 / 21
Diusion Tensor Imaging (DTI) En 3D tensor (ellipsoid) kan skattas för den huvudsakliga vätskediusionen i varje voxel i hjärnan, vilket ger den huvudsakliga riktningen för nervbrena i varje voxel. I dag används DTI i huvudsak till hjärnavbildning inom forskning och till kliniska tillämpningar. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 17 / 21
Mätningar i DTI Mätsignalen i DTI är ett mått på diusionsprocessen av vattenmolekyler i hjärnan. I DTI studeras hjärnan i vila utan något stimuli. I DTI mäts signalen i varje voxel ertalet gånger utifrån olika val av diusionsriktningar samt genom att variera pulsens styrka i magnetfältet och varaktigheten av diusionen innan mätning (b-faktor). Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 18 / 21
Diusionstensormodellen En tensormodell med en 3D-tensor för diusionen i varje voxel kan denieras för den ideala brusfria signalen S i för mätning i som ( ) S i = S 0 exp b i gi T Dg i, D = d xx d xy d xz d xy d yy d yz d xz d yz d zz där S 0 är signalen utan diusionsgradient, b i är b-faktorn, g i = (g ix, g iy, g iz ) är gradientvektorn och D är diusionstensorn. Log-Cholesky representation av tensorn garanterar att D är positiv denit. Diusionstensorn D kan skrivas som D (ω) = Ω T Ω med Ω = e ω 1 ω 4 ω 6 0 e ω 2 ω 5 0 0 e ω 3. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 19 / 21
Bayes sats ger fördelningen av tensorn Icke-informativ prior används för parametrarna i tensorn. Detta innebär att vi apriori modellerar tensorn som en sfär, dvs di usionen är lika stor i alla riktningar. Bayes sats ger en posterior för respektive parameter i tensorn, vilket innebär en fördelning för tensorn i varje voxel. Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 20 / 21
Tack för visat intresse! Bertil Wegmann, STIMA, IDA, LiU Bayesiansk statistik October 5, 2017 21 / 21