Robust Bayes och konkurrerande skolor. Stefan Arnborg, KTH

Relevanta dokument
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Hur fattar samhället beslut när forskarna är oeniga?

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

S0005M, Föreläsning 2

SF1911: Statistik för bioteknik

12.6 Heat equation, Wave equation

Isometries of the plane

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Rastercell. Digital Rastrering. AM & FM Raster. Rastercell. AM & FM Raster. Sasan Gooran (VT 2007) Rastrering. Rastercell. Konventionellt, AM

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

Förändrade förväntningar

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Viktig information för transmittrar med option /A1 Gold-Plated Diaphragm

Collaborative Product Development:

CONNECT- Ett engagerande nätverk! Paula Lembke Tf VD Connect Östra Sverige

Bayes i praktiken. exempel och reflektioner från en forskarutbildningskurs. Ralf Rittner, Arbets och Miljömedicin

Pre-Test 1: M0030M - Linear Algebra.

Module 6: Integrals and applications

Questionnaire for visa applicants Appendix A

Quicksort. Koffman & Wolfgang kapitel 8, avsnitt 9

denna del en poäng. 1. (Dugga 1.1) och v = (a) Beräkna u (2u 2u v) om u = . (1p) och som är parallell

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

1. Varje bevissteg ska motiveras formellt (informella bevis ger 0 poang)

Workplan Food. Spring term 2016 Year 7. Name:

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Writing with context. Att skriva med sammanhang

Styrteknik: Binära tal, talsystem och koder D3:1

Protokoll Föreningsutskottet

Health café. Self help groups. Learning café. Focus on support to people with chronic diseases and their families

Småprat Small talk (stressed vowels are underlined)

Grafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions:

Preschool Kindergarten

Mönster. Ulf Cederling Växjö University Slide 1

LUNDS TEKNISKA HÖGSKOLA Institutionen för Elektro- och Informationsteknik

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Support Manual HoistLocatel Electronic Locks

Könsfördelningen inom kataraktkirurgin. Mats Lundström

Resultat av den utökade första planeringsövningen inför RRC september 2005

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

SHANGHAI PAVEMENTS C. Anders Wallén

Webbregistrering pa kurs och termin

Adding active and blended learning to an introductory mechanics course

Bayesiansk statistik utan tårar

Kombinatorik och sannolikhetslära

SVENSK STANDARD SS :2010

#minlandsbygd. Landsbygden lever på Instagram. Kul bild! I keep chickens too. They re brilliant.

Klyvklingor / Ripping Blades.

Grafisk teknik IMCDP. Sasan Gooran (HT 2006) Assumptions:

Affärsmodellernas förändring inom handeln

SkillGuide. Bruksanvisning. Svenska

F ξ (x) = f(y, x)dydx = 1. We say that a random variable ξ has a distribution F (x), if. F (x) =

Tentamen i Matematik 2: M0030M.

D-RAIL AB. All Rights Reserved.

LINC MODELL 13. INR SVERIGE AB Kosterögatan 15 SE Malmö 13 EN 1428:2005+A1:2008

Självkörande bilar. Alvin Karlsson TE14A 9/3-2015

Second handbook of research on mathematics teaching and learning (NCTM)

Scalable Dynamic Analysis of Binary Code

Plats för projektsymbol. Nätverket för svensk Internet- Infrastruktur

Tentamen del 2 SF1511, , kl , Numeriska metoder och grundläggande programmering

Intäkter inom äldreomsorgen Habo kommun

Välkommen in på min hemsida. Som företagsnamnet antyder så sysslar jag med teknisk design och konstruktion i 3D cad.

De senaste åren har det hänt en hel del på ATO Fritid

Projektmodell med kunskapshantering anpassad för Svenska Mässan Koncernen

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

(D1.1) 1. (3p) Bestäm ekvationer i ett xyz-koordinatsystem för planet som innehåller punkterna

Mälardalens Högskola. Formelsamling. Statistik, grundkurs


Grafisk teknik. Sasan Gooran (HT 2006)

Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00. English Version

Webbreg öppen: 26/ /

Mekanik FK2002m. Kraft och rörelse I

Par m 328 feet. Lång höger sväng. Korgen står placerad i en skogsglänta OB-linje på vänster sida.

Förordning 376/2014. Händelserapportering Ulrika Svensson, flyginspektör

Wittgenstein for dummies Eller hur vi gör det obegripliga begripligt. Västerås 15 februari 2017

Chapter 2: Random Variables

SF1901: Sannolikhetslära och statistik

< THE SHELF SYSTEM FILLED WITH POSSIBILITIES. Design Anne Krook

Discovering!!!!! Swedish ÅÄÖ. EPISODE 6 Norrlänningar and numbers Misi.se

Föreläsning 6, Repetition Sannolikhetslära

EVALUATION OF ADVANCED BIOSTATISTICS COURSE, part I

Consumer attitudes regarding durability and labelling

PORTSECURITY IN SÖLVESBORG

Mycket formellt, mottagaren har en speciell titel som ska användas i stället för namnet

Jämställd vård. Primärvårdsdelegationen

Isolda Purchase - EDI

Mycket formellt, mottagaren har en speciell titel som ska användas i stället för namnet

Spel(ar)kultur. Spelfortbildning april Matilda Ståhl Åbo Akademi

Bridging the gap - state-of-the-art testing research, Explanea, and why you should care

Att stödja starka elever genom kreativ matte.

Swedish adaptation of ISO TC 211 Quality principles. Erik Stenborg

Ecolin - Natural silence!

Outline. TSFS06 Diagnos och övervakning Föreläsning 10 - Sannolikhetsbaserad diagnos och Bayesianska nätverk. Sneak-peak. Outline

Anna: Bertil: Cecilia:

Kurskod: TAMS11 Provkod: TENB 07 April 2015, 14:00-18:00. English Version

Provlektion Just Stuff B Textbook Just Stuff B Workbook

Användarhandbok. MHL to HDMI Adapter IM750

Design by Voice. Azzaro

EASA FTL (Flygarbetstid)

Transkript:

Robust Bayes och konkurrerande skolor Stefan Arnborg, KTH

* WIRED on Total Information Awareness WIRED (Dec 2, 2002) article "Total Info System Totally Touchy" discusses the Total Information Awareness system. The Total Information Awareness System and related efforts received ~~~ Quote: "People have to move and plan before committing a terrorist act. Our hypothesis is their planning process has a signature." Jan Walker, Pentagon spokeswoman, in Wired, Dec 2, 2002. "What's alarming is the danger of false positives based on incorrect data," Herb Edelstein, in Wired, Dec 2, 2002. För att skapa fred måste man *veta hur det ser ut *veta hur det fungerar

Fred Fred är viktigt för oss. Krig är inte bra för oss. Om jag fick välja va jag vill då skulle jag göra fred. Fred tycker jag om. I Love FRED. Krig är jätte dåligt.av Mikaela.

Sun Zi Den som känner sig själv och sin motpart genomgår hundra strider utan fara. Den som känner sig själv men inte sin motpart förlorar en strid för varje seger. Den som varken känner sig själv eller sin motpart är dömd att förlora varje strid.

Sun Zi Om han upprättar ett läger på ett lättillgängligt ställe är det för att vinna andra fördelar. Om det rör sig i skogen är han på väg. Många uppsatta hinder på öppen mark betyder att fienden vill vilseleda. När fåglar lättar ligger fienden i bakhåll. Uppskrämda djur betyder att fienden är i rörelse. När dammet yr i höga och tydliga strängar är det vagnar som är på väg. När dammet ligger lågt och jämnt är det fotsoldater. När dammet är utspritt i tunna strängar samlar fienden ved. När dammet är tunt och yr kors och tvärs slår fienden läger

Bayes metod f (l D) µ f (D l) f (l) Posterior fås ur prior genom multiplicering med den nya informationens likelihood och normalisering. Vid en serie oberoende observationer: D t = (d 1,d 2,..., d t ) f (l D t ) µ f (d t l) f (l D t -1 ) posterior blir prior för ny observation,

Kombination av evidens f (l D) µ f (D l) f (l) f (l {d 1,d 2 }) µ f (d 1 l) f (d 2 l) f (l) Förutsättning: d1 och d2 oberoende betingat av l. Laplace/Bernoulli parallellkombination vid ändligt parameterrum: uttryck alla likelihoods och prior som sannolikhetsvektorer över L Kombinera genom komponentvis multiplikation och normalisering. Formellt: pdf kan betraktas som (singelton) slumpmängd. Kombinationen är snitt av slumpmängder betingad att vara icke-tomma.

Bayesiansk Beslutsteori (Savage) Utfall R beror av osäker l med prior f(l) och eget val a: f (R l,a) Nyttan av utfall R är u(r) Observerbarhet: f(d l) Välj a som maximerar förväntad nytta, arg max a : u(r) f (R l,a) f (l D) f (l)dldr Ú

Tillämpning: PET-kamera f (l D) µ f (D l) f (l) Camera geometry&noise film scene regularity

Chapman-Kolmogorov Dynamiska problem f (l t D t ) µ f (d t l t )Ú f (l t l t -1 ) f (l t -1 D t -1 )dl t-1 Grund för Kalman-filtret, där alla ingående fördelningar är normalfördelningar. Generella fördelningar kan ofta hanteras med partikelfilter (sekvensiell Markov Chain Monte Carlo) Uppskattning av en dynamisk situation: tillstånd l, observationer d, likelihood f(d l), innovation f(l(t) l(t-1)), rekursion/prior i varje steg IMM: flera filter med olika manöverbrus. Klassificerar manövertillstånd.

Problem med IMM (Smets Fusion 2004) Om målets klass kan ändras fritt, tex som vid klassning av manövertillstånd, råkar multipla modeller fungera bra: det filter som är bäst anpassat ger klassen. Är också Bayesianskt tolkningsbart. Om målets klass inte kan ändras momentant, t ex klassning av måltyp, är IMM inte bra - utgå i stället från Chapman-Kolmogorov

Joint Tracking & Classification Civilflyg, Bombplan, Attackplan (c, b, a) Har olika accelerationsprestanda Tillstånd: position, hastighet, typ : L = R 3 R 3 {c, b,a} Manöverbrus: typ ändras aldrig, f ((p t,v t,c) (p t -1, v t -1,b)) = 0 Acceleration begränsas: Vi har f ((p t,v t,c) (p t -1, v t -1,c)) = 0 då v t - v t -1 > a c

Generalisering av Bayes/Kalman Hur gör man när man inte har någon prior? Likelihood går inte att bestämma exakt (imprecision)? Parameterrummet är vagt, dvs inte samma för alla likelihoods (Fuzziness, vagueness)? Parameterrummet(och observationsrummet) har komplex struktur (enkel struktur är t ex Cartesisk produkt av ett antal R och ändliga mängder)?

Några ansatser... Robust Bayes: ersätter fördelningar med konvexa mängder av fördelningar (Berger m fl) Dempster/Shafer/TBM: Beskriver imprecision med slumpmängder DSm: Transformerar parameterrum för att beskriva vagueness.(dezert/smarandache) FISST: FInite Set STatistics: Generaliserar observations-och parameterrum till produkt av rum beskriven som slumpmängd (Goodman, Mahler, Ngyuen)

Robust Bayes Arbeta med priors och likelihoods som är konvexa mängder av sannolikhets-fördelningar (Berger, de Finetti, Walley,...): imprecisa sannolikheter f (l D) µ f (D l) f (l) F(l D) µ F(D l)f(l) Varje element i posterior består av parallellkombination av ett element i likelihood och ett element i prior. För beslut: använd det element i posterior som har störst entropi (Maxent estimat).

Ellsberg s Paradox: Ambiguity Avoidance Urna A innehåller 4 vita och 4 svarta kulor, och 4 av okänd färg (svart eller vit)??? Urna B innehåller 6 vita och 6 svarta kulor? Du får en krona om du drar en svart kula. Ur vilken urna vill du dra den? En precis Bayesian bör först anta hur?-kulorna är färgade och sedan svara. Men en majoritet föredrar urna B även om svart byts mot vit

Maximum Entropy - kanonisk pdf i konvex mängd? En obalanserad tärning har medelutfall 4.5 i stället för 3.5. Hur stora är sannolikheterna? Jaynes koncentrationsfenomen: Av alla sekvenser med medelutfall 4.5 har en förbluffande stor andel frekvenser nära den fördelning med medelutfall 4.5 som har högst entropi: arg max p { Â -p i log p i Âip i = 4.5} i i Kan man alltid ersätta en imprecis fördelning med MAXENT-estimatet?

Hur används imprecisa sannolikheter? Förväntad nytta för beslutsalternativ blir intervall i stället för punkter: maximax, maximin, maximedel? u Bayesian optimist pessimist a

Dempster/Shafer/Smets Beskriv evidens med slumpmängd över L. Sannolikhetsfördelning över 2^ L. Sannolikhet för singelton: Belief som allokeras för alternativet, dvs sannolikhet. Sannolikhet för icke-singelton: Belief som allokeras till mängden alternativ, men som inte kan tillordnas någon av dess delar. Kombineras med snitt betingat av att vara icke-tomt (Dempster s rule).

Correspondence DS-structure -- set of probability distributions For a pdf (bba) m over 2^Q, consider all ways of reallocating the probability mass of non-singletons to their member atoms: This gives a convex set of probability distributions over Q. Example: Q={A,B,C} bba A: 0.1 B: 0.3 C: 0.1 AB: 0.5 set of pdfs A: 0.1+0.5*x B: 0.3+0.5*(1-x) C: 0.1 for all xœ[0,1] Can we regard any set of pdf:s as a bba? Answer is NO!! There are more convex sets of pdf:s than DS-structures

Representing probability set as bba: 3-element universe Black: convex set Blue: rounded up Red: rounded down Rounding up: use lower envelope. Rounding down: Linear programming Rounding is not unique!!

Dempster/Shafer/Smets För precis (bayesiansk) belief: samma som Bayes metod. Kombination av precis och imprecis DSstruktur: blir singeltonslumpmängd, dvs precis belief. Så är det inte i Robust Bayes! Kombination av två imprecisa DSstrukturer: Blir imprecis, dock mycket smalare än Robust Bayes.

An appealing conjecture Precise pdf can be regarded as (singleton) random set. Bayesian combination of precise pdf:s corresponds to random set intersection (conditioned on non-emptiness) DS-structure corresponds to Choquet capacity (set of pdf:s) Is it reasonable to combine Choquet capacities by (nonempty) random set intersection (Dempster s rule)?? Answer is NO!!

Zadeh s Paradoxical Example Patient has headache, possible explanations are M-- Meningitis ; C-- Concussion ; T-- Tumor. Expert 1: P( M )=0 ; P( C )=0.9 ; P( T )=0.1 Expert 2: P( M )=0.9 ; P( C )=0 ; P( T )=0.1 Parallel comb: 0 0 0.01 What is the combined conclusion? Parallel normalized: (0,0,1)? Is there a paradox??

Zadeh s Paradox (ctd) One expert (at least) made an error Experts do not know what probability zero means Experts made correct inferences based on different observation sets, and T is indeed the correct answer: f(l o1, o2) = c f(o1 l)f(o2 l)f(l) but this assumes f(o1,o2 l)=f(o1 l) f(o2 l) which need not be true if granularity of L is too coarse (not taking variability of f(oi l) in account). One reason (among several) to look at Robust Bayes.

Zadeh s example Robust and Dempster s rule Yager s rule random set union Union rule

Robust Combination on Zadeh s ex -- Expert 2 discounted by 10% Robust rule maxent Fixsen/Mahler rule Dempster s rule

Robust Combination on Zadeh s ex -- Both discounted by 5% Robust rule maxent Dempster s rule MDS Rounded robust

Two imprecise operands o1, o2 (red lines), their pignistic transformations p1, p2 (red crosses), and robust combinations o1*p2 and p1*o2 (blue) o1*p2 p1*o2

o1*o2 p1*o2 o1*p2 p1*p2

p1*p2 Ã MDS(o1,o2) Ã (p1*o2 «o1*p2) MDS(o1,o2)

Consistency of fusion operators Operands Robust rule

Consistency of fusion operators DS rule Rounded robust MDS rule Dempster s fusion rule outside robust rounded polytope!! Fixsen/Mahler (MDS compatible with Robust Bayes fusion

FInite Set STatistics Särskilt avsedd för problem multiple tracking/multiple sensor Flera tätt flygande mål. Varierar vid MIRV och missilavfyring. Tillstånd är ett variabelt antal tillståndsvektorer för enkla mål: Problem med symmetrier: I FISST är tillståndet en slumpmängd ur Ska inte förväxlas med DS-struktur. L = (R 6 C)U(R 12 C 2 )UL L = R 6 C

That s all Folks! Bayesianism har starka normativa anspråk Dempsters regel inkompatibel med synen på DS-struktur som imprecis sannolikhetsfördelning. MDS kompatibelt men underskattar imprecision. Förståelsen av komplexa tillståndsrum otillräcklig: Behövs antingen enklare teori (gränsvärdesteknik för kompakta metriska rum) eller måtteori i ingenjörsutbildningen.