729G43 Artificiell intelligens / 2016 Probabilistisk logik 1 Marco Kuhlmann Institutionen för datavetenskap
Osäkerhet
1.01 Osäkerhet Agenter måste kunna hantera osäkerhet. Agentens miljö är ofta endast delvist observerbar. sensorer Agentens miljö är ofta icke-deterministisk. aktuatorer
Osäkerhet i Wumpusvärlden bris bris Vilken eller vilka av de gula rutorna innehåller ett hål?
Osäkerhet i Wumpusvärlden 31% bris 86% rationellt beslut: gå inte hit! bris 31% Vilken eller vilka av de gula rutorna innehåller ett hål?
Osäkerhet i Wumpusvärlden 31% bris 86% bris hål Rationella beslut är inte alltid de rätta besluten!
1.03 Källa: NASA (Public domain)
Rationella beslut inför osäkerhet När agenten är osäker måste den göra en avvägning: Hur viktiga är de olika målen som ska uppnås? förutsätter ett mått för agentens prestanda Hur troligt är det att dessa mål kan uppnås? förutsätter ett mått för hur säker agenten är på sin information
Logik I världar utan osäkerhet kan en agent använda logik för att fatta rationella beslut, t.ex. satslogik eller predikatlogik. En konkret värld beskrivs genom att tilldela varje atomärt påstående värdet sant eller falskt. H i,j = sant betyder att ruta (i,j) innehåller ett hål Logiken tillhandahåller sedan regler för att resonera kring komplexa påståenden.
1.04 Probabilistisk logik I världar med osäkerhet måste en agent kunna kvantifiera hur säker den är på olika påståenden. Som mått för detta använder vi sannolikhet. P(H i,j = sant) = 0,20 betyder: På en skala från 0 till 100 så är säkerheten att ruta (i,j) innehåller ett hål lika med 20.
1.05 Varifrån kommer sannolikheter? Frekventistiskt perspektiv Sannolikheter är relativa frekvenser. Objektivistiskt perspektiv Sannolikheter är reala aspekter i verkligheten. Subjektivistiskt perspektiv Sannolikheter beskriver en agents konfidens.
1.05 Pierre-Simon Laplace (1749 1827) Thomas Bayes (1702 1761)
1.06 Probabilistisk inferens Probabilistisk logik är ett logiskt system avsett för att beskriva probabilistiska modeller av världen och utifrån dessa modeller fatta beslut. Denna process kallas probabilistisk inferens.
Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk inferens 2: Inferenser från simultanfördelningen Probabilistisk inferens 3: Bayesianska nät
Probabilistiska modeller
2.01 Probabilistiska modeller En probabilistisk modell är består av: stokastiska variabler en sannolikhetsfördelning för dessa variabler
2.02 Stokastiska variabler En stokastisk variabel är en variabel med ett osäkert värde. patientens diagnos, marsroverns position, vädret i morgon Stokastiska variabler betecknar vi med stora bokstäver.
2.03 Sannolikhetsfördelningar En fördelning för en stokastisk variabel X visar sannolikheten för varje möjligt värde på X. Fördelningar för X betecknar vi P(X). När en stokastisk variabel har ändligt många värden kan en fördelning för den (i princip) anges i tabellform.
2.03 Sannolikhetsfördelningar P(W) W P sol 0,4 moln 0,3 regn 0,2 snö 0,1
Av Ingeborg Behne Länk
2.04 Notation Exempel: vädret i morgon P(X = x) = sannolikhet Exempel: sol
2.05 Olika typer av stokastiska variabler Vi kommer endast behöva finita stokastiska variabler, dvs. variabler med ändligt många möjliga värden. Det finns även stokastiska variabler med oändligt många möjliga värden, både diskreta och kontinuerliga. höjdhopp, längdhopp Observera: Det som inom AI:n kallas för stokastiska variabler är inte samma sak som t.ex. statistikens stokastiska variabler.
2.06 Sannolikhetsaxiom 1 W P sol 0,4 moln 0,3 regn 0,2 snö 0,1 Sannolikheter är icke-negativa tal.
2.06 Sannolikhetsaxiom 2 W P sol 0,4 moln 0,3 regn 0,2 snö 0,1 Den totala sannolikheten är lika med 1.
2.07 Stokastiska variabler och slumpförsök stokastiska variabler = slumpförsök; värden = utfall
2.08 Händelser En händelse är en delmängd av möjliga utfall. första raden
2.08 Sannolikheten för händelser Sannolikheten för en händelse A får vi genom att summera över sannolikheterna för alla värden som ingår i A.
2.08 Koppling till logiken Atomära formler beskriver utfall. P(W = sol) Komplexa formler beskriver händelser. P(W = moln W = regn)
2.11 Simultanfördelningar En simultanfördelning för två slumpvariabler X och Y visar sannolikheten för varje möjlig kombination av värden på X och Y. Begreppet kan generaliseras till fler än två slumpvariabler.
2.11 Simultanfördelning, exempel P(X, Y) X Y P sol varmt 0,4 sol kallt 0,2 regn varmt 0,1 regn kallt 0,3
2.13 Notation för simultanfördelningar Exempel: sol P(X = x, Y = y) = sannolikhet Exempel: kallt
Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk inferens 2: Inferenser från simultanfördelningen Probabilistisk inferens 3: Bayesianska nät
Probabilistisk inferens 1: Betingad sannolikhet
3.01 Betingad sannolikhet Sannolikhet är vårt mått på hur mycket vi tror på någonting. Betingad sannolikhet är vårt mått på hur mycket vi tror på någonting då vi redan har viss annan information. Notation: P(H E) sannolikheten för H givet E H = hypothesis, E = evidence
3.02 Definition av betingad sannolikhet Hur sannolikt är H givet att E redan är känd? P(H E) = P(H E) P(E)
3.04 Betingad sannolikhet H H E E apriorisannolikhet, aposteriorisannolikhet för H
3.08 Multiplikationsregeln P(H E) = P(H E) P(E) P(H E) = P(E H) P(H)
3.10 ingen information P( ) P( ) P( ) P( ) P( ) P( )
3.11 Bayes regel För beslutsfattande behöver agenten veta P(H E). P(diagnos symptom) Men i många fall är det enklare att säga någonting om P(E H). P(symptom diagnos) Bayes regel kan användas för att konvertera mellan dessa.
3.12 Bayes regel P(B A)P(A) P(A B) = P(B) Thomas Bayes (1702 1761)
3.14 Bayes regel i aktion En läkare träffar en patient med nackspärr. Nackspärr kan vara en symptom på sjukdomen meningit; meningit orsakar nackspärr i 70% av fallen. Apriorisannolikheten för meningit är 1 på 50 000. Apriorisannolikheten för nackspärr är 1%. Hur stor är sannolikheten att patienten har meningit?
3.14 Läkaren möter patienten P(+m) P( m) +m m P(+n +m) P( n +m) P(+n m) P( n m) +n n +n n
Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk inferens 2: Inferenser från simultanfördelningen Probabilistisk inferens 3: Bayesianska nät