Föreläsning 4: Beslut och nytta, paradoxer

Relevanta dokument
Föreläsning 3: Osäkerhet och sannolikhet

Föreläsning 6: Spelteori II

Föreläsning 2: Preferensrationalitet och beslut under okunskap

Tema Förväntat värde. Teori Förväntat värde

Laboration 2. Artificiell Intelligens, Ht Lärare: Christina Olsén Handledare: Therese Edvall Daniel Ölvebrink

UTFALL = (KLAVE, 2 KR; KRONA-KLAVE, 4 KR; KRONA-KRONA-KLAVE, 8 KR; OSV) = (1/2, 2 KR; 1/4, 4 KR; 1/8 8 KR; OSV)

Recension. Tänka, snabbt och långsamt Daniel Kahneman Översättning: Pär Svensson Volante, Stockholm, 2013, 511 s. ISBN

Förfluten tid Nu Framtiden. Bedömning Värdering Kunskaper Integration Konsekvenser Beslut Genomförande

BESLUT UNDER OSÄKERHET

Föreläsning 5. Deduktion

Föreläsning 1: Introduktion till beslutsteorin

Nyttohänsyn i investeringar avseende brandskydd

Mängdlära. Kapitel Mängder

Statistikens grunder HT, dagtid Statistiska institutionen

Riskbeteende utifrån prospektteorin

Spelteori. Lars-Åke Lindahl

Föreläsning 7: Gruppbeslutsteori

Cake-cutting. att fördela resurser på ett rättvist sätt. Ebba Lindström

Postprint.

), beskrivs där med följande funktionsform,

Block 1 - Mängder och tal

Att välja statistisk metod

MVE420: Beslutsteori och rationalitet under osäkerhet

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

exakt en exponent x som satisfierar ekvationen. Den okända exponent x i ekvationen = kallas logaritm av b i basen a och betecknas x =log

Kompletteringsmaterial. K2 Något om modeller, kompakthetssatsen

Sannolikhetsbegreppet

Lösningsförslag Fråga 1.

Block 1 - Mängder och tal

Inkonsekvent beslutsfattande

D. x 2 + y 2 ; E. Stockholm ligger i Sverige; F. Månen är en gul ost; G. 3 2 = 6; H. x 2 + y 2 = r 2.

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

Grundläggande matematisk statistik

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

SKRIVNING I VEKTORGEOMETRI

Senaste revideringen av kapitlet gjordes , efter att ett fel upptäckts.

Kända och okända funktioner

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Lotto. Singla slant. Vanliga missuppfattningar vad gäller slumpen. Slumpen och hur vi uppfattar den - med och utan tärning

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

Föreläsning 1: Tal, mängder och slutledningar

Lutande torn och kluriga konster!

5Chans och risk. Mål. Grunddel K 5. Ingressen

1 Duala problem vid linjär optimering

Anteckningar för kursen "Analys i en Variabel"

MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Avd. Matematik Examinator: Daniel Bergh. Lösningsförslag Algebra och kombinatorik

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Tillämpning av beslutsanalys i beslutsprocessen för Teknologföreingens fastighetsförnyelse

Kunskap. Evidens och argument. Kunskap. Goda skäl. Goda skäl. Två typer av argument a) deduktiva. b) induktiva

Gaussiska primtal. Christer Kiselman. Institut Mittag-Leffler & Uppsala universitet

Förra gången. Allmänt om samarbete. Dagens föreläsning

Lösningar och lösningsskisser

Remissvar. Förslag till föreskrifter och allmänna råd - Kemiska arbetsmiljörisker

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

Grundläggande matematisk statistik

18 juni 2007, 240 minuter Inga hjälpmedel, förutom skrivmateriel. Betygsgränser: 15p. för Godkänd, 24p. för Väl Godkänd (av maximalt 36p.

Definitionsmängd, urbild, domän

4 Diskret stokastisk variabel

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Värdering av olycksrisker Nationalekonomi

Spelteori. Lars-Åke Lindahl

K2 Något om modeller, kompakthetssatsen

Filosofisk logik Kapitel 15 (forts.) Robin Stenwall Lunds universitet

Fire Risk Evaluator Ett datorprogram för värdering av investeringar i brandskydd

Förslag på. Instruktion för kontrollanter i föreningslotterier

Välkommen till V4-bibeln

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Betingad sannolikhet och oberoende händelser

Induktion, mängder och bevis för Introduktionskursen på I

Självständigt arbete på grundnivå

LABORATION 3 - Regressionsanalys

Jörgen Säve-Söderbergh

Slumpförsök för åk 1-3

Exempel för diskreta och kontinuerliga stokastiska variabler

Talmängder. Målet med första föreläsningen:

Sociala investeringar - förebyggande insatser för ett minskat utanförskap

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Föreläsninsanteckningar till föreläsning 3: Entropi

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

TMS136. Föreläsning 2

TNK047 OPTIMERING OCH SYSTEMANALYS

Explorativ övning 4 ÄNDLIGT OCH OÄNDLIGT. Övning A


SF1625 Envariabelanalys

2x ex dx. 0 = ln3 e

Statistikens grunder HT, dagtid Statistiska institutionen

Hur man skriver matematik

y y 1 = k(x x 1 ) f(x) = 3 x

Enklare matematiska uppgifter

Tema Oändligheten Oändligheten - 1

Resurscentrums matematikleksaker

1 Att läsa matematik.

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

En bijektion mellan två mängder A och B som har ändligt antal element kan endast finnas om mängderna har samma antal element.

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Andragradspolynom Några vektorrum P 2

Kontinuitet och gränsvärden

Begreppen "mängd" och "element" är grundläggande begrepp i matematiken.

Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden.

Transkript:

Föreläsning 4: Beslut och nytta, paradoxer Litteratur: Hansson, Introduction to Decision Theory, kap 5-7 och 11 Resnik, Choices, kap 4 1# S:t Petersburg-paradoxen (Daniel Bernoulli, 1713; Nicolas Bernoulli, 1738) Regler: Singla en slant tills klave dyker upp. Om spelet slutar vid första singlingen får du två kronor; om spelet slutar vid andra singlingen för du fyra kronor o.s.v. Din förväntade vinst blir lika med (1/2)*2+(1/2) 2 *4+(1/2) 3 *8+(1/2) 4 *16+ = 1+1+1+1+. Din förväntade vinst är alltså oändligt stor! MEN: Skulle du vara beredd att betala en miljon kronor för att spela spelet? Ett tusen kronor? Nej, inte ens tio kronor. Bernoullis lösning: Minskande marginalnytta. Nyttan av pengar kan beskrivas som en konkav funktion. (Bernoulli använde log-funktionen) Beräkna förväntad nytta, inte förväntad vinst! Förväntad nytta blir lika med (1/ 2) * log(2) (1/ 2 n n= 0 + n n 2 2 / 2 2 + (1/ 2) + 3/ 2 3 + 2 * log(4) + (1/ 2) 4 / 2 +...) * log(2) = * log(2) = 2 * log(2) 0,6. 4 3 * log(8) + (1/ 2) 4 * log(16) +... = Alltså: Förväntad nytta är ändlig, även om förväntad vinst är oändlig! Anmärkning: Paradoxen kvarstår om man låter utbetalningarna bli enligt serien 10, 100, 10.000, 100.000.000, etc. (Resnik, sid. 109) 2# Nyttoteori expected utility theory 1

Formulerad av John von Neumann (matematiker) och Oskar Morgenstern (nationalekonom) i boken Theory of games and economic behaviour, 1944. Ett viktigt problem: Hur jämföra alternativ som innebär olika risknivåer? Exempel: Du har 1.000 kronor och erbjuds att investera dem i ett lotteri där du får 10.000 kr med 10 % sannolikhet och 10 kronor med 90 % sannolikhet. I Resniks bok är beteckningar på formen L(a; x; y) vanliga, vilket läses ett lotteri där du vinner x med sannolikheten a och y med sannolikheten 1-a. (x och y betecknar vanligen, men inte nödvändigtvis, penningenheter.) Vårt exempel kan alltså betecknas L(0,1; 10.000; 10), dvs. ett lotteri där sannolikheten är 0,1 att du får 10.000 och 0,9 (=1-0,1) att du får 10. Är det bra att gå med på lotteriet? A 1 : Om du behåller dina pengar är din förväntade förmögenhet lika med 1.000 kronor (detsamma som du hade från början). A 2 : Om du går med på lotteriet är din förväntade förmögenhet lika med 10.000*0,1+10*0,9 = 1.009 kronor. Om du väljer A 2 får du en (lite) högre förväntad förmögenhet än om du väljer A 1. Men, som S:t Petersburg-paradoxen visar, förväntad vinst säger inte allt om vad du bör välja. Om vi använder oss av Bernoullis log-funktion för att beskriva din nytta så får vi E[U(A 1 )] = log(1.000) = 3 E[U(A 2 )] = 0,1*log(10.000)+0,9*log(10) = 0,1*4+0,9*1 = 1,3. Enligt detta sätt att räkna är det klart bättre att låta bli lotteriet! Alltså: Antag att en viss nyttofunktion beskriver beslutsfattarens preferenser. Välj mellan olika, mer eller mindre, riskfyllda alternativ på ett sätt som maximerar den förväntade nyttan! 3# Intervallskalor 2

Ibland är det meningsfullt att beskriva hur stora skillnaderna är mellan de objekt man jämför: Kebnekaise är lite högre än Åreskutan. Mont Blanc är betydligt högre än Kebnekaise. Mount Everest är mycket högre än Mont Blanc. Notera användandet av orden lite, betydligt och mycket! Kontrastera med följande utsaga: Kebnekaise är högre än Åreskutan. Mont Blanc är högre än Kebnekaise. Mount Everest är högre än Mont Blanc. I det ena fallet skulle följande skalsteg vara meningsfulla: 1.420 2.103 4.807 8.848 I det andra fallet räcker det med följande skala för att förmedla budskapet: 1 2 3 4 (eller: lågt högt högre högst) Intervallskala = en skala i vilken avstånden mellan olika skalvärden är lika stora genom hela skalan, men där en absolut nollpunkt saknas. Varför intervallskalor i beslutsteorin? För att veta huruvida en beslutsfattare är villig att ta en risk räcker det inte med att veta om han föredrar ett utfall framför ett annat; vi behöver även veta om hon föredrar det tillräckligt mycket för att vara villig att ta risken. Vi har tidigare behandlat ordinalskalor, nyttofunktioner där följande gäller: 1) xpy omm u(x) > u(y). 2) xiy omm u(x) = u(y). Dessa villkor gäller även för intervallskalor, men intervallskalor kräver att ytterligare ett villkor är uppfyllt: 3) Preferensintervallet mellan x och y är minst lika stort som intervallet mellan z och w omm u(x)-u(y) u(z)-u(w). (Alla intervallskalor är ordinalskalor, men alla ordinalskalor är inte intervallskalor; intervallskalor innehåller mer information än ordinalskalor.) 4# Exempel Vad menas med ett preferensintervall? Betänk följande utsaga: 3

Jag föredrar glass framför cola. Cola är betydligt bättre än äpplen. Jag föredrar äpplen framför popcorn, men de är nästan likvärdiga. Vi kan tolka detta som att preferensintervallet mellan cola (C) och äpplen (A) är störst, eftersom det ena är betydligt bättre än det andra. Minst är preferensintervallet mellan äpplen och popcorn (P), som är nästan likvärdiga. Preferensintervallet mellan glass (I) och cola tycks vara mindre än preferensintervallet mellan cola och äpplen, men större än preferensintervallet mellan äpplen och popcorn. Illustration (Resnik, sid. 82): sämre bättre P A C I Ett sätt att beskriva ovanstående situation är genom följande nyttofunktion: u(p) = 1 u(a) = 2 u(c) = 7 u(i) = 10 Som enkelt kan verifieras uppfylls villkoren 1-3 av denna funktion. 5# Transformationer Ovanstående nyttofunktion kan genomgå en positiv linjär transformation, dvs. en transformation av typen v=a+bu, utan att något av villkoren 1-3 bryts. Beakta t.ex. följande funktion, där v=5+10u: v(p) = 15 v(a) = 25 v(c) = 75 v(i) = 105 Denna nyttofunktion innehåller samma information som den första nyttofunktionen. Däremot finns det många andra slags transformationer som man inte får göra! Beakta t.ex. följande funktion, där w=u 2 : 4

w(p) = 1 w(a) = 4 w(c) = 49 w(i) = 100 Denna funktion uppfyller visserligen villkoren 1 och 2; om ett alternativ är bättre än ett annat så har det ett högre siffervärde: I är bättre än C, C är bättre än A och A är bättre än P. Och mycket riktigt gäller att w(i) > w(c) > w(a) > w(p). Men som synes bryter funktionen mot villkor 3: Preferensintervallet mellan C och A är större än preferensintervallet mellan I och C. MEN: w(c)-w(a) < w(i)-w(c). Alltså är w=u 2 INTE en tillåten transformation av intervallskalor! 6# Mer om nyttoteorin von Neumann och Morgenstern föreslår att man använder sig av nyttofunktioner med följande egenskaper: 1) xpy omm u(x) > u(y) 2) xiy omm u(x) = u(y) 3) u[l(a; x; y)] = au(x)+(1-a)u(y) 4) Om en annan funktion u tillfredsställer villkoren 1-3 så är u en positiv linjär transformation av u. Villkor 1-2 känner vi igen sedan tidigare. Villkor 3 överbryggar gapet mellan riskfyllda och säkra alternativ. Villkor 4 innebär att u är en intervallskala för beslutsfattarens preferenser. Om en nyttofunktion uppfyller villkor 1-4 så säger man att den har the expected utility property. 7# Nyttoteorins axiom Rationalitetsvillkor inom nyttoteorin (a, b, c och d är sannolikheter; x, y och z är utfall eller lotterier): The ordering condition: Alla utfall och alla lotterier som kan bildas genom att kombinera dem ska kunna rankas i en preferensordning. Detta innebär att asymmetri, sambundenhet, fullständighet och transitivitet (se sid. 23) gäller. 5

The continuity condition: Om xpy och ypz så finns det något reellt tal a sådant att 0 a 1 och yil(a; x; z). The better prize condition: xpy omm L(a; z; x)pl(a; z; y) och L(a; x; z)pl(a; y; z). The better-chances condition: Om xpy så är a>b ekvivalent med att L(a; x; y)pl(b; x; y). The reduction of compound lotteries condition: Om d=ab+(1-a)c så gäller att L(a; L(b; x; y); L(c; x; y))il(d; x; y). Om dessa rationalitetsvillkor är uppfyllda så går det att bevisa att det finns en nyttofunktion som uppfyller villkoren 1-4. Detta resultat, dvs. att villkoren 1-4 följer av ovanstående rationalitetsvillkor, kallas för the expected utility theorem. 8# Allais paradox Maurice Allais (f. 1911), fransk nationalekonom och nobelpristagare (1988), började sin karriär som gruvingenjör. Allais paradox utgör ett problem för nyttoteorin. Paradoxen utgår från två valsitutioner: A) alternativ 1: Du får 1.000.000 med sannolikheten 100 %. alternativ 2: Du får 5.000.000 med sannolikheten 10 %, 1.000.000 med sannolikheten 89 % eller 0 med sannolikheten 1 %. B) alternativ 1: Du får 5.000.000 med sannolikheten 10 % och 0 med sannolikheten 90 %. alternativ 2: Du får 1.000.000 med sannolikheten 11 % och 0 med sannolikheten 89 %. Många människor föredrar det första alternativet framför det andra alternativet i båda situationerna. Spontant tycker vi inte att detta är särskilt irrationellt; det vore konstigt att säga att sådana preferenser är felaktiga eller förbjudna. En möjlig informell förklaring är t.ex. att man lockas av det säkra alternativet i situation A, samtidigt som man gärna vill åt jackpoten i situation B. 6

MEN: Det finns ingen nyttofunktion som beskriver dessa preferenser! I situation A gäller: u(1.000.000) > 0,1*u(5.000.000)+0,89*u(1.000.000)+0,01*u(0) 0,11*u(1.000.000) > 0,1*u(5.000.000)+0,01*u(0) Men i situation B gäller: 0,1*u(5.000.000)+0,9*u(0) > 0,11*u(1.000.000)+89*u(0) 0,11*u(1.000.000) < 0,1*u(5.000.000)+0,01*u(0) Paradoxen har diskuterats mycket. En del beslutsteoretiker anser att Allais paradox utgör ett argument mot nyttoteorin; varför ska vi förlita oss på en beslutsregel när fullt rationella beslutsfattare kan bryta mot den? Andra beslutsteoretiker menar att det faktiskt vore irrationellt att välja första alternativet i båda fallen; en av dem är statistikern Leonard Savage. Savage jämför Allais valsituationer med ett lotteri med 100 lotter, var och en av dem numrerad: LOTT NUMMER 1 2-11 12-100 SITUATION alternativ 1 1 M 1 M 1 M A alternativ 2 0 5 M 1 M SITUATION alternativ 1 0 5 M 0 B alternativ 2 1 M 1 M 0 I båda situationerna kan man bortse från lott nummer 12-100, eftersom de ger samma vinst vilket alternativ man än väljer. Alternativ 1 i situation A är i så fall identiskt med alternativ 2 i situation B, och alternativ 2 i situation A är identiskt med alternativ 1 i situation B. Är detta ett skäl att tro att Allais beslutsfattare är irrationella? 7

8# Ellsbergs paradox Daniel Ellsberg (f. 1931), amerikansk nationalekonom och kärnvapenmotståndare. Ellsbergs paradox utgör ett problem bl.a. för den subjektiva tolkningen av sannolikhetsbegreppet i Bayesiansk beslutsteori. En urna innehåller 90 kulor. 30 av kulorna är gula. Övriga kulor är antingen röda eller blå (Vi vet ej exakt i vilken proportion). Precis som i Allais paradox står du inför två valsituationer med vardera två alternativ. Vinst enligt följande tabell: Gul Röd Blå 30 60 SITUATION alternativ 1 100 0 0 A alternativ 2 0 100 0 SITUATION alternativ 1 0 100 100 B alternativ 2 100 0 100 Många väljer alternativ 1 framför alternativ 2 i situation A, samtidigt som de föredrar alternativ 1 framför alternativ 2 i situation B. Är detta irrationellt? Det finns ingen Bayesiansk förväntning som motiverar de val som Ellsberg beskriver! Låt p stå för (den subjektiva) sannolikheten att kulan är röd. I situation A gäller: 100*0,3 > 100*p p < 0,3 Men i situation B gäller: 100*p+100*(1-0,3-p) > 100*0,3+100*(1-0,3-p) p > 0,3 Se även: Resnik, sid. 109 8

9# Newcombs paradox Uppkallad efter fysikern William Newcomb. Även kallad The Predictor Paradox Omskriven av Robert Nozick (i övrigt mest känd som politisk filosof) Situation: Blå box tom Inte tom Ta blå boxen = 0; p = 0,1 = 1M; p = 0,9 Ta båda boxarna = 1.000; p = 0,9 = 1M+1000; p = 0,1 Övriga exempel: * Calvinistens frestelse * Rökarens dröm Ett seriöst problem? 9