Spelteori Lars-Åke Lindahl 2014
Spelteori c 2014 Lars-Åke Lindahl, Matematiska institutionen, Uppsala universitet
Innehåll Förord Notation 1 I Nyttoteori 3 1 Preferensrelationer 5 11 Preferensrelationer och nyttofunktioner 5 12 Kontinuerliga preferensrelationer 9 2 Lotterier 13 21 Lotterier 13 22 Kardinala nyttofunktioner 17 23 von Neumann Morgenstern-preferenser 20 v II Spel på strategisk form 25 3 Strategiska spel 27 31 Definition 28 32 Nashjämvikt 32 33 Existens av Nashjämvikt 37 34 Säkerhetsnivån 40 35 Strikt konkurrensinriktade spel 42 36 Cournots och Bertrands oligopolmodeller 47 4 Blandade strategier 57 41 Blandade strategier 58 42 Likgiltighetsprincipen 62 43 Dominans 65 44 Maxminstrategier 72 5 Tvåpersoners nollsummespel 77 51 Optimala strategier och spelets värde 77 52 Tvåpersoners nollsummespel och linjär programmering 82 iii
iv INNEHÅLL 6 Rationaliserbarhet 87 61 Övertygelser 87 62 Rationaliserbarhet 91 III Spel på extensiv form 97 7 Extensiva spel med perfekt information 99 71 Spelträd 99 72 Spel på extensiv form 102 73 Delspelsperfekta jämvikter 109 74 Stackelbergs modell för duopol 114 75 Slumpdrag 117 8 Extensiva spel med ofullständig information 123 81 Basic Endgame 123 82 Extensiva spel med ofullständig information 126 83 Blandade strategier och situationsanpassade strategier 135 IV Koalitionsspel 149 9 Koalitionsspel 151 91 Definitioner 151 92 Imputeringar 153 93 Exempel 155 94 Kärnan 160 95 Karakterisering av spel med icke-tom kärna 164 96 Nukleolen 168 10 Shapleyvärdet 181 101 Shapleylösningen 181 102 Alternativ karakterisering av Shapleyvärdet 187 103 Shapley Shubiks styrkeindex 192 11 Koalitionsspel utan överförbar nytta 195 111 Koalitionsspel utan överförbar nytta 195 112 Bytesekonomier 197 113 Nashs förhandlingslösning 202 Spelteorins historia 209 Appendix 1: Konvexitet 213 Appendix 2: Kakutanis fixpunktssats 217 Appendix 3: Preferensrelationer och nyttofunktioner 221
v Svar och anvisningar till övningarna 229 Svensk terminologi 239 Sakregister 241
vi
Förord Innehållet i det här kompendiet bygger på föreläsningar för en fempoängskurs i spelteori som jag gav somrarna 2005 och 2006 Kompendiet har funnits sedan dess men nu blivit föremål för en översyn, varvid en del kapitel redigerats om för att förhoppningsvis ökat läsbarheten och ett antal tryckfel eliminerats Det mesta av innehållet bör man kunna tillgodogöra sig utan några större förkunskaper i matematik en termins högskolestudier i ämnet torde vara fullt tillräckligt Man måste behärska de vanliga mängdoperationerna (union, snitt, mängdtillhörighet) och funktionsbegreppet, veta vad som menas med sannolikheter (på ändliga utfallsrum) och vara van vid att hantera summa- och produktsymbolerna Men framförallt får man inte var rädd för det matematiska språkbruket, som ju innebär att man definierar abstrakta begrepp och inför symboler och sedan använder dessa friskt De mest avancerade resonemangen förekommer i avsnitten 33, 61, 62, 83, 95 och (slutet av) 96 samt i appendix 2 och 3 För att ta sig igenom dessa bör man nog kunna lite om öppna och slutna mängder, kompakthet och konvexitet, vilket är mer än vad man lär sig under den första terminens matematikstudier Å andra sidan har man lärt sig ganska mycket om spelteori om man tar sig igenom kompendiet utan att ha läst dessa avsnitt, så den som inte har de nödvändiga förkunskaperna kan hoppa över dem utan att för den skull ha dåligt samvete Uppsala, januari 2014 Lars-Åke Lindahl vii
Notation De matematiska beteckningar som vi kommer att använda oss av är med några få undantag standardbeteckningar, och de som inte är det kommer vi att förklara allteftersom de införs Således betecknar R mängden av alla reella tal, medan R + är mängden av alla icke-negativa reella tal Vi skriver f : X R för att ange att den reellvärda funktionen f är definierad på mängden X Antalet element i en ändlig mängd A kommer att betecknas A Ett centralt begrepp är begreppet produktmängd Om A 1 och A 2 är två godtyckliga mängder, så består produktmängden A 1 A 2 av alla ordnade par (a 1, a 2 ) som kan bildas genom att välja elementet a 1 från mängden A 1 och elementet a 2 från mängden A 2 Produktmängder av fler än två mängder definieras förstås analogt Givet n stycken mängder A 1, A 2,, A n betecknar A 1 A 2 A n, eller kortare n j=1 A j, mängden av alla ordnade n-tipler (a 1, a 2,, a n ) som kan bildas genom att välja a 1 A 1, a 2 A 2,, a n A n Ordnade n-tipler kommer vi för övrigt också att kalla vektorer Vi kommer att använda följande konvention för namngivning av n-tipler Om de ingående elementen i en n-tipel betecknas a 1, a 2,, a n, använder vi samma bokstav a som namn på själva n-tipeln Detta innebär att exempelvis a = (a 1, a 2,, a n ), b = (b 1, b 2,, b n ) och x = (x 1, x 2,, x n ) Vi använder förstås samma konvention för produktmängder så att A = A 1 A 2 A n, osv Mycket ofta kommer vi att behöva betrakta den (n 1)-tipel som uppstår när elementet på plats i i en n-tipel stryks, och för det behövs en bekväm beteckning Om a = (a 1, a 2,, a n ) skriver vi a i för (n 1)-tipeln (a 1,, a i 1, a i+1,, a n ) I fallet n = 3 är således a 1 = (a 2, a 3 ), a 2 = (a 1, a 3 ) och a 3 = (a 1, a 2 ) Vi använder ett analogt skrivsätt för produktmängder; om A = A 1 A 2 A n, så är A i den produktmängd med n 1 faktorer som bildas när den i:te faktorn A i utelämnas 1
2 Givet en n-tipel a = (a 1, a 2,, a n ) behöver vi också ett enkelt sätt att beteckna den n-tipel som bildas när man byter ut elementet a i på plats i mot ett element b Vi skriver (a i, b) för detta element, vilket innebär att (a i, b) = (a 1,, a i 1, b, a i+1,, a n ) I fallet n = 3 är alltså (a 1, b) = (b, a 2, a 3 ), (a 2, b) = (a 1, b, a 3 ) och (a 3, b) = (a 1, a 2, b) Vidare är naturligtvis (a i, a i ) = a för alla n-tipler a Vi använder förstås ett helt analogt skrivsätt för produktmängder; detta betyder att (A i, B) = A 1 A i 1 B A i+1 A n
Del I Nyttoteori 3
Kapitel 1 Preferensrelationer 11 Preferensrelationer och nyttofunktioner Vi hamnar dagligen i situationer där vi behöver välja mellan olika handlingsalternativ: Kavaj eller tröja? Te eller kaffe till frukost? Bil eller buss till jobbet?, osv De flesta valen gör vi av vana, omedvetet eller utan att reflektera närmare, men om det gäller en helt ny situation och ett viktigare val, vill vi kanske göra ett rationellt val En förutsättning för att kunna göra detta är att vi på något sätt kan rangordna eller värdera de olika handlingsalternativen Det är sådana beslutsproblem som vi ska studera i det här kapitlet Ett beslutsproblem består med andra ord av en mängd A av handlingsalternativ och en preferensrelation på mängden A, där a b ska utläsas alternativet a är lika bra eller bättre än alternativet b Istället för a b skriver man också b a För att en relation på A ska duga som preferensrelation måste vissa minimikrav vara uppfyllda; de ges i följande definition Definition 1 En preferensrelation på A är en relation som uppfyller följande två axiom: Axiom 1 (Fullständighet) För alla a, b A är a b eller b a Axiom 2 (Transitivitet) Om a b och b c, så är a c Fullständigheten innebär att alla alternativ i A ska kunna rangordnas och medför speciellt att a a för alla a A Om a b och b a, kallar vi alternativen a och b ekvivalenta och skriver a b Vi säger också att beslutsfattaren är indifferent för sådana alternativ Relationen är förstås en ekvivalensrelation på mängden A Om a b och a b, säger vi att a är bättre än b och skriver a b Definition 2 Låt vara en preferensrelation på mängden A Ett element a A kallas maximalt (med avseende på preferensrelationen) om a x 5
6 1 Preferensrelationer för alla x A (och minimalt om x a för alla x A) Att a är maximalt betyder alltså att det inte finns något alternativ i A som är bättre Det är lätt att ge exempel på preferensrelationer som saknar maximala element och på preferensrelationer med mer än ett maximalt element Om mängden A är ändlig, vilket vi ofta kommer att antaga i fortsättningen, finns det emellertid alltid maximala element Det följer nämligen av axiom 1 och 2 att handlingsalternativen i A i så fall kan ordnas i en ändlig kedja a 1 a 2 a 3 a n, och då är naturligtvis alternativet a 1 maximalt Nu när vi beskrivit vad som menas med preferensrelationer och maximala element är det lätt att definiera vad som bör menas med en rationell beslutsfattare en rationell beslutsfattare är en person som i varje beslutssituation väljer ett maximalt element som sitt handlingsalternativ Exempel 1 En persons preferenser för de fem rätterna på lunchrestaurangens matsedel en viss dag ser ut så här: Bruna bönor Kroppkakor Pannbiff Sill och potatis Pasta Det unika optimala valet är förstås Bruna bönor Ett vanligt sätt att ange sina preferenser (t ex i tävlingssammanhang) är att sätta poäng på de olika alternativen; ju bättre alternativ desto högre poäng Detta leder till begreppet nyttofunktion Definition 3 Låt vara en preferensrelation på mängden A En funktion u: A R kallas en med preferensrelationen kompatibel (ordinal) nyttofunktion om a b u(a) u(b) Exempel 2 Vi får en med matsedeln i exempel 1 kompatibel nyttofunktion u genom att definiera u(bruna bönor) = 3, u(kroppkakor) = u(pannbiff) = 2, u(sill och potatis) = u(pasta) = 1 Kan exempel 2 generaliseras, dvs finns det en kompatibel nyttofunktion för varje preferensrelation? För ändliga mängder är svaret uppenbarligen ja; för oändliga mängder behöver man topologiska tilläggsvillkor som vi ska diskutera i nästa avsnitt Sats 1 Till varje preferensrelation på en ändlig mängd hör en kompatibel nyttofunktion Bevis Ordna elementen i mängden i växande ordning a 1 a 2 a n ;
11 Preferensrelationer och nyttofunktioner 7 eftersom mängden är ändlig är detta inget problem Definiera sedan funktionen u induktivt genom att sätta u(a 1 ) = 1 och { u(a k 1 ) om a k a k 1 u(a k ) = u(a k 1 ) + 1 om a k a k 1 för k = 2, 3,, n Funktionen u är uppenbarligen kompatibel med preferensrelationen I definitionen av begreppet nyttofunktion är det bara den inbördes ordningen mellan värdena u(a) och u(b) som är viktig, inte själva värdena Nyttofunktionen är därför inte entydigt bestämd av sin preferensrelation Sats 2 Två funktioner u och v på A är kompatibla med samma preferensrelation om och endast om v = f u för någon strängt växande funktion f (som är definierad på värdemängden till u) Bevis Antag att u är en med kompatibel nyttofunktion Om v = f u och funktionen f är strängt växande, så gäller enligt definitionen av monotonitet att u(a) u(b) v(a) = f(u(a)) f(u(b)) = v(b) Funktionen v är därför också kompatibel med preferensrelationen Antag omvänt att v är en med kompatibel nyttofunktion Då gäller speciellt att u(a) = u(b) a b v(a) = v(b), så vi kan därför entydigt definiera en funktion f på u:s värdemängd genom att sätta f(u(a)) = v(a) för alla a A Naturligtvis är då v = f u, och det följer av definitionen av nyttofunktion att u(a) u(b) a b v(a) v(b) f(u(a)) f(u(b)) Ekvivalensen ovan innebär förstås att f är strängt växande Ett vanligt sätt att definiera en preferensrelation på en mängd A är att utgå från en funktion u: A R och sedan definiera genom sambandet a b u(a) u(b) Den på så sätt definierade relationen är uppenbarligen både fullständig och transitiv, dvs en preferensrelation Preferensrelationen säges vara inducerad av funktionen u, och u är per definition en med relationen kompatibel nyttofunktion
8 1 Preferensrelationer Exempel 3 De flesta människorna är väl giriga i den bemärkelsen att de tycker det är bättre att ha mer pengar än mindre, vilket betyder att preferensen för rikedom ges av den vanliga ordningsrelationen på R, mängden av reella tal, som representerar mängden av alla möjliga förmögenheter (angivna i kronor) Varje strängt växande funktion är en motsvarande ordinal nyttofunktion Preferensrelationen och de ordinala nyttofunktionerna ger emellertid inte någon information om hur en person värderar nyttan av olika förmögenhetsförändringar En löneökning med 1 000 kr i månaden värderas förmodligen mer av en person med en månadslön på 10 000 kr än av en person med 100 000 kr i månaden, men för att kunna beskriva detta måste vi tilldela våra nyttofunktioner ytterligare egenskaper utöver att ange en ordning Nyttofunktionens funktionsvärden u(x) måste i så fall ange nyttan av x på ett sådant sätt att man meningsfullt kan jämföra nyttoförändringen då x ändras från a till b med nyttoförändringen då x ändras från c till d med hjälp av differenserna u(b) u(a) och u(d) u(c) Nyttofunktioner med den egenskapen kallas kardinala nyttofunktioner, och vi kommer att studera sådana närmare i nästa kapitel Låt oss som exempel jämföra följande två tänkbara kardinala nyttofunktioner: u(x) = x och v(x) = ln x För personer med den förstnämnda nyttofunktion är u(11 000) u(10 000) = u(101 000) u(100 000) = 1 000, dvs dessa personer värderar en ökning av månadslönen med 1 000 kr lika oavsett om lönen före ökningen är 10 000 eller 100 000 kr För personer med v som nyttofunktion är istället v(11 000) v(10 000) = ln 11 0095 och v(101 000) v(100 000) = ln 101 0010, dvs för dem är värdet av löneökningen större vid den lägre månadsinkomsten Övningar 11 Visa att indifferensrelationen är en ekvivalensrelation, dvs att (i) a a för alla a A (ii) a b b a (iii) a b & b c a c 12 Den s k lexikografiska ordningen på R 2 definieras av att (x 1, x 2 ) (y 1, y 2 ) om och endast om x 1 > y 1 eller x 1 = y 1 och x 2 y 2 Visa att den lexikografiska ordningen är en preferensrelation 13 Definiera en relation på R 2 genom Är en preferensrelation? (x 1, x 2 ) (y 1, y 2 ) x 1 y 1 & x 2 y 2 14 Anna, Bo och Cecilia är fotbollsfans och försöker enas om vilket av Stockholmslagen AIK, Djurgården och Hammarby de som grupp tycker bäst om, vilket inte är helt enkelt eftersom deras individuella preferenser är olika Anna rankar lagen i ordningen AIK, Djurgården, Hammarby, Bo i ordningen Hammarby, AIK, Djurgården, och Cecilia i ordningen Djurgården, Hammarby, AIK
12 Kontinuerliga preferensrelationer 9 Våra tre fotbollsvänner beslutar sig därför för att fastställa gruppens preferenser genom majoritetsbeslut När AIK i en omröstning ställs mot Djurgården, vinner AIK med två röster (Annas och Bos) mot en, så gruppen tycker att AIK Djurgården a) Komplettera genom att bestämma relationen mellan AIK och Hammarby och mellan Djurgården och Hammarby b) Är den erhållna relationen mellan lagen en preferensrelation? c) Kan relationen beskrivas med hjälp av någon nyttofunktion? 15 En kardinal nyttofunktion u med avseende på förmögenhet kallas riskavert om funktionen är växande och strikt konkav (vilket gäller om u (x) > 0 och u (x) < 0 för alla x) Nyttofunktionen kallas riskneutral om den har formen u(x) = ax + b med a > 0 a) Visa att för en riskavert person (dvs en person med en riskavert nyttofunktion) är nyttoökningen då förmögenheten ökar med 1 000 kr större om den ursprungliga förmögenheten är 10 000 kr än om den är 1 milj kr b) Vad gäller i motsvarande läge för en riskneutral person? c) Generalisera påståendet i a) genom att formulera hur en ökning med h kr påverkar en riskavert persons nytta om den ursprungliga förmögenheten är a resp b kr 16 Vilken inkomstökning krävs för att en person med 30 000 kr i månadslön och u(x) = ln x som kardinal nyttofunktion ska känna samma tillfredsställelse som 1 000 kr mer i månadslön gav henne när månadslönen var 10 000 kr? 12 Kontinuerliga preferensrelationer För att man ska kunna säga något intressant om preferensrelationer på oändliga mängder behöver man göra ytterligare antaganden om relationen, t ex att den är kontinuerlig eller uppfyller något konvexitetsvillkor Definition 4 Låt X vara en delmängd av R n En preferensrelation på X kallas kontinuerlig om följande villkor är uppfyllt: För alla konvergenta följder (x k ) k=1 och (y k) k=1 i X med egenskapen att x k y k för alla k och vars gränsvärden x = lim x k och y = lim y k också k k ligger i X, gäller att x y Sats 3 Om X är en sluten delmängd av R n, är en kontinuerlig preferensrelation på X och a är ett godtyckligt element i X, så är mängden {x X x a} sluten Bevis För att visa att mängden F = {x X x a} är sluten räcker det att visa att gränsvärdet x = lim x k till varje konvergent följd (x k ) k=1 av element i F också ligger F Men om x k F, så är x k a, så det följer därför av definitionen av kontinuitet (med y k = a för alla k) att x a, dvs att x F
10 1 Preferensrelationer Vitsen med kontinuerliga preferensrelationer är att de har maximala element om mängden är kompakt (En delmängd av R n är kompakt om den är sluten och begränsad) Sats 4 Antag att mängden X är kompakt Då har varje kontinuerlig preferensrelation på X ett maximalt element (som inte behöver vara unikt) Bevis Sätt F a = {x X x a}; för varje a X är F a enligt föregående sats en sluten delmängd av X Betrakta nu snittmängden a X F a av alla mängderna F a Ett element b X tillhör denna snittmängd om och endast om b tillhör varje F a, dvs om och endast om b a för alla a X, dvs om och endast om elementet b är maximalt Vi behöver därför visa att snittmängden a X F a inte är tom Vi gör ett motsägelsebevis och antar att snittmängden är tom Enligt en standardsats i topologin karakteriseras kompakta mängder av att varje familj av slutna delmängder med tomt snitt har en ändligt delfamilj med tomt snitt Detta innebär i det här fallet att det finns ändligt många element a 1, a 2,, a m så att m j=1 F a j =, och vi kan naturligtvis anta att dessa element är ordnade så att a 1 a 2 a m Men i så fall gäller att a 1 F aj för alla j, så elementet a 1 tillhör snittet m j=1 F a j, som därför inte är tomt Detta är en motsägelse som bevisar att det måste finnas ett maximalt element Kontinuitetsdefinitionen för preferensrelationer är gjord så att preferensrelationer med kontinuerliga nyttofunktioner ska bli kontinuerliga Vi har nämligen följande resultat Sats 5 Antag att preferensrelationen på X har någon kontinuerlig nyttofunktion u: X R Då är preferensrelationen kontinuerlig Bevis Låt (x k ) k=1 och (y k) k=1 vara följder i X som konvergerar mot x resp y och uppfyller x k y k för alla k Då är u(x k ) u(y k ) för alla k, och eftersom funktionen u är kontinuerlig följer det genom gränsövergång i olikheten att u(x) u(y), dvs att x y, vilket visar att preferensrelationen är kontinuerlig Alla nyttofunktioner u som är kompatibla med en kontinuerlig preferensrelation kan inte vara kontinuerliga eftersom varje sammansättning av typen f u också är en kompatibel nyttofunktion, om funktionen f är strängt växande Sats 5 har emellertid följande omvändning Sats 6 Antag att X är en sammanhängande delmängd av R n Då har varje kontinuerlig preferensrelation på X en kompatibel kontinuerlig nyttofunktion u
12 Kontinuerliga preferensrelationer 11 Vi kommer inte att utnyttja sats 6 och avstår därför från beviset som är en smula komplicerat Förutom kontinuitet kommer vi också ibland att behöva använda oss av följande konvexitetsegenskap Definition 5 En funktion f : X R kallas kvasikonkav om mängderna {x X f(x) t} är konvexa för alla t R En preferensrelation på X kallas kvasikonkav om mängderna {x X x a} är konvexa för alla a X x 1 x 2 a {x x a} Figur 11 En preferensrelation är kvasikonkav om samtliga mängder av typen {x x a} är konvexa t y = f(x) x y {x f(x) t} Figur 12 Figuren visar grafen till en kvasikonkav envariabelfunktion f Mängderna {x f(x) t} är intervall eller tomma för alla t Sats 7 Preferensrelationer med kvasikonkava nyttofunktioner u är kvasikonkava Bevis Påståendet följer direkt av kvasikonkavitetsdefinitionen och sambandet {x X x a} = {x X u(x) u(a)} Övningar 17 Är den lexikografiska ordningen på R 2 (se övning 12) en kontinuerlig preferensrelation? 18 Är den lexikografiska ordningen på R 2 kvasikonkav?
Kapitel 2 Lotterier 21 Lotterier I besluts- och spelteori måste man ibland fatta beslut och välja alternativ som på ett eller annat sätt beror av slumpen Vi kommer i den här framställningen inte att behöva göra några avancerade sannolikhetsteoretiska resonemang, så det räcker om man kan de allra mest elementära sannolikhetsbegreppen För att undvika komplikationer kommer vi enbart att arbeta med ändliga utfallsrum, och vi kommer att använda oss av den terminologi som är bruklig i spelteorin och bl a kalla sannolikhetsfördelningar för lotterier Definition 1 Låt A vara en ändlig mängd Med ett lotteri p över A menas en sannolikhetsfördelning på A, dvs en funktion p: A [0, 1] som uppfyller p(x) = 1 x A Mängden av alla lotterier över A betecknas L(A) Vi tolkar förstås p(a) som sannolikheten för att lotteriet ska ge utfallet (vinsten) a Exempel 1 Antag att mängden A består av tre element b, c och n, som står för alternativen att vinna en bil, en cykel resp ingenting Genom att sätta p(b) = 00001, p(c) = 0005 och p(n) = 09949 har vi definierat ett lotteri över A, där sannolikheten att vinna en bil är en på tiotusen och sannolikheten att vinna en cykel är fem på tusen Det finns lotterier där utgången är helt given För dem inför vi följande beteckningar Definition 2 För a A definieras lotteriet δ a av att { 1 för x = a δ a (x) = 0 för x a 13
14 2 Lotterier I lotteriet δ a är med andra ord a det enda möjliga utfallet Om p och q är två lotterier över A och α och β är två icke-negativa tal med summa 1, så är också funktionen αp + βq ett lotteri över A Mängden L(A) av alla lotterier är med andra ord en konvex mängd Mer allmänt gäller förstås att varje konvex summa av lotterier är ett lotteri, dvs summan m i=1 α ip i är ett lotteri om p 1, p 2,, p m är lotterier och α 1, α 2,, α m är icke-negativa tal med summa 1 Vi kan realisera lotteriet p = m i=1 α ip i i två steg Låt L vara ett lotteri med m olika utfall, där utfall nr i inträffar med sannolikhet α i och består i att fortsätta med lotteriet p i Lotteriet p är den kombinerade effekten av att först utföra L och, om utfallet i detta lotteri är alternativ i, sedan fortsätta med lotteriet p i Varje lotteri p över A är en konvex kombination av de enkla lotterierna δ a eftersom p = p(a)δ a a A Antag att A = {a 1, a 2,, a n } består av n element Varje lotteri p över A är förstås helt bestämt av n-tipeln (p(a 1 ), p(a 2 ),, p(a n )), så därför är avbildningen p (p(a 1 ), p(a 2 ),, p(a n )) en bijektion mellan mängden L(A) av alla lotterier över A och en delmängd av R n Denna delmängd, mängden {(p(a 1 ), p(a 2 ),, p(a n )) p L(A)}, är en konvex och kompakt mängd, som för n = 2 är sträckan mellan punkterna (1, 0) och (0, 1), och för n = 3 är triangeln med hörn i (1, 0, 0), (0, 1, 0) och (0, 0, 1) Observera att hörnpunkterna i bildmängden svarar mot de säkra lotterierna δ ai Exempel 2 För alternativmängden A = {b, c, n} i exempel 1 kan lotterimängden L(A) identifieras med mängden {(x 1, x 2, x 3 ) x 1 + x 2 + x 3 = 1, x 1, x 2, x 3 0}, som är en triangel i R 3, och lotteriet i exemplet svarar då mot punkten (00001, 0005, 09949) Punkten (1,0,0) motsvaras av lotteriet δ b, som ger en bil som vinst med sannolikhet 1, dvs helt säkert Definition 3 Låt u: A R vara en funktion definierad på A, och låt p vara ett godtyckligt lotteri över A Summan ũ(p) = a A u(a)p(a) kallas för väntevärdet av u med avseende på lotteriet p
21 Lotterier 15 Genom att variera p erhåller man en funktion p ũ(p) som är definierad på lotterimängden L(A) Om u är en nyttofunktion, kommer vi att kalla funktionen ũ: L(A) R för den till u associerade förväntade nyttofunktionen på L(A) Antag t ex att u(a) är den vinst i kronor som man erhåller om ett lotteri resulterar i utfallet a Då är ũ(p) den förväntade vinsten av lotteriet p, och enligt stora talens lag är det den vinst man i genomsnitt får då lotteriet upprepas många gånger Exempel 3 Betrakta åter lotteriet i exempel 1, och antag att bilvinsten är värd 200 100 kr, cykelvinsten är värd 5 100 kr och att en lott kostar 100 kr Låt vidare funktionen u ange vinstens värde minskat med lottpriset så att u(b) = 200 000, u(c) = 5 000 och u(n) = 100 Väntevärdet av u med avseende på det explicita lotteriet p i exempel 1 blir då ũ(p) = 200 000 00001 + 5 000 0005 100 09949 = 5449 kr Funktionen ũ: L(A) R är uppenbarligen affin på sin definitionsmängd i den bemärkelsen att ũ(αp + βq) = αũ(p) + βũ(q) för alla lotterier p och q och alla reella tal α, β 0 med summa 1 Naturligtvis är funktionen också kontinuerlig; ũ(p) är helt enkelt ett polynom av grad 1 i variablerna p(a 1 ),, p(a n ) Med beteckningarna x i = p(a i ) och c i = u(a i ) ser det hela kanske mer välbekant ut för läsaren, ty då blir ũ(p) = c 1 x 1 + + c n x n Direkt ur väntevärdesdefinitionen följer den självklara utsagan ũ(δ a ) = u(a), dvs väntevärdet av u med avseende på ett lotteri δ a, som helt säkert resulterar i utfallet a, är lika med u(a) Av det skälet, och för att lätta upp vår notation, kommer vi i fortsättningen oftast att använda samma beteckning för det säkra lotteriet δ a och handlingen a och följaktligen skriva ũ(a) istället för ũ(δ a ) Sats 1 Vi kommer längre fram att behöva följande triviala resultat Låt u och v vara två funktioner på A och antag att för alla x A Då är för alla lotterier p L(A) v(x) = Cu(x) + D ṽ(p) = Cũ(p) + D
16 2 Lotterier Bevis ṽ(p) = v(a)p(a) = (Cu(a) + D)p(a) = C u(a)p(a) + D p(a) a A a A a A a A = Cũ(p) + D I spelteorin kommer vi att betrakta situationer, där de olika spelarna oberoende av varandra väljer var sitt lotteri och det förväntade utfallet beror av de kombinerade valen Detta leder till begreppet produkt av lotterier Definition 4 Antag att A = A 1 A 2 A n är en produkt av ändliga mängder, och låt p i vara ett lotteri över A i för i = 1, 2,, n Med produktlotteriet p = p 1 p 2 p n menas det lotteri över A som fås genom att för a = (a 1, a 2,, a n ) A definiera p(a) = p 1 (a 1 )p 2 (a 2 ) p n (a n ) Om p = p 1 p 2 p n och i är ett index mellan 1 och n, så använder vi p i som beteckning för det lotteri över mängden A i = A 1 A i 1 A i+1 A n som fås genom att utelämna faktorn p i, dvs p i = p 1 p i 1 p i+1 p n Om q i är ett godtyckligt lotteri på A i skriver vi vidare p i q i för det lotteri över A som fås genom att i p byta ut p i mot q i Produktbildningen p 1 p 2 p n är uppenbarligen affin i alla sina faktorer, dvs p i (αp i + βq i ) = α p i p i + β p i q i förutsatt att α, β 0 och α + β = 1 Observera speciellt att för a = (a 1, a 2,, a n ) är δ a = δ a1 δ a2 δ an Lotteriet i vänsterledet är det lotteri över A som ger utfallet a helt säkert, medan lotteriet i högerledet är det lotteri som består i att för varje i utföra lotteriet δ ai, något som säkert resulterar i a i och som därför sammantaget helt säkert ger a Detta gör att vi kan och kommer att använda den enklare beteckningen a för lotteriet δ a1 δ a2 δ an Om u är en funktion som är definierad på produktmängden A och p är produktlotteriet p = p 1 p 2 p n, så ges väntevärdet ũ(p) av att ũ(p) = u(a)p(a) = u(a 1, a 2,, a n )p 1 (a 1 )p 2 (a 2 ) p n (a n ) a A a 1 A 1 a n A n
22 Kardinala nyttofunktioner 17 Vi kommer att skriva ũ(p 1, p 2,, p n ) för summan ovan om vi behöver framhäva de ingående lotterierna p 1, p 2,, p n Funktionen (p 1, p 2,, p n ) ũ(p 1, p 2,, p n ) är förstås definierad på produktmängden L(A 1 ) L(A n ), som kan uppfattas som en konvex, kompakt delmängd av något R m Funktionen är affin i varje variabel för sig och kontinuerlig 22 Kardinala nyttofunktioner Med hjälp av preferensrelationer och ordinala nyttofunktioner kan man per definition rangordna alternativ Antag t ex att en person får välja ett av tre föremål a, b och c, och att hans preferensordning är a b c Då väljer han förstås a Men vad är bäst för honom om valet istället står mellan föremålet b och att deltaga i ett lotteri som med 50% chans ger honom a och med lika stor chans c? Ett rationellt val verkar förutsätta att vår person har en uppfattning om hur bra a är i förhållande till b jämfört med hur bra b är i förhållande till c, och detta ger preferensrelationen som sådan ingen information om Det hjälper heller inte att övergå till en på måfå vald med preferensordningen kompatibel nyttofunktion u, dvs en funktion med u(a) > u(b) > u(c) Nyttan av föremålet b är i så fall u(b) och ett möjligt sätt att värdera lotterialternativet, som vi kan kalla p, är att använda sig av väntevärdet av u med avseende på lotteriet p, dvs ũ(p) = 1 2 u(a)+ 1 2u(c) Om då ũ(p) > u(b) väljer vi lotteriet, om ũ(p) < u(b) väljer vi föremålet b, och om ũ(p) = u(b) är vi likgiltiga inför valet mellan de båda alternativen Problemet med denna approach är att utfallet inte är entydigt bestämt av preferensrelationen utan beror på vilken nyttofunktion som valts för att representera densamma Med u(a) = 5, u(b) = 2 och u(c) = 1 blir ũ(p) = 1 2 (5 + 1) = 3 > u(b) med slutsatsen att vi ska välja lotteriet Men med u(a) = 5, u(b) = 4 och u(c) = 1 blir istället ũ(p) = 3 < u(b), och nu är plötsligt föremålet b bästa valet Om vi vill värdera lotterier, dvs utfall som beror av slumpen, med hjälp av en nyttofunktions väntevärde räcker det således inte att utnyttja funktionens ordinala (dvs ordnande) egenskaper, utan vi måste också använda dess numeriska värden I fortsättningen säger vi därför att vi valt en kardinal nyttofunktion när vi fixerat en nyttofunktion och förutom dess ordinala egenskaper också utnyttjar funktionsvärdena för att bilda olika väntevärden En naturlig fråga i sammanhanget är vilket samband som måste gälla för att två kardinala nyttofunktioner på en mängd A ska ge upphov till samma värdering av lotterierna på A, dvs för att de båda nyttofunktionernas väntevärden ska inducera samma preferensordning på lotterimängden L(A) Svaret ges av nästa sats Sats 2 Låt u och v vara två funktioner på en (ändlig) mängd A De båda
18 2 Lotterier väntevärdesfunktionerna ũ och ṽ inducerar samma preferensrelation på lotterimängden L(A) om och endast om det finns reella konstanter C > 0 och D så att (1) v(x) = Cu(x) + D för alla x A Anmärkning En funktion f : R R på formen f(x) = Cx + D, där C och D är konstanter, kallas en affin transformation Om C > 0 är funktionen dessutom ordningsbevarande, dvs x > y f(x) > f(y) Sats 2 innebär med andra ord att ũ och ṽ inducerar samma preferensrelation på L(A) om och endast om v(x) = f(u(x)) för någon ordningsbevarande affin transformation f Bevis Antag först att v(x) = Cu(x) + D med C > 0, och låt u och v beteckna de av ũ resp ṽ inducerade preferensrelationerna på lotterimängden L(A) Enligt sats 1 är då ṽ(p) = Cũ(p) + D för alla lotterier p För godtyckliga lotterier p och q gäller därför ekvivalenserna p v q ṽ(p) ṽ(q) Cũ(p) + D Cũ(q) + D ũ(p) ũ(q) p u q, vilket visar att v och u är samma preferensordning Antag omvänt att ũ och ṽ inducerar samma preferensordning på lotterimängden Då gäller speciellt ekvivalenserna ũ(p) = ũ(q) p q ṽ(p) = ṽ(q) som beskriver indifferens Låt nu a och b vara två element i A med egenskapen att u(a) u(x) u(b) för alla x A, dvs a är en maximipunkt och b är en minimipunkt till u Vi skiljer på två fall Fall 1, u(a) = u(b) Detta betyder att u(x) = u(a) för alla x A, dvs funktionen u är konstant Men då är ũ(δ x ) = u(x) = u(a) = ũ(δ a ), dvs δ x δ a för alla x A (Det råder med andra ord indifferens mellan alla lotterier med säker utgång) Följaktligen är också v(x) = ṽ(δ x ) = ṽ(δ a ) = v(a)
22 Kardinala nyttofunktioner 19 för alla x, så funktionen v är också konstant Sambandet mellan u och v har därför formen v(x) = u(x) + v(a) u(a), vilket visar att (1) gäller med C = 1 och D = v(a) u(a) Fall 2, u(a) > u(b) Vi fixerar ett x A och ska jämföra det säkra lotteriet δ x med lotterierna p = αδ a + (1 α)δ b för olika värden på α [0, 1] För exakt ett α-värde är δ x p; villkoret är att dvs att med lösningen ũ(δ x ) = ũ(p) = αũ(δ a ) + (1 α)ũ(δ b ) u(x) = αu(a) + (1 α)u(b) α = u(x) u(b) u(a) u(b) Observera att lösningen α verkligen uppfyller 0 α 1 och att 1 α = u(a) u(x) u(a) u(b) Eftersom ṽ enligt antagande inducerar samma preferensrelation som ũ, kan indifferensvillkoret δ x p också uttryckas med hjälp av funktionen ṽ, vilket ger v(x) = ṽ(δ x ) = ṽ(p) = αv(a) + (1 α)v(b) u(x) u(b) = u(a) u(b) v(a) v(b) = u(a) u(b) Detta visar att sambandet (1) gäller med C = v(a) v(b) u(a) u(b) Därmed är beviset klart v(a) + u(a) u(x) u(a) u(b) v(b) u(a)v(b) u(b)v(a) u(x) + u(a) u(b) u(a)v(b) u(b)v(a) > 0 och D = u(a) u(b) För att kunna uttrycka sats 2 enklare gör vi följande definition Definition 5 Två kardinala nyttofunktioner u och v på en mängd kallas ekvivalenta om sambandet mellan dem ges av en ordningsbevarande affin transformation, dvs har formen (1) Här följer nu en sammanfattning av hittills erhållna resultat om kardinala nyttofunktioner
20 2 Lotterier 1 Ekvivalenta kardinala nyttofunktioner inducerar samma preferensrelation på mängden (Ett specialfall av sats 2 i avsnitt 11) 2 Förväntade nyttofunktioner ũ och ṽ, som är associerade till ekvivalenta kardinala nyttofunktioner u och v på en mängd, är själva ekvivalenta och inducerar samma preferensrelation på lotterimängden (Sats 1 och punkt 1 ovan) 3 Två kardinala nyttofunktioner på en mängd inducerar via sina associerade förväntade nyttofunktioner samma preferensrelation på lotterimängden om och endast om de är ekvivalenta (Sats 2) Övning 21 Anna har just anställts som VD för ett börsföretag med följande lönevillkor: fast årslön på 2 milj kr samt en en variabel bonus Bonusens storlek beror av företagets vinst, som är indelad i fyra kategorier: dålig, halvbra, bra eller mycket bra Sannolikheten för att vinsten ett givet år ska vara dålig, halvbra, bra resp mycket bra bedöms vara 01, 04, 03 resp 02, och bonusens storlek är i resp fall 0, 05, 1 resp 2 milj kr a) Bestäm Annas förväntade årliga ersättning b) Bestäm Annas förväntade nytta givet att hennes kardinala nyttofunktion är u(x) = ln x c) Antag att Anna som alternativ erbjuds en fast årslön på 2 850 000 kr utan någon bonus Bör hon anta detta erbjudande? d) Vilken är den lägsta årslön utan bonus som Anna är villig att acceptera? 23 von Neumann Morgenstern-preferenser För att kunna fatta rationella beslut om händelser som beror av slumpen behöver man kunna värdera lotterier, vilket innebär att man behöver en preferensrelation på lotterimängden I det förra avsnittet visade vi att kardinala nyttofunktioner på en mängd ger upphov till sådana preferensrelationer på lotterimängden via väntevärdesbildning En naturlig fråga i sammanhanget blir då om det finns några andra vettiga preferensrelationer på lotterimängden än de som uppkommer på detta sätt John von Neumann 1 och 1 John von Neumann, 1903 1957, ungerskfödd matematiker, som 1932 flyttade till Institute for Advanced Study, Princeton, USA von Neumann har lämnat många viktiga bidrag, inte bara inom ren och tillämpad matematik utan också inom fysik och filosofi Han var under andra världskriget aktiv i Manhattanprojektet som utvecklade atombomben Hans senare arbeten om parallella processer och nätverk har förtjänat honom benämningen datorns fader
23 von Neumann Morgenstern-preferenser 21 Oskar Morgenstern 2 visade i det epokbildande verket Theory of Games and Economic Behavior att om man med vettig preferensrelation menar en preferensrelation som uppfyller några naturliga tilläggskrav utöver fullständighets- och transitivitetsaxiomen, så är svaret nej Besluts- och spelteori kan därför baseras på begreppet förväntad nytta I det här avsnittet ska vi presentera en variant av von Neumann Morgensterns resultat Definition 6 Låt A vara en ändlig mängd En preferensrelation på lotterimängden L(A) kallas en von Neumann Morgenstern-preferensrelation, förkortat vnm-preferensrelation, om den satisfierar följande två axiom: Axiom 3 (Kontinuitetsaxiomet) För alla lotterier p, q, r L(A) och alla konvergenta följder (α n ) 1 av reella tal i intervallet [0, 1] med lim α n = α gäller de båda implikationerna α n p + (1 α n )q r för alla n αp + (1 α)q r α n p + (1 α n )q r för alla n αp + (1 α)q r Axiom 4 (Oberoende av irrelevanta alternativ) För alla p, q L(A) med p q och alla r L(A) gäller 1 2 p + 1 2 r 1 2 q + 1 2 r Oberoendeaxiomet innebär speciellt att en person som är indifferent inför två handlingsalternativ a och a, också för varje annat handlingsalternativ b är indifferent mellan valen V och V, där V representerar en 50 50 chans att få a eller b och V representerar en 50 50 chans att få a eller b Oberoendeaxiomet är formulerat för att vara så svagt som möjligt, och det är inget speciellt med valet av vikterna 1 2, 1 2 Ur axiomen 3 och 4 följer nämligen att antagandet p q i själva verket medför att αp + (1 α)r αq + (1 α)r för alla tal α [0, 1] och alla lotterier r Vidare följer t ex att p q medför αp + (1 α)r αq + (1 α)r Se appendix 3, där allt detta bevisas Axiomet om oberoende av irrelevanta alternativ kan förefalla oskyldigt, men i reella beslutssituationer handlar många beslutsfattare på ett sätt som inte är förenligt med axiomet Betrakta följande valsituation mellan två lotterier: Lotteri p 1 utlovar en säker vinst på 100 000 kr Lotteri p 2 utlovar 80% chans att vinna 125 000 kr (och 20% chans att inte vinna någonting) Flertalet försökspersoner föredrar p 1 framför p 2 Betrakta nu valet mellan följande lotterier: 2 Oskar Morgenstern, 1902 1976, österrikisk ekonom och professor vid Wiens universitet som avskedades efter nazisternas maktövertagande och 1938 flyttade till Princeton där han träffade von Neumann och tillsammans med honom 1944 skrev det berömda spelteoriverket som blev en startpunkt för såväl spelteori som beslutsteori under osäkerhet
22 2 Lotterier Lotteri q 1 utlovar 5% chans att vinna 100 000 kr Lotteri q 2 utlovar 4% chans att vinna 125 000 kr I denna situation föredrar flertalet lotteriet q 2 framför q 1 Men lotterierna q i kan bildas ur lotterierna p i genom att blanda dem med ett irrelevant alternativ r i samma proportioner Om r är ett lotteri som med 100% sannolikhet inte ger någonting alls, är nämligen q i = 005p i + 095r Denna psykologiska paradox brukar kallas Allais paradox Följande sats visar dock att det kan vara naturligt att kräva att egenskaperna i axiom 3 och 4 ska vara uppfyllda Sats 3 Preferensrelationer som induceras av förväntade nyttofunktioner är vnm-preferensrelationer Bevis Satsen följer, som vi ska se, enkelt av att förväntade nyttofunktioner är affina Låt vara en preferensrelation på en lotterimängd, och antag att preferensrelationen induceras av den förväntade nyttofunktionen ũ För att visa den första implikationen i kontinuitetsaxiomet antar vi att α n p + (1 α n )q r för en tillåten följd (α n ) 1 som konvergerar mot α Då är per definition ũ(α n p + (1 α n )q) = α n ũ(p) + (1 α n )ũ(q) ũ(r), vilket efter gränsövergång ger ũ(αp + (1 α)q) = αũ(p) + (1 α)ũ(q) ũ(r), dvs αp + (1 α)q r Helt analogt bevisas den andra implikationen i kontinuitetsaxiomet Indifferensvillkoret p q i oberoendeaxiomet innebär att ũ(p) = ũ(q), och därav följer ũ( 1 2 p + 1 2 r) = 1 2ũ(p) + 1 2ũ(r) = 1 2ũ(q) + 1 2ũ(r) = ũ( 1 2 q + 1 2 r), dvs 1 2 p + 1 2 r 1 2 q + 1 2 r De båda axiomen 3 och 4 är därför uppfyllda, vilket innebär att är en vnm-preferensrelation Att en person ska kunna ange sina preferenser för ett antal alternativ på en kardinalskala är ett starkt antagande ett antagande som vi likväl behöver göra för att kunna använda oss av begreppet förväntad nytta inom spelteorin En person kanske en given biokväll föredrar film X framför film Y och film Y framför film Z, men kan han på ett meningsfullt sätt säga att hans nöje av att se X istället för Y är exempelvis tre gånger så stort som hans nöje av att se Y istället för Z? Förmodligen inte Ett sätt att försöka utröna biobesökarens preferenser på en kardinalskala är att låta honom välja mellan en biobiljett till film Y och en lottsedel, som
23 von Neumann Morgenstern-preferenser 23 med sannolikhet α ger honom en biljett till film X och med sannolikhet 1 α ger honom en biljett till film Z För α = 1 föredrar han givetvis lottsedeln, eftersom han då säkert får se film X som han föredrar framför film Y Låt oss nu sänka sannolikheten α; för α = 075 kanske han fortfarande föredrar lottsedeln framför biobiljetten till Y, eftersom lottsedeln fortfarande gör att han med stor sannolikhet får se sin älsklingsfilm För α = 0 kommer han dock säkert att föredra biobiljetten till Y eftersom lottsedeln i detta fall innebär att han helt säkert tvingas se film Z Någonstans i intervallet mellan 0 och 1 bör det därför finnas en sannolikhet som gör honom indifferent mellan biobiljetten till Y och lottsedeln; låt oss anta att denna sannolikhet är α = 025 Eftersom kardinala nyttofunktioner är ekvivalenta under ordningsbevarande affina transformationer, kan vi fixera vår biobesökares nyttofunktionsvärden för de två alternativen X och Z så att u(x) = 1 och u(z) = 0 Den förväntade nyttan av lottsedeln med α = 025 blir då 025u(X) + 075u(Z) = 025, och eftersom han är indifferent mellan lottsedeln och en biobiljett till filmen Y är hans nytta av denna film nu fastställd till u(y ) = 025 Exemplet med biobiljetterna antyder att det alltid borde vara möjligt att konstruera en kardinal nyttofunktion åt en beslutsfattare som på ett konsistent sätt kan ange sina preferenser för alla tänkbara lottsedlar, när antalet handlingsalternativ är ändligt Att så verkligen är fallet för vnm-preferenser är kontentan av följande sats, som utgör omvändningen till sats 3 Med något annorlunda förutsättningar visades satsen som redan nämnts först av von Neumann och Morgenstern Sats 4 Låt vara en vnm-preferensrelation på lotterimängden L(A) till en ändlig mängd A (a) Då induceras av någon affin nyttofunktion U på L(A), och funktionen U är entydigt bestämd så när som på ordningsbevarande affina transformationer (b) Det finns vidare en kardinal nyttofunktion u på A så att U = ũ, vilket innebär att U(p) = u(a)p(a) a A för alla lotterier p Bevis Beviset för del (a) är elementärt men långt, så vi hänskjuter det till appendix 3 Givet funktionen U är det emellertid lätt att konstruera en motsvarande nyttofunktion u på A; det är bara att definiera u(a) = U(δ a )
24 2 Lotterier för alla a A Varje lotteri p är en affin kombination p = a A p(a)δ a av elementära lotterier δ a, och eftersom funktionen U är affin blir U(p) = a A p(a)u(δ a ) = a A p(a)u(a) = ũ(p) Vi sammanfattar satserna 3 och 4 i följande sats Sats 5 En preferensrelation på en lotterimängd L(A) är en vnm-preferensrelation om och endast om den induceras av den förväntade nyttofunktionen till någon kardinal nyttofunktion på alternativmängden A De mot vnm-preferensrelationer på L(A) svarande kardinala nyttofunktionerna på A kallas ofta Bernoulli-nyttofunktioner efter Daniel Bernoulli, 3 som förefaller vara den förste att använda sig av sådana funktioner Övningar 22 Visa att följande egenskap, som brukar kallas den arkimediska egenskapen, följer av kontinuitetsaxiomet för preferensrelationer: För alla lotterier p, q, r L(A) med egenskapen att p q r finns det tal α, β i intervallet ]0, 1[ så att αp + (1 α)r q och q βp + (1 β)r 23 Ge exempel på en preferensrelation på L(A) som inte är av vnm-typ [Ledning: Det räcker med två element i A] 3 Daniel Bernoulli, 1700 1782, schweizisk matematiker verksam som professor i Sankt Petersburg och Basel Bernoulli införde nyttofunktioner med avtagande marginalnytta i sitt arbete Specimen Theoriae Novae de Mensara Sortis, 1738, där han presenterar en lösning till den berömda St Petersburgparadoxen
Del II Spel på strategisk form 25
Kapitel 3 Strategiska spel I spelteorin studeras situationer där det råder intressekonflikter mellan de inblandade personerna som kallas spelare Beroende på om man intresserar sig för vad enskilda spelare kan åstadkomma på egen hand utan att samarbeta med andra eller om man intresserar sig för vad grupper av spelare kan åstadkomma genom samarbete, klassificerar man spelen som ickekooperativa spel respektive kooperativa spel I ett icke-kooperativt spel är således fokus inställt på hur varje enskild spelare värderar utgången av spelet Utgången beror i allmänhet av samtliga spelares agerande, och varje spelare antas ha en mängd av handlingsalternativ att välja bland Eftersom ett utfall som är bra för en spelare kan vara dåligt för en annan, är spelarnas preferenser för de olika utfallen individuella Utgången av ett konkret spel förutsätts vara bestämd av spelarnas kombinerade val av handlingsalternativ Vi kan därför förutsätta att varje spelares preferenser för utfall är givna i form av en preferensrelation som är definierad på den produktmängd som består av alla spelarnas kombinerade val Vi förutsätter vidare genomgående att samtliga spelare har fullständig kännedom om varandras handlingsalternativ och preferensrelationer Detta är naturligtvis ett mycket starkt antagande, som inte är uppfyllt i många realistiska situationer och som därför reducerar värdet av spelteori som instrument för praktisk konfliktlösning Det finns i allmänhet inte något alternativ för en spelare som är bäst i alla situationer; spelteorin ger därför oftast inte något svar på frågan hur ett konkret spel ska spelas då det spelas en enstaka gång Teorin handlar istället i stor utsträckning om att bestämma lösningar som är stabila i en eller annan mening, lösningar som alla spelarna i någon mening tjänar på att välja I icke-kooperativa spel på strategisk form eller kortare strategiska spel, som är den form av spel som vi ska behandla först, väljer spelarna sina handlingsalternativ samtidigt och oberoende av varandra, och ingen spelare informeras i förväg om de andra spelarnas val 27
28 3 Strategiska spel 31 Definition Den formella definitionen av ett strategiskt spel lyder som följer Definition 1 Ett strategiskt spel N, (A i ), ( i ) består av en ändlig mängd N av spelare antalet spelare förutsätts vara minst två, och vi kommer att numrera dem 1,2,, n, vilket innebär att vi kommer att uppfatta N som mängden {1, 2, 3,, n}; för varje spelare i N en mängd A i av handlingar; för varje spelare i en preferensrelation i på produktmängden A = A 1 A 2 A n Spelet kallas ändligt om A är en ändlig mängd (dvs om alla A i ändliga) är Vi kommer ofta att definiera preferensrelationerna i via nyttofunktioner u i, som i spelteorisammanhang också ofta kallas utbetalningsfunktioner, och använder då beteckningen N, (A i ), (u i ) för spelet N, (A i ), ( i ) Produktmängden A = A 1 A 2 A n består per definition av alla n-tipler a = (a 1, a 2,, a n ) av de olika spelarnas handlingar a i A i Vi kommer att kalla sådana n-tipler av handlingar för handlingsvektorer Produktmängden A är således lika med mängden av alla handlingsvektorer Om mängderna A i innehåller ν i stycken element, så finns det totalt ν 1 ν 2 ν n handlingsvektorer Den tredje egenskapen i definitionen av ett strategiskt spel betyder att en spelarnas preferensrelation (eller nyttofunktion) ska vara definierad på mängden av alla handlingsvektorer Eftersom en spelare bara kan kontrollera sina egna handlingsalternativ, är det därför i allmänhet omöjligt för en spelare att uppnå det för honom bästa alternativet Vad som bör menas med en optimal lösning i ett strategiskt spel är därför annorlunda än i ett rent beslutsproblem, där beslutsfattaren har full kontroll över situationen En av huvuduppgifterna i spelteorin är att ge olika förslag på lösningar som i någon mening kan anses vara optimala eller stabila Vi kommer huvudsakligen att studera ändliga strategiska spel och för det mesta att exemplifiera med tvåpersonersspel För att definiera ett ändligt spel {1, 2}, (A i ), (u i ) med två spelare behöver man ange de båda handlingsmängderna A 1 = {r 1, r 2,, r m } och A 2 = {k 1, k 2,, k n } och nyttofunktionernas värden α ij = u 1 (r i, k j ) och β ij = u 2 (r i, k j ) för alla handlingsvektorer (r i, k j ), och det gör man enklast i tabellform på följande sätt:
31 Definition 29 k 1 k 2 k n r 1 (α 11, β 11 ) (α 12, β 12 ) (α 1n, β 1n ) r 2 (α 21, β 21 ) (α 22, β 22 ) (α 2n, β 2n ) r m (α m1, β m1 ) (α m2, β m2 ) (α mn, β mn ) Spelare 1 är alltså alltid den spelare som väljer rad och vi kommer därför ibland att kalla honom för radspelaren, och då blir förstås spelare 2 kolonnspelaren Naturligtvis är namnen på elementen i mängderna A 1 och A 2 oväsentliga, så spelet är helt bestämt av de två m n - matriserna [α ij ] och [β ij ], som innehåller all information om de båda spelarnas nyttofunktioner Exempel Vi illustrerar begreppet strategiskt spel med några klassiska exempel Exempel 1 (Fångarnas dilemma) Två personer är häktade, misstänkta för ett grovt brott och isolerade från varandra Det finns tillräckliga bevis för att fälla båda för ett mindre brott, men inte tillräckliga bevis för att fälla någon för det grova brottet, såvida inte någon av dem tjallar på den andra Om båda håller tyst, kommer båda att dömas till 1 års fängelse för det mindre brottet Om en och endast en av de häktade tjallar, kommer han att användas som kronvittne och frikännas, medan den andre döms till fem års fängelse Om båda tjallar kommer båda att dömas till tre års fängelse Vi kan modellera situationen som ett strategiskt spel på följande vis Spelarna är de två häktade, och båda spelarna har samma handlingsmängd, nämligen {Tig, Tjalla} Detta innebär att det finns fyra handlingsvektorer som spelare 1 rangordnar på följande vis (Tjalla, Tig) 1 (Tig, Tig) 1 (Tjalla, Tjalla) 1 (Tig, Tjalla) eftersom han föredrar en så kort fängelsevistelse som möjligt För spelare 2 gäller analogt (Tig, Tjalla) 2 (Tig, Tig) 2 (Tjalla, Tjalla) 2 (Tjalla, Tig) En nyttofunktion u 1 som är kompatibel med spelare 1:s preferenser ska alltså uppfylla u 1 (Tjalla, Tig) > u 1 (Tig, Tig) > u 1 (Tjalla, Tjalla) > u 1 (Tig, Tjalla), och vi får en funktion som uppfyller detta genom att exempelvis sätta u 1 (Tjalla, Tig) = 0, u 1 (Tig, Tig) = 1, u 1 (Tjalla, Tjalla) = 3, u 1 (Tig, Tjalla) = 5
30 3 Strategiska spel För spelare 2 definierar vi analogt u 2 (Tig, Tjalla) = 0, u 2 (Tig, Tig) = 1, u 2 (Tjalla, Tjalla) = 3, u 2 (Tjalla, Tig) = 5 Spelet kan nu på ett kompakt sätt representeras av följande tabell: Tig Tjalla Tig ( 1, 1) ( 5, 0) Tjalla (0, 5) ( 3, 3) Hur ska radspelaren agera? Bäst för honom är förstås att han tjallar och kolonnspelaren tiger, ty då slipper han straff Men om kolonnspelaren också tjallar så får han å andra sidan tre års fängelse Kanske är det bäst för radspelaren att tiga vilket också är kollektivt bäst för båda eftersom tigande bara ger dem ett års fängelse var Men kan radspelaren verkligen lita på att kolonnspelaren kommer att tiga? Genom att tiga riskerar ju kolonnspelaren fem års fängelse Båda spelarna står förstås inför samma dilemma Exempel 2 (Boxning eller fotboll) En kväll visar en TV-kanal boxning och en annan kanal fotboll Kvinnan i familjen (spelare 1) föredrar boxning och mannen (spelare 2) vill helst titta på fotbollsmatchen Båda föredrar dock att titta tillsammans framför att sitta ensamma framför var sin TV, och om de måste göra det är de indifferenta mellan att titta på boxning eller fotboll Konflikten kan modelleras som ett spel, där båda spelarna har {Boxning, Fotboll} som sina handlingsmängder och där nyttofunktionerna framgår av följande tabell: Boxning Fotboll Boxning (2, 1) (0, 0) Fotboll (0, 0) (1, 2) Om spelarna hade fått samråda innan de gör sina val, så skulle de förstås välja en gemensam sport, förslagsvis genom lottdragning om de inte kan enas om valet av sport, men när de inte får samråda och måste göra sina val oberoende av varandra, har de förstås ett problem I litteraturen går spelet ofta under namnet Kampen mellan könen Exempel 3 (Krona eller klave) Två personer väljer samtidigt och oberoende av varandra sida av ett mynt, dvs krona eller klave Om båda väljer samma sida får spelare 1 en krona av spelare 2, och om de valda sidorna är olika får istället spelare 2 en krona av spelare 1 Preferenserna kan beskrivas av följande nyttofunktioner: