Föreläsning 6: Spelteori II

Relevanta dokument
14.1 Två-personers nollsummespel och konstantsummespel: sadelpunkt

Matematik och grafik i mikroekonomiska modeller

Spelteori: Att studera strategisk interaktion. Grundkurs i nationalekonomi för jurister HT 2014 Jesper Roine, SITE, Handelshögskolan i Stockholm

Föreläsning 5: Spelteori I

Rättningsmall för Mikroteori med tillämpningar, tentamensdatum

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

Förra gången. Allmänt om samarbete. Dagens föreläsning

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

Föreläsning 4: Beslut och nytta, paradoxer

c) Vid vilka tillverkade kvantiteter gör företaget åtminstone någon vinst?

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

1.1 Polynomfunktion s.7-15

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

SKRIVNING I A/GRUNDLÄGGANDE MIKRO- OCH MAKROTEORI 3 DECEMBER 2016

Artificial Intelligence

), beskrivs där med följande funktionsform,

1 Duala problem vid linjär optimering

5 Linjär algebra. 5.1 Addition av matriser 5 LINJÄR ALGEBRA

(Föreläsning:) 1. Marknader i perfekt konkurrens

1 Positivt definita och positivt semidefinita matriser

EU i klassrummet. Övningar och diskussionsuppgifter. EU i klassrummet 1

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem

Resträkning och ekvationer

Några saker som jag inte hann: Ur trigonometriska ettan kan vi uttrycka och i termer av. Vi delar båda led i trig. 1:an med :

Övningar och diskussionsuppgifter om EU. ett material från Ekonomifakta

Laboration 2: Spelteori

Fråga 3: Följande tabell nedan visar kvantiteterna av efterfrågan och utbud på en viss vara vid olika prisnivåer:

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

Resurscentrums matematikleksaker

Kryssuppgifter 5, Inledande diskret matematik D/DI, HT2016 Lösningar

Repetitionsuppgifter inför Matematik 1. Matematiska institutionen Linköpings universitet 2013

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Finansiell statistik FÖRELÄSNING 11

Lösningsförslag till övningsuppgifter, del V

Laboration 2: Spelteori

Föreläsning 9. Absolutstabilitet

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

FÖRNYELSEBARA RESURSER ETT RÄKNEEXEMPEL. Utgå från en logistisk tillväxtfunktion: = f ( x) = rx 1, där x är populationen, r är den

Vektorgeometri för gymnasister

Vektorgeometri för gymnasister

1. Ekvationer 1.1. Ekvationer och lösningar. En linjär ekvation i n variabler x 1,..., x n är en ekvation på formen. 2x y + z = 3 x + 2y = 0

Härledning av Black-Littermans formel mha allmänna linjära modellen

Matematiska uppgifter

Välkommen till Kängurutävlingen Matematikens hopp 17 mars Student för elever på kurs Ma 4 och Ma 5

= = i K = 0, K =

Avslutande föreläsning LGMA65

Övning 1 Sannolikhetsteorins grunder

Kängurutävlingen Matematikens hopp 2009 Benjamin för elever i åk 5, 6 och 7

SF1901: Sannolikhetslära och statistik

Tentamen i nationalekonomi, tillämpad mikroekonomi A, 3 hp (samt 7,5 hp)

Exempelprov. Matematik Del A, muntlig del. 1abc

SF1901: Sannolikhetslära och statistik

Del 18 Autocalls fördjupning

Postprint.

Vektorgeometri för gymnasister

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Rättningsmall till tentan Mikroteori med tillämpningar 17 maj 09. Ofullständiga eller endast delvis korrekta svar ger del av poängen.

Introduktion till statistik för statsvetare

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

4. Bestäm alla trippler n 2, n, n + 2 av heltal som samtliga är primtal. 5. Skriv upp additions- och multiplikationstabellen för räkning modulo 4.

TNK047 OPTIMERING OCH SYSTEMANALYS

Lösningsförslag Fråga 1.

UPPGIFT 1 TVÅPOTENSER. UPPGIFT 2 HISSEN I LUSTIGA HUSET.

Resurscentrums matematikleksaker

2. Härled TR och MR från efterfrågekurvan nedan. 3. Hur förhåller sig lutningen på MR till lutningen på D? Svar: MR har dubbla lutningen mot D.

Övningar - Andragradsekvationer

Lutande torn och kluriga konster!

Föreläsning 3: Osäkerhet och sannolikhet

Inlämningsuppgift-VT lösningar

d dx xy ( ) = y 2 x, som uppfyller villkoret y(1) = 1. x, 0 x<1, y(0) = 0. Bestäm även y( 2)., y(0) = 0 har entydig lösning.

Innehåll. Referenser och vidare läsning Register Illustrationer kapitel 1 Spelets regler kapitel 2 Slump...

Mängder. 1 Mängder. Grunder i matematik och logik (2015) 1.1 Grundläggande begrepp. 1.2 Beskrivningar av mängder. Marco Kuhlmann

Tentamen i Samhällsekonomi (NAA132)

Lösningar och lösningsskisser

TATA42: Föreläsning 5 Serier ( generaliserade summor )

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Repetitionsuppgifter inför Matematik 1-973G10. Matematiska institutionen Linköpings universitet 2014

FK2005 Datorövning 3

Finaltävling i Umeå den 18 november 2017

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

Grafer och grannmatriser

Statistiska samband: regression och korrelation

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 15 mars 2010 kl

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Kort sammanfattning av de funktioner som används för att Skapa en smart Dashboard!

Inledande kurs i matematik, avsnitt P.2. Linjens ekvation kan vi skriva som. Varje icke-lodrät linje i planet kan skrivas i formen.

En effektiv miljöpolitik

Lösningsförslag till övningsuppgifter, del II

TAMS79: Föreläsning 1 Grundläggande begrepp

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

1 LP-problem på standardform och Simplexmetoden

Svar och arbeta vidare med Benjamin 2008

= ( 1) ( 1) = 4 0.

Transkript:

Föreläsning 6: Spelteori II Litteratur: Resnik, Choices, kap. 5 1# Viktiga begrepp Först lite allmänt om spelteori: Spelteorin har främst utvecklats inom matematiken och nationalekonomin, och är fortfarande en viktig del av t.ex. mikroteori och industriell organisation (där den används för att teoretiskt härleda jämviktspriser och jämviktskvantiteter på marknader för olika varor och tjänster), men även psykologer, statsvetare och biologer har uppmärksammat området och använt spelteorin för att förklara företeelser inom t.ex. krig och evolution. De namn som främst förknippas med spelteorins ursprungliga formulering på 1950-talet är John von Neumann och Oskar Morgenstern (som även formulerade Expected Utility Theorem, från föreläsning 5) samt John Nash (populärt känd bl.a. från filmen A Beautiful Mind). På senare tid har även Robert Aumann och Thomas Schelling (Riksbankens ekonomipris 2005) varit uppmärksammade spelteoretiker. För filosofer ligger intresset för spelteori främst i områdets betydelse för rationalitetsbegreppet (Derek Parfit och Amartya Sen) och etik (Peter Singer) samt politisk filosofi (Den klassiska referensen är här Thomas Hobbes statslära, som ofta påstås ha föregått spelteorin med 300 år); i synnerhet fångarnas dilemma och kooperationsproblematik har fångat filosofers intresse, men det bör naturligtvis påpekas att spelteorin är betydligt bredare än så. Jämvikt. Ingen spelare kan få det bättre genom att ensidigt byta strategi. Vad menas? Om spelet är i jämvikt, så finns det ingen alternativ strategi sådan att någon spelare får det bättre genom att byta strategi samtidigt som de övriga spelarnas strategier hålls konstanta (i fallet med två spelare: samtidigt som den andre spelarens strategi hålls konstant). Spelet är i jämvikt om detta gäller för varje spelare (i fallet med två spelare: båda spelare). Exempel med två spelare: Antag att radspelaren kan välja mellan strategierna R = {R 1, R 2,, R n } och att kolumspelaren kan välja mellan strategierna C = {C 1, C 2,, C n }. Låt u R (R i, C j ) och u C (R i, C j ) beteckna den nytta som rad- respektive kolumnspelaren erhåller när radspelaren spelar R i och kolumnspelaren spelar C j. Spelet befinner sig i jämvikt i punkten (R i, C j ) om och endast om (a) det inte finns någon strategi C * i mängden C sådan att u C (R i, C j ) < u C (R i, C * ) och (b) det inte finns någon strategi R * i mängden R sådan att u R (R i, C j ) < u R (R *, C j ). Paretooptimalitet. Ett utfall X är paretooptimalt om och endast om det inte finns något annat möjligt utfall där följande gäller: varje spelare får det minst lika bra som hon skulle få i X och där någon får det bättre än vad hon skulle få i X. Observera att paretooptimalitet inte behöver betyda jämvikt; detta är den viktigaste egenskapen i fångarnas dilemma. 2# två personer, två strategier, nollsummespel I vissa fall saknas jämvikt i rena strategier. Men exemplet ovan kan göras om på ett sätt som fångar jämviktsbegreppet. Byt ut mängderna R och C mot variablerna p 1 respektive p 2, som var och en antar ett värde mellan noll och ett. Detta tolkas som sannolikheten för att radspelaren respektive kolumnspelaren ska spela den första (rena) strategin. Istället för faktisk nytta utgår vi nu från förväntad nytta; spelet är i jämvikt 1

när sannolikheterna (p 1, p 2 ) väljs om och endast om (a) det inte finns någon sannolikhet p * mellan noll och ett sådan att E[u C (p 1, p 2 )] < E[u C (p 1, p * )] och (b) det inte finns någon sannolikhet p * mellan noll och ett sådan att E[u R (p 1, p 2 )] < E[u R (p *, p 2 )]. Med andra ord innebär jämvikt att vardera spelaren väljer den sannolikhet som maximerar förväntad nytta, under antagandet att motspelarens sannolikhetsval hålls konstant. Ett konkret exempel är spelet sten, sax, påse ; spelet är i jämvikt om vardera spelaren spelar sten, sax eller påse med sannolikheten 1/3 dvs. i genomsnitt var tredje gång. (Spelet befinner sig inte i jämvikt t.ex. om båda spelarna hela tiden dvs. med sannolikheten 1 väljer att spela sten, ty i så fall kan endera spelaren få det bättre genom att spela påse vilket i sin tur leder till att motspelaren bör tänka om sin strategi Spelet befinner sig heller inte i jämvikt ifall båda spelaren spelar sax och påse med sannolikheten 1/2 vardera, och aldrig spelar sten, ty då kan endera spelaren få det bättre genom att spela sten med sannolikheten 1/2 och sax med sannolikheten 1/2.) Termen blandstrategier kan tolkas så att ibland väljer man den ena (rena) strategin och ibland den andra. Man beslutar sig för en sannolikhet, snarare än en ren strategi. 3# Egenskaper för jämvikt i blandstrategier Hur hittar man jämvikt i blandstrategier i fallet 2 personer, 2 strategier, 0-summespel? En viktig egenskap, som Resnik bygger på, är att jämvikt för blandstrategier inträffar då följande gäller för vardera spelaren: Oavsett vad motspelaren gör, blir din förväntade nytta densamma. Ett tvåpersoners-tvåstrategiers-nollsummespel har följande form (Bokstäverna ABCD betecknar radspelarens nytta och P 1 och P 2 är sannolikheten för att rad- respektive kolumnspelaren ska välja den första strategin): P 2 1 P 2 P 1 A B 1 P 1 C D Förväntad nytta för radspelaren = = A*P 1 *P 2 +B*P 1 *(1 P 2 )+C*(1 P 1 )*P 2 +D*(1 P 1 )*(1 P 2 ). Förväntad nytta för kolumnspelaren = (radspelarens nytta multiplicerat med 1) = = A*P 1 *P 2 B*P 1 *(1 P 2 ) C*(1 P 1 )*P 2 D*(1 P 1 )*(1 P 2 ). Betrakta nedanstående nollsummespel (Siffrorna anger nyttan för radspelaren; kolumnspelarens nytta är lika med radspelarens nytta multiplicerat med minus ett): P 2 1 P 2 P 1 2 1 1 P 1 2 3 RADSPELARENS BESLUT: Antag att P 1 = 5/8, vilket innebär att 1 P 1 = 3/5. Då blir radspelarens förväntade nytta lika med 2*(5/8)*P 2 1*(5/8)*(1 P 2 ) 2*(3/8)*P 2 +3*(3/8)*(1 P 2 ) = P 2 *(10/8 6/8 5/8 9/8) 5/8+9/8 = 4/8 = 1/2. Notera att detta är oberoende av P 2. KOLUMNSPELARENS BESLUT: Antag att P 2 = 1/2, vilket innebär att 1 P 2 = 1/2. Kolumnspelarens förväntade nytta blir lika med 2*P 1 *(1/2)+1*P 1 *(1/2)+2*(1 2

P 1 )*(1/2) 3*(1 P 1 )*(1/2) = P 1 *( 2/2+1/2 2/2+3/2)+2/2 3/2 = 1/2. Notera att detta är oberoende av P 1. 4# Egenskaper för jämvikt i blandstrategier Utifrån villkoret att förväntad nytta för vardera spelaren ska vara oberoende av motspelarens val av sannolikhet, härleder Resnik en ekvation för jämvikt i blandstrategier för tvåpersoners-tvåstrategiers-nollsummespel: P 1 = (D C)/((A+D) (B+C)) P 2 = (D B)/((A+D) (B+C)) där A, B, C och D samt P 1 och P 2 är enligt ovan. 5# Gauthiers samarbetsproblem Resnik diskuterar Gauthiers analys av samarbetsproblemet. Scenariot är individer som går omkring och möter andra individer som antingen samarbetar eller utnyttjar varandra. Ett antal parametrar antas påverka huruvida det är lönsamt att samarbeta: Ju större sannolikhet att möta någon som vill samarbeta Ju lägre sannolikhet att lyckas utnyttja någon Ju större sannolikhet att lyckas samarbeta med någon Ju lägre nyttan av att inte samarbeta Ju större nyttan av att samarbeta desto mer lönsamt är det att inbjuda till samarbete. 6# Gauthiers samarbetsproblem Resnik illustrerar samarbetsproblemet med ett beslutsträd på sidan 154. 7# Samarbete i koordinationsspel Betrakta nedanstående spel: (1, 2) (0, 0) (0, 0) (2, 1) De båda okoordinerade utfallen (dvs. utfallet där radspelaren spelar den första strategin medan kolumnspelaren spelar den andra strategin och utfallet där radspelaren spelar den andra strategin medan kolumnspelaren spelar den första strategin) är paretodominerade av vardera av de båda koordinerade utfallen (dvs. utfallet där båda spelarna spelar den första strategin och utfallet där båda spelarna spelar den andra strategin). Båda spelarna har därför intresse av att strategierna koordineras. Men hur koordineringen ska ske är något som de har motstridiga intressen om; radspelaren föredrar utfallet (2, 1) nere i högra hörnet framför utfallet (1, 2) uppe i vänstra hörnet, och kolumnspelaren föredrar motsatsen. 8# Samarbete i koordinationsspel Antag att spelarna kommer överens om att koordinera sina strategier. De förhandlar sig fram till en sannolikhet p sådan att de (samtidigt) spelar den första strategin med sannolikheten p och den andra strategin med sannolikheten 1 p. Radspelaren vill naturligtvis helst att p = 0, medan kolumnspelaren helst vill att p = 1. 9# Detta kan illustreras i ett diagram. Linjen ger förväntad nytta för vardera spelaren; om p = 0 så får radspelaren E[u R ] = 2 och kolumnspelaren får E[u C ] = 1 (dvs. det utfall 3

som är längst ner till vänster i spelmatrisen på bild 7) och om p = 1 så får radspelaren E[u R ] = 1 och kolumnspelaren får E[u C ] = 2 (dvs. det utfall som är längst upp till höger i spelmatrisen på bild 7). Om 0 < p < 1 så blir förväntad nytta mellan 1 och 2 för vardera spelaren; ju lägre värde på p desto bättre för radspelaren och vice versa. Vi kan därmed uttrycka den förväntade nyttan för vardera spelaren som en funktion av p: E[u R ] = 2 p och E[u C ] = 1+p. 10# Nashpunkt Låt f = (f 1,, f n ) vara den nytta som tillfaller spelarna ifall förhandlingarna misslyckas, en failure point. I ett förhandlingsspel med två spelare är Nashpunkten den paretooptimala punkt (u 1, u 2 ) som maximerar (u 1 f 1 )*(u 2 f 2 ). I vårt exempel: f = (f 1, f 2 ) = (0, 0). Nashpunkten är den paretooptimala punkt (u 1, u 2 ) som maximerar (E[u R ] f 1 )*(E[u C ] f 2 ) = E[u R ]*E[u C ], givet att E[u R ] = 2 p och E[u C ] = 1+p. Vi ska alltså maximera (2 p)*(1+p) = 2+p p 2, som har sitt största värde när p = 3/2. 11# I diagrammet motsvaras detta av att maximera ytan av en fyrhörning med vänstra sidan och nedersta sidan längs koordinataxlarna och översta högra hörnet på den paretooptimala linjen. Den största arean uppnås av en kvadrat. 12# Varför ska man välja Nashpunkten vid förhandlingar? Nashpunkten uppfyller fyra villkor: (1) Den är unik och paretooptimal. (2) Den påverkas ej av positiva linjära transformationer av nyttofunktionerna. (3) Vid symmetri gäller att u 1 = u 2. (4) Den påverkas ej av att övriga paretooptimala punkter i spelet tas bort. 13# Kontrovers kring villkor (4) Det fjärde villkoret är lite tveksamt; det tycks ju faktiskt som att man kan förändra förhandlingssituationen genom att ta bort paretooptimala punkter. 14# Samarbete i spel med n > 2 spelare Spel med fler än två spelare är mer komplicerade än de spel vi har behandlat hittills. Resnik nöjer sig med att ge ett specifikt exempel på sådan problematik. Tre personer Hank, Ike och Ned kan bilda koalitioner bestående av antingen en, två eller tre personer. Det finns sju möjliga sådana koalitioner: tre koalitioner som består av en ensam individ, tre koalitioner som består av två individer och en storkoalition som består av alla tre individer. Tre scenarier kan utmålas: (1) Var och en står ensam. I så fall får Hank 10.000, Ike 7.500 och Ned 5.000. (2) Två personer går ihop och en lämnas utanför. Tre möjligheter finns: A. Ned lämnas utanför; Ned får 5.000, medan Hank och Ike får 33.875 att fördela mellan sig B. Ike lämnas utanför; Ike får 7.500, medan Hank och Ned får 30.000 att fördela mellan sig. C. Hank lämnas utanför; Hank får 10.000, medan Ike och Ned får 25.000 att fördela mellan sig. 4

(3) En storkoalition bildas. I så fall får de tre tillsammans 40.125 att fördela mellan sig. 15# Kriterier för fördelning Superadditivitet innebär att alla kan tjäna på att gå med i koalitionerna. Individuell rationalitet innebär att ingen går med i någon koalition ifall han inte får det minst lika bra som han skulle ha fått på egen hand. 16# Tveksamt kriterium: paretooptimalitet Storkoalitionen ger störst total vinst: {H, I, N} 40.125 {H}, {I, N} 10.000+25.000 = 35.000 {I}, {H, N} 7.500+30.000 = 37.500 {N}, {H, I} 5.000+33.875 = 38.875 {H}, {I}, {N} 10.000+7.500+5.000 = 22.500 Därav följer att alla kan tjäna på storkoalitionen. Men storkoalitionen är instabil: Om Hank får mer än 15.125 så får Ike och Ned tillsammans mindre än 40.125 15.125 = 35.000; Ike och Ned skulle således tjäna på att hoppa av och bilda en fristående koalition. Om Ike får mer än 10.125 så får Hank och Ned tillsammans mindre än 40.125 10.125 = 37.500; Hank och Ned skulle således tjäna på att hoppa av och bilda en fristående koalition. Om Ned får mer än 6.250 så får Hank och Ike tillsammans mindre än 40.125 6.250 = 38.875; Hank och Ike skulle således tjäna på att hoppa av och bilda en fristående koalition. Något av de ovanstående måste inträffa, ty om Hank inte får mer än 15.125 och om Ike inte får mer än 10.125 och om Ned inte får mer än 6.250 så har man bara 15.125+10.125+6.250 = 31.500 att fördela men i storkoalitionen måste man fördela 40.125. 5