Förra gången. Allmänt om samarbete. Dagens föreläsning

Förra gången Evolutionary computation Genetic programming Genetic algorithms Aspects of evolution Classifier systems Allmänt om samarbete Exempel Slemsvampar Fåglar och fiskar som putsar Symbios Lavar: symbios mellan alg och bakterie Magbakterier i magen på människa Samhälle Varför fungerar det? Vad händer om någon fuskar? Spelteori är ett försök att ge svar Dagens föreläsning Allmänt om samarbete Spelteori Nollsummespel Icke-nollsummespel Prisoners Dilemma Dilemman Itererad Prisoners Dilemma 1

Spelteori Handlar om att hitta bästa möjliga strategi för ett visst spel Historia 1928: John von Neumann Optimal strategi för 2-pers nollsummespel 1944: von Neumann och Oskar Morganstern Theory of Games and Economic Behavior Morganstern en berömd matematisk ekonom 1950: John Nash Non-cooperative games, doktorsavhandling, 27 sidor Geni, Nobelpris 1994, schizofren Klassificering av spel Chansspel Utgången beror ej på spelarnas handlingar Ointressanta, sannolikhetsteori Strategispel Spelarnas handlingar spelar roll Exempel: Poker Klassificering av strategispel Antal spelare 1, 2, 3,..., n Nollsumme eller ej Nollsumme det en vinner förlorar den andre Icke-nollsumme positiv, negativ, konstant summa, icke konstant summa Essentiell eller ej Essentiell fördel bilda kolliationer Perfekt ellet imperfekt information Perfekt alla har fullständig info om alla tidigare handlingar Imperfekt några eller alla har partiell information 2

Strategier En fullständig sekvens av handlingar för en spelare Ren strategi Sekvensen är helt deterministisk Mixad strategi Handlingar kan ske med viss sannolikhet Nollsummespel Maximin Välj den strategi som maximerar minimala utkomsten (payoff) Exempel Två konkurrerande mineralvattentillverkare På tavlan Matching Pennies På tavlan von Neumann: Varje 2-personers nollsummespel har en maximinlösning om vi tillåter mixade strategier Icke-konstant summespel Det finns ingen allmän definition för rationalitet för icke-konstanta summespel (ej nollsummespel) Två vanliga kriterier Dominant-strategijämvikt Nash-jämvikt 3

Dominant strategijämvikt Studera varje av din opponents strategier och bestäm din bästa strategi för varje fall Om samma strategi är bäst i alla situationer, så är det en dominant strategi Jämvikt råder när båda spelarna har en dominant strategi som de använder Exempel På tavlan Nash-jämvikt En mängd strategier med egenskapen: Ingen spelare kan klara sig bättre med en annan strategi när den andre behåller strategin För mixade strategier tittar man på förväntad utkomst Exempel På tavlan Varje maximin lösning är en dominant strategijämvikt Varje dominant strategijämvikt är en Nashjämvikt The Prisoners Dilemma Melvin Dresher och Merrill Flood, RAND Corporation, 1950 Vidareutvecklat av Albert W. Tucker Används inom filosofi, etik, biologi, sociologi, politisk vetenskap, ekonomi, spelteori, datavetenskap, matematik,... The E. Coli of social psychology - Axelrod 4

The Prisoners Dilemma The story Två brottslingar har fångats, de har begått ett brott men polisen har inte tillräckliga bevis De kan inte kommunicera med varandra Om båda erkänner får de 10 år var Om en erkänner och anklagar den andra Den som erkänner går fri Den anklagade får 20 år Om ingen erkänner får de 1 år vardera The Prisoners Dilemma Utfallsmatris Cooperate Defect Cooperate Defect -1, -1-20, 0 0, -20-10, -10 rationella analys (dominant strategi) Om inte tjallar bäst att tjalla Om tjallar bäst att tjalla (Samma för ) Dominant strategijämvikt 10 år för båda Besluta irrationellt att samarbeta 1 år för båda The Prisoners Dilemma Summering Individuell rationallitet inte optimalt Ett exempel på ett spelteoretiskt dilemma 5

Spelteoretiskt dilemma En situation som kräver ett val mellan alternativ som är likvärdiga Damned if you do, damned if you don t I spelteori: Varje spelare agerar rationellt, men resultatet är inte önskvärt Spelteoretiskt dilemma Generell utfallsmatris Cooperate Defect Cooperate CC (R) Reward DC (T) Temptation to defect Defect CD (S) Sucker s payoff DD (P) Punishment Dilemmas Coop Def Coop Def CC CD DC DD Generella villkor för ett dilemma Du vinner alltid på om den andra samarbetar CC > CD och DC > DD Ibland vinner du på att hoppa av (defect) DC > CC eller DD > CD Ömsesidigt samarbete är att föredra CC > DD 24 permutationer men endast 3 är dilemman 6

Dilemmas Coop Def Coop Def CC CD DC DD Prisoners Dilemma DC > CC > DD > CD Bättre hoppa av oavsett vad den andra gör Nash-jämvikt är DD Chicken DC > CC > CD > DD Ömsesidig defect är värst Två Nash-jämvikter, DC och CD Stag Hunt CC > DC > DD > CD Bäst att samarbeta med samarbetare Nash-jämvikt är CC Itererad Prisoners Dilemma Antaganden Inga överrenskommelser eller hot En spelares nästa drag kan inte förutses Inget sätt att eliminera spelare eller undvika interaktion Inget sätt att ändra utfall (payoff) Kommunikation endast via direkt interaktion Itererad Prisoners Dilemma Axelrod s experiment (1980) Intuitivt antagande om att framtida interaktion kan påverka rationaliteten i beslut Round-robin turnering för strategier Alla tävlar mot alla, inkl sig själv 200 iterationer av PD Ska vara okänt! Varje program/strategi kan minnas tidigare händelser 14 program kom in CC = 3, CD = 0, DC = 5, DD = 1 (Krav: DC + CD < 2 * CC) Coop Def Coop 3, 3 0, 5 Def 5, 0 1, 1 7

Itererad Prisoners Dilemma Förväntade resultat för tre enkla strategier ALL-C RAND ALL-D Medel ALL-C 3.0 1.5 0.0 1.5 RAND 4.0 2.0 0.5 2.167 ALL-D 5.0 3.0 1.0 3.0 Itererad Prisoners Dilemma Resultat Vinnare: Rapaport s Tit-For-Tat (TFT) Samarbeta vid första interaktion Därefter, gör det som motståndaren gjorde i föregående drag Andra experimentet 62 program Alla visste om att TFT vann förra gången TFT vann igen Tit-for-Two-Tats Mer förlåtande än TFT Klarar störningar bättre än TFT Skulle vunnit första experimentet, men gick dåligt i andra Itererad Prisoners Dilemma Kännetecken för en framgångsrik strategi Var inte avundsjuk Var snäll Återgälda Var inte för smart Var en generalist Kom överens med dig själv Var en evolutionärt stabil strategi John Maynard Smith Resistant mot invasion av andra strategier 8

Dagens föreläsning Allmänt om samarbete Spelteori Nollsummespel Icke-nollsummespel Prisoners Dilemma Dilemman Itererad Prisoners Dilemma Nästa gång Onsdag Gästföreläsning: Kenneth Bodin Torsdag Ekologiska modeller Spatiala modeller 9