Förra gången. Allmänt om samarbete. Dagens föreläsning

Relevanta dokument
Spelteori: Att studera strategisk interaktion. Grundkurs i nationalekonomi för jurister HT 2014 Jesper Roine, SITE, Handelshögskolan i Stockholm

Föreläsning 6: Spelteori II

Föreläsning 5: Spelteori I

tidskrift för politisk filosofi nr årgång 10

VAD INNEBÄR EGENTLIGEN ÅRETS EKONOMIPRIS?

14.1 Två-personers nollsummespel och konstantsummespel: sadelpunkt

Institutionella perspektiv på policyanalys. Rational choice perspektiv

Avslutande föreläsning LGMA65

Biliakartellen. Kimberly Doherty Dennis Lundquist. Kartellverksamhet definierad inom ramen för ekonomisk brottslighet

Innehåll. Referenser och vidare läsning Register Illustrationer kapitel 1 Spelets regler kapitel 2 Slump...

Ekonomipriset till spelteoretiker

Samarbete. Upplägg: 1. Varför samarbeta? 1. Varför samarbeta? (Trivers, 1971) 1. Reciprok altruism

c) Vid vilka tillverkade kvantiteter gör företaget åtminstone någon vinst?

Kontraktsteorin. Föreläsning

Föreläsning 8. Oligopol

Förfluten tid Nu Framtiden. Bedömning Värdering Kunskaper Integration Konsekvenser Beslut Genomförande

Frågan om P=NP? Är P=NP? Bakgrund. "Snabb lösning"?!

Uppvaktning av utbildningsminister Jan Björklund

Resurscentrums matematikleksaker

Optimal abstraktion i heads up no-limit Texas hold em DAN ERIKSSON

Monopol, imperfekt konkurrens, monopsoni.

Att visa kunskap genom argumentation Muntlig examination inom etik och logik

Charlotta Törneling. Abstract reasoning. Urvalsförfarande 2015 Handläggare (generalister) och revisorer

Postprint.

LINKÖPINGS TEKNISKA HÖGSKOLA Institutionen för Ekonomisk och Industriell Utveckling Ou Tang

Kapitel 6 Imperfekt konkurrens

Ylva Norén Bretzer ATT FÖRSTÅ VAD SOM HÄNDER när man utvecklar plats tillsammans

Sannolikheten att vinna ett spel med upprepade myntkast

Lotto. Singla slant. Vanliga missuppfattningar vad gäller slumpen. Slumpen och hur vi uppfattar den - med och utan tärning

Lutande torn och kluriga konster!

Recension. Tänka, snabbt och långsamt Daniel Kahneman Översättning: Pär Svensson Volante, Stockholm, 2013, 511 s. ISBN

Resurscentrums matematikleksaker

Föreläsninsanteckningar till föreläsning 3: Entropi

Övningsuppgifter 2 i spelteori

Populationernas ekologi (sid )

UTFALL = (KLAVE, 2 KR; KRONA-KLAVE, 4 KR; KRONA-KRONA-KLAVE, 8 KR; OSV) = (1/2, 2 KR; 1/4, 4 KR; 1/8 8 KR; OSV)

Studieplan för utbildning på forskarnivå. Matematisk statistik

Memory Det kombinatoriska spelet

FEM TIPS FÖR ATT BLI EN BÄTTRE FÖRHANDLARE!

Skolans språk är ingens modersmål. Nils Fredriksson Utbildning

De antika grekerna (Platon, Aristoteles) trodde inte på evolution

National- och företagsekonomi HT Läsanvisningar till Frank, Microeconomics and Behavior

Att utvärdera utbildningar på forskarnivå

Strategier vid enstaka och upprepade Ultimatumspel

MARGINALISM mikroteorins framväxt KLASSIKER: MAKRO, SAMHÄLLET I STORT, FÖRDELNING MELLAN KLASSER, MARGINALISM: MIKRO, MARKNAD, JÄMVIKT, PRISBILDNING

Är ekonomer egoistiska?

Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet?

Undervisningsspråk: Engelska Undervisningen sker på engelska. (Undervisningen kan ske på svenska om alla registrerade studenter behärskar svenska.

Laboration 2 -litteraturstudie i Mechanism design

Undervisningsspråk: Engelska Undervisningen sker på engelska. (Undervisningen kan ske på svenska om alla registrerade studenter behärskar svenska.

Egoism, grupplojalitet och korruption i svensk kommunalpolitik: Lärdomar från spelteori och experimentell samhällsvetenskap

Introduktion till Programmering. Dåtid, nutid och framtid

Kombinatorik. Kapitel 2. Allmänt kan sägas att inom kombinatoriken sysslar man huvudsakligen med beräkningar av

Utbildningsplan. Civilingenjör och lärare Master of Science in Engineering and of Education 300,0 högskolepoäng. Utbildningens mål

Eventuell spänning mellan kapitalism och demokrati? Är det möjligt för ett kapitalistiskt samhälle att uppfylla kriterierna för en ideal demokrati?

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Institutionen för datavetenskap, DAT060, Laboration 2 2 För denna enkla simulerings skull kommer handen att representeras som ett par tal μ värdet på

STOCKHOLMS UNIVERSITET Sociologiska institutionen

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Vem tjänar på spelteorin?

Tentamen i nationalekonomi, tillämpad mikroekonomi A, 3 hp (samt 7,5 hp)

Upprepade mönster (fortsättning från del 1)

INSTITUTIONEN FÖR MARINA VETENSKAPER

Kapitel 2. Grundläggande sannolikhetslära

TDDC30. Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 10 Erik Nilsson, Institutionen för Datavetenskap, LiU

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

2. Härled TR och MR från efterfrågekurvan nedan. 3. Hur förhåller sig lutningen på MR till lutningen på D? Svar: MR har dubbla lutningen mot D.

BARN OCH GAMING - EN GUIDE TILL FÖRÄLDRAR

(Föreläsning:) 1. Marknader i perfekt konkurrens

Föreläsning 5: Dynamisk programmering

Kan normer och attityder påverka vårt vardagliga beteende? Miljöhandlingar ur ett miljöpsykologiskt perspektiv.

Rättningsmall för Mikroteori med tillämpningar, tentamensdatum

Bör man legalisera nerladdning av musik?

Optimal abstraktion i heads up no-limit texas hold em

TNK047 OPTIMERING OCH SYSTEMANALYS

MinMax Algoritmen Implementation och optimering. Joakim Östlund 15 juni 2004

1 Mätdata och statistik

Strategier för att öka market power för att höja vinsten. Hur påverkas strategival av marknadsstrukturen?

Föreläsning 5. Deduktion

IBM Software Group. Agil Acceptans Test. Annika Kortell SAST 15-års jubileum IBM Corporation

TATA42: Föreläsning 8 Linjära differentialekvationer av högre ordning

Artificial Intelligence

Laboration 2. Artificiell Intelligens, Ht Lärare: Christina Olsén Handledare: Therese Edvall Daniel Ölvebrink

Konsultavtalets verkan och effekt. Jur. Kand.

Grundläggande programmering, STS 1, VT Sven Sandberg. Föreläsning 20

Randall Collins: Den sociologiska blicken

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Fotboll och tärningskast. En spelteoretisk analys av straffläggning

Kapitel 1. Slutligen vänder sig Scanlon till metafysiska och kunskapsteoretiska frågor.

Föreläsning 4: Beslut och nytta, paradoxer

tidskrift för politisk filosofi nr årgång 18

Studieplan för utbildning på forskarnivå

Kursen ges som en del av masterprogrammet i kognitionsvetenskap. Den ges även som fristående kurs.

En Framtid Värd att Leva. David Ståhlberg

TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS

Datavetenskapligt program, 180 högskolepoäng

Lgr 11 - Centralt innehåll och förmågor som tränas:

SF1625 Envariabelanalys

En spelteoretisk analys av konflikten mellan USA och Nordkorea

Transkript:

Förra gången Evolutionary computation Genetic programming Genetic algorithms Aspects of evolution Classifier systems Allmänt om samarbete Exempel Slemsvampar Fåglar och fiskar som putsar Symbios Lavar: symbios mellan alg och bakterie Magbakterier i magen på människa Samhälle Varför fungerar det? Vad händer om någon fuskar? Spelteori är ett försök att ge svar Dagens föreläsning Allmänt om samarbete Spelteori Nollsummespel Icke-nollsummespel Prisoners Dilemma Dilemman Itererad Prisoners Dilemma 1

Spelteori Handlar om att hitta bästa möjliga strategi för ett visst spel Historia 1928: John von Neumann Optimal strategi för 2-pers nollsummespel 1944: von Neumann och Oskar Morganstern Theory of Games and Economic Behavior Morganstern en berömd matematisk ekonom 1950: John Nash Non-cooperative games, doktorsavhandling, 27 sidor Geni, Nobelpris 1994, schizofren Klassificering av spel Chansspel Utgången beror ej på spelarnas handlingar Ointressanta, sannolikhetsteori Strategispel Spelarnas handlingar spelar roll Exempel: Poker Klassificering av strategispel Antal spelare 1, 2, 3,..., n Nollsumme eller ej Nollsumme det en vinner förlorar den andre Icke-nollsumme positiv, negativ, konstant summa, icke konstant summa Essentiell eller ej Essentiell fördel bilda kolliationer Perfekt ellet imperfekt information Perfekt alla har fullständig info om alla tidigare handlingar Imperfekt några eller alla har partiell information 2

Strategier En fullständig sekvens av handlingar för en spelare Ren strategi Sekvensen är helt deterministisk Mixad strategi Handlingar kan ske med viss sannolikhet Nollsummespel Maximin Välj den strategi som maximerar minimala utkomsten (payoff) Exempel Två konkurrerande mineralvattentillverkare På tavlan Matching Pennies På tavlan von Neumann: Varje 2-personers nollsummespel har en maximinlösning om vi tillåter mixade strategier Icke-konstant summespel Det finns ingen allmän definition för rationalitet för icke-konstanta summespel (ej nollsummespel) Två vanliga kriterier Dominant-strategijämvikt Nash-jämvikt 3

Dominant strategijämvikt Studera varje av din opponents strategier och bestäm din bästa strategi för varje fall Om samma strategi är bäst i alla situationer, så är det en dominant strategi Jämvikt råder när båda spelarna har en dominant strategi som de använder Exempel På tavlan Nash-jämvikt En mängd strategier med egenskapen: Ingen spelare kan klara sig bättre med en annan strategi när den andre behåller strategin För mixade strategier tittar man på förväntad utkomst Exempel På tavlan Varje maximin lösning är en dominant strategijämvikt Varje dominant strategijämvikt är en Nashjämvikt The Prisoners Dilemma Melvin Dresher och Merrill Flood, RAND Corporation, 1950 Vidareutvecklat av Albert W. Tucker Används inom filosofi, etik, biologi, sociologi, politisk vetenskap, ekonomi, spelteori, datavetenskap, matematik,... The E. Coli of social psychology - Axelrod 4

The Prisoners Dilemma The story Två brottslingar har fångats, de har begått ett brott men polisen har inte tillräckliga bevis De kan inte kommunicera med varandra Om båda erkänner får de 10 år var Om en erkänner och anklagar den andra Den som erkänner går fri Den anklagade får 20 år Om ingen erkänner får de 1 år vardera The Prisoners Dilemma Utfallsmatris Cooperate Defect Cooperate Defect -1, -1-20, 0 0, -20-10, -10 rationella analys (dominant strategi) Om inte tjallar bäst att tjalla Om tjallar bäst att tjalla (Samma för ) Dominant strategijämvikt 10 år för båda Besluta irrationellt att samarbeta 1 år för båda The Prisoners Dilemma Summering Individuell rationallitet inte optimalt Ett exempel på ett spelteoretiskt dilemma 5

Spelteoretiskt dilemma En situation som kräver ett val mellan alternativ som är likvärdiga Damned if you do, damned if you don t I spelteori: Varje spelare agerar rationellt, men resultatet är inte önskvärt Spelteoretiskt dilemma Generell utfallsmatris Cooperate Defect Cooperate CC (R) Reward DC (T) Temptation to defect Defect CD (S) Sucker s payoff DD (P) Punishment Dilemmas Coop Def Coop Def CC CD DC DD Generella villkor för ett dilemma Du vinner alltid på om den andra samarbetar CC > CD och DC > DD Ibland vinner du på att hoppa av (defect) DC > CC eller DD > CD Ömsesidigt samarbete är att föredra CC > DD 24 permutationer men endast 3 är dilemman 6

Dilemmas Coop Def Coop Def CC CD DC DD Prisoners Dilemma DC > CC > DD > CD Bättre hoppa av oavsett vad den andra gör Nash-jämvikt är DD Chicken DC > CC > CD > DD Ömsesidig defect är värst Två Nash-jämvikter, DC och CD Stag Hunt CC > DC > DD > CD Bäst att samarbeta med samarbetare Nash-jämvikt är CC Itererad Prisoners Dilemma Antaganden Inga överrenskommelser eller hot En spelares nästa drag kan inte förutses Inget sätt att eliminera spelare eller undvika interaktion Inget sätt att ändra utfall (payoff) Kommunikation endast via direkt interaktion Itererad Prisoners Dilemma Axelrod s experiment (1980) Intuitivt antagande om att framtida interaktion kan påverka rationaliteten i beslut Round-robin turnering för strategier Alla tävlar mot alla, inkl sig själv 200 iterationer av PD Ska vara okänt! Varje program/strategi kan minnas tidigare händelser 14 program kom in CC = 3, CD = 0, DC = 5, DD = 1 (Krav: DC + CD < 2 * CC) Coop Def Coop 3, 3 0, 5 Def 5, 0 1, 1 7

Itererad Prisoners Dilemma Förväntade resultat för tre enkla strategier ALL-C RAND ALL-D Medel ALL-C 3.0 1.5 0.0 1.5 RAND 4.0 2.0 0.5 2.167 ALL-D 5.0 3.0 1.0 3.0 Itererad Prisoners Dilemma Resultat Vinnare: Rapaport s Tit-For-Tat (TFT) Samarbeta vid första interaktion Därefter, gör det som motståndaren gjorde i föregående drag Andra experimentet 62 program Alla visste om att TFT vann förra gången TFT vann igen Tit-for-Two-Tats Mer förlåtande än TFT Klarar störningar bättre än TFT Skulle vunnit första experimentet, men gick dåligt i andra Itererad Prisoners Dilemma Kännetecken för en framgångsrik strategi Var inte avundsjuk Var snäll Återgälda Var inte för smart Var en generalist Kom överens med dig själv Var en evolutionärt stabil strategi John Maynard Smith Resistant mot invasion av andra strategier 8

Dagens föreläsning Allmänt om samarbete Spelteori Nollsummespel Icke-nollsummespel Prisoners Dilemma Dilemman Itererad Prisoners Dilemma Nästa gång Onsdag Gästföreläsning: Kenneth Bodin Torsdag Ekologiska modeller Spatiala modeller 9