Spelteori: En studie v hur pokerproblemet delvis lösts Mik Gustfsson
Smmnfttning Spelteorin föddes 198 då von Neumnn mtemtiskt lyckdes påvis bluffens nödvändighet i spel med ofullständig informtion. Dett vr sedn länge känt v bl.. pokerproffs. Det finns mång spel där bluffen förekommer, men det mest känd spelet är troligtvis poker, som dessutom är intressnt för ndr än mtemtiker. Då riktig poker är lltför svårnlyserd kretsr rbetet kring olik förenklde vrinter med två spelre, vilk belyser speciell egenskper i L Relnce poker med såväl öppn som dold kort där korten ges från generell distributionsfunktioner. I rbetet studers också vd en vlfrihet i stsningsstorlek renderr i, då speciell krv på distributionsfunktionern nts smt vikten v tt vet sitt pokerfce vid bluffnde. Någr generell regler för hur riktig poker sk spels utveckls. De säger bl. tt du bör bluff lik oft som de odds potten ger motståndren. Om motståndren står inför vlet tt syn eller inte syn sk hn gör det med den frekvens som svrr mot komplementet till den potentiellt bluffnde spelrens pottodds.
Abstrct Gme theory ws born 198 when von Neumnn succeded to mthemticlly prove the necessity or bluffing in gmes with imperfect informtion. This ws known for long time mong e.g. proffessionl pokerplyers. There re mny gmes were bluffing ocurres, but the most fmous gme is probbly poker, which lso is interesting for other thn mthemticins. Rel poker is fr to tough to nlyse strictly with gme theory. The work is therefore concentrted to different kinds of simplified -person poker models, which enlightens specil prts of L Relnce poker with open nd closed crds nd crds given from generlised distribution function. It is studied how to solve multistge poker where one of the plyers cn choose size of the bet with specil ssumptions on the distrubution functions. It is lso shown how the pokerfce should influence the optiml betting structure. Some specil rules for rel poker is developed. They stte for exmple tht you should bluff s often s the odds the pot gives your opponent. If your opponent hs to chose whether to cll or fold, he should cll s often s the complement to the odds tht the potentil bluffer hd in the pot.
Innehåll 1 Inledning 1 1.1 Introduktion........................................... 1 1. Innehåll och begränsningr................................... Terminologi 3.1 Pokerterminologi......................................... 3. Spelteoriterminologi....................................... 4..1 Blndde och ren strtegier kontr tktik...................... 4.. Målfunktionsdefinition.................................. 4 3 Ett enkelt finit exempel 6 3.1 Speldefinition........................................... 6 3. Målfunktionsdefinition...................................... 6 3.3 Lösning.............................................. 7 3.3.1 Fllet > b........................................ 8 3.3. Resternde möjligheter.................................. 8 3.4 Tolkning v resultt....................................... 9 4 Mtemtisk redskp 1 4.1 Växnde snnolikhetsfunktioner................................. 1 4. Stieltjesintegrler......................................... 11 5 Infinit spel med en stsningsrund 1 5.1 Symmetrisk poker........................................ 1 5.1.1 Speldefinition....................................... 1 5.1. Målfunktionsdefiniton.................................. 13 5.1.3 Lösning.......................................... 14 5.1.4 Tolkning v resultt................................... 18 5. Fixtpunktmetoden: Hur mn seprerr ett pokerspel..................... 19 5..1 Generell målfunktionsdefinition............................. 19 5.. Seprtionsmetoden................................... 5.3 Asymmetrisk poker, med en storlek på beten......................... 1 5.3.1 Speldefinition....................................... 1 5.3. Lösning.......................................... 5.4 Resultt.............................................. 4 5.4.1 Någr speciell fll.................................... 5 6 Fler stsningsstorlekr 8 6.1 Fler stsningsstorlekr, med lägst öppningsbet....................... 8 6.1.1 Speldefinition....................................... 8 6.1. Lösning.......................................... 9 6.1.3 Krv på F (x)....................................... 31 6.1.4 F = G........................................... 31 6.1.5 Resultt.......................................... 3 6.1.6 Tolkning.......................................... 3 6. Fler stsningsstorlekr utn lägst öppningsbet....................... 3 i
6..1 Speldefinition....................................... 33 6.. Lösning.......................................... 33 6..3 Resultt.......................................... 35 6..4 Riktig poker à l Newmn................................ 36 7 Informtion i poker 38 7.1 Informtion i uppvänd kort................................... 38 7.1.1 Speldefinition....................................... 38 7.1. Lösning.......................................... 39 7.1.3 Tolkning v resultt................................... 4 7. Vikten v pokerfce....................................... 41 7..1 Speldefinition....................................... 41 7.. Lösning v G 1...................................... 4 7..3 Optimllösning för G 1................................. 47 7..4 Lösning v G 1/..................................... 47 7..5 Optimllösning för G 1/................................. 48 7..6 Tolkning v de olik informtionstypern....................... 48 8 Spelteori vid pokerbordet 5 8.1 En bluffsitution utn risk för kontrhöjning......................... 5 8. Lösning.............................................. 51 8.3 Resultt.............................................. 51 8.4 Tolkning v resultt....................................... 51 9 Diskussion v resultten 53 9.1 Poker ett nollsummert spel eller inte?............................. 53 9. Olik typer v odds....................................... 53 9.3 De olik spelen under bektnde v pottoddsen........................ 54 9.4 Öppen informtion........................................ 55 9.5 Pokerfce............................................. 56 9.6 Allmänt om poker........................................ 56 9.7 Flermnn poker......................................... 56 9.8 Dtorsimuleringr och den ndr fronten............................ 57 9.9 Slutstser............................................. 57 9.1 Frmtid forskning inom spelteori............................... 58 9.11 Tck................................................ 58 ii
Kpitel 1 Inledning 1.1 Introduktion Poker hr länge vrit ett stort intresse för mig. I synnerhet de spelteoretisk spektern, därför vr dett uppstsämne v stort intresse för mig. Det primär målet med uppstsen är därför tt på ett pedgogiskt sätt vis tt tnkrn vid spelbordet är spelteoretisk snningr snrre än psykologisk effekter som är mtemtiskt påvisbr med hjälp v spelteori. De former v poker som studers är grovt förenklde, men själv grunddrgen från riktig poker finns kvr. Det kommer inte lls vr någr utredningr över snnolikhetern tt få olik pokerhänder utn istället vr koncentrert till tt hitt en hndlingspln för hur mn bör ger vid pokerbordet. Det mtemtisk ordet för en sådn hndlingspln klls optimllösning 1. Poker är ett spel med ofullständig styrk. Det är dett tillsmmns med tt det finns en minst insts (nten) som gör bluffr till mtemtisk finesser och det är intresset för dess som gör pokerproblemet intressnt. Med pokerproblemet menr jg den problemtik som föreligger i poker med nte, där bluffr och/eller underbjudningr kn förekomm. Bluffr förekommer i lösningen eftersom det gäller tt optimer pottens storlek, men smtidigt minimer risktgndet för tt optimer denn. Mer konkret: vrje insts du gör vslöjr något om styrkn på denn, men smtidigt så måste du sts i förhållnde till hndens styrk, nnrs kn du vrken vinn mycket eller förlor litet. Ett citt från Jones [5] beskriver br vd spelteoritisk kretsr kring: He thinks tht I think tht he thinks... 3. All som spelt någon form v skicklighetskrävnde spel hr förmodligen hmnt i liknnde tnkr, men förmodligen inte trott tt det fnns något mtemiskt sätt tt formuler dett. Det sk sägs tt jg med skicklighetskrävnde menr tt det finns tktisk beslut som kn vr korrekt. Det gäller dock tt det i det lång loppet br finns ett optimlt sätt tt ger i poker. Det är därför tips som: Du bör då och då t tokig beslut i poker för tt minimer informtionen om din hnd som läcker ut då du gerr, finns i pokerlitterturen [4]. Med tokig beslut mens här bluffr, dvs. tt representer sin hnd i nnn dger än den fktisk. Det är därför poker är mycket mer intressnt än exempelvis bridge (som nses vr ett svårt kortspel). Ett nnt sätt tt se på poker är som en ffärsuppgörelse där båd prter vill sälj sin hnd så dyrt som möjligt. Det är själv momentet tt hndsks med pengr som ger poker dimensionen v ett spel där det lönr sig tt vr oförutsägbr, snrre än tt lägg ptiens, vilket bridge kn nses isomorft med. Bluffen förekommer därför även i ffärsuppgörelser, men även i politisk och krigsstrtegisk beslut där motståndrens styrk är okänd. I bridge exempelvis finns det br ett sätt tt spel sin kort optimlt, medn i poker finns det mång sätt. Det är osäkerheten i det optiml gerndet vid enstk fll som förknippr de nämnd spelteoretisk problemen smtidigt som säkerheten i det lång loppet. Poker är emellertid ett komplicert spel, eftersom jg gör nspråk på tt lös pokerproblemet är det viktigt tt de förenklingr som görs bibehåller bluffens existens även om det inte är exkt smm regler som vid riktig poker. 1 Närmre definiert i (..). Se.1 för definition. 3 på svensk: Hn tror tt jg tror tt hn tror... 1
1. Innehåll och begränsningr Det finns mång olik vrinter v poker, där de flest hr fler stsningsrundor och kortbyte lterntivt tt delr v hnden fås i olik steg. Det finns även pokerformer som hr delr v hnden synlig för ll. Anlyserndet kommer tt trots dett mest krets kring vrinter där hnden ges i ett svep. Jg kommer sedn tt lös denn vrint utgående från någr olik stsningsstrukurer. Dess är mycket enkl, men behåller mycket v essensen i poker, bluffen. Denn påviss i en rd spel. Dess kommer bestå v oändligt ntl kort utom i ett fll. Dett är ingen större begränsning då poker med fem kort innehåller drygt,5 miljoner möjlig händer. Det kommer även tt studers hur poker förändrs då extr osäker informtion tillkommer och hur öppn kort kn behndls spelteoretiskt. Jg kommer genomgående tt försök håll spelen så generell som möjligt och spelrn kommer därför tt ges händer utifrån generell stokstisk funktioner. Jg kommer även tt försök se på resultten från en prktisernde pokerspelres synvinkel och se någr generell grundprinciper, vilk hn sk ger utifrån. Spelen kommer enbrt vr v duellkrktär, vilket är en viss brist. Det går dock i mång fll tt studer n personer genom tt betrkt dem som en n gånger strkre motståndre. En nnn stor brist i de behndlde modellern är tt det i de flest fllen inte tillåts någon kontrhöjning. Dett eftersom jg vrit tvungen tt fokuser mig och vlt bort dess delr. En kortre diskussion hur en pokerspelre ser på denn möjlighet ges dock. Det kn även påpeks tt utveckling på dett område inte kommit så långt, vilket i viss mån motiverr mitt vl.
Kpitel Terminologi För den oinstte klrgör jg dels terminolgin som rör poker, dels den spelteoretisk terminologin. I uppstsen kommer det sedn nts tt läsren förstår dess begrepp..1 Pokerterminologi Det finns mång olik grundtyper v poker. Jg kommer referer till poker med delr v spelrns händer uppslgn som stötpoker. Blnd dess kn nämns 7-korts stötpoker och sökö, vilk är populär vrinter. En nnn vrint är mörkpoker, där får spelrn byt ut delr v hnden en gång. Den är Sveriges vnligste pokertyp och spels oft i vrinten knektöppning 1. Den tredje grundtypen får spelet Texs Hold em representer. Den är ett exempel på pokervrinter där spelrn får gemensmm öppn kort tillsmmns med någr dold enskild kort. Ingen v vrintern är så lätt tt den kn behndls i sin helhet v oss då de ll involverr tt delr v den slutlig hnden fås i olik steg. Vi kommer istället betrkt så kllde L Relnce spel, med vilket mens tt hnden fås i ett svep. Mn missr då ett viktigt problem i spelteori, nämligen tt en hnd kn h ett stort potentiellt värde, men är värdelös llt som oftst. Enkelheten i L Relnce ligger just i tt vi inte behöver bry oss om dett problem utn lätt kn rngordn ders styrk, efter ders inbördes rng. För tt förstå poker förklrr jg här grunddrgen, vilk kn tjän som huvudprinciper i ll vnlig pokertyper. Spelet börjr med tt spelrn lägger en summ i en pott, den summ vrje person lägger kllr vi nte 3. Med en bluff mens tt sts för tt indiker tt en hnd är strkre än den fktisk. Emellnåt kommer jg dock inte vr så stringent och med bluff enbrt men tt inte ger efter hndens värde. I begreppet bluff rymms då även underbjudning, vilket mn kn gör genom s.k. checkhöjningr(mer om dett senre. Då båd spelrn ntt får de en del v sin slutlig hnd. I stötpoker är delr v denn synlig och innefttr ungefär 4% v den slutlig hnden, men i mörkpoker ges fem kort vrder till spelrn 4. Sedn sker den först stsningsrundn. Nu får spelrn ftt beslut i en bestämd ordning om de vill h fler kort. Den förste spelren som lägger in pengr i potten sägs lägg öppningsbeten, denne öppnr potten. Med ordet bet mens ett tillägg till potten som medför tt hn lägger in ett större belopp en vd de övrig gjort, hn hr då bett och gjort en höjning. Resternde spelre kn då välj tt lägg in lik mycket som den betnde spelren, vilket klls tt syn eller tt inte vr med, vilket klls tt lägg sig. Spelet kn likns vid en uktion, eftersom spelrn lltid får chnsen tt svr på motspelrns bud och de/den som betlr mest vinner potten. I de flest vrinter kn spelrn även svr med tt höj en bet till, en s.k. kontrhöjning. Det kommer tyvärr inte studers något exempel då kontrhöjningr är tillåtn. Om ingen spelre hr öppnt hr mn vnligtvis möjligheten tt pss, med vilket mens tt inte sts mer pengr men med bibehållen möjlighet tt sts om någon nnn gör så. En spelre som först pssr och sedn (efter tt en spelre hr öppnt potten) höjer hr utfört en checkhöjning. En checkhöjning är som påpekt ett sätt tt indiker svghet för tt kunn sno en eventuell bet från motståndrn. Den nvänds därför främst med mycket 1 I denn vrint krävs det lägst pr i knektr för tt inled stsningen som tillåter de kvrvrnde spelrn tt byt kort. L Relnce beytder ungefär tt bjud över sin hnd. 3 I tävlingspoker är det dock vnligt tt mn stsr olik mycket beroende på position, men det förbiser vi då det inte är så viktigt vem som lägger pengrn i potten. På 18-tlets mitt speldes poker utn nte. Införndet v nten kn ses som pokerspelets födelse eftersom det är det som motiverr ren bluffr och ndr spelteoretisk sinnrikheter. 4 I poker är lltså informtionen om motståndrens hnd ofullständig, liksom den egn hndens slutgiltig värde under de inlednde stsningsrundorn. 3
god händer, då beten är stor i förhållnde till nten. När sedn ll stst lik mycket pengr eller lgt sig får de kvrvrnde spelrn fler kort, vrvid proceduren uppreps. När vi till slut är klr med den sist stsningsrundn sker en jämförelse melln de kvrvrnde spelrn vrvid spelren med den högst kvrvrnde hnden vinner hel potten. Det händer oft tt det br är en spelre kvr efter sist rundn. Då vinner denne hel potten. Ett ytterligre påpeknde om betens storlek är tt den vrierr stort i olik spel. Det finns både spel där beten är fixerd vid ett visst belopp som klls stright limit och spel där spelren får välj på fler olik storlekr på beten inom viss rmr, vilk klls spred limit spel. Blnd spred limit spelen finns pottlimit och nolimit som vnlig vrinter. Jg kommer tt studer båd vrintern. Det är no-limit vrinten som är den mest skicklighetskrävnde v ll och tvingr frm bluffen i mång fler fll. Förhoppningsvis är dett nog med terminologi för tt läsren sk kunn tillgodogör sig innehållet i uppstsen. För mer detljer ngående pokerterminologin rekommenders Pokerhndboken v Dn Glimne [4].. Spelteoriterminologi För tt klrgör viss termer härrörnde från spelteori förklrr/definierr jg dem närmre här. Jg kommer i dett rbete enbrt behndl olik typer v pokerspel. Jg koncentrerr mig därför på begrepp, vilk är lämplig tt nvänd i dett område. Målet i vrje problem är tt finn de optiml strtegiern till ett givet problem. Med optimliteten mens tt spelre A och B gör det bäst möjlig för tt vinn/förlor så mycket/litet som möjligt i lång loppet. Den summ de vinner (förlust bokförs som negtiv vinst) i lång loppet kllr vi spelets målfunktion. Då vi funnit optimlstrtegiern så kllr vi målfunktionen med dess för spelets värde. För spelets värde reserverr vi den grekisk bokstven ν..1 Blndde och ren strtegier kontr tktik I spelteori prts om blndde och ren strtegier. I vrdgsspråk nvänds även begreppet tktik. Skillnden melln tktik och strtegi är tt med tktik mens de redskp vi i en given sitution hr, dvs. en spelre kn bet/höj, syn eller lägg sig. All dess är tktisk redskp. Med frågn v vilken tktik en spelre sk nvänd sig v menr hn om hn sk höj/syn/lägg sig i en given sitution. Med strtegi mens emellertid den smlde uppsättningen v korrekt tktisk hndlnden. Med frågn v vilken strtegi en spelre sk nvänd sig v förväntr hn sig generell svr hur hn sk ger i spelet. Hn vill h svr på ll frågor v typen - Om du hr: pr lägg dig, färg höj med 1 kr. Skillnden melln blndde och ren strtegier är tt ren strtegier just ger sådn 1 % svr på de tidigre frågorn. Medn en blndd strtegi hr möjlighet tt ge svr v typen - Om du hr pr höj med 3 % snnolikhet 1 kr och lägg dig med 7 % snnolikhet. Anledningen till tt jg kommer tt nvänd blndde strtegier vid lösndet v pokerspelen är tt jg inte vill vslöj mer om vår egen hnd än nödvändigt. Poker är ett spel med ofullständig informtion om motspelrens/s hnd/händer och i de flest vrinter även om den egn hndens värde... Målfunktionsdefinition I de spel vi kommer nlyser besitter de båd spelrn icke fullständig informtion om motståndrens styrk och därför väljer vi tt gör följnde definition v det vi vill optimer: målfunktionen. Definition..1. Målfunktionen i ett spel är den förväntde vinsten för spelre A vid ett spel, under förutsättning v tt spelre A och B gerr på ett givet sätt. Anmärkning: Då poker är ett spel som inte hr någr sänkor eller källor (m..p. pengr) är A:s vinst detsmm som B:s förlust och vice vers. Det som sk löss är därför tt mximer målfunktionen m..p. A:s strtegi och minimer den med vseende på B:s strtegi. Det är den här drgkmpenmelln A och B som resulterr i tt mn förhoppningsvis når en punkt där B nvänder en strtegi så tt A åtminstone inte vinner mer än ν och A hr en strtegi så tt B inte förlorr mindre än ν enheter, en sdelpunkt. Dess båd strtegier klls tillsmmns för spelets optimllösning. Spelet värdet klls ν. Med dett mens br det ovn sgd och påståendet tt optimlstrtegin verkligen är den bäst strtegin är endst snt om vi vet tt vår motståndre är smrt och nvänder sig v sin optimlstrtegi. Vet A emellertid tt B hr en specifik strtegi skild från optimlstrtegin kn det vr bättre för A tt frångå sin optimlstrtegi. Antgndet tt motståndren är smrt är därför viktig tt 4
minns, eftersom det i verkligheten inte lltid är så. Det är dock lättre tt lös spelet om motståndren är dålig så optimeringen v målfunktionen är lösningen v spelet då det är som svårst. Bevis för tt dess strtegier är optiml finns i mång grundläggnde böcker och jg refererr till von Neumnn [18] för bevis. Först med tt bevis tt dett så kllde minmxteoremet gäller då spelrn kn nvänd sig v blndde strtegier vr von Neumnn, 198. Dett kn ses som själv födelsen för spelteori och mång v tnkegångrn rörnde pokerproblemet är hns förtjänst. 5
Kpitel 3 Ett enkelt finit exempel I problemformuleringen nämnde jg tt vi kommer tt studer krftigt förenklde pokervrinter i denn uppsts. Spelet kommer oftst tt betrkts som infinit, dvs. ntlet möjlig händer är oändligt, vilket rättfärdigs i 5.1. I dett vsnitt kommer jg istället förenkl spelet genom tt minsk ntlet möjlig händer. Dett görs för tt mycket v väsentlighetern finns med ändå. 3.1 Speldefinition Exemplet som nu kommer tt betrkts innehåller en kortlek med tre kort: 1, och 3. Spelet börjr med tt båd spelrn lägger ntr enheter, därefter ges de båd spelrn vrsin hnd. Den spelre som gerr först refererr jg till som spelre A och den ndre spelren, spelre B. Denn konvention bibehålls genom hel uppstsen. Spelre A får sedn välj melln om hn vill bet ytterligre b enheter i potten eller pss. Betr A får B välj melln tt även hn sts b ytterligre enheter (syn) vrvid en jämförelse melln händern sker och spelren med den högst hnden vinner + b enheter v sin motståndre, eller lägg sig vrvid hn förlorr sin stsde enheter. Om A väljer tt pss kn B välj tt pss, eller höj. Vid en höjning från B kn A endst välj tt syn. Vid syn eller då de båd psst sker jämförelse och den högst hnden vinner potten. Spelet innehåller lltså inte någon möjlighet till checkhöjningr, men underbjudning kn eventuellt inträff från A:s sid om hn först pssr och sedn synr med hnd 3. 3. Målfunktionsdefinition En målfunktion är som beknt den förväntde vinsten A gör genom tt spel spelet. Då den beror på slumpmomentet vid given måste jg nvänd en form v väntevärde. En förlust kommer jg bokför som negtiv vinst. Denn målfunktion kllr jg K. Nu går jg vidre och definierr ll strtegier för A som: (α i, β i, γ i ) i=1,,3. Där α i för en hnd i motsvrr snnolikheten tt A betr direkt, β i är snnolikheten tt A pssr och synr ifll B betr och γ i är snnolikheten tt hn först pssr och sedn lägger sig. Dess är de tre möjlighetern för A. För B däremot räcker det med två prmetrr för tt bestämm strtegin med hnd i (x i, y i ) i=1,,3. Där x i är snnolikheten tt hn betr efter en pss från A och y i är snnolikheten v en syn från B efter en bet från A. Det är enkelt tt inse följnde: α i, β i, γ i, x i, y i 1 smt α i + β i + γ i = 1. Genom enkel bokföring är det enkelt tt se tt A:s förväntde vinst vid nvändnde v de definierde strtegiern är: K = 1 (β i + γ i )(1 x j )sgn(i j) + ( + b) β i x j sgn(i j) 3! i j i j (3..1) γ i x j + α i (1 y j ) + ( + b) α i y j sgn(i j), i j i j i j 6
där sgn(x) = 1 om x > och sgn(x) = 1 om x <. Nu försöker jg hitt strtegier (αi, β i, γ i ) och (x i, y i ) i så tt K(α i, β i, γ i, x i, y i ) K(α i, β i, γ i, x i, y i ) x i, y i, i (3..) K(α i, β i, γ i, x i, y i ) K(α i, β i, γ i, x i, y i ) α i, β i, γ i, i (3..3) Det gäller nu tt hitt en strtegi för A så tt B inte kn gör K lägre än K(αi, β i, γ i, x i, y i ) och så tt dett värde för K är mximlt. Anlogt gäller det för B tt hitt en strtegi så tt A inte kn gör K större än K(αi, β i, γ i, x i, y i ) och tt dett värde för K är minimlt. Hur kn vi hitt dess strtegier? 3.3 Lösning All komponenter i optimlstrtegiern är melln och 1. Då K sk görs miniml med hänsyn till x i, y i så måste dess väljs 1 då koefficienten frmför dess är negtiv och noll då koefficienten är positiv. För spelre A gäller emellertid även tt α i + β i + γ i = 1 i så därför kn endst den v α i, β i, γ i vilken hr den störst koefficienten väljs 1 och ll ndr till. Finns det fler koefficienter som är lik så finns det ingen regel för vilken som tvingr någon till /1. Det gäller br tt vriblern summers till ett. För B gäller istället tt så fort koefficienten frmför x i, y i är negtiv så måste de väljs 1, är de spelr det ingen roll och hr de positiv koefficienter måste de väljs till 1. Nu räcker det för mig tt br studer dess koefficienter och välj dess enligt dess kriterier. Därför skriver jg om (3..1) så tt koefficientern frmför vriblern tydligt syns enligt två olik sätt illustrert nedn: K(α i, β i, γ i, x i, y i ) = 1 3! ( x 1[ (γ + γ 3) + b(β + β 3)] + x [ γ 3 b(β 1 β 3)] + x 3 [ b(β 1 + β )]+ y 1 [b(α + α 3)] + y [ α 1 b(α 1 α 3)] + y 3 [ ( + b)(α 1 + α )] ) + termer oberoende v x i och y i, K(α i, β i, γ i, x i, yi ) = 1 ( α1 [ ( + b)(y + y 3! 3)]+ β 1 [ b(x + x 3)] + γ 1 [ ]+ α [ + by1 ( + b)y3] + β [b(x 1 x 3)] + γ [ x 1]+ α 3 [ + b(y 1 + y )] + β 3 [ + b(x 1 + x )] + γ 3 [ (x 1 + x )] ). (3.3.1) (3.3.) Nu är det br tt börj resoner frm vd koefficientern bör vr. Först noterr jg tt koefficienten frmför y 1 i (3.3.1) är icke- negtiv så kn jg giss tt y1 =. Nu fortsätter jg gissndet v värdet på vriblern i optimllösningen. Iblnd kommer gissndet tt led in i återvändsgränder där ntgnden visr sig vr felktig, men viss ntgnden kommer tt vis sig konsistent med vrndr i optimllösningen. När jg lyckts bestämm ll vriblern så tt de stämmer överens med vrndr är optimum funnet eftersom då är vribler x i, y i vld så tt (3.3.1) är m..p. på x i, y i och (3.3.) är mximerd med vseende på α i, β i, γ i och därmed är optimum funnet. Förmodligen är y3 = 1 då koefficienten frmför är icke-positiv och v smm nledning är också förmodligen x 3 = 1. Nu studerr jg (3.3.) och ser tt koefficienten fmför γ 3 inte är större än koefficienten fmför α 3, därför sätter jg γ3 =. På smm sätt ser jg tt β1 = är ett rimligt vl. Insättning v den nyvunn kunskpen i (3.3.1) och (3.3.) finner jg: K(αi, βi, γi, x i, y i ) = 1 ( x1 [ γ + b(β + β 3! 3)] + x o [bβ3] + y [ α1 b(α1 α3)] ) + termer oberoende v x i och y i, (3.3.3) smt y 1 = och y 3 = x 3 = 1 och K(α i, β i, γ i x i, y i ) = 1 3! ( α 1[ b ( + b)y ] + γ 1 [ ]+ α [ b] + β [b(x 1 1)] + γ [ x 1]+ α 3 [ + by ] + β 3 [ + bx 1] ), (3.3.4) smt β 1 = γ 1 =. 7
Dett är så långt jg kn komm utn tt gör viss ntgnden om de reltiv storlekrn hos och b. Jg noterr tt koefficientern frmför α, β, γ 3 endst beror på vribeln x 1 och därför sk jg gör ett försök tt bestämm de reltiv storlekrn hos dess koefficienter. Jg börjr med tt studer fllet > b, då ser jg tt så länge x 1 < b +b så är koefficienten frmför γ störst och därför γ = 1, smt α = β =, vilket i sin tur gör koefficienten frmför x 1 i (3.3.3) mindre än noll, vilket skulle betyd tt x 1 =, vilket strider mot ntgndet. Eftersom jg utgår från tt > b så måste ntgndet om x 1 vr flskt. Jg prövr därför med x 1 > b +b, dett leder till tt koefficienten frmför β är större än de frmför α, γ och därför β = 1, α = γ =. Tittr jg nu återigen på (3.3.3) så ser jg tt koefficienten frmför x 1 är mindre än noll, vilket skulle led till tt x 1 =, vilket återigen strider mot x 1 > b +b. Det finns nu endst ett fll kvr nämligen x 1 = b +b, vilket betyder tt koefficienten frmför β är lik stor som koefficienten frmför γ som är större än den frmför α, vilket leder till tt α =. Jg studerr nu α 1 och β 1. Jg vet tt den v dess med störst koefficient sk vr ett och den ndr noll. Jg ntr tt y < b +b α 1 = 1, vilket ger tt koefficienten frmför y är negtiv y = 1, vilket motsäger ntgndet. Alltså är y b +b. Nu försöker jg med y > b +b α 1 =, nu ser jg tt koefficienten frmför y är icke-negtiv i (3.3.3) och endst noll om α 3 =, vilket koefficienten måste vr om y > b +b >. Om α 3 = så måste koefficienten frmför α 3 vr mindre än den frmför β 3 för tt jg sk vr tvungen tt h β3 = 1, dvs. + by < + b(x 1 + x ) y < x 1 = b +b. Alltså b +b > y > b +b, vilket inte kn stämm om b. Nu måste beräkningrn dels upp i fler fll. 3.3.1 Fllet > b Då det blev motsägelse vid ll fll utom för y = b +b, utreder jg nu dett fll noggrnnre. Från ovnstående beräkningr vet jg även tt x 1 = b +b och α =. Studerr mn nu (3.3.3) ser mn tt om β3 > x =, vilket innebär tt koefficienten frmför β 3 måste vr större än den frmför α 3, men insättning v y och x 1 leder till: [ + b(x 1 + x } {{ )] = [ + } koefficient frmför β 3 b + b ] < } [ + {{ by ] = [ + } koefficient frmför α 3 Då måste β 3 = α 3 = 1. Ekvtionern (3.3.3) och (3.3.4) är nu förenklde till: x 1 [ γ + β b] + x [] + y [ ( + b)α 1 + b] b( b) + b ], ty b <. (3.3.5) och α 1 [ ] + γ 1 [ ] + β [ b + b ] + γ [ b + b ]. Då x 1 vrken är eller 1 så måste koefficienten frmför x 1 vr β = b γ, ty α + β = 1, β = +b och γ = b +b. På smm sätt finner vi tt α 1 = b +b och γ 1 = +b. Då koefficienten frmför x är så är x inte helt bestämt, men då β3 = så måste x 1 + x y, vilket betyder tt: x ( b) +b. Nu är fllet > b utrett och optimlstrtegiern kn summers i nednstående ekvtioner: (x 1, y1) b = ( + b, ), (x (α1, β1, γ1) b = ( + b,, ( b) + b, y = b + b ) (x 3, y 3) = (1, 1) + b ), (α, β, γ ) = (, + b, b + b ), (α 3, β 3, γ 3) = (1,, ). (3.3.6) Spelets värde fås genom direkt insättning i (3..1) och är b 6(+b) 3.3. Resternde möjligheter För tt inte fördjup mig lltför mycket i dett fll ger jg br lösningen v de resternde fllen som de ges i [7], resonemnget ovn grunddes också från denn. Det är br ett likdnt resonernde som leder frm till dess resultt, därför ger jg dem utn bevis för tt diskuter resultten. 8
= b Då = b ges optimlstrtegier för spelet v: (x 1, y 1) = (1, ), (x, y ) = (, 1 3 ), (x 3, y 3) = ( 1 3, 1), α = β 1 = γ 3 =, övrig godtycklig i [, 1] uppfyllnde α 3 = 3α 1, β + β 3 = γ, β 3 + α 3 = 1, β + γ = 1, α 1 + γ 1 = 1. (3.3.7) < b < I dett fll är optimllösningen: (x 1, y1) b = ( + b, ), x =, b + b y (α 1, β 1, γ 1) = (,, 1), (α, β, γ ) = (, b + b, b + b, (x 3, y3) = (1, 1) b + b ), (α 3, β3, γ3) = (, 1, ). (3.3.8) < b Spelet hr nu optimlstrtegier enligt: (x 1, y 1) = (, ), (x, y ) = (, ), (x 3, y 3) = (1, 1), (α 1, β 1, γ 1) = (α, β, γ ) = (,, 1), för hnd 3 finns det fler lösningr vilk uppfyller α 3 + β 3 + γ 3 = 1 och γ 3 + bβ 3. (3.3.9) 3.4 Tolkning v resultt Mycket v själv essensen i poker finns kvr i denn grovt förenklde vrint. Mn kn först se tt i fllet som är löst, då nten är stor i förhållnde till beten bluffr både A och B då och då (x 1, α1 ). A hlvbluffr ingenting, men B hr friheten tt gör det (α =, x ej entydigt bestämd). Det förekommer ingen underbjudning, ty β3 =. Då beten är mellnstor ( < b < ) bluffr A fortfrnde, men inte B. Ing hlvbluffr förekommer, men A underbjuder lltid. I det sist fllet då beten stor i förhållnde till nten ser vi tt spelrn inte går med på låg eller mellnlåg händer. Ingen går med utn tt vr säker på vinst. Spelre A kn vrier sin strtegi, men i optimllösningen måste det finns med tt A underbjuder, ty β3. De resternde fllen innehållnde likhet är inte v så stort intresse då de br uttrycker en större flexibilitet hos spelrn och är br gränszoner. Jg återkommer till hur mn sk tolk de olik frekvensern och tlen + b med fler i 9.3. 9
Kpitel 4 Mtemtisk redskp Då jg kommer tt rbet med infinitesiml mått snrre än små intervll och integrler i stället för summor då jg kommer tt behndl poker som ett infinit spel kommer jg tt definier redskp utvecklde för tt lös infinit spel nedn. Dess är mtemtisk verktyg som behövs för tt kunn studer mer komplex spel. 4.1 Växnde snnolikhetsfunktioner En funktion som beskriver snnolikheten för tt någon viss händelse sk h inträfft vid en viss tidpunkt ligger lltid melln och 1. Mn förstår intuitivt tt efter en större tid så måste snnolikheten tt händelsen hr inträfft större eller lik stor som vid en tidigre tidpunkt. Snnolikheten minskr inte hos en funktion definierd på det här sättet. Det är precis så en växnde snnolikhetsfunktion är definierd. Mer mtemtiskt formulert i nednstående definition. Definition 4.1.1. En funktion F (x) är en växnde snnolikhetsfunktion (v.s.f.) definierd i intervllet [, b] om: F () =, F (b) = 1, smt F (c) F (x) c, x {[, b] c < x}. Dett vr just vd jg skrev i exemplet ovn. Det kommer typiskt vr =, b = 1 och iblnd även F (x) = x i de exempel som behndls. Det är värt tt noter tt en v.s.f. inte behöver vr kontinuerlig utn mycket väl vr diskontinuerlig. Jg sk nu definier en speciell form v v.s.f. som är lämplig tt nvänd vid beräkning v viss stieltjesintegrler. Definition 4.1.. Jg kllr en växnde snnolikhetsfunktion med egenskpen tt den är för x < och 1 för x för en indiktorfunktion, denn betecknr jg X A (x) där A är en mängd och följnde gäller: { x / A X A (x) 1 x A Iblnd skriver vi indiktorfonktionen som X [c,d] (x), med vilket vses tt den är 1 då c x d, nnrs. Oft kommer vi emellertid tt nvänd det ännu kortre skrivsättet X (x) när jg vser den funktion som är för x < och 1 för x 1. För tt skriv upp någr egesnkper om indiktorfunktionen inför jg två vnlig konventioner ngående gränsvärden eftersom indiktorfunktionen är diskontinuerlig och den kommer tt nvänds frekvent i uppstsen. Definition 4.1.3. En funktion F (x) sägs h högergränsvärdet i punkten och dett beteckns F (+). På smm sätt hr funktionen vänstergränsvärdet F ( ). Dett skrivs mtemtiskt som: och F ( + ) lim F ( + ε) ε ε> F ( ) lim F ( ε). ε ε> 1
Då indiktorfunktionen är diskontinuerlig behöver mn vet vd höger- respektive vänstergränsvärdet i den diskontinuerlig punkten är. Dett kn ses som en definition, men även som ett resultt v Definition 4.1.. Sts 4.1.4. Låt X (x) vr en indiktorfunktion som är 1 för x > och för x <. Då gäller tt X ( + ) = 1 och X ( ) =. 4. Stieltjesintegrler Om vi återgår till vårt exempel ovn där vi hr definiert en v.s.f. som snnolikheten tt en händelse sk h inträfft vid en tidpunkt t. Vill vi beräkn måste vi integrer differentieringen v v.s.f. på vnligt mnèr. Det är själv integreringen v en funktion som klls stieltjesintgrl. Lite mer mtemtiskt. Definition 4..1. Låt punktern x i (för i=1,,...,n) vr olik i intervllet [,b] så tt: = x < x 1 < x < < x n = b Inför nu ett mått, enligt: = mx x 1 x, x x 1,, x n x n 1 Då klls nednstående för stieltjesintegrlen v G med vseende på F från till b: b G(x)dF (x) lim n n G(z i )[F (x i ) F (x i 1 )], där x i 1 x i i i=1 Anmärkningr: Definitionen v stieltjesintegrler är nlog med den för riemnnintegrler, med den skillnden tt mn här integrerr över en funktion istället för över en vribel.mn ser också tt om F (x) = x så övergår integrlen till en vnlig riemnnintegrl med x som oberoende vribel. Det är inte säkert tt stieltjesintegrlen exister eftersom den innehåller en gnsk komplicerd gränsövergång. Speciellt kn sådnt inträff om F (x) och G(x) hr en gemensm diskontinuitet i någon punkt. Då dess sk nvänds i uppstsen ställer jg upp någr nvändbr stser om dess som uttrycker nvändbr egenskper. Det ges ing bevis, men det går tt hitt fullständig utredningr i t.ex Widder [19], eller McKinsey [9]. Sts 4... Steltjesintegrlern är distributiv och kommuttitv på smm sätt som Riemnnintegrlern. Även tringelolikheten gäller på motsvrnde sätt. Nu följer någr stser då funktionern i stieltjesintegrlen hr specifik värden. Sts 4..3. Vi låter G(x) vr en godtycklig funktion definierd i intervllet [,b] och kontinuerlig i punktern 1,,, n, vilk stisfierr 1 n b Om dessutom F (x) är definierd enligt: F (x) = b 1 X 1 + b X + + b n X n ; där b 1,, b n är reell tl. Då gäller: b G(x)dF (x) = b 1 G( 1 ) + b G( ) + + b n G( n ) För bevis se McKinsey [9], sidorn 175-176. En sts som vi kommer tt behöv är: Sts 4..4. Antg tt G(x) är monotont växnde, och dg(x) dx är Riemnn integrebr över det slutn intevllet och b. Låt F(x) vr en begränsd reell funktion på smm intervll. Då F(x) är Riemnn- Stieltjes integrebr om och endst om F (x) dg(x) dx är Riemnn integrebr. I så fll gäller: Bevis hitts i exempelvis [19]. b F (x)dg(x) = b F (x) dg(x) dx dx 11
Kpitel 5 Infinit spel med en stsningsrund I 3 behndldes pokerproblemet under den huvudsklig inskränkningen tt det br existerr tre olik händer. Här kommer jg tt först tänk oss ntlet som stort och sedn se det som oändligt. Sedn kommer jg tt studer spel med mer generell distributionsfunktioner. I dett kpitel behndls enkom spel där spelrn kn välj melln tt sts en bet eller pss. 5.1 Symmetrisk poker Dett problem löstes först i John von Neumnns klssisk verk [18], jg nvänder en liknnde metod med den som gjordes i denn. Problemet får också ses som en introduktion till exempel som behndls senre, då mycket väsentligen är sig likt. Dett exempel kommer också vr det sist som utgår från en vnlig kortlek och visr tt given utn större fel kn pproximers med tt båd spelrn får ett slumptl i intervllet [, 1]. Nottionen i exemplet nedn kommer tt skilj sig från senre exempel och är delvis tgen från von Neumnn [18]. Dett är ändå ett normlt förfrnde vid söknde efter en sdelpunkt även om den är något krångligre än senre metoder. 5.1.1 Speldefinition Spelet som sk nlysers är en form v symmetrisk L Relnce poker. Spelet består v två deltgre, A och B. Spelet börjr med tt båd spelrn ntr enheter vr. Sedn får de båd spelrn fem slumpvis kort ur en vnlig kortlek. Dess rngordns efter speciell regler och rngordningstlet (= s) går då från 1 till 598 96 (= S). Den lägst hnden är hnd 1 och den högst rngordns som hnd nummer S. I riktig poker gör mn ingen åtskillnd melln färgern, vilket leder till en viss degenertion v ntl händer. För enkelhets skull tänker mn tt någon regel gör åtskillnd melln färger. Med dett menr jg tt någon regel skiljer hnden 4 5 6 8 1 och 4 5 6 8 1 åt. Det förändrr i stort sett ingenting om det skulle ts med tt dess händer räkns som lik, förutom tt S blir något lägre. Mn gör dock vnligtvis en viss åtskillnd melln korts kulörer (då ll kort är i smm kulör exempelvis) i poker, därför är regeln om åtskillnd gnsk välmotiverd då problemställning br hndlr om vilken styrk mn sk h för tt sts. Det finns lltså S olik möjlig händer. Där A och B får vrsin hnd med vrsitt rngordningstl ssociert till sig, jg kommer kll A:s rngordningstl för s A och B:s för s B. Sedn får båd spelrn smtidigt bestämm sig för pss eller spel. Säger båd spelrn pss jämför spelrn sin händer och den med det lägst rngordingstlet vinner enheter v den ndr (vid lik vinner ingen). Om en spelre säger pss och den ndr spelren säger spel, får den först spelren beslut sig för om hn vill ändr sitt beslut till spel eller stå kvr vid sitt pss. Ändrr hn sig sker en jämförelse v händern och den spelren med det lägst rngordingstlet vinner + b enheter v den ndr (b > ). Säger båd spelrn spel jämför spelrn sin händer och den med det lägst rngordingstlet vinner + b enheter v den ndr (vid lik vinner ingen). Dett spel kommer tt referers till som spelet G sym uppstsen. Spelet är nu väldefiniert och det gäller nu tt sök en mtemtisk problemformulering tt lös spelet med. 1
5.1. Målfunktionsdefiniton Det finns lltså tre olik tktisk redskp för spelrn tt tillgrip. De måste därför t ett tredelt beslut oberoende v hndens värde. De kn båd pss med vsikten tt lägg sig om motståndren spelr, vilket jg kllr för lterntiv 1. Hn kn också pss med vsikten tt ändr sig till spel ifll hns motståndre spelr, vilket jg kllr för lterntiv. Som tredje lterntiv kn hn spel från börjn, då behöver hn inte t något mer beslut, dett kllr jg för lterntiv 3. Det går därför urskilj 3 S olik ren strtegier. Vrje ren strtegi är en uppsättning v tktisk beslut som säger tt om du får hnden s A så gör si och om s B så gör så. Nu definierr jg dess strtegier. Då vrje spelre hr tre olik möjlig tktisk drg i en given sitution, kllr jg i s det beslut spelre A tr med hnd s och j s det som spelre B tr med hnd s. Besluten är numrerde som i texten ovn, dvs. enligt: 1 om A (B) spelr med hnd s och därmed stsr + b i s ( eller j s ) = om A(B) med hnd s pssr med vsikt tt ändr till spel om B(A) betr 3 om A (B) med hnd s pssr, med vsikt tt lägg sig En spelres strtegi är en uppsättning v ll i s vld på ett unikt sätt för hnd s. Jg betecknr spelre A:s strtegier som Σ A (i 1,..., i S ) och B:s strtegier som Σ B (j 1,..., j S ). Med dett mens tt A (B) med hnd s sk ger som värdet på komponent s i Σ A (Σ B ) dikterr. Det fiffig med tt räkn ll händer som olik är tt ll händer då är precis lik snnolik. Det skulle inte h vrit så om vi räknt ntlet händer med specifik värden i riktig poker. Till exempel är det inte lik mång händer som svrr mot pr i ess med kung, nio och tre vid sidn om som kåk i dmer och tvåor. Nu vill jg uttryck hur mycket A förvänts vinn då A nvänder strtegi Σ A (i 1,..., i S ) och B Σ B (j 1,..., j S ). Dett kllr jg för mtriselementet H(i 1,, i S, j 1,, j S ). Det är därför hel mtrisen som är målfunktionen i enlighet med (..1) då den uttrycker den förväntde vinsten. I sökndet efter målfunktionen skriver jg först upp vinsten för spelre A då hn hr hnd s A och B hr s B för olik tktiker i och j. Denn utbetlningsfunktion kllr jg för L(s A, s B, i, j), vilken senre bestämmes. Jg smmnställer nu vd vinsten till A blir då A gerr på ett visst sätt och B på ett visst sätt i nednstående tbell som visr värdet hos L(s A, s B, i, j) för olik i och j. Där i j 1 3 1 sgn(s A s B ) sgn(s A s B ) b sgn(s A s B ) bsgn(s A s B ) bsgn(s A s B ) 3 -b bsgn(s A s B ) bsgn(s A s B ) 1, om x >, sgn(x) =, om x =, 1, om x <. Den förväntde vinsten om A nvänder en strtegi Σ A (i 1,, i S ) och B nvänder en strtegi given v vektorn Σ B (j 1,, j S ) är 1 : H(i 1,, i S, j 1,, j S ) = 1 S S s A,s B =1 L(s A, s B, i sa, j sb ) (5.1.1) Det är nu nästn dgs tt ställ upp målfunktionen, men eftersom det gäller tt sök efter lösningr i form v blndde strtegier definierr jg vektorern ξ och η som består v 3 S komponenter som är ξ i1,,i S och η j1,,j S. I dess vektorer finns lltså ll möjlig kombintioner v i k, j l och därför består de 1 Det kn diskuters om 1 1 S inte sk ersätts mot, men då jg ntgit tt ll händer är lik snnolik får jg S(S 1) fortsätt med dett. Det är inte som i det tidigre kpitlet eftersom den hög korreltionen melln händern vr viktig i problemställningen. En fullsändig utredning skulle led till tt mn fick ett något lägre S och en summ som inte gick över ll möjlig s A, s B. Dett eftersom viss händer exkluderr ndr motståndrhänder. Den orolige läsren får tänk sig tt händern ges från vrsin kortlek, då är ll kombintioner v händer möjlig och (5.1.1) är helt korrekt. 13
v vrder 3 S komponenter. I vilken ordning de kommer är inte v intresse för tillfället, det räcker tt vet tt det går tt nummrer dem som föreskrivet och vektorbenämningen är br ett förkortt skrivätt. Vrje komponent i ξ är ligger i intervllet [, 1] och är vikter som beskriver med hur stor snnolikhet spelre A sk nvänd den ren strtegin som komponenten svrr mot (nlogt för B). Det måste lltså gäll tt ll komponenter i ξ summers till 1, eftersom det är snnolikheten tt vi kommertt nvänd någon strtegi överhuvudtget. När vi nu vill skp den förväntde vinsten då spelrn kn nvänd sig v blndde strtegier måste vi vikt väntevärdet v vrje ren strtegi så tt målfunktionen blir: Vilket med (5.1.1) blir: K( ξ, η) = K( ξ, η) = 1 S S 3 l=1 i l =1 j l =1 S 3 H(i 1,, i S, j 1,, j S )ξ i1,,i S η j1,,j S. S 3 s A,s B =1 l=1 i l =1 j l =1 3 L(s A, s B, i sa, j sb )ξ i1,,i S η j1,,j S. (5.1.) Nu försöker jg förenkl och bli v med någr överflödig vribler. Därför definierr jg två ny vribler: ρ s A i 3 i 1= =i S =1 ej i sa i ξ i1,,i S (5.1.3) och σ s B j 3 j 1= =j S =1 ej j sb j η j1,,j S. (5.1.4) Dess båd vribler uttrycker snnolikheten tt om spelre A nvänder den blndde strtegin ξ så uttrycker ρ s A i snnolikheten tt hn tr beslutet i med hnd s A. På smm sätt menr jg med σ s B j snnolikheten tt spelre B med den blndde strtegin η och hnd s B tr beslutet j. Dess två omskrivningr gör också tt (5.1.) kn skrivs om som: K( ξ, η) = 1 S S 3 s A,s B =1 i,j=1 L(s A, s B, i, j)ρ s A i σ s B j. (5.1.5) Då ξ och η är vektorer vrs komponenter summers till 1 och ll är i [, 1] ser mn från (5.1.3) och (5.1.4) tt även ρ s A i och σ s B j måste gör det, dvs.: ρ s A i i, s A, σ s B j j, s B och 3 i=1 ρ s A i = 1, (5.1.6) 3 j=1 σ s B j = 1. (5.1.7) Jg definierr nu även följnde tredimensionell vektorer för tt kunn förenkl skrivsättet än mer: ρ s A (ρ s A 1, ρ s A, ρ s A 3 ) och σ s B (σ s B 1, σ s B, σ s B 3 ). (5.1.8) Från (5.1.5) ser mn tt målfunktionen beror på ρ s A och σ s B (om mn utför först summn syns det explicit) och vrken v ξ eller η, vilket inte vr fllet tidigre i (5.1.). De båd ξ och η består vrder v 3 S komponenter vilk beror på 3 S 1 vribler vrder. Men de ny vriblern ρ s A och σ s B beror vrder på komponenter och därför beror målfunktionen br v S konstnter. Då 3 S 1 >> S är förenklingen stor. 5.1.3 Lösning Nu hr jg definiert en rd vribler och funnit målfunktionen (se (5.1.5)) som A vill mximer och B minimer m..p. ders respektive (blndde) strtegier. Det är därför dgs tt påbörj lösningsprocessen genom tt bekt de speciell omständigheter som föreligger i spelet. 14
Enkl kriterier Spelet är helt symmetriskt. Det finns lltså ingen åtskillnd melln A och B i ders strtegier, eftersom reglern för båd dess är desmm. Det gäller därför tt om mn kllr optimlstrtegiern för η och ξ så måste det gäll tt: η = ξ. Från (5.1.5) syntes det tt K( η, ξ) egentligen beror v ρ sa och σ sb. Dett uttrycker jg mer explicit genom en omflyttning i summorn, vilket leder till tt (5.1.5) istället ser ut som: K( ρ 1,, ρ S, σ 1,, σ S ) = S 3 s A =1 i=1 ρ s A i S 3 s B =1 j=1 L(s A, s B, i, j)σ s B j. (5.1.9) Då summn v ll komponenter iσ s B är 1 och ligger i [, 1] så måste mn på smm sätt som i 3.3 välj den komponent som hr den minst koefficienten till 1 (då mn vill minimer m..p. σ s B ) och ll ndr till. Skulle det finns fler koefficienter som vr lik små spelr det ingen roll vilk som väljs till ett, förutom tt de måste summers till 1. Då σ s B j och ρ s A i redn är seprerde från vrndr (5.1.9) döper jg koefficienten frmför σ s B j till 1 S γ js B, dvs.: γ s B j 1 S s A =S,i=3 s A =1,i=1 L(s A, s B, i, j)ρ s A i. (5.1.1) Denn isärskrivning är tillåten fstän L(s A, s B, i, j) beror v s B, j då den är entydigt bestämd för specifik s A, s B, i, j (den sk lltså inte bestämms). γ s B j beror sålund enbrt v s B och j. Det behövs inte görs motsvrnde seprtion med koefficienten frmför ρ s A i då det är känt tt strtegiern för de båd spelrn är likdn. Med denn nottion blir målfunktionen: K( ρ 1,, ρ S, σ 1,, σ S ) = 1 S Nu söker jg lltså för vilk pr v s B, j som γ s B j jg uttrycken för γ s B j explict: γ s B 1 = 1 S γ s B = 1 S γ s B 3 = 1 S ( sb 1 ( ( + b)(ρ s A 1 + ρ s A ) ρ s A 3 ) bρ s B s A =1 ( sb 1 ( ( + b)ρ s A 1 (+ρ s A + ρ s A 3 )) + s A =1 ( sb 1 s A =1 b(ρ s A 1 ρ s A ρ s A 3 ) + bρ s B 1 + Övergång från finit till infinit problem S 3 s B =1 j=1 γ s B j σ s B j. (5.1.11) ntr sitt minimum. För tt kunn studer dett skriver 3 + S s A =s B +1 S s A =s B +1 S s A =s B +1 (( + b)(ρ s A 1 + ρ s A ) ρ s B (( + b)ρ s A 1 (ρ s A + ρ s B 3 )) ) 3 ) ), (5.1.1), (5.1.13) ) (ρ s A 1 + ρ s A ) + ρ s B 3. (5.1.14) (5.1.15) Hittills hr problemet stäälts i nlogi med det tidigre löst finit problemet i 3. Det är emellertid svårt/jobbigt tt bestämm S stycken oberoende σ s A i genom tt successivt lös (5.1.13),(5.1.14) och 5.1.15, vilket är 3S stycken ekvtioner. Det kommer därför tt görs en gränsövergång från diskret händer till kontinuerlig. Till tt börj emed skls trnsformers ll händer så tt de ligger i intervllet [,1]. Dett klls hndens värde i det kontinuerlig fllet, och benämnes z. Denn trnsformtion görs enligt: z s 1 1 S 1. Dett innebär tt den lägst hnden hr värdet, näst S 1, änd upp till 1. Prmetern z är lltså en diskontinuerlig vribel som ökr i diskret steg med 1 S 1 då s ökr. Då vrje hnd är lik snnolik är z likformigt fördeld i S punkter. Då S är ungefär,5 miljoner låter jg dett stor tl gå till oändligheten. Felet som görs är högst ungefär 1 på miljonen i z, vilket får betrkts som litet då det är grundprincipern i poker som studers. En noggrnnre felnlys kommer följer i 5.1.4. Spelrns 15
händer benämnes nu z A respektive z B istället för s A och s B överllt där de förekommer. Från Definition 4..1 eller den konventionell definitionen v riemnnintegrler ser mn tt: 1 S Målfunktion övergår nu i: där γ z B 1 = γ z B = γ z B 3 = zb zb zb S, 1 S s A =1 Lösning v det infinit spelet S s B =1 dz 1, K(ρ z A i, σ z B j ) = dz, ty z A z A 1 } {{ } dz 3 j=1 ( ( + b)(ρ z A 1 + ρ z A ) ρ z A 3 )dz A + ( ( + b)ρ z A 1 (+ρ z A + ρ z A 3 ))dz A + = 1 S 1 } {{ } 1 S γ z B j σ z B j dz B, (5.1.16) z B (( + b)(ρ z A 1 + ρ z A ) ρ z B 3 )dz A, (5.1.17) z B (( + b)ρ z A 1 (ρ z A + ρ z B 3 ))dz A, (5.1.18) b(ρ z A 1 ρ z A ρ z A 3 )dz A z B (ρ z A 1 + ρ z A ) + ρ z B 3 )dz A. (5.1.19) (5.1.) För ρ z B (som nu är oändlig till ntlet) gäller tt komponentern måste vr då inte γ z j ntr sitt minimum i j, nnrs 1. Om γj z ntr sitt minimum för fler j (med z fixt) gäller tt en konvexkombintion v ρ z A j måste vr 1. Nu ntr jg tt z B så tt ρ z B >, vilket betyder tt min j ρ z B = γ z B. Speciellt gäller då γ z B 1 γ z B γ z B γ z B 1. Användnde v (5.1.18) och (5.1.19) leder till tt det för något z = z B måste gäll: ( z b ρ z A dz A z ρ z A dz A ) + z ρ z A 3 dz A. (5.1.1) Då ρ z A så låter jg z vr den övre gränsen där ρ z A >. Då gäller (5.1.1) godyckligt när z och v kontinuitetsskäl i z. Dett tillsmmns med som: b ρ z A dz A } {{ } >, ty ρ z A > för något z A enligt ntgnde ρ z A dz A = medför tt (5.1.1) likväl kn skrivs z + ρ z A 3 dz A z } {{ } Dett är ohållbrt eftersom den först termen är positiv och den ndr ickenegtiv, därför måste ntgndet vr flskt och det är lltså vist tt: ρ z A. (5.1.) Möjligheten till tt pss i vsikt tt syn är lltså eliminerd från optimllösningen. Detär nu br kvr tt bestämm j = 1 och j = 3. Då ρ z A summers till 1 kn mn genom (5.1.) se tt: Det är känt från tidigre tt ρ z A 1, ρ z A ρ z A 3 = 1 ρ z A 1. (5.1.3) 3 1. Det kn finns delintervll i [, 1] där någon v dess är 3 vr både och 1 för olik z i [, 1] så måste det v kontinuitetsskäl 3 är eller 1. Skulle det inte finns sådn punkter 3 vr både och 1 i fler punkter, vilket både strider mot tt summn v dess sk vr noll eller ett. Skulle en utv ρ z B 1, ρ z B finns punkter godtyckligt när där vrken ρ z B 1, ρ z B skulle ρ z B 1, ρ z B 16
1 och entydighetsntgndet som ligger implicit i målfunktionsnstsen. Ett sådnt tillstånd kllr jg blndtillstånd. Här måste det gäll tt: γ z B 1 = γ z B 3, då. För tt underlätt fortstt nlys definierr jg F (z B ) = γ z B 3 γ z B 1. Genom (5.1.18),(5.1.), (5.1.) och (5.1.3) får vi följnde ekvtion för F (z): F (z) = ( + b) z ρ z A 1 dz A b z ρ z A 1 dz A + I ett blndtillstånd måste lltså F (z) =, vilket leder till tt: ( + b) z ρ z A 1 dz A b Genom lgebrisk förenklingr finner mn tt: ( z ( + b) ρ z A 1 dz A z ρ z A 1 dz A + z z z (1 ρ z A 1 )dz A z. (5.1.4) (1 ρ z A 1 )dz A =. ρ z A 1 dz A ) + (1 z) =. (5.1.5) Nu betrktr jg två blndtillstånd z och z. Om mn nvänder (5.1.5) för båd dess z och subtrherr dem från vrndr finner mn: ( + b) z z 1 (z z ) ρ z A 1 dz A (z z ) = z z ρ z A 1 dz A = + b Uttryckt i ord betyder (5.1.6) tt medelvärdet ρ z A 1 melln z och z är (5.1.6) +b. Det gäller lltså vrken tt 1 1 i intervllet [z, z ] lltså är ett z-värde melln dess också ett blndt tillstånd. ρ z A 1, eller ρ z A Nu låter jg z, z vr ändpunkter i det intervllet v blndde punkter och tt [z, z ] innehåller en tredje punkt. Då måste (5.1.6) också gäll för denn punkt. Fortsätter mn tt let efter ny punkter i intervllet ser mn tt (5.1.6) måste gäll för smtlig punkter i intervllet och därför måste ρ z A +b i hel det blndde tillståndet. Dett följer v tt vi nnrs inte kn h +b som medelvärde för ρz A 1 melln två godtycklig punkter i [z, z ]. Det är emellertid inte bevist tt [z, z ] innehåller en punkt till, men om det finns så gäller lltså tt ρ z A 1 = +b för dett z A. Det inte är någon motsättning tt nt dett även om [z, z ] är ett tomt intervll. Om det inte är så leder det till någon motsättning senre. Det är lltså vist tt om det existerr något blndt tillstånd överhuvudtget för fler än ett z är ρ z A 1 = +b v blndde tillstånd för z och z. Det gäller därmed tt: 1 = i hel det blndde tillståndet. Nu kllr jg den undre respektive övre gränsen i intervllet ρ z A 1 = + b, z [z, z ]. (5.1.7) Nu gäller det tt vis tt det finns blndde tillstånd. Finns de inte är ntingen ρ z A 1 eller ρ z A 1 1 för ll z i [,1]. Om ρ z A 1 ρ z A 3 1 så får mn från (5.1.18) och (5.1.) med z B = tt γ1 = och γ3 =, dvs. γ1 < γ3 ρ 3 = 1. Om ρ z A 1 1 ρ z A 3 så ger smm ekvtioner tt γ1 = + b och γ3 =, dvs. γ1 > γ3 ρ 1. Det måste lltså finns ett blndt tillstånd någonstns om ρ z A 1 =. Från (5.1.4) ser mn tt: F (1) = ( + b)) ρ z A 1 dz A >, eftersom det nu är uteslutet tt ρ z A 1. Av kontinuitetsskäl är F (z) > godtyckligt när z = 1. Därför är ρ z A 3 = ρ z A 1 = 1 för dess z. Då (5.1.7) gäller i hel [z, z ] så måste z < 1 eftersom ρ 1 1 = 1 +b. Det finns lltså ing blndde tillstånd för z < z A 1,eftersom F (z) >, z [z, 1] så gäller: ρ z 1 1 z z 1. (5.1.8) Nu övergår jg till tt studer nedre delen v definitionsmängden för z. Om z > så är intervllet [, z ] inte blndt och därför är ρ z A 1 eller ρ z A 1 1. Jg definierr förstderivtn v F (z) med hjälp v (5.1.5): F (z) = d ( ( z ) ) ( + b) ρ z A dz 1 dz A ρ z A 1 dz A + (1 z) = ( + b)ρ z 1. z 17