Deal or No Deal. Budgivarens hemliga formel

Relevanta dokument
Föreläsning 12: Regression

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Lektionsanteckningar 11-12: Normalfördelningen

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

LABORATION 3 - Regressionsanalys

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Matematisk statistik, Föreläsning 5

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Grundläggande matematisk statistik

Regressionsanalys av lägenhetspriser i Spånga

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Metod och teori. Statistik för naturvetare Umeå universitet

10.1 Enkel linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Statistik B Regressions- och tidsserieanalys Föreläsning 1

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Medicinsk statistik II

FÖRELÄSNING 8:

Tentamen i Matematisk statistik Kurskod S0001M

F13 Regression och problemlösning

Stokastiska processer med diskret tid

Finansiell statistik. Multipel regression. 4 maj 2011

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Föreläsning 12: Linjär regression

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Industriell matematik och statistik, LMA /14

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift a b c d e Vet inte Poäng

F3 Introduktion Stickprov

LABORATION 3 - Regressionsanalys

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 2 multipel linjär regression

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i Matematisk statistik Kurskod S0001M

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Laboration 4 R-versionen

, s a. , s b. personer från Alingsås och n b

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Regressions- och Tidsserieanalys - F1

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Sänkningen av parasitnivåerna i blodet

Härledning av Black-Littermans formel mha allmänna linjära modellen

Föreläsning 13: Multipel Regression

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Korrelation och autokorrelation

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

F9 Konfidensintervall

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F7

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Matematisk statistik för D, I, Π och Fysiker

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotestestning och repetition

Statistisk försöksplanering

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

MVE051/MSG Föreläsning 14

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Transkript:

Handelshögskolan Statistik C, Uppsats 15hp VT-2016 Handledare: Niklas Karlsson Examinator: Nicklas Pettersson Deal or No Deal Budgivarens hemliga formel Vafa Nasirova (92-09-25) Henric Nyström (94-11-25)

Sammanfattning Uppsatsen behandlar en analys av tv-programmet för ett spel om pengar som heter Deal or No Deal. Programmet går ut på att en tävlande väljer ut en väska bland ett visst antal väskor utan att titta i den. Spelarens väska behålls tills spelet är slut. Väskorna innehåller olika belopp. Under spelets gång väljer sedan spelaren att öppna de övriga väskorna och därmed utesluts de från spelet. Efter ett visst antal borttagna väskor får spelaren ett bud från en anonym bankir. Om budet accepteras är spelet över och spelaren vinner då den summan. Men om budet nekas fortsätter spelaren att öppna väskor tills ett nytt bud ges. Om alla bud nekas får spelaren öppna sin egen väska och vinner prissumman i den valda väskan. Men vet bankiren i förväg beloppet som ligger i spelarens väska? Tar bankiren hänsyn till denna information när han beräknar budet? Vilka andra faktorer spelar roll i budets värde? Med hjälp av multipel regressionsanalys har vi försökt besvara dessa frågor. Vi har analyserat totalt 9 program från två versioner, svenska Deal or No Deal och turkiska Var Mısın Yok Musun?. Med hjälp av regressionsanalys och metoden backward elimination har vi funnit två separata modeller för de två olika versionerna. Gemensamt för dessa modeller är att spelarens eget väskvärde inte påverkade bankirens bud. Detta tyder på att bankiren antingen inte känner till vad som finns i väskan eller att han inte tar hänsyn till denna information vid uträkning av bud. Den svenska modellen är en enkel linjär modell som förklarar budet som en funktion av de återstående väskornas medelbelopp. Budet ökar också linjärt med varje omgång. Det turkiska programmet tycks följa en annorlunda modell, där budet är en funktion av fyra variabler, varav två är interaktionsvariabler. Dessa variabler är de återstående väskornas medelbelopp, standardavvikelse och interaktionsvariabler mellan spelomgång och återstående väskornas medelbelopp respektive medelbelopp i kvadrat.

Innehållsförteckning 1 Inledning... 1 1.1 Disposition... 2 2 Bakgrund... 3 2.1 Spelets struktur... 3 2.2 Tidigare studier... 7 3 Metod... 8 3.1 Data... 8 3.2 Teori... 9 3.2.1 Expected utility... 9 4 Modell... 15 5 Resultat och analys... 19 5.1 Slutsats... 25 6 Diskussion... 26 7 Referenser... 27

1 Inledning Spel om pengar har varit en viktig del av människans liv i tusentals år. Tidiga egyptiska, mellanamerikanska, kinesiska och hinduiska civilisationer hade redan uppfunnit en rad olika spel om pengar. Enligt Folkhälsomyndigheten (2014) startade den moderna spelhistorien i Sverige 1897. Därefter har olika spel och lotterier fortsatt att utvecklas och sprida sig. Förutom att roa oss och ge oss chansen att vinna pengar kan spel även fungera undervisande på olika sätt. Vissa spel kan hjälpa oss att vidga våra begrepp samt träna våra förmågor och färdigheter. Därmed kräver spel ibland både tur och skicklighet. Många av er har säkert sett eller hört talas om tv-programmet Deal or No Deal. I programmet spelas ett spel om pengar som kräver både tur och skicklighet. Spelets regler kan variera beroende på version och land det spelas i. Den ursprungliga versionen av programmet och även den svenska versionen går ut på att en tävlande väljer ut en väska bland 26 numrerade väskor. I den svenska versionen innehåller väskorna dolda belopp mellan 1 krona och 10 miljoner kronor. Vilket belopp som finns i väskan som spelaren väljer i början av spelet avslöjas inte förrän spelet är slut. I fortsättningen genom hela spelet får spelaren öppna ett visst förutbestämt antal väskor för varje spelomgång och därefter får spelaren ett bud från en anonym bankir. Varje redan öppnad väska utesluts från spelet och därmed tas även det tillhörande beloppet bort från spelet. Budet som spelaren får beror då på de belopp som återstår i spelet. När spelaren får ett bud kan den välja att antingen tacka ja till budet och avsluta spelet eller tacka nej och fortsätta spela. Om spelaren tar budet spelas ett låtsasspel och bankiren ger falska bud för att se hur mycket pengar spelaren hade kunnat vinna ifall spelet fortsatte. Om spelaren tackar nej till budet, fortsätter spelet och samma process upprepas tills det bara är två väskor kvar. Spelaren får då ett sista bud och kan välja att ta budet eller gå hem med den prissumma som finns i hens egen väska. Bankiren försöker helt enkelt att köpa den tävlandes väska till ett lägre pris än vad den innehåller och den tävlande försöker givetvis vinna så stor summa som möjligt. Syftet med denna rapport är att försöka modellera algoritmen som bankiren använder vid beräkning av bud i den turkiska och svenska versionen av programmet. 1

1.1 Disposition I kapitel 2 redogörs bakgrund för spelet samt spelets struktur och tidigare gjorda studier. Vidare i kapitel 3 beskrivs hur datainsamlingen har gått till, vilken metod som har används samt vilken teori de ingående variablerna grundas på. I kapitel 4 beskrivs den använda modellen samt de ingående variablerna. I kapitel 5 presenteras resultat samt slutsats och analys av den gjorda undersökningen. Uppsatsen avslutas med diskussion av det gjorda arbetet i kapitel 6. 2

2 Bakgrund Den ursprungliga versionen av programmet hette Miljoenejacht och hade premiär i Nederländerna den 25:e november 2000. Därefter spred sig programmet över 81 olika länder i världen. Den svenska versionen av programmet innehåller 26 väskor med belopp mellan 1 krona och 10 miljoner kronor och den turkiska versionen innehåller 24 boxar med belopp mellan 1 turkisk lira och 500 000 turkiska lira. I den svenska versionen får spelaren totalt 9 bud från bankiren. I den turkiska versionen som vi valde får spelaren totalt 7 bud. Som det nämndes tidigare ges sista budet när det bara är två väskor kvar. Spelaren kan se alla möjliga belopp som väskorna innehåller på belopp-tablån som visas i skärmen på programmet. Om spelaren i en viss omgång öppnar många små belopp blir budet högre än om spelaren öppnar höga belopp. Genom att kolla på tablån får spelaren en gissning om vad budet kan vara och hur många höga belopp det finns kvar. På så sätt kan spelaren bättre resonera om det är rimligt att tacka ja till budet eller fortsätta spela. Till sin hjälp har spelaren även en bekant som den kan kommunicera med. 2.1 Spelets struktur Nedan följer tabeller som beskriver belopp-tablån i de olika spelen, spelformatet i de olika spelomgångarna samt ett exempel på ett spel med både den svenska och den turkiska versionen. Tabell 1. Beloppen (kr) i den svenska versionen. Tablån är samma i alla spel. 1 2 5 10 20 50 100 200 1000 2500 5000 7500 10 000 50 000 100 000 200 000 300 000 400 000 500 000 750 000 1 000 000 2 500 000 5 000 000 7 500 000 10 000 000 3

I den turkiska versionen av programmet fanns det tre olika varianter. Tablån varierade i de olika varianterna. Beloppen som visas är i turkisk lira. Tabell 2. Beloppen i den första varianten av den turkiska versionen. I den första varianten fanns det bara tre stycken av det största beloppet, 500 000 lira. 1 2 5 10 25 50 100 200 300 400 500 750 1000 5000 10 000 15 000 25 000 50 000 100 000 125 000 150 000 500 000 500 000 500 000 Tabell 3. Beloppen i den andra varianten. I den andra varianten fanns det däremot fem stycken av det största beloppet. 1 2 5 10 25 50 100 200 300 400 500 750 10 000 20 000 30 000 40 000 50 000 100 000 150 000 500 000 500 000 500 000 500 000 500 000 Tabell 4. Beloppen i den tredje varianten. I den tredje varianten fanns det också bara tre stycken av det största beloppet. Men denna variant skiljer sig från första varianter genom att det finns fler större belopp i denna variant. 1 2 5 10 25 100 200 300 400 500 750 10 000 20 000 30 000 40 000 50 000 50 000 50 000 150 000 200 000 250 000 500 000 500 000 500 000 4

I den svenska versionen öppnar spelaren väskor enligt schemat som presenteras i Tabell 5 nedan. Efter varje omgång får spelaren ett bud som antingen accepteras eller nekas. Totala antalet bud för varje spel är nio oavsett om spelaren accepterar budet i de tidigare omgångarna eller om spelaren fortsätter att spela tills dess egen väska kan öppnas. Däremot är buden som ges efter spelets slut falska bud. Tabell 5. Regler för spelomgång i den svenska versionen Omgång 1 2 3 4 5 6 7 8 9 Antal väskor att öppna 6 5 4 3 2 1 1 1 1 I den turkiska versionen öppnar spelaren fem väskor i den första omgången. I de resterande omgångarna öppnar spelaren tre väskor tills det bara är två väskor kvar. Även här får spelaren ett bud efter varje omgång. Totala antalet bud för varje spel är sju oavsett om spelaren accepterar budet i de tidigare omgångarna eller om spelaren fortsätter att spela tills hens egen väska kan öppnas. Däremot är buden som ges efter spelets slut falska bud även i denna version. Tabell 6. Regler för spelomgång i den turkiska versionen Omgång 1 2 3 4 5 6 7 Antal väskor att öppna 5 3 3 3 3 3 2 Nedan följer exempel på två genomförda spel. Tabell 7 redovisar ett genomfört spel från den svenska versionen och Tabell 8 redovisar ett genomfört spel från den turkiska versionen. I tabellen redovisas väskvärden som öppnas i respektive omgång, budet som bankiren erbjuder, beloppet som finns i spelarens egen väska samt besluten som spelaren tar. 5

Tabell 7. Exempel på ett spel med den svenska versionen. Från tabellen kan vi ses att spelaren nekade alla bud och vann 200 kronor. Omgång Öppnade väskor Budet i Resultat omgången (kr) 1 750 000, 7500, 300 000, 1, 2, 10 202 300 Nekat 2 1 000 000, 2500, 2 500 000, 1000, 340 600 Nekat 20 3 400 000, 100 000, 5 000 000, 500 590 000 Nekat 4 7 500 000, 50 000, 100 662 800 Nekat 5 500 000, 10 000 000 21 200 Nekat 6 50 29 800 Nekat 7 200 000 2900 Nekat 8 10 000 1500 Nekat 9 5 2600 Nekad Sista väskan 5000 Tävlarens väska 200 Tabell 8. Exempel på ett spel med den turkiska versionen. Spelaren accepterade budet i omgång 6 på 67 000 kronor. Bud 7 är ett falskt bud. Omgång Öppnade väskor Budet i Resultat omgången (turkisk lira) 1 500, 125 000, 15 000, 1000, 25 6000 Nekat 000 2 300, 25, 1 17 000 Nekat 3 2, 200, 750 45 000 Nekat 4 500 000, 5, 10 000 55 000 Nekat 5 100 000, 500 000, 50 000 37 000 Nekat 6 5000, 10, 400 67 000 Accepterat 7 500 000, 50 44 000 (falskt bud) Sista väskan 100 Tävlarens väska 150 000 6

2.2 Tidigare studier Det finns tidigare studier som undersöker spelet Deal or No Deal och det finns även flera teorier om algoritmen som används för att räkna ut det bud som banken erbjuder. Naturligtvis innehas den riktiga algoritmen av några få personer runt om i världen och hålls i hemlighet. Dock har några matematikälskare lyckats approximera denna algoritm med olika grader av noggrannhet. En statistisk analys av den amerikanska versionen av spelet utfördes av matematikern Daniel Shifflet (2011). Resultatet av hans analyser publicerades i Ohio Journal of School Mathematics under namnet Is Deal or No Deal cheating its contestants? Modellen som Shifflet använde var en linjär regressionsmodell med budet som beroende variabel. Budet visade sig vara beroende av väntevärdet av de återstående väskvärdena. Han kom fram till att banken erbjuder en procentuell andel av väntevärdet av de återstående väskvärdena. Han kom även fram till att denna andel är låg vid den första omgången och ökar successivt i följande omgångar. Även i den version av programmet som Shifflet undersökte fick spelarna fortsätta spela falska spel ifall de hade tagit bankens bud i tidigare omgångar än den sista. Det var först och främst dessa falska bud Shifflet ville undersöka. Därför låg den stora vikten av hans analyser på en annan frågeställning. Shifflet misstänkte att de falska buden som bankiren erbjöd efter ett avslutat spel var högre än de riktiga buden som han i vanliga fall skulle ha erbjudit. Den statistiska undersökningen som han genomförde visade att så var fallet. Han misstänker att en av anledningarna till detta kan vara att öka stressen och intresset för tittarna, genom att få de att tro att spelaren förlorade mer pengar än vad hen gjorde i verkligheten. Det finns även en del andra personer som har resonerat kring budet som banken erbjuder utan att ha utfört några statistiska undersökningar. En av dem är användaren av bloggen NSLog(), George Jones (2006). Enligt honom var budet baserat på följande formel: bankens erbjudande = medelvärdet omgång/10 Även han påstår att det används en linjär modell vid beräkning av budet och att budet är beroende av väntevärden och spelomgångar. 7

3 Metod Först och främst separerade vi datamaterialet för den svenska och turkiska versionen. Sedan genomförde vi en så kallad backward elimination för att komma fram till den slutliga regressionsmodellen för varje version separat. Backward elimination innebär att man ställer upp en regressionsmodell där alla kandidatvariabler får vara med i modellen från början. Man bestämmer en signifikansnivå och tar sedan successivt bort de variabler som är minst signifikanta, tills man kommer fram till en modell där alla variabler är signifikanta på den valda nivån. En ny regressionsmodell skattas vid varje borttagen variabel. För att skatta våra modellers parametrar använde vi oss av minstakvadratmetoden. Det valda kriteriet för backward elimination var en signifikansnivå på 5 %. I och med att vi hade ett litet datamaterial testade vi om de slutliga modellernas residualer var normalfördelade samt kontrollerade även homoskedasticitet i modellerna. För att kunna dra giltiga slutsatser om de skattade parametrarna i modellerna krävs att residualerna i respektive modell är normalfördelade samt att de har konstant varians. Dessa antaganden kontrollerades med hjälp av histogram över residualerna, spridningsdiagram med residualer som beroende variabel och predikterade värden som förklarande variabel samt ett Shapiro-Wilk-test och Breusch- Pagan test. 3.1 Data Vi samlade in data genom att titta på 11 tidigare publicerade avsnitt av programmet, varav 6 var svenska och 5 var turkiska. Alla bud, spelomgångar samt väskvärden noterades. Datamaterialet kontrollerades sedan flera gånger och all data som kunde missleda regressionen togs bort. Vi tog bort två spel från den turkiska versionen. I en av dessa spel fick vi inte reda på spelarens eget väskvärde och det andra spelet verkade inte tillförlitligt då spelaren var en kändis som spelade för välgörenhet. Anledningen till att vi tog bort spelet där vi inte visste spelarens eget väskvärde var att vi inte skulle kunna testa ifall bankiren tar hänsyn till väskvärdet i sina beräkningar av bud eller inte. 8

Vi tog även bort alla falska bud i och med att vi misstänkte att dessa bud kunde vara större än de riktiga buden som skulle ges om spelet hade fortsatt. Även tidigare gjorda studier stödjer våra misstankar. Till slut hade vi kvar totalt 38 bud i den svenska versionen och 21 bud i den turkiska versionen. Alla belopp i datamaterialet för den turkiska versionen approximerades från turkisk lira (YTL) till svenska kronor (SEK), med en approximativ kurs på 3 SEK per YTL. Med hjälp av den insamlade datan genererade vi variabelvärden som senare skulle användas i modellen. Dessa variabler beskrivs mer ingående i kapitel 4. 3.2 Teori Det är inte sällan vi hamnar i situationer där vi behöver välja mellan en rad olika handlingar. Om vi hamnar i en situation som vi inte är vana vid eller behöver göra ett avgörande val, vill vi oftast göra ett rationellt val. För att kunna lösa sådana beslutsproblem måste vi då på något sätt värdera de olika alternativen vi kan välja bland. I detta fall ska vi då ha våra känslor i åtanke och fundera på hur besvikna vi skulle kunna vara över en förlust och hur glada vi skulle vara för motsvarande vinst. En teori som behandlar just detta och kan hjälpa oss att handla i sådana svåra situationer är spelteori. Teorins syfte är att beskriva aktörers beteenden i olika samspel. Idén är att aktörernas beteenden ska vara fördelaktiga för alla parter. De grundläggande begreppen inom teorin är att maximera vinst samt minimera förlust. Det är även viktigt att aktörerna har motstridiga intressen. Denna teori kan kopplas till Deal or No Deal. I programmet måste bankiren agera på ett sätt som gynnar både hen själv och spelaren. Samtidigt vill spelaren maximera sin vinst, medan bankiren vill minimera sin förlust. Bankirens kompromiss kan förklaras med hjälp av teorin expected utility. Expected utility säger att en aktör, beroende på personlighet, kan bedöma en situation annorlunda beroende på risk. 3.2.1 Expected utility Teorin säger att en individ tar risker i åtanke medan olika situationer värderas. Hur olika personer uppfattar risker är beroende av deras personlighet. Olika individer kan vara högrisktagare, riskneutrala eller riskaverta. Högrisktagare är personer som oftast tar stora risker. 9

Riskneutrala personer värderar situationer utan att ta hänsyn till risker. Riskaverta personer är inte villiga att ta för stora risker. Vi kan anta att de flesta spelare i Deal or No Deal är medelinkomsttagare och att många är ute efter att vinna pengar för ett visst ändamål, därmed kan vi även anta att majoriteten av alla tävlande då är riskaverta. Varje individs agerande i en situation med risk kan beskrivas med hjälp av en funktion som kallas nyttofunktion. Nyttofunktionen för en viss individ beskriver en värdering av olika situationer, kallad nytta, som är beroende av vinst. Funktionens utseende beror på individens preferenser, men den är alltid ökande med avseende på vinst. Nyttan för en vinst x betecknas U(x). Nyttofunktionen är inte bara begränsad till en bestämd vinst. Vi kan också beräkna den förväntade nyttan av ett spel. Ett spel definieras som ett scenario där en spelare kan vinna eller förlora olika summor med en viss sannolikhet för varje summa. Om sannolikheten för att vinna en viss summa är 100 % kan den kallas en säker vinst. Den förväntade nyttan av ett spel X med n vinster beskrivs med denna formel: E(U(X)) = p i U(x i ) n i=1 Där x i är vinst i och p i är sannolikheten att få vinst i, där i = 1,, n. Nyttofunktionen för en riskavert person är konkav. Detta innebär att förändringen i nytta med avseende på vinst är lägre då de ursprungliga tillgångarna redan är höga. För att kunna välja relevanta beroende variabler till modellen för beräkning av bud kollar vi närmare på nyttofunktionen för riskaverta personer. I grafen nedan illustreras ett exempel på en sådan nyttofunktion, med avseende på den potentiella vinstsumman v. Grafen visar även nyttan av den förväntade vinsten samt den förväntade nyttan av tre olika spel. Alla dessa spel har två olika möjliga vinster. De förväntade vinsterna i de olika spelen varierar, men standardavvikelsen är densamma. De förväntade vinsterna är 50, 150 och 250. Sannolikheterna för de två möjliga vinsterna i alla tre spel är 50 %. 10

Figur 1. Graf över nyttan av den förväntade vinsten samt den förväntade nyttan av tre spel med avseende på potentiell vinst. Kurvan för nyttofunktionen är anpassad till en riskavert individ. Vi kan se att nyttan av spelens förväntade vinst är större än spelens förväntade nytta. Vi kan därmed definiera en säker vinst som är lägre än den förväntade vinsten men vars nytta fortfarande är större än den förväntade nyttan av spelet. Den förväntade nyttan av spelet närmar sig dock nyttan av den förväntade vinsten i samband med att denna förväntade vinst ökar. Differensen mellan en säker vinst och spelets förväntade vinst måste då minska för att en spelare ska kunna bedöma den säkra vinstens nytta som större. 11

I Figur 2 illustreras differensen mellan den förväntade vinsten av ett hypotetiskt spel X och den minsta säkra vinst vars nytta är lika stor som spelets förväntade nytta. Kurvan y1 visar spelets förväntade vinst E(X) och kurvan y2 visar den säkra vinstsumman. Standardavvikelsen av X är fixt, men väntevärdet varierar. Figur 2. Graf över den minsta säkra vinsten vars nytta är lika stor som den förväntade nyttan av ett spel X (y2) samt den förväntade vinsten av X (y1), båda med avseende på E(X). Från grafen kan vi se att den förväntade vinsten alltid är högre än den säkra vinsten, men att kurvorna närmar sig varandra då den förväntade vinsten ökar. Vi kan även se att den säkra vinsten är negativ då E(X) är nära noll. 12

I Figur 3 illustreras nyttofunktionen för en riskavert person med avseende på potentiell vinst. Grafen visar även tre spel med ett fixt väntevärde på 150, men med olika standardavvikelser. Spelens standardavvikelser är 50, 100 och 150. I grafen illustreras den förväntade nyttan av varje spel samt nyttan av spelens förväntade vinst. Figur 3. Graf över nyttan av väntevärdet samt den förväntade nyttan av tre spel med avseende på potentiell vinst. Kurvan för nyttofunktionen är anpassad till en riskavert individ. I grafen kan man se att differensen mellan ett spels förväntade nytta och nyttan av dess förväntade vinst ökar då standardavvikelsen ökar. Vi kan även se att differensens ökar exponentiellt. Den förväntade vinsten av ett spel X kommer då att alltid vara större än den minsta säkra vinsten vars nytta är densamma som den förväntade nyttan av spelet. Denna säkra vinst kommer också att sjunka exponentiellt. 13

Figur 4. Graf över den minsta säkra vinsten vars nytta är densamma som den förväntade nyttan av ett spel X (y2) samt den förväntade vinsten av X (y1), båda med avseende på spelets standardavvikelse σ. Om vi kopplar dessa härledningar till Deal or No Deal kan vi konstatera att bankiren kan minimera sin förväntade förlust genom att erbjuda ett bud, vilket kan tolkas som en säker vinst, vars värde är lägre än den förväntade vinsten då spelaren väljer att spela vidare, men vars nytta är större än nyttan av att spela vidare. Med hjälp av dessa härledningar kan vi därmed motivera valen av variablerna i regressionsmodellerna. Härledningarna kommer även att ge hypoteser om modellernas parameterskattningar. 14

4 Modell Med hjälp av dels teoribeskrivning som genomfördes i föregående kapitel och dels tidigare gjorda studier konstaterade vi att nedanstående variabler ska ingå i modellen vid uträkning av budet som bankiren erbjuder i spelet Deal or No Deal. Även en extra variabel, spelarens eget väskvärde, har inkluderats till modellen. Anledningen till detta är att testa om bankiren känner till spelarens väskvärde och därmed kanske tar hänsyn till denna information vid beräkning av budet. Den ursprungliga modellen var då följande: bud = β 0 + β 1 e + β 2 e_kvdr + β 3 stdav + β 4 stdav_kvdr + β 5 vv + β 6 omgn_e + β 7 omgn_e_kvdr + β 8 omgn_stdav +β 9 omgn_stdav_kvdr + β 10 omgn_vv + ε Beroende variabel: bud: budet som bankiren ger efter varje avslutad omgång Budet i spelet Deal or No Deal kan tolkas som en säker vinst. Förklarande variabler: e: medelbeloppet av alla kvarvarande väskvärden Då spelarens väskvärde redan är bestämt kan det vara svårt att beskriva situationen som ett slumpmässigt försök. Dock kan det värde som väskan innehåller tolkas som en stokastisk variabel från spelarens perspektiv, eftersom hen inte känner till väskans värde. Denna hypotetiska variabel kan anta alla n väskvärden som fortfarande ingår i spelet då ett bud ges, och chansen att variabeln antar dessa värden är p = 1/n för alla värden. Vi kan då definiera slumpvariabeln som X= belopp i den väska som väljs av spelaren i början av spelet. De kvarvarande väskvärdenas medelbelopp kan därmed tolkas som den stokastiska variabelns väntevärde. Därmed kommer vi i fortsättningen benämna medelbeloppet som väntevärdet. 15

Väntevärdet beräknas med följande formel: n E(X) = 1 n x i i=1 Tidigare studier visar att parametern β 1 är noll, men vi väljer att testa en modell med denna parameter för att kunna tillåta en konstant effekt av väntevärdet på budet oavsett av vilken omgång spelaren är i. Vi har inga förväntningar om parametern β 1. e_kvdr: kvadraten av väntevärdet av alla kvarvarande väskvärden I teoriavsnittet har vi med hjälp av expected utility härlett att väntevärdet har en exponentiellt avtagande effekt på budet. Vi har approximerat denna avtagande effekt som en kvadratisk effekt. Vi förväntar oss därmed att parametern β 2 är negativ. stdav: standardavvikelsen av alla kvarvarande väskvärden, som beräknas enligt följande formel: σ= x 2 P(X = x) (E(X)) 2 där x är kvarvarande väskvärden efter varje omgång och P(X = x) är sannolikheten för att dessa väskor dras. I och med att alla väskor har lika stor sannolikhet att dras kan formeln ändras till följande: 2 σ = x 2 /n ( x/n) där n är antal kvarvarande väskor efter varje omgång. Vi har inga förväntningar på parametern β 3. I föregående kapitel såg vi att budet minskar exponentiellt i förhållande till spridningen, därmed tror vi inte att spridningens negativa effekt har en linjär komponent. 16

stdav_kvdr: kvadraten av standardavvikelsen av kvarvarande väskvärden I teoriavsnittet har vi med hjälp av expected utility härlett att standardavvikelsen har en exponentiellt avtagande effekt på budet. Vi har approximerat denna avtagande effekt som en kvadratisk effekt. Vi förväntar oss att parametern β 4 är negativ. Den ökade spridningen medför en ökad risk för den tävlande, varför den tävlande borde acceptera ett lägre bud än om spridningen var lägre. vv: spelarens eget väskvärde Vi har inkluderat denna variabel för att kontrollera om värdet som ligger i spelarens väska har en effekt på buden, vilket skulle ge misstankar om att bankiren känner till spelarens väskvärde. Vi misstänker att parametern β 5 kan vara positiv, då vi tror att bankiren skulle öka sitt bud ifall spelarens väskvärde var stort, för att undvika att spelaren vinner sitt eget väskvärde. omgn_e: en interaktionsvariabel mellan spelomgång och väntevärde Vi förväntar oss att parametern β 6 är signifikant positiv, då tidigare gjorda studier visar att budet är beroende av väntevärde betingat på omgång i spelet. omgn_e_kvdr: en interaktionsvariabel mellan spelomgång och väntevärde i kvadrat Vi har inkluderat denna variabel i modellen för att tillåta en ökning av väntevärdets avtagande effekt på budet betingat på spelomgång. Vi förväntar oss att parametern β 7 är negativ. omgn_stdav: en interaktionsvariabel mellan spelomgång och standardavvikelsen Vi har inkluderat denna variabel i modellen för att tillåta en ökning av standardavvikelsen negativa effekt på budet betingat på spelomgång. Anledningen till detta är att vi har betingat de andra variablerna på spelomgång och misstänker då att även standardavvikelsen kan vara betingat på spelomgång och vill testa detta. Vi förväntar oss ingenting av parametern β 8. omgn_stdav_kvdr: en interaktionsvariabel mellan spelomgång och standardavvikelse i kvadrat Vi har inkluderat denna variabel i modellen för att tillåta en ökning av standardavvikelsens exponentiella effekt. Vi förväntar oss att parametern β 9 är negativ. 17

omgn_vv: en interaktionsvariabel mellan spelomgång och spelarens väskvärde Vi har inkluderat denna variabel i modellen för att tillåta en ökning av väskvärdets effekt på budet betingat på spelomgång. Vi misstänker att parametern β 10 kan vara positiv, med samma skäl som för parametern β 5. ε: störningsterm 18

5 Resultat och analys Genom att använda backward elimination hittade vi de mest lämpade modellerna för både den turkiska och den svenska versionen av spelet. Tabell 9 visar den slutliga modellen för den turkiska versionen av programmet. Konfidensintervallen beräknas med 95 % konfidensgrad. Tabell 9. Resultat av regressionen av den turkiska modellen. bud Koefficienter Medelfel t-värde p-värde Konf. intervall e_kvdr 7,96*10-4 1,79*10-4 4,45 0,000 [4,16*10-4 ; 1,18*10-3 ] omgn_e 0,18 0,025 7,29 0,000 [0,13;0,24] omgn_e_kvdr -2,65*10-7 6,29*10-8 -4,22 0,001 [-4*10-7 ;-1,32*10-7 ] omgn_stdav_kvdr -3,98*10-5 1,33*10-5 -3,00 0,009 [-6,8*10-5 ;-1,17*10-5 ] intercept -66537 22409-2,97 0,009 [-114041;-19033] Modellens förklaringsgrad R 2 0,929 Justerad R 2 0,911 Alla parameterskattningar uppfyller våra förväntningar som vi hade vid modellbygget. Vi ser att modellens alla parameterskattningar är signifikant skilda från noll. Även förklaringsgraden och den justerade förklaringsgraden är höga. I tabell 10 visas en jämförelse mellan den reducerade modellen och den fulla modellen samt univariata modeller för varje enskild variabel. Tabellen inkluderar parameterskattningar, t- värden och justerade förklaringsgrader för respektive modeller. 19

Tabell 10. Regression av univariat, full samt reducerad modell av den turkiska versionen. Univariat modell Full Reducerad Koeff. t-värde 2 R adj Koeff. t-värde Koeff. t-värde omgn 21,86 5,19 0,56 125,72 0,28 stdav -0,03-0,29-0,05 3,73 0,28 e 0,32 2,61 0,23-0,66-0,16 vv -0,06-0,52-0,04-0,01-0,08 omgn_e 0,06 8,80 0,79 0,21 0,32 0,18 7,29 omgn_stdav 0,05 5,51 0,59-0,44-0,23 omgn_vv 0,04 4,10 0,44-7,2*10-3 -0,16 e_kvdr 4,95*10-4 2,98 0,28 2,1*10-3 0,35 7,96*10-4 4,45 omgn_e_kvdr 1,05*10-4 5,92 0,63-3,59*10-4 -0,37 2,65*10-7 -4,22 stdav_kvdr -1,59*10-5 -0,13-0,05 3,57*10-3 -0,30 omgn_stdav_kvdr 5,91*10-5 3,74 0,39 3,56*10-4 0,21-3,98*10-5 -3,00 intercept -948003-0,30-66537 -2,97 R adj =0,8638 R adj =0,9113 För att kunna säkerställa att inferensen av regressionsmodellerna har en viss grad av validitet krävs först och främst att residualerna i respektive modell är normalfördelade samt att residualerna har konstant varians. Det första antagandet kontrollerades med hjälp av histogram över residualer samt ett Shapiro-Wilk-test. Från Figur 5 kan vi se att residualerna i den turkiska modellen verkar vara normalfördelade. Även Shapiro-Wilk-testet stöder detta. Testets p-värde blev 0.93 (>0,05), vilket gör att vi inte kan förkasta nollhypotesen att stickprovet är draget från en normalfördelning. 20

Figur 5. Histogram över residualer i den turkiska modellen. Antagandet om homoskedasticitet kontrollerades med hjälp av spridningsdiagram som visas i figur 6. I och med att diagrammet inte visar tydligt om residualernas varians är konstant eller inte gör vi även ett Breusch-Pagan test för heteroskedasticitet. Testet gav ett p-värde på 0,53 (>0,05) vilket gör att vi inte kan förkasta nollhypotesen att residualernas varians är konstant. Detta ger ett starkare stöd för modellen. 21

Figur 6. Spridningsdiagram över residualer och predikterade värden i den turkiska modellen Tabell 11 visar den slutliga modellen för den svenska versionen av programmet. Konfidensintervallen beräknas med 95 % konfidensgrad. Tabell 11. Resultat av regressionen för den svenska modellen bud Koefficienter Medelfel t-värde p-värde Konf. intervall omgn_e 0,110 0,005 23,86 0,000 [0,101;0,119] intercept -19174 16776-1,14 0,261 [-53197;14849] Modellens 0,941 förklaringsgrad R 2 Justerad R 2 0,939 I den svenska modellen har vi bara en signifikant förklarande variabel, väntevärdet av kvarvarande väskvärden betingat på spelomgång. Interceptet saknar signifikans i denna modell. Modellen har hög förklaringsgrad samt hög justerad förklaringsgrad. 22

I tabell 12 visas en jämförelse mellan den reducerade modellen och den fulla modellen samt univariata modeller för varje enskild variabel. Tabellen inkluderar parameterskattningar, t- värden och justerade förklaringsgrader för respektive modeller. Tabell 12. Regression av univariat, full samt reducerad modell av den svenska versionen. Univariat modell Full Reducerad Koeff. t-värde 2 R adj Koeff. t-värde Koeff. t-värde omgn 11,57 0,55-0,02-4,33-0,26 stdav 0,12 3,89 0,28-0,29-0,65 e 0,29 5,40 0,43 0,92 0,34 vv -0,09-0,61-0,02 0,11-0,13 omgn_e 0,11 23,86 0,94 0,18 0,33 0,11 23,86 omgn_stdav 0,06 14,90 0,86 0,11 0,35 omgn_vv -0,02-0,56-0,02 0,03 0,24 e_kvdr 1,66*10-4 5,87 0,47 3,77*10-4 -0,74 omgn_e_kvdr 5,33*10-5 12,07 0,79 7,85*10-5 0,65 stdav_kvdr 3,71*10-5 4,14 0,30 1,00*10-4 1,05 omgn_stdav_kvdr 1,54*10-5 9,25 0,69 2,65*10-5 -0,60 intercept 32952 0,30-19174 -1,14 R adj =0,9325 R adj =0,9389 Antagandet om normalfördelning kontrollerades med hjälp av histogram över residualerna. Från Figur 7 kan vi se att residualerna i den svenska modellen inte verkar vara normalfördelade. Även Shapiro-Wilk-testet stöder detta, då testets p-värde är 0,014 (<0,05). 23

Figur 7. Histogram över residualer i den svenska modellen. Antagandet om homoskedasticitet kontrollerades med hjälp av spridningsdiagram som visas i figur 8. I och med att diagrammet inte visar tydligt om residualernas varians är konstant eller inte gör vi även ett Breusch-Pagan test för heteroskedasticitet. Testet gav ett p-värde på 0,0001 (<0,05) vilket gör att vi kan förkasta nollhypotesen att residualernas varians är konstant. Figur 8. Spridningsdiagram över residualer och predikterade värden i den svenska modellen. 24

5.1 Slutsats Som vi nämnde tidigare är alla parametrar i respektive modell signifikanta. Modellernas variabler kan motiveras med tidigare gjorda studier samt teorin expected utility. Även förklaringsgraderna i respektive modell är höga. Den turkiska modellen uppfyller dessutom alla krav för valid inferens. Trots att residualernas varians inte är konstant samt att residualerna inte är normalfördelade i den svenska modellen är parameterskattningen i modellen väldigt signifikant samt att den är i princip identisk med modellen som George Jones (2006) konstruerade för den amerikanska versionen av spelet. Parameterskattningarna bör dock tolkas med en viss grad av försiktighet. Gemensamt för dessa modeller är att analysen som har genomförts inte stöder misstanken om att bankiren kanske känner till beloppet som ligger i spelarens egen väska och därmed tar hänsyn till detta vid beräkning av bud. Därmed kan vi säga att bankiren antingen inte känner till spelarens eget väskvärde eller inte tar hänsyn till den informationen vid beräkning av budet. 25

6 Diskussion I och med att vi inte kunde hitta några tidigare gjorda studier till varken den turkiska eller svenska versionen av spelet är det svårt att diskutera rimligheten av modellernas parameterskattningar. Dock tycker vi att vi hade tillräckligt med datamaterial för att genomföra en hållbar analys. Trots att den turkiska modellen inte liknar någon annan modell kan den anses vara en god approximation, eftersom den kan motiveras med hjälp av expected utility theory som vi har nämnt tidigare. Modellen som Daniel Shifflet (2011) konstruerade visar att budet som bankiren erbjuder är beroende av väntevärdet och att denna effekt ökar linjärt med spelomgång. Han har skattat en modell där han beräknar budet som en procentuell andel av väntevärdet av kvarvarande väskvärden. Våra svenska modell kan också tolkas på liknande sätt. Även George Jones (2006) har konstruerat en modell där budet är beroende av väntevärdet av kvarvarande väskvärden betingat på spelomgång. Vi kan se att i alla spelversioner och modeller är budet först och främst beroende av väntevärdet av återstående väskvärden och att denna effekt ökar linjärt för varje ny spelomgång. Trots att vi lyckades genomföra en hållbar analys med mycket signifikanta parametrar samt höga förklaringsgrader skulle vi kunna få starkare inferenser om vi hade haft tillgång till mer datamaterial. Slutligen kan det tilläggas att det modellval som har gjorts i detta arbete inte nödvändigtvis är optimal för att besvara de frågeställningar som uppsatsen behandlar i och med att de exponentiella effekterna är approximerade till kvadratiska effekter. Vi hoppas därmed på att det finns fler studenter som skulle vara intresserade av att undersöka vidare och kanske hitta modeller som närmare approximerar spelets bud. 26

7 Referenser Folkhälsomyndigheten (2014). Svensk spelhistoria. https://www.folkhalsomyndigheten.se/spelprevention/spel-om-pengar/spelandetshistoria/svensk-spelhistoria/ [2014-03-12] George Jones (2006). Deal or no deal algorithm. http://nslog.com/2005/12/20/deal_or_no_deal_algorithm [2006-03-07] R. Shifflet, Daniel (2011). Is Deal or No Deal Cheating Its Contestants? Ohio Journal of School Mathematics, s. 5-9, nr. 63, Våren 2011 R.Varian, Hal (1984). Expected Utility. Microeconomic Analysis. New York, Norton&Company ss. 155-162 Wikipedia (2016). Deal or No Deal. https://en.wikipedia.org/wiki/deal_or_no_deal [2016-04-28] Wikipedia (2014). Deal or No Deal (Sverige). https://sv.wikipedia.org/wiki/deal_or_no_deal_(sverige) [2014-11-26] Wikipedia (2016). Stepwise regression. https://en.wikipedia.org/wiki/stepwise_regression [2016-05-14] 27