Cake-cutting. att fördela resurser på ett rättvist sätt. Ebba Lindström

Relevanta dokument
Sammanfattning Avslut Litteraturförteckning... 19

Laboration 2. Artificiell Intelligens, Ht Lärare: Christina Olsén Handledare: Therese Edvall Daniel Ölvebrink

Resträkning och ekvationer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning 4: Beslut och nytta, paradoxer

Algebra I, 1MA004. Lektionsplanering

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University

Antag att följande träd genereras i ett spelförande program om vi applicerar evalueringsfunktionen

Algoritmer, datastrukturer och komplexitet

Stokastiska processer och simulering I 24 augusti

MESI-Protokollet. Richard Elvhammar. Lund Universitet 4/12-16

Föreläsning 6: Spelteori II

TMV206: Linjär algebra

Linjär Algebra, Föreläsning 2

FULLSTäNDIGHETSAXIOMET, SATSEN OM MELLANLIGGANDE VäRDE OCH SATSEN OM STöRSTA OCH MINSTA VäRDE

Algoritmer, datastrukturer och komplexitet

Talmängder. Målet med första föreläsningen:

Förfluten tid Nu Framtiden. Bedömning Värdering Kunskaper Integration Konsekvenser Beslut Genomförande

Kvalificeringstävling den 30 september 2008

tidskrift för politisk filosofi nr årgång 9

NOG-provet Provansvarig: Anders Lexelius Provtid: 50 min Högskoleverket

GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON

Hare Del II (Metod) kunskap om hur det skulle vara för mig att befinna mig i deras. "reflektionsprincipen" (dock ej av H). Den säger följande: för att

Tal i bråkform. Kapitlet behandlar. Att förstå tal

Regler för: getsmart Grön

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Lektion 1. Förenklingar. Valentina Chapovalova. vårterminen IT-Gymnasiet. Valentina Chapovalova Lektion 1

Prioritering Frågor och svar Rev

Probabilistisk logik 1

Numeriska metoder för ODE: Teori

Förenklad förklaring i anslutning till kompedieavsnitten 6.3 och 6.4

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Prov 1 2. Ellips 12 Numeriska och algebraiska metoder lösningar till övningsproven uppdaterad a) i) Nollställen för polynomet 2x 2 3x 1:

Bisektionsalgoritmen. Kapitel Kvadratroten ur 2

Linjära ekvationssystem

Graärgning och kromatiska formler

Postprint.

Improved-MOESI Cache koherens Protokoll

Linjära ekvationssystem

Föreläsning 12+13: Approximationsalgoritmer

NMCC Sigma 8. Täby Friskola 8 Spets

Ansiktsigenkänning med MATLAB

KAPITEL 5 etiska och sociala aspekter

Beskrivande statistik

Växande och avtagande

MAA7 Derivatan. 2. Funktionens egenskaper. 2.1 Repetition av grundbegerepp

FASTIGHETS- FÖRETAGAR- KLIMATET I HALMSTAD. En rapport från Fastighetsägarna GFR

getsmart Gul Regler för:

FASTIGHETS- FÖRETAGAR- KLIMATET I GÖTEBORG. En rapport från Fastighetsägarna GFR

FASTIGHETS- FÖRETAGAR- KLIMATET I VARBERG. En rapport från Fastighetsägarna GFR

En föräldramanual om läxläsning

15SK Prefekt

Lektion 1, Envariabelanalys den 8 september ε < 1 < ε för alla x > N. ( ) I vårt exempel är f(x) = 1/x, så vi ska alltså ta fram ett N så att

Föreläsning 8: Aritmetik och stora heltal

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning

Shannon-Fano-Elias-kodning

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping

Tentamen Marco Kuhlmann

Relativ närhet - på fel och rätt sätt ETT DETALJERAT EXEMPEL

Medelvärde, median och standardavvikelse

Svar till ÖVNING 4. SVAR

Vi skalla främst utnyttja omskrivning av en matris för att löas ett system av differentialekvaioner. 2? Det är komplicerat att

Fixpunktsiteration. Kapitel Fixpunktsekvation. 1. f(x) = x = g(x).

ATT FÅ BESTÄMMA SJÄLV AUTONOMI INOM ÄLDREOMSORGEN. Lars Sandman. Praktisk filosof Lektor, Fil Dr

LMA201/LMA521: Faktorförsök

SF2715 Tillämpad kombinatorik, 6hp

Reflektion efter tillverkande av skalenlig modell

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Kort om mätosäkerhet

Föreläsning 4: Konfidensintervall (forts.)

Moment Viktiga exempel Övningsuppgifter I Ö5.1b, Ö5.2b, Ö5.3b, Ö5.6, Ö5.7, Ö5.11a

Bråk. Introduktion. Omvandlingar

Project Specification: Analysis of voting algorithms

KALLE ANKA CUP Matchskola

Sidor i boken f(x) = a x 2 +b x+c

Risk- och sårbarhetsanalyser Utmaningar och möjligheter

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Ontologier. Cassandra Svensson

Uppgift 1a (Aktiekurser utan poster)

Programmering II (ID1019) :00-12:00

FASTIGHETS- FÖRETAGAR- KLIMATET I LIDKÖPING. En rapport från Fastighetsägarna GFR

Eulercykel. Kinesiska brevbärarproblemet. Kinesiska brevbärarproblemet: Metod. Kinesiska brevbärarproblemet: Modell. Definition. Definition.

Inlämningsuppgift-VT lösningar

Lösningsforslag till tentamen i SF1624 den 22/ e x e y e z = 5e x 10e z = 5(1, 0, 2). 1 1 a a + 2 2a 4

Lärande genom interaktion

Ekvivalensrelationer

Grafer och grannmatriser

Konsten att lösa icke-linjära ekvationssystem

Inkomstfördelning: En konfliktfråga.

Bildbehandling, del 1

Algoritmer, datastrukturer och komplexitet

FASTIGHETS- FÖRETAGAR- KLIMATET I MOTALA. En rapport från Fastighetsägarna GFR

FASTIGHETS- FÖRETAGAR- KLIMATET I VÄSTERVIK. En rapport från Fastighetsägarna GFR

Så sparar svenskarna Spargap mellan män och kvinnor insikter och råd från Folksam

Vad behövs för att skapa en tillståndsrymd?

Hantering av hazards i pipelines

Hemtentamen: Politisk Teori 2

FASTIGHETS- FÖRETAGAR- KLIMATET I SKÖVDE. En rapport från Fastighetsägarna GFR

Transkript:

Cake-cutting att fördela resurser på ett rättvist sätt Ebba Lindström

Innehållsförteckning Inledning 3 Utility Theory 3 Orderability 4 Transitivity 4 Continuity 4 Monotonicity 5 Decomposability 5 Cake-cutting 5 Modellen 6 Normalisering 6 Delbarhet 6 Icke-negativitet 7 Additivitet 7 Vad är rättvisa? 7 Proportionalitet 7 Envy-freeness 8 Equitability 8 Algoritmer 9 Cut and choose 9 Dubins-Spanier 10 Selfridge-Conway 10 Avslutning 11 Litteraturförteckning 13 Bildkällor 13

Inledning Denna rapport kommer att gå in på konceptet cake-cutting. Den kommer att ta upp utility theory samt cake-cutting, vad cake-cutting innebär, och vilka olika algoritmer det finns för detta. Utility Theory Utility theory beskriver hur en agent fattar beslut i världar med osäkerhet och flera olika måltillstånd som kan skapa konflikter gentemot varandra. Detta är något som exempelvis målbaserade agenter inte klarar av. Den beslutsteoretiska agenten (eng. decision-theoretic agent) fattar ett beslut baserat på hur den uppfattar världen och hur mycket nytta olika handlingar i den situationen skulle kunna ge agenten. Den väljer sedan den handling som ger den störst uppskattad nytta. (Russel & Norvig, 2014) För att räkna ut detta används maximum expected utility (MEU). Denna bygger på den förväntade nyttan (eng. Expected utility) som kan skrivas på följande sätt:!" # $ = &(()*+,- # = * #, $)"(* ) 2 Result(a) är i detta fall resultatet då handlingen a utförs. Nyttofunktionen U(s ) är den funktion som räknar ut hur stor nytta agenten skulle få av att uppnå tillståndet s. Genom att sedan räkna ut den genomsnittliga nyttan av att handlingen a utförs, givet de evidens e som agenten vet om, fås den förväntade nyttan fram. För att sedan hitta MEU beräknar agenten den förväntade nyttan för alla olika handlingar som kan utföras och MEU är sedan den handling som returnerar den största förväntade nyttan. Denna handling utför då agenten. (Russel & Norvig, 2014)

Man kan tänka sig varje handling som agenten kan utföra som ett lotteri. Varje handling som kan utföras kan leda till olika resultat och sannolikheten för varje specifikt resultat kan räknas ut med hjälp av nyttofunktionen U. Man kan då tänka sig att varje handling är en lott i lotteriet. Om lotteriet L har de olika resultaten S1,,Sn och att sannolikheten att de sker är p1,,pn så kan det skrivas: L = [p1,s1;p2,s2, p3,s3]. Notationen för att beskriva en agents preferenser är följande: A B : Agenten föredrar A framför B. A ~ B : Agenten värderar A och B som likvärdiga och det spelar ingen roll för denne vilken som väljs. För att en agent ska handla rationellt måste den följa ett antal axiom: Orderability Orderability innebär att agenten måste föredra ett alternativ före det andra eller värdera de båda alternativen som likvärdiga. En agent kan alltså inte undvika att värdera alternativen. Transitivity Transitivity innebär att ifall agenten föredrar A framför B, och B framför C, så föredrar den även A framför C. Continuity Continuity innebär att om ett lotteri B värderas av agenten att ligga mellan lotterierna A och C i preferens så att A B C, så finns det en sannolikhet p sådan att agenten kommer värdera lotteri B likvärdigt med sannolikheten p att få lotteri A, eller att få lotteri C med sannolikheten 1 p. Alltså, vid en viss sannolikhet p värderar agenten att det är likvärdigt att garanterat få lotteri B med risken att få det mindre prefererade lotteri C till sannolikheten 1 p och chansen att få det prefererade lotteriet A till sannolikheten p.

Monotonicity Ebba Lindström Monotonicity innebär att en agent kommer välja det lotteri som har störst sannolikhet att få ett prefererat resultat ifall de båda har exakt samma möjliga resultat. Det vill säga, ifall två olika lotterier har resultaten S 1, S 2, S 3 och S 4, och det prefererade resultatet för agenten är S 2 så kommer den att välja det lotteri som har störst sannolikhet att få resultatet S 2. Decomposability Decomposability innebär att ifall det är flera lotterier i följd så kan alla dessa lotterier reduceras till endast ett lotteri med hjälp av regler inom sannolikhetslära. Dessa axiom kan tyckas vara intuitiva, men det är viktigt att de efterföljs. Ifall agenten inte följer axiomen kommer den att handla irrationellt. Genom axiomen kan man även säga något om nyttofunktionen U. Om axiomen följs måste det finnas en nyttofunktion sådan att U(A) > U(B) om agenten föredrar A framför B. Det gäller även att U(A )= U(B) om det är så att agenten anser A och B vara likvärdiga varandra. (Russel & Norvig, 2014) Cake-cutting Cake-cutting handlar om att fördela resurser över två eller flera parter och hur detta ska göras på ett sätt som parterna anser vara rättvist. Man kan tänka sig en tårta med flera olika toppings och dekorationer på. Någon kanske allra helst vill ha chokladströsslet, någon vill ha jordgubbarna och den tredje parten kanske endast bryr sig om att få så stor del som möjligt. Att fördela en så kallad heterogen, fördelbar, resurs på detta sätt kan beskrivas genom cakecutting. Tårtan i detta fall är alltså endast en metafor, den finns inte på riktigt (Procaccia, 2013). Ett exempel då cake-cutting kan vara användbart kan vara då ett kollektiv ska dela upp hyran på en lägenhet beroende på hur bra rum de olika personerna har. Ett annat exempel kan vara uppdelningen av ett arv mellan olika släktingar där arvet består av mer än bara pengar, där olika saker kan ha ett sentimentalt värde för olika släktingar.

Bild 1. En bild av den metaforiska tårtan och hur den kan delas upp mellan fyra olika agenter. Modellen Modellen över denna tårta innehåller först och främst ett antal agenter som resurserna ska fördelas emellan, N = {1,..., n}. Själva tårtan kan beskrivas som intervallet [0,1], som är heterogent, alltså inte en tårta som ser exakt likadan ut överallt. Varje agent i Î N har sin egen evalueringsfunktion V i som beräknar dess värde för en del av tårtan sådant att det intervallet I är en del av hela tårtan, alltså I Í [0,1]. För evalueringsfunktionen V i (x,y) finns det vissa antaganden som måste stämma: Normalisering Värdena som evalueringsfunktionen returnerar måste vara normaliserade, alltså mellan 0 och 1. Hela tårtan ska alltså ha värdet 1, tårtan kan aldrig värderas som större än 100%. Likaså evaluerar funktionen att ifall den inte får något alls av tårtan returnerar funktionen 0. V i (0,1) = 1 Delbarhet Delbarhet innebär att för varje intervall [x, y] så finns det ett värde λ så att 0 λ 1 som gör att evalueringsfunktionen för ett delintervall [x, z], alltså där z Î [x, y] av intervallet [x, y] blir likvärdigt med intervallet [x, y] multiplicerat med faktorn λ. V i (x, z) = λv i (x, y)

Icke-negativitet Evalueringsfunktionen får inte returnera ett negativt värde, den kan alltså aldrig värdera en bit av tårtan som negativ. V i (I ) ³ 0 Additivitet Då tårtan består av delbara resurser kan olika bitar av tårtan sättas ihop till en slutgiltig bit som en agent får. Evalueringsfunktionen för den tårtbiten är densamma om man adderar värdena från alla funktioner separat som ifall alla intervall adderas först för att sedan evalueras. För de två intervallen I och I gäller alltså att Vi(I) + Vi(I ) = Vi(I I ) (Procaccia, 2016) Vad är rättvisa? När något ska delas så att alla agenter blir nöjda är det viktigt att alla parter anser det vara rättvist. Det finns olika tillstånd som bör uppfyllas för att detta ska uppnås. Proportionalitet Proportionalitet innebär att alla agenter anser att de har fått en proportionellt rättvis del av hela tårtan. Ifall det finns n stycken agenter som ska dela på något så vill varje agent ha 1/n stor del av tårtan, eller mer, enligt de evalueringsfunktioner som varje agent har. Då anser varje agent att den har blivit tilldelad en tillräckligt stor del. Ifall någon värderar sin del som mindre än 1/n så kommer denne att anse att den inte har fått en tillräckligt stor del, denne kommer då anse att fördelningen är orättvis. Alltså, för varje agent i gäller att i N, V i (A i ) ³ 1/n Proportionalitet är oftast relativt lätt att uppnå, men behöver inte betyda att alla agenter

anser fördelningen vara rättvis bara för att den har fått en proportionellt tillräckligt stor del. (Procaccia, 2016) Envy-freeness Envy-freeness innebär att ingen av parterna ska känna sig avundsjuk av den delen av tårtan som någon av de andra agenterna har fått. Alltså, ingen ska vilja byta sin egen del av tårtan mot någon annans del. Alltså, för alla agenter i,j N, V i (A i ) ³ V i (A j ) Ifall en uppdelning uppfyller envy-freeness så implicerar det att uppdelningen även uppfyller proportionalitet, även om det motsatta fallet inte gäller. Det är detta som gör att även om uppdelningen är proportionerlig kan agenterna uppfatta den som orättvis. Även om agenten värderar sin egen bit som 1/n kanske den värderar någon annans bit som 2/n, agenten skulle då hellre vilja ha denna bit än sin egen och uppdelningen uppfyller inte envy-freeness. Envyfreeness är inte lika lätt att uppnå som proportionalitet. Dock finns det alltid en lösning, även om den kan vara svår att hitta. (Procaccia, 2016) Equitability Equitability uppnås då alla agenter värderar sin bit som exakt lika stor som alla andra agenter värderar sin bit. Alltså, för alla agenter i, j N, V i (A i ) = V j (A j ) Detta kan tyckas vara rättvist, då det är lika för alla. Dock kan det vara ett sämre mått än de andra två, till exempel kan två agenter som ska dela på tårtan värdera sin egen bit till 1/3, vilket inte är proportionellt då de skulle vilja ha åtminstone ½ bit. Det leder inte heller till envy-freeness, då båda agenterna i detta fall skulle värdera den andras bit till 2/3, vilket gör att de hellre skulle vilja ha den biten än den som de har. Dock uppfyller fallet equitability. (Procaccia, 2016)

Det kan alltså inte endast leda till att alla är lika exakt lika nöjda, utan också till att alla är exakt lika missnöjda. Algoritmer De resultat man har fått fram för att uppnå proportionalitet eller envy-freeness brukar falla in under en av fyra kategorier: existensteorem, moving-knife solutions, algoritmer samt protokoll. Existensteorem beskriver hur rättvisa bör uppnås, exempelvis genom att alla får 1/n bit av tårtan. Deras stora nackdel är att de sällan ger en konkret lösning till hur detta ska uppnås utan mest beskriver hur resultatet bör vara. Ett exempel på moving-knife solutions finns nedan (se Dubins-Spanier ). Protokoll liknar algoritmer, de består av instruktioner som de olika agenterna ska genomföra för att uppnå proportionalitet och envy-freeness. Dock utgår protokoll från att agenterna inte behöver göra rätt och exempelvis alltid välja bitar som är 1/n. Om protokollet dock efterföljs korrekt kan både proportionalitet och envyfreeness uppnås med vissa protokoll. (Brams & Taylor, 1995) Det finns flera olika algoritmer som på maskinell väg försöker att hitta en så rättvis lösning som möjligt. Nedan finns tre olika algoritmer. Cut and choose Den enklaste algoritmen är cut and choose. Denna kan endast användas då det är två agenter som ska dela på tårtan. Den går ut på att agent 1 får dela upp tårtan i två delar som den anser är likvärdiga, sedan får agent 2 välja vilken av delarna denne vill ha. Eftersom agent 1 har värderat de två bitarna som likvärdiga, alltså exakt ½ var, förekommer det proportionalitet. Detta då även agent 2 får välja vilken bit denne föredrar, alltså kommer den att värdera sin bit som ½ eller mer. Den kan inte heller vara avundsjuka på den andras bit, då agent 1 tycker de är likvärdiga och inte bryr sig om vilken av bitarna denne får och agent 2 får välja biten som den tycker bäst om. Därför förkommer både proportionalitet och envy-freeness när cut and choose används. (Procaccia, 2013)

Dubins-Spanier Ebba Lindström Dubins-Spanier kan användas när det är fler än två personer som ska dela på tårtan, den fungerar för n antal personer. Med Dubins-Spanier så kan man tänka sig att det finns en kniv som ska skära i tårtan. Den kommer att placeras allra längst till vänster vid tårtans vänstra kant och sedan långsamt förflytta sig mot den högra kanten av tårtan. Agenterna som ska dela på tårtan använder sin evalueringsfunktion för att avgöra hur mycket de värderar den del av tårtan som är till vänster om kniven. När någon av agenterna anser att delen är värd exakt 1/n så säger denna stopp och får den tårtbiten. Sedan fortsätter kniven att förflytta sig och agenterna fortsätter att säga stopp när de har värderat biten till 1/n och antalet agenter som evaluerar blir succesivt färre. När det endast finns en agent kvar får denne den tårtbit som finns kvar. Denna algoritm garanterar proportionalitet, då alla agenter säger stopp när de anser att de har fått exakt 1/n. Även den sista agenten får åtminstone 1/n av biten, då den har evaluerat alla bitar innan som mindre än 1/n och därför evaluerar den sista biten som 1/n eller större. Alltså, den sista agenten anser att dennes bit är V i (A i ) ³ 1 (n 1)/n = 1/n. Trots att Dubins-Spanier är proportionerlig så innebär det inte alltid envy-freeness. En agent vill aldrig byta bit med någon som är tidigare än den själv, då hade den helt enkelt sagt stopp innan den agenten hade gjort det och därigenom fått den biten. Dock kan den värdera en bit senare som mer värdefull än sin egen bit som endast är 1/n. Därför garanterar den inte envy-freeness. (Procaccia, 2016) Selfridge-Conway Selfridge-Conway kan användas när tre agenter ska dela på något, alltså då n = 3. Algoritmen består av ett antal steg. Agent 1 börjar med att dela tårtan i tre delar som denne anser vara likvärdiga. Sedan väljer agent 2 ut de två bitar som denne anser är bäst. Sedan trimmar agent 2 den bit som den

anser är allra bäst så att den får samma evalueringsvärde som den andra biten den valde. Den borttrimmade delen tas bort för tillfället. Av de andra tre bitarna väljer agent 3 den bit som denne anser är bäst. Ifall agent 3 inte valde den biten som blivit trimmad får agent 2 den biten, annars får agent 2 välja vilken bit denne vill ha. Till slut får agent 1 biten som blir kvar. Den av agenterna 2 och 3 som fick den tårtbit som inte blivit trimmad tidigare får sedan trimma den biten som lades åt sidan, denna delas då upp i tre delar som agenten anser likvärdiga. Sedan får den av agenterna 2 och 3 som inte delade biten välja, sedan agent 1 och till sist får den tredje agenten välja en bit. Denna algoritm uppfyller både proportionalitet och envy-freeness. Agent 3 får välja den första biten, så denne väljer självklart den bit den anser vara bäst. Eftersom agent 2 får den trimmade biten ifall agent 3 inte valde den och får välja annars leder det till att agent 2 får någon av de två bitar som denne anser vara bäst. Agent 1 får inte den trimmade biten, då agent 2 eller 3 kommer ha fått den, och då agent 1 värderade bitarna denne skar upp i början som likvärdiga kommer agent 1 att få en bit som denne värderar till exakt 1/3. Av den bortskurna biten får den agent som väljer först givetvis biten denne värderar som bäst. Agenten som delade upp bitarna värderar alla som likvärdiga och blir också nöjd. Agent 1 blir också nöjd, då den agent som fick den trimmade biten i första valet väljer först. Då agent 1 värderar de tre bitarna den skar upp i början som likvärdiga kan den valda biten + den trimmade biten aldrig komma upp i totalt värde som agent 1 anser att dennes första bit har. (Procaccia, 2016) Avslutning Både Utility theory och cake-cutting handlar om agenter som ska uppskatta värden som sedan ska gynna agenten. Nyttofunktionen U(s ) kan liknas vid evalueringsfunktionen V i (A i ), då båda dessa uppskattar den nytta som en agent skulle få av en viss handling (när det kommer till nyttofunktionen) eller resurs (när det kommer till evalueringsfunktionen).

Cake-cutting är otroligt relevant inom AI:n idag, och trots att problemet samt många av lösningarna och teoremen är över 50 år gamla så finns det fortfarande inte algoritmer som alltid fungerar då agenterna blir för många och preferenserna blir för komplexa. Därför tycker jag, precis som Procaccia (2013), att cake-cutting är ett mycket relevant område som skulle behöva mer forskning., och att vi i framtiden kommer att ha effektivare algoritmer för cake-cutting.

Litteraturförteckning Brams, S. J., & Taylor, A. D. (Januari 1995). An envy-free cake division protocol. The american matemathical monthly, 102. Procaccia, A. (Juli 2013). Cake-cutting: not just child s play. Communications of the ACM(7). Procaccia, A. (2016). Cake-cutting algorithms. i F. Brandt, V. Conitzer, U. Endris, J. Lang, & A. Procaccia, Handbook of computational social choice. New York: Cambridge university press. Russel, S., & Norvig, P. (2014). Artificial intelligence - A modern approach (3:e uppl.). Edinburgh Gate: Pearson. Bildkällor Framsida: https://brilliant.org/wiki/fair-division/ Bild 1: http://www.science4all.org/article/fair-division/