Cake-cutting att fördela resurser på ett rättvist sätt Ebba Lindström
Innehållsförteckning Inledning 3 Utility Theory 3 Orderability 4 Transitivity 4 Continuity 4 Monotonicity 5 Decomposability 5 Cake-cutting 5 Modellen 6 Normalisering 6 Delbarhet 6 Icke-negativitet 7 Additivitet 7 Vad är rättvisa? 7 Proportionalitet 7 Envy-freeness 8 Equitability 8 Algoritmer 9 Cut and choose 9 Dubins-Spanier 10 Selfridge-Conway 10 Avslutning 11 Litteraturförteckning 13 Bildkällor 13
Inledning Denna rapport kommer att gå in på konceptet cake-cutting. Den kommer att ta upp utility theory samt cake-cutting, vad cake-cutting innebär, och vilka olika algoritmer det finns för detta. Utility Theory Utility theory beskriver hur en agent fattar beslut i världar med osäkerhet och flera olika måltillstånd som kan skapa konflikter gentemot varandra. Detta är något som exempelvis målbaserade agenter inte klarar av. Den beslutsteoretiska agenten (eng. decision-theoretic agent) fattar ett beslut baserat på hur den uppfattar världen och hur mycket nytta olika handlingar i den situationen skulle kunna ge agenten. Den väljer sedan den handling som ger den störst uppskattad nytta. (Russel & Norvig, 2014) För att räkna ut detta används maximum expected utility (MEU). Denna bygger på den förväntade nyttan (eng. Expected utility) som kan skrivas på följande sätt:!" # $ = &(()*+,- # = * #, $)"(* ) 2 Result(a) är i detta fall resultatet då handlingen a utförs. Nyttofunktionen U(s ) är den funktion som räknar ut hur stor nytta agenten skulle få av att uppnå tillståndet s. Genom att sedan räkna ut den genomsnittliga nyttan av att handlingen a utförs, givet de evidens e som agenten vet om, fås den förväntade nyttan fram. För att sedan hitta MEU beräknar agenten den förväntade nyttan för alla olika handlingar som kan utföras och MEU är sedan den handling som returnerar den största förväntade nyttan. Denna handling utför då agenten. (Russel & Norvig, 2014)
Man kan tänka sig varje handling som agenten kan utföra som ett lotteri. Varje handling som kan utföras kan leda till olika resultat och sannolikheten för varje specifikt resultat kan räknas ut med hjälp av nyttofunktionen U. Man kan då tänka sig att varje handling är en lott i lotteriet. Om lotteriet L har de olika resultaten S1,,Sn och att sannolikheten att de sker är p1,,pn så kan det skrivas: L = [p1,s1;p2,s2, p3,s3]. Notationen för att beskriva en agents preferenser är följande: A B : Agenten föredrar A framför B. A ~ B : Agenten värderar A och B som likvärdiga och det spelar ingen roll för denne vilken som väljs. För att en agent ska handla rationellt måste den följa ett antal axiom: Orderability Orderability innebär att agenten måste föredra ett alternativ före det andra eller värdera de båda alternativen som likvärdiga. En agent kan alltså inte undvika att värdera alternativen. Transitivity Transitivity innebär att ifall agenten föredrar A framför B, och B framför C, så föredrar den även A framför C. Continuity Continuity innebär att om ett lotteri B värderas av agenten att ligga mellan lotterierna A och C i preferens så att A B C, så finns det en sannolikhet p sådan att agenten kommer värdera lotteri B likvärdigt med sannolikheten p att få lotteri A, eller att få lotteri C med sannolikheten 1 p. Alltså, vid en viss sannolikhet p värderar agenten att det är likvärdigt att garanterat få lotteri B med risken att få det mindre prefererade lotteri C till sannolikheten 1 p och chansen att få det prefererade lotteriet A till sannolikheten p.
Monotonicity Ebba Lindström Monotonicity innebär att en agent kommer välja det lotteri som har störst sannolikhet att få ett prefererat resultat ifall de båda har exakt samma möjliga resultat. Det vill säga, ifall två olika lotterier har resultaten S 1, S 2, S 3 och S 4, och det prefererade resultatet för agenten är S 2 så kommer den att välja det lotteri som har störst sannolikhet att få resultatet S 2. Decomposability Decomposability innebär att ifall det är flera lotterier i följd så kan alla dessa lotterier reduceras till endast ett lotteri med hjälp av regler inom sannolikhetslära. Dessa axiom kan tyckas vara intuitiva, men det är viktigt att de efterföljs. Ifall agenten inte följer axiomen kommer den att handla irrationellt. Genom axiomen kan man även säga något om nyttofunktionen U. Om axiomen följs måste det finnas en nyttofunktion sådan att U(A) > U(B) om agenten föredrar A framför B. Det gäller även att U(A )= U(B) om det är så att agenten anser A och B vara likvärdiga varandra. (Russel & Norvig, 2014) Cake-cutting Cake-cutting handlar om att fördela resurser över två eller flera parter och hur detta ska göras på ett sätt som parterna anser vara rättvist. Man kan tänka sig en tårta med flera olika toppings och dekorationer på. Någon kanske allra helst vill ha chokladströsslet, någon vill ha jordgubbarna och den tredje parten kanske endast bryr sig om att få så stor del som möjligt. Att fördela en så kallad heterogen, fördelbar, resurs på detta sätt kan beskrivas genom cakecutting. Tårtan i detta fall är alltså endast en metafor, den finns inte på riktigt (Procaccia, 2013). Ett exempel då cake-cutting kan vara användbart kan vara då ett kollektiv ska dela upp hyran på en lägenhet beroende på hur bra rum de olika personerna har. Ett annat exempel kan vara uppdelningen av ett arv mellan olika släktingar där arvet består av mer än bara pengar, där olika saker kan ha ett sentimentalt värde för olika släktingar.
Bild 1. En bild av den metaforiska tårtan och hur den kan delas upp mellan fyra olika agenter. Modellen Modellen över denna tårta innehåller först och främst ett antal agenter som resurserna ska fördelas emellan, N = {1,..., n}. Själva tårtan kan beskrivas som intervallet [0,1], som är heterogent, alltså inte en tårta som ser exakt likadan ut överallt. Varje agent i Î N har sin egen evalueringsfunktion V i som beräknar dess värde för en del av tårtan sådant att det intervallet I är en del av hela tårtan, alltså I Í [0,1]. För evalueringsfunktionen V i (x,y) finns det vissa antaganden som måste stämma: Normalisering Värdena som evalueringsfunktionen returnerar måste vara normaliserade, alltså mellan 0 och 1. Hela tårtan ska alltså ha värdet 1, tårtan kan aldrig värderas som större än 100%. Likaså evaluerar funktionen att ifall den inte får något alls av tårtan returnerar funktionen 0. V i (0,1) = 1 Delbarhet Delbarhet innebär att för varje intervall [x, y] så finns det ett värde λ så att 0 λ 1 som gör att evalueringsfunktionen för ett delintervall [x, z], alltså där z Î [x, y] av intervallet [x, y] blir likvärdigt med intervallet [x, y] multiplicerat med faktorn λ. V i (x, z) = λv i (x, y)
Icke-negativitet Evalueringsfunktionen får inte returnera ett negativt värde, den kan alltså aldrig värdera en bit av tårtan som negativ. V i (I ) ³ 0 Additivitet Då tårtan består av delbara resurser kan olika bitar av tårtan sättas ihop till en slutgiltig bit som en agent får. Evalueringsfunktionen för den tårtbiten är densamma om man adderar värdena från alla funktioner separat som ifall alla intervall adderas först för att sedan evalueras. För de två intervallen I och I gäller alltså att Vi(I) + Vi(I ) = Vi(I I ) (Procaccia, 2016) Vad är rättvisa? När något ska delas så att alla agenter blir nöjda är det viktigt att alla parter anser det vara rättvist. Det finns olika tillstånd som bör uppfyllas för att detta ska uppnås. Proportionalitet Proportionalitet innebär att alla agenter anser att de har fått en proportionellt rättvis del av hela tårtan. Ifall det finns n stycken agenter som ska dela på något så vill varje agent ha 1/n stor del av tårtan, eller mer, enligt de evalueringsfunktioner som varje agent har. Då anser varje agent att den har blivit tilldelad en tillräckligt stor del. Ifall någon värderar sin del som mindre än 1/n så kommer denne att anse att den inte har fått en tillräckligt stor del, denne kommer då anse att fördelningen är orättvis. Alltså, för varje agent i gäller att i N, V i (A i ) ³ 1/n Proportionalitet är oftast relativt lätt att uppnå, men behöver inte betyda att alla agenter
anser fördelningen vara rättvis bara för att den har fått en proportionellt tillräckligt stor del. (Procaccia, 2016) Envy-freeness Envy-freeness innebär att ingen av parterna ska känna sig avundsjuk av den delen av tårtan som någon av de andra agenterna har fått. Alltså, ingen ska vilja byta sin egen del av tårtan mot någon annans del. Alltså, för alla agenter i,j N, V i (A i ) ³ V i (A j ) Ifall en uppdelning uppfyller envy-freeness så implicerar det att uppdelningen även uppfyller proportionalitet, även om det motsatta fallet inte gäller. Det är detta som gör att även om uppdelningen är proportionerlig kan agenterna uppfatta den som orättvis. Även om agenten värderar sin egen bit som 1/n kanske den värderar någon annans bit som 2/n, agenten skulle då hellre vilja ha denna bit än sin egen och uppdelningen uppfyller inte envy-freeness. Envyfreeness är inte lika lätt att uppnå som proportionalitet. Dock finns det alltid en lösning, även om den kan vara svår att hitta. (Procaccia, 2016) Equitability Equitability uppnås då alla agenter värderar sin bit som exakt lika stor som alla andra agenter värderar sin bit. Alltså, för alla agenter i, j N, V i (A i ) = V j (A j ) Detta kan tyckas vara rättvist, då det är lika för alla. Dock kan det vara ett sämre mått än de andra två, till exempel kan två agenter som ska dela på tårtan värdera sin egen bit till 1/3, vilket inte är proportionellt då de skulle vilja ha åtminstone ½ bit. Det leder inte heller till envy-freeness, då båda agenterna i detta fall skulle värdera den andras bit till 2/3, vilket gör att de hellre skulle vilja ha den biten än den som de har. Dock uppfyller fallet equitability. (Procaccia, 2016)
Det kan alltså inte endast leda till att alla är lika exakt lika nöjda, utan också till att alla är exakt lika missnöjda. Algoritmer De resultat man har fått fram för att uppnå proportionalitet eller envy-freeness brukar falla in under en av fyra kategorier: existensteorem, moving-knife solutions, algoritmer samt protokoll. Existensteorem beskriver hur rättvisa bör uppnås, exempelvis genom att alla får 1/n bit av tårtan. Deras stora nackdel är att de sällan ger en konkret lösning till hur detta ska uppnås utan mest beskriver hur resultatet bör vara. Ett exempel på moving-knife solutions finns nedan (se Dubins-Spanier ). Protokoll liknar algoritmer, de består av instruktioner som de olika agenterna ska genomföra för att uppnå proportionalitet och envy-freeness. Dock utgår protokoll från att agenterna inte behöver göra rätt och exempelvis alltid välja bitar som är 1/n. Om protokollet dock efterföljs korrekt kan både proportionalitet och envyfreeness uppnås med vissa protokoll. (Brams & Taylor, 1995) Det finns flera olika algoritmer som på maskinell väg försöker att hitta en så rättvis lösning som möjligt. Nedan finns tre olika algoritmer. Cut and choose Den enklaste algoritmen är cut and choose. Denna kan endast användas då det är två agenter som ska dela på tårtan. Den går ut på att agent 1 får dela upp tårtan i två delar som den anser är likvärdiga, sedan får agent 2 välja vilken av delarna denne vill ha. Eftersom agent 1 har värderat de två bitarna som likvärdiga, alltså exakt ½ var, förekommer det proportionalitet. Detta då även agent 2 får välja vilken bit denne föredrar, alltså kommer den att värdera sin bit som ½ eller mer. Den kan inte heller vara avundsjuka på den andras bit, då agent 1 tycker de är likvärdiga och inte bryr sig om vilken av bitarna denne får och agent 2 får välja biten som den tycker bäst om. Därför förkommer både proportionalitet och envy-freeness när cut and choose används. (Procaccia, 2013)
Dubins-Spanier Ebba Lindström Dubins-Spanier kan användas när det är fler än två personer som ska dela på tårtan, den fungerar för n antal personer. Med Dubins-Spanier så kan man tänka sig att det finns en kniv som ska skära i tårtan. Den kommer att placeras allra längst till vänster vid tårtans vänstra kant och sedan långsamt förflytta sig mot den högra kanten av tårtan. Agenterna som ska dela på tårtan använder sin evalueringsfunktion för att avgöra hur mycket de värderar den del av tårtan som är till vänster om kniven. När någon av agenterna anser att delen är värd exakt 1/n så säger denna stopp och får den tårtbiten. Sedan fortsätter kniven att förflytta sig och agenterna fortsätter att säga stopp när de har värderat biten till 1/n och antalet agenter som evaluerar blir succesivt färre. När det endast finns en agent kvar får denne den tårtbit som finns kvar. Denna algoritm garanterar proportionalitet, då alla agenter säger stopp när de anser att de har fått exakt 1/n. Även den sista agenten får åtminstone 1/n av biten, då den har evaluerat alla bitar innan som mindre än 1/n och därför evaluerar den sista biten som 1/n eller större. Alltså, den sista agenten anser att dennes bit är V i (A i ) ³ 1 (n 1)/n = 1/n. Trots att Dubins-Spanier är proportionerlig så innebär det inte alltid envy-freeness. En agent vill aldrig byta bit med någon som är tidigare än den själv, då hade den helt enkelt sagt stopp innan den agenten hade gjort det och därigenom fått den biten. Dock kan den värdera en bit senare som mer värdefull än sin egen bit som endast är 1/n. Därför garanterar den inte envy-freeness. (Procaccia, 2016) Selfridge-Conway Selfridge-Conway kan användas när tre agenter ska dela på något, alltså då n = 3. Algoritmen består av ett antal steg. Agent 1 börjar med att dela tårtan i tre delar som denne anser vara likvärdiga. Sedan väljer agent 2 ut de två bitar som denne anser är bäst. Sedan trimmar agent 2 den bit som den
anser är allra bäst så att den får samma evalueringsvärde som den andra biten den valde. Den borttrimmade delen tas bort för tillfället. Av de andra tre bitarna väljer agent 3 den bit som denne anser är bäst. Ifall agent 3 inte valde den biten som blivit trimmad får agent 2 den biten, annars får agent 2 välja vilken bit denne vill ha. Till slut får agent 1 biten som blir kvar. Den av agenterna 2 och 3 som fick den tårtbit som inte blivit trimmad tidigare får sedan trimma den biten som lades åt sidan, denna delas då upp i tre delar som agenten anser likvärdiga. Sedan får den av agenterna 2 och 3 som inte delade biten välja, sedan agent 1 och till sist får den tredje agenten välja en bit. Denna algoritm uppfyller både proportionalitet och envy-freeness. Agent 3 får välja den första biten, så denne väljer självklart den bit den anser vara bäst. Eftersom agent 2 får den trimmade biten ifall agent 3 inte valde den och får välja annars leder det till att agent 2 får någon av de två bitar som denne anser vara bäst. Agent 1 får inte den trimmade biten, då agent 2 eller 3 kommer ha fått den, och då agent 1 värderade bitarna denne skar upp i början som likvärdiga kommer agent 1 att få en bit som denne värderar till exakt 1/3. Av den bortskurna biten får den agent som väljer först givetvis biten denne värderar som bäst. Agenten som delade upp bitarna värderar alla som likvärdiga och blir också nöjd. Agent 1 blir också nöjd, då den agent som fick den trimmade biten i första valet väljer först. Då agent 1 värderar de tre bitarna den skar upp i början som likvärdiga kan den valda biten + den trimmade biten aldrig komma upp i totalt värde som agent 1 anser att dennes första bit har. (Procaccia, 2016) Avslutning Både Utility theory och cake-cutting handlar om agenter som ska uppskatta värden som sedan ska gynna agenten. Nyttofunktionen U(s ) kan liknas vid evalueringsfunktionen V i (A i ), då båda dessa uppskattar den nytta som en agent skulle få av en viss handling (när det kommer till nyttofunktionen) eller resurs (när det kommer till evalueringsfunktionen).
Cake-cutting är otroligt relevant inom AI:n idag, och trots att problemet samt många av lösningarna och teoremen är över 50 år gamla så finns det fortfarande inte algoritmer som alltid fungerar då agenterna blir för många och preferenserna blir för komplexa. Därför tycker jag, precis som Procaccia (2013), att cake-cutting är ett mycket relevant område som skulle behöva mer forskning., och att vi i framtiden kommer att ha effektivare algoritmer för cake-cutting.
Litteraturförteckning Brams, S. J., & Taylor, A. D. (Januari 1995). An envy-free cake division protocol. The american matemathical monthly, 102. Procaccia, A. (Juli 2013). Cake-cutting: not just child s play. Communications of the ACM(7). Procaccia, A. (2016). Cake-cutting algorithms. i F. Brandt, V. Conitzer, U. Endris, J. Lang, & A. Procaccia, Handbook of computational social choice. New York: Cambridge university press. Russel, S., & Norvig, P. (2014). Artificial intelligence - A modern approach (3:e uppl.). Edinburgh Gate: Pearson. Bildkällor Framsida: https://brilliant.org/wiki/fair-division/ Bild 1: http://www.science4all.org/article/fair-division/