Sammanfattning Avslut Litteraturförteckning... 19

Transkript

1 ATT DELA EN TÅRTA SAMMANFATTNING För att nå rättvisa kan man använda olika algoritmer för att dela upp tårtan mellan olika agenter utifrån egenskaper som implicerar rättvisa. Linnea Bergsten Artificiell Intelligens 729G43 Algoritmer för rättvis fördelning av resurser

2 Innehåll Inledning... 4 Bakgrund... 5 Nyttoteori... 5 Begrepp inom nyttoteori... 5 Nyttofunktion U(s) Förväntad nytta EU(a e)... 5 Maximal förväntad nytta... 5 Nyttoteorins grundprinciper... 5 Benägenhet att kunna ordnas... 6 Transitivitet... 6 Kontinuitet... 6 Utbytbarhet... 6 Monotoni... 6 Upplöslighet... 6 Nyttofunktionen... 6 Preferenslictering... 6 Normaliserade nyttoutfall... 6 Standardlotteri... 7 Nyttoteori för flera attribut... 7 Dominans... 7 Attributens oberoende... 7 Att dela en tårta... 9 Modellen... 9 Modellens delar... 9 Värdetäthetsfunktion... 9 Värderingsfunktionens egenskaper... 9 Normalisering... 9 Delbarhet Ickenegativitet Additivitet Rättviseegenskaper Proportionalitet Avsaknad av avundsjuka Likhet... 10

3 Egenskaperna i relation till varandra Algoritmer Teorem för rättvisa Dela och välj Dubins-Spanier Stegen i Dubins-Spaniers-algoritmen Proportionalitet hos Dubins-Spanier-algoritmen En liknande algoritm Selfridge-Conway Initiering, delning av tårta 1 och tårta Avsaknad av avundsjuka i Selfridge-Conway Komplexitetsanalys i att skära upp en tårta Robertson-Webb Utvärderingsfunktion och delningsfunktion Komplexitet av proportionell tårtuppdelning Komplexitet av avundsjukfri tårtuppdelning Applicering Beslutsteori Mikromort Riskaversion eller risksökande Beslutsnätverk Slumpnoder Beslutsnoder Nyttonoder Nyttofunktion för handling i beslutsnätverk Utvärderingsalgoritm för handlingar i beslutsnätverk Värdet av information Beslutsteoretiska expertsystem Kausal modell Kvalitativ beslutsmodell Sannolikheter Nytta Förfina modellen Känslighetsanalys Avslutning... 18

4 Sammanfattning Avslut Litteraturförteckning... 19

5 Inledning En agent som baserar sina val på beslutslära kan göra rationella beslut baserade på vad den tror, sannolikhetslära, och vad den vill, nyttoteori, i en osäker värld med konflikterande mål. Beslutsnätverk är utvecklingar på Bayesianska nät och kan uttrycka och lösa beslutsproblem (Russel & Norvig, 2014). Nyttofunktionen är den som fångar en agents preferenser och nyttoteorin beskriver hur agenter värderar olika alternativ utifrån dess nyttofunktion (Russel & Norvig, 2014). När man delar upp en heterogen resurs mellan olika agenter, där man kan använda metaforen av att dela en tårta mellan olika agenter så tar man hänsyn till vad agenternas nyttofunktioner värderar de olika bitarna till (Procaccia, 2016). För att nå rättvisa kan man använda olika algoritmer för att dela upp resursen, tårtan, mellan de olika agenterna utifrån olika egenskaper som kan implicera rättvisa (Procaccia, 2016). Sannolikhetslära tillsammans med nyttoteori kan användas vid utvecklingen av beslutsteoretiska expertsystem.

6 Bakgrund Nyttoteori Nyttoteori beskriver vad en agent vill, det vill säga hur en rationell agent borde agera. Begrepp inom nyttoteori Nyttofunktion U(s). Nyttofunktionen fångar agentens preferenser. Den uttrycker hur gärna den vill nå ett visst tillstånd genom att tilldelas ett nummer (Russel & Norvig, 2014). U(s) Förväntad nytta EU(a e) En handlings förväntade nytta givet evidensen är resultatets genomsnittliga nyttovärde U(s ) viktat med sannolikheten att utfallet sker (P(RESULT(a)=s a,e)) (Russel & Norvig, 2014). EU(a e) = P(RESULT(a)=s a,e)u(s ) s För att räkna ut den förväntade nyttan krävs en komplett kausal modell av världen och väldigt stora Bayesianska nätverk för att det ska kunna gå att räkna ut det genomsnittliga nyttovärdet. Utöver detta krävs ofta planering eller sökning för att räkna ut utfallets nyttovärden (Russel & Norvig, 2014). Maximal förväntad nytta Principen av maximal förväntad nytta innebär att en rationell agent ska välja den handling som maximerar agentens förväntade nytta (Russel & Norvig, 2014). action = argmax EU(a e) a En agent som handlar på ett sätt som maximerar en nyttofunktion kommer att nå den hösta möjliga prestationen givet att nyttofunktionen reflekterar korrekt på prestandamätningen. Det går att se maximal förväntad nytta som en definition av artificiell intelligens, däremot löser och definierar det inte allt inom artificiell intelligens (Russel & Norvig, 2014). Beslutsteori bidrar till ett användbart ramverk inom artificiell intelligens. Principen av maximal förväntad nytta ger en praktisk tillämpning på det generella i att agenten ska ta ett rationellt beslut. Det agenten behöver göra är att räkna ut alla variabler och maximera nyttan över dessa handlingar. För att avgöra omgivningens tillstånd krävs bland annat perception, inlärning, kunskapsrepresentation och slutledningsförmåga (Russel & Norvig, 2014). Nyttoteorins grundprinciper Genom att definiera begräsningar på preferenserna som en rationell agent ska ha går det att visa att principen av maximal förväntad nytta kan härledas från begränsningarna såsom att det finns en nyttofunktion samt förväntad nytta av ett lotteri. Det som agenten ska välja preferenser för är huruvida den föredrar, ser likvärdighet gentemot två alternativ. Alternativen kan vara tillstånd i världen men också nya lotterier som kan ge antingen nya lotterier för tillstånd. Lotterierna är därmed uppsättningar av utfall som har olika sannolikheter, och när agenten väljer ett alternativ kommer ett av dessa utfall att dras (Russel & Norvig, 2014).

7 Begränsningarna nedan är grundprinciperna av nyttoteorin. Om en agent bryter mot en av dessa principer eller begränsningar kommer den att agera irrationellt. Dessa grundprinciper är alltså principer av företräde och säger ingenting om själva nyttofunktionen (Russel & Norvig, 2014). Benägenhet att kunna ordnas Givet två lotterier måste en rationell agent föredra antingen en framför en annan eller anse dem likvärdiga. Agenten kan inte välja att inte värdera dem (Russel & Norvig, 2014). Transitivitet Transitivitet måste gälla. Om en agent föredrar alternativ A framför alternativ B och alternativ B framför alternativ C måste agenten föredra alternativ A framför alternativ C (Russel & Norvig, 2014). Kontinuitet Om agenten föredrar A framför B och B framför C finns det en sannolikhet p att agenten är likvärdig inför att välja alternativ B eller att för alternativ A med en sannolikhet av p och alternativ C med en sannolikhet av p-1. Det vill säga att det finns ett osäkerhetsvärde för alternativ A där agenten kommer att se alternativet att vara säker på att få B vara jämförbart med att med en viss osäkerhet kunna få alternativ A och att annars få alternativ C (Russel & Norvig, 2014). Utbytbarhet Givet att agenten är likvärdig inför två alternativ är agenten också likvärdig inför att byta ut det ena alternativet mot det andra alternativet i komplexare lotterier (Russel & Norvig, 2014). Monotoni Om en agent föredrar ett alternativ framför ett annat kommer agenten att föredra det lotteriet med en större chans för alternativet som den föredrar (Russel & Norvig, 2014). Upplöslighet Lotterier som består av fler lotterier kan genom sannolikhetslagar reduceras till enklare lotterier (Russel & Norvig, 2014). Nyttofunktionen Nyttofunktionen är vad som kartlägger från lotterier till riktiga siffror. Nyttofunktionen måste följa grundprinciperna men vad den föredrar kan i princip vara vad som helst. En agent kan till exempel föredra att förlora framför att vinna ett spel, det gör den inte irrationell för det (Russel & Norvig, 2014). Preferenslictering Processen att reda ut vad ett beslutförande system har för nyttofunktion kallas preferenselicitering, där elicitering betyder att identifiera och fånga krav. Under preferenselicitering presenteras val för agenten och dess observerade reaktioner används för att ta reda på dess underliggande nyttofunktion (Russel & Norvig, 2014). Normaliserade nyttoutfall För att få en skala över vilka nyttoutfallen söks värsta och bästa tänkbara utfall fram. Normaliserade nyttoutfall använder en skala där värsta möjliga utfall är 0 och bästa tänkbara utfall är 1 (Russel & Norvig, 2014).

8 Standardlotteri Givet en skala mellan värsta och bästa tänkbara utfall går det att ta reda på nyttan för vilket utfall som helst genom att låta agenten välja mellan det utfallet och ett standardlotteri. I standardlotteriet finns en viss sannolikhet för bästa tänkbara scenario och att det i alla andra fall skulle värsta tänkbara scenario ske. Efter att ha låtit agenten välja justeras sannolikheterna i standardlotteriet tills agenten anser lotteriet och utfallet som undersöks likvärdiga. Givet en normaliserad skala är nyttan för utfallet samma som den sannolikheten för bästa tänkbara scenario i det fall där standardlotteriet ses som jämförbart (Russel & Norvig, 2014). Nyttoteori för flera attribut För problem där resultatet påverkar flera attribut används nyttoteori för flera attribut. För att hantera flera attribut används en vektor av tilldelningar för de olika attributen som värderar hur viktiga attributen är (Russel & Norvig, 2014). Dominans Om en agent i ett val mellan två alternativ finner att alla attribut i den en attributvektor är bättre än i den andra krävs inte någon vidare eftertanke. I detta fall finns det en strikt dominans av det ena valet framför det andra (Russel & Norvig, 2014). Strikt dominans är inte lika vanligt i verkliga problem som stokastisk dominans är. Det finns algoritmer för att ta rationella beslut utan att använda numeriska värden genom att istället basera sina val på stokastisk dominans. Ett exempel är när det finns två alternativ med respektive sannolikhet för en distribution av en kostnad i pengar, med ett antagande av att nyttan minskar med kostnaden. I det exemplet finns en stokastisk dominans för alternativet med större förväntad nytta framför det andra alternativet. Skulle däremot ett sådant alternativ jämföras med ett där kostnaden är känd kan inte längre det beslutet tas då inte nyttan av den kostnaden är känd. Detta kan upplevas paradoxalt men förklaras genom att även om valet blir enklare om den exakta kostnaden är okänd, är risken att det blir fel också större (Russel & Norvig, 2014). Givet att ett alternativ stokastiskt dominerar ett annat alternativ, gäller för en nyttofunktion som enbart stiger, att den förväntade nyttan av det första alternativet är åtminstone lika hög som den förväntade nyttan av det andra alternativet. Den kumulativa distributionen mäter sannolikheten att kostnaden är mindre än eller jämförbar beroende på vilket värde som ges. Om den kumulativa distributionen för det ena valet alltid har en större negativ kostnad än det andra är den ena valet billigare än den andra ur ett perspektiv av stokastisk dominans. Om en handling stokastiskt dominerar en annan handling vad det gäller alla attribut kan den dominerade handlingen väljas bort (Russel & Norvig, 2014). Attributens oberoende Nyttoteori för flera attribut bygger på att det finns en viss struktur i agentens nyttofunktion på ett sätt att det inte uppstår en kombinatorisk explosion. För att definiera den kompletta funktionen söks det efter strukturer i hur agenten tar beslut. Exempelvis kan det finnas att det är så enkelt att det räcker med att addera nyttan för de olika attributen för att nyttan för hela valet (Russel & Norvig, 2014). Den grundläggande struktur som hittas i en deterministisk omgivning är preferiellt oberoende. Strukturen bygger på att två attribut kan vara preferentiellt oberoende från ett tredje attribut. Givet att agentens beslut att välja mellan två alternativ inte beror på värdet av ett tredje alternativ är de två alternativet preferiellt oberoende från det tredje alternativet (Russel & Norvig, 2014).

9 Om ett set av alternativ parvis är preferiellt oberoende gentemot varandra är de ömsesidigt preferiellt obereoende. De kan alla vara viktiga, men värdet på ett av attributen påverkar inte värdet på de andra. Om ett set av värden är ömsesidigt preferiellt obereoende är dess gemensamma värdefunktion summan av varje enskild värdefunktion. En sådan funktion kallas en adderande värdefunktion. En adderande värdefunktion minskar antalet gånger agentens preferenser behöver undersökas (Russel & Norvig, 2014). I en omgivning med osäkerhet behövs strukturen för preferens mellan olika lotterier också tas i åtanke och förståelse för de nyttofunktioner som följer till skillnad från de värdefunktioner som gällde i den deterministiska världen (Russel & Norvig, 2014). Nyttovis oberoende innebär när ett set av attribut är nyttovis oberoende från ett annat set av attribut då preferenserna mellan lotterierna hos attributen i den ena alternativet är oberoende av värdena på attributen i hos det andra lotteriet. Ömsesidigt nyttovis oberoende gäller om varje delset av attribut är nyttovis oberoende av resten av attributen. Givet ömsesidigt nyttovis oberoende kan multiplicerande nyttofunktion användas (Russel & Norvig, 2014).

10 Att dela en tårta Procaccia beskriver två teman har funnits i forskningen kring tårtdelningsproblemet: att visa att det går att uppnå rättvisa och hur rättvisa kan uppnås. Tårtdelningsproblemet är ett leksaksproblem som utforskar ett beräkningsmässigt tänk i tilldelningen av delbara resurser (Procaccia, 2016). I detta avsnitt kommer fokus att lika på hur rättvisa kan uppnås utifrån olika algoritmer. Nedan kommer modellen för tårtdelningsproblemet; dess värderingsfunktions egenskaper; rättviseegenskaper som algoritmer som är tänkta att lösa tårtdelningsproblemet kan inneha; några av dessa algoritmer samt komplexitetsanalys av dessa att presenteras. Modellen Tårtan är den metafor som används för att prata om resurserna som ska fördelas olika parter, det handlar alltså inte om att skära i en verklig tårta. Tårtan ska vara en heterogen delbar resurs (Procaccia, 2016), det vill säga, den innehåller delar som är olika och den går att dela. Tårtan i metaforen har alltså olika dekorationer som de olika personerna som ska dela på tårtan värderar olika. Modellens delar I modellen som Procaccia (2016) beskriver finns en samling agenter N = {1,, n} och den heterogena delbara resursen, tårtan, som representeras av intervallet [0, 1]. Denna resurs har delintervallet I vars längd l(i) är l([x, y]) = y - x. Längden på ett intervall definieras därmed av avståndet mellan den start- och slutpunkten. Varje agent i N har en värderingsfunktion Vi som kartlägger hur agenten i sätter värde till ett givet delintervall I [0, 1] av kakan, Vi(I). Vi([x, y]) kan skrivas som det förenklade Vi(x, y). Värderingsfunktionerna förväntas följa följande egenskaper: normalisering, delbarhet och icke negativitet. Rättviseegenskaper som övervägs är proportionalitet, avsaknad av avundsjuka samt rättvisa ur likhetssynpunkt (Procaccia, 2016). Värdetäthetsfunktion Värderingsfunktionerna kan enligt Proccacia (2016) även modelleras i en värdetäthetsfunktion vi. Givet en del av resursen, en tårtbit X, låter vi Vi(X) = x X vi(x)dx. Likväl som för värderingsfunktionerna kan även värdetäthetsfunktionen antas värdera hela resursen till ett, Vi(X) = 1 x=0 vi(x)dx = Vi(0, 1) = 1 (Procaccia, 2016). Att en agents värderingsfunktion är styckvis konstant innebär att inom delintervall är delarna värderade lika, men att de olika delintervallen kan värderas olika. Där har man begränsat dess värderingsfunktioner till att bero på strukturen av dess värdetäthetsfunktion. Styckvis likformiga värderingar är en form av styckvis konstanta värderingsfunktioner. Styckvis likformiga värderingars värderingsfunktioner antingen är fasta på en konstant c > 0 eller är noll. En agent med en styckvis likformig värderingsfunktion har särskild aspekt som den gör vissa delar av resursen likformigt värdefulla och de andra är utan värde. Värderingsfunktionens egenskaper Normalisering Egenskapen av normalisering Vi(0, 1) = 1 innebär att värdet som en agent i sätter på delintervallet som består av hela kakan är 1. Att få allt är det bästa tänkbara scenariot.

11 Delbarhet Delbarhetsegenskapen definierar att för varje delintervall [x, y] och 0 λ 1 finns en punkt z [x,y] sådan att Vi(x, z) = λvi(x,y). Detta betyder att tårtan kan delas och att värdet beror på vilken del det är som värderas. Till exempel kommer värdet för ett delintervall mellan samma punkt i ett intervall, det vill säga att vara utan tårtbit, alltid att vara noll, Vi(x, x) = 0 för varje punkt x [0,1]. Delbarhetsegenskapen låter oss alltså att se bortom gränserna för intervallen, och kan dela tårtan hur vi vill. Ickenegativitet Ickenegativitetsegenskapen definierar att för varje delintervall I gäller att Vi(I) 0. Alla intervall har antingen ett positivt värde eller inget värde alls. Additivitet För additivitetsegenskapen gäller givet två delinterval I och I är det sammanlagda värdet för de två delintervallen är detsamma som värdet för de sammanlagda delintervallen, Vi(I)+Vi(I )= Vi(I I ). Värdet som agenten sätter till två enskilda intervall är detsamma som värdet agenten skulle sätta till de två intervallen om vore ett intervall trots att de inte är sammanhängande. Detta kan även uttryckas som värdet agenten i N sätter på en del X är Vi(X)= I X Vi(I), och dess längd är (X)= I X l(i). Att tårtbitens värde och längd är summan av värdet och längden på dess delar. Rättviseegenskaper Procaccia (2016) beskriver ett antal rättviseegenskaper som algoritmer för tårtdelning kan inneha. Detta avsnitt presenterar det procaccia proportionalitet, avsaknad av avundsjuka och likhet samt diskuterar dessa i relation till varandra som Procaccia beskrivit. Proportionalitet Rättviseegenskapen; proportionalitet, att för alla i N gäller att Vi(Ai) 1/n. Varje agent har ett värde som är åtminstone 1/n för sin del av kakan (Procaccia, 2016). Det finns ingen agent som har ett värde på sin del av kakan som är mindre än det totala värdet genom antalet agenter. Avsaknad av avundsjuka Rättviseegenskapen; avsaknad av avundsjuka, att för alla i,j N gäller att Vi(Ai) Vi(Aj) (Procaccia, 2016). Detta betyder att varje agent föredrar sin del av resurserna framför någon annan del, dess värderingsfunktion värderar dess del högre än eller lika med en del som någon annan agent tilldelats. Likhet Rättviseegenskapen som ser rättvisa ur likhetssynpunkt, att för alla i,j N gäller att Vi(Ai)= Vj(Aj) (Procaccia, 2016). Att två agenters värden på sina respektive bitar jämförs, värderas bitarna lika högt. Egenskaperna i relation till varandra Avsaknad av avundsjuka medför proportionalitet. Utifrån additivitetsegenskapen ses att det måste finnas en agent som har ett större eller lika stort värde på sin del som om man skulle dela värdet på hela resursen i antalet delar som det finns agenter. För tre agenter finns det tilldelningar som är proportionella men inte har avsaknad av avundsjuka. En agent kan värdera sin bit att vara värd 1/3 men värdera en annans agents bit till 1/2 och därmed vara

12 avundsjuk trots att den har tilldelats åtminstone minsta möjliga del av tårtan (Procaccia, 2016). Att se rättvisa ur likhetssynpunkt är vitt skiljt från egenskaperna av avsaknad av avundsjuka och proportionalitet. Det finns tilldelningar som är helt lika utdelade men inte följer egenskaperna av proportionalitet och avsaknad av avundsjuka. Den tilldelning som är har den största avsaknad av avundsjuka är inte rättvis ur likhetsynpunkt (Procaccia, 2016). Algoritmer Detta avsnitt inleds med att beskriva att det givet kontinuitet teoretiskt sett finns en rättvis tilldelning enligt alla de rättviseegenskaper som togs upp i förra avsnittet men att den är svår att finna (Procaccia, 2016). Detta avsnitt tar upp algoritmer som löser olika aspekter av rättvisa för olika antal agenter: dela och välj, Dubins-Spanier, Selfridge-Conway, samt komplexitetsanalys av algoritmer, Teorem för rättvisa Alon presenterar ett teorem som säger att givet kontinuitet hos värdedensitetsfunktionen finns det en tilldelning där varje agent värderar sin och alla andras bitar till exakt den del som värdet av hela resursen genom antalet agenter skulle ge (Alon, 1987). Kontinuitet som beskrevs i det tidigare avsnittet som säger att det finns ett osäkerhetsvärde för det mest prefererade valet som gör det jämförbart med att vara säker på att få det näst mest prefererade valet (Russel & Norvig, 2014). Detta menar Procaccia ger en tilldelning som är rättvis ur likhetssynpunkt, proportionalitet och har avsaknad av avundsjuka. Denna tilldelning är dock svår och i vissa fall omöjlig att finna (Procaccia, 2016). Dela och välj En algoritm som ger proportionalitet för två agenter är dela och välj (Procaccia, 2016). Procaccia beskriver att den ena agenten delar resurserna i två delar som den värderar lika, och sedan väljer den andra agenten den del som den föredrar och den första agenten får den bit som blir över. Värdet på de båda bitarna kommer bli ½, eftersom att för agenterna 1 och 2 där bitarna X1 och X2 kommer värdena att vara V1(X1)= V1(X2)=1/2 (Procaccia, 2016). En egenskap som algoritmen för dela och välj har är att oavsett en agent kan få sin beskärda del utan att den andra agenten följer algoritmen. Man gör därmed en skillnad på algoritmen och agentens strategier på ett sätt som kopplat till spelteoretiska frågor (Procaccia, 2016). Dubins-Spanier En algoritm som Procaccia (2016) beskriver och refererar till Dubins och Spanier som beskrivs av Strömquist (1980) garanterar en proportionell fördelning för alla olika antal agenter. Ursprungligen definierad för en kontinuerlig delning av resursen, men kommer här att förklaras utifrån en diskret delning. Stegen i Dubins-Spaniers-algoritmen I första rundan kommer varje agent i N göra en markering på punkt xi sådan att Vi(0, xi) = 1/n. Varje agent värderar den första delen av resursen och markerar hur den skulle dela den för att skapa en del som är värd lika mycket som en jämnt delad del skulle vara värd (Procaccia, 2016).

13 Agenten i* som gör markeringen som är längst till vänster, det vill säga den agent som värderar den första biten högst och kan få mest värde för den aktuella biten, tilldelas den. Detta upprepas tills det bara är en agent kvar och den får den biten som blir över av kakan (Procaccia, 2016). Proportionalitet hos Dubins-Spanier-algoritmen Egenskapen av proportionalitet garanteras då varje agent får en del Ai sådan att Vi(Ai)=1/n. Även den sista agenten j får garanteras minst att få minst 1/n då Vj(Ai) 1/n för alla i N \{ j}, och därmed är Vj(Aj) 1 (n 1)/n = 1/n. Varje del som agenterna innan tilldelats har den sista agenten värderat som mindre än eller lika med 1/n vilket innebär att den bit som är kvar måste vara större än eller lika med 1/n (Procaccia, 2016). En liknande algoritm Procaccia (2016) berättar att mer än tjugo år efter att Dubins-Spanier algoritmen föreslogs, kom Evan och Paz (1984) med en liknande algoritm. Den har samma garanti för proportionalitet men är mer beräkningsmässigt effektiv (Procaccia, 2016). Selfridge-Conway Procaccia (2016) beskriver det Brams och Taylor (1996) skrivit att oberoende av varandra konstruerade Selfridge och Conway på 1960talet en algoritm som hade avsaknad av avundsjuka givet tre agenter. Algoritmen består av tre delar: initiering, delning av tårta 1 och delning av tårta 2. Initiering, delning av tårta 1 och tårta 2 Initieringen börjar med att agent 1 delar kakan i tre bitar som enligt den är jämnt värderade X1, X2, X3: V1(X1) = V1(X2) = V1(X3) = 1/3. Agent 1 sätter värdet på alla delar till 1/3. Därefter skapar agent 2 två stycken, enligt agent 2 s värderingsfunktion, likvärdiga bitar genom att skära av en bit från den del som den värderar högst på ett sätt att den värderas lika mycket som den som den värderar näst högst. Därmed finns alltså fyra bitar. De tre bitarna som agent 1 delade på kallas nu tårta 1 (Procaccia, 2016). Det första steget av delningen av tårta 1 är att agent 3 väljer en av de tre bitarna av kaka 1. Om agent 3 väljer den delen som agent två från början värderat högst och skurit av en bit av får agent 2 välja mellan de andra två delarna av kaka 1. I alla andra fall får agent 2 den delen. Den agent i {2, 3} som fick den delen skriver vi nu som T, och den andra som. Agent 1 får den del som blir kvar av kaka 1 (Procaccia, 2016). För att dela tårta 2 börjar agent att dela tårta 2 i tre delar som den värderar lika. Därefter väljer agent T sin del, följt på agent 1 och till sist får agent den del som blir över (Procaccia, 2016). Avsaknad av avundsjuka i Selfridge-Conway Delningen av tårta 1 är fri från avundsjuka (Procaccia, 2016). Agent 3 får välja först, agent 2 från en av de delar som den ser som likvärdigt störst och agent 1 får en av de bitar som den ansåg var lika. Vid delningen av tårta 2 får agent T välja först och agent ser alla delarna som likvärdiga vilket gör att detta par inte kommer att vara avundsjuka sinsemellan. Agent 1 kommer inte att kunna vara avundsjuk på agent T som får välja före den då agent 1 har fått en tredjedel av tårtan i och med delen som den fick från tårta 1, allt den får av tårta 2 är ett överskott.

14 Komplexitetsanalys i att skära upp en tårta Procaccia (2016) menar att generellt sett finns det inte en finit diskret representation av probleminstansen. Finit innebär att den är garanterad att avslutas. Därför behöver en konkret komplexitetsmodell antas som specificerar vilka operationer en tårtdelningsalgoritm får använda. Komplexiteten kommer här att mätas via vilka restriktioner som finns på antalet tillåtna operationer (Procaccia, 2016). Robertson-Webb Procaccia (2016) beskriver det Robertson och Web (1998) talar om som standardmodellen för konkret komplexitet vid uppdelning av tårtor som är Robertson-Webbmodellen. Modellen är enkel men kraftfull nog att fånga algoritmerna såsom dela och välj, Dubins-Spanier, Even-paz och Selfrige- Conway. Denna har två frågeställningar, en som utvärderar och en som delar (Procaccia, 2016). Utvärderingsfunktion och delningsfunktion Utvärderingsfunktionen evali(x, y) = Vi(x, y). Funktionen evali(x, y) ber agenten i att utvärdera intervallen [x, y] (Procaccia, 2016). Delningsfunktionen cuti(x,α) = y där y är den punkt längst till vänster sådan att Vi(x,y)= α. Funktionen cuti(x,α) ber agenten i att skära en bit av kakan som har värdet α från och med en viss punkt x (Procaccia, 2016). Komplexitet av proportionell tårtuppdelning För att simulera algoritmen för att dela och välj beskriver Procaccia (2016) att agent 1 först får svara på funktionen cut1(0, 1/2) som svarar med en punkt y. Intervallet [0, y] värderar därmed agent 1 till att vara värt 1/2. Därefter får agent 2 svara på funktionen eval2(0, y), om agent 2 svarar att det är 1/2 eller mer vet vi att A1 =[y, 1], A2 =[0, y] är en proportionell tilldelning. Om så inte är fallet kan en proportionell tilldelning fås genom att byta tilldelningarna mellan agenterna (Procaccia, 2016). Procaccia (2016) beskriver att för att simulera det initialiserande steget i Selfridge-Conwayalgoritmen får först agent 1 svara på cut1(0,1/3) = y, följt på cut1(y,1/3) = z. Intervallen [0, y], [y, z] och [z, 1] kommer alla att vara värda 1/3 för agent 1. Sedan får agent 2 utvärdera dessa tre intervall. Om till exempel agent 2 värderar V2(0,y) >V 2(y,z) V2(z,1) därmed för att skära av den största biten bes agent 2 att cut2(0,v2(0, y) V2(y, z)) = w. Intervallet som är tårta 2 blir då [0, w] (Procaccia, 2016). Komplexitet av avundsjukfri tårtuppdelning Komplexiteten av proportionell uppdelning av resurser har enligt Procaccia (2016) varit enkelt att förstå, medan det tog flera årtionden för att till exempel Selfridge-Conway algoritmen skulle utvecklas till att fungera för vilket antal agenter som helst. Procaccia (2016) beskriver att Brams och Taylor (1995) har gjort en finit, diskret funktion utan avundsjuka som kan bli simulerad via funktionerna eval och cut. Däremot är tiden som det tar för den utan gränser, till skillnad från Dubins-Spanier och Even-Paz algoritmerna som har ett begränsat antal gånger som den behöver köra en eval- eller cutfunktion (Procaccia, 2016).

15 Procaccia (2016) menade att det i nuläget, fanns två delsvar på frågan det är omöjligt att designa en begränsad algoritm utan avundsjuka. Det ena begränsar fördelningarna till att vara kontinuerligt angränsande (Procaccia, 2016). Procaccia (2016) beskriver teoremet som Strömquist (2008) beskrev. För alla n 3 finns ingen finit algoritm utan avundsjuka med angränsande fördelningar.

16 Applicering Beslutsteori Russel och Norvig menar att beslutsteori beskriver hur agenten bör agera och är därmed en normativ teori. En deskriptiv teori beskriver å andra sidan hur faktiska agenter handlar, till exempel människor som ofta handlar motsatt mot vad som kan ses som rationellt. Beslutsteori är en kombination av sannolikhet och nyttor (Russel & Norvig, 2014). Mikromort Russel och Norvig berättar att i problem som involverar val av medicin, miljö och transport brukar värsta tänkbara scenario antas vara dödfall hos en eller flera personer. Dock är det många som tycker att det känns olustigt att sätta ett värde till mänskligt liv. Paradoxalt nog blir ofta resultatet av att inte sätta värde på mänskligt liv att valen som görs undervärderar liv. Det finns olika försök till att låta människor själva sätta värde på sitt liv. Ett sådant försök är mikromort där människor får säga den mängd pengar de är villiga riskera att dö med en sannolikhet av en i på en miljon. Däremot stämmer inte människors beteende överens med deras uppskattning. Detta kan ses i människans olika biases. Exempelvis vill inte människor i allmänhet betala en viss summa för att minska mängden mikromort vid till exempel ett köp av en säkrare bil, men värderar samma mängd mikromort i det teoretiska exemplet till en högre summa (Russel & Norvig, 2014). Riskaversion eller risksökande Penningpreferens säger att om allt annat är likvärdigt föredrar en agent mer pengar framför mindre pengar enligt Russel och Norvig. Förväntat penningvärde är de adderade utfallen i pengar multiplicerat med deras respektive sannolikheter. Nyttan är inte i direkt proportion till penningvärdet eftersom att nyttan av att tjäna mer pengar beror på hur mycket pengar du redan har tjänat (Russel & Norvig, 2014). Agenter kan vara riskaversiva eller risksökande. En riskaversiv agent föredrar ett val med mindre förväntat penningvärde men med mer säkerhet framför ett val med större förväntat penningvärde och större risk. En risksökande agent har det motsatta agerandet och föredrar större förväntat penningvärde oavsett risk. En agent kan även vara riskneutral och då antas risk med neutralitet (Russel & Norvig, 2014). Beslutsnätverk Russel och Norvig beskriver beslutsnätverk som en kompakt grafisk och matematisk representation av en beslutssituation. De kombinerar Bayesianska nät med ytterligare noder för beslut och nytta (Russel & Norvig, 2014). Slumpnoder Slumpnoder representeras som ovaler, som i Bayesianska nät. De variabler som agenten kan vara osäker på. Varje slumpnod har en ansluten betingad sannolikhetsfördelning som beror på förändranoden som i ett beslutsnätverk både kan vara en slumpnod eller en beslutsnod (Russel & Norvig, 2014). Beslutsnoder Representeras som rektanglar och är de punkter där agenten har ett val att ta till handling. Den kan ta olika värden beroende på vad för val agenten gör och kan vidare påverka slumpnoder. När beslutsnoden är satt beter den sig precis som en slumpnod (Russel & Norvig, 2014).

17 Nyttonoder Nyttonoder har diamantform. Nyttonoden kan även kallas för värdenod och representerar agentens nyttofunktion. Nyttonodens föräldrar är alla variabler som beskriver resultatet som direkt påverkar nyttan. Till nyttonoden hör en beskrivning av agentens nytta som en funktion av föräldrarnas attribut vilket till exempel kan vara en tabell (Russel & Norvig, 2014). Nyttofunktion för handling i beslutsnätverk Det finns nätverk som väljer bort slumpnodernas beskrivning av det resulterande tillståndet. Istället låts nyttonoderna vara direkt kopplade till beslutsnoden. I detta fall representerar inte längre nyttonoden nyttofunktionen utan den förväntade nytta som hör till varje handling. Noden är då kopplat till en nyttofunktion för handling och skapar en förenklad och sammanställd representation av problemet som är mindre flexibel men har en kompaktare representation (Russel & Norvig, 2014). Utvärderingsalgoritm för handlingar i beslutsnätverk Handlingar väljs genom att utvärdera beslutsnätverket för varje möjligt värde på beslutsnoden. Det finns en algoritm för att utvärdera ett beslutsnätverk. Det första steget är att sätta vittnesvariblerna till det nuvarande tillståndet. Följaktligen räknas nyttan för det aktuella valet ut för varje val som kan göras. Detta genom att beslutsnodens alla värden itereras med stegen att beslutsnoden först sätts till det aktuella värdet och genom en vanlig probabilistisk inferensalgoritm räknas de posteriorella sannolikheterna ut för föräldranoderna till nyttonoden, för att räkna ut nyttan på den aktuella handlingen. Sedan returneras handlingen med den högsta nyttan (Russel & Norvig, 2014). Värdet av information I besluttagande är det viktigt att veta vilken information som krävs för att ta ett beslut. Informationens värde grundas i att den ger kunskapen att anpassa handlingen för att utifrån den faktiska situationen. Generellt sett är värdet på information definierat som skillnaden i förväntat värde mellan de bästa handlingarna före och efter agenten tagit del av informationen. Informationen har alltså bara ett värde om den kan skapa en förändring på planen som för det signifikant bättre än den ursprungliga planen (Russel & Norvig, 2014). Informationsvärdesteorin ger agenten valet av hur mycket information den behöver. Informationsvärdesteorin involverar en förenklad form av sekventiell beslutstagande. Förenklingen är att observationerna inte påverkar agentens fysiska tillstånd utan dess upplevda tillstånd (Russel & Norvig, 2014). En förnuftig agent borde ställa frågor i en logisk ordning, undvika frågor som är irrelevanta, värdera varje information i relation till dess kostnad och sluta ställa frågor när det är rimligt. Om agenten ska kommunicera med en människa kan det även vara bra att ställa frågor på ett sätt som upplevs vettigt från människans synvinkel, för att få bättre svar. Detta för att maximera den totala nyttan av systemet tillsammans med människan snarare än att maximera värdet av informationen (Russel & Norvig, 2014). Beslutsteoretiska expertsystem Beslutsteoretiska expertsystem kan vara till god nytta till exempel när diagnos ska ställas eller beslut ska tas angående genomförandet av en kritisk operation (Russel & Norvig, 2014). De tidiga beslutsteoretiska expertsystemen var tänkta som stöd för att säkerställa att de personer som tog beslut gjorde det i enlighet med deras egna preferenser. Utvecklingen har rört sig mer och mer mot att systemen istället ser till att de automatiska processerna beter sig

18 som tänkt. Framväxten av bayesianska nät i slutet av 1980talet gav möjligheten att öka skalan på system som istället för att vara villkorsbaserade genererade probabilistiskt inferens från vittnesmål i omgivningen. Utvecklingen av beslutsnätverk gjorde att expertsystemen kunde utvecklas till att rekommendera de optimala valen som reflekterar på preferenserna hos agenten tillsammans med tillgänglig information om omvärlden. Ett system som överväger nyttor kan undvika att använda förenklingar som till exempel använda den mest vanliga lösningen. Ett expertsystem måste ju ta i åtanke både sannolikheter och nytta (Russel & Norvig, 2014). 1. Kausal modell Processen att skapa ett beslutsteoretiskt expertsytsem kan delas upp i steg där det första steget är att skapa en kausal modell. Definiera delarna i vad som expertsystemet ska ta beslut om (Russel & Norvig, 2014). 2. Kvalitativ beslutsmodell Steget därefter är att förenkla till en kvalitativ beslutsmodell och därmed ta bort variabler som inte påverkar beslutet (Russel & Norvig, 2014). 3. Sannolikheter Sedan anges sannolikheter från databaser, litteraturstudier eller experter (Russel & Norvig, 2014). 4. Nytta Därefter anges nyttan. Vid ett lågt antal värden tilldelas nytta genom preferenselicitering. Om det är exponentiellt många värden behöver de kombineras genom att använda funktioner för flera attribut, till exempel addera värdena för varje enskild nyttovärde (Russel & Norvig, 2014). 5. Förfina modellen För att utvärdera systemet behövs en guldstandard, ett set av par där med korrekt svar till rätt indata. Detta kan jämföras med vad systemet matchar för rekommendationer för att sedan verifiera och förfina modellen (Russel & Norvig, 2014). 6. Känslighetsanalys Systematiskt undersöks om det bästa valet är känsligt för små skillnader genom att förändra parametrarna och utvärdera upprepade gånger (Russel & Norvig, 2014).

19 Avslutning Sammanfattning Nyttoteori innefattar agenter med nyttofunktioner som räknar ut förväntad nytta. Dessa kan användas för att finna maximal förväntad nytta. Att dela en tårta modelleras med en modell där värdefunktionen har särskilda egenskaper. Värdefunktionen används i algoritmer som har särskilda egenskaper för att uppnå olika aspekter av rättvisa. Dessa algoritmer är bland annat dela och välj, Dubins-spanier och Selfridge-conway. Komplexitetsanalys värderar algoritmerna som ger proportionell rättvisa simplare jämfört med de som ger frihet från avundsjuka. Nyttofunktioner appliceras i beslutsnätverken som beslutsteoretiska expertsystem bygger på. Att faktumet att det går att se maximal förväntad nytta som en definition av artificiell intelligens, gör att man i och med algoritmerna för tårtuppdelning kan göra system som inte bara maximerar nyttan för en agent utan för flera agenter och därmed skapa rättvisa. Avslut Det är få personer som inte tycker om tårtor, utöver detta samt faktumet att tårtan bara är en metafor, finns det mycket som är intressant med detta ämne. Att med algoritmer kunna räkna ut rättvisa fördelningar är något som kan vara användbart. Att det är ett beräkningsmässigt sätt är värdefullt eftersom att det kan ge en opartisk fördelning av resurser. Detta kan vara till god användning både på samhällsnivå och personlig nivå.

20 Litteraturförteckning Alon, N. (1987). Splitting Necklaces. Advances in Mathematics, 63, Brams, S. J., & Alan, T. D. (1996). Fair Division: from Cake-Cutting to Dispute Resolution. New York: Cambridge University Press. Brams, S. J., & Taylor, A. D. (1995). An Envy-free Cake Division protocol. The American Mathematical Monthly, 102(1), Even, S., & Paz, A. (1984). A note on cake cutting. Discrete Applied Mathematics(7), Procaccia, A. D. (2016). Cake cutting algorithms. i F. Brandt, V. Conitzer, U. Endriss, J. Lang, & A. D. Procaccia, Handbook of computational social choice (ss ). New York: Cambridge univeristy press. Robertson, J., & Webb, W. (1998). Cake-Cutting Algorithms: Be Fair If You can. Amer. Math. Monthly, 2000(107), Russel, S., & Norvig, P. (2014). Making simple decisions. i S. Russel, & P. Norvig, Artificiall Intelligence A modern Approach (tredje uppl., ss ). Harlow, England: Pearson Education Limited. Strömquist, W. (1980). How to Cut a Cake fairly. The Americal Mathematical Montthly, 87(8), Strömquist, W. (2008). Envy-free cake divisions cannot be found by finite protocols. The Electronic Journal of Combinatorics, 15, 1-10.