Sammanfattning Avslut Litteraturförteckning... 19
|
|
- Lars Fransson
- för 8 år sedan
- Visningar:
Transkript
1 ATT DELA EN TÅRTA SAMMANFATTNING För att nå rättvisa kan man använda olika algoritmer för att dela upp tårtan mellan olika agenter utifrån egenskaper som implicerar rättvisa. Linnea Bergsten Artificiell Intelligens 729G43 Algoritmer för rättvis fördelning av resurser
2 Innehåll Inledning... 4 Bakgrund... 5 Nyttoteori... 5 Begrepp inom nyttoteori... 5 Nyttofunktion U(s) Förväntad nytta EU(a e)... 5 Maximal förväntad nytta... 5 Nyttoteorins grundprinciper... 5 Benägenhet att kunna ordnas... 6 Transitivitet... 6 Kontinuitet... 6 Utbytbarhet... 6 Monotoni... 6 Upplöslighet... 6 Nyttofunktionen... 6 Preferenslictering... 6 Normaliserade nyttoutfall... 6 Standardlotteri... 7 Nyttoteori för flera attribut... 7 Dominans... 7 Attributens oberoende... 7 Att dela en tårta... 9 Modellen... 9 Modellens delar... 9 Värdetäthetsfunktion... 9 Värderingsfunktionens egenskaper... 9 Normalisering... 9 Delbarhet Ickenegativitet Additivitet Rättviseegenskaper Proportionalitet Avsaknad av avundsjuka Likhet... 10
3 Egenskaperna i relation till varandra Algoritmer Teorem för rättvisa Dela och välj Dubins-Spanier Stegen i Dubins-Spaniers-algoritmen Proportionalitet hos Dubins-Spanier-algoritmen En liknande algoritm Selfridge-Conway Initiering, delning av tårta 1 och tårta Avsaknad av avundsjuka i Selfridge-Conway Komplexitetsanalys i att skära upp en tårta Robertson-Webb Utvärderingsfunktion och delningsfunktion Komplexitet av proportionell tårtuppdelning Komplexitet av avundsjukfri tårtuppdelning Applicering Beslutsteori Mikromort Riskaversion eller risksökande Beslutsnätverk Slumpnoder Beslutsnoder Nyttonoder Nyttofunktion för handling i beslutsnätverk Utvärderingsalgoritm för handlingar i beslutsnätverk Värdet av information Beslutsteoretiska expertsystem Kausal modell Kvalitativ beslutsmodell Sannolikheter Nytta Förfina modellen Känslighetsanalys Avslutning... 18
4 Sammanfattning Avslut Litteraturförteckning... 19
5 Inledning En agent som baserar sina val på beslutslära kan göra rationella beslut baserade på vad den tror, sannolikhetslära, och vad den vill, nyttoteori, i en osäker värld med konflikterande mål. Beslutsnätverk är utvecklingar på Bayesianska nät och kan uttrycka och lösa beslutsproblem (Russel & Norvig, 2014). Nyttofunktionen är den som fångar en agents preferenser och nyttoteorin beskriver hur agenter värderar olika alternativ utifrån dess nyttofunktion (Russel & Norvig, 2014). När man delar upp en heterogen resurs mellan olika agenter, där man kan använda metaforen av att dela en tårta mellan olika agenter så tar man hänsyn till vad agenternas nyttofunktioner värderar de olika bitarna till (Procaccia, 2016). För att nå rättvisa kan man använda olika algoritmer för att dela upp resursen, tårtan, mellan de olika agenterna utifrån olika egenskaper som kan implicera rättvisa (Procaccia, 2016). Sannolikhetslära tillsammans med nyttoteori kan användas vid utvecklingen av beslutsteoretiska expertsystem.
6 Bakgrund Nyttoteori Nyttoteori beskriver vad en agent vill, det vill säga hur en rationell agent borde agera. Begrepp inom nyttoteori Nyttofunktion U(s). Nyttofunktionen fångar agentens preferenser. Den uttrycker hur gärna den vill nå ett visst tillstånd genom att tilldelas ett nummer (Russel & Norvig, 2014). U(s) Förväntad nytta EU(a e) En handlings förväntade nytta givet evidensen är resultatets genomsnittliga nyttovärde U(s ) viktat med sannolikheten att utfallet sker (P(RESULT(a)=s a,e)) (Russel & Norvig, 2014). EU(a e) = P(RESULT(a)=s a,e)u(s ) s För att räkna ut den förväntade nyttan krävs en komplett kausal modell av världen och väldigt stora Bayesianska nätverk för att det ska kunna gå att räkna ut det genomsnittliga nyttovärdet. Utöver detta krävs ofta planering eller sökning för att räkna ut utfallets nyttovärden (Russel & Norvig, 2014). Maximal förväntad nytta Principen av maximal förväntad nytta innebär att en rationell agent ska välja den handling som maximerar agentens förväntade nytta (Russel & Norvig, 2014). action = argmax EU(a e) a En agent som handlar på ett sätt som maximerar en nyttofunktion kommer att nå den hösta möjliga prestationen givet att nyttofunktionen reflekterar korrekt på prestandamätningen. Det går att se maximal förväntad nytta som en definition av artificiell intelligens, däremot löser och definierar det inte allt inom artificiell intelligens (Russel & Norvig, 2014). Beslutsteori bidrar till ett användbart ramverk inom artificiell intelligens. Principen av maximal förväntad nytta ger en praktisk tillämpning på det generella i att agenten ska ta ett rationellt beslut. Det agenten behöver göra är att räkna ut alla variabler och maximera nyttan över dessa handlingar. För att avgöra omgivningens tillstånd krävs bland annat perception, inlärning, kunskapsrepresentation och slutledningsförmåga (Russel & Norvig, 2014). Nyttoteorins grundprinciper Genom att definiera begräsningar på preferenserna som en rationell agent ska ha går det att visa att principen av maximal förväntad nytta kan härledas från begränsningarna såsom att det finns en nyttofunktion samt förväntad nytta av ett lotteri. Det som agenten ska välja preferenser för är huruvida den föredrar, ser likvärdighet gentemot två alternativ. Alternativen kan vara tillstånd i världen men också nya lotterier som kan ge antingen nya lotterier för tillstånd. Lotterierna är därmed uppsättningar av utfall som har olika sannolikheter, och när agenten väljer ett alternativ kommer ett av dessa utfall att dras (Russel & Norvig, 2014).
7 Begränsningarna nedan är grundprinciperna av nyttoteorin. Om en agent bryter mot en av dessa principer eller begränsningar kommer den att agera irrationellt. Dessa grundprinciper är alltså principer av företräde och säger ingenting om själva nyttofunktionen (Russel & Norvig, 2014). Benägenhet att kunna ordnas Givet två lotterier måste en rationell agent föredra antingen en framför en annan eller anse dem likvärdiga. Agenten kan inte välja att inte värdera dem (Russel & Norvig, 2014). Transitivitet Transitivitet måste gälla. Om en agent föredrar alternativ A framför alternativ B och alternativ B framför alternativ C måste agenten föredra alternativ A framför alternativ C (Russel & Norvig, 2014). Kontinuitet Om agenten föredrar A framför B och B framför C finns det en sannolikhet p att agenten är likvärdig inför att välja alternativ B eller att för alternativ A med en sannolikhet av p och alternativ C med en sannolikhet av p-1. Det vill säga att det finns ett osäkerhetsvärde för alternativ A där agenten kommer att se alternativet att vara säker på att få B vara jämförbart med att med en viss osäkerhet kunna få alternativ A och att annars få alternativ C (Russel & Norvig, 2014). Utbytbarhet Givet att agenten är likvärdig inför två alternativ är agenten också likvärdig inför att byta ut det ena alternativet mot det andra alternativet i komplexare lotterier (Russel & Norvig, 2014). Monotoni Om en agent föredrar ett alternativ framför ett annat kommer agenten att föredra det lotteriet med en större chans för alternativet som den föredrar (Russel & Norvig, 2014). Upplöslighet Lotterier som består av fler lotterier kan genom sannolikhetslagar reduceras till enklare lotterier (Russel & Norvig, 2014). Nyttofunktionen Nyttofunktionen är vad som kartlägger från lotterier till riktiga siffror. Nyttofunktionen måste följa grundprinciperna men vad den föredrar kan i princip vara vad som helst. En agent kan till exempel föredra att förlora framför att vinna ett spel, det gör den inte irrationell för det (Russel & Norvig, 2014). Preferenslictering Processen att reda ut vad ett beslutförande system har för nyttofunktion kallas preferenselicitering, där elicitering betyder att identifiera och fånga krav. Under preferenselicitering presenteras val för agenten och dess observerade reaktioner används för att ta reda på dess underliggande nyttofunktion (Russel & Norvig, 2014). Normaliserade nyttoutfall För att få en skala över vilka nyttoutfallen söks värsta och bästa tänkbara utfall fram. Normaliserade nyttoutfall använder en skala där värsta möjliga utfall är 0 och bästa tänkbara utfall är 1 (Russel & Norvig, 2014).
8 Standardlotteri Givet en skala mellan värsta och bästa tänkbara utfall går det att ta reda på nyttan för vilket utfall som helst genom att låta agenten välja mellan det utfallet och ett standardlotteri. I standardlotteriet finns en viss sannolikhet för bästa tänkbara scenario och att det i alla andra fall skulle värsta tänkbara scenario ske. Efter att ha låtit agenten välja justeras sannolikheterna i standardlotteriet tills agenten anser lotteriet och utfallet som undersöks likvärdiga. Givet en normaliserad skala är nyttan för utfallet samma som den sannolikheten för bästa tänkbara scenario i det fall där standardlotteriet ses som jämförbart (Russel & Norvig, 2014). Nyttoteori för flera attribut För problem där resultatet påverkar flera attribut används nyttoteori för flera attribut. För att hantera flera attribut används en vektor av tilldelningar för de olika attributen som värderar hur viktiga attributen är (Russel & Norvig, 2014). Dominans Om en agent i ett val mellan två alternativ finner att alla attribut i den en attributvektor är bättre än i den andra krävs inte någon vidare eftertanke. I detta fall finns det en strikt dominans av det ena valet framför det andra (Russel & Norvig, 2014). Strikt dominans är inte lika vanligt i verkliga problem som stokastisk dominans är. Det finns algoritmer för att ta rationella beslut utan att använda numeriska värden genom att istället basera sina val på stokastisk dominans. Ett exempel är när det finns två alternativ med respektive sannolikhet för en distribution av en kostnad i pengar, med ett antagande av att nyttan minskar med kostnaden. I det exemplet finns en stokastisk dominans för alternativet med större förväntad nytta framför det andra alternativet. Skulle däremot ett sådant alternativ jämföras med ett där kostnaden är känd kan inte längre det beslutet tas då inte nyttan av den kostnaden är känd. Detta kan upplevas paradoxalt men förklaras genom att även om valet blir enklare om den exakta kostnaden är okänd, är risken att det blir fel också större (Russel & Norvig, 2014). Givet att ett alternativ stokastiskt dominerar ett annat alternativ, gäller för en nyttofunktion som enbart stiger, att den förväntade nyttan av det första alternativet är åtminstone lika hög som den förväntade nyttan av det andra alternativet. Den kumulativa distributionen mäter sannolikheten att kostnaden är mindre än eller jämförbar beroende på vilket värde som ges. Om den kumulativa distributionen för det ena valet alltid har en större negativ kostnad än det andra är den ena valet billigare än den andra ur ett perspektiv av stokastisk dominans. Om en handling stokastiskt dominerar en annan handling vad det gäller alla attribut kan den dominerade handlingen väljas bort (Russel & Norvig, 2014). Attributens oberoende Nyttoteori för flera attribut bygger på att det finns en viss struktur i agentens nyttofunktion på ett sätt att det inte uppstår en kombinatorisk explosion. För att definiera den kompletta funktionen söks det efter strukturer i hur agenten tar beslut. Exempelvis kan det finnas att det är så enkelt att det räcker med att addera nyttan för de olika attributen för att nyttan för hela valet (Russel & Norvig, 2014). Den grundläggande struktur som hittas i en deterministisk omgivning är preferiellt oberoende. Strukturen bygger på att två attribut kan vara preferentiellt oberoende från ett tredje attribut. Givet att agentens beslut att välja mellan två alternativ inte beror på värdet av ett tredje alternativ är de två alternativet preferiellt oberoende från det tredje alternativet (Russel & Norvig, 2014).
9 Om ett set av alternativ parvis är preferiellt oberoende gentemot varandra är de ömsesidigt preferiellt obereoende. De kan alla vara viktiga, men värdet på ett av attributen påverkar inte värdet på de andra. Om ett set av värden är ömsesidigt preferiellt obereoende är dess gemensamma värdefunktion summan av varje enskild värdefunktion. En sådan funktion kallas en adderande värdefunktion. En adderande värdefunktion minskar antalet gånger agentens preferenser behöver undersökas (Russel & Norvig, 2014). I en omgivning med osäkerhet behövs strukturen för preferens mellan olika lotterier också tas i åtanke och förståelse för de nyttofunktioner som följer till skillnad från de värdefunktioner som gällde i den deterministiska världen (Russel & Norvig, 2014). Nyttovis oberoende innebär när ett set av attribut är nyttovis oberoende från ett annat set av attribut då preferenserna mellan lotterierna hos attributen i den ena alternativet är oberoende av värdena på attributen i hos det andra lotteriet. Ömsesidigt nyttovis oberoende gäller om varje delset av attribut är nyttovis oberoende av resten av attributen. Givet ömsesidigt nyttovis oberoende kan multiplicerande nyttofunktion användas (Russel & Norvig, 2014).
10 Att dela en tårta Procaccia beskriver två teman har funnits i forskningen kring tårtdelningsproblemet: att visa att det går att uppnå rättvisa och hur rättvisa kan uppnås. Tårtdelningsproblemet är ett leksaksproblem som utforskar ett beräkningsmässigt tänk i tilldelningen av delbara resurser (Procaccia, 2016). I detta avsnitt kommer fokus att lika på hur rättvisa kan uppnås utifrån olika algoritmer. Nedan kommer modellen för tårtdelningsproblemet; dess värderingsfunktions egenskaper; rättviseegenskaper som algoritmer som är tänkta att lösa tårtdelningsproblemet kan inneha; några av dessa algoritmer samt komplexitetsanalys av dessa att presenteras. Modellen Tårtan är den metafor som används för att prata om resurserna som ska fördelas olika parter, det handlar alltså inte om att skära i en verklig tårta. Tårtan ska vara en heterogen delbar resurs (Procaccia, 2016), det vill säga, den innehåller delar som är olika och den går att dela. Tårtan i metaforen har alltså olika dekorationer som de olika personerna som ska dela på tårtan värderar olika. Modellens delar I modellen som Procaccia (2016) beskriver finns en samling agenter N = {1,, n} och den heterogena delbara resursen, tårtan, som representeras av intervallet [0, 1]. Denna resurs har delintervallet I vars längd l(i) är l([x, y]) = y - x. Längden på ett intervall definieras därmed av avståndet mellan den start- och slutpunkten. Varje agent i N har en värderingsfunktion Vi som kartlägger hur agenten i sätter värde till ett givet delintervall I [0, 1] av kakan, Vi(I). Vi([x, y]) kan skrivas som det förenklade Vi(x, y). Värderingsfunktionerna förväntas följa följande egenskaper: normalisering, delbarhet och icke negativitet. Rättviseegenskaper som övervägs är proportionalitet, avsaknad av avundsjuka samt rättvisa ur likhetssynpunkt (Procaccia, 2016). Värdetäthetsfunktion Värderingsfunktionerna kan enligt Proccacia (2016) även modelleras i en värdetäthetsfunktion vi. Givet en del av resursen, en tårtbit X, låter vi Vi(X) = x X vi(x)dx. Likväl som för värderingsfunktionerna kan även värdetäthetsfunktionen antas värdera hela resursen till ett, Vi(X) = 1 x=0 vi(x)dx = Vi(0, 1) = 1 (Procaccia, 2016). Att en agents värderingsfunktion är styckvis konstant innebär att inom delintervall är delarna värderade lika, men att de olika delintervallen kan värderas olika. Där har man begränsat dess värderingsfunktioner till att bero på strukturen av dess värdetäthetsfunktion. Styckvis likformiga värderingar är en form av styckvis konstanta värderingsfunktioner. Styckvis likformiga värderingars värderingsfunktioner antingen är fasta på en konstant c > 0 eller är noll. En agent med en styckvis likformig värderingsfunktion har särskild aspekt som den gör vissa delar av resursen likformigt värdefulla och de andra är utan värde. Värderingsfunktionens egenskaper Normalisering Egenskapen av normalisering Vi(0, 1) = 1 innebär att värdet som en agent i sätter på delintervallet som består av hela kakan är 1. Att få allt är det bästa tänkbara scenariot.
11 Delbarhet Delbarhetsegenskapen definierar att för varje delintervall [x, y] och 0 λ 1 finns en punkt z [x,y] sådan att Vi(x, z) = λvi(x,y). Detta betyder att tårtan kan delas och att värdet beror på vilken del det är som värderas. Till exempel kommer värdet för ett delintervall mellan samma punkt i ett intervall, det vill säga att vara utan tårtbit, alltid att vara noll, Vi(x, x) = 0 för varje punkt x [0,1]. Delbarhetsegenskapen låter oss alltså att se bortom gränserna för intervallen, och kan dela tårtan hur vi vill. Ickenegativitet Ickenegativitetsegenskapen definierar att för varje delintervall I gäller att Vi(I) 0. Alla intervall har antingen ett positivt värde eller inget värde alls. Additivitet För additivitetsegenskapen gäller givet två delinterval I och I är det sammanlagda värdet för de två delintervallen är detsamma som värdet för de sammanlagda delintervallen, Vi(I)+Vi(I )= Vi(I I ). Värdet som agenten sätter till två enskilda intervall är detsamma som värdet agenten skulle sätta till de två intervallen om vore ett intervall trots att de inte är sammanhängande. Detta kan även uttryckas som värdet agenten i N sätter på en del X är Vi(X)= I X Vi(I), och dess längd är (X)= I X l(i). Att tårtbitens värde och längd är summan av värdet och längden på dess delar. Rättviseegenskaper Procaccia (2016) beskriver ett antal rättviseegenskaper som algoritmer för tårtdelning kan inneha. Detta avsnitt presenterar det procaccia proportionalitet, avsaknad av avundsjuka och likhet samt diskuterar dessa i relation till varandra som Procaccia beskrivit. Proportionalitet Rättviseegenskapen; proportionalitet, att för alla i N gäller att Vi(Ai) 1/n. Varje agent har ett värde som är åtminstone 1/n för sin del av kakan (Procaccia, 2016). Det finns ingen agent som har ett värde på sin del av kakan som är mindre än det totala värdet genom antalet agenter. Avsaknad av avundsjuka Rättviseegenskapen; avsaknad av avundsjuka, att för alla i,j N gäller att Vi(Ai) Vi(Aj) (Procaccia, 2016). Detta betyder att varje agent föredrar sin del av resurserna framför någon annan del, dess värderingsfunktion värderar dess del högre än eller lika med en del som någon annan agent tilldelats. Likhet Rättviseegenskapen som ser rättvisa ur likhetssynpunkt, att för alla i,j N gäller att Vi(Ai)= Vj(Aj) (Procaccia, 2016). Att två agenters värden på sina respektive bitar jämförs, värderas bitarna lika högt. Egenskaperna i relation till varandra Avsaknad av avundsjuka medför proportionalitet. Utifrån additivitetsegenskapen ses att det måste finnas en agent som har ett större eller lika stort värde på sin del som om man skulle dela värdet på hela resursen i antalet delar som det finns agenter. För tre agenter finns det tilldelningar som är proportionella men inte har avsaknad av avundsjuka. En agent kan värdera sin bit att vara värd 1/3 men värdera en annans agents bit till 1/2 och därmed vara
12 avundsjuk trots att den har tilldelats åtminstone minsta möjliga del av tårtan (Procaccia, 2016). Att se rättvisa ur likhetssynpunkt är vitt skiljt från egenskaperna av avsaknad av avundsjuka och proportionalitet. Det finns tilldelningar som är helt lika utdelade men inte följer egenskaperna av proportionalitet och avsaknad av avundsjuka. Den tilldelning som är har den största avsaknad av avundsjuka är inte rättvis ur likhetsynpunkt (Procaccia, 2016). Algoritmer Detta avsnitt inleds med att beskriva att det givet kontinuitet teoretiskt sett finns en rättvis tilldelning enligt alla de rättviseegenskaper som togs upp i förra avsnittet men att den är svår att finna (Procaccia, 2016). Detta avsnitt tar upp algoritmer som löser olika aspekter av rättvisa för olika antal agenter: dela och välj, Dubins-Spanier, Selfridge-Conway, samt komplexitetsanalys av algoritmer, Teorem för rättvisa Alon presenterar ett teorem som säger att givet kontinuitet hos värdedensitetsfunktionen finns det en tilldelning där varje agent värderar sin och alla andras bitar till exakt den del som värdet av hela resursen genom antalet agenter skulle ge (Alon, 1987). Kontinuitet som beskrevs i det tidigare avsnittet som säger att det finns ett osäkerhetsvärde för det mest prefererade valet som gör det jämförbart med att vara säker på att få det näst mest prefererade valet (Russel & Norvig, 2014). Detta menar Procaccia ger en tilldelning som är rättvis ur likhetssynpunkt, proportionalitet och har avsaknad av avundsjuka. Denna tilldelning är dock svår och i vissa fall omöjlig att finna (Procaccia, 2016). Dela och välj En algoritm som ger proportionalitet för två agenter är dela och välj (Procaccia, 2016). Procaccia beskriver att den ena agenten delar resurserna i två delar som den värderar lika, och sedan väljer den andra agenten den del som den föredrar och den första agenten får den bit som blir över. Värdet på de båda bitarna kommer bli ½, eftersom att för agenterna 1 och 2 där bitarna X1 och X2 kommer värdena att vara V1(X1)= V1(X2)=1/2 (Procaccia, 2016). En egenskap som algoritmen för dela och välj har är att oavsett en agent kan få sin beskärda del utan att den andra agenten följer algoritmen. Man gör därmed en skillnad på algoritmen och agentens strategier på ett sätt som kopplat till spelteoretiska frågor (Procaccia, 2016). Dubins-Spanier En algoritm som Procaccia (2016) beskriver och refererar till Dubins och Spanier som beskrivs av Strömquist (1980) garanterar en proportionell fördelning för alla olika antal agenter. Ursprungligen definierad för en kontinuerlig delning av resursen, men kommer här att förklaras utifrån en diskret delning. Stegen i Dubins-Spaniers-algoritmen I första rundan kommer varje agent i N göra en markering på punkt xi sådan att Vi(0, xi) = 1/n. Varje agent värderar den första delen av resursen och markerar hur den skulle dela den för att skapa en del som är värd lika mycket som en jämnt delad del skulle vara värd (Procaccia, 2016).
13 Agenten i* som gör markeringen som är längst till vänster, det vill säga den agent som värderar den första biten högst och kan få mest värde för den aktuella biten, tilldelas den. Detta upprepas tills det bara är en agent kvar och den får den biten som blir över av kakan (Procaccia, 2016). Proportionalitet hos Dubins-Spanier-algoritmen Egenskapen av proportionalitet garanteras då varje agent får en del Ai sådan att Vi(Ai)=1/n. Även den sista agenten j får garanteras minst att få minst 1/n då Vj(Ai) 1/n för alla i N \{ j}, och därmed är Vj(Aj) 1 (n 1)/n = 1/n. Varje del som agenterna innan tilldelats har den sista agenten värderat som mindre än eller lika med 1/n vilket innebär att den bit som är kvar måste vara större än eller lika med 1/n (Procaccia, 2016). En liknande algoritm Procaccia (2016) berättar att mer än tjugo år efter att Dubins-Spanier algoritmen föreslogs, kom Evan och Paz (1984) med en liknande algoritm. Den har samma garanti för proportionalitet men är mer beräkningsmässigt effektiv (Procaccia, 2016). Selfridge-Conway Procaccia (2016) beskriver det Brams och Taylor (1996) skrivit att oberoende av varandra konstruerade Selfridge och Conway på 1960talet en algoritm som hade avsaknad av avundsjuka givet tre agenter. Algoritmen består av tre delar: initiering, delning av tårta 1 och delning av tårta 2. Initiering, delning av tårta 1 och tårta 2 Initieringen börjar med att agent 1 delar kakan i tre bitar som enligt den är jämnt värderade X1, X2, X3: V1(X1) = V1(X2) = V1(X3) = 1/3. Agent 1 sätter värdet på alla delar till 1/3. Därefter skapar agent 2 två stycken, enligt agent 2 s värderingsfunktion, likvärdiga bitar genom att skära av en bit från den del som den värderar högst på ett sätt att den värderas lika mycket som den som den värderar näst högst. Därmed finns alltså fyra bitar. De tre bitarna som agent 1 delade på kallas nu tårta 1 (Procaccia, 2016). Det första steget av delningen av tårta 1 är att agent 3 väljer en av de tre bitarna av kaka 1. Om agent 3 väljer den delen som agent två från början värderat högst och skurit av en bit av får agent 2 välja mellan de andra två delarna av kaka 1. I alla andra fall får agent 2 den delen. Den agent i {2, 3} som fick den delen skriver vi nu som T, och den andra som. Agent 1 får den del som blir kvar av kaka 1 (Procaccia, 2016). För att dela tårta 2 börjar agent att dela tårta 2 i tre delar som den värderar lika. Därefter väljer agent T sin del, följt på agent 1 och till sist får agent den del som blir över (Procaccia, 2016). Avsaknad av avundsjuka i Selfridge-Conway Delningen av tårta 1 är fri från avundsjuka (Procaccia, 2016). Agent 3 får välja först, agent 2 från en av de delar som den ser som likvärdigt störst och agent 1 får en av de bitar som den ansåg var lika. Vid delningen av tårta 2 får agent T välja först och agent ser alla delarna som likvärdiga vilket gör att detta par inte kommer att vara avundsjuka sinsemellan. Agent 1 kommer inte att kunna vara avundsjuk på agent T som får välja före den då agent 1 har fått en tredjedel av tårtan i och med delen som den fick från tårta 1, allt den får av tårta 2 är ett överskott.
14 Komplexitetsanalys i att skära upp en tårta Procaccia (2016) menar att generellt sett finns det inte en finit diskret representation av probleminstansen. Finit innebär att den är garanterad att avslutas. Därför behöver en konkret komplexitetsmodell antas som specificerar vilka operationer en tårtdelningsalgoritm får använda. Komplexiteten kommer här att mätas via vilka restriktioner som finns på antalet tillåtna operationer (Procaccia, 2016). Robertson-Webb Procaccia (2016) beskriver det Robertson och Web (1998) talar om som standardmodellen för konkret komplexitet vid uppdelning av tårtor som är Robertson-Webbmodellen. Modellen är enkel men kraftfull nog att fånga algoritmerna såsom dela och välj, Dubins-Spanier, Even-paz och Selfrige- Conway. Denna har två frågeställningar, en som utvärderar och en som delar (Procaccia, 2016). Utvärderingsfunktion och delningsfunktion Utvärderingsfunktionen evali(x, y) = Vi(x, y). Funktionen evali(x, y) ber agenten i att utvärdera intervallen [x, y] (Procaccia, 2016). Delningsfunktionen cuti(x,α) = y där y är den punkt längst till vänster sådan att Vi(x,y)= α. Funktionen cuti(x,α) ber agenten i att skära en bit av kakan som har värdet α från och med en viss punkt x (Procaccia, 2016). Komplexitet av proportionell tårtuppdelning För att simulera algoritmen för att dela och välj beskriver Procaccia (2016) att agent 1 först får svara på funktionen cut1(0, 1/2) som svarar med en punkt y. Intervallet [0, y] värderar därmed agent 1 till att vara värt 1/2. Därefter får agent 2 svara på funktionen eval2(0, y), om agent 2 svarar att det är 1/2 eller mer vet vi att A1 =[y, 1], A2 =[0, y] är en proportionell tilldelning. Om så inte är fallet kan en proportionell tilldelning fås genom att byta tilldelningarna mellan agenterna (Procaccia, 2016). Procaccia (2016) beskriver att för att simulera det initialiserande steget i Selfridge-Conwayalgoritmen får först agent 1 svara på cut1(0,1/3) = y, följt på cut1(y,1/3) = z. Intervallen [0, y], [y, z] och [z, 1] kommer alla att vara värda 1/3 för agent 1. Sedan får agent 2 utvärdera dessa tre intervall. Om till exempel agent 2 värderar V2(0,y) >V 2(y,z) V2(z,1) därmed för att skära av den största biten bes agent 2 att cut2(0,v2(0, y) V2(y, z)) = w. Intervallet som är tårta 2 blir då [0, w] (Procaccia, 2016). Komplexitet av avundsjukfri tårtuppdelning Komplexiteten av proportionell uppdelning av resurser har enligt Procaccia (2016) varit enkelt att förstå, medan det tog flera årtionden för att till exempel Selfridge-Conway algoritmen skulle utvecklas till att fungera för vilket antal agenter som helst. Procaccia (2016) beskriver att Brams och Taylor (1995) har gjort en finit, diskret funktion utan avundsjuka som kan bli simulerad via funktionerna eval och cut. Däremot är tiden som det tar för den utan gränser, till skillnad från Dubins-Spanier och Even-Paz algoritmerna som har ett begränsat antal gånger som den behöver köra en eval- eller cutfunktion (Procaccia, 2016).
15 Procaccia (2016) menade att det i nuläget, fanns två delsvar på frågan det är omöjligt att designa en begränsad algoritm utan avundsjuka. Det ena begränsar fördelningarna till att vara kontinuerligt angränsande (Procaccia, 2016). Procaccia (2016) beskriver teoremet som Strömquist (2008) beskrev. För alla n 3 finns ingen finit algoritm utan avundsjuka med angränsande fördelningar.
16 Applicering Beslutsteori Russel och Norvig menar att beslutsteori beskriver hur agenten bör agera och är därmed en normativ teori. En deskriptiv teori beskriver å andra sidan hur faktiska agenter handlar, till exempel människor som ofta handlar motsatt mot vad som kan ses som rationellt. Beslutsteori är en kombination av sannolikhet och nyttor (Russel & Norvig, 2014). Mikromort Russel och Norvig berättar att i problem som involverar val av medicin, miljö och transport brukar värsta tänkbara scenario antas vara dödfall hos en eller flera personer. Dock är det många som tycker att det känns olustigt att sätta ett värde till mänskligt liv. Paradoxalt nog blir ofta resultatet av att inte sätta värde på mänskligt liv att valen som görs undervärderar liv. Det finns olika försök till att låta människor själva sätta värde på sitt liv. Ett sådant försök är mikromort där människor får säga den mängd pengar de är villiga riskera att dö med en sannolikhet av en i på en miljon. Däremot stämmer inte människors beteende överens med deras uppskattning. Detta kan ses i människans olika biases. Exempelvis vill inte människor i allmänhet betala en viss summa för att minska mängden mikromort vid till exempel ett köp av en säkrare bil, men värderar samma mängd mikromort i det teoretiska exemplet till en högre summa (Russel & Norvig, 2014). Riskaversion eller risksökande Penningpreferens säger att om allt annat är likvärdigt föredrar en agent mer pengar framför mindre pengar enligt Russel och Norvig. Förväntat penningvärde är de adderade utfallen i pengar multiplicerat med deras respektive sannolikheter. Nyttan är inte i direkt proportion till penningvärdet eftersom att nyttan av att tjäna mer pengar beror på hur mycket pengar du redan har tjänat (Russel & Norvig, 2014). Agenter kan vara riskaversiva eller risksökande. En riskaversiv agent föredrar ett val med mindre förväntat penningvärde men med mer säkerhet framför ett val med större förväntat penningvärde och större risk. En risksökande agent har det motsatta agerandet och föredrar större förväntat penningvärde oavsett risk. En agent kan även vara riskneutral och då antas risk med neutralitet (Russel & Norvig, 2014). Beslutsnätverk Russel och Norvig beskriver beslutsnätverk som en kompakt grafisk och matematisk representation av en beslutssituation. De kombinerar Bayesianska nät med ytterligare noder för beslut och nytta (Russel & Norvig, 2014). Slumpnoder Slumpnoder representeras som ovaler, som i Bayesianska nät. De variabler som agenten kan vara osäker på. Varje slumpnod har en ansluten betingad sannolikhetsfördelning som beror på förändranoden som i ett beslutsnätverk både kan vara en slumpnod eller en beslutsnod (Russel & Norvig, 2014). Beslutsnoder Representeras som rektanglar och är de punkter där agenten har ett val att ta till handling. Den kan ta olika värden beroende på vad för val agenten gör och kan vidare påverka slumpnoder. När beslutsnoden är satt beter den sig precis som en slumpnod (Russel & Norvig, 2014).
17 Nyttonoder Nyttonoder har diamantform. Nyttonoden kan även kallas för värdenod och representerar agentens nyttofunktion. Nyttonodens föräldrar är alla variabler som beskriver resultatet som direkt påverkar nyttan. Till nyttonoden hör en beskrivning av agentens nytta som en funktion av föräldrarnas attribut vilket till exempel kan vara en tabell (Russel & Norvig, 2014). Nyttofunktion för handling i beslutsnätverk Det finns nätverk som väljer bort slumpnodernas beskrivning av det resulterande tillståndet. Istället låts nyttonoderna vara direkt kopplade till beslutsnoden. I detta fall representerar inte längre nyttonoden nyttofunktionen utan den förväntade nytta som hör till varje handling. Noden är då kopplat till en nyttofunktion för handling och skapar en förenklad och sammanställd representation av problemet som är mindre flexibel men har en kompaktare representation (Russel & Norvig, 2014). Utvärderingsalgoritm för handlingar i beslutsnätverk Handlingar väljs genom att utvärdera beslutsnätverket för varje möjligt värde på beslutsnoden. Det finns en algoritm för att utvärdera ett beslutsnätverk. Det första steget är att sätta vittnesvariblerna till det nuvarande tillståndet. Följaktligen räknas nyttan för det aktuella valet ut för varje val som kan göras. Detta genom att beslutsnodens alla värden itereras med stegen att beslutsnoden först sätts till det aktuella värdet och genom en vanlig probabilistisk inferensalgoritm räknas de posteriorella sannolikheterna ut för föräldranoderna till nyttonoden, för att räkna ut nyttan på den aktuella handlingen. Sedan returneras handlingen med den högsta nyttan (Russel & Norvig, 2014). Värdet av information I besluttagande är det viktigt att veta vilken information som krävs för att ta ett beslut. Informationens värde grundas i att den ger kunskapen att anpassa handlingen för att utifrån den faktiska situationen. Generellt sett är värdet på information definierat som skillnaden i förväntat värde mellan de bästa handlingarna före och efter agenten tagit del av informationen. Informationen har alltså bara ett värde om den kan skapa en förändring på planen som för det signifikant bättre än den ursprungliga planen (Russel & Norvig, 2014). Informationsvärdesteorin ger agenten valet av hur mycket information den behöver. Informationsvärdesteorin involverar en förenklad form av sekventiell beslutstagande. Förenklingen är att observationerna inte påverkar agentens fysiska tillstånd utan dess upplevda tillstånd (Russel & Norvig, 2014). En förnuftig agent borde ställa frågor i en logisk ordning, undvika frågor som är irrelevanta, värdera varje information i relation till dess kostnad och sluta ställa frågor när det är rimligt. Om agenten ska kommunicera med en människa kan det även vara bra att ställa frågor på ett sätt som upplevs vettigt från människans synvinkel, för att få bättre svar. Detta för att maximera den totala nyttan av systemet tillsammans med människan snarare än att maximera värdet av informationen (Russel & Norvig, 2014). Beslutsteoretiska expertsystem Beslutsteoretiska expertsystem kan vara till god nytta till exempel när diagnos ska ställas eller beslut ska tas angående genomförandet av en kritisk operation (Russel & Norvig, 2014). De tidiga beslutsteoretiska expertsystemen var tänkta som stöd för att säkerställa att de personer som tog beslut gjorde det i enlighet med deras egna preferenser. Utvecklingen har rört sig mer och mer mot att systemen istället ser till att de automatiska processerna beter sig
18 som tänkt. Framväxten av bayesianska nät i slutet av 1980talet gav möjligheten att öka skalan på system som istället för att vara villkorsbaserade genererade probabilistiskt inferens från vittnesmål i omgivningen. Utvecklingen av beslutsnätverk gjorde att expertsystemen kunde utvecklas till att rekommendera de optimala valen som reflekterar på preferenserna hos agenten tillsammans med tillgänglig information om omvärlden. Ett system som överväger nyttor kan undvika att använda förenklingar som till exempel använda den mest vanliga lösningen. Ett expertsystem måste ju ta i åtanke både sannolikheter och nytta (Russel & Norvig, 2014). 1. Kausal modell Processen att skapa ett beslutsteoretiskt expertsytsem kan delas upp i steg där det första steget är att skapa en kausal modell. Definiera delarna i vad som expertsystemet ska ta beslut om (Russel & Norvig, 2014). 2. Kvalitativ beslutsmodell Steget därefter är att förenkla till en kvalitativ beslutsmodell och därmed ta bort variabler som inte påverkar beslutet (Russel & Norvig, 2014). 3. Sannolikheter Sedan anges sannolikheter från databaser, litteraturstudier eller experter (Russel & Norvig, 2014). 4. Nytta Därefter anges nyttan. Vid ett lågt antal värden tilldelas nytta genom preferenselicitering. Om det är exponentiellt många värden behöver de kombineras genom att använda funktioner för flera attribut, till exempel addera värdena för varje enskild nyttovärde (Russel & Norvig, 2014). 5. Förfina modellen För att utvärdera systemet behövs en guldstandard, ett set av par där med korrekt svar till rätt indata. Detta kan jämföras med vad systemet matchar för rekommendationer för att sedan verifiera och förfina modellen (Russel & Norvig, 2014). 6. Känslighetsanalys Systematiskt undersöks om det bästa valet är känsligt för små skillnader genom att förändra parametrarna och utvärdera upprepade gånger (Russel & Norvig, 2014).
19 Avslutning Sammanfattning Nyttoteori innefattar agenter med nyttofunktioner som räknar ut förväntad nytta. Dessa kan användas för att finna maximal förväntad nytta. Att dela en tårta modelleras med en modell där värdefunktionen har särskilda egenskaper. Värdefunktionen används i algoritmer som har särskilda egenskaper för att uppnå olika aspekter av rättvisa. Dessa algoritmer är bland annat dela och välj, Dubins-spanier och Selfridge-conway. Komplexitetsanalys värderar algoritmerna som ger proportionell rättvisa simplare jämfört med de som ger frihet från avundsjuka. Nyttofunktioner appliceras i beslutsnätverken som beslutsteoretiska expertsystem bygger på. Att faktumet att det går att se maximal förväntad nytta som en definition av artificiell intelligens, gör att man i och med algoritmerna för tårtuppdelning kan göra system som inte bara maximerar nyttan för en agent utan för flera agenter och därmed skapa rättvisa. Avslut Det är få personer som inte tycker om tårtor, utöver detta samt faktumet att tårtan bara är en metafor, finns det mycket som är intressant med detta ämne. Att med algoritmer kunna räkna ut rättvisa fördelningar är något som kan vara användbart. Att det är ett beräkningsmässigt sätt är värdefullt eftersom att det kan ge en opartisk fördelning av resurser. Detta kan vara till god användning både på samhällsnivå och personlig nivå.
20 Litteraturförteckning Alon, N. (1987). Splitting Necklaces. Advances in Mathematics, 63, Brams, S. J., & Alan, T. D. (1996). Fair Division: from Cake-Cutting to Dispute Resolution. New York: Cambridge University Press. Brams, S. J., & Taylor, A. D. (1995). An Envy-free Cake Division protocol. The American Mathematical Monthly, 102(1), Even, S., & Paz, A. (1984). A note on cake cutting. Discrete Applied Mathematics(7), Procaccia, A. D. (2016). Cake cutting algorithms. i F. Brandt, V. Conitzer, U. Endriss, J. Lang, & A. D. Procaccia, Handbook of computational social choice (ss ). New York: Cambridge univeristy press. Robertson, J., & Webb, W. (1998). Cake-Cutting Algorithms: Be Fair If You can. Amer. Math. Monthly, 2000(107), Russel, S., & Norvig, P. (2014). Making simple decisions. i S. Russel, & P. Norvig, Artificiall Intelligence A modern Approach (tredje uppl., ss ). Harlow, England: Pearson Education Limited. Strömquist, W. (1980). How to Cut a Cake fairly. The Americal Mathematical Montthly, 87(8), Strömquist, W. (2008). Envy-free cake divisions cannot be found by finite protocols. The Electronic Journal of Combinatorics, 15, 1-10.
Cake-cutting. att fördela resurser på ett rättvist sätt. Ebba Lindström
Cake-cutting att fördela resurser på ett rättvist sätt Ebba Lindström Innehållsförteckning Inledning 3 Utility Theory 3 Orderability 4 Transitivity 4 Continuity 4 Monotonicity 5 Decomposability 5 Cake-cutting
de var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Probabilistisk logik 2
729G43 Artificiell intelligens / 2016 Probabilistisk logik 2 Marco Kuhlmann Institutionen för datavetenskap Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk
Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Laboration 2. Artificiell Intelligens, Ht 2004 2004-10-19 Lärare: Christina Olsén Handledare: Therese Edvall Daniel Ölvebrink
Artificiell Intelligens, Ht 2004 2004-10-19 Lärare: Christina Olsén Handledare: Therese Edvall Daniel Ölvebrink Laboration 2 Laboranter: Johan Bystedt (dit02lbt) Alexander Pettersson (dit02apn) Stefan
Probabilistisk logik 1
729G43 Artificiell intelligens / 2016 Probabilistisk logik 1 Marco Kuhlmann Institutionen för datavetenskap Osäkerhet 1.01 Osäkerhet Agenter måste kunna hantera osäkerhet. Agentens miljö är ofta endast
Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad för att man skall
Anna: Bertil: Cecilia:
Marco Kuhlmann 1 Osäkerhet 1.01 1.02 1.03 1.04 1.05 Intelligenta agenter måste kunna hantera osäkerhet. Världen är endast delvist observerbar och stokastisk. (Jmf. Russell och Norvig, 2014, avsnitt 2.3.2.)
Antag att följande träd genereras i ett spelförande program om vi applicerar evalueringsfunktionen
1. Komplexiteten hos en agent beror mycket på vilken omgivning den skall verka i. Vad innebär det att en omgivning är stokastisk, episodisk och dynamisk? Ge exempel på en omgivning som är stokastisk, episodisk
Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Resträkning och ekvationer
64 Resträkning och ekvationer Torsten Ekedahl Stockholms Universitet Beskrivning av uppgiften. Specialarbetet består i att sätta sig in i hur man räknar med rester vid division med primtal, hur man löser
Föreläsninsanteckningar till föreläsning 3: Entropi
Föreläsninsanteckningar till föreläsning 3: Entropi Johan Håstad, transkriberat av Pehr Söderman 2006-01-20 1 Entropi Entropi är, inom kryptografin, ett mått på informationsinnehållet i en slumpvariabel.
1 Mätdata och statistik
Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS
Datorövning 2 Statistisk teori med tillämpningar Simulering i SAS Syfte Att simulera data är en metod som ofta används inom forskning inom ett stort antal ämnen, exempelvis nationalekonomi, fysik, miljövetenskap
Monte Carlo-metoder. Bild från Monte Carlo
Monte Carlo-metoder 0 Målen för föreläsningen På datorn Bild från Monte Carlo http://en.wikipedia.org/wiki/file:real_monte_carlo_casino.jpg 1 Begrepp En stokastisk metod ger olika resultat vid upprepning
Förfluten tid Nu Framtiden. Bedömning Värdering Kunskaper Integration Konsekvenser Beslut Genomförande
Beslutsfattandets psykologi ht 2010: Översikt och kort historik Val (eng. choice) Beslutsfattande (eng. decision making) Vad handlar beslutsfattande och bedömningar om? Beslutsfattande : beslutsprocessen
TSFS06: Bayesianska nätverk i GeNIe - kort handledning
TSFS06: Bayesianska nätverk i GeNIe - kort handledning GeNIe är en grafisk utvecklingsmiljö för inferensberäkningar med bland annat Bayesianska nätverk. Verktyget är utvecklat vid Decision Systems Laboratory,
Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS
Datorövning 3 Statistisk teori med tillämpningar Simulering i SAS Syfte Att simulera data är en metod som ofta används inom forskning inom ett stort antal ämnen, exempelvis nationalekonomi, fysik, miljövetenskap
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts.
Datakompression fö 3 p.3 Datakompression fö 3 p.4 Optimala koder Övre gräns för optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning)
Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or.
Datakompression fö 3 p.1 Optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning) som har lägre kodordsmedellängd. Det existerar förstås
Recension. Tänka, snabbt och långsamt Daniel Kahneman Översättning: Pär Svensson Volante, Stockholm, 2013, 511 s. ISBN 978 91 86 81572 1
Recension Tänka, snabbt och långsamt Daniel Kahneman Översättning: Pär Svensson Volante, Stockholm, 2013, 511 s. ISBN 978 91 86 81572 1 Av de tre orden i titeln på denna bok syftar det första, tänka, på
I en deterministisk omgivning beror nästa tillstånd bara av agentens handling och nuvarande tillstånd.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Statistikens grunder HT, dagtid Statistiska institutionen
Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet
Regression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)
Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel-
Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT
Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Jointly distributed Joint probability function Marginal probability function Conditional probability function Independence
729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Ekvivalensrelationer
Abstrakt datatyp för disjunkta mängder Vi skall presentera en abstrakt datatyp för att representera disjunkta mängder Kan bl.a. användas för att lösa ekvivalensproblemet avgör om två godtyckliga element
Föreläsning 3: Osäkerhet och sannolikhet
Föreläsning 3: Osäkerhet och sannolikhet Litteratur: Hansson, Introduction to Decision Theory, kap 8 (Även kap 6 är relevant) Resnik, Choices, kap 3 *Galavotti, Philosophical Introduction to Probability,
Föreläsning 5: Dynamisk programmering
Föreläsning 5: Dynamisk programmering Vi betraktar en typ av problem vi tidigare sett: Indata: En uppsättning intervall [s i,f i ] med vikt w i. Mål: Att hitta en uppsättning icke överlappande intervall
Vinjetter TDDC91 Datastrukturer och algoritmer
Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.
HKGBB0, Artificiell intelligens
HKGBB0, Artificiell intelligens Kortfattade lösningsförslag till tentan 3 november 2005 Arne Jönsson 1. Vad karaktäriserar dagens AI-forskning jämfört med den AI-forskning som bedrevs perioden 1960-1985.
TDDI16 Datastrukturer och algoritmer. Algoritmanalys
TDDI16 Datastrukturer och algoritmer Algoritmanalys 2017-08-28 2 Översikt Skäl för att analysera algoritmer Olika fall att tänka på Medelfall Bästa Värsta Metoder för analys 2017-08-28 3 Skäl till att
Shannon-Fano-Elias-kodning
Datakompression fö 5 p.1 Shannon-Fano-Elias-kodning Antag att vi har en minnesfri källa X i som tar värden i {1, 2,...,L}. Antag att sannolikheterna för alla symboler är strikt positiva: p(i) > 0, i. Fördelningsfunktionen
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar
Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi
Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 00-1-03 Lars Engebretsen 00-1-03 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner
Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade
HT 2011 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas in senast 29/9 kl 16.30.
Asymptotisk komplexitetsanalys
1 Asymptotisk komplexitetsanalys 2 Lars Larsson 3 4 VT 2007 5 Lars Larsson Asymptotisk komplexitetsanalys 1 Lars Larsson Asymptotisk komplexitetsanalys 2 et med denna föreläsning är att studenterna skall:
f(x) = 2 x2, 1 < x < 2.
Avd. Matematisk statistik TENTAMEN I SF90,SF907,SF908,SF9 SANNOLIKHETSTEORI OCH STATISTIK TORSDAGEN DEN 7:E JUNI 0 KL 4.00 9.00. Examinator: Gunnar Englund, tel. 07 7 45 Tillåtna hjälpmedel: Formel- och
Föreläsning 9: NP-fullständighet
Föreläsning 9: NP-fullständighet Olika typer av problem: 1. Beslutsproblem: A(x) =Ja. 2. Optimeringsproblem: A(x) =m Vanligen max/min. 3. Konstruktionsproblem: A(x) =En struktur. Vanligen lösningen till
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,
1 Föreläsning I, Mängdlära och elementär sannolikhetsteori, LMA201, LMA521 1.1 Mängd (Kapitel 1) En (oordnad) mängd A är en uppsättning av element. En sådan mängd kan innehålla ändligt eller oändlligt
GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON
2018 GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON Innehåll Inledning & Bakgrund... 2 Förstärkt inlärning... 2 MDP... 2 Gridworld... 3 Nytta och policy... 4 Värdefunktion och Bellmanekvationer...
Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 003-11-18 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner i polynomisk tid. Kanske
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)
Statistiska institutionen VT 2012 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas
Tal i bråkform. Kapitlet behandlar. Att förstå tal
Tal i bråkform Kapitlet behandlar Test Användning av hälften och fjärdedel 2 Representation i bråkform av del av antal och av del av helhet 3, Bråkform i vardagssituationer Stambråk, bråkuttryck med 1
IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare
Fibonacci / översättning från engelska IBSE Ett självreflekterande(självkritiskt) verktyg för lärare Riktlinjer för lärare Vad är det? Detta verktyg för självutvärdering sätter upp kriterier som gör det
Matematisk statistik - Slumpens matematik
Matematisk Statistik Matematisk statistik är slumpens matematik. Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och Pascal 1654. Modern matematisk statistik
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping
Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Kurser inom profilen Teknisk matematik (Y)
Matematisk Statistik Kurser inom profilen Teknisk matematik (Y) Martin Singull Matematisk Statistik MAI - LiU Linköping 9 mars 2015 Matematisk statistik Matematisk statistik handlar om: 1) Sannolikhetslära
Stokastiska processer och simulering I 24 augusti
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd Matematisk statistik 24 augusti 2016 Lösningar Stokastiska processer och simulering I 24 augusti 2016
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):
EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer
Regressionsmodellering inom sjukförsäkring
Matematisk Statistik, KTH / SHB Capital Markets Aktuarieföreningen 4 februari 2014 Problembeskrivning Vi utgår från Försäkringsförbundets sjuklighetsundersökning och betraktar en portfölj av sjukförsäkringskontrakt.
TMS136. Föreläsning 2
TMS136 Föreläsning 2 Sannolikheter För en händelse E skriver vi sannolikheten att E inträffar som P(E) För en händelse E skriver vi sannolikheten att E inte inträffar som P(E ) Exempel Låt E vara händelsen
Stokastiska signaler. Mediesignaler
Stokastiska signaler Mediesignaler Stokastiska variabler En slumpvariabel är en funktion eller en regel som tilldelar ett nummer till varje resultatet av ett experiment Symbol som representerar resultatet
Algoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 6 Anton Grensjö grensjo@csc.kth.se 4 oktober 2017 1 Idag Algoritmkonstruktion (lite blandat) Redovisning och inlämning av labbteori 3 2 Uppgifter Uppgift
Bedömningar och beslutsfattande: Beslutsfattande 1
Bedömningar och beslutsfattande: Beslutsfattande 1 Prospektteorins värdefunktion Isolationseffekten ( framing ) Reflektionseffekten (risksökande/riskaversion) Förlustaversion Prospekteorins beslutsviktsfunktion
Vad behövs för att skapa en tillståndsrymd?
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk
Perspektiv på kunskap
Perspektiv på kunskap Alt. 1. Kunskap är något objektivt, som kan fastställas oberoende av den som söker. Alt. 2. Kunskap är relativ och subjektiv. Vad som betraktas som kunskap är beroende av sammanhanget
Kapitel 10 Hypotesprövning
Sannolikhetslära och inferens II Kapitel 10 Hypotesprövning 1 Vad innebär hypotesprövning? Statistisk inferens kan utföras genom att ställa upp hypoteser angående en eller flera av populationens parametrar.
Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare
MIKROEKONOMETRI Data på individ/hushålls/företags/organisationsnivå Tvärsnittsdata och/eller longitudinella data o paneldata Idag större datamänger än tidigare Tekniska framsteg erbjuder möjligheter till
En- och tvåperiodsmodeller
En- och tvåperiodsmodeller Per Krusell /10, 3/11, 10/11 och 17/11, 08 /10, 3/11, 10/11 och 17/11, 08 1 / 1 period, socialplanerare u(c, 1 l) och eller 2 figurer: c = Ak α l 1 α c = Ak α l 1 α + (1 δ)k
TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS
TNK047 [TEN1] OPTIMERING OCH SYSTEMANALYS Datum: 7 april 2010 Tid: 8 12 Hjälpmedel: Ett A4-blad med text/anteckningar (båda sidor) samt miniräknare. Antal uppgifter: 5; Vardera uppgift kan ge 5p. Poängkrav:
Demonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Antag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Antag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten.
OS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Kort Sammanfattning av Schack MAS
Kort Sammanfattning av Schack MAS Krister Ljung kljung@kth.se 6th April 2003 1 Bamse 1.1 Agenter 1.1.1 Bamse Bestämmer vilket drag som skall skickas till spelplanen. Har även nio öppningar att spela dom
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Algoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 6 Anton Grensjö grensjo@csc.kth.se 9 oktober 2015 Anton Grensjö ADK Övning 6 9 oktober 2015 1 / 23 Översikt Kursplanering Ö5: Grafalgoritmer och undre
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Föreläsning 4: Beslut och nytta, paradoxer
Föreläsning 4: Beslut och nytta, paradoxer Litteratur: Hansson, Introduction to Decision Theory, kap 5-7 och 11 Resnik, Choices, kap 4 1# S:t Petersburg-paradoxen (Daniel Bernoulli, 1713; Nicolas Bernoulli,
TATM79: Föreläsning 1 Notation, ekvationer, polynom och summor
TATM79: Föreläsning 1 Notation, ekvationer, polynom och summor Johan Thim 22 augusti 2018 1 Vanliga symboler Lite logik Implikation: P Q. Detta betyder att om P är sant så är Q sant. Utläses P medför Q
Funktionella beroenden - teori
Relationell databasdesign, FB Teori 7-12 Funktionella beroenden - teori Vid utformning av databassystem är det av största vikt att man kan resonera systematiskt om funktionella beroenden bl.a. för att
Karlstads Universitet, Datavetenskap 1
2003-01-20 DAV B04 - Databasteknik 2003-01-20 KaU - Datavetenskap - DAV B04 - MGö 26 Relationsmodellen En formell teori som baserar sig på (främst) mängdlära predikatlogik Föreslogs av E.F Codd 1970 i
Introduktion till programmering D0009E. Föreläsning 5: Fruktbara funktioner
Introduktion till programmering D0009E Föreläsning 5: Fruktbara funktioner 1 Retur-värden Funktioner kan både orsaka en effekt och returnera ett resultat. Hittills har vi ej definierat några egna funktioner
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
Kvalificeringstävling den 30 september 2008
SKOLORNAS MATEMATIKTÄVLING Svenska Matematikersamfundet Kvalificeringstävling den 30 september 2008 Förslag till lösningar Problem 1 Tre rader med tal är skrivna på ett papper Varje rad innehåller tre
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Optimering och simulering: Hur fungerar det och vad är skillnaden?
Optimering och simulering: Hur fungerar det och vad är skillnaden? Anders Peterson, Linköpings universitet Andreas Tapani, VTI med inspel från Sara Gestrelius, RIS-SIS n titt i KAJTs verktygslåda Agenda
729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA
729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion
Högstadiets matematiktävling 2016/17 Finaltävling 21 januari 2017 Lösningsförslag
Högstadiets matematiktävling 2016/17 Finaltävling 21 januari 2017 Lösningsförslag 1. Lösningsförslag: Låt oss först titta på den sista siffran i 2 0 1 7. Ett tal som är delbart med 2 och 5 är då också
Algoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 7 Anton Grensjö grensjo@csc.kth.se 14 oktober 2015 Anton Grensjö ADK Övning 7 14 oktober 2015 1 / 28 Översikt Kursplanering Ö6: Algoritmkonstruktion F19:
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07 Bengt Ringnér August 31, 2007 1 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Händelser och sannolikheter
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
Slumpförsök för åk 1-3
Modul: Sannolikhet och statistik Del 3: Att utmana elevers resonemang om slump Slumpförsök för åk 1-3 Cecilia Kilhamn, Göteborgs Universitet Andreas Eckert, Linnéuniversitetet I följande text beskrivs
Markovkedjor. Patrik Zetterberg. 8 januari 2013
Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)
UTFALL = (KLAVE, 2 KR; KRONA-KLAVE, 4 KR; KRONA-KRONA-KLAVE, 8 KR; OSV) = (1/2, 2 KR; 1/4, 4 KR; 1/8 8 KR; OSV)
Beslutsfattandets psykologi ht 2010: Beslutsfattande under risk och osäkerhet I Prospektteorins värdefunktion Risksökande/riskaversion Framing (inramning) Referenspunkt Sjunkkostnadseffekten Förlustaversion/förlustkänslighet
Tillvägaghångssätt för skattning av körkortsmodell
Siamak Baradaran sia@kth.se Tillvägaghångssätt för skattning av körkortsmodell 1 Syfte med modellen Syftet med denna forskning har varit att utveckla en beskrivande modell som kan hjälpa oss att förstå
Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6
Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6? DAGENS AGENDA Komplexitet Ordobegreppet Komplexitetsklasser Loopar Datastrukturer Några nyttiga regler OBS! Idag jobbar