Ämne: AI med inriktning mot kognition och design Kurskod: KOGB05 / TDBB21 Datum: 2005-04-01 Antal uppgifter: 12 Skrivtid: 09:00 15:00 Max poäng: 54 Betygsgränser: 27 x<35 3 35 x<43 4 43 x 54 5 alternativt 27 x<41 G 41 x 54 VG Lärare: Christina Olsén Hjälpmedel: Penna, Sudd och Miniräknare Tänk på följande saker när du skriver tentan: Börja på en ny sida för varje uppgift (obs inte delfrågorna!!), glöm inte att skriva namn och uppgift på varje blad!! Motivera dina svar, ett bra motivering/beskrivning ger alltid mer poäng. Alla svar måste vara välmotiverade om inte annat uttryckligen sägs. Disponera tiden mellan frågorna i förhållande till deras poäng. Frågorna kommer inte i någon svårighetsgradering utan svårare och lättare frågor är blandade med varandra. Om du är osäker på någon fråga: Gör en rimlig tolkning av uppgiften, skriv ner din tolkning och lös problemet utifrån denna. Lycka till! Christina
1 (2+2p) a) Vad avses med begreppet Inductive Learning samt ange vad det innebär att en hypotes är konsistent. b) Namnge två metoder för Inductive Learning? 2 (1+2+1+2p) Under kursen har vi studerat Neurala nätverk. a) Ge ett exempel på en funktion som INTE är linjärt separerbar? b) Ange en inlärningsalgoritm som används för sådana neurala nätverk (från svaret i a). Beskriv principen för hur denna inlärning går till. c) Beskriv hur man kan hantera neurala nätverks benägenhet för överträning. d) Redogör för den fundamental skillnaden mellan neurala och bayesiska nätverk? 3 (1+3 p) Betrakta följande graf för ett tvåpersonersspel. MINIMAX metoden ska användas för att bestämma vilket drag som spelare MAX ska göra genom att söka två drag framåt. Den heuristiska funktion, h(x), som ska användas är definierad enligt följande för sluttillstånden. h(e) = 2 h(f) = 12 h(g) = 4 h(h) = 3 h(i) = 1 h(j) = 6 h(k) = 2 a) Vilket drag kommer MAX att välja (B, C eller D)? b) Vilka delar av trädet (noder) kommer inte att besökas (om någon) om α β beskärning (pruning) används? Beskär trädet enligt principen, var noga med att beskriva varje steg. Markera tydligt beskurna delar! 2
4 (2+2+2p) Under kursen har vi bland annat studerat tre olika typer av agenter, reaktiva, resonerande (planerande) och lärande. Beskriv dessa och förklara skillnaden mellan dem. 5 (1 p) I situationskalkylen (situation calculus) finns vissa svårigheter, som kallas ramproblemet (frame problem). Vad är det för svårigheter? 6 (2+2p) a) Sökstrategin A är optimal och komplett om evalueringsfunktionen f(n) innehåller en admissble heuristisk funktion. Vad innebär en admissble heuristisk funktion? Redogör för beviset att A är optimal givet att evalueringsfunktionen f(n) innehåller en admissble heuristisk funktion. b) A(h 2 ) sägs vara bättre informerad än A(h 1 ) om h >h 2 >h 1. Redogör för vad detta innebär samt ge exempel på en h 2 och en h 1. 7 (2+2p) a) Vilka två typer av kvantifierare har vi i första ordningens logik? b) Ge två exempel på uttryck och skriv om dem så att den andra kvantifieraren används. 8 (2+2p) På kursen har vi studerat lokala sökningsalgoritmer. Ett problem med lokala sökningsalgoritmer är att de kan fastna i lokal optima, ange två sätt att hantera detta samt förklara grundprinciperna för de två. 3
9 (3+3p) Givet följande regler: 1. if (B or C) then A 2. if (D and E) then B 3. if (H or I) then D 4. if K then E 5. if (F and G) then C 6. if (D and I) then G och följande fakta: I, F a) Använd backward chaining för att bevisa att A är sant. b) Använd forward chaining för att bevisa att A är sant. I båda deluppgifterna är det viktigt att du kommenterar varje steg i slutdragningsprocessen (vilken regel som använts etc.). 10 (1 + 1 p) Förklara syftet med och uppläggningen av ett Turing-test. 11 (1+1+1+1p) Vilka fyra syntaxiska egenskaper definierar ett bayesiskt nätverk? 4
12 (3 + 3 + 3 (1.5) p) Nedan finns 6 slumpmässigt valda frågor från de tentamensfrågor ni konstruerat till era projektarbeten. Välj 3 av dessa och besvara dem tydligt. Skulle din grupps fråga finnas med får du välja denna, men den frågan är i så fall bara värd 1.5 poäng. Svaret ska tydligt framgå för att få full poäng per fråga. a) Beskriv översiktligt hur en agent hanterar osäkerhet med hjälp av conditional planning. b) Nämn en fördel respektive nackdel med approximativa bayesiska nätverk. c) Vad har Bellman ekvationen för central roll i den aktiva reinforcement learning? d) När man sätter upp regler för generalisering, vad bör man tänka på och varför? Ge ett lätt exempel! e) Du har fått problemet att färglägga Australiens regioner genom att använda färgerna röd, grön och blå, utan att några närliggande regioner får samma färg. Du ska formulera detta problem som ett Constraint Satisfaction Problem. Vad väljer du som variabler, vilka är deras domäner och vilka begränsningar finns i problemet? f) Vilket av följande beskriver bäst definitionen av ett Nash Ekvilibrium? A. Låt en individuell spelare utvärdera alla strategikombinationer separat, och för var och en av dessa kombinationer välja den strategi som ger spelaren bäst utdelning. Om för var och en av dessa kombinationer spelaren väljer att använda en och samma strategi, utgör denna strategi ett Nash Ekvilibrium. B. Finns en mängd strategier med den egenskapen att ingen spelare kan tjäna på att ändra sin strategi medan övriga spelare behåller sina strategier oförändrade, så utgör denna mängd strategier med sammanhörande payoffs Nash Ekvilibrium. C. När varje spelare har en dominant strategi, och spelar enligt den strategin, kallas kombinationen av dessa ett Nash Ekvilibrium. D. Mixade strategier specificerar att ett drag kan väljas slumpmässigt från en mängd av rena strategier med olika sannolikhet. En kombination av alla kombinerade mixade strategier tillsammans med deras sannolikheter utgör ett Nash Ekvilibrium. 5
Några formler som kan vara till hjälp (α β) (β α) (α β) (β α) ((α β) γ) (α (β γ)) ((α β) γ) (α (β γ)) ( α) α (α β) ( β α) (α β) ( α β) (α β) ((α β) (β α)) (α β) ( α β) (α β) ( α β) (α (β γ)) ((α β) (α γ)) (α (β γ)) ((α β) (α γ)) α β,α β α β α α β, β γ α γ 6