Tentamen (TEN2) Maskininlärning (ML) 5hp 21IS1C Systemarkitekturutbildningen. Tentamenskod: Inga hjälpmedel är tillåtna

Relevanta dokument
2B1115 Ingenjörsmetodik för IT och ME, HT 2004 Omtentamen Måndagen den 23:e aug, 2005, kl. 9:00-14:00

Chalmers, Data- och informationsteknik DAI2 samt EI3. Peter Lundin. Godkänd räknedosa

Tentamen i Dataanalys och statistik för I den 5 jan 2016

Komplettering: 9 poäng på tentamen ger rätt till komplettering (betyg Fx).

Vinst (k) Sannolikhet ( )

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

KVALITETSDEKLARATION

Riktlinjer för avgifter och ersättningar till kommunen vid insatser enligt LSS

Hur bör en arbetsvärderingsmodell

Steg 1 Arbeta med frågor till filmen Jespers glasögon

En studiecirkel om Stockholms katolska stifts församlingsordning

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Centrala Gränsvärdessatsen:

Handlingsplan. Grön Flagg. Pysslingförskolan Gläntan

Tentamen i MATEMATISK STATISTIK Datum: 8 Juni 07

Beräkna standardavvikelser för efterfrågevariationer

Tentamen i Tillämpad matematisk statistik för MI3 och EPI2 den 15 december 2010

2014 års brukarundersökning inom socialtjänstens vuxenavdelning i Halmstads kommun

saknar reella lösningar. Om vi försöker formellt lösa ekvationen x 1 skriver vi x 1

Performansanalys LHS/Tvåspråkighet och andraspråksinlärning Madeleine Midenstrand

KURS-PM för. Namn på kurs (YTLW37) 40 Yhp. Version 1.1 Uppdaterad

Om ja, hur har ni lagt upp och arbetat i Grön Flagg-rådet/samlingarna med barnen och hur har det upplevts?

a) B är oberoende av A. (1p) b) P (A B) = 1 2. (1p) c) P (A B) = 1 och P (A B) = 1 6. (1p) Lösningar: = P (A) P (A B) = 1

TENTAMEN Datum: 11 feb 08

Skoldemokratiplan Principer och guide till elevinflytande

Lab 1, MATLAB som grafritande räknare

FK2002,FK2004. Föreläsning 5

Generellt ägardirektiv

Mätfelsbehandling. Lars Engström

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

Sammanfattning av kvalitetsrapporter - kommunala skolorna

Hur har Grön Flagg-rådet/elevrådet arbetat och varit organiserat? Hur har rådet nått ut till resten av skolan?

Utbildningsdepartementet Stockholm 1 (6) Dnr 2013:5253

Grön Flagg-rapport Ås skola 15 okt 2014

Samhällsvetenskaplig metod, 7,5 hp

Introduktion Online Rapport Din steg-för-steg guide till den nya Online Rapporten (OLR) Online Rapport

1. a Vad menas med medianen för en kontinuerligt fördelad stokastisk variabel?

DEL I. Matematiska Institutionen KTH

HUR KAN ARBETET MED BEHOVSUTREDNINGAR KOPPLA TILL STATENS ARBETE. SKL 1 juni 2018 Tomas Waara Jenny Jonsson

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

Förklaring:

Industrins förbrukning av inköpta varor (INFI) 2008

Tentamen ges för: ACEKO14h (MANG, MFÖR, REDO), ACIVE14h, SAMEK16h

STUDIE- HANDLEDNING KOMVUX Inför ansökan till Komvux KOMVUX

Kursbeskrivning. Tolkning magisterkurs, AN, 15 hp (TTA655) Masterprogram i tolkning, 120 hp (HTOLO) Tolk- och översättarinstitutet (TÖI)

Industrins förbrukning av inköpta varor INFI

Billigaste väg: Matematisk modell i vektor/matrisform. Billigaste väg: Matematisk modell i vektor/matrisform

Bankernas kapitalkrav med Basel 2

En kort introduktion till principalkomponenttransformation och kanonisk diskriminantanalys av multispektrala data

Viktigt säkerhetsmeddelande

Beställningsintervall i periodbeställningssystem

TDDC47 Realtids- och processprogrammering. Jourhavande-lärare: Mehdi Amirijoo (Telefonnummer: , ).

Lösningar modul 3 - Lokala nätverk

När vi räknade ut regressionsekvationen sa vi att denna beskriver förhållandet mellan flera variabler. Man försöker hitta det bästa möjliga sättet

Grön Flagg-rapport Berga förskola 2 jun 2015

Rättningstiden är i normalfall tre veckor, annars är det detta datum som gäller:

Attitudes Toward Caring for Patients Feeling Meaninglessness Scale

Grön Flagg-rapport Pepparrotens förskola 15 aug 2014

Forskningsmetoder i offentlig förvaltning

Del A Begrepp och grundläggande förståelse.

Radien r och vinkeln θ för komplexa tal i polär form och potensform: KOMPLEXA TAL. ) (polär form) (potensform)

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

KVALITETSKRITERIER FÖR NÄTBASERADE LÄROMEDEL

Grön Flagg-rapport Tryserums förskola 3 dec 2014

Kursbeskrivning. Översättning masterkurs, AN, 15 hp (TTA645) Masterprogram i översättning, 120 hp. Tolk- och översättarinstitutet (TÖI)

Sammanfattning, Dag 1

Projekt i transformetoder. Rikke Apelfröjd Signaler och System rikke.apelfrojd@signal.uu.se Rum 72126

Tillfälliga elanläggningar (Källor: SEK handbok 415 oktober 2007, SS kap 704, ELSÄK-FS)

Grön Flagg-rapport Rots skola 30 dec 2014

TNK049 Optimeringslära

Trafikljus utvidgat med stresstest för försäkrings- och driftskostnadsrisker inom livförsäkring

Beryll Tävlingsförslag av Johan Johansson & Joakim Carlsson Modernisering av mineralutställningen vid SBN - ett steg mot bättre lärandemiljö

Tentamen ges för: FEA, kvällskurs, Marknadsföring grundkurs 7,5hp. Underkänt 0-29 poäng Godkänt poäng Väl godkänt poäng

LÖSNINGAR TILL TENTAMEN I FYP302 MEKANIK B

TFYA16: Tenta Svar och anvisningar

Grön Flagg-rapport Speldosans förskola 30 dec 2014

Ladokkod: TentamensKod: Tentamensdatum: Tid: Hjälpmedel: Inga hjälpmedel

Date/Datum Issue/Utgåva 2

Dokumentation kring beräkningsmetoder använda för prisindex för elförsörjning (SPIN 35.1) inom hemmamarknadsprisindex (HMPI)

på fråga 6 i tävlingen för matematiklärare. 'l.

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in. Skriv inte på bladens baksidor. Helst en uppgift per blad.

Gymnasial yrkesutbildning 2015

Statistisk försöksplanering

Handlingsplan mot hedersrelaterat våld och förtryck i skolan

Föreläsning G70 Statistik A

KOMMISSIONENS DELEGERADE FÖRORDNING (EU) / av den

Att identifiera systemviktiga banker i Sverige vad kan kvantitativa indikatorer visa oss?

Forskningsmetoder i offentlig förvaltning

rm o rs W e d n r: A e n tio stra Illu Grön Flagg-rapport Talavidskolan 15 aug 2013

Trafikljus stresstest för försäkrings- och driftskostnadsrisker inom livförsäkring

Experimentella metoder 2014, Räkneövning 5

för alla i Landskrona

Tentamen B1AMO1 Administratörsprogrammet HT2014

Handlingsplan. Grön Flagg. Gärdesängens förskola

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Snabbguide. Kaba elolegic programmeringsenhet 1364

SYST14h, Systemvetarutbildningen. Tentamensdatum: Tid: Tentamenstiden är tre timmar, 09:00 12:00. för betyget VG krävs minst 53 poäng

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Handlingsplan. Grön Flagg. Förskolan Trollet

rm o rs W e d n r: A e n tio stra Illu Grön Flagg-rapport Ugglan förskola 15 aug 2013

Transkript:

Intellgenta och lärande system 15 högskolepoäng Provmoment: Ladokkod: Tentamen ges för: Tentamen (TEN2) Masknnlärnng (ML) 5hp 21IS1C Systemarktekturutbldnngen Tentamenskod: Tentamensdatum: 2017-03-24 Td: 14:00-19:00 Hjälpmedel: Inga hjälpmedel är tllåtna Totalt antal poäng på tentamen: 20 poäng För att få respektve betyg krävs: G >= 10, VG >= 16 Allmänna anvsnngar: Skrv tentamenskod på varje blad du lämnar n. Skrv tydlgt (oläslga svar kan ej bedömas = 0 poäng) och motvera dna svar väl. Numrera sdorna och börja varje ny uppgft på ett nytt blad. Om du anser att en fråga är svår att förstå eller felaktgt ställd, skrv ner dn tolknng av frågan tllsammans med svaret. Rättnngstden är som längst tre veckor Vktgt! Glöm nte att skrva tentamenskod på alla blad du lämnar n. Lycka tll! Ansvarga lärare: Patrck Gabrelsson Henrk Lnusson Telefonnummer: 033-435 4132 0731-82 06 07 1

1. ALLMÄNT (5p) Preprocesserng är en vktg del av masknnlärnng. Beroende på datamängdens egenskaper och/eller masknnlärnngsalgortmens egenskaper, så kan man behöva preprocessera sn datamängd för att möjlggöra en bättre nlärnng. a) Förklara vad normalserng av en datamängd nnebär och anlednngen tll varför (1p) man normalserar. Normalsera sedan nedanstående tvådmensonella datamängd (bestående av de fyra nstanserna A, B, C och D, med de två attrbuten X och Y), antngen tll ntervallet [0,1] eller genom att standardsera (om du standardserar, kan du ange dna svar som en kvot nnehållandes termer med rottecken). Ange de normalserade värdena som Xnorm samt Ynorm. Redovsa samtlga beräknngar. X Y X norm Y norm A 1 3 B 3 4 C 3 2 D 5 3 b) En del masknnlärnngsalgortmer kan endast hantera kategorska eller (1p) numerska attrbut. Varje attrbut tllhör dessutom en vss mätskala; nomnal, ordnal, nterval eller rato. Beroende på mätskalan, så kan ett eller flera av följande matematska operatorer applceras på attrbutens värden; dstnctness (=, ), order (<,>), addton (+,-) och multplcaton (*,/). För varje mätskala, ange vlka av ovanstående matematska operatorer som kan applceras samt om mätskalan är av kategorsk eller numersk karaktär. Ange slutlgen vlken mätskala som följande attrbut tllhör; ögonfärg, betyg, datum, längd. =, <,> +,- *,/ Kategorsk Numersk Ögonfärg Betyg Datum Längd Nomnal Ordnal Interval Rato c) De attrbut (features) som används som nput tll en masknnlärnngsalgortm (1p) är avgörande för hur bra nlärnngen blr. En stor del av preprocesserngsarbetet utgörs därför av feature engneerng, dvs framtagandet av attrbut som underlättar nlärnngen. Dskutera ett par olka metoder för framtagandet av features. d) En datamängd kan nnehålla ett stort antal attrbut (features), där det är önskvärt (1p) att välja en delmängd av dessa som nput tll masknnlärnngsalgortmen - så kallad feature selecton. Dskutera mnst två olka feature selecton metoder som vanlgen tllämpas nom masknnlärnng. e) The curse of dmensonalty och Occam s razor är två välkända uttryck nom (1p) masknnlärnng. Förklara vad dessa två uttrycken nnebär. 2

2. KLASSIFICERING OCH REGRESSION (5p) Nedanstående datamängd är gven, med åtta tränngsnstanser och en testnstans. ID X1 X2 Y 1 0 0 True 2 0 1 True 3 0 2 True 4 1 0 False 5 1 1 False 6 1 2 True 7 2 0 False 8 2 1 False 9 2 2? a) Konstruera ett beslutsträd från tränngsnstanserna datamängden ovan. (2p) Använd classfcaton error (CE) för att beräkna orenheten en nod, och använd vktad medelvärdnng (SPLIT) för att beräkna orenheten en splt. Vsa uträknngarna för orenhet för de splts som testas rotnoden; för övrga splts behövs nte uträknngar vsas. CE(t) = 1 max[p( t)] SPLIT(l, r, t) =CE(l) sze(l) sze(r) + CE(r) sze(t) sze(t) b) Använd k-nearest neghbors med k = 3 för att härleda klassen för (2p) testnstansen datamängden ovan. Använd det Eukldska avståndet d(p,q) för att beräkna avståndet mellan testnstansen P och respektve tränngsnstans Q. Ange avstånden som roten ur ett heltal. d(p, Q) = (P Q ) 2 c) Prestandan för en ensemblemodell kan uttryckas genom (1p) E = E A, där E är ensemblemodellens felfrekvens, E är medelfelfrekvensen för ensembles medlemmar och A är ambguty eller dverstet. Förklara vad ambguty/dverstet nnebär, och varför det är vktgt för ensemblemodeller. 3

3. ASSOCIATIONSREGLER (5p) Nedanstående transaktonsdatabas är gven, nnehållande no transaktoner bestående av tems A, B, C och D. ID Items 1 A, B 2 A, B, C 3 A, C 4 A, B, C, D 5 B, C, D 6 A, C, D 7 A, B, C 8 B, D 9 C, D a) Ange support för samtlga canddate temsets av storlek 1, 2, 3 (1p) respektve 4. b) Antag att mnmum support = 3. Ange, för respektve frequent (1p) temset, huruvda det är maxmalt respektve stängt (closed). c) Ange de assocatonsregler som kan konstrueras från samtlga (1p) frequent temsets nnehållande 2 eller fler tems. Beräkna confdence för dessa assocatonsregler. d) Förklara varför confdence kan vara ett mssvsande utvärderngsmått (1p) för assocatonsregler. Motvera med ett exempel. e) Förklara och vsa med exempel hur de åtta tränngsexemplen (1p) datamängden från uppgft 2 kan konverteras tll en transaktonsdatabas. Antag att X1 är kategorsk och X2 numersk. 4

4. KLUSTRING (5p) Nedanstående tvådmensonella datamängd, bestående av de fyra nstanserna A, B, C och D, med de två attrbuten X och Y, är gven: X Y A -1 2 B 2 1 C -3-2 D 1-1 a) Beräkna dstansmatrsen (proxmty matrx) för datamängden. Använd det (1p) Eukldska avståndet d(p,q) mellan varje par av nstanser (P,Q). Ange avstånden som roten ur ett heltal. Redovsa samtlga beräknngar. A B C D A B C D d(p, Q) = (P Q ) 2 b) Utför en enda teraton av k-means algortmen med k = 2 samt med (1p) nstanserna A och C valda som de ntala kluster-centroderna m1 = (-1, 2) samt m2 = (-3, -2). Utfrån dstansmatrsen, förklara vlka nstanser som fnns varje kluster efter teratonen samt beräkna de nya centroderna m1 samt m2. Redovsa samtlga beräknngar. Instanser Kluster 1? Kluster 2? X Y m1 m2 c) Utför agglomeratv herarksk klustrng på datamängden med MIN (Sngle Lnk) (1p) och rta det resulterande dendogrammet. Glöm nte dstansen på Y-axeln. d) Defnera följande fem begrepp (som används DBSCAN algortmen): (1p) Eps, MnPts, Core pont, Border pont, Nose pont. e) Använd DBSCAN för att klustra datamängden med Eps = 12 samt (1p) MnPts = 2. Ange (och förklara varför) vlka nstanser som är Core Ponts, Border Ponts respektve Nose Ponts. Ange även vlka kluster som erhålls samt vlka nstanser som fnns varje kluster. Instanser Core Ponts? Border Ponts? Nose Ponts? Kluster Instanser 5