Associationsanalys och klustring

Relevanta dokument
Reflektioner och resultat utifrån frågeställningarna tas tacksamt emot och kommer att användas som ett led i KomTeks förbättringsarbete.

Verktyg & Maskiner. trämaterial. Såga med rakt snitt. svängda snitt. Finns med sågblad för metall eller för trä.

Reflektioner och resultat utifrån frågeställningarna tas tacksamt emot och kommer att användas som ett led i KomTeks förbättringsarbete.

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

VERKTYG 8an. Namn och användning

Verktygsbilder i slöjden, Sid 1(12) Leif Blomqvist. Verktyg & Maskiner. Namn Bild Används till. Kapa och klyva trämaterial. Såga med rakt snitt

Det här behöver du när du sätta upp persienner:

Används oftast som snickarhammare För att slå i stora spikar Du kan dra ut spikar med klon

Monteringsanvisning Kapad pulpettakstomme

Används oftast som snickarhammare För att slå i stora spikar Du kan dra ut spikar med klon

Kan man lära datorer att läsa? NIKLAS LUNDBORG

Monteringsanvisning. Veranda med pulpettak. Rev.nr För montering av plåttak behövs även: Plåtsax Falstång

Tentamen (TEN2) Maskininlärning (ML) 5hp 21IS1C Systemarkitekturutbildningen. Tentamenskod: Inga hjälpmedel är tillåtna

Monteringsanvisning Fristående Limträstomme Pulpettak

Monteringsanvisning Fristående Limträstomme Sadeltak

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Monteringsanvisning Underhåll Leveransbestämmelser Lagring på byggarbetsplatser Garantier INNERDÖRR

Kursplan För Slöjden

Klustring av svenska tidningsartiklar

Monteringsanvisning. Veranda med sadeltak. Rev.nr För montering av plåttak behövs även: Plåtsax Falstång

TDP Regler

Vilka är vi? Mellanstadie- och SvA-lärare

Problemlösning. Veckodagsproblemet Gissa talet Siffersumman

Bruksanvisning. Vedklyv, 9 ton Art.: Annelundsgatan 7A I Enköping I Tel I Fax I

Monteringsanvisning Kapad pulpettakstomme Glastak

EN GARDEROB BLIR TILL. Här kommer du att få följa hur skjutdörrsgarderoben

Lektion Vad gör vi Begrepp Mål 1 Presentation projekt 3 i 1. 2 Lerskulptur - enskilt. 3 Göra klart din skulptur - enskilt. 4 Intro bygge - grupp

Data mining. Data mining Skillnaden mellan observationella och experimentella data

GeneTrader. Ett helautomatiserat tradingsystem

50 KONSTHANTVERK monteringsanvisning Sätt igång. Bygg din egna loungestol.

M6x16 (Bild 6.1.) M8 (Bild 6.2.) M8x25

Bee-Bot & Blue-Bot Verktygslära

Flygande fågeln Fia. När du vevar på baksidan flaxar fågeln Fia med sin vinge. Se en film på produkten:

Problemlösning. Veckodagsproblemet Gissa talet Siffersumman

HCP-revision Byxelkroks GK

Transport Våra återförsäljare har fasta priser på frakter inom Sverige.

Monteringsanvisning Okapad Limträstomme Sadeltak

Tålig och återanvändbar handske utan puder

MONTERINGSANVISNING INNERDÖRR

MatteSafari Kikaren 2A Facit

Matte Direkt Safari Läxbok 2A Läraranvisning Textview. Verksnummer: 30952

Elbilstävlingen. Tilläggsuppdrag till. Magneter och Motorer. och. Rörelse och Konstruktion

Monteringsanvisning Leveransbestämmelser Lagring på byggarbetsplatser Garantier

Del 1 Monteringsanvisning Garageport med motor. Boxline Modern Ribbline Futura (Basic)

jämföra/storleksordna talen jämföra/storleksordna talen Jag kan jämföra/storleksordna talen

MONTERINGSANVISNING. Basta väderskydd Beklädnad: Liggande träspaljé Låg och Hög gavel Tak: Sedum och Plåt

(1/5) David Södermark Data Mining

Concept description genom klustring

Projektdokumentation för Othello

Exempeltenta 3 Introduktionskurs i Matematik H1009 (1.5 hp) Datum: xxxxxx

VERKTYG. Skruvmejsel. Insexnycklar. Skiftnyckel

Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter

Trolldetektering. En undersökning i lämpligheten att använda ämnesmodellering och klustring förtrolldetektion. LILI DU ERIK SÖDERBERG

Språkstart Matematik Facit. Matematik för nyanlända. Jöran Petersson

Tentamen i Databasteknik

Sidor i boken Figur 1: Sträckor

Copyright GordionInfomakers 1

Gitarrdelar.SE. Byggbeskrivning Gitarrdelars LP-kit. Innehållsförteckning

Uppgift 1 ( Betyg 3 uppgift )

Föreläsning 12. Söndra och härska

Ånässkolan Bagaregårdsskolan

HJÄLTERUMMET Ett rum där allt är möjligt.

Krypande kaninen Karin

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret Lektion 1

Monte Carlo-metoder. Bild från Monte Carlo

Hej! Tack för att du valt en Harmonidörr.

Några svar till TDDC70/91 Datastrukturer och algoritmer

DATORÖVNING 2: STATISTISK INFERENS.

Optimeringslära Kaj Holmberg

Monteringsanvisning för Duschkabin Miranda

Monteringsanvisning Kapad Limträstomme Sadeltak

SF1513 (tidigare DN1212) Numeriska metoder och grundläggande programmering. för Bio3, 9 hp (högskolepoäng)

Vi hoppas ni skall få mycket glädje och nytta av den under många år framåt.

DN1212/numpm Numeriska metoder och grundläggande programmering Laboration 1 Introduktion

Anvisning för stomresning Classic

Kort sammanfattning av de funktioner som används för att Skapa en smart Dashboard!

TDDC30. Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 5 Jonas Lindgren, Institutionen för Datavetenskap, LiU

Signal- och bildbehandling TSEA70

TDDC30/725G63. Objektorienterad programmering i Java, datastrukturer och algoritmer

KUNDCASE. Inovia gjorde sin AI-utveckling 10 gånger snabbare med Power-plattformen

MONTAGE GLAS Installationsinstruktioner ö f r skärm tak glas DESIGN LINEAR S STEM Steg ö f r steg till helt monterade skärmtak

Algoritmer och datastrukturer H I HÅKAN S T R Ö M B E R G N I C K L A S B R A N D E F E L T

Casall INFINITY 1.2B motionscykel 91018

lösningar! ger 0 poäng.) i partiella bråk. och deras typ.

Lösningsförslag DD1320/DD

4 Sammansatta datatyper

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Laborationsinformation TAOP88 Optimering för ingenjörer, VT17

Matematik klass 3. Vårterminen. Anneli Weiland Matematik åk 3 VT 1

Lilla lyckohjulet Lina

Trähuset önskar lycka till med stugan, boden ni köpt från Trähuset.

Programmeringsmetodik DV1 Programkonstruktion 1. Moment 4 Om rekursion. PK1&PM1 HT-06 moment 4 Sida 1 Uppdaterad

Tentamen för DD1370 Databasteknik och informationssystem

Tentamen i Realtidsprogrammering för Au3, D3, E3

Höga paneler på ett par timmar. 2 lösningar som ger

Monteringsanvisning. Veranda med valmat tak. Rev.nr För montering av plåttak behövs även: Plåtsax Falstång

Sätt färg på tillvaron genom att måla och tapetsera

Transport Våra återförsäljare har fasta priser på frakter inom Sverige.

Färdigbehandlat innertak Elittaket

Bruksanvisning. Vedklyv, 7 tons Art.: Annelundsgatan 7A I Enköping I Tel I Fax I

Transkript:

Johan Boye, CSC, KTH DD1371 Beslutstödssystem, VT2013 Associationsanalys och klustring 57. (Från tentamen augusti 2010) Byggvaruhuset Bygger vill ha mer information om sina kunders köpbeteenden och vill därför att du utför associationsanalys på nedanstående lista med inköp. Hitta alla associationsregler med support 0.4 och konfidens 0.7. (3p) Kvitto Inhandlade varor nr 1 hyvel, sandpapper, skruv, rundfil, hammare, syl, vinkelhake 2 vedklyv, skruv, skruvmejsel, skiftnyckel 3 tapeter, tapetlim, rakblad, roller, skiftnyckel 4 borrmaskin, gångjärn, skruvmejsel, skruv, hammare, spik 5 hammare, tumstock, vinkelhake, hovtång, skruv, skiftnyckel, grillkol, tändvätska 6 sandpapper, målarfärg, pensel, lacknafta, stege, overall, skiftnyckel, skruvmejsel 7 hammare, skruvmejsel, skruv, spik 8 slipmaskin, sandpapper, skyddsglasögon, skyddshandskar 9 utegrill, grillkol, tändvätska, skruvmejsel 10 skiftnyckel, muttrar, skruv, spik 58. (Från tentamen maj 2012) Antag att vi vill göra associationsanalys på en datamängd med transaktioner. a. Om det är möjligt att hitta två regler A B och B A som har samma support, men där A B har dubbelt så hög konfidens som B A, konstruera ett exempel som visar detta. Om det inte är möjligt, förklara varför. (2p) b. Om det är möjligt att hitta två regler A B och B A som har samma konfidens, men där A B har dubbelt så hög support som B A, konstruera ett exempel som visar detta. Om det inte är möjligt, förklara varför. (2p)

59. Utför hierarkisk klustring på följande datamängd, först med strategin närmaste närmaste punkt, och sedan med strategin närmaste mest avlägsen punkt. Rita de resulterande dendrogrammen och förklara skillnaderna. 60. Antag att man vill använda k-means-algoritmen för att dela in nedanstående datamängd i tre kluster. Punkt nr x y 1 0.2 0.2 2 0.6 2.5 3 0.8 0.8 4 1 2.8 5 2.6 2.8 6 1.3 2.9 7 1.5 1.5 8 2.6 0.8 9 2.8 0.1 10 2 2 a. Vi slumpar fram de tre startpunkterna 2, 3 och 6. Hur ser de initiala klustren ut? b. Beräkna centroiderna av dessa kluster. c. Kör en iteration av k-means-algoritmen. Hur ser klustren ut nu, och vad har de för centroider? d. Hur ser klustren ut efter två iterationer?

61. (Från tentamen augusti 2011) Tabellen nedan visar hur tio unga datoranvändare spenderar sin datortid. De olika kolumnerna visar hur stor proportion av tiden som spenderas på Facebook, Youtube, respektive skolarbete. (Alla rader summerar inte till 1 eftersom vissa användare även gör andra saker på datorn). Andel av total datortid Användare # Facebook Youtube Skola 1 0.64 0.26 0.1 2 0.3 0.7 0 3 0.22 0.5 0.1 4 0 0.5 0.5 5 0.2 0.42 0.26 6 0 0 0.9 7 0 0.2 0.2 8 0.8 0 0.15 9 0.73 0.1 0.15 10 0.6 0.2 0.2 Gruppera de tio användarna ovan i 3 olika kluster med hjälp av k-means-algoritmen. Låt användarna 1, 2 och 6 utgöra centroider i den första iterationen. (6p) 62. I en välseparerad klustring gäller att varje datapunkt P är närmare till varje punkt i samma kluster än till alla punkter utanför klustret. Betrakta punktmängden nedan. För vilka heltal k kan man göra en välseparerad klustring med k kluster, om varje kluster ska innehålla minst två punkter?

Svar 57. {hammare} {skruv} 58. a) Enklaste exemplet: cola, chips cola Här har {cola} {chips} och {chips} {cola} bägge support 0.5 eftersom {cola, chips} förekommer i hälften av transaktionerna. Regeln {chips} {cola} har konfidens 1, eftersom alla transaktioner som innehåller chips även innehåller cola. Regeln {cola} {chips} har konfidens 0.5 eftersom hälften av alla transaktioner som innehåller cola också innehåller chips. b) Detta är inte möjligt eftersom supp(a B)=supp(AUB)=supp(BUA)=supp(B A). 59. I första iterationen är centroiderna punkt nummer 1,2 och 6: Centroid # Facebook Youtube Skola 1 0.64 0.26 0.1 2 0.3 0.7 0 3 0 0 0.9 Vi räknar ut avstånden mellan varje centroid och varje punkt med hjälp av avståndsformeln. Punkt # Centroid 1 Centroid 2 Centroid 3 1 0 0.564978 1.056977 2 0.564978 0 1.178983 3 0.483735 0.237487 0.96871 4 0.79196 0.616441 0.640312 5 0.494773 0.394968 0.791202 6 1.056977 1.178983 0 7 0.650538 0.616441 0.728011 8 0.309354 0.873212 1.096586 9 0.190263 0.75326 1.05138 10 0.123288 0.616441 0.943398 Vi ser att punkterna 1, 8, 9, och 10 är närmast centroid 1, och att punkterna 2, 3, 4, 5 och 7 är närmast centroid 2. Endast punkt 6 är närmast centroid 3. Vi tar medelvärden för att beräkna centroiderna i nästa iteration:

Centroid # Facebook Youtube Skola 1 0.6925 0.14 0.15 2 0.144 0.464 0.212 3 0 0 0.9 Vi beräknar avstånden från varje punkt till de nya centroiderna: Punkt # Centroid 1 Centroid 2 Centroid 3 1 0.140201 0.547883 1.056977 2 0.700112 0.353519 1.178983 3 0.596118 0.140057 0.96871 4 0.855369 0.324 0.640312 5 0.57711 0.085884 0.791202 6 1.030367 0.842245 0 7 0.69689 0.300958 0.728011 8 0.176511 0.805901 1.096586 9 0.054829 0.69263 1.05138 10 0.121063 0.527045 0.943398 Vi ser att återigen är punkterna 1, 8, 9 och 10 närmast centroid 1, punkterna 2, 3, 4, 5 och 7 närmast centroid 2, och punkt 6 närmast centroid 3. Centroiderna är därför oförändrade, och algoritmen terminerar. Klustrena är alltså {1,8,9,10}, {2,3,4,5,7} samt {6}. 60. Närmaste närmaste punkt: Närmaste mest avlägsen punkt: A B C D E F G H A B C D E F G H 61. a) { 2 }, { 1, 3, 7, 8, 9 } resp. { 4, 5, 6, 10 } b) (0.6, 2.5), (1.58, 0.68) resp. (1.725, 2.625) c) { 2, 4 } med centroid (0.8, 2.65), { 1, 3, 7, 8, 9 } med centroid (1.58, 0.68) resp. { 5, 6, 10 } med centroid (1.96667, 2.56667 ) d) { 2, 4, 6 }, { 1, 3, 7, 8, 9 } resp. { 5, 10 } 62. 1, 2, 4, 5, 7