Liswi948, Lisa Widerberg, liswi948 Fördjupningsarbete Linköpings Universitet 729G43, Artificiell Intelligens

Storlek: px
Starta visningen från sidan:

Download "Liswi948, Lisa Widerberg, liswi948 Fördjupningsarbete Linköpings Universitet 729G43, Artificiell Intelligens"

Transkript

1 Lisa Widerberg, liswi948 Fördjupningsarbete Linköpings Universitet 729G43, Artificiell Intelligens

2 Innehållsförteckning 1 Inledning Bakgrund Bilder som tredimensionella matriser 2 2 Feature-inlärning Features och lokala receptorfält Konvolutionslagret Rectified linear unit (ReLU) Max pooling Stapling av lager 7 3 Klassificering Fullt sammankopplat lager 8 4. Bakåtpropagering Hyperparametrar Användningsområden, diskussion och slutsats 11 Referenser 13

3 1 Inledning Att en människa kan förstå vad hon ser, så fort hon ser det, är för de som inte gett det närmare eftertanke en självklar färdighet. Det lärs in i barnsben, och så snart ett barn börjar prata börjar barnet också att peka på saker för att lära sig dess namn. Maskininlärning och AI har sedan dess begynnelse varit inspirerad av människans intelligens, och inte minst förmågan att lära (Welcome to the machine, 2017) var året då Microsoft vann den årliga tävlingen ImageNet Large Scale Visual Recognition Challenge (He m.fl., 2015), med deras djupa nätverk av slaget Convolutional Neural Network (hädan efter refererat till som Convolutional Neurala Nät eller CNN) som för första gången klassificerade bilder med mindre antal fel än människor (Colin Johnson, 2015). Sedan dess har CNN varit metoden i framkant inom bildklassificering, då de är mycket användbara inom computer vision i allt från robotar till utvecklingen av automatiserade bilar (Padmanabhan, 2016). I denna rapport kommer jag att studera de grundläggande delarna av ett CNN. Många variationer, nya modeller och metoder kan integreras och läggas till, men syftet med denna text är att steg för steg förstå grunderna. 1.1 Bakgrund Där tidigare modeller av neurala nät var inspirerade av människans neuroner och förmåga att lära sig, är CNNs vidare inspirerade av människans visuella cortex (ursprungligen av studierna på katter gjorda av Hubel och Wiesel 1962) (Suryani, 2017). De första Convolutional neurala nätverken utvecklades med intentionen att lösa problemet som uppstod hos de nätverk med många lager kallade Feed Foreward Neural Networks, t.ex. Multi Layer Perceptron (MLP) som då låg i framkant inom mönsterigenkänning. I dessa nätverk är alla neuroner i de dolda lagren sammankopplade med neuronerna i det föregående lagret vilket gör att parametrarna snabbt växer i antal då bilderna bearbetas pixel för pixel (Suryani, 2017). CNNs använder istället vad som kallas lokala receptorfält för att bearbeta delar av bilder, och motverkar att datan växer i okontrollerbar takt genom att inte ha fullt sammankopplade lager samt genom en metod kallad pooling. Dessa lokala receptorfält löser även ett annat stort klassificeringsproblem med MLPs. MPLs presterar bra när det kommer till att finna globala mönster, men kan inte hantera om den data den får in har transformerats spatialt på ett vis den inte fått tränas på (Gupta, 2017). CNNs är däremot bra på detta, vilket kallas att de är translation-invariant. 1

4 För att ett CNN ska fungera och ge goda resultat krävs stora träningsdatamängder och därmed även stora resurser för beräkningen (Cheng m.fl., 2015). Detta är den stora anledningen till att CNNs inte förrän nu visar stor framgång, även fast konceptet funnits sedan innan 1990-talet (Padmanabhan, 2016). Stora handannoterade datamängder för träning finns nu tillgängliga för allmänheten, speciellt via ImageNet, som även årligen håller en tävling (ILSVRC) i bildklassificering och angränsande områden som t.ex. objektigenkänning (Simonyan & Zisserman, 2015). Utöver detta har den utvecklade prestandan hos grafikprocessorer (eng. graphics processing units/gpu) även gjort det möjligt att hantera de stora beräkningarna av CNNs på ett effektivare sätt än tidigare. CNNs kraft ligger som nämnt i att ta hänsyn till spatialt ordnad data. Detta betyder att all data som får sin signifikans av just ordningen är lämplig att applicera detta nät på. CNN kan utöver bildklassificering därför appliceras på till exempel text, ljud och video (Rohrer, 2016). Denna rapport är dock avgränsad till 2-dimentioella CNNs för bildklassificering. 1.2 Bilder som tredimensionella matriser När en dator ser en bild ser den en matris av tal, pixel för pixel (Rohrer, 2016). För att se om två bilder är desamma skulle man kunna jämföra dessa tal. Detta skulle dock resultera i ett mycket oflexibelt system där minsta variation i bilderna skulle resultera i att systemet inte med säkerhet kan veta om de matchar varandra. Detta nät skulle alltså bli mycket specifikt, och därmed relativt oanvändbart på verklig, varierande data. Convolutional neurala nät är därför skapta för att tackla detta genom vad som kallas featureinlärning, och sedan avslutas det med en klassifikation (Raval, 2017). Där man i vanliga fall ser bilder som tvådimensionella matriser är det i detta fall bra att se dem som tredimensionella med pixelhöjd, pixelbredd, och djup. Djupet är bildens färgkanaler, för svartvitt är det två och för färgbilder är de tre (rött, grönt och blått). Dessa representerar alla pixlar i bilderna tre gånger och har tal mellan som representerar hur mycket av varje färg varje pixel har. 2

5 2 Feature-inlärning 2.1 Features och lokala receptorfält Fig. 1, Features, (Rohrer, 2016). Istället för att jämföra hela bilder så jämförs och matchas i CNNs delar av bilderna med specifika egenskaper (Olah, 2014). Dessa egenskaper kallas features. En feature kan till exempel vara en kant, en form, en textur, en färg eller kontraster mellan färger. Vad dessa i slutändan blir är något som nätverket lär sig självt (se Bakåtpropagering sid. 8) och utgångspunkterna för vad dessa features är randomiseras. Featuren har ett visst pixelmått som bildar ett kvadratiskt fönster som kommer flyttas och matchas till alla delar av input-bilden (Coors, 2016). Detta fönster är vad som kallas lokalt receptorfält (eng. local receptive field) och är inspirerat av människans visuella cortex, där neuronerna är lokalt känsliga för specifik visuell input. Det är det lokala receptorfältet som möjliggör att den spatiala informationen behålls intakt i CNNs, då dessa endast är sammankopplade med ett fält av neuronerna i kommande dolda lager i nätet. Storleken är vanligtvis endast några pixlar bred och en pixel djup, t.ex. 3x3x1 (Rohrer, 2016). Djupet 1 betyder att en feature endast matchas till en färgkanal i taget (Suryani, 2017). Detta lokala receptorfält skjutas över hela bilden tills att alla delar har blivit granskade, vilket möjliggör att samma feature kan användas för att upptäcka mönster på flera delar av samma bild (Nielsen, 2015a). Detta görs med alla features på alla djup (färgkanaler) i bilden. Fig. 2, Lokalt receptorfält, (Nielsen, 2015a) 3

6 2.2 Konvolutionslagret Beräkningen som nu kommer utföras för att matcha alla features (en i taget) till inputbilden kallas konvolution eller faltning (eng. convolution) (Rohrer, 2016). I korthet går detta ut på att pixel för pixel i alla lager, med hjälp av det lokala receptorfältet, se om en feature finns (och till vilken grad den finns) i alla delar av bilden. Där matchningen är stor kommer resultatet att vara ett högt positivt tal, och där matchningen inte finns alls kommer resultatet vara ett lågt tal. Dessa outputs skapar en filtrerad bild, en featurekarta (ibland kallat aktiveringskarta), som visar var denna feature finns i bilden. Konvolution är den operation som kombinerar två separata dataset till ett nytt, i detta fall ursprungsbilden med alla features för att skapa featurekartorna (Raval, 2017). Fig. 3, Feature-matchning, (Rohrer, 2016) Konvolutionen räknas ut genom att varje pixel i receptorfältet (featuren som ska matchas) får ett tal (Rohrer, 2016). I en svartvit bild där pixlarna är antingen totalt svarta eller vita skulle dessa t.ex. få antingen -1 (svart) eller 1 (vitt), se fig. 3. Detta fönster jämförs sedan pixel för pixel med input-bilden genom att pixlarna på samma position multipliceras med varandra. Om båda är svarta kommer svaret bli 1 (-1x-1) och om båda är vita kommer svaret också bli 1 (1x1). Om de däremot inte har samma tal kommer resultatet bli -1 (1x-1). Dessa resultat sparas på samma position som pixlarna som jämförts. Om bilden inte är helt svartvit, alltså inte har endast två diskreta värden, kommer talen att vara kontinuerliga flyttal mellan dessa. Fig. 4, Konvolution, (Gupta, 2017) 4

7 Fig. 5, Featurekarta, (Rohrer, 2016). Fig. 6, Featurekartor, (Rohrer, 2016). När den första matchningen av featursen är klara utförs ytterligare en beräkning, ibland kallat filtrering (Rohrer, 2016). Detta görs genom att talen adderas med varandra som i fig. 4, eller som i exemplet i fig. 5 och 6 där de sedan divideras med antalet pixlar. Om alla pixlar har matchat varandra exakt kommer detta (i exemplet i fig. 5 och 6) resultera i 1 (( )/9=1), en perfekt matchning som betyder att denna feature finns exakt på den platsen i bilden. Om det däremot t.ex. var två pixlar som inte matchade kommer beräkningen att ge svaret 0.55 (( (-1)+(-1))/9=0.55). Om svaret är nära -1 här betyder det att bilden är en motsats av featuren, och om det är nära 0 finns ingen matchning alls. Detta görs med hela bilden, vilket är vad som kallas konvolution, och sedan igen med alla features som ska matchas. Outputen av konvolutionslagret blir en uppsättning av dessa filtrerade bilder, se fig. 6. Det blir lika många featurekartor som features man letat efter. Lägg märke till att featurekartorna är något mindre i bredd och höjd, då featuren endast kan flyttas ett antal steg innan den slår i kanten till höger och längst ner, och antal steg den tar blir storleken på featurekartan (Nielsen, 2015a). 5

8 Parametrarna för vad dessa features i konvolutinslagret ska vara, vilka värden matrisen ska bestå av, lärs in självt av det neurala nätet för att det ska få ut den mest användbara informationen (Dettmers, 2015). Detta är nödvändigt eftersom klassificeringen av olika objekt i bilder görs bäst med olika typer av information, och kommer därmed vara individuellt för varje situation. Den mest användbara informationen för att klassificera en bilmodell kommer till exempel inte att vara färgen, utan kanske formen, men för att klassificera en blomma kan färgen däremot vara långt mer användbar information än bara formen. 2.3 Rectified linear unit (ReLU) ReLU är ett normaliseringslager med en icke-linjär funktion som konverterar alla negativa tal i featurkartorna till 0, men behåller resten av talen som de är genom funktionen f(x)=max(0,x) (Mattson, 2016). Detta görs för att inlärda värden senare inte ska fastna kring 0 eller gå mot oändligheten (Rohrer, 2016), vilket skulle få matematiken att gå sönder, samt för att nätverket ska ha möjlighet att extrahera både linjära och icke-linjära relationer i datan (Mattson, 2016). I bakåtpropageringen betyder detta senare att inlärningen kommer ske snabbt för positiva tal och att inga negativa gradienter kommer användas för uppdateringen av vikter (Dettmers, 2015b). Denna aktiveringsfunktion är vanligast inom CNNs (Nielsen, 2015a). Det finns fler funktioner som fungerar, t.ex. Sigmoid och Tanh, men ReLU har visat sig ge bäst resultat i de flesta lägen. 2.4 Max pooling Poolinglagerts uppgift i CNNs, ibland kallat sub-sampling, är att minska storleken av featurekartorna genom att ta ut den viktigaste informationen (Coors, 2016). Detta är viktigt av flera anledningar. Genom denna metod kontrolleras overfitting hos nätverket eftersom kravet för spatial precision minskar, och det hänger mer på den spatiala relationen mellan olika features istället för faktiska positioner. Utöver detta minskar minnesåtgången mycket, eftersom datan (featurekartorna) blir mindre, vilket gör nätverken smidigare att hantera samt att det ger plats åt att göra nätverket djupare med fler lager (Dettmers, 2015a). Max pooling är den poolingmetod som har visat sig ge bäst resultat inom CNNs (Mattson, 2016). Detta görs likt konvolutionslagret genom att ett fönster av ett par pixlar, vanligtvis 3x3 eller 2x2, flyttas i vad som kallas en stride, ett antal steg i taget (Rohrer, 2016). Om striden är en pixel kommer outputen till nästa lager att vara i samma storlek som inputen, men om striden är två pixlar, vilket är vanligast, kommer storleken att bli halverad (Mattson, 2016). 6

9 Det är dock viktigt att hålla en balans mellan hur mycket man vill vinna i minne och hur generellt man låter nätverket bli. Ju större stride man väljer, desto mer spatial information går förlorad, och desto mer generellt blir det. Fig. 7, Max pooling, (Gupta, 2017) Max pooling sker genom att det största talet inom fönstret plockas ut för varje stride, och dessa skapar sedan en ny filtrerad version av den featurekarta som var inputen (Rohrer, 2016). Denna version behåller alltså samma mönster men är mer kompakt, se fig. 7. Om inputen är flera featurekartor görs max poolingen på alla dessa och fortsätter hålla dem isär i outputen. Ytterligare en metod för att undvika overfitting, som är vanlig att ha med inte nödvändig, är en funktion som regulariserar datan, kallad drop-out (Raval, 2017). Denna metod gör att slumpvis utvalda neuroners output sätts till 0. Detta betyder för nätverket att det tvingas lära sig nya sätt att känna igen mönster, och kan då inte förlita sig på enstaka neuroner med starka vikter. 2.5 Stapling av lager Dessa tre sorters lager, konvolutionslagret, ReLU-lagret, och max-poolinglagret är de komponenter som oftast finns med i CNN (Dettmers, 2015a). Eftersom outputen från dessa lager har samma dimensioner som inputen de tar kan dessa läggas efter varandra i flera omgångar. Ju fler konvolutionslager man har desto mer abstrakt blir informationen som filtreras ut, och ju fler pooling-lager man har desto mer kompakt och generell blir datan (Dettmers, 2015, Rohrer, 2016). Detta resulterar i att featuresen som tas ut blir mer och mer komplexa, då de behandlar större och större delar av bilderna i taget. Lägre/tidigare lager representerar alltså enklare features, t.ex. prickar, linjer och kanter, och högre upp har dessa ökat i komplexitet och representerar hela mönster och former. Vanliga variationer i dessa lager för CNNs kan vara allt från små nät: 7

10 Till djupare staplingar: Konvolutionslager à ReLU à Pooling à Klassificering Konvolutionslager à ReLU à Konvolutionslager à ReLU à Pooling à Klassificering Dessa kan varieras som man önskar. Till exempel hade vinnaren av ILSVRC år 2014 som mest 16 konvolutionslager (följt av ReLUs) och totalt 5 max-pooling-lager efter några av dessa (Simonyan & Zisserman, 2015). Detta var möjligt genom att de höll nere antal parametrar och vikter via användningen av små receptorfält (3x3 pixlar). 3 Klassificering 3.1 Fullt sammankopplat lager Den sista komponenten i ett CNN består av minst ett fullt sammankopplat lager, som utformas på samma sätt som i vanliga neurala nät (Raval, 2017). Även dessa kan läggas flera efter varandra för att bilda ett djupare nät. Att lagret är fullt sammankopplat betyder att alla neuroner i lagret innan är sammankopplade med alla neuroner i detta lager, men inga av dessa är kopplade till varandra inom det fullt sammankopplade lagret. Målet med det fullt sammankopplade lagret är att omvandla den hittills framtagna datan till probabilitet, eftersom målet med hela nätverket har varit att kunna klassificera bilder. I detta lager blir de tidigare tvådimensionella matriserna av siffror som bildar de filtrerade bilderna istället listor (vektorer) (Rohrer, 2016). Varje position i denna lista har en viss vikt mot en specifik output, alltså en viss klassificering av bilden. Neuronerna i outputlagret från det fullt sammankopplade lagret är lika många som antalet av de kategorier hela nätet ska kunna klassificera (Mattson, 2016). Detta kan se ut såhär: 8

11 Fig 8. Vikter mot en klass, (Edureka, 2017). I detta exempel (fig. 8), är det vissa positioner i denna lista som kommer ha höga tal om outputen är en specifik klass, här ett X (Edureka, 2017). Vilka dessa blir är inlärt. På samma vis kommer nätet att lära sig vilka andra positioner som tillsammans alla kommer ha höga tal för andra klasser. Dessa positioner kommer för ny input att adderas ihop och divideras med summan av samma positioner från listan med den specifika klassen (se fig. 9) för att få ett medelvärde av nätets gissning för respektive klass. Fig 9. (Egen redigering i rött, Edureka, 2017). I fig. 9 visas ett exempel på detta. De positioner som är starka för X adderas ihop, och divideras med summan av samma positioner hos facitbilden (Edureka, 2017). Resultatet blir att nätet tror att inputbilden är ett X med 91% säkerhet. Detta jämförs till sist med alla 9

12 sannolikheter för andra klassificeringar, varpå den med störst sannolikhet tas ut. Detta ger oss den mest sannolika klassen bilden enligt nätverket tillhör. En funktion som används för att göra dessa operationer, att omvandla input-matriserna till probabiliteter för varje enskild kategori, är Softmax (Deshpande, 2016). En softmax-output för 10 möjliga klasser kan till exempel se ut såhär för klassificering av siffror: [.05,.1,.0,.0,.75,.1,.0,.0,.0,.0]. Denna output kan ses som en sannolikhetsfördelning och betyder här att nätet tror att bilden den fått är en fyra med 75% säkerhet. Adderar man ihop resterade sannolikheter blir summan av en softmax-funktion alltid 1. 4 Bakåtpropagering Som tidigare nämnts finns det i nätverket vissa parametrar som lärs in av nätverket av sig självt, som inte bestäms av designern för hand. Dessa är framför allt vilka features som tas ut för klassificeringen och alla viktvärden mellan neuronerna, t.ex. vilka neuroner som ska ha stark vikt mot en viss klassificering (Raval, 2017). Detta görs genom att granska det fel som nätet gör varje gång det tränas på en bild (Rohrer, 2016). Om nätet kommer fram till att bilden föreställer en hund med.92 probabilitet, och en katt med.01, och det enligt facit är en hund, är det totala felet.09 ( ). Detta propageras sedan bakåt i nätet, vilket uppdaterar vikterna och featursen, genom gradient descent. Hur mycket de uppdateras beror på hur stort felet har blivit, och en parameter som kallas learning rate som bestäms av designern. Målet med detta är att hitta de förändringar som minskar felet i outputen, och genom många iterationer uppnås tillslut nätets minsta möjliga fel där det presterar så bra det kan (Mattson, 2016; Rohrer, 2016). 5 Hyperparametrar Hyperparametrar är de parametrar som nätverket inte kan lära sig självt och som därför designern bestämmer. Att bestämma hyperparametrarna är inte en simpel uppgift, och är speciellt svårt om nätet är stort och djup (Nielsen, 2015b). I konvolutionslagret rör dessa parametrar featursen, både antal och dess pixelstorlek (Rohrer, 2016). I pooling-lagret bestäms fönstrets storlek och dess stride. I de fullt sammankopplade lagerna är det antalet neuroner som ska bestämmas. Även learning rate i bakåtpropageringen, vilken regulariseringsparameter nätet ska använda och vilken initialisering av neuronernas vikter som ska användas är sådant som designern måste besluta. Utöver detta är det även en 10

13 fråga om, som tidigare nämnt, hur djupt nätet ska vara och hur många av varje sorts lager det ska finnas, samt i vilken ordning. Även om alla dessa nämnda parametrar fortfarande spelar in, fann Padmanabhan (2016) att en ökning antalet konvolutionslager påverkade prestationen av deras CNN positivt. Att djupet hade stor påverkan på prestationen var även något vinnarna av ILSVRC år 2014 fann, med ett djup på 19, och vidare analyserade vinnarna av samma tävling år 2015 hur man kan tackla de nya problem som uppstår vid CNNs så djupa som med 152 lager (He m.fl., 2015). Det He m.fl (2016) ville understryka var att maskininlärning med neurala nät inte endast var en fråga om djup. Eftersom hyperparametrarna i CNNs är många kan det vara svårt att veta vilka det är som skapar problem i ens nätverk, och därmed svårt att veta vilka som bör ändras (Nielsen, 2015b). När detta händer finns det inga regler att följa, och inte heller ett fast värde där man vet att nätverket är så optimalt det kan bli, eftersom detta alltid kommer att variera mellan alla nät (Rohrer, 2016). Det finns däremot allmänna metoder som tenderar att fungera bra, och de största framstegen som görs inom CNNs idag bygger på att hitta nya och bättre kombinationer av dessa parametrar. Dessa kan behandla de parametrar som redan finns, men forskarna i framkant är de som även lyckas integrera nya sorters lager och funktioner. Ett tillvägagångsätt som visat sig ge goda resultat, och som därför inte är ovanligt, är att låta fler enskilda CNNs lära sig av samma data, och sedan rösta om vilken klassificering som är rätt (Nielsen, 2015a). Det är relativt intuitivt att förstå att detta skulle kunna minska antal fel, då sannolikheten att alla separata nätverk gör samma fel inte är lika stor som sannolikheten att ett ensamt nätverk gör fel. 6 Användningsområden, diskussion och slutsats Det är nu när CNN och andra neurala nät visar på hög träffsäkerhet som både företag och andra aktörer börjar känna sig bekväma med att integrera dessa i deras verksamheter. I detta läge bör de enligt mig i första hand, eftersom detta fortfarande är relativt nytt, endast användas som beslutsstöd, men bara detta kan skapa stor effektivisering samt säkerhet inom många områden. Ett exempel på hur CNNs kan användas för effektivitet är Microsoft Azure (Lösningsarkitektur: Bildklassificering med CNN-nätverk (Convolutional Neural Network), (hämtad) 2018). De använder ett CNN med sista lagret ersatt av ett beslutsträd för att 11

14 klassificera bilder av nyproducerade kretskort som godkända eller icke godkända. Detta resulterar i att mänsklig expertis endast behöver appliceras på de som klassas som icke godkända av nätet för att göra den slutgiltiga bedömningen. Inom vården har CNNs fått stor uppmärksamhet i frågor rörande hudcancerdiagnostisering (Esteva m.fl., 2017). Dessa har visat sig kunna klassificera hudcancer korrekt i högre grad än experter, vilket ger stora förhoppningar för framtidens tillgänglighet av sjukvård. Detta kan med andra ord betyda att fler människor i framtiden kommer ha finansiell möjlighet att få denna livsavgörande vård. Detta är ett område där jag personligen anser att teknikutveckling är som allra viktigast. Dessa hjälpmedel är då inte bara en effektivisering som gynnar företag, utan de kan till och med rädda liv. En aspekt som jag ser som ett spännande skift är hur framgångar inom detta fält nu främst tycks bero på nya idéer till skillnad från tidigare, då utvecklingen av datorers beräkningsprestanda samt tillgång till träningsdata verkar ha varit den största drivkraften. I detta läge handlar det om att optimera genom nya sätt att tänka, vilket enligt mig öppnar upp långt mer intressanta möjligheter för framtiden. Detta betyder att utbildning av fler människor och möjligtvis integrering av fler forskningsfält är vad som kommer föra dessa tekniker och idéer framåt. Utifrån mina lärdomar av detta arbete är min förmodan och förhoppning att användningen och utvecklingen av CNNs kommer ha stor positiv påverkan på framtiden. 12

15 Referenslista Cheng, Y., Cai, R., Zhao, X., Huang, K. (2015). Convolutional Fisher Kernels for RGB-D Object Recognition International Conference on 3D Vision (3DV). Institute of Electrical and Electronics Engineers, Inc. Coors, B. (2016). Navigation of Mobile Robots in Human Environments with Deep Reinforcement Learning. KTH Royal Institute of Technology. Deshpande, A. (2016). A Beginner's Guide To Understanding Convolutional Neural Networks. Hämtad från: -To-Understanding-Convolutional-Neural-Networks/ Dettmers, T. (2015a). Deep Learning in a Nutshell: Core Concepts. Hämtad från: Dettmers, T. (2015b). Deep Learning in a Nutshell: History and Training. Hämtad från: Edureka. (2017). Convolutional Neural Network (CNN) Convolutional Neural Networks With TensorFlow Edureka. Hämtad från: Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M, Blau, M. H., Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature 542, Doi: /nature Gupta, V. (2017). Image Classification using Convolutional Neural Networks in Keras. Hämtad från: He, K., Zhang, X., Ren, S., & Sun, J. (2015a). Deep residual learning for image recognition. CoRR, abs/ Hubel, D. H. & Wiesel, T. N. (1962). Receptive fields, binocular interaction and functional architecture in the cat s visual cortex. The Journal of Physiology, 160(1): Johnson, R. C. (2015). Microsoft, Google Beat Humans at Image Recognition: Deep learning algorithms compete at ImageNet challenge. Hämtad från: Mattson, N. (2016). Classification Performance of Convolutional Neural Networks. Uppsala Universitet. Microsoft Azure. (Hämtad 2018). Lösningsarkitektur: Bildklassificering med CNN-nätverk (Convolutional Neural Network). Hämtad från: 13

16 networks/ Nielsen, M. (2015a). Neural Networks and Deep Learning, Kap. 6, Determination Press, Hämtad från: Nielsen, M. (2015b). Neural Networks and Deep Learning, Kap. 3, Determination Press, Hämtad från: l_network's_hyper-parameters Olah, C. (2014). Conv Nets: A Modular Perspective. Hämtad från: Padmanabhan, S. (2016). Convolutional Neural Networks for Image Classification and Captioning, Department of computer science, Stanford University. Raval, S. (2017). Convolutional Neural Networks - The Math of Intelligence (Week 4), Hämtad från: Rohrer, B. (2016). How Convolutional Neural Networks work. Hämtad från: Simonyan, K. & Zisserman, A. (2015). Very deep convolutional networks for large-scale image recognition. Visual Geometry Group, Department of Engineering Science, University of Oxford. Suryani, D. (2017). Convolutional Neural Network. Hämtad från: WorldQuant. (2017). Welcome to the machine. Hämtad från: 14

729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap

729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap 729G43 Artificiell intelligens (2016) Maskininlärning 3 Marco Kuhlmann Institutionen för datavetenskap Modell med vektornotation parametervektor särdragsvektor Perceptron kombinerar linjär regression med

Läs mer

Ett Neuralt Nätverk Tittar På Kläder

Ett Neuralt Nätverk Tittar På Kläder [Skriv här] [Skriv här] [Skriv här] 2019 Ett Neuralt Nätverk Tittar På Kläder ETT KONVOLUTIONELLT NEURALT NÄTVERK KATEGORISERAR FASHION MNIST DATASETET WILHELM BRODIN, WILBR797 1.1 Inledning En människas

Läs mer

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen

Läs mer

729G43. Neurala faltningsnät MASKINSYN PÅ SVENSKA VENDELA FOLKER ÅKERLIND

729G43. Neurala faltningsnät MASKINSYN PÅ SVENSKA VENDELA FOLKER ÅKERLIND 729G43 Neurala faltningsnät MASKINSYN PÅ SVENSKA VENDELA FOLKER ÅKERLIND Innehållsförteckning Bakgrund... 2 Historia... 2 ImageNet... 2 Avgränsningar och språk... 3 Artificiella neurala nät... 3 Tillbakaspridning...

Läs mer

Google Assistant & WaveNet

Google Assistant & WaveNet Google Assistant & WaveNet Projektrapport om CNN Maja Albrektson 27/12 17 Linköpings universitet 729G43, Artificiell Intelligens 0 SAMMANFATTNING Denna rapport beskriver WaveNet, en generativ modell av

Läs mer

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning

Läs mer

Artificiell Intelligens den nya superkraften

Artificiell Intelligens den nya superkraften Artificiell Intelligens den nya superkraften Socialchefsdagarna, 4 oktober 2018 #CGINext Artificiell Intelligens Förmågan hos mjukvara att agera självständigt på ett intelligent sätt tidigare bara associerat

Läs mer

de var svåra att implementera och var väldigt ineffektiva.

de var svåra att implementera och var väldigt ineffektiva. OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan

Läs mer

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,

Läs mer

1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05

1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05 1(15) Bilaga 1 2(15) Neuronnätslaboration Räknare Denna laboration riktar sig till gymnasieelever som går en teknisk utbildning och som helst har läst digitalteknik samt någon form av styrteknik eller

Läs mer

Algoritmer och maskininlärning

Algoritmer och maskininlärning Algoritmer och maskininlärning Olof Mogren Chalmers tekniska högskola 2016 De här företagen vill Tjäna pengar Hitta mönster i stora datamängder Göra förutsägelser Klassificera data Förstå människan Maskininlärning

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Sub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén,

Sub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, Sub-symbolisk kognition & Konnektionism Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, mats.andren@liu.se 1 Konnektionism Neutrala nät baseras på en (förenklad) modell av hur hjärnan fungerar.

Läs mer

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full

Läs mer

729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap

729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap 729G43 Artificiell intelligens (2016) Maskininlärning 2 Marco Kuhlmann Institutionen för datavetenskap Förra gången: Gradientsökning tangentens lutning i punkt θ steglängdsfaktor Översikt Introduktion

Läs mer

Perception och Maskininärning i Interaktiva Autonoma System. Michael Felsberg Institutionen för systemteknik Linköpings universitet

Perception och Maskininärning i Interaktiva Autonoma System. Michael Felsberg Institutionen för systemteknik Linköpings universitet Perception och Maskininärning i Interaktiva Autonoma System Michael Felsberg Institutionen för systemteknik Linköpings universitet Vad är WASP? Wallenberg Autonomous Systems Program Sveriges största individuella

Läs mer

729G43 Artificiell intelligens / Maskininlärning 2. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 2. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 2 Marco Kuhlmann Förra gången: Linjär regression Gradientsökning Vandra ner i felets dal. Steg 0: Börja med ett godtyckligt värde för θ. Steg 1: Räkna

Läs mer

Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.

Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA5 Institutionen för teknik och naturvetenskap Linköpings universitet

Läs mer

Grafiska pipelinens funktion

Grafiska pipelinens funktion LUNDS TEKNISKA HÖGSKOLA CAMPUS HELSINGBORG Grafiska pipelinens funktion Ludvig von Sydow EDT62, HT17 Datorarkitekturer med Operativsystem Sammanfattning Denna rapport syftar till att beskriva hur en graphics

Läs mer

EnBlightMe! - ett automatiserat stödsystem för upptäckt av potatisbladmögel

EnBlightMe! - ett automatiserat stödsystem för upptäckt av potatisbladmögel EnBlightMe! - ett automatiserat stödsystem för upptäckt av potatisbladmögel Erland Liljeroth, Erik Alexandersson (SLU, Alnarp) Kristin Piikki, Mats Söderström (SLU Skara) Oscar Bagge, Hanna Blomquist,

Läs mer

Artificiell Intelligens Lektion 7

Artificiell Intelligens Lektion 7 Laboration 6 Artificiell Intelligens Lektion 7 Neurala nätverk (Lab 6) Probabilistiska resonemang Vad? Mönsterigenkänning Lära ett neuralt nätverk att känna igen siffror Varför? Få ökad förståelse för

Läs mer

Vindkraft och ML. - hur kan vindkraft dra nytta avml

Vindkraft och ML. - hur kan vindkraft dra nytta avml Vindkraft och ML - hur kan vindkraft dra nytta avml AI och ML Intelligens: förmågan att utnyttja kunskap för att bättre lösa en klass av uppgifter Lärande: förmågan att förbättra sin förmåga att lösa uppgifterna

Läs mer

Matcha rätt hjärta till rätt patient med AI. Dennis Medved

Matcha rätt hjärta till rätt patient med AI. Dennis Medved Matcha rätt hjärta till rätt patient med AI Dennis Medved Översikt Introduktion IHTSA LuDeLTA Sammanfattning Framtida arbete Introduktion Hjärttransplantation Livräddande operation för patienter med hjärtsvikt

Läs mer

Maskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi

Maskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med

Läs mer

Ansiktsigenkänning. Anna Ericsson Linköpings Universitet Linköping

Ansiktsigenkänning. Anna Ericsson Linköpings Universitet Linköping Ansiktsigenkänning Anna Ericsson Linköpings Universitet Linköping 2011-09-18 Innehållsförteckning Sammanfattning... 1 Introduktion... 2 Ansiktsigenkänning med Eigenfaces... 3 Eigenfaces steg för steg...

Läs mer

Enlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät

Enlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät Artificiella Neuronnät 1 Karaktäristiska egenskaper Användningsområden Klassiska exempel Biologisk bakgrund 2 Begränsningar Träning av enlagersnät 3 Möjliga avbildningar Backprop algoritmen Praktiska problem

Läs mer

med hjälp av Deep Reinforcement Learning

med hjälp av Deep Reinforcement Learning Agent som kan spela Atarispel bättre än människor med hjälp av Deep Reinforcement Learning Sofie Adolfsson, sofad117@student.liu.se Artificiell Intelligens Linköpings Universitet 2017-01-12 SofieAdolfsson

Läs mer

2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.

2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit. 2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen

Läs mer

SHAZAM! En!smart!musiktjänst! Linha108! Fördjupningsarbete!729G43!

SHAZAM! En!smart!musiktjänst! Linha108! Fördjupningsarbete!729G43! SHAZAM Ensmartmusiktjänst Linha108 Fördjupningsarbete729G43 Sammanfattning Shazam är en musiktjänst som genom en sökalgoritm kan känna igen ljud och returnera låt och artist till användaren. Detta sker

Läs mer

Inlärning utan övervakning

Inlärning utan övervakning Översikt Biologiska mekanismer bakom inlärning Inlärning utan övervakning Inlärning utan övervakning Hebbiansk modellinlärning Självorganisering Arbetsfördelning mellan noder i ett lager som utvecklas

Läs mer

Ansiktsigenkänning med MATLAB

Ansiktsigenkänning med MATLAB Ansiktsigenkänning med MATLAB Avancerad bildbehandling Christoffer Dahl, Johannes Dahlgren, Semone Kallin Clarke, Michaela Ulvhammar 12/2/2012 Sammanfattning Uppgiften som gavs var att skapa ett system

Läs mer

SIMD i Intel s P5- baserade Pentium MMX

SIMD i Intel s P5- baserade Pentium MMX SIMD i Intel s P5- baserade Pentium MMX Maurits Gabriel Johansson - IDA2 Datorarkitekturer med operativsystem - 4 december 2016 SIMD I INTEL S P5-BASERADE PENTIUM MMX 1 Abstrakt Moderna CPU s (Central

Läs mer

TEM Projekt Transformmetoder

TEM Projekt Transformmetoder TEM Projekt Transformmetoder Utförs av: Mikael Bodin 19940414 4314 William Sjöström 19940404 6956 Sammanfattning I denna laboration undersöks hur Fouriertransformering kan användas vid behandling och analysering

Läs mer

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 Möjligheter/Problem med 2-dimensionella mätdata Uppstart: Se planen (kursens hemsida) Etapp 1 Mätdata i 2 dimensioner behöver utredas/signalbehandlas

Läs mer

Jämförelse av skrivtekniker till cacheminne

Jämförelse av skrivtekniker till cacheminne Jämförelse av skrivtekniker till cacheminne 1 Innehåll 1. Sammanfattning 2. Inledning 3. Diskussion 4. Referenslista 1. Sammanfattning En rapport innehållande jämförelser av olika skrivtekniker till minnen

Läs mer

Artificiella Neuronnät

Artificiella Neuronnät Artificiella Neuronnät 2 3 4 2 (ANN) Inspirerade av hur nervsystemet fungerar Parallell bearbetning Vi begränsar oss här till en typ av ANN: Framåtkopplade nät med lagerstruktur 3 4 Fungerar i princip

Läs mer

ANN fk. Örjan Ekeberg. Framåtkopplade Nät. återkopplade nät. Olika arkitekturer. BackPropagation through Time. Kalman-Filter tekniker

ANN fk. Örjan Ekeberg. Framåtkopplade Nät. återkopplade nät. Olika arkitekturer. BackPropagation through Time. Kalman-Filter tekniker Hantering av Tid Återkopplade Återkopplade Återkopplade t Återkopplade Återkopplade Temporala signaler är svåra Gör om temporal signal till spatial t 1 t 2 t 3 t 4 Återkopplade t Enklaste formen Neuronal

Läs mer

Hierarchical Temporal Memory Maskininlärning

Hierarchical Temporal Memory Maskininlärning Hierarchical Temporal Memory Maskininlärning Innehåll Sammanfattning... 3 Inledning... 4 Vad är HTM?... 4 Hur fungerar HTM?... 4 Hierarchical... 4 Temporal... 5 Memory... 5 Hitta orsaker i världen... 5

Läs mer

Emma Hallstan Emmha584

Emma Hallstan Emmha584 LINKÖPING UNIVERISTET SIFT AIBOs ögon Emma Hallstan Emmha584 Innehållsförteckning Inledning... 3 Syfte... 3 SIFT- Scale Invariant Feature Transform... 3 Historien om SIFT... 4 SIFT algoritmen... 4 1. Scale-space

Läs mer

Igenkänning av bilddata med hjälp av Kohonen-nätverk, samt beskrivning av program

Igenkänning av bilddata med hjälp av Kohonen-nätverk, samt beskrivning av program Igenkänning av bilddata med hjälp av Kohonen-nätverk, samt beskrivning av program Jerker Björkqvist September 2001 1 Introduktion I detta arbete undersökts hur klassificering av bilddata kan göras med

Läs mer

Linköpings universitet

Linköpings universitet Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga

Läs mer

Digitalitet. Kontinuerlig. Direkt proportionerlig mot källan. Ex. sprittermometer. Elektrisk signal som representerar ljud.

Digitalitet. Kontinuerlig. Direkt proportionerlig mot källan. Ex. sprittermometer. Elektrisk signal som representerar ljud. Analog Digitalitet Kontinuerlig Direkt proportionerlig mot källan Ex. sprittermometer Elektrisk signal som representerar ljud Diskret Digital Representation som siffror/symboler Ex. CD-skiva Varje siffra

Läs mer

HAND TRACKING MED DJUPKAMERA

HAND TRACKING MED DJUPKAMERA HAND TRACKING MED DJUPKAMERA ETT PROJEKT I TNM090 - SOFTWARE ENGINEERING Rasmus KARLSSON Per JOHANSSON Erik HAMMARLUND raska293@student.liu.se perjo020@student.liu.se eriha891@student.liu.se 2014-01-14

Läs mer

Projektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.

Projektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Projektion av träningsdata på aktuell underrum av dim Föreläsning : Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA Institutionen för

Läs mer

Bildbehandling i frekvensdomänen

Bildbehandling i frekvensdomänen Uppsala Tekniska Högskola Signaler och system Handledare: Mathias Johansson Uppsala 2002-11-27 Bildbehandling i frekvensdomänen Erika Lundberg 800417-1602 Johan Peterson 790807-1611 Terese Persson 800613-0267

Läs mer

Att programmera en Beethoven

Att programmera en Beethoven Linköpings universitet Att programmera en Beethoven Fördjupning inom Neurala nätverk och LSTM 2018-01-03 Innehåll 1 Inledning- Musik och artificiell intelligens... 2 1.1 Historia... 2 1.2 Bakgrund AIVA...

Läs mer

729G43 Artificiell intelligens (2016) Maskininlärning 1. Marco Kuhlmann Institutionen för datavetenskap

729G43 Artificiell intelligens (2016) Maskininlärning 1. Marco Kuhlmann Institutionen för datavetenskap 729G43 Artificiell intelligens (2016) Maskininlärning 1 Marco Kuhlmann Institutionen för datavetenskap Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå

Läs mer

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum: Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer

Läs mer

Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.

Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant. Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant. Sammanfattning När processorns klockhastighet ökar medför det en ökning av instruktioner vilket såklart ökar

Läs mer

Grafiska pipelinen. Edvin Fischer

Grafiska pipelinen. Edvin Fischer Grafiska pipelinen Edvin Fischer Sammanfattning Rapporten behandlar den grafiska pipelinen och dess steg, vilka stegen är och hur de funkar. Inledning Rapporten har till syfte att beskriva hur den grafiska

Läs mer

x 23 + y 160 = 1, 2 23 = ,

x 23 + y 160 = 1, 2 23 = , Matematiska Institutionen KTH Lösningar till några övningar, inför tentan moment B, på de avsnitt som inte omfattats av lappskrivningarna, Diskret matematik för D2 och F, vt08.. Ett RSA-krypto har n =

Läs mer

! "# # # $ # " % & # # '(") " " )## (")"#*+*(, ( - " ' # (") #. % % /

! # # # $ #  % & # # '()   )## ()#*+*(, ( -  ' # () #. % % / ! "# # # $ # " % & # # '(") " " )## (")"#*+*(, ( - " ' # (") #. % % / Hageltal Problem ID: hageltal Tänk dig att du skriver upp alla positiva heltal på ett oändligt stort papper. Från varje tal n>1 ritar

Läs mer

HI1024 Programmering, grundkurs TEN

HI1024 Programmering, grundkurs TEN HI1024 Programmering, grundkurs TEN2 2014-10-27 KTH STH Haninge 13.15-18.00 Tillåtna hjälpmedel: En A4 handskriven på ena sidan med egna anteckningar Kursboken C PROGRAMMING A Modern Approach K. N. King

Läs mer

Single-word speech recognition with Convolutional Neural Networks on raw waveforms

Single-word speech recognition with Convolutional Neural Networks on raw waveforms Single-word speech recognition with Convolutional Neural Networks on raw waveforms Patrick Jansson Degree Thesis Information technology Förnamn Efternamn 2018 EXAMENSARBETE Arcada Utbildningsprogram: Informationsteknik

Läs mer

ATT ARBETA MED VEKTORGRAFIK

ATT ARBETA MED VEKTORGRAFIK ATT ARBETA MED VEKTORGRAFIK Helene Brogeland Vektorgrafik och animation VT 2014 2014-04-29 Inledning Före aktuell kurs hade jag bara en vag uppfattning av innebörden av vektorgrafik och hade aldrig jobbat

Läs mer

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens

Läs mer

Ett enkelt OCR-system

Ett enkelt OCR-system P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor

Läs mer

Histogram över kanter i bilder

Histogram över kanter i bilder Histogram över kanter i bilder Metod Både den svartvita kanstdetekteringen och detekteringen av färgkanter följer samma metod. Först görs en sobelfiltrering i både vertikal och horisontell led. De pixlar

Läs mer

Martin Burström [dit02mbm] Robert Eriksson [dit02ren] Filip Sjögren [dit02fsn] Handledare: Therese Edvall Daniel Ölvebrink 2009-07-06 22:13

Martin Burström [dit02mbm] Robert Eriksson [dit02ren] Filip Sjögren [dit02fsn] Handledare: Therese Edvall Daniel Ölvebrink 2009-07-06 22:13 Artificiell intelligens I, 5p Laboration 2 Fördjupning i perception och objektigenkänning Martin Burström [dit02mbm] Robert Eriksson [] Filip Sjögren [dit02fsn] Handledare: Therese Edvall Daniel Ölvebrink

Läs mer

Optimera, inte eliminera, den mänskliga hjärnan genom AI. Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB

Optimera, inte eliminera, den mänskliga hjärnan genom AI. Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB Optimera, inte eliminera, den mänskliga hjärnan genom AI Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB En av sjukvårdens största utmaningar är ökande personalbrist 4 av 10 läkare

Läs mer

729G43 Artificiell intelligens / Maskininlärning 1. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 1. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 1 Marco Kuhlmann Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå naturligt språk kontrollera maskiner,

Läs mer

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs... OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs... OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

Algebra och Geometri SF1624

Algebra och Geometri SF1624 Algebra och Geometri SF1624 Agenda 28/8/2017: 1 Information om kursen 2 vektorer Sandra Di Rocco dirocco@kth.se professor, institution för Matematik https://people.kth.se/~dirocco/ Webbsida: Canvas logga

Läs mer

Om intellektuell funktionsnedsättning

Om intellektuell funktionsnedsättning Om intellektuell funktionsnedsättning SvenOlof Dahlgren E-post: svenolof@huh.se GRUNDFÖRUTSÄTTNINGAR Litet forskningsunderlag Barn, ungdomar och vuxna med Intellektuell funktionsnedsättning (If) oftast

Läs mer

Mentorprogram Real diversity mentorskap Att ge adepten stöd och vägledning Adeptens personliga mål Att hantera utanförskap

Mentorprogram Real diversity mentorskap Att ge adepten stöd och vägledning Adeptens personliga mål Att hantera utanförskap Mentorprogram Real diversity mentorskap Real diversity är ett projekt som fokuserar på ungdomar i föreningsliv och arbetsliv ur ett mångfaldsperspektiv. Syftet med Real diversity är att utveckla nya metoder

Läs mer

HKGBB0, Artificiell intelligens

HKGBB0, Artificiell intelligens HKGBB0, Artificiell intelligens Kortfattade lösningsförslag till tentan 3 november 2005 Arne Jönsson 1. Vad karaktäriserar dagens AI-forskning jämfört med den AI-forskning som bedrevs perioden 1960-1985.

Läs mer

Linköpings universitet

Linköpings universitet 2014-09-08 Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 5 Integrationsutmaningen Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga

Läs mer

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Flervariabel Analys för Civilingenjörsutbildning i datateknik Flervariabel Analys för Civilingenjörsutbildning i datateknik Henrik Shahgholian KTH Royal Inst. of Tech. 2 / 9 Utbildningens mål Gällande matematik: Visa grundliga kunskaper i matematik. Härmed förstås

Läs mer

Vektorer, matriser, nätverk - några elementa

Vektorer, matriser, nätverk - några elementa Vektorer, matriser, nätverk - några elementa Innehåll: Vektorer Radvektorer och kolumnvektorer Operationer med vektorer Input- och outputvektorer i neurala nätverk Utvikning om kompetitiva nät Matriser

Läs mer

Datalogiskt tänkande för alla

Datalogiskt tänkande för alla Datalogiskt tänkande för alla Fredrik Heintz, IDA fredrik.heintz@liu.se @FredrikHeintz Linda Mannila linda.mannila@abo.fi @lindamannila Software is eating the world Trends AI och Autonoma System redan

Läs mer

FAKTAAVSNITT: ARBETSMINNETS UTVECKLING OCH KOPPLING TILL ANDRA FÖRMÅGOR

FAKTAAVSNITT: ARBETSMINNETS UTVECKLING OCH KOPPLING TILL ANDRA FÖRMÅGOR FAKTAAVSNITT: ARBETSMINNETS UTVECKLING OCH KOPPLING TILL ANDRA FÖRMÅGOR ARBETSMINNETS UTVECKLING Arbetsminnet utvecklas som mest mellan åldrarna 5 till 11 år. En fyraåring har ett relativt outvecklat arbetsminne

Läs mer

Ventilen. Nytt på IT- fronten. System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande

Ventilen. Nytt på IT- fronten. System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande Ventilen Nytt på IT- fronten System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande https://www.youtube.com/watch?v=nfneoooeqx4 https://www.youtube.com/watch?v=nfneoooeqx4

Läs mer

Fingerprint Matching

Fingerprint Matching Fingerprint Matching Björn Gustafsson bjogu419 Linus Hilding linhi307 Joakim Lindborg joali995 Avancerad bildbehandling TNM034 Projektkurs Biometri 2006 1 Innehållsförteckning 1 Innehållsförteckning 2

Läs mer

Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information

Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information ARTIFICIELL INTELLIGENS II INSTITUTUINEN FÖR DATAVETENSKAP LINKÖPINGS UNIVERSITET Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information Anna

Läs mer

Projekt i bildanalys Trafikövervakning

Projekt i bildanalys Trafikövervakning Projekt i danalys Trafikövervakning F 99 F 00 Handledare : Håkan Ardö Hösten 3 vid Lunds Tekniska Högskola Abstract Using traffic surveillance cameras the authorities can get information about the traffic

Läs mer

MARTIN ISAKSSON KTH SKOLAN FÖR ELEKTRO- OCH SYSTEMTEKNIK

MARTIN ISAKSSON KTH SKOLAN FÖR ELEKTRO- OCH SYSTEMTEKNIK EXAMENSARBETE INOM ELEKTROTEKNIK, AVANCERAD NIVÅ, 30 HP STOCKHOLM, SVERIGE 2017 StemNet A Temporally Trained Fully Convolutional Network for Segmentation of Muscular Stem Cells MARTIN ISAKSSON KTH SKOLAN

Läs mer

Laboration 4: Digitala bilder

Laboration 4: Digitala bilder Objektorienterad programmering, Z : Digitala bilder Syfte I denna laboration skall vi återigen behandla transformering av data, denna gång avseende digitala bilder. Syftet med laborationen är att få förståelse

Läs mer

Optimering av hyperparametrar till artificiella neurala nätverk med genetiska algoritmer.

Optimering av hyperparametrar till artificiella neurala nätverk med genetiska algoritmer. Optimering av hyperparametrar till artificiella neurala nätverk med genetiska algoritmer. Simon Stensson Juni 6, 2016 Abstract This master thesis explores the feasibility of using genetic algorithms in

Läs mer

Kandidatuppsats. Jämförelse mellan neurala nätverk baserad AI och state-of-the-art AI i racing spel. Simon Karlsson, Christopher Jensen

Kandidatuppsats. Jämförelse mellan neurala nätverk baserad AI och state-of-the-art AI i racing spel. Simon Karlsson, Christopher Jensen Kandidatuppsats Jämförelse mellan neurala nätverk baserad AI och state-of-the-art AI i racing spel Simon Karlsson, Christopher Jensen Sammanfattning Denna rapport jämför prestandan mellan state-of-the-art

Läs mer

Case-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011

Case-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011 Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka

Läs mer

Matematik med QR-koder

Matematik med QR-koder Matematik med QR-koder PML18 2018-09-26 Carina Bognäs Matematikutvecklare Pedagogisk Inspiration Malmö Dagens workshop Vad är en QR-kod? Varför QR-koder? QR-koder som pedagogiskt verktyg Att upptäcka matematik

Läs mer

Matematik 92MA41 (15hp) Vladimir Tkatjev

Matematik 92MA41 (15hp) Vladimir Tkatjev Matematik 92MA41 (15hp) Vladimir Tkatjev Med anledning av de nya kursplanerna har Strävorna reviderats. Formen, en matris med rutor, är densamma men istället för att som tidigare anknyta till mål att sträva

Läs mer

Study and Analysis of Convolutional Neural Networks for Pedestrian Detection in Autonomous Vehicles

Study and Analysis of Convolutional Neural Networks for Pedestrian Detection in Autonomous Vehicles UPTEC F 18020 Examensarbete 30 hp Juni 2018 Study and Analysis of Convolutional Neural Networks for Pedestrian Detection in Autonomous Vehicles Louise Augustsson Abstract Study and Analysis of Convolutional

Läs mer

Hört och lärt på NES2012 Session: Visual ergonomics

Hört och lärt på NES2012 Session: Visual ergonomics Ergonomisektionen/LSR Hört och lärt på NES2012 Session: Visual ergonomics Frukostseminarie I samverkan med Mousetrapper 2 oktober, 2012 08.30-09.30 Susanne Glimne Leg. Optiker/Universitetsadjunkt Optikerprogrammet

Läs mer

Neural bas för kognition

Neural bas för kognition Kommunikation Neural bas för kognition stimulerande, retande inhiberande, förhindrande depolarisation vid tillräckligt mycket retning blir hela neuronen för en stund positivt laddad, då har en SPIKE uppnåtts

Läs mer

Structuring Two Dimensional Space

Structuring Two Dimensional Space Structuring Two Dimensional Space Structuring Two Dimensional Space Vi tar in mönster mestadels som tvådimensionella plan utan djup. Dessa tvådimensionella mönster är viktiga av två anledningar; 1. De

Läs mer

Personifierad Netflix

Personifierad Netflix Linköpings universitet Personifierad Netflix Lisa Rönnqvist 2016-08-24 Sammanfattning INNEHÅLLSFÖRTECKNING 1. Inledning... 1 1.1 Bakgrund... 1 1.2 Syfte... 2 2. Netflix... Fel! Bokmärket är inte definierat.

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 4: Metadatastandarder Mer om metadatastandarder Välkommen till presentation 3 i pass 4. Den här presentationen handlar om några olika teman som har att göra med metadatastandarder. Jag kommer att

Läs mer

SELF- ORGANIZING MAPS

SELF- ORGANIZING MAPS LINKÖPINGS UNIVERSITET Kognitionsvetenskapliga Programmet Examinator: Arne Jönsson SELF- ORGANIZING MAPS - Ett fördjupningsarbete inom Artificiell Intelligens Fack 52 katwa676@student.liu.se Sammanfattning

Läs mer

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder. OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

UNIVERSITETSRANKINGEN FRÅN TIMES HIGHER EDUCATION 2013

UNIVERSITETSRANKINGEN FRÅN TIMES HIGHER EDUCATION 2013 UNIVERSITETSRANKINGEN FRÅN TIMES HIGHER EDUCATION 2013 En analys av resultatet för Göteborgs. Magnus Gunnarsson / Enheten för analys och utvärdering PM 2013:12 Diarienummer V2013/781 Oktober 2013 GÖTEBORGS

Läs mer

Tentamen Bildanalys (TDBC30) 5p

Tentamen Bildanalys (TDBC30) 5p Tentamen Bildanalys (TDBC30) 5p Skrivtid: 9-15 Hjälpmedel: kursboken Digital Image Processing Svara på alla frågor på nytt blad. Märk alla blad med namn och frågenummer. Disponera tiden mellan frågorna

Läs mer

Min syn på koncepthantering generering och utvärdering

Min syn på koncepthantering generering och utvärdering Min syn på koncepthantering generering och utvärdering Linus Granström KN3060, Produktutv. med formgivning Mälardalens högskola 2007-04-25 Inledning Denna essä beskriver författarens syn på de steg i produktutvecklingsprocessen

Läs mer

Medicinska Bilder, TSBB31. Lab: Mätvärden på Medicinska Bilder

Medicinska Bilder, TSBB31. Lab: Mätvärden på Medicinska Bilder Medicinska Bilder, TSBB3 Lab: Mätvärden på Medicinska Bilder Maria Magnusson, 22 Senaste updatering: september 25 Avdelningen för Datorseende, Institutionen för Systemteknik Linköpings Universitet Introduktion

Läs mer

CDC en jämförelse mellan superskalära processorer. EDT621 Campus Helsingborg av: Marcus Karlsson IDA

CDC en jämförelse mellan superskalära processorer. EDT621 Campus Helsingborg av: Marcus Karlsson IDA CDC6600 - en jämförelse mellan superskalära processorer av: Marcus Karlsson Sammanfattning I denna rapport visas konkret information om hur den första superskalära processorn såg ut och hur den använde

Läs mer

Bildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet

Bildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet Bildmosaik Bilddatabaser, TNM025 Linko pings Universitet Anna Flisberg Linne a Mellblom annfl042 linme882 28 maj 2015 Innehåll 1 Introduktion 2 2 Metod 2 2.1 Features..............................................

Läs mer

1 Mätdata och statistik

1 Mätdata och statistik Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt

Läs mer

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och

Läs mer

Artificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?)

Artificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?) Artificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?) 1.a November 2011 Innan vi börjar R.I.P. John McCarthy (1924 2011) Grundare av ämnet artificiell

Läs mer