Liswi948, Lisa Widerberg, liswi948 Fördjupningsarbete Linköpings Universitet 729G43, Artificiell Intelligens
|
|
- Joakim Mattsson
- för 5 år sedan
- Visningar:
Transkript
1 Lisa Widerberg, liswi948 Fördjupningsarbete Linköpings Universitet 729G43, Artificiell Intelligens
2 Innehållsförteckning 1 Inledning Bakgrund Bilder som tredimensionella matriser 2 2 Feature-inlärning Features och lokala receptorfält Konvolutionslagret Rectified linear unit (ReLU) Max pooling Stapling av lager 7 3 Klassificering Fullt sammankopplat lager 8 4. Bakåtpropagering Hyperparametrar Användningsområden, diskussion och slutsats 11 Referenser 13
3 1 Inledning Att en människa kan förstå vad hon ser, så fort hon ser det, är för de som inte gett det närmare eftertanke en självklar färdighet. Det lärs in i barnsben, och så snart ett barn börjar prata börjar barnet också att peka på saker för att lära sig dess namn. Maskininlärning och AI har sedan dess begynnelse varit inspirerad av människans intelligens, och inte minst förmågan att lära (Welcome to the machine, 2017) var året då Microsoft vann den årliga tävlingen ImageNet Large Scale Visual Recognition Challenge (He m.fl., 2015), med deras djupa nätverk av slaget Convolutional Neural Network (hädan efter refererat till som Convolutional Neurala Nät eller CNN) som för första gången klassificerade bilder med mindre antal fel än människor (Colin Johnson, 2015). Sedan dess har CNN varit metoden i framkant inom bildklassificering, då de är mycket användbara inom computer vision i allt från robotar till utvecklingen av automatiserade bilar (Padmanabhan, 2016). I denna rapport kommer jag att studera de grundläggande delarna av ett CNN. Många variationer, nya modeller och metoder kan integreras och läggas till, men syftet med denna text är att steg för steg förstå grunderna. 1.1 Bakgrund Där tidigare modeller av neurala nät var inspirerade av människans neuroner och förmåga att lära sig, är CNNs vidare inspirerade av människans visuella cortex (ursprungligen av studierna på katter gjorda av Hubel och Wiesel 1962) (Suryani, 2017). De första Convolutional neurala nätverken utvecklades med intentionen att lösa problemet som uppstod hos de nätverk med många lager kallade Feed Foreward Neural Networks, t.ex. Multi Layer Perceptron (MLP) som då låg i framkant inom mönsterigenkänning. I dessa nätverk är alla neuroner i de dolda lagren sammankopplade med neuronerna i det föregående lagret vilket gör att parametrarna snabbt växer i antal då bilderna bearbetas pixel för pixel (Suryani, 2017). CNNs använder istället vad som kallas lokala receptorfält för att bearbeta delar av bilder, och motverkar att datan växer i okontrollerbar takt genom att inte ha fullt sammankopplade lager samt genom en metod kallad pooling. Dessa lokala receptorfält löser även ett annat stort klassificeringsproblem med MLPs. MPLs presterar bra när det kommer till att finna globala mönster, men kan inte hantera om den data den får in har transformerats spatialt på ett vis den inte fått tränas på (Gupta, 2017). CNNs är däremot bra på detta, vilket kallas att de är translation-invariant. 1
4 För att ett CNN ska fungera och ge goda resultat krävs stora träningsdatamängder och därmed även stora resurser för beräkningen (Cheng m.fl., 2015). Detta är den stora anledningen till att CNNs inte förrän nu visar stor framgång, även fast konceptet funnits sedan innan 1990-talet (Padmanabhan, 2016). Stora handannoterade datamängder för träning finns nu tillgängliga för allmänheten, speciellt via ImageNet, som även årligen håller en tävling (ILSVRC) i bildklassificering och angränsande områden som t.ex. objektigenkänning (Simonyan & Zisserman, 2015). Utöver detta har den utvecklade prestandan hos grafikprocessorer (eng. graphics processing units/gpu) även gjort det möjligt att hantera de stora beräkningarna av CNNs på ett effektivare sätt än tidigare. CNNs kraft ligger som nämnt i att ta hänsyn till spatialt ordnad data. Detta betyder att all data som får sin signifikans av just ordningen är lämplig att applicera detta nät på. CNN kan utöver bildklassificering därför appliceras på till exempel text, ljud och video (Rohrer, 2016). Denna rapport är dock avgränsad till 2-dimentioella CNNs för bildklassificering. 1.2 Bilder som tredimensionella matriser När en dator ser en bild ser den en matris av tal, pixel för pixel (Rohrer, 2016). För att se om två bilder är desamma skulle man kunna jämföra dessa tal. Detta skulle dock resultera i ett mycket oflexibelt system där minsta variation i bilderna skulle resultera i att systemet inte med säkerhet kan veta om de matchar varandra. Detta nät skulle alltså bli mycket specifikt, och därmed relativt oanvändbart på verklig, varierande data. Convolutional neurala nät är därför skapta för att tackla detta genom vad som kallas featureinlärning, och sedan avslutas det med en klassifikation (Raval, 2017). Där man i vanliga fall ser bilder som tvådimensionella matriser är det i detta fall bra att se dem som tredimensionella med pixelhöjd, pixelbredd, och djup. Djupet är bildens färgkanaler, för svartvitt är det två och för färgbilder är de tre (rött, grönt och blått). Dessa representerar alla pixlar i bilderna tre gånger och har tal mellan som representerar hur mycket av varje färg varje pixel har. 2
5 2 Feature-inlärning 2.1 Features och lokala receptorfält Fig. 1, Features, (Rohrer, 2016). Istället för att jämföra hela bilder så jämförs och matchas i CNNs delar av bilderna med specifika egenskaper (Olah, 2014). Dessa egenskaper kallas features. En feature kan till exempel vara en kant, en form, en textur, en färg eller kontraster mellan färger. Vad dessa i slutändan blir är något som nätverket lär sig självt (se Bakåtpropagering sid. 8) och utgångspunkterna för vad dessa features är randomiseras. Featuren har ett visst pixelmått som bildar ett kvadratiskt fönster som kommer flyttas och matchas till alla delar av input-bilden (Coors, 2016). Detta fönster är vad som kallas lokalt receptorfält (eng. local receptive field) och är inspirerat av människans visuella cortex, där neuronerna är lokalt känsliga för specifik visuell input. Det är det lokala receptorfältet som möjliggör att den spatiala informationen behålls intakt i CNNs, då dessa endast är sammankopplade med ett fält av neuronerna i kommande dolda lager i nätet. Storleken är vanligtvis endast några pixlar bred och en pixel djup, t.ex. 3x3x1 (Rohrer, 2016). Djupet 1 betyder att en feature endast matchas till en färgkanal i taget (Suryani, 2017). Detta lokala receptorfält skjutas över hela bilden tills att alla delar har blivit granskade, vilket möjliggör att samma feature kan användas för att upptäcka mönster på flera delar av samma bild (Nielsen, 2015a). Detta görs med alla features på alla djup (färgkanaler) i bilden. Fig. 2, Lokalt receptorfält, (Nielsen, 2015a) 3
6 2.2 Konvolutionslagret Beräkningen som nu kommer utföras för att matcha alla features (en i taget) till inputbilden kallas konvolution eller faltning (eng. convolution) (Rohrer, 2016). I korthet går detta ut på att pixel för pixel i alla lager, med hjälp av det lokala receptorfältet, se om en feature finns (och till vilken grad den finns) i alla delar av bilden. Där matchningen är stor kommer resultatet att vara ett högt positivt tal, och där matchningen inte finns alls kommer resultatet vara ett lågt tal. Dessa outputs skapar en filtrerad bild, en featurekarta (ibland kallat aktiveringskarta), som visar var denna feature finns i bilden. Konvolution är den operation som kombinerar två separata dataset till ett nytt, i detta fall ursprungsbilden med alla features för att skapa featurekartorna (Raval, 2017). Fig. 3, Feature-matchning, (Rohrer, 2016) Konvolutionen räknas ut genom att varje pixel i receptorfältet (featuren som ska matchas) får ett tal (Rohrer, 2016). I en svartvit bild där pixlarna är antingen totalt svarta eller vita skulle dessa t.ex. få antingen -1 (svart) eller 1 (vitt), se fig. 3. Detta fönster jämförs sedan pixel för pixel med input-bilden genom att pixlarna på samma position multipliceras med varandra. Om båda är svarta kommer svaret bli 1 (-1x-1) och om båda är vita kommer svaret också bli 1 (1x1). Om de däremot inte har samma tal kommer resultatet bli -1 (1x-1). Dessa resultat sparas på samma position som pixlarna som jämförts. Om bilden inte är helt svartvit, alltså inte har endast två diskreta värden, kommer talen att vara kontinuerliga flyttal mellan dessa. Fig. 4, Konvolution, (Gupta, 2017) 4
7 Fig. 5, Featurekarta, (Rohrer, 2016). Fig. 6, Featurekartor, (Rohrer, 2016). När den första matchningen av featursen är klara utförs ytterligare en beräkning, ibland kallat filtrering (Rohrer, 2016). Detta görs genom att talen adderas med varandra som i fig. 4, eller som i exemplet i fig. 5 och 6 där de sedan divideras med antalet pixlar. Om alla pixlar har matchat varandra exakt kommer detta (i exemplet i fig. 5 och 6) resultera i 1 (( )/9=1), en perfekt matchning som betyder att denna feature finns exakt på den platsen i bilden. Om det däremot t.ex. var två pixlar som inte matchade kommer beräkningen att ge svaret 0.55 (( (-1)+(-1))/9=0.55). Om svaret är nära -1 här betyder det att bilden är en motsats av featuren, och om det är nära 0 finns ingen matchning alls. Detta görs med hela bilden, vilket är vad som kallas konvolution, och sedan igen med alla features som ska matchas. Outputen av konvolutionslagret blir en uppsättning av dessa filtrerade bilder, se fig. 6. Det blir lika många featurekartor som features man letat efter. Lägg märke till att featurekartorna är något mindre i bredd och höjd, då featuren endast kan flyttas ett antal steg innan den slår i kanten till höger och längst ner, och antal steg den tar blir storleken på featurekartan (Nielsen, 2015a). 5
8 Parametrarna för vad dessa features i konvolutinslagret ska vara, vilka värden matrisen ska bestå av, lärs in självt av det neurala nätet för att det ska få ut den mest användbara informationen (Dettmers, 2015). Detta är nödvändigt eftersom klassificeringen av olika objekt i bilder görs bäst med olika typer av information, och kommer därmed vara individuellt för varje situation. Den mest användbara informationen för att klassificera en bilmodell kommer till exempel inte att vara färgen, utan kanske formen, men för att klassificera en blomma kan färgen däremot vara långt mer användbar information än bara formen. 2.3 Rectified linear unit (ReLU) ReLU är ett normaliseringslager med en icke-linjär funktion som konverterar alla negativa tal i featurkartorna till 0, men behåller resten av talen som de är genom funktionen f(x)=max(0,x) (Mattson, 2016). Detta görs för att inlärda värden senare inte ska fastna kring 0 eller gå mot oändligheten (Rohrer, 2016), vilket skulle få matematiken att gå sönder, samt för att nätverket ska ha möjlighet att extrahera både linjära och icke-linjära relationer i datan (Mattson, 2016). I bakåtpropageringen betyder detta senare att inlärningen kommer ske snabbt för positiva tal och att inga negativa gradienter kommer användas för uppdateringen av vikter (Dettmers, 2015b). Denna aktiveringsfunktion är vanligast inom CNNs (Nielsen, 2015a). Det finns fler funktioner som fungerar, t.ex. Sigmoid och Tanh, men ReLU har visat sig ge bäst resultat i de flesta lägen. 2.4 Max pooling Poolinglagerts uppgift i CNNs, ibland kallat sub-sampling, är att minska storleken av featurekartorna genom att ta ut den viktigaste informationen (Coors, 2016). Detta är viktigt av flera anledningar. Genom denna metod kontrolleras overfitting hos nätverket eftersom kravet för spatial precision minskar, och det hänger mer på den spatiala relationen mellan olika features istället för faktiska positioner. Utöver detta minskar minnesåtgången mycket, eftersom datan (featurekartorna) blir mindre, vilket gör nätverken smidigare att hantera samt att det ger plats åt att göra nätverket djupare med fler lager (Dettmers, 2015a). Max pooling är den poolingmetod som har visat sig ge bäst resultat inom CNNs (Mattson, 2016). Detta görs likt konvolutionslagret genom att ett fönster av ett par pixlar, vanligtvis 3x3 eller 2x2, flyttas i vad som kallas en stride, ett antal steg i taget (Rohrer, 2016). Om striden är en pixel kommer outputen till nästa lager att vara i samma storlek som inputen, men om striden är två pixlar, vilket är vanligast, kommer storleken att bli halverad (Mattson, 2016). 6
9 Det är dock viktigt att hålla en balans mellan hur mycket man vill vinna i minne och hur generellt man låter nätverket bli. Ju större stride man väljer, desto mer spatial information går förlorad, och desto mer generellt blir det. Fig. 7, Max pooling, (Gupta, 2017) Max pooling sker genom att det största talet inom fönstret plockas ut för varje stride, och dessa skapar sedan en ny filtrerad version av den featurekarta som var inputen (Rohrer, 2016). Denna version behåller alltså samma mönster men är mer kompakt, se fig. 7. Om inputen är flera featurekartor görs max poolingen på alla dessa och fortsätter hålla dem isär i outputen. Ytterligare en metod för att undvika overfitting, som är vanlig att ha med inte nödvändig, är en funktion som regulariserar datan, kallad drop-out (Raval, 2017). Denna metod gör att slumpvis utvalda neuroners output sätts till 0. Detta betyder för nätverket att det tvingas lära sig nya sätt att känna igen mönster, och kan då inte förlita sig på enstaka neuroner med starka vikter. 2.5 Stapling av lager Dessa tre sorters lager, konvolutionslagret, ReLU-lagret, och max-poolinglagret är de komponenter som oftast finns med i CNN (Dettmers, 2015a). Eftersom outputen från dessa lager har samma dimensioner som inputen de tar kan dessa läggas efter varandra i flera omgångar. Ju fler konvolutionslager man har desto mer abstrakt blir informationen som filtreras ut, och ju fler pooling-lager man har desto mer kompakt och generell blir datan (Dettmers, 2015, Rohrer, 2016). Detta resulterar i att featuresen som tas ut blir mer och mer komplexa, då de behandlar större och större delar av bilderna i taget. Lägre/tidigare lager representerar alltså enklare features, t.ex. prickar, linjer och kanter, och högre upp har dessa ökat i komplexitet och representerar hela mönster och former. Vanliga variationer i dessa lager för CNNs kan vara allt från små nät: 7
10 Till djupare staplingar: Konvolutionslager à ReLU à Pooling à Klassificering Konvolutionslager à ReLU à Konvolutionslager à ReLU à Pooling à Klassificering Dessa kan varieras som man önskar. Till exempel hade vinnaren av ILSVRC år 2014 som mest 16 konvolutionslager (följt av ReLUs) och totalt 5 max-pooling-lager efter några av dessa (Simonyan & Zisserman, 2015). Detta var möjligt genom att de höll nere antal parametrar och vikter via användningen av små receptorfält (3x3 pixlar). 3 Klassificering 3.1 Fullt sammankopplat lager Den sista komponenten i ett CNN består av minst ett fullt sammankopplat lager, som utformas på samma sätt som i vanliga neurala nät (Raval, 2017). Även dessa kan läggas flera efter varandra för att bilda ett djupare nät. Att lagret är fullt sammankopplat betyder att alla neuroner i lagret innan är sammankopplade med alla neuroner i detta lager, men inga av dessa är kopplade till varandra inom det fullt sammankopplade lagret. Målet med det fullt sammankopplade lagret är att omvandla den hittills framtagna datan till probabilitet, eftersom målet med hela nätverket har varit att kunna klassificera bilder. I detta lager blir de tidigare tvådimensionella matriserna av siffror som bildar de filtrerade bilderna istället listor (vektorer) (Rohrer, 2016). Varje position i denna lista har en viss vikt mot en specifik output, alltså en viss klassificering av bilden. Neuronerna i outputlagret från det fullt sammankopplade lagret är lika många som antalet av de kategorier hela nätet ska kunna klassificera (Mattson, 2016). Detta kan se ut såhär: 8
11 Fig 8. Vikter mot en klass, (Edureka, 2017). I detta exempel (fig. 8), är det vissa positioner i denna lista som kommer ha höga tal om outputen är en specifik klass, här ett X (Edureka, 2017). Vilka dessa blir är inlärt. På samma vis kommer nätet att lära sig vilka andra positioner som tillsammans alla kommer ha höga tal för andra klasser. Dessa positioner kommer för ny input att adderas ihop och divideras med summan av samma positioner från listan med den specifika klassen (se fig. 9) för att få ett medelvärde av nätets gissning för respektive klass. Fig 9. (Egen redigering i rött, Edureka, 2017). I fig. 9 visas ett exempel på detta. De positioner som är starka för X adderas ihop, och divideras med summan av samma positioner hos facitbilden (Edureka, 2017). Resultatet blir att nätet tror att inputbilden är ett X med 91% säkerhet. Detta jämförs till sist med alla 9
12 sannolikheter för andra klassificeringar, varpå den med störst sannolikhet tas ut. Detta ger oss den mest sannolika klassen bilden enligt nätverket tillhör. En funktion som används för att göra dessa operationer, att omvandla input-matriserna till probabiliteter för varje enskild kategori, är Softmax (Deshpande, 2016). En softmax-output för 10 möjliga klasser kan till exempel se ut såhär för klassificering av siffror: [.05,.1,.0,.0,.75,.1,.0,.0,.0,.0]. Denna output kan ses som en sannolikhetsfördelning och betyder här att nätet tror att bilden den fått är en fyra med 75% säkerhet. Adderar man ihop resterade sannolikheter blir summan av en softmax-funktion alltid 1. 4 Bakåtpropagering Som tidigare nämnts finns det i nätverket vissa parametrar som lärs in av nätverket av sig självt, som inte bestäms av designern för hand. Dessa är framför allt vilka features som tas ut för klassificeringen och alla viktvärden mellan neuronerna, t.ex. vilka neuroner som ska ha stark vikt mot en viss klassificering (Raval, 2017). Detta görs genom att granska det fel som nätet gör varje gång det tränas på en bild (Rohrer, 2016). Om nätet kommer fram till att bilden föreställer en hund med.92 probabilitet, och en katt med.01, och det enligt facit är en hund, är det totala felet.09 ( ). Detta propageras sedan bakåt i nätet, vilket uppdaterar vikterna och featursen, genom gradient descent. Hur mycket de uppdateras beror på hur stort felet har blivit, och en parameter som kallas learning rate som bestäms av designern. Målet med detta är att hitta de förändringar som minskar felet i outputen, och genom många iterationer uppnås tillslut nätets minsta möjliga fel där det presterar så bra det kan (Mattson, 2016; Rohrer, 2016). 5 Hyperparametrar Hyperparametrar är de parametrar som nätverket inte kan lära sig självt och som därför designern bestämmer. Att bestämma hyperparametrarna är inte en simpel uppgift, och är speciellt svårt om nätet är stort och djup (Nielsen, 2015b). I konvolutionslagret rör dessa parametrar featursen, både antal och dess pixelstorlek (Rohrer, 2016). I pooling-lagret bestäms fönstrets storlek och dess stride. I de fullt sammankopplade lagerna är det antalet neuroner som ska bestämmas. Även learning rate i bakåtpropageringen, vilken regulariseringsparameter nätet ska använda och vilken initialisering av neuronernas vikter som ska användas är sådant som designern måste besluta. Utöver detta är det även en 10
13 fråga om, som tidigare nämnt, hur djupt nätet ska vara och hur många av varje sorts lager det ska finnas, samt i vilken ordning. Även om alla dessa nämnda parametrar fortfarande spelar in, fann Padmanabhan (2016) att en ökning antalet konvolutionslager påverkade prestationen av deras CNN positivt. Att djupet hade stor påverkan på prestationen var även något vinnarna av ILSVRC år 2014 fann, med ett djup på 19, och vidare analyserade vinnarna av samma tävling år 2015 hur man kan tackla de nya problem som uppstår vid CNNs så djupa som med 152 lager (He m.fl., 2015). Det He m.fl (2016) ville understryka var att maskininlärning med neurala nät inte endast var en fråga om djup. Eftersom hyperparametrarna i CNNs är många kan det vara svårt att veta vilka det är som skapar problem i ens nätverk, och därmed svårt att veta vilka som bör ändras (Nielsen, 2015b). När detta händer finns det inga regler att följa, och inte heller ett fast värde där man vet att nätverket är så optimalt det kan bli, eftersom detta alltid kommer att variera mellan alla nät (Rohrer, 2016). Det finns däremot allmänna metoder som tenderar att fungera bra, och de största framstegen som görs inom CNNs idag bygger på att hitta nya och bättre kombinationer av dessa parametrar. Dessa kan behandla de parametrar som redan finns, men forskarna i framkant är de som även lyckas integrera nya sorters lager och funktioner. Ett tillvägagångsätt som visat sig ge goda resultat, och som därför inte är ovanligt, är att låta fler enskilda CNNs lära sig av samma data, och sedan rösta om vilken klassificering som är rätt (Nielsen, 2015a). Det är relativt intuitivt att förstå att detta skulle kunna minska antal fel, då sannolikheten att alla separata nätverk gör samma fel inte är lika stor som sannolikheten att ett ensamt nätverk gör fel. 6 Användningsområden, diskussion och slutsats Det är nu när CNN och andra neurala nät visar på hög träffsäkerhet som både företag och andra aktörer börjar känna sig bekväma med att integrera dessa i deras verksamheter. I detta läge bör de enligt mig i första hand, eftersom detta fortfarande är relativt nytt, endast användas som beslutsstöd, men bara detta kan skapa stor effektivisering samt säkerhet inom många områden. Ett exempel på hur CNNs kan användas för effektivitet är Microsoft Azure (Lösningsarkitektur: Bildklassificering med CNN-nätverk (Convolutional Neural Network), (hämtad) 2018). De använder ett CNN med sista lagret ersatt av ett beslutsträd för att 11
14 klassificera bilder av nyproducerade kretskort som godkända eller icke godkända. Detta resulterar i att mänsklig expertis endast behöver appliceras på de som klassas som icke godkända av nätet för att göra den slutgiltiga bedömningen. Inom vården har CNNs fått stor uppmärksamhet i frågor rörande hudcancerdiagnostisering (Esteva m.fl., 2017). Dessa har visat sig kunna klassificera hudcancer korrekt i högre grad än experter, vilket ger stora förhoppningar för framtidens tillgänglighet av sjukvård. Detta kan med andra ord betyda att fler människor i framtiden kommer ha finansiell möjlighet att få denna livsavgörande vård. Detta är ett område där jag personligen anser att teknikutveckling är som allra viktigast. Dessa hjälpmedel är då inte bara en effektivisering som gynnar företag, utan de kan till och med rädda liv. En aspekt som jag ser som ett spännande skift är hur framgångar inom detta fält nu främst tycks bero på nya idéer till skillnad från tidigare, då utvecklingen av datorers beräkningsprestanda samt tillgång till träningsdata verkar ha varit den största drivkraften. I detta läge handlar det om att optimera genom nya sätt att tänka, vilket enligt mig öppnar upp långt mer intressanta möjligheter för framtiden. Detta betyder att utbildning av fler människor och möjligtvis integrering av fler forskningsfält är vad som kommer föra dessa tekniker och idéer framåt. Utifrån mina lärdomar av detta arbete är min förmodan och förhoppning att användningen och utvecklingen av CNNs kommer ha stor positiv påverkan på framtiden. 12
15 Referenslista Cheng, Y., Cai, R., Zhao, X., Huang, K. (2015). Convolutional Fisher Kernels for RGB-D Object Recognition International Conference on 3D Vision (3DV). Institute of Electrical and Electronics Engineers, Inc. Coors, B. (2016). Navigation of Mobile Robots in Human Environments with Deep Reinforcement Learning. KTH Royal Institute of Technology. Deshpande, A. (2016). A Beginner's Guide To Understanding Convolutional Neural Networks. Hämtad från: -To-Understanding-Convolutional-Neural-Networks/ Dettmers, T. (2015a). Deep Learning in a Nutshell: Core Concepts. Hämtad från: Dettmers, T. (2015b). Deep Learning in a Nutshell: History and Training. Hämtad från: Edureka. (2017). Convolutional Neural Network (CNN) Convolutional Neural Networks With TensorFlow Edureka. Hämtad från: Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M, Blau, M. H., Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature 542, Doi: /nature Gupta, V. (2017). Image Classification using Convolutional Neural Networks in Keras. Hämtad från: He, K., Zhang, X., Ren, S., & Sun, J. (2015a). Deep residual learning for image recognition. CoRR, abs/ Hubel, D. H. & Wiesel, T. N. (1962). Receptive fields, binocular interaction and functional architecture in the cat s visual cortex. The Journal of Physiology, 160(1): Johnson, R. C. (2015). Microsoft, Google Beat Humans at Image Recognition: Deep learning algorithms compete at ImageNet challenge. Hämtad från: Mattson, N. (2016). Classification Performance of Convolutional Neural Networks. Uppsala Universitet. Microsoft Azure. (Hämtad 2018). Lösningsarkitektur: Bildklassificering med CNN-nätverk (Convolutional Neural Network). Hämtad från: 13
16 networks/ Nielsen, M. (2015a). Neural Networks and Deep Learning, Kap. 6, Determination Press, Hämtad från: Nielsen, M. (2015b). Neural Networks and Deep Learning, Kap. 3, Determination Press, Hämtad från: l_network's_hyper-parameters Olah, C. (2014). Conv Nets: A Modular Perspective. Hämtad från: Padmanabhan, S. (2016). Convolutional Neural Networks for Image Classification and Captioning, Department of computer science, Stanford University. Raval, S. (2017). Convolutional Neural Networks - The Math of Intelligence (Week 4), Hämtad från: Rohrer, B. (2016). How Convolutional Neural Networks work. Hämtad från: Simonyan, K. & Zisserman, A. (2015). Very deep convolutional networks for large-scale image recognition. Visual Geometry Group, Department of Engineering Science, University of Oxford. Suryani, D. (2017). Convolutional Neural Network. Hämtad från: WorldQuant. (2017). Welcome to the machine. Hämtad från: 14
729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 3 Marco Kuhlmann Institutionen för datavetenskap Modell med vektornotation parametervektor särdragsvektor Perceptron kombinerar linjär regression med
Läs merEtt Neuralt Nätverk Tittar På Kläder
[Skriv här] [Skriv här] [Skriv här] 2019 Ett Neuralt Nätverk Tittar På Kläder ETT KONVOLUTIONELLT NEURALT NÄTVERK KATEGORISERAR FASHION MNIST DATASETET WILHELM BRODIN, WILBR797 1.1 Inledning En människas
Läs mer729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Läs mer729G43. Neurala faltningsnät MASKINSYN PÅ SVENSKA VENDELA FOLKER ÅKERLIND
729G43 Neurala faltningsnät MASKINSYN PÅ SVENSKA VENDELA FOLKER ÅKERLIND Innehållsförteckning Bakgrund... 2 Historia... 2 ImageNet... 2 Avgränsningar och språk... 3 Artificiella neurala nät... 3 Tillbakaspridning...
Läs merGoogle Assistant & WaveNet
Google Assistant & WaveNet Projektrapport om CNN Maja Albrektson 27/12 17 Linköpings universitet 729G43, Artificiell Intelligens 0 SAMMANFATTNING Denna rapport beskriver WaveNet, en generativ modell av
Läs merNeurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University
Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning
Läs merArtificiell Intelligens den nya superkraften
Artificiell Intelligens den nya superkraften Socialchefsdagarna, 4 oktober 2018 #CGINext Artificiell Intelligens Förmågan hos mjukvara att agera självständigt på ett intelligent sätt tidigare bara associerat
Läs merde var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Läs merVad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Läs mer1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05
1(15) Bilaga 1 2(15) Neuronnätslaboration Räknare Denna laboration riktar sig till gymnasieelever som går en teknisk utbildning och som helst har läst digitalteknik samt någon form av styrteknik eller
Läs merAlgoritmer och maskininlärning
Algoritmer och maskininlärning Olof Mogren Chalmers tekniska högskola 2016 De här företagen vill Tjäna pengar Hitta mönster i stora datamängder Göra förutsägelser Klassificera data Förstå människan Maskininlärning
Läs merStatistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Läs merSub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén,
Sub-symbolisk kognition & Konnektionism Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, mats.andren@liu.se 1 Konnektionism Neutrala nät baseras på en (förenklad) modell av hur hjärnan fungerar.
Läs merARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap
ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 2 Marco Kuhlmann Institutionen för datavetenskap Förra gången: Gradientsökning tangentens lutning i punkt θ steglängdsfaktor Översikt Introduktion
Läs merPerception och Maskininärning i Interaktiva Autonoma System. Michael Felsberg Institutionen för systemteknik Linköpings universitet
Perception och Maskininärning i Interaktiva Autonoma System Michael Felsberg Institutionen för systemteknik Linköpings universitet Vad är WASP? Wallenberg Autonomous Systems Program Sveriges största individuella
Läs mer729G43 Artificiell intelligens / Maskininlärning 2. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 2 Marco Kuhlmann Förra gången: Linjär regression Gradientsökning Vandra ner i felets dal. Steg 0: Börja med ett godtyckligt värde för θ. Steg 1: Räkna
Läs merFöreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.
Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA5 Institutionen för teknik och naturvetenskap Linköpings universitet
Läs merGrafiska pipelinens funktion
LUNDS TEKNISKA HÖGSKOLA CAMPUS HELSINGBORG Grafiska pipelinens funktion Ludvig von Sydow EDT62, HT17 Datorarkitekturer med Operativsystem Sammanfattning Denna rapport syftar till att beskriva hur en graphics
Läs merEnBlightMe! - ett automatiserat stödsystem för upptäckt av potatisbladmögel
EnBlightMe! - ett automatiserat stödsystem för upptäckt av potatisbladmögel Erland Liljeroth, Erik Alexandersson (SLU, Alnarp) Kristin Piikki, Mats Söderström (SLU Skara) Oscar Bagge, Hanna Blomquist,
Läs merArtificiell Intelligens Lektion 7
Laboration 6 Artificiell Intelligens Lektion 7 Neurala nätverk (Lab 6) Probabilistiska resonemang Vad? Mönsterigenkänning Lära ett neuralt nätverk att känna igen siffror Varför? Få ökad förståelse för
Läs merVindkraft och ML. - hur kan vindkraft dra nytta avml
Vindkraft och ML - hur kan vindkraft dra nytta avml AI och ML Intelligens: förmågan att utnyttja kunskap för att bättre lösa en klass av uppgifter Lärande: förmågan att förbättra sin förmåga att lösa uppgifterna
Läs merMatcha rätt hjärta till rätt patient med AI. Dennis Medved
Matcha rätt hjärta till rätt patient med AI Dennis Medved Översikt Introduktion IHTSA LuDeLTA Sammanfattning Framtida arbete Introduktion Hjärttransplantation Livräddande operation för patienter med hjärtsvikt
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merAnsiktsigenkänning. Anna Ericsson Linköpings Universitet Linköping
Ansiktsigenkänning Anna Ericsson Linköpings Universitet Linköping 2011-09-18 Innehållsförteckning Sammanfattning... 1 Introduktion... 2 Ansiktsigenkänning med Eigenfaces... 3 Eigenfaces steg för steg...
Läs merEnlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät
Artificiella Neuronnät 1 Karaktäristiska egenskaper Användningsområden Klassiska exempel Biologisk bakgrund 2 Begränsningar Träning av enlagersnät 3 Möjliga avbildningar Backprop algoritmen Praktiska problem
Läs mermed hjälp av Deep Reinforcement Learning
Agent som kan spela Atarispel bättre än människor med hjälp av Deep Reinforcement Learning Sofie Adolfsson, sofad117@student.liu.se Artificiell Intelligens Linköpings Universitet 2017-01-12 SofieAdolfsson
Läs mer2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.
2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen
Läs merSHAZAM! En!smart!musiktjänst! Linha108! Fördjupningsarbete!729G43!
SHAZAM Ensmartmusiktjänst Linha108 Fördjupningsarbete729G43 Sammanfattning Shazam är en musiktjänst som genom en sökalgoritm kan känna igen ljud och returnera låt och artist till användaren. Detta sker
Läs merInlärning utan övervakning
Översikt Biologiska mekanismer bakom inlärning Inlärning utan övervakning Inlärning utan övervakning Hebbiansk modellinlärning Självorganisering Arbetsfördelning mellan noder i ett lager som utvecklas
Läs merAnsiktsigenkänning med MATLAB
Ansiktsigenkänning med MATLAB Avancerad bildbehandling Christoffer Dahl, Johannes Dahlgren, Semone Kallin Clarke, Michaela Ulvhammar 12/2/2012 Sammanfattning Uppgiften som gavs var att skapa ett system
Läs merSIMD i Intel s P5- baserade Pentium MMX
SIMD i Intel s P5- baserade Pentium MMX Maurits Gabriel Johansson - IDA2 Datorarkitekturer med operativsystem - 4 december 2016 SIMD I INTEL S P5-BASERADE PENTIUM MMX 1 Abstrakt Moderna CPU s (Central
Läs merTEM Projekt Transformmetoder
TEM Projekt Transformmetoder Utförs av: Mikael Bodin 19940414 4314 William Sjöström 19940404 6956 Sammanfattning I denna laboration undersöks hur Fouriertransformering kan användas vid behandling och analysering
Läs merProjekt 2 (P2) Problembeskrivning och uppdragsspecifikation
Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 Möjligheter/Problem med 2-dimensionella mätdata Uppstart: Se planen (kursens hemsida) Etapp 1 Mätdata i 2 dimensioner behöver utredas/signalbehandlas
Läs merJämförelse av skrivtekniker till cacheminne
Jämförelse av skrivtekniker till cacheminne 1 Innehåll 1. Sammanfattning 2. Inledning 3. Diskussion 4. Referenslista 1. Sammanfattning En rapport innehållande jämförelser av olika skrivtekniker till minnen
Läs merArtificiella Neuronnät
Artificiella Neuronnät 2 3 4 2 (ANN) Inspirerade av hur nervsystemet fungerar Parallell bearbetning Vi begränsar oss här till en typ av ANN: Framåtkopplade nät med lagerstruktur 3 4 Fungerar i princip
Läs merANN fk. Örjan Ekeberg. Framåtkopplade Nät. återkopplade nät. Olika arkitekturer. BackPropagation through Time. Kalman-Filter tekniker
Hantering av Tid Återkopplade Återkopplade Återkopplade t Återkopplade Återkopplade Temporala signaler är svåra Gör om temporal signal till spatial t 1 t 2 t 3 t 4 Återkopplade t Enklaste formen Neuronal
Läs merHierarchical Temporal Memory Maskininlärning
Hierarchical Temporal Memory Maskininlärning Innehåll Sammanfattning... 3 Inledning... 4 Vad är HTM?... 4 Hur fungerar HTM?... 4 Hierarchical... 4 Temporal... 5 Memory... 5 Hitta orsaker i världen... 5
Läs merEmma Hallstan Emmha584
LINKÖPING UNIVERISTET SIFT AIBOs ögon Emma Hallstan Emmha584 Innehållsförteckning Inledning... 3 Syfte... 3 SIFT- Scale Invariant Feature Transform... 3 Historien om SIFT... 4 SIFT algoritmen... 4 1. Scale-space
Läs merIgenkänning av bilddata med hjälp av Kohonen-nätverk, samt beskrivning av program
Igenkänning av bilddata med hjälp av Kohonen-nätverk, samt beskrivning av program Jerker Björkqvist September 2001 1 Introduktion I detta arbete undersökts hur klassificering av bilddata kan göras med
Läs merLinköpings universitet
Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga
Läs merDigitalitet. Kontinuerlig. Direkt proportionerlig mot källan. Ex. sprittermometer. Elektrisk signal som representerar ljud.
Analog Digitalitet Kontinuerlig Direkt proportionerlig mot källan Ex. sprittermometer Elektrisk signal som representerar ljud Diskret Digital Representation som siffror/symboler Ex. CD-skiva Varje siffra
Läs merHAND TRACKING MED DJUPKAMERA
HAND TRACKING MED DJUPKAMERA ETT PROJEKT I TNM090 - SOFTWARE ENGINEERING Rasmus KARLSSON Per JOHANSSON Erik HAMMARLUND raska293@student.liu.se perjo020@student.liu.se eriha891@student.liu.se 2014-01-14
Läs merProjektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.
Projektion av träningsdata på aktuell underrum av dim Föreläsning : Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA Institutionen för
Läs merBildbehandling i frekvensdomänen
Uppsala Tekniska Högskola Signaler och system Handledare: Mathias Johansson Uppsala 2002-11-27 Bildbehandling i frekvensdomänen Erika Lundberg 800417-1602 Johan Peterson 790807-1611 Terese Persson 800613-0267
Läs merAtt programmera en Beethoven
Linköpings universitet Att programmera en Beethoven Fördjupning inom Neurala nätverk och LSTM 2018-01-03 Innehåll 1 Inledning- Musik och artificiell intelligens... 2 1.1 Historia... 2 1.2 Bakgrund AIVA...
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 1. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 1 Marco Kuhlmann Institutionen för datavetenskap Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå
Läs merLunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:
Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer
Läs merMulti-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.
Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant. Sammanfattning När processorns klockhastighet ökar medför det en ökning av instruktioner vilket såklart ökar
Läs merGrafiska pipelinen. Edvin Fischer
Grafiska pipelinen Edvin Fischer Sammanfattning Rapporten behandlar den grafiska pipelinen och dess steg, vilka stegen är och hur de funkar. Inledning Rapporten har till syfte att beskriva hur den grafiska
Läs merx 23 + y 160 = 1, 2 23 = ,
Matematiska Institutionen KTH Lösningar till några övningar, inför tentan moment B, på de avsnitt som inte omfattats av lappskrivningarna, Diskret matematik för D2 och F, vt08.. Ett RSA-krypto har n =
Läs mer! "# # # $ # " % & # # '(") " " )## (")"#*+*(, ( - " ' # (") #. % % /
! "# # # $ # " % & # # '(") " " )## (")"#*+*(, ( - " ' # (") #. % % / Hageltal Problem ID: hageltal Tänk dig att du skriver upp alla positiva heltal på ett oändligt stort papper. Från varje tal n>1 ritar
Läs merHI1024 Programmering, grundkurs TEN
HI1024 Programmering, grundkurs TEN2 2014-10-27 KTH STH Haninge 13.15-18.00 Tillåtna hjälpmedel: En A4 handskriven på ena sidan med egna anteckningar Kursboken C PROGRAMMING A Modern Approach K. N. King
Läs merSingle-word speech recognition with Convolutional Neural Networks on raw waveforms
Single-word speech recognition with Convolutional Neural Networks on raw waveforms Patrick Jansson Degree Thesis Information technology Förnamn Efternamn 2018 EXAMENSARBETE Arcada Utbildningsprogram: Informationsteknik
Läs merATT ARBETA MED VEKTORGRAFIK
ATT ARBETA MED VEKTORGRAFIK Helene Brogeland Vektorgrafik och animation VT 2014 2014-04-29 Inledning Före aktuell kurs hade jag bara en vag uppfattning av innebörden av vektorgrafik och hade aldrig jobbat
Läs merSPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens
Läs merEtt enkelt OCR-system
P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor
Läs merHistogram över kanter i bilder
Histogram över kanter i bilder Metod Både den svartvita kanstdetekteringen och detekteringen av färgkanter följer samma metod. Först görs en sobelfiltrering i både vertikal och horisontell led. De pixlar
Läs merMartin Burström [dit02mbm] Robert Eriksson [dit02ren] Filip Sjögren [dit02fsn] Handledare: Therese Edvall Daniel Ölvebrink 2009-07-06 22:13
Artificiell intelligens I, 5p Laboration 2 Fördjupning i perception och objektigenkänning Martin Burström [dit02mbm] Robert Eriksson [] Filip Sjögren [dit02fsn] Handledare: Therese Edvall Daniel Ölvebrink
Läs merOptimera, inte eliminera, den mänskliga hjärnan genom AI. Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB
Optimera, inte eliminera, den mänskliga hjärnan genom AI Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB En av sjukvårdens största utmaningar är ökande personalbrist 4 av 10 läkare
Läs mer729G43 Artificiell intelligens / Maskininlärning 1. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 1 Marco Kuhlmann Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå naturligt språk kontrollera maskiner,
Läs merFråga 5 (1 poäng) För att definiera ett sökproblem krävs...
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merFråga 5 (1 poäng) För att definiera ett sökproblem krävs...
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merAlgebra och Geometri SF1624
Algebra och Geometri SF1624 Agenda 28/8/2017: 1 Information om kursen 2 vektorer Sandra Di Rocco dirocco@kth.se professor, institution för Matematik https://people.kth.se/~dirocco/ Webbsida: Canvas logga
Läs merOm intellektuell funktionsnedsättning
Om intellektuell funktionsnedsättning SvenOlof Dahlgren E-post: svenolof@huh.se GRUNDFÖRUTSÄTTNINGAR Litet forskningsunderlag Barn, ungdomar och vuxna med Intellektuell funktionsnedsättning (If) oftast
Läs merMentorprogram Real diversity mentorskap Att ge adepten stöd och vägledning Adeptens personliga mål Att hantera utanförskap
Mentorprogram Real diversity mentorskap Real diversity är ett projekt som fokuserar på ungdomar i föreningsliv och arbetsliv ur ett mångfaldsperspektiv. Syftet med Real diversity är att utveckla nya metoder
Läs merHKGBB0, Artificiell intelligens
HKGBB0, Artificiell intelligens Kortfattade lösningsförslag till tentan 3 november 2005 Arne Jönsson 1. Vad karaktäriserar dagens AI-forskning jämfört med den AI-forskning som bedrevs perioden 1960-1985.
Läs merLinköpings universitet
2014-09-08 Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 5 Integrationsutmaningen Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga
Läs merFlervariabel Analys för Civilingenjörsutbildning i datateknik
Flervariabel Analys för Civilingenjörsutbildning i datateknik Henrik Shahgholian KTH Royal Inst. of Tech. 2 / 9 Utbildningens mål Gällande matematik: Visa grundliga kunskaper i matematik. Härmed förstås
Läs merVektorer, matriser, nätverk - några elementa
Vektorer, matriser, nätverk - några elementa Innehåll: Vektorer Radvektorer och kolumnvektorer Operationer med vektorer Input- och outputvektorer i neurala nätverk Utvikning om kompetitiva nät Matriser
Läs merDatalogiskt tänkande för alla
Datalogiskt tänkande för alla Fredrik Heintz, IDA fredrik.heintz@liu.se @FredrikHeintz Linda Mannila linda.mannila@abo.fi @lindamannila Software is eating the world Trends AI och Autonoma System redan
Läs merFAKTAAVSNITT: ARBETSMINNETS UTVECKLING OCH KOPPLING TILL ANDRA FÖRMÅGOR
FAKTAAVSNITT: ARBETSMINNETS UTVECKLING OCH KOPPLING TILL ANDRA FÖRMÅGOR ARBETSMINNETS UTVECKLING Arbetsminnet utvecklas som mest mellan åldrarna 5 till 11 år. En fyraåring har ett relativt outvecklat arbetsminne
Läs merVentilen. Nytt på IT- fronten. System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande
Ventilen Nytt på IT- fronten System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande https://www.youtube.com/watch?v=nfneoooeqx4 https://www.youtube.com/watch?v=nfneoooeqx4
Läs merFingerprint Matching
Fingerprint Matching Björn Gustafsson bjogu419 Linus Hilding linhi307 Joakim Lindborg joali995 Avancerad bildbehandling TNM034 Projektkurs Biometri 2006 1 Innehållsförteckning 1 Innehållsförteckning 2
Läs merFrån ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information
ARTIFICIELL INTELLIGENS II INSTITUTUINEN FÖR DATAVETENSKAP LINKÖPINGS UNIVERSITET Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information Anna
Läs merProjekt i bildanalys Trafikövervakning
Projekt i danalys Trafikövervakning F 99 F 00 Handledare : Håkan Ardö Hösten 3 vid Lunds Tekniska Högskola Abstract Using traffic surveillance cameras the authorities can get information about the traffic
Läs merMARTIN ISAKSSON KTH SKOLAN FÖR ELEKTRO- OCH SYSTEMTEKNIK
EXAMENSARBETE INOM ELEKTROTEKNIK, AVANCERAD NIVÅ, 30 HP STOCKHOLM, SVERIGE 2017 StemNet A Temporally Trained Fully Convolutional Network for Segmentation of Muscular Stem Cells MARTIN ISAKSSON KTH SKOLAN
Läs merLaboration 4: Digitala bilder
Objektorienterad programmering, Z : Digitala bilder Syfte I denna laboration skall vi återigen behandla transformering av data, denna gång avseende digitala bilder. Syftet med laborationen är att få förståelse
Läs merOptimering av hyperparametrar till artificiella neurala nätverk med genetiska algoritmer.
Optimering av hyperparametrar till artificiella neurala nätverk med genetiska algoritmer. Simon Stensson Juni 6, 2016 Abstract This master thesis explores the feasibility of using genetic algorithms in
Läs merKandidatuppsats. Jämförelse mellan neurala nätverk baserad AI och state-of-the-art AI i racing spel. Simon Karlsson, Christopher Jensen
Kandidatuppsats Jämförelse mellan neurala nätverk baserad AI och state-of-the-art AI i racing spel Simon Karlsson, Christopher Jensen Sammanfattning Denna rapport jämför prestandan mellan state-of-the-art
Läs merCase-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011
Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka
Läs merMatematik med QR-koder
Matematik med QR-koder PML18 2018-09-26 Carina Bognäs Matematikutvecklare Pedagogisk Inspiration Malmö Dagens workshop Vad är en QR-kod? Varför QR-koder? QR-koder som pedagogiskt verktyg Att upptäcka matematik
Läs merMatematik 92MA41 (15hp) Vladimir Tkatjev
Matematik 92MA41 (15hp) Vladimir Tkatjev Med anledning av de nya kursplanerna har Strävorna reviderats. Formen, en matris med rutor, är densamma men istället för att som tidigare anknyta till mål att sträva
Läs merStudy and Analysis of Convolutional Neural Networks for Pedestrian Detection in Autonomous Vehicles
UPTEC F 18020 Examensarbete 30 hp Juni 2018 Study and Analysis of Convolutional Neural Networks for Pedestrian Detection in Autonomous Vehicles Louise Augustsson Abstract Study and Analysis of Convolutional
Läs merHört och lärt på NES2012 Session: Visual ergonomics
Ergonomisektionen/LSR Hört och lärt på NES2012 Session: Visual ergonomics Frukostseminarie I samverkan med Mousetrapper 2 oktober, 2012 08.30-09.30 Susanne Glimne Leg. Optiker/Universitetsadjunkt Optikerprogrammet
Läs merNeural bas för kognition
Kommunikation Neural bas för kognition stimulerande, retande inhiberande, förhindrande depolarisation vid tillräckligt mycket retning blir hela neuronen för en stund positivt laddad, då har en SPIKE uppnåtts
Läs merStructuring Two Dimensional Space
Structuring Two Dimensional Space Structuring Two Dimensional Space Vi tar in mönster mestadels som tvådimensionella plan utan djup. Dessa tvådimensionella mönster är viktiga av två anledningar; 1. De
Läs merPersonifierad Netflix
Linköpings universitet Personifierad Netflix Lisa Rönnqvist 2016-08-24 Sammanfattning INNEHÅLLSFÖRTECKNING 1. Inledning... 1 1.1 Bakgrund... 1 1.2 Syfte... 2 2. Netflix... Fel! Bokmärket är inte definierat.
Läs merSvensk nationell datatjänst, SND BAS Online
Pass 4: Metadatastandarder Mer om metadatastandarder Välkommen till presentation 3 i pass 4. Den här presentationen handlar om några olika teman som har att göra med metadatastandarder. Jag kommer att
Läs merSELF- ORGANIZING MAPS
LINKÖPINGS UNIVERSITET Kognitionsvetenskapliga Programmet Examinator: Arne Jönsson SELF- ORGANIZING MAPS - Ett fördjupningsarbete inom Artificiell Intelligens Fack 52 katwa676@student.liu.se Sammanfattning
Läs merAsymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merUNIVERSITETSRANKINGEN FRÅN TIMES HIGHER EDUCATION 2013
UNIVERSITETSRANKINGEN FRÅN TIMES HIGHER EDUCATION 2013 En analys av resultatet för Göteborgs. Magnus Gunnarsson / Enheten för analys och utvärdering PM 2013:12 Diarienummer V2013/781 Oktober 2013 GÖTEBORGS
Läs merTentamen Bildanalys (TDBC30) 5p
Tentamen Bildanalys (TDBC30) 5p Skrivtid: 9-15 Hjälpmedel: kursboken Digital Image Processing Svara på alla frågor på nytt blad. Märk alla blad med namn och frågenummer. Disponera tiden mellan frågorna
Läs merMin syn på koncepthantering generering och utvärdering
Min syn på koncepthantering generering och utvärdering Linus Granström KN3060, Produktutv. med formgivning Mälardalens högskola 2007-04-25 Inledning Denna essä beskriver författarens syn på de steg i produktutvecklingsprocessen
Läs merMedicinska Bilder, TSBB31. Lab: Mätvärden på Medicinska Bilder
Medicinska Bilder, TSBB3 Lab: Mätvärden på Medicinska Bilder Maria Magnusson, 22 Senaste updatering: september 25 Avdelningen för Datorseende, Institutionen för Systemteknik Linköpings Universitet Introduktion
Läs merCDC en jämförelse mellan superskalära processorer. EDT621 Campus Helsingborg av: Marcus Karlsson IDA
CDC6600 - en jämförelse mellan superskalära processorer av: Marcus Karlsson Sammanfattning I denna rapport visas konkret information om hur den första superskalära processorn såg ut och hur den använde
Läs merBildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet
Bildmosaik Bilddatabaser, TNM025 Linko pings Universitet Anna Flisberg Linne a Mellblom annfl042 linme882 28 maj 2015 Innehåll 1 Introduktion 2 2 Metod 2 2.1 Features..............................................
Läs mer1 Mätdata och statistik
Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt
Läs merKristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
Läs merArtificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?)
Artificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?) 1.a November 2011 Innan vi börjar R.I.P. John McCarthy (1924 2011) Grundare av ämnet artificiell
Läs mer