SHAZAM! En!smart!musiktjänst! Linha108! Fördjupningsarbete!729G43!
|
|
- Elin Dahlberg
- för 7 år sedan
- Visningar:
Transkript
1 SHAZAM Ensmartmusiktjänst Linha108 Fördjupningsarbete729G43
2 Sammanfattning Shazam är en musiktjänst som genom en sökalgoritm kan känna igen ljud och returnera låt och artist till användaren. Detta sker genom att användaren spelar in ett tio sekunder långt ljudklipp i mobiltelefonen som sedan analyseras av tjänsten och jämförs med låtar i dess databas. Denna text ämnar förklara i detalj hur detta går till.
3 Innehållsförteckning0 Sammanfattning) 2 Inledning) 4 Spektrogram)blir)konstellationskartor) 4 Djupt&neuralt&nätverk& 5 Konstellationskartor)blir)hashdetaljer) 7 Fingeravtryck& 8 Spridningsdiagram& 10 Histogram& 10 Diskussion) 12 Referenser) 13
4 Inledning Musiken är en av de äldsta och största konst- och underhållningsformerna vi har, och den strömmar till oss från alla möjliga håll i vår vardag. Vi hör musik i bilen på väg till jobbet, i vårt hem, när vi går i affärer och när vi ser på filmer eller serier. Ibland är det vi själva som väljer musiken och ibland har någon annan valt den. Om vi själva spelar musik från någon musiktjänst är det enkelt att ta reda på exakt vad det är vi lyssnar på, allt vi behöver göra är att gå in i programmet och avläsa namn och artist. Men vad gör vi när vi inte kommer åt källan till musiken, och vill ha reda på vad det är som spelas och av vem? Det är här smarta musiktjänster som Shazam, utvecklat av Shazam Entertainment Ltd., kommer in i bilden. En musikigenkännande tjänst som genom akustiska fingeravtryck kan avgöra vilken låt vi lyssnar på och med vilken artist, genom att via nätverksanslutning koppla upp sig mot en stor databas av musik och jämföra. Spektrogram blir konstellationskartor Akustiska fingeravtryck, eller innehållsbaserad ljudidentifiering (i.e. content-based audio identification), kan skapas genom spektrografi som är en typ av akustisk analys (Wikipedia 2016). Resultatet av spektrografi är ett diagram med tre dimensioner, vilka uppmäter frekvens, tid och intensitet (se Figur 1). Genom ett spektrogram kan ljudets frekvenssammansättning göras om till visuell information som sedan fortsatt kan analyseras. Ett ljud visas separat i diagrammet och det går även att urskilja hur starkt ljudet var, hur länge det pågick samt vilken frekvens ljudet hade. Av dessa ljud väljer Shazam ut spektrogramtoppar (i.e. spectogram peaks) vilka förblir robusta trots närvaro av brus i ljudfilen, som till exempel röster eller trafik (Wang, 2003). En topp väljs ut genom att man tittar på grannarna runt den potentiella toppen och avgör om den har ett högre energiinnehåll än de andra. Det finns även ett krav på densitet och amplitud för att säkerställa enhetlig täckning genom ljudfilen samt för att öka sannolikheten att toppen väljs framför någon typ av brus. Topparna som väljs ut bildar något som ser ut som en karta av konstellationer och som kallas därefter. Om man skulle placera en konstellationskarta av en låt i databasen på en remsa och placera en konstellationskarta av ett okänt klipp ovanför, på ett transparant papper, och skjuta den ovanpå remsan skulle prickarna förr eller senare stämma överens. Desto fler prickar som stämmer överens, desto större chans att det faktiskt är samma låt.
5 Figur 1. Spektrogram Figur 2. Konstellationskarta av spektrogramtoppar Djupt neuralt nätverk Det är enkelt att som människa urskilja de punkter som kan användas som spektrogramtoppar, men desto svårare för en dator. Här används bildigenkänning som är en typ av maskininlärning. Bildigenkänning kan innebära att systemet givet en bild ska kunna tilldela denna en kategori, men det kan också vara mer invecklat än så, som i detta fall. För att ett spektrogram ska kunna bli en konstellationskarta av spektrogramtoppar krävs fler outputvärden samt en förståelse för hela spektrogrammet. Brusreducering (i.e. denoising) kallas en process man skulle kunna genomföra på ett spektrogram för att få fram spektrogramtoppar (Goodfellow, Bengio & Courville, 2016). Givet en skadad eller inkorrekt observerad bild kan maskininlärningssystemet returnera en uppskattning av originalet eller den korrekta bilden. I det här fallet kan bilden ses som skadad då den innehåller onödigt bakgrundsbrus, ljud som vi ej önskar använda oss utav. Ljudet vi i detta fall är intresserade av är endast spektrogramtopparna, de punkter på vår bild som är mest tydliga, övrig information kan sorteras bort. Simpson, Roma och Plumbley (2015) genomförde en liknande studie där de försökte få ett neuralt nätverk att urskilja röster i en brusig omgivning. Detta problem är även känt som cocktailpartyeffekten, och är något som vi människor är väldigt bra på. När vi står i en samling av människor där alla pratar kan vi ändå lyckas fokusera vår uppmärksamhet på den
6 vi talar med. Vi kan även skifta vårt fokus och fokusera på en annan röst istället, eller en helt annan konversation. Något som för oss är så enkelt är däremot inte alls lika enkelt för ett neuralt nätverk. I Simpson, Roma och Plumbleys studie är uppgiften för det neurala nätverket att försöka urskilja en rösts unika spektrogram från de andra spektrogram som finns närvarande i ljudbilden. De tränade nätverket genom att använda spektrogram för en hel låt, samt spektrogram för enskilda instrument, exempelvis en viss röst, som facit och förväntade sig att det neurala nätverket slutligen skulle kunna producera det enskilda instrumentets spektrogram utifrån det hela spektrogrammet. För en uppgift som denna krävs miljarder parametrar som behöver justeras på ett sätt som ger ett önskat outputvärde och detta sker genom flera iterationer. När man funnit en inställning som presterar bra på träningsdata kan man sedan testa systemet på några låtar man ej haft med då man testat nätverket. Simpson, Roma och Plumbley (2015) fann att deras neurala nätverk presterade över förväntan på dessa låtar, och att nätverket hade skaffat sig en generell förståelse för hur en mänsklig stämma ser ut på ett spektrogram. När detta gjorts kunde det neurala nätverket sedan även lära sig urskilja separata stämmor, olika röster från olika personer eller olika ljud från olika instrument. Detta skulle kunna användas för att plocka bort en röst eller ett instrument från en redan befintlig låt, exempelvis för att skapa karaokelåtar. I figur 3 nedan skulle Simpson, Roma och Plumbleys input layer vara låten med alla instrument, medan output layer skulle vara en enskild stämma. Figur 3. Ett djupt neuralt nätverk (Deep neural network). I ett neuralt närverk är varje lager en transformeringsfunktion vars output blir inputen till nästa lager (Dai, 2016). Matematiskt,
7 där är det första och andra lagret och är vikternas parametrar som är associerade med det första respektive det andra lagret. När vi genomför gradientsökningen uppdateras. I Shazam har det djupa neurala nätverket istället tränats att välja ut spektrogramtopparna, exakt hur detta genomförs framgår ej från rapporten som skrivits av dess utvecklare (Wang, 2003). Utifrån hur Simpson, Roma och Plumbley genomförde sin studie bör även denna träning först ha skett i mindre skala på ett antal låtar där man försöker minimera modellens träningsfel, för att sedan kunna minimera felvärdet på okända data, modellens generaliseringsfel. Här försöker man undvika underfitting och overfitting. Underfitting innebär att man får ett högt felvärde redan på träningsmängden samt att modellen presterar ännu sämre på testmängden, medan overfitting innebär att man överoptimerat modellen på träningsdatat och får ett lågt felvärde på den men sedan ett mycket högre felvärde på testmängden då modellen lärt sig särdrag hos testdatat. I Figur 3 blir spektrogrammet input layer medan en färdig konstellationskarta blir output layer. När det neurala nätverket justerats och tränats färdigt kan det framställa egna konstellationskartor där spektrogramtopparna är tydligt utmärkta. När detta gjorts fortsätter man skapa individuella fingeravtryck, hashdetaljer. Konstellationskartor blir hashdetaljer Det tar lång tid att hitta rätt tidpunkt i låtarna i databasen endast med hjälp av konstellationskartor, detta då de har låg entropi. Entropi är ett mått på brus, eller störningar som finns i materialet som ska analyseras. I databasen har låtarna ett rent ljud, utan bakgrundsbrus och de är även mycket längre än det ljudklipp användaren spelat in. Då det inte är helt säkert att samtliga spektrogramtoppar på konstellationskartan kommer från låten vi söker behöver vi modifiera vår sökning något. Detta är anledningen till att man även använder en hashfunktion som tar ut de specifika fingeravtrycken för låtarna. En hashfunktion är en funktion som används för att göra om en godtycklig mängd data till en fixerad mängd data (Yantao & Xiang, 2016). Två ljud och tidpunkten mellan dessa bildar en hashdetalj. De unika hashdetaljerna, eller fingeravtrycken, som skapas för ljudfilen jämförs sedan mot filerna i databasen och deras respektive fingeravtryck, för att avgöra om det finns några matchningar. De eventuella matchningar som dyker upp utvärderas efter hur korrekta de är och algoritmen returnerar sedan den korrekta matchningen. Wang (2003) beskriver att man börjar med att välja ett ankare, som är ett visst ljud. Detta enskilda ljud paras sedan ihop med andra rent tidsmässigt nära ljud och läggs till i databasen som hashdetaljer. Varje par ger två
8 frekvenskomponenter plus tidsskillnaden mellan punkterna och varje hashdetalj kan packas i ett 32-bitars heltal. Till detta heltal läggs även information om vilken låt det gäller, vilket ger ett 64-bitars heltal, varav 32 bitar är en hashdetalj och 32 bitar är när hashdetaljen startar och vilken låt det gäller. Genom att söka efter par istället för enskilda toppar går sökningen mycket snabbare. När man söker efter par blir det mindre chans att det blir en matchning om detta par inte skulle vara korrekt utfärdat, men att söktiden minskar samt att det blir fler hashdetaljer än det hade blivit spektrogramtoppar väger upp för detta. Fingeravtryck För att något ska kunna användas som ett fingeravtryck bör det enligt Shazam vara temporärt lokaliserat, ej påverkas av översättning, vara robust och ha tillräcklig men ej för hög entropi (Wang, 2003). Att ett fingeravtryck är temporärt lokaliserat innebär att man plockar ut ett visst ljud som ankare och sedan jämför detta med ljud som inträffar nära detta ankare, rent tidsmässigt. Detta gör man för att inte avlägsna händelser i ljudfilen ska påverka den hashdetalj man tagit ut. Fingeravtrycket får ej heller påverkas av översättning, i det här fallet innebär det att fingeravtrycket inte får påverkas av var i låten fingeravtrycket befinner sig. När man spelar in ett klipp från en okänd låt vet man ej heller exakt var i låten man befinner sig, och en matchning måste kunna hittas trots detta. Därför söker algoritmen igenom hela databasen och även hela låtar, för att försöka avgöra om fingeravtrycket finns någonstans i någon av låtarna. Ljudfilen måste även kunna kännas igen trots brusig bakgrund och andra ljud i omgivningen som kan störa, till exempel röster. Databasen och dess fingeravtryck bör därför vara robusta, för att en ljudfil med brus ska kunna matcha med en ljudfil i databasen som har rent ljud, utan brus. Fingeravtrycken som skapas bör vara tillräckligt exakta och ha tillräckligt hög entropi för att inte ge falska matchningar mellan den okända ljudfilen och ljudfiler i databasen, men de bör ej heller vara för exakta och ha en allt för hög entropi då även detta leder till att inga matchningar kan göras vid närvaro av brus.
9 Figur 4. Kombinatorisk hashgeneration Figur 5. Hashdetalj Sökning och matchning När sökningen sker har fingeravtryck skapats på den okända ljudfilen och hashdetaljerna kan matchas mot ljudfiler i databasen. Om ett par från den okända ljudfilen matchas mot ett annat par i databasen från en viss låt placeras det i en mapp för just den låten. Om flera matchningar hittas för olika låtar sorteras dessa per låt och sedan skannas mapparna igenom ytterligare en gång efter en fullständig matchning. Ett exempel på hur mapparna kan se ut demonstreras av Figur 6 nedan. Figur 6. Mappar fyllda med hashdetaljer sorterade på låt och artist.
10 Spridningsdiagram Här skapas ett spridningsdiagram som visar sambandet mellan den okända ljudfilen och ljudfilen i databasen. Om ljudfilerna matchar bör en sekvens av matchningar visas i form av de hashdetaljer som matchats, från början till slutet av ljudfilen, med samma relativa tidsföljd. Då bör man även kunna finna ett signifikant kluster av prickar som formar en diagonal linje i spridningsdiagrammet. För att denna diagonala linje ska upptäckas antar vi att lutningen är 1.0 och då har de matchande filerna relationen där är ett särdrag för den rena filen i databasens tidskoordinat och är tidskoordinaten för ett särdrag i den okända ljudfilen. För varje koordinat räknar man ut skillnaden mellan koordinaterna enligt nedan: i spridningsdiagrammet Histogram Av denna skillnad skapar man sedan ett histogram och söker efter en topp. Detta kan man enligt Wang (2003) göra genom att sortera alla skillnader och söka efter ett kluster av samma värden. Sökningen tar endast mikrosekunder per mapp och resultatet av en matchning är antalet matchande punkter i histogrammet. Om det finns ett signifikant kluster av matchningar har man hittat en matchning. Nedan visas ett spridningsdiagram samt ett histogram som visar hur det ser ut då ett klipp och en ljudfil i databasen ej matchar varandra, samt ett spridningsdiagram och histogram som demonstrerar ett klipp och en ljudfil som matchar varandra (se Figur 7 samt Figur 8). Anledningen till att även en låt som inte matchar ger utslag på histogrammet är att vissa delar av låtar kan vara lika varandra. Vissa tonföljder eller bastoner kan vara desamma då det är vanligt att musiker influeras av varandra. Därför sätter man även en gräns för hur måna matchningar som måste finnas i ett visst klipp för att det ska ge utslag som en matchning.
11 Figur 7. Ett spridningsdiagram samt ett histogram där två ljudfiler ej matchar Figur 8. Ett spridningsdiagram samt ett histogram där två ljudfiler matchar
12 Diskussion Shazam hjälper sina användare att hitta den musik de söker, och musiktjänsten hjälper även musiken och dess upphovsmän att nå ut till fler personer. I applikationen ges man möjlighet att lyssna på låten direkt, se texten, videoklipp om sådana finns och man kan även se information från artisten om eventuella konsertdatum och annat som kan intressera användaren. Algoritmen är så pass exakt att utvecklarna funnit flera exempel på plagiat. Detta blir ytterligare ett användningsområde för tjänsten, då stulet material med copyright kan kännas igen och även rapporteras. Tjänsten går ej att använda vid konserter eftersom den söker efter fingeravtryck som överensstämmer exakt, vilket de ej gör vid ett liveframträdande, åtminstone inte med millisekundprecision. Om tjänsten finner låten trots att inspelningen sker live är det därför snarare troligt att artisten ej framträder live, vilket har upptäckts flertalet gånger av tjänsten. Detta kan vara intressant vid recensioner av konserter, då det är ganska stor skillnad på att framträda live och att spela upp ett ljudklipp från ett redan befintligt album. Det finns även gånger man får en låt i huvudet som man ej kommer på vad den heter, utan att den spelas. Kanske kan framtiden erbjuda tjänster där man själv kan sjunga in den låt man söker och som sedan söker i en databas efter korrekt låt. Självklart skulle inte en sådan tjänst vara lika exakt eftersom det kan vara stora skillnader på materialet i databasen och det material som användaren spelar in. Men då man kan se frekvens på ett spektrogram borde inte detta vara helt omöjligt, så länge inte användaren är helt tondöv. Det finns många ytterligare användningsområden för den här typen av tjänst, och jag är därför övertygad om att ytterligare liknande tjänster kommer att dyka upp i framtiden. Det ska bli spännande att se vad vi kommer kunna göra om några år med den här typen av algoritmer.
13 Referenser Wang, A. L.-C. (2003). An Industrial Strength Audio Search Algorithm. Proceedings of the 4th International Society for Music Information Retrieval Conference (ISMIR 203), Baltimore, Maryland (USA), October 2003, Yantao, L., & Xiang, L. (2016). Chaotic hash function based on circular shifts with variable parameters. Elsevier, s Wikipedia.(den ).Wikipedia&Den&fria&encyklopedin.Hämtatfrån Goodfellow,I.,Bengio,Y.,&Courville,A.(2016).Deep&Learning.Cambridge:MITPress. Simpson, A. J. R., Roma, G., & Plumbley, M. D. (2015). Deep karaoke: Extracting vocals from musical mixtures using a convolutional deep neural network. In Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) (Vol. 9237, pp ). Dai,W.(2016).Acoustic&Scene&Recognition&with&Deep&Learning.Carneige:MachineLearning DepartmentCarneigeMellonUniversity.
ACOUSTIC FINGERPRINTING SYSTEMS
LINKÖPINGS UNIVERSITET - IDA ACOUSTIC FINGERPRINTING SYSTEMS Louise Walletun Artificiell Intelligens II 729G11 HT2012 Innehållsförteckning Inledning... 3 Attribut hos akustiska fingeravtryck... 4 Evalueringssystemet...
Läs merStatistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Läs merI en deterministisk omgivning beror nästa tillstånd bara av agentens handling och nuvarande tillstånd.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merInledning till Wavesurfer av Christine Ericsdotter (Lingvistik, Stockholms universitet)
Inledning till Wavesurfer av Christine Ericsdotter (Lingvistik, Stockholms universitet) WaveSurfer är ett program för analys av tal utvecklat vid Centrum för talteknologi, Institutionen för tal, musik
Läs merTUTORIAL 3: ATT STARTA ETT NYTT PROJEKT, IMPORTERA ELLER DIGITALISERA MATERIAL, SAMT SORTERA DET.
TUTORIAL 3: ATT STARTA ETT NYTT PROJEKT, IMPORTERA ELLER DIGITALISERA MATERIAL, SAMT SORTERA DET. Att starta ett nytt projekt När du startar Avid kommer Select Project fönstret upp: Istället för att välja
Läs merIT-körkort för språklärare. Modul 5: Ljud, del 2
IT-körkort för språklärare Modul 5: Ljud, del 2 Innehåll Spela in och klipp en ljudfil (metod 1)... 3 Importera och klipp en ljudfil (metod 2)... 6 Ta bort störande bakgrundsljud... 8 Förstärk ljudet...
Läs merManual Produktion av presentationssynkar med PowerPoint och Producer
Centrum för Pedagogik, IKT och Lärande (PIL) Mälardalens högskola Peter Aspengren Tel: 021-103116 Manual Produktion av presentationssynkar med PowerPoint och Producer Gör din presentation Om du inte har
Läs merFöreläsningsanteckningar F6
Föreläsningsanteckningar F6 Martin Andersson & Patrik Falkman Kortaste vägen mellan en nod och alla andra noder Detta problem innebär att givet en graf G = (E,V) hitta den kortaste vägen över E från en
Läs merNeurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University
Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning
Läs merProjektfönstret I projektfönstret finns tidlinjen samt de olika spår som ditt projekt innehåller. Det är här du redigerar och arrangerar ljudklippen.
Soundtrack Pro Syftet med denna övning är att du ska få en förståelse för hur verktyget Soundtrack Pro är uppbyggt och fungerar. Vi kommer att gå igenom de grundläggande funktionerna och ett enkelt arbetsflöde
Läs mer729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Läs merExempel på observation
Exempel på observation 1 Jag gjorde en ostrukturerad, icke deltagande observation (Bell, 2005, s. 188). Bell beskriver i sin bok ostrukturerad observation som något man tillämpar när man har en klar uppfattning
Läs merFingerprint Matching
Fingerprint Matching Björn Gustafsson bjogu419 Linus Hilding linhi307 Joakim Lindborg joali995 Avancerad bildbehandling TNM034 Projektkurs Biometri 2006 1 Innehållsförteckning 1 Innehållsförteckning 2
Läs merInternational Olympiad in Informatics 2011 22 29 July 2011, Pattaya City, Thailand Tävlingsuppgifter Dag 2 Svenska 1.3. Papegojor
Papegojor Yanee är fågelentusiast. Sedan hon läst om IP over Avian Carriers (IPoAC), har hon spenderat mycket tid med att träna en flock papegojor att leverera meddelanden över långa avstånd. Yanees dröm
Läs merSignalbehandling Röstigenkänning
L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 1. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 1 Marco Kuhlmann Institutionen för datavetenskap Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå
Läs merLektionsanteckningar 2: Matematikrepetition, tabeller och diagram
Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 3 Marco Kuhlmann Institutionen för datavetenskap Modell med vektornotation parametervektor särdragsvektor Perceptron kombinerar linjär regression med
Läs merTHE CAVE. ACEx15 Kandidatarbete i Arkitektur och teknik VT19 av Felicia Andersson och Cecilia Lewensetdt, AT3
THE CAVE ACEx15 Kandidatarbete i Arkitektur och teknik VT19 av Felicia Andersson och Cecilia Lewensetdt, AT3 THE CAVE EN UPPSKATTAD PLATS BEVARAS Skanstorget i Göteborg är ett väl omtalat område som står
Läs merNågra skillnader på Premiere Elements 8 och Premiere Elements 9 ARBETSYTANS NYA ANSIKTE 2 PROJEKTINSTÄLLNINGAR - NU MED FLER MÖJLIGHETER 4
Några skillnader på och Av Josefina Sahlin, lärare på Premiere Elements för alla Rent estetiskt har programmet fått en liten make over i form av: - färre färger i menyn under åtgärder - nya färger som
Läs merPremiere Elements för alla
Premiere Elements för alla Några skillnader på och 10 Rent estetiskt har programmet fått en liten make over i form av: - färre färger i menyn under åtgärder - nya färger som skiljer video, ljud och textfiler
Läs merInstruktionsmanual Poddar, hemsidan, appen och marknadsföring
Instruktionsmanual Poddar, hemsidan, appen och marknadsföring Översikt Att skapa en podd Poddar är en central del av dagens radioproduktion, och eftersom Studentradion 98,9 ska producera innehåll av en
Läs merKdenlive snabbstartguide
Den här dokumentationen konverterades från sidan Kdenlive/Manual/QuickStart på KDE:s användarbas. Översättare: Stefan Asserhäll 2 Innehåll 1 Skapa ett nytt projekt 5 2 Lägga till klipp 7 3 Tidslinje 9
Läs merProjekt i språkteknologi Projektförslag Johanna Karlsson joka1954
Projekt i språkteknologi Projektförslag Johanna Karlsson 870411-7129 joka1954 1. Inledning Opus är en växande parallell korpus med data från många olika språk (Tiedemann, 2009). Data som finns i OPUS i
Läs mer1 Photo Story Steg 1 - Hämta och fixa dina bilder
1 Photo Story Microsoft Photo Story är ett program för att skapa bildberättelser. Det är gratis att ladda hem från Microsofts webbplats för Photo Story. Programmet fungerar bara om du har Windows XP. Se
Läs merSPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 2 Marco Kuhlmann Institutionen för datavetenskap Förra gången: Gradientsökning tangentens lutning i punkt θ steglängdsfaktor Översikt Introduktion
Läs merWorkshop PIM 2 - PowerPoint
Workshop PIM 2 - PowerPoint Varje ny sida i bildspelet kallas för en Bild. Foton och andra bilder som man lägger in kallas för Bildobjekt. All text skrivs i Textrutor. Växlingen från en bild till nästa
Läs merVad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Läs merPhoto Story. Sara Eriksson IKT A, HT 2007
Photo Story Mitt tips: Om du inte ser bilderna i manualen backa ett steg och spar filen. Öppna sedan den sparade filen. Då ser du bilderna. Med Photo Story kan du skapa bildberättelser, genom att sätta
Läs merKryptering. Krypteringsmetoder
Kryptering Kryptering är att göra information svårläslig för alla som inte ska kunna läsa den. För att göra informationen läslig igen krävs dekryptering. Kryptering består av två delar, en algoritm och
Läs merMacromedia Flash MX 2004
Mittuniversitetet ITM Telefon 0771-97 50 00 Erik Öberg Macromedia Flash MX 2004 Visuell kommunikation Detta exemplar tillhör: VT 2005 Laborationskompendium för Macromedia Flash Uppgift 1 Texthanteringen
Läs merResurscentrums matematikleksaker
Resurscentrums matematikleksaker Aktiviteter för barn och vuxna Innehåll 1 Bygga lutande torn som inte faller 2 2 Om konsten att vinna betingat godis i spel 5 3 Den snåle grosshandlarens våg 6 4 Tornen
Läs merARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap
ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full
Läs merProv i vågrörelselära vt06 Lösningsförslag
Prov i vågrörelselära vt06 Lösningsförslag Hjälpmedel: Formelsamling, fysikbok, miniräknare, linjal, sunt förnuft. 7 uppgifter vilka inlämnas på separat papper snyggt och välstrukturerat! Låt oss spela
Läs merTDDB96 Projekt: Object priming med visuell stimuli
TDDB96 Projekt: Object priming med visuell stimuli Daniel Johansson danjo133@student.liu.se Rickard Jonsson ricjo400@student.liu.se 1. Sammanfattning Vad vi ville komma fram till i denna studie var huruvida
Läs mer729G43 Artificiell intelligens / Maskininlärning 2. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 2 Marco Kuhlmann Förra gången: Linjär regression Gradientsökning Vandra ner i felets dal. Steg 0: Börja med ett godtyckligt värde för θ. Steg 1: Räkna
Läs merAritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12
Aritmetisk kodning Vi identifierar varje sekvens av källsymboler med ett tal i intervallet [0, 1). Vi gör det med hjälp av fördelningsfunktionen (cumulative distribution function) F. För enkelhets skull
Läs merCase-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011
Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka
Läs mer3D- LJUD. Binaural syntes med hjälp av HRTF- filter och duplexteorin. DT1174 Ljud som informationsbärare Sandra Liljeqvist
3D- LJUD Binaural syntes med hjälp av HRTF- filter och duplexteorin DT1174 Ljud som informationsbärare Sandra Liljeqvist sanlil@kth.se 2012-11- 14 Inledning Mitt mål är att illustrera binaural syntes med
Läs merIT-körkort för språklärare. Modul 6: Video, del 2
IT-körkort för språklärare Modul 6: Video, del 2 Innehåll IT-körkort för språklärare... Fel! Bokmärket är inte definierat. Skapa ett projekt... 2 Spela in och ladda ner en video... 3 Redigering... 6 Övergångar...
Läs merFöreläsning 3.1: Datastrukturer, en översikt
Föreläsning.: Datastrukturer, en översikt Hittills har vi i kursen lagt mycket fokus på algoritmiskt tänkande. Vi har inte egentligen ägna så mycket uppmärksamhet åt det andra som datorprogram också består,
Läs merTDIU Regler
Regler Student får lämna salen tidigast en timme efter tentans start. Vid toalettbesök eller rökpaus ska pauslista utanför salen fyllas i. All form av kontakt mellan studenter under tentans gång är strängt
Läs merSony lanserar smartare och snabbare Blu-ray spelare
Pressrelease 7 januari 2014 Sony lanserar smartare och snabbare Blu-ray spelare Förbättrar ljud- och bildkvaliteten samt gör det enkelt och snabbt att komma åt innehåll på internet Dela innehåll från smartphones
Läs merLutande torn och kluriga konster!
Lutande torn och kluriga konster! Aktiviteter för barn under Vetenskapsfestivalens skolprogram 2001 Innehåll 1 Bygga lutande torn som inte faller 2 2 Om konsten att vinna betingat godis i spel 5 3 Den
Läs merInstallera Anaconda Python
Maskininlärning Installera Anaconda Python Nummergisslek Vi ska bygga ett litet program, RIDER, som ska gissa vilket nummer som du tänker på. Reglerna är att du tänker på ett heltal mellan 1 och 100. RIDER
Läs merDN1212/numpm Numeriska metoder och grundläggande programmering Laboration 1 Introduktion
Staffan Romberger 2008-10-31 DN1212/numpm Numeriska metoder och grundläggande programmering Laboration 1 Introduktion Efter den här laborationen ska du kunna hantera vektorer och matriser, villkorssatser
Läs merÖSTERÄNGSKYRKANS MUSIKSKOLA ÖKM
ÖSTERÄNGSKYRKANS MUSIKSKOLA ÖKM Sverige kan stoltsera med en stor mängd fantastiska låtskrivare och artister som försett några av världens i särklass största artister med toppklassigt låtmaterial. Namn
Läs merFACIT (korrekta svar i röd fetstil)
v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta
Läs merImportera, redigera och publicera film med Windows Live Movie Maker
Importera, redigera och publicera film med Windows Live Movie Maker Du har spelat in en kort film om Flipping the classroom i dina projektgrupper. Dessa filmklipp finns nu kopierade till mappen filmövning_20mars
Läs merNamn: Eron Teklehaimanot Klass: 9b Datum: 21 maj 2010 Mentor: Mikael (svenskan) Hållbar utveckling med inriktning naturvetenskap Oljud i klassrummen
Namn: Eron Teklehaimanot Klass: 9b Datum: 21 maj 2010 Mentor: Mikael (svenskan) Hållbar utveckling med inriktning naturvetenskap Oljud i klassrummen 1 Innehållsförteckning Inledning.....sidan 3 Bakgrund......sidan
Läs mersamma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.
LABORATION 1: SANNOLIKHETER Lös Uppgift 1-8 nedan. Första uppgiften har ledning steg för steg, resterande uppgifter löser du på samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel
Läs merJag rek. starkt att alla uppgraderar sin TomTom till version 5 eller högre då massor av nya funktioner och en betydande prestandaskillnad finns.
Installation av fartkameror i TomTom Installationstipset är skrivet för TomTom Navigator 3 eller version 5,TomTom Go Classic,ONE,300,500,700 (troligtvis även RIDER) eller TomTom Mobile samt en PC med Microsoft
Läs mer1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05
1(15) Bilaga 1 2(15) Neuronnätslaboration Räknare Denna laboration riktar sig till gymnasieelever som går en teknisk utbildning och som helst har läst digitalteknik samt någon form av styrteknik eller
Läs merUppgift 1 ( Betyg 3 uppgift )
2008-03-25.kl.14-19 Uppgift 1 ( Betyg 3 uppgift ) Du skall skriva ett program (en funktion), my_plot_figure, som läser in ett antal sekvenser av koordinater från tangentbordet och ritar ut dessa till en
Läs merAppar vi arbetat med. ipad projekt 2013 appar vi jobbat med. Nina Lundell Sida "1
Appar vi arbetat med ipad projekt 2013 appar vi jobbat med. Nina Lundell Sida "1 Vårterminen 2013 Rönnbäcksskolan 2013 ipad projekt 2013 appar vi jobbat med. Nina Lundell Sida "2 Choiceboard Creator Vi
Läs merFunktioner. Parametrar
Funktioner ScandLarm Air IP kamera stöds av WiFi och LAN-nätverk, gör att den lätt kan besökas globalt. Sammarbetet mellan ScandLarm Air IP kamera och den mobila appensmarta larmsystemet och den mobila
Läs merKonvergens och Kontinuitet
Kapitel 7 Konvergens och Kontinuitet Gränsvärdesbegreppet är väldigt centralt inom matematik. Som du förhoppningsvis kommer ihåg från matematisk analys så definieras tex derivatan av en funktion f : R
Läs merSänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Läs merDatorövning 1 Statistik med Excel (Office 2007, svenska)
Datorövning 1 Statistik med Excel (Office 2007, svenska) I processövningen som ni ska genomföra ingår det att konstruera samt sammanställa en enkät. Denna sammanställning ska göras med hjälp av programmet
Läs merFuzzy Logic: Den oskarpa skarpheten
Fuzzy Logic: Den oskarpa skarpheten Av: 1 Innehåll Inledning... 3 Vad är Fuzzy Logic?... 4 Fuzzy sets... 4 Medlemsskapsfunktion... 5 Operatorer... 7 Union... 7 Snitt... 8 Komplement... 8 Exempel med de
Läs merStudien. Teknik. Akustik. Enkätundersökning. En kvalitativ, explorativ studie av ett case. Bestående av tre delar:
Studien En kvalitativ, explorativ studie av ett case Bestående av tre delar: Teknik Akustik Enkätundersökning Redovisning av Enkätsvar: från lyssnare, musiker, anställda Subjektiv hörselstatus Ljudkvalitet
Läs merEtt enkelt OCR-system
P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor
Läs merGuide till att använda Audacity för uttalsövningar
Guide till att använda Audacity för uttalsövningar Victoria Johansson Humlabbet, SOL-center, Lund IT-pedagog@sol.lu.se 28 mars 2006 1 Inledning Audacity är ett program som kan användas för att spela in
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merLathund Windows Movie Maker
Redigera film med Movie Maker Lägg in det filmade materialet på datorn och samla det i en ny mapp med lämpligt namn. Det är viktigt att du har en backup på ditt material. Backupen ska finnas på en annan
Läs merExekutiva funktioner och trafik. Björn Lyxell, Institutet för Handikappvetenskap, Linköpings universitet
Exekutiva funktioner och trafik Björn Lyxell, Institutet för Handikappvetenskap, Linköpings universitet Exekutiva funktioner Exekutiva funktioner är kognitiva processer ligger bakom målinriktat beteende,
Läs merRapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merTiVo ett rekommendationssystem. TiVo ett rekommendationssystem
Sammanfattning I dagens informationssamhälle kan det ibland vara svårt att sortera ut relevant information från mängden. Vi får då förlita oss till rekommendationer och omdömen från andra i allt från vilken
Läs merFå dina bilder att tala
Få dina bilder att tala Programmet CrazyTalk skapar tecknad film av dina porträttbilder. Programmet synkroniserar till och med läpparna på porträttet så att de passar med ljudspåret. Journalist Morten
Läs merHistogram över kanter i bilder
Histogram över kanter i bilder Metod Både den svartvita kanstdetekteringen och detekteringen av färgkanter följer samma metod. Först görs en sobelfiltrering i både vertikal och horisontell led. De pixlar
Läs merOneNote En inspirationsguide för dig som vill lära dig grunderna i OneNote
OneNote En inspirationsguide för dig som vill lära dig grunderna i OneNote I exemplet nedan kommer ni att få lära er några olika funktioner jag använder när jag skapar lektioner i OneNote. Många av dessa
Läs merYAHOO! SEARCH MARKETING Tips för att öka trafiken
YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova
Läs merBarns och ungdomars engagemang
Barns och ungdomars engagemang Delaktighet definieras av WHO som en persons engagemang i sin livssituation. I projektet har vi undersökt hur barn och ungdomar med betydande funktionshinder är engagerade
Läs merHenrik Brändén. bioscience explained Vol 3 No 1. Undersökning av influensavirus med hjälp av släktträd. Vetenskapsrådet 103 78 Stockholm Sverige
Henrik Brändén Vetenskapsrådet 103 78 Stockholm Sverige Undersökning av influensavirus med hjälp av släktträd Introduktion Influensavirus delas in i olika stammar beroende på vilka varianter viruset bär
Läs merEulercykel. Kinesiska brevbärarproblemet. Kinesiska brevbärarproblemet: Metod. Kinesiska brevbärarproblemet: Modell. Definition. Definition.
Eulercykel Definition En Eulercykel är en cykel som använder varje båge exakt en gång. Definition En nods valens är antalet bågar som ansluter till noden. Kinesiska brevbärarproblemet En brevbärartur är
Läs merUpprepade mönster (fortsättning från del 1)
Modul: Algebra Del 2: Resonemangsförmåga Upprepade mönster (fortsättning från del 1) Anna-Lena Ekdahl och Robert Gunnarsson, Högskolan i Jönköping Ett viktigt syfte med att arbeta med upprepade mönster
Läs merÖvningshäfte 2: Induktion och rekursion
GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2017 INLEDANDE ALGEBRA Övningshäfte 2: Induktion och rekursion Övning D Syftet är att öva förmågan att utgående från enkla samband, aritmetiska och geometriska,
Läs merde var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Läs merUPPLADDAD FULL KONTROLL
FULLT UPPLADDAD FULL KONTROLL ALLA FANTASTISKA FUNKTIONER HOS WIDEX BEYOND NU MED UPPLADDNINGSBART BATTERI Nu finns världens mest högpresterande hörapparat för iphone med praktisk uppladdning och längst
Läs mer729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581
Fuzzy logic 880328-2535 Innehåll Fuzzy logic... 1 1. Inledning... 4 2. Jämförelse mellan fuzzy logic och tvåvärdeslogik.... 4 3. Fuzzy sets.... 4 4. Linvistiska variabler... 5 5. Operatorer... 5 6. If-
Läs merArtificiell Intelligens Lektion 7
Laboration 6 Artificiell Intelligens Lektion 7 Neurala nätverk (Lab 6) Probabilistiska resonemang Vad? Mönsterigenkänning Lära ett neuralt nätverk att känna igen siffror Varför? Få ökad förståelse för
Läs merAlgoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 10 Anton Grensjö grensjo@csc.kth.se 9 november 2017 1 Idag En konstruktionsreduktion Fler bevis av NP-fullständighet 2 Teori Repetition Ett problem tillhör
Läs merFakta om Marcus och Martinus
SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? Boken handlar om tvillingarna Marcus och Martinus. Du kommer att lära dig massor av fakta om killarna. Du kommer bland annat att få svar på följande frågor:
Läs merKryptografi - När är det säkert? Föreläsningens innehåll. Kryptografi - Kryptoanalys. Kryptering - Huvudsyfte. Kryptografi - Viktiga roller
Föreläsningens innehåll Grunder Kryptografiska verktygslådan Symmetriska algoritmer MAC Envägs hashfunktioner Asymmetriska algoritmer Digitala signaturer Slumptalsgeneratorer Kryptering i sitt sammanhang
Läs merFunktioner. Räta linjen
Sidor i boken 14-143, 145-147 Funktioner. Räta linjen Här följer en dialog mellan studenten Tor-Björn (hädanefter kallad TB) och hans lärare i matematik Karl-Ture Hansson (nedan kallad KTH). När vi möter
Läs merMatcha rätt hjärta till rätt patient med AI. Dennis Medved
Matcha rätt hjärta till rätt patient med AI Dennis Medved Översikt Introduktion IHTSA LuDeLTA Sammanfattning Framtida arbete Introduktion Hjärttransplantation Livräddande operation för patienter med hjärtsvikt
Läs merCarl-Oscar Hermansson WEBB DESIGN
Carl-Oscar Hermansson WEBB DESIGN Del SKAPA DIN WEBBPLATS MED HTML. Öppna ett HTML-dokument... 8 6. HTML grundkod... 9 7. Färger... 0 8. Textformatering... 9. Listor... 0 0. Bilder.... Bakgrundsbilder...
Läs merSLUTRAPPORT RUNE TENNESMED WEBBSHOP
SLUTRAPPORT RUNE TENNESMED WEBBSHOP -05-30 Abstrakt Under 10 veckor har jag och Oskar Norling arbetat med att ta fram en webbshop-applikation till företaget Rune Tennesmed i Kalmar. I denna rapport tänker
Läs merKdenlive snabbstartguide
Den här dokumentationen konverterades från sidan Kdenlive/Manual/QuickStart på KDE:s användarbas. Översättare: Stefan Asserhäll 2 Innehåll 1 Snabbstart 5 1.1 Skapa ett nytt projekt....................................
Läs merDel I Denna del består av 8 uppgifter och är avsedd att genomföras utan miniräknare.
Del I Denna del består av 8 uppgifter och är avsedd att genomföras utan miniräknare. Dina lösningar på denna del görs på separat papper som ska lämnas in innan du får tillgång till din miniräknare. Observera
Läs merRIKSFINAL 2017 Lagen
RIKSFINAL 2017 Lagen 1. Biologi Ni kommer nu att få höra några påståenden som handlar om biologi, och sen ska ni svara på om de är sanna eller falska. Detta gör ni genom att hålla upp en grön skylt om
Läs merIntroduktion till frågespråket SQL (v0.91)
DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför
Läs merAI, musik & PLCGalgoritmen
LINKOPINGS UNIVERSITET, IDA AI, musik & PLCGalgoritmen AI inom en artistisk domän sarwi387 9/18/2012 ABSTRAKT AI har anpassats på de flesta naturvetenskapliga ämnen tidigare men man har de senaste årtionden
Läs merLARS ULVELAND HOPFIELDNÄTVERK FÖR IGENKÄNNING AV DEGRADERADE BILDER OCH HANDSKRIVNA TECKEN
LARS ULVELAD HOPFIELDÄTVERK FÖR IGEKÄIG AV DEGRADERADE BILDER OCH HADSKRIVA TECKE E PROJEKTRAPPORT FÖR PROJEKTKURSE I BILDAALYS HT 02 Teori för Hopfieldnätverk Hopfieldmodellen är en typ av neuronnät,
Läs merVerktygslåda för mental träning
Lek med tanken! Instruktioner för Verktygslåda för mental träning Här hittar du några verktyg som hjälper dig som är aktiv idrottare att bli att bli ännu bättre i din idrott. Är du tränare eller förälder
Läs mer1. Eleverna hämtar på skolans hemsida formuläret som ska fyllas i.
IUP år 7 1. Eleverna hämtar på skolans hemsida formuläret som ska fyllas i. 2. Elever besvarar frågeställningar kring sin utveckling inom ämnet. Ett formulär gemensamt för alla ämnen används av eleven.
Läs merProvverktyg för elever instruktioner [SE]
Provverktyg för elever instruktioner [SE] Innehållsförteckning 1 Inledning 3 2 Göra proven 3 2.1 Logga in 3 2.2 Kontrollera ljudet för hörförståelseprovet 5 2.3 Göra ett prov 5 3 Uppgifterna 7 3.1 Uppgifter
Läs mer