AI, musik & PLCGalgoritmen

Relevanta dokument
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens Erik Claesson

Statistisk mönsterigenkänning

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping

Upplägg. Binära träd. Träd. Binära träd. Binära träd. Antal löv på ett träd. Binära träd (9) Binära sökträd (10.1)

Artificiell Intelligens den nya superkraften

DD1350 Logik för dataloger. Vad är logik?

de var svåra att implementera och var väldigt ineffektiva.

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

för att komma fram till resultat och slutsatser

Dependensregler - Lathund

Beräkningsvetenskap introduktion. Beräkningsvetenskap I

Ex post facto forskning Systematisk, empirisk undersökning. om rökning så cancer?

Föreläsning 13 Innehåll

Hitta k största bland n element. Föreläsning 13 Innehåll. Histogramproblemet

ADT Prioritetskö. Föreläsning 13 Innehåll. Prioritetskö vs FIFO-kö. Prioritetskö Exempel på användning. Prioritetsköer och heapar

Handledare: Mikael Goldmann

Hur kan AI förbättra våra processer?

Optimera, inte eliminera, den mänskliga hjärnan genom AI. Anna-Karin Edstedt Bonamy, MD, PhD Chief Medical Officer, Doctrin AB

Programmering i skolan varför då? Marie Gustafsson Friberger Geek Girl Mini / Good Measure

Anvisningar till rapporter i psykologi på B-nivå

OMTENTAMEN I DATASTRUKTURER OCH ALGORITMER DVG B kl. 08:15 13:15

Beräkningsvetenskap introduktion. Beräkningsvetenskap I

Vindkraft och ML. - hur kan vindkraft dra nytta avml

Programmering i skolan varför då? Lisa Söderlund Pedagogik och kommunikation

Föreläsning Datastrukturer (DAT037)

Matcha rätt hjärta till rätt patient med AI. Dennis Medved

Programmering i skolan varför då? Lisa Söderlund Pedagogik och kommunikation

Tentamen: Programutveckling ht 2015

Vad säger forskningen om antagning och urval till högre utbildning

FUZZY LOGIC. Christopher Palm chrpa087

Tentamen, EDA501/EDAA20 Programmering M MD W BK L

Visualisering av samverkan

Att hitta projekt. Björn Victor. måndag 19 mars 12

Tentamen i. TDDC67 Funktionell programmering och Lisp

c a OP b Digitalteknik och Datorarkitektur 5hp ALU Design Principle 1 - Simplicity favors regularity add $15, $8, $11

Föreläsning Datastrukturer (DAT036)

TDDC74 Programmering: Abstraktion och modellering Datortenta , kl 14-18

Designing Case Studies

AI utmaningar inom kvalitetssäkring. Henrik Emilsson Teststrateg, Nordic Medtest AB

Kosmosklubben i samarbete med Enskedeskolan erbjuder dig/ditt barn VT 2015; Schack. Piano. Björkstugan (Handelsvägen 20), fredagar, från 13.

Logik: sanning, konsekvens, bevis

a = a a a a a a ± ± ± ±500

Beräkningsvetenskap. Vad är beräkningsvetenskap? Vad är beräkningsvetenskap? Informationsteknologi. Informationsteknologi

Föreläsning 13 Innehåll

Innehåll. Föreläsning 12. Binärt sökträd. Binära sökträd. Flervägs sökträd. Balanserade binära sökträd. Sökträd Sökning. Sökning och Sökträd

Kinesiska restsatsen

729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581

ADT Prioritetskö. Föreläsning 12 Innehåll. Prioritetskö. Interface för Prioritetskö. Prioritetsköer och heapar

- ett statistiskt fråga-svarsystem

Föreläsning 10 Innehåll. Prioritetsköer och heapar. ADT Prioritetskö. Interface för Prioritetskö. Exempel på vad du ska kunna

Språket Python - Del 1 Grundkurs i programmering med Python

Bråkräkning uppfattas av många elever som svårt, särskilt vid beräkningar

För att kunna förse de externa parterna med kunduppgifter görs följande steg i Eurostore.

Numerisk Analys, MMG410. Lecture 12. 1/24

Problem med stenplattor

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Tentamen Programmeringsteknik II Skrivtid: Hjälpmedel: Java-bok (vilken som helst) Skriv läsligt! Använd inte rödpenna!

Tekniska beräkningar. Vad är tekn beräkningar? Vad är beräkningsvetenskap? Informationsteknologi. Informationsteknologi

Forskning och vetenskap: Kvalitativa metoder

TDDD92 Artificiell intelligens -- projekt

Människa-datorinteraktion och användarcentrerad design

Lite Kommentarer om Gränsvärden

Självbalanserande träd AVL-träd. Koffman & Wolfgang kapitel 9, avsnitt 1 2

Problem: FIL File Paths

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock

Anmälningskod: Lägg uppgifterna i ordning. Skriv uppgiftsnummer (gäller B-delen) och din kod överst i högra hörnet på alla papper

Föreläsning Datastrukturer (DAT037)

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Träd. Rot. Förgrening. Löv

Hierarchical Temporal Memory Maskininlärning

NELL - Never-Ending Language Learner

Statistik 1 för biologer, logopeder och psykologer

Följddiagram för händelsestyrda rörelser

Föreläsning 4 Datastrukturer (DAT037)

Rapport: I vilken utstra ckning anva nds forskningsbaserade metoder i skolan

Illustrerad vetenskap. ett temaarbete i Hårkdalen F-5 v

Statistisk Maskinöversättning eller:

Lösningsförslag. Programmeringsmetodik, KV: Java och OOP. 17 januari 2004

Två fall: q Tom sekvens: () q Sekvens av element: (a b c) ; (sum-rec '(2 4 6)) = 12. q Första elementet uppfyller vissa villkor: (2 a b c)

Grundläggande Datalogi

Föreläsning 9 Innehåll

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Tentamen i Algoritmer & Datastrukturer i Java

MinMax Algoritmen Implementation och optimering. Joakim Östlund 15 juni 2004

Laboration i datateknik

FORMATIV BEDÖMNING PEDAGOGISKT CAFÉ MED TUTORLÄRARNA KVARNBACKENS SKOLA

COMPUTABILITY BERÄKNINGSBARHET. Källa: Goldschlager, Lister: Computer Science A Modern Introduction 2. upplaga 1988, Prentice Hall

Regression med Genetiska Algoritmer

Artificiella Neuronnät

Seminarium 13 Innehåll

Registerforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen

Styrteknik 7.5 hp distans: E-1000 och E-Designer

Instruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python

Bilaga 3: Kvalitetsbedömning av primärstudier

Programmets benämning: Danspedagogprogrammet Study Programme in Dance Pedagogy

Avsnitt 1, introduktion.

FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

Introduktion till programmering SMD180. Föreläsning 4: Villkor och rekursion

Datastrukturer. föreläsning 10. Maps 1

Abstrakt algebra för gymnasister

Transkript:

LINKOPINGS UNIVERSITET, IDA AI, musik & PLCGalgoritmen AI inom en artistisk domän sarwi387 9/18/2012

ABSTRAKT AI har anpassats på de flesta naturvetenskapliga ämnen tidigare men man har de senaste årtionden visat att AI även går att appliceras på en artistisk domän som musik. Man vill inom denna typ av forskning använda metoder inom AI för att studera det komplexa fenomenet i utförande av uttrycksfull, expressiv musik.

INLEDNING AI och musik är ett stort tvärvetenskapligt forskningsprojekt där ett av målen är att använda AI för att öka förståelsen för komplexa artistiska fenomen. Man studerar de fundamentala principerna i expressiv musik genom att analysera och mäta den artistiska förmågan i stora mängder data med inspelningar av talangfulla pianister. Man använder sig av moderna metoder som till exempel data-mining (datasökning), maskininlärning, mönsterigenkänning och data-visualisering. Huvudsyftet med denna forskning är att hitta modeller och regler som karaktäriserar och förklarar mönster inom musiken. Man letar efter enkla, generella och tolkningsbara modeller inom uttrycksfull musik. Grunden för detta arbete bygger på Gerhard Widmer s artikel In search of the Horowitz factor (2003). Widmer är ett stort namn inom denna typ av forskning inom musikologi. Liksom i hans artikel så ligger fokus i detta arbete på den artistiska förmågan för pianister, forskning kring detta och vad för arbete som gjorts för att hitta en generell modell eller regler för att beskriva artistisk musik. Man kan om man så vill kalla det sökandet efter Horowitz faktor som artikeln är döpt till efter den kända pianisten Vladimir Horowitz. I tidigare forsking som G, Widmer utfört -95-98 så har man introducerat ett antal grundläggande regler för pianospelande med induktiva inlärningsalgoritmer. Men dessa försök var väldigt begränsade gällande empirisk data och därför gjorde det näst intill omöjligt att dra en generell signifikant slutsats. Den forskning som G, Widmer och hans forskningsgrupp senare har bedrivit är den mest dataintensiva empiriska studien som någonsin gjorts inom detta ämne och detta har därför gett stora framsteg och utökad förståelse inom musikologi. Följande arbete kommer beskriva projektet att hitta Horowitz faktor och dess omfattning och sedan belysa en av de algoritmer som utvecklades för att komma ett steg närmare den omtalade faktorn.

DEN ARTISTISKA DOMÄNEN Först och främst hur beskriver vi då uttrycksfull musik? Jo, det är konsten att kunna forma ett musikaliskt stycke genom att variera olika parametrar som till exempel tempo och dynamik. En pianist spelar inte mekaniskt och kan inte avläsa noter och sedan hålla ett exakt tempo eller hålla en viss styrka. Det är det som skiljer de mycket talangfulla pianisterna från de mer medelmåttiga och det är precis detta man vill belysa. Vad är det som gör att en pianist så talangfull och kan man hitta en faktor som särskiljer en pianist från en annan? De viktigaste parametrarna man fokusera på är tempo, tajming, dynamik och artikulation (förbindelsen mellan olika noter). Det är denna typ av parametrar som får musiken att komma till liv och gör att det skiljer sig mellan olika personer som spelar. IN SEARCH OF THE HOROWITZ FACTOR-THE PROJECT: 2001 startade G Widmer och hans forskningsgrupp projektet som var början på sökandet efter Horowitz faktor. I detta projekt användes induktiva inlärningsalgoritmer för att upptäcka generella och giltiga principer utifrån insamlad data. Man samlade ihop data där precisa mätningar av timing, dynamik och de övriga viktiga faktorerna som behövdes för att kunna få så korrekta och beskrivande resultat som möjligt. Materielet bestod av stora mängder av inspelningar av mycket begåvade konsertpianister eftersom fokus i forskningen ligger på endast pianospel. Projektet byggde vidare på tidigare forskning som till exempel Friberg -95 och Todd -92-89 men där användes det statiska metoder medan man i detta projekt lät datorn och AI ha en mer självständig roll. All data som samlades in spelades på ett speciellt piano, ett Bösendorfer SE290, som är ett datorövervakat piano som mäter tider, styrka, timing med mera. Pianot mäter och spelar in varje tangent- och pedalrörelse med väldigt hög precision. Data som insamlats är en av de största korpusarna med musik mätt på detta sätt och den bestod av 18 kompletta Mozartsonater och mer än 150,000 noter. Även stycken av Chopin som spelats av 22 stycken olika pianister. Tre olika pianister spelar samma stycke. Kan man se några generella regler? Dessa inspelningar analyserades med intelligent dataanalysmetoder från olika delar av maskininlärning, datasökning (data mining) och mönsterigenkänning för att kunna bygga tolkningsbara kvantitativa modeller för vissa aspekter av olika inspelningar.

I början av projektet så undersökte man data på en mer lokal not-till-not nivå. Man utgick från tre definierade målklasser: tempo, dynamik och artikulation men detta var inte tillräckligt omfattande för att hitta generella signifikanta regler. Det blev på en för låg nivå som verkligen inte kan beskriva större sammanhang och det är fler faktorer som spelar in en dessa tre tar hänsyn till. Alltså går det inte att beskriva artistisk musik på denna representationsnivå, inte tillräckligt bra i alla fall. De tidigare algoritmerna lärde sig nya teorier men då endast med en regel åt gången och en regel var satt när ett stoppvillkor var uppfyllt och inlärningsprocessen stannar när det inte går att hitta fler regler som uppfyller villkoren. En enkel inlärningsalgoritm med icke så höga krav på varken precision eller coverage. Med detta i ryggen så utvecklade man därför en ny regellärande algoritm: PLCG-algoritmen. PLCG: Den induktiva PLCG(Partition, Learn, Cluster, Generalize)-algoritmen vill hitta enkla regelmodeller i komplexa datasamlingar där det kan vara svårt eller näst intill omöjligt att hitta generella modeller för olika data. PLCG står för delning, inlärning, klustering och generalisering vilket är de steg som den utför. Det är en inlärningsmetod som med hjälp av enkla regelinlärnings-algoritmer lär sig modeller eller teorier för att sedan kombinera dessa till en gällande regel. Experiment som Widmer genomförde visade att PLCG hade lättare för att upptäcka signifikant enkla teorier till skillnad från mer direkta metoder av regellärande. PLCG kompromissar också mellan täckning(coverage) och precision vilket ger bättre resultat till skillnad från tidigare algoritmer som endast tar in en viss typ av information i sina beräkningar. Ett distinkt kännedrag är att det är en meta-algoritm som kan implementeras på vilken annan regellärande algoritm som helst och den kan alltid på lämpligt sätt hitta en perfekt trade-off mellan generaliteten, precisionen och komplexiteten på olika teorier.

Experimenten visade också hur lätt det var att använda PLCG som en meta-lärande strategi för att utforska olika delar av regelmodeller. Grundidén är att lära flera modeller parallellt och söka efter grupper med liknade regler för att sedan generalisera dessa till sammanfattade regler. Dessa regler varierar i generaliserbarhet men vi väljer till slut dessa generaliseringar som grund för den slutliga modellen som optimerar de fördefinierade villkoren. Ett enkelt not-nivå exempel: PLCG lär sig några få enkla regler och det visade sig att bara med fyra regler så kan man förutspå noter och cirka 23 % av alla situationer där pianisten förlängde en not. I ett annat exempel räckte det med två regler, en att förlänga noter och en att förkorta en not och då kunde dessa två förutse hur ett stycke skulle spelas, långt ifrån hundra procent men samtidigt lyckades den mycket bra för att vara endast två regler. För att få förståelse för hur enkel och generell en regel kan vara: Regel TL2: Abstract_duration_context = equal-longer & metr_strenght 1 lengthen Givet två noter med likvärdig varaktighet följt av en längre not, förläng den noten (alltså spela den långsammare) som föregår den sista, förläng den dessutom om noten är på en uppmätt svagare position( metr_strenght 1) Med endast två regler kan en maskin förutspå en pianists mönster. Denna enkla regel visar sig att vara väldigt generell. Regel TL2 förutser korrekt 1,894 fall med lokal notförlängning vilket är 14,12 procent av alla exempel av signifikant förlängning som observerades. Det är 588 fel (2,86 procents fel) vilket ger en precision på 0,763. Tänk att en enkel regel kan förutse detta i sådan komplex musik. Ett andra exempel: Med hjälp av ett exempel från artikeln Discovering simple rules in complex data: A meta-learning algorithm and some surprising musical discoveries, även denna av Widmer,

så ska PLCG s grundläggande egenskaper förklaras och exempelfieras i ett exempel från den artikeln: I exemplet så behövs det tre andra algoritmer: En regelinlärande algoritm L, en hierarkisk klusteralgoritm H och slutligen ett regelväljandekriterium eller en strategi S. Vid regelinlärningen så använder PLCG den algoritm som tidigare exemplifierats:

De kriterier som gäller för att slutföra algoritmen är: (1) RULESTOPCRITERION(r,E) = true if purity P (r, E) = p/(p + n) MPRL, (2) THEORYSTOPCRITERION(Theory,E) = true if no more rule r can be found with purity P (r, E) = p/(p + n) MPRL and positive coverage p MCRL, där p och n är numeriska positiva och negativa exempel, dessa två är båda gömda av regel r i en samling exempel E, den krävda minimum purity MPRL och minimum täckning MCRL är användardefinierade parametrar. Självklart så kommer höga värden av MPRL producera mer precisa teorier med möjligen lägre täckning, och lägre MPRL kommer leda till en mer generell teori som också täcker ett stort nummer av negativa exempel. I regel-klustering använder man sig av en bottom-up hierarkisk samlingsklusteringalgoritm som producerar ett binärt klusterträd med de individuella reglerna som löven på trädet och roten är alla reglerna. Koden nedan. Avståndet δ mellan två regler är det antal generaliseringar som behövs för att räkna ut den minst generella generaliseringen, som vi kallar lgg, av de två reglerna. Givet våra standardrepresentationsexempel och regler så är definitionen av lgg väldigt enkel: ett diskret attribut med två olika värden i de två reglerna generaliseras till det tomma villkoret (=true) medan villkor med numeriska attribut generaliseras till det mest specifika oregelbundna uttrycket som täcker båda av de ursprungliga intervallen. Avståndet mellan kluster räknas sedan ut till det kortaste avståndet från vilket som helst av delarna av ett kluster till vilken av delaren som helst i ett annat kluster och detta kallas single-link clustering, enkel-länk klustering. Se bild nedan.

För regelval-kriterierna (steg 6 I Fig 2) så använder man en annan greedy set-covering - algoritm, som börjar med den tomma regelmängden och som alltid lägger till den regel som har maximum renhet/äkthet till det ännu obetäckta instanserna. Koden nedan: Laplace uppskattar L = (p + 1)/(p + n + 2) vilket är relaterat till purity men som straffar regler med en låg täckning på de positiva exemplen. Åter igen, urvalet avslutas när ingen regel med högre purity än någon användar-definierad MPPLCG och högra täckning än någon minimum täckande MCPLCG kan hittas.

SLUTSATS Arbetet beskrivit ovan är bara en liten del av den forskning som faktiskt bedrivs idag. Att arbetet främst berörde Widmer och hans forskningsgrupps arbete så var det för just sökandet efter en faktor som avgör musikalisk begåvning lät så intressant och det var av intresse jag valde att läsa mer för att se vart man faktiskt hade kommit. Dock var det svårt att hitta någon annan person som skrivit om ämnet, främst algoritmen PLCG som jag ville beskriva. Därför ligger det mesta på grund av Widmer s forsking och den forskning som bedrivits på the Austrian Research Institute for Artificial Intelligence. Även om man då skulle kunna säga att det bara är information från en källa så de källor jag funnit varit mycket givande och tillräckligt för att bilda sig en uppfattning. Det som framgick är att PLCG-algoritmen var ett stort steg vidare inom musikologi och en mycket mer framgångsrik och beskrivande algoritm än de tidigare enklare alternativen. PLCG kan ta fram enkla modeller och gör en bra avvägning och att den går att kombinera med andra algoritmer är något som gör den så användbar.

LITTERATURFÖRTECKNING Artiklar: Widmer, G. (2003). Discovering simple rules in complex data: A meta-learning algorithm and some surprising musical discoveries. Artificiell Intelligens 146(2): 129-148. Widmer, G. (2003). In search of the Horowitz factor. AI-magazine volume 24, no 3. 111-130. Widmer, G. (2001) Using AI and Machine Learning to Study Expressive Music Performance: Project Survey and First Report. Austrian research institute for artificiell intelligens. http://www.ofai.at/cgi-bin/tr-online?number+2001-06 Friberg, A. (1995). A Quantitative Rule System for Musical Performance. http://www.speech.kth.se/music/publications/thesisaf/sammfa2nd.htm Todd, N (1992). The Dynamics of Dynamics: A Model of Musical Expression. http://asadl.org/jasa/resource/1/jasman/v91/i6/p3540_s1