729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007

Storlek: px
Starta visningen från sidan:

Download "729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007"

Transkript

1 729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007 $,I UGMXSQLQJ 7DOLJHQNlQQLQJ

2 6DPPDQIDWWQLQJ Ett taligenkänningssystem kan vara konstruerat för en eller flera användare och för enstaka ord eller kontinuerligt tal. Taligenkänning handlar om hur en maskin (dator) får en input av olika ljudsignaler, från en användare. Sedan fattar sig en uppfattning om vad som sagts och letar igenom sitt vokabulär, samt ger en output i form av text eller tal tillbaka till användaren. För att datorn ska kunna tolka signalerna digitaliseras de först och sedan används olika algoritmer för att tolka innebörd av orden. En av metoderna för att tolka signalerna är Hidden Markov Model (HMM), som jag kommer att ta upp i mitt arbete. En HMM är en temporal sannolikhetsmodell, där processen är en diskret variabel. De möjliga värdena för den variabeln är de möjliga tillstånden i världen.

3 ,QQHKnOOVI UWHFNQLQJ 1. Inledning Syfte Om mitt arbete Bakgrund Historia Taligenkänning Lagrat tal Text-till-tal Taligenkänning Röstigenkänning Kommunikation mellan människa data Språket Talvariation Dialekter Betoning Tvetydigheter Produktion av tal Taligenkänning Olika taligenkänningssystem Beroende/oberoende av talaren Flytande tal versers pausering Ordförråd Ordbaserad igenkänning Fonembaserad igenkänning Systemlösningar Acoustic-fonetic approach Pattern recognition approach Artificial Intelligence approach Akustiska- och språkmodellen Akustiska modellen Noisy Channel model Vektor kvantifiering Hidden Markov Models (HMM) Viterbi algoritmen & A* sökning Diskussion Praktiska exempel Telias kundservice SJ:s Biljettbokningssystem Referenser Böcker Artiklar Examensarbeten Webbsidor Telefonnummer...14

4 ,QOHGQLQJ Ett taligenkänningssystems uppgift är att identifiera en sekvens av ord, givet en viss akustisk signal. Med hjälp av olika modeller tas en sannolik sekvens av ord fram och med hjälp av detta fattar systemet sig en mening om vad som ska göras härnäst; tala tillbaka, skicka användaren vidare eller släppa in användaren i en byggnad. 6\IWH Att jag började intressera mig för taligenkänningssystem var redan i ettan under Introkursen. Då talade vi om bra och dåliga artefakter, en artefakt som då kom upp var SJ:s biljettbokningssystem. Det hela är en bra sak som underlättar för många resenärer, men på samma sätt så är den för andra ett stort irritationsmoment. Då man många gånger måste upprepa sig eller att maskinen uppfattar fel saker. Redan då blev jag intresserad av hur det fungerar och vad man skulle kunna göra för att förbättra systemet. Så därför har jag valt att inrikta mig på taligenkänning, inte för att förbättra systemet, utan för att få en förståelse i hur det fungerar. 2PPLWWDUEHWH Detta arbete ger en inblick i hur taligenkänning fungerar. I mitt arbete har jag tagit hjälp av gamla arbeten för att få en bra struktur på mitt eget. Jag har använt mig dels av kurslitteraturen, men även sökt och använt mig av olika examensarbeten och litteratur. Jag har även sökt information på webben för att på ett lättare sätt få tag i bilder till mitt arbete, men trots detta resulterade det inte i så många bilder. 4

5 %DNJUXQG Talet är ett av de beteenden som skiljer människor från djur. Även djur har läten, men människospråk är en av sakerna som har gjort att vi kommit så långt i vår utveckling. Eftersom språket är en stor del av oss, har människor i alla tider varit fascinerade av tal, hur det fungerar och även försökt få maskiner och andra saker få detta människokarakteristiska beteende. +LVWRULD Taligenkänning har funnits under en längre tid, redan under 1700-talet försökte man att frambringa tal på maskinellväg 1. Men det var under 1950-talet i och med utvecklingen av datorn som även AI-epoken började blomstra. Det var under denna tid man började få en inblick i hur vi skulle kunna få maskiner att förstå och frambringa tal. Framtidsutsikterna såg goda ut och förhoppningarna om att man inom några år skulle kunna kommunicera med datorerna var stor. Drömmarna krossades dock ganska fort när forskarna började inse komplexiteten med taligenkänning. Dels för att människor uttalar ord olika och för att det krävdes alldeles för mycket databearbetning och minne än vad som fanns tillgängligt på den tiden 2. 7DOLJHQNlQQLQJ Taligenkänning hör till området talbearbetning, det innefattar både tolkning och syntes av tal. För att tolka tal måste en dator få en input i form av olika signaler. Taligenkänning delas i stort in i fyra områden: /DJUDWWDO Här så spelar man upp meningar för en dator, den lagrar sedan meningarna som enstaka ord. Datorn kan sedan med de orden som finns lagrade sammanfoga ord till meningar. 7H[WWLOOWDO Inom denna metod så sparas vanlig text, både ord och meningar, som tillsist syntetiseras till tal. 7DOLJHQNlQQLQJ Detta är en omvänd process till text-till-tal. I denna metod så tar man de talade orden och översätter dem till text, eller så kan talet kopplas till utförande av olika kommandon. Min fördjupning kommer i förstahand kretsa kring taligenkänning. 5 VWLJHQNlQQLQJ Där tolkar man talet. Datorn försöker känna igen rösten för att sammankoppla det med en enskild användare ³7DOLJHQNlQQLQJLWHRULRFKSUDNWLN (Johnny Larsson, 1998) 5

6 .RPPXQLNDWLRQPHOODQPlQQLVND±GDWD Så varför har vi ett behov av att kommunicera med datorer, räcker det inte med ett tangentbord och en mus? Svaret är att för den vanliga användaren så är detta mer än nog, men det finns många fördelar med att istället kunna kommunicera med till exempel sin dator. Röststyrning av både dator och andra saker i hemmet är till stor hjälp för handikappade. Folk som har problem att röra sig kan till exempel få bra hjälp av system som reglerar sängens läge. Ett annat område som röststyrning är användbart i är miljöer som kräver vår fulla uppmärksamhet, till exempel när man kör en bil. Det blir allt viktigare för så kallade handsfree utrustning. Numera är det i vissa länder förbjudet att köra och tala i en telefon samtidigt, ska detta göras så måste det ske genom en hands-free. På samma sätt är klimatanläggningar och stereon saker som stör koncentrationen, om de istället för knapptryckningar sköttes av röststyrning skulle trafiksäkerheten öka. Eftersom talet är en stor del av vårt dagliga liv handlar det även om en effektivisering, till exempel kan en människa uttala mellan ord per minut, medan en vältränad datoranvändare kan skriva 100 till 150 ord per minut 3. 3 ³7DOLJHQNlQQLQJLWHRULRFKSUDNWLN (Johnny Larsson, 1998) 6

7 6SUnNHW En grundläggande kunskap för ett taligenkänningssystem är språkets uppbyggnad. Ett språks grundstenar kallas för fonem, de är de små betydelseskiljande ljudenheterna. I svenskan finns cirka 30 fonem 4. Ett taligenkänningssystem måste också veta hur de olika fonemen kan kombineras. När ett ord uttalas så hör vi ljud, men en maskin kan höra ljudvågens frekvens och även få se en bild av ljudvågen genom ett spektogram. Frekvensen är det antal gånger per sekund som en ljudvåg upprepar sig själv och spektogrammet är en bild över hur de olika frekvenserna förändras över tiden. 7DOYDULDWLRQ Ett språk byggs upp av ord och hur dessa ord uttalas skiljer sig stort. Olika variabler till variation kan vara kön, ålder, sinnesstämning och uttalshastighet. Ord låter även olika om de skriks ut eller viskas fram. 'LDOHNWHU Variationen i uttal kan bero på dialekter, många dialekter både förkortar ord eller har sina egna ord för samma sak. Ett exempel är norrländskan/värmländskan som ofta tar bort den sista vokalen i ett ord. %HWRQLQJ Svenska har en så kallad fri betoning, men i många andra språk har man bara en slags betoning. Då har man alltid betoning på samma stavelse. För svenskan innebär det att vi har huvudbetoning, bibetoning och obetoning. Detta påverkar många av de svenska orden. Beroende på hur vi betonar orden kan vi förmedla om vi menar ta i för allt du har, eller ta i trä. 7YHW\GLJKHWHU Tvetydigheter handlar i grund och botten om ordbetoning, hur långt/kort bokstäverna uttalas. Ett exempel är ordet hov. Som i ett hov, uttalas vokalen R mycket längre en det gör i en hästhov. En fiskhåv och ett kungligt hov uttalas på samma sätt och kan endast skiljas åt i skrift eller med hjälp av sammanhang. 3URGXNWLRQDYWDO När vi talar så kombinerar vi de olika fonemen till att bilda ord som i sin tur bildar meningar. Fonemen uttalas inte ett och ett utan de följer varandra. Fonemen och deras övergångar står i relation till varandra, och bildar tillsammans en ljudvåg. Som är periodiska förändringar av lufttrycket. Det är ljudvågen som senare analyseras i ett taligenkänningssystem. Ljudfrekvensen i tal är stort, vi kan istället mäta förändringarna av innehållet i en signal för de är färre. Därför summeras signalens egenskaper i en så kallad frame (ram). En ram har en längd på ca 10 ms och de olika händelserna gestaltas med vektorer. Ramar överlappar varandra för att man inte ska förlora information i övergångarna. För varje ram finns det ett ospecificerat antal egenskaper Q, och varje egenskap kan ha olika värden [. Vanliga system har vanligtvis tals egenskaper, och egenskaperna ökar exponentiellt mot sina värden ([ ). Om Q är större än 2, måste ytterligare kompression göras för att kunna representera P(egenskaper fonem). Detta kan göras genom en Vektor kvantifiering (VHDYVQLWW) 4 )RQHWLNHQVJUXQGHU (Per Lindblad, 1997) Göteborgs Universitet 7

8 7DOLJHQNlQQLQJ Alla taligenkänningssystem är gjorda för olika ändamål, till exempel kan det gälla röststyrning för att få tillgång till en byggnad, automatiska telefontjänster och dikteringsprogram. På grund av de språkvariationen som finns i naturligt tal anses taligenkänning som ett probabilistiskt problem. 2OLNDWDOLJHQNlQQLQJVV\VWHP Det finns olika sorters system. De delas in i olika grupper beroende på vilka kriterier systemet uppfyller. %HURHQGHREHURHQGHDYWDODUHQ Ett talarberoende system är bundet till en specifik individ. Detta gör att systemet endast kan användas av den person som talat in ord och tränat systemet. Användaren tränar systemet till att känna igen de ord som anses nödvändiga, vilket gör att systemet ofta blir bättre. Det negativa är att de endast kan användas av en individ. De talaroberoende systemen är bättre på så sätt att systemet inte behöver lära sig hur en ny användare talar. Detta system är mer komplext och tar lägre tid att träna upp, eftersom den måste innehålla så många olika uttal för samma ord. )O\WDQGHWDOYHUVHUVSDXVHULQJ Det finns också system som klarar av flytande tal och de systemen som kräver pauser mellan de uttalade orden. Det positiva med pauser är att talaren tar det lugnt och artikulerar orden ordentligt, detta gör att systemet har lättare att känna igen orden och prestanda ökar. Fördelen med ett system som klarar av flytande tal är att det klarar av att identifiera dubbelt så många ord per minut som ett system som kräver pauser. Problem för system som tar flytande tal kan vara att människor uttalar ord olika fort, plus att människor ofta binder samman ord och tar bort ändelser. 2UGI UUnG Beroende på hur många ord systemet har i sin kunskapsbas klassificeras systemet som stort eller litet. Har systemet under ord klassas det som ett litet och över som ett stort system. Ett riktigt stort system kan ha mellan ord. 2UGEDVHUDGLJHQNlQQLQJ Ett litet system identifierar oftast hela ord. Ordsökning passar för små system därför att man tränar in de ord som systemet ska kunna. Eftersom orden är begränsade kan systemet lätt göra en identifiering, med något som matchar i kunskapsbasen. Skulle man använda detta för ett större system så skulle det krävas ett otroligt stort lagringsutrymme och sökningen skulle ta alldeles för lång tid för att vara användbart. Det positiva med ordbaserade system är att det har lättare att se till helheten och lättare för tvetydigheter. )RQHPEDVHUDGLJHQNlQQLQJ Större system baseras istället på fonemidentifiering. Det finns ett begränsat antal fonem vilket gör att det inte krävs så stort lagringsutrymme. Orden finns fortfarande i ordförrådet, men de finns inte lagrade med en massa information om sin helhet utan informationen koncentreras istället på fonemen som bygger upp ordet. 8

9 6\VWHPO VQLQJDU Det finns tre olika huvudlösningar, skillnaden mellan dessa är hur man använder intelligensen i igenkänningen och vilken signalbehandling som man använder. De tre olika implementationerna är, akustisk-fonetisk, mönstermatchning och Artificiell Intelligens. $FRXVWLFSKRQHWLFDSSURDFK Gör en sekventiell analys på signalen. Signalen byggs upp till sekvenser av fonem som i sin tur tolkas till ord. Taligenkänningen i ett sådant system sker i två etapper. I första etappen delas den talade signalen upp i tid och de olika fonem som uttalas. Talsignalen blir då indelad i diskreta tidssegment som sedan associeras till motsvarande möjliga fonem. Nästa steg innebär att försöka identifiera sekvensen med fonem till ett sannolikt ord. 3DWWHUQUHFRJQLWLRQDSSURDFK Är en matchning av mönster. Här delas inte ljudsignalens spektrum upp utan man analyserar hela spektret. De två stegen i denna tillämpning är att först träna på mönstren och sedan jämföra nya mönster mot de som redan finns tränade. Just för denna process kan man använda sig av HMM eller neurala nätverk. $UWLILFLDO,QWHOOLJHQFHDSSURDFK Är en blandning av de två föregående tillvägagångssätten. Det är ett försök till att på mekanisk väg likna igenkänningsfasen till hur vi människor skulle bearbeta och ta vårt beslut utifrån de akustiska egenskaperna vi får. För att kunna använda sig av fler regler och få mer information i beslutsfattandet används expertsystem för att dela upp fonemen. $NXVWLVNDRFKVSUnNPRGHOOHQ Generellt kan vi visa sannolikhetsproblemet med att ett visst ord har uttalats given en viss signal. Den mest sannolika tolkningen av signalen är värdet av Ord när det maximerar P(Ord Signal). Att använda sig av Bayes teorem kan vara till hjälp på grund av att det är ett bakvänt sätt att räkna ut sannolikheten. Att räkna ut just ett Ord givet en viss signal kan vara ganska krångligt. Om man istället har sannolikheten för ordet givet en viss signal och multiplicerar det med sannolikheten för ordet, får man lättare fram ett svar. Bayes Teorem: P(Signal Ord) P(Ord) / P(Signal) Genom att normalisera förändrar vi formeln. Vi ersätter 1/ P(Signal) med alfa. Detta på grund av att signalen inte påverkar valet av ord 5. Vi får då formeln: P(Ord Signal) = α P(Signal Ord) P(Ord) P(Signal Ord) brukar kallas för den akustiska modellen. Den förklarar hur ord låter, genom en signal givet ett visst ord. För att räkna ut detta använder man sig av en HMM (DYVQLWW), denna visar sannolikheten för en signal givet ordet. Till exempel att kan två olika ord ha samma signaler, en håv(fisk) och ett hov(kungligt). Då kan man använda sig av P(Ord) som kallas för språkmodellen, den ger sannolikheten för ett uttalande. För att räkna ut sannolikheten för P(Ord) använder man sig av en N-gram modell. Som använder det föregående N-1 ord till att förutse nästa ord. Detta innebär att systemet även måste veta 5 ³6SHHFK6\QWKHVLVDQG5HFRJQLWLRQ HGLWLRQ, (John and Wendy Holmes, 2001) 9

10 sannolikheten för att vissa ord hör ihop. Hade till exempel det föregående ordet varit en hade P(håv) haft ett högre värde än P(hov). Multiplicerar man sedan dessa två sannolikheter (P(Signal Ord) P(Ord))med alfa, så får vi fram sannolikheten för ordet givet en signal P(Ord Signal). $NXVWLVNDPRGHOOHQ Den akustiska modellen kan delas in i två delar. Den första behandlar uttal och skapar för varje ord en sannolikhet över möjliga fonemsekvenser. Fonem är små och inte direkt observerbara, för att representera tal använder man sig av en Hidden Markov Modell. Variabeln X t specificerar vilket fonem som används i tidpunkten t. Andra delen av modellen jobbar med hur fonem blir till akustiska signaler. Modellen tillåter skillnad i hastighet och volym. 1RLV\&KDQQHOPRGHO Eftersom systemen ska kunna användas i olika miljöer och med bakgrundsljud måste ett sätt finnas att kunna urskilja det talaren säger mot vad som händer/sägs i bakgrunden. På grund av detta behandlar Noisy Channel modellen den akustiska inputen som en brusig version av källsignalen. För att filtrera bort bruset söks alla meningar som finns i vokabulären genom, och sannolikheten räknas ut för att meningen i vokabulären skulle ge den brusiga signalen. Den meningen med störst sannolikhet väljs. 9HNWRUNYDQWLILHULQJ Detta är ett sätt för att minska signalens datamängd när en ram har skapats. Ramen består av en rad vektorer. För att minska datamängden jämförs dessa vektorer mot referensvektorer som finns i en kodbok. De inkommande vektorerna jämförs med referensvektorerna och den mest sannolika referensvektorn blir vald. En referensvektor har ett eget nummer, som ersätter den inkommande vektorn. Så de ursprungliga vektorerna blir i outputen till en sekvens av nummer. Den sekvensen blir sedan indata till HMM. +LGGHQ0DUNRY0RGHOV+00 Efter att man har gjort en vektor kvantifiering så behövs ytterligare förfining. Dels så handlar det om strukturen av fonem, olika fonem bildas på olika sätt i munhålan och ljuds därför ut på olika sätt. Ett sätt för att fånga fonemens interna struktur är three-state fonem modellen. Det innebär att varje fonem har en början, mitt och ett slut, och varje tillstånd fördelar olika egenskaper. En annan förfining handlar om kontexten där fonemet uttalas. Fonem som uttalas med varandra kan låta olika mot hur de skulle låta var för sig. 10

11 En fonem HMM för [m]: Början 0.7 Mitten 0.1 Slutet 0.6 itt FINAL Output Sannolikheter för en fonem-hmm: Början: Mitten: Slutet: C1: 0.5 C3: 0.2 C4: 0.1 C2: 0.2 C4: 0.7 C6: 0.5 C3: 0.3 C5: 0.1 C7: 0.4 )LJXU±)RQHPHW0lUHWWH[HPSHOSnHWW WKUHHVWDWH IRQHP9DUMHWLOOVWnQGKDUIOHUP MOLJDRXWSXWV &&VWnUI UP MOLJDVLIIURUIUnQ9HNWRUNYDQWLILHULQJHQ En HMM används om man inte har någon information om de interna processerna, men outputen är en sekvens av observerbar data. I taligenkänning byggs en modell upp för varje möjligt ord givet en signal. En HMM måste tränas för varje specifikt ord. Systemet räknar ut sannolikheten för att en modell har gett en output av en specifik observationssekvens. Sedan väljs den optimala sekvensen av fonem ut, som matchar vektorerna, modellen tränas genom att uppdatera de nya vektorerna för att maximera sannolikhetsvärdet. Modellen kan generera mönstret över egenskaperna för att representera ordet 7. När en modell för ett visst ord aktiveras skapas vektorer som representerar ett exempel av ordet. Om modellen är bra gjord så ska statistiken visa att ungefär lika många egenskapsvektorer aktiveras i modellen som det skulle göras i det mänskliga uttalandet. En HMM kan även ses som den enklaste formen av ett Bayesianskt nätverk. I taligenkänning använder man sig av en så kallad left-right HMM 8. Det innebär att man kan gå vidare framåt i kedjan, men man kan aldrig backa till ett tillstånd som hänt innan det man befinner sig i för tillfället. )LJXU±(WWH[HPSHOSnHQOHIWULJKW+00 Outputen från en HMM är en stokastisk process, vilket betyder att allt beror på sannolikheten. Sannolikheten för alla handlingar i tiden t, beror bara på just det tillstånd som vi är i och inte värdet på W. I modellen finns också en diskret variabel som kallas X t, den står för det gömda tillståndet i tiden W. Y t står för observationerna i tiden W. 6 Artificial Intelligence, A modern approach, second edition - (Russell & Norvig, 2003) 7 ³6SHHFK6\QWKHVLVDQG5HFRJQLWLRQ HGLWLRQ, (John and Wendy Holmes, 2001) 8 ³$7XWRULDORQ+LGGHQ0DUNRY0RGHOVDQG6HOHFWHG$SSOLFDWLRQVLQ6SHHFK5HFRJQLWLRQ ±(Rabiner, 1988) 9 ³$7XWRULDORQ+LGGHQ0DUNRY0RGHOVDQG6HOHFWHG$SSOLFDWLRQVLQ6SHHFK5HFRJQLWLRQ ±(Rabiner, 1988) 11

12 9LWHUELDOJRULWPHQ $V NQLQJ Viterbialgoritmen är en algoritm som väljer ut den mest sannolika sekvensen givet en signal. Viterbialgoritmen löser orduppdelningsproblem genom dynamisk programmering för att undersöka alla möjliga ordsekvenser och ordbegränsningar samtidigt. Eftersom Viterbi går helt enligt sannolikhet ger den inte alltid rätt resultat. Därför har man till viss del börjat använda A*sökning istället. A* söker alltid efter den bästa lösningen. Har man kommit till målet av med sannolikheten 0.6 och det finns en nod med högre uppskattad sannolikhet högre upp i trädet så kommer A* att expandera den noden. För att på så sätt söka efter den högst sannolikalösning, även att den redan har funnit en lösning. På detta sätt är A* bättre lämpad för att söka efter det mest troliga ordet. En annan bra sak med A* är att den inte behöver söka genom hela tillståndsrymden. Eftersom den har vetskap om den uppskattade- och faktiska kostnaden, behöver den inte expandera vägar som den vet kommer att ge ett sämre resultat. 12

13 'LVNXVVLRQ Att taligenkänning är komplext är lätt att inse även för en icke insatt person. Bara av att lyssna på de olika dialekterna som finns i Sverige, dels de landskapsstyrda men även de invandrarstyrda dialekterna så märker vi en stor skillnad som i vissa fall ställer till problem även för oss människor 10. Om vi som är vana lyssnare har svårt för att förstå, vad har då inte en dator. För att möjliggöra en kommunikation mellan människor och datorer har man länge jobbat för att finna en bra lösning. Men de svenska talsystemen ligger än så länge efter de engelska. Detta kan vara på grund av att det finns fler engelsktalande som både kan utveckla och träna systemen än vad det finns svensktalande. De system som jag har provat tycker jag själv fungerar ganska bra, men jag vet att andra har haft problem och lätt irriterar sig på att systemet inte förstår eller går alldeles för långsamt. Jag tycker att man ska försöka ha lite tålamod och inse att systemen kanske inte fungerar perfekt nu, men att om man ger det lite tid och fortsätter använda systemen så kommer de bli bättre och bättre. Forskare har sedan 50- talet jobbat med att få datorer att frambringa och förstå tal, men det är först nu på senare år som datorerna har börjat få den prestanda som behövs för taligenkänningsprocessen. Desto fortare och bättre datorerna blir desto lättare och snabbare kommer taligenkänningen att fungera, givet att man fortsätter att forska och försöker utveckla de redan befintliga systemen. Jag har i min studie fått en inblick i några olika system och olika sätt att få systemen att fungera. De system som jag tycker är mest intressanta är de generella systemen som klarar av fler användare. Det är intressant hur man kan få en dator att förstå så många olika saker sagt av så många olika människor. 3UDNWLVNDH[HPSHO Jag har funnit en del praktiska tillämpningar på olika taligenkänningssystem. De flesta är system för att guida kunder rätt innan de når kundtjänst. Andra system är till för biljettbokning, eller för att få information om varor som företaget har. 7HOLDVNXQGVHUYLFH Telias kundtjänstsystem är till för att guida kunden in i rätt telefonkö på kundservice. Systemet börjar med att be kunden specificera sitt problem. När detta är klart ställs olika frågor, men det hela mynnar ut i att kunden får ge sitt telefonnummer och slussas vidare till en handläggare inom rätt område vid kundtjänst. 6-V%LOMHWWERNQLQJVV\VWHP SJ har ett biljettbokningssystem som fungerar så att kunden ringer ett nummer (se referenser). Därifrån guidas man vidare till antingen tidtabellsinformation, biljettbokning eller bemannad kundtjänst. I början använder sig man av knapptryckningar, men så fort man valt tidtabell eller biljettbokning så får man börja använda rösten för att göra sina val. Jag provade själv på tjänsten tidtabellsinformation och tycker att det fungerar relativt bra. Först får man ange varifrån man vill åka och vart. Systemet svarar tillbaka och undrar om det var en korrekt iakttagelse, man får då svara ja eller nej. Sedan följer frågor om vilken tid och vilken dag, vilket färdsätt med mera. Jag upplevde det som om systemet klarade av min dialekt, om jag pratade fort eller långsamt, tyst eller normal samtalston. Väntetiden var inte heller så lång, utan systemet kom relativt snabbt tillbaka med ett svar eller en fråga

14 5HIHUHQVHU % FNHU ³$UWLILFLDO,QWHOOLJHQFH$PRGHUQDSSURDFKVHFRQGHGLWLRQ - (Stuart Russell & Peter Norvig, 2003) ³6SHHFK6\QWKHVLVDQG5HFRJQLWLRQ HGLWLRQ - (John and Wendy Holmes, 2001) )RQHWLNHQVJUXQGHU (Per Lindblad, 1997) Göteborgs Universitet 6SHHFKDQGODQJXDJHSURFHVVLQJ (Jurafsky & Martin, 2000) $UWLNODU ³$7XWRULDORQ+LGGHQ0DUNRY0RGHOVDQG6HOHFWHG$SSOLFDWLRQVLQ6SHHFK5HFRJQLWLRQ ± (Rabiner, 1988) ³*HQHUDWLYHIDFWRUDQDO\]HG+00IRUDXWRPDWLFVSHHFKUHFRJQLWLRQ ±(Yao, Paliwal, Lee, 2003) Speech communication, Volume 45, Issue 4, April 2005, sidorna ([DPHQVDUEHWHQ ³7DOLJHQNlQQLQJLWHRULRFKSUDNWLN (Johnny Larsson, 1998) LiTH-ISY-EX-2030 :HEEVLGRU Telia Kundservice Lyssna på en interaktion Lyssna på Sverige olika dialekter Ett nationellt centrum för svensk språkteknologi 7HOHIRQQXPPHU SJ:s Talsvar: Telias kundtjänst:

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0 Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens

Läs mer

Artificial)Intelligence) Taligenkänning)

Artificial)Intelligence) Taligenkänning) LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...

Läs mer

Taligenkänning med fördjupning på Hidden Markov Models

Taligenkänning med fördjupning på Hidden Markov Models IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models 870524-0045 jearu017@student.liu.se Sammanfattning Taligenkänning är en teknik

Läs mer

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,

Läs mer

Niklas Lindvall Artificiell intelligens II Ht

Niklas Lindvall Artificiell intelligens II Ht Taligenkänning Hidden Markov Model Niklas Lindvall nikli368@student.liu.se Artificiell intelligens II Ht 2011 2011-09-19 0 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende...

Läs mer

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och

Läs mer

AI-rapport Speech recognition

AI-rapport Speech recognition AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! !

Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! ! Taligenkänning HMMochViterbi EllinorAndersson,92091393801 LinköpingsUniversitet ArtificiellIntelligensII,729G11 Ht2012 2012909912 Sammanfattning Dennaprojektuppsatsbehandlartaligenkänningochdeolikadelmomentsomkrävsför

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09 Taligenkänning Hur datorer känner igen talat språk 729G43 Artificiell Intelligens Charlie Forsgren, chafo246 2014-01-09 Charlie Forsgren Innehållsförteckning Inledning..3 Språk och Ljud 4 Elektronisk Inspelning

Läs mer

de var svåra att implementera och var väldigt ineffektiva.

de var svåra att implementera och var väldigt ineffektiva. OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan

Läs mer

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder. OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA 729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion

Läs mer

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning

Läs mer

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder. OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad för att man skall

Läs mer

Pedagogisk planering för ämnet: Svenska

Pedagogisk planering för ämnet: Svenska 1(5) Pedagogisk planering för ämnet: Svenska Tidsperiod: årskurs 4 Syfte & övergripande mål: Vi kommer att läsa, skriva, lyssna och tala. Syftet är att du ska utveckla förmågan att: - formulera dig och

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs... OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs...

Fråga 5 (1 poäng) För att definiera ett sökproblem krävs... OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

CMG Speech Attendant. Användarmanual. 19 februari PUBLIC

CMG Speech Attendant. Användarmanual. 19 februari PUBLIC CMG Speech Attendant Användarmanual 19 februari 2010 www.aastra.com PUBLIC Innehåll 1 Inledning... 3 2 Tips... 3 3 Funktioner... 4 3.1 Framkoppling enligt namn... 4 3.1.1 Enkel framkoppling... 4 3.1.2

Läs mer

HKGBB0, Artificiell intelligens

HKGBB0, Artificiell intelligens HKGBB0, Artificiell intelligens Kortfattade lösningsförslag till tentan 3 november 2005 Arne Jönsson 1. Vad karaktäriserar dagens AI-forskning jämfört med den AI-forskning som bedrevs perioden 1960-1985.

Läs mer

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen

Läs mer

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett

Läs mer

Att kommunicera med personer med demenssjukdom

Att kommunicera med personer med demenssjukdom Att kommunicera med personer med demenssjukdom Kommunikation är en viktig del i våra relationer och ett grundläggande behov. Vår identitet är nära sammankopplad med vårt språk. Vem vi är som person, skapas

Läs mer

Hör och härma. Röda boken lite lättare. Uttalsträning för nybörjare i svenska som andraspråk. Unni Brandeby

Hör och härma. Röda boken lite lättare. Uttalsträning för nybörjare i svenska som andraspråk. Unni Brandeby Hör och härma Röda boken lite lättare Uttalsträning för nybörjare i svenska som andraspråk Unni Brandeby spår 1 FÖRORD till den studerande Den här boken är till dig som just ska börja lära dig svenska.

Läs mer

Probabilistisk logik 2

Probabilistisk logik 2 729G43 Artificiell intelligens / 2016 Probabilistisk logik 2 Marco Kuhlmann Institutionen för datavetenskap Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk

Läs mer

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens

Läs mer

Mål- och bedömningsmatris Engelska, år 3-9

Mål- och bedömningsmatris Engelska, år 3-9 Mål- och bedömningsmatris Engelska, år 3-9 Bedömningens inriktning Receptiva färdigheter: Förmåga att förstå talad och skriven engelska. Förmåga att förstå helhet och sammanhang samt att dra slutsatser

Läs mer

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet

Läs mer

Tolkhandledning 2015-06-15

Tolkhandledning 2015-06-15 Att använda tolk Syftet med denna text är att ge konkreta råd och tips om hur tolk kan användas i både enskilda möten och i grupp. För att hitta aktuell information om vad som gäller mellan kommun och

Läs mer

Föreläsning 11 - Automater, textsökning, tillstånd

Föreläsning 11 - Automater, textsökning, tillstånd Föreläsning 11 - Automater, textsökning, tillstånd Automater Textsökning KMP-automat (Knuth-automat) Boyer-Moore Rabin-Karp Sökning på webben Automater En portkodsautomat med nio knappar kan se ut så här:

Läs mer

BEDÖMNINGSSTÖD till TUMMEN UPP! svenska åk 3

BEDÖMNINGSSTÖD till TUMMEN UPP! svenska åk 3 BEDÖMNINGSSTÖD till TUMMEN UPP! svenska åk 3 Det här är ett BEDÖMNINGSSTÖD till Tummen upp! svenska som hjälper dig att göra en säkrare bedömning av elevernas kunskaper i årskurs 3. Av tradition har man

Läs mer

Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.

Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata. Att förstå variabler Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata. Vad är en variabel? En variabel är en plats att lagra information. Precis

Läs mer

Grundläggande programmering med matematikdidaktisk inriktning för lärare som undervisar i gy eller komvux gy nivå, 7,5 hp

Grundläggande programmering med matematikdidaktisk inriktning för lärare som undervisar i gy eller komvux gy nivå, 7,5 hp Grundläggande programmering med matematikdidaktisk inriktning för lärare som undervisar i gy eller komvux gy nivå, 7,5 hp Dag Wedelin, bitr professor, och K V S Prasad, docent Institutionen för data- och

Läs mer

Artificiell Intelligens Lektion 7

Artificiell Intelligens Lektion 7 Laboration 6 Artificiell Intelligens Lektion 7 Neurala nätverk (Lab 6) Probabilistiska resonemang Vad? Mönsterigenkänning Lära ett neuralt nätverk att känna igen siffror Varför? Få ökad förståelse för

Läs mer

Att fånga den akustiska energin

Att fånga den akustiska energin Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte

Läs mer

Tekniken bakom språket

Tekniken bakom språket Tekniken bakom språket Red. Rickard Domeij Småskrift utarbetad av SPRÅKRÅDET 2008 NORSTEDTS AKADEMISKA FÖRLAG INNEHÅLL Språkteknologi för språken i Sverige 13 Rickard Donieij Tekniken bakom språket 13

Läs mer

1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05

1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05 1(15) Bilaga 1 2(15) Neuronnätslaboration Räknare Denna laboration riktar sig till gymnasieelever som går en teknisk utbildning och som helst har läst digitalteknik samt någon form av styrteknik eller

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Probabilistisk logik 1

Probabilistisk logik 1 729G43 Artificiell intelligens / 2016 Probabilistisk logik 1 Marco Kuhlmann Institutionen för datavetenskap Osäkerhet 1.01 Osäkerhet Agenter måste kunna hantera osäkerhet. Agentens miljö är ofta endast

Läs mer

Kroppsspråk och tal. Introduktion. Gå- och Stopp-signaler. Viktiga delar:

Kroppsspråk och tal. Introduktion. Gå- och Stopp-signaler. Viktiga delar: Kroppsspråk och tal Introduktion I detta avsnitt kommer du lära dig ett par grundläggande saker för kontakt med andra människor. I kontakt med andra använder vi både ord och kroppsspråk. Du kommer att

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.

Läs mer

KORT FÖR ATT LEDA DISKUSSIONEN

KORT FÖR ATT LEDA DISKUSSIONEN KORT FÖR ATT LEDA DISKUSSIONEN INNEHÅLL 1 Så här använder du diskussionskorten 2 Vad är dialog? 3 Förbättra din förmåga att lyssna 4 Förberedelser inför att föra en diskussion 5 Exempel ur manuset för

Läs mer

Vardagssituationer och algebraiska formler

Vardagssituationer och algebraiska formler Modul: Algebra Del 7: Kommunikation i algebraklassrummet Vardagssituationer och algebraiska formler Cecilia Kilhamn, Göteborgs Universitet och Jörgen Fors, Linnéuniversitetet En viktig del av algebran

Läs mer

Bedömda elevexempel i årskurs 4 6

Bedömda elevexempel i årskurs 4 6 LÄSA 1 5 Bedömda elevexempel i årskurs 4 6 EN DEL AV BYGGA SVENSKA ETT BEDÖMNINGSSTÖD FÖR NYANLÄNDA ELEVERS SPRÅKUTVECKLING 1 SAMTAL OM EN FABEL 1 UPPGIFT I ett ämnesöverskridande temaarbete om däggdjur

Läs mer

Svenska Läsa

Svenska Läsa Svenska Läsa utvecklar sin fantasi och lust att lära genom att läsa litteratur samt gärna läser på egen hand och av eget intresse, utvecklar sin förmåga att läsa, förstå, tolka och uppleva texter av olika

Läs mer

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska

Läs mer

Rockhammars skola Lokal pedagogisk planering (LPP)

Rockhammars skola Lokal pedagogisk planering (LPP) Ämne: Svenska Åk:1 Syftet Undervisningen i ämnet svenska ska syfta till att eleverna utvecklar kunskaper i och om svenska språket. Genom undervisningen ska eleverna ges förutsättningar att utveckla sitt

Läs mer

Signaler och system, IT3

Signaler och system, IT3 Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad

Läs mer

Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3)

Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3) SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? Boken handlar Moa och Lina som ska ta hästarna i stallet till hagen över sommaren. Lina ska ta hand om Gullan, som ligger ner i sin box och är trött. Lina pratar

Läs mer

Algoritmer och maskininlärning

Algoritmer och maskininlärning Algoritmer och maskininlärning Olof Mogren Chalmers tekniska högskola 2016 De här företagen vill Tjäna pengar Hitta mönster i stora datamängder Göra förutsägelser Klassificera data Förstå människan Maskininlärning

Läs mer

Användarhandbok för Automatisk telefonist (inklusive Talad hänvisning)

Användarhandbok för Automatisk telefonist (inklusive Talad hänvisning) Användarhandbok för Automatisk telefonist (inklusive Talad hänvisning) MEDDELANDE Informationen i detta dokument tros vara korrekt i alla hänseenden, men garanteras inte av Mitel Networks Corporation (MITEL

Läs mer

DAB760: Språk och logik

DAB760: Språk och logik DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg

Läs mer

Stina Nyman 2012-09-16

Stina Nyman 2012-09-16 LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem

Läs mer

RealSimPLE: Pipor. Laborationsanvisningar till SimPLEKs pipa

RealSimPLE: Pipor. Laborationsanvisningar till SimPLEKs pipa RealSimPLE: Pipor Laborationsanvisningar till SimPLEKs pipa Vad händer när ljudvågor färdas genom ett rör? Hur kan man härma ljudet av en flöjt? I detta experiment får du lära dig mer om detta! RealSimPLE

Läs mer

Mål som eleverna skall ha uppnått i slutet av år 5 enligt nationella kursplanen

Mål som eleverna skall ha uppnått i slutet av år 5 enligt nationella kursplanen Engelska Mål att sträva mot enligt nationella kursplanen Skolan skall i sin undervisning i engelska sträva efter att eleven utvecklar sin förmåga att använda engelska för att kommunicera i tal och skrift,

Läs mer

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande: MODERNA SPRÅK Moderna språk är ett ämne som kan innefatta en stor mängd språk. Dessa kan sinsemellan vara mycket olika vad gäller allt från skriftsystem och uttal till utbredning och användning inom skiftande

Läs mer

Logik och Jämförelser. Styrsatser: Villkorssatsen if och repetitonssatsen for. Scriptfiler. Kommentarer. Tillämpningar: Ett enkelt filter.

Logik och Jämförelser. Styrsatser: Villkorssatsen if och repetitonssatsen for. Scriptfiler. Kommentarer. Tillämpningar: Ett enkelt filter. TAIU07 Föreläsning 3 Logik och Jämförelser. Styrsatser: Villkorssatsen if och repetitonssatsen for. Scriptfiler. Kommentarer. Tillämpningar: Ett enkelt filter. 27 januari 2016 Sida 1 / 21 Logiska variabler

Läs mer

Bornholmsmodellen ett metodiskt sätt att göra elever läsberedda. Utbildningsförvaltningen

Bornholmsmodellen ett metodiskt sätt att göra elever läsberedda. Utbildningsförvaltningen Bornholmsmodellen ett metodiskt sätt att göra elever läsberedda Bornholmsprojektet 1985-1989 Kan man: Specifikt stimulera språklig medvetenhet? Bekräfta ett positivt samband mellan fonologisk medvetenhet

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

DATORER OCH PROGRAM. Datorn är en symbolmaskin

DATORER OCH PROGRAM. Datorn är en symbolmaskin DATORER OCH PROGRAM Datorn är en symbolmaskin men kan ha såväl symboliska som fysiska gränssnitt till omvärlden Program beteendeplan och beteendegenerator Programmerade maskiner Generalitet och portabilitet

Läs mer

Vilka färdigheter ska vi sträva efter för att ge våra barn en god grund för åk 1?

Vilka färdigheter ska vi sträva efter för att ge våra barn en god grund för åk 1? Vilka färdigheter ska vi sträva efter för att ge våra barn en god grund för åk 1? Skolans uppdrag Leverera verktyg till elevens verktygslåda Språk, lärande och identitetsutveckling är nära förknippade.

Läs mer

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4 Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa

Läs mer

man kan lyssna på vad de betyder man kan lyssna efter hur de låter utan att bry sig om vad de betyder.

man kan lyssna på vad de betyder man kan lyssna efter hur de låter utan att bry sig om vad de betyder. LJUDLEK Vad är språklig medvetenhet? Små barn använder språket för kommunikation HÄR och NU, och det viktiga är vad orden betyder. Man kan säga att orden är genomskinliga, man ser igenom dem på den bakomliggande

Läs mer

AMIRA TIME. Lätt version. Lärarhandledning

AMIRA TIME. Lätt version. Lärarhandledning AMIRA TIME Lätt version Lärarhandledning Amira time lätt version Om programserien Amira time lätt version är en sitcom i 15 avsnitt. Avsnitten är cirka 4 minuter långa. Serien syftar till att bidra till

Läs mer

BLOCK 1. 1A. Att komma igång

BLOCK 1. 1A. Att komma igång BLOCK 1 1A. Att komma igång Blocket omfattar sidorna 8 23 i läseboken och sidorna 7 8 i grammatikboken samt hörövningar. 1. Vem är du? 2. Vilka fyra färdigheter är viktiga vid språkinlärning? 3. Hur många

Läs mer

KORT FÖR ATT LEDA DISKUSSIONEN

KORT FÖR ATT LEDA DISKUSSIONEN KORT FÖR ATT LEDA DISKUSSIONEN INNEHÅLL 1 Så här använder du diskussionskorten 2 Vad är dialog? 3 Förbättra din förmåga att lyssna 4 Förberedelser inför att föra en diskussion 5 Exempel ur manuset för

Läs mer

Komponentvisa operationer,.-notation Multiplikation (*), division (/) och upphöj till (ˆ) av vektorer följer vanliga vektoralgebraiska

Komponentvisa operationer,.-notation Multiplikation (*), division (/) och upphöj till (ˆ) av vektorer följer vanliga vektoralgebraiska Matlab-föreläsning 3 (4), 17 september, 2015 Innehåll Sekvenser (från förra föreläsningen) Upprepning med for-slingor och while-slingor Villkorssatser med if - then -else - Logik Sekvenser - repetion från

Läs mer

Antag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten.

Antag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten. OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

Jollerkoll - typisk jollerutveckling

Jollerkoll - typisk jollerutveckling Jollerkoll - typisk jollerutveckling Anette Lohmander Leg logoped, professor, enheten för logopedi CLINTEC, Karolinska Institutet Erik G Svensson 1 Förutsättningar Barn lär språk och tal snabbt och lätt

Läs mer

Rockhammars skola Lokal pedagogisk planering (LPP)

Rockhammars skola Lokal pedagogisk planering (LPP) Ämne: Svenska Åk:3 Syftet Undervisningen i ämnet svenska ska syfta till att eleverna utvecklar kunskaper i och om svenska språket. Genom undervisningen ska eleverna ges förutsättningar att utveckla sitt

Läs mer

Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information

Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information ARTIFICIELL INTELLIGENS II INSTITUTUINEN FÖR DATAVETENSKAP LINKÖPINGS UNIVERSITET Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information Anna

Läs mer

Fonem eller grafem? Vilket ska komma först i sfiundervisningen? Margareta Molin

Fonem eller grafem? Vilket ska komma först i sfiundervisningen? Margareta Molin Fonem eller grafem? Vilket ska komma först i sfiundervisningen? Margareta Molin Fonem är ett språkljud dvs den minsta betydelseskiljande enheten i talspråket Grafem är tecken som symboliserar språkljudet

Läs mer

Matris i engelska, åk 7-9

Matris i engelska, åk 7-9 E C A HÖRFÖRSTÅELSE Förstå och tolka engelska tydliga detaljer i talad engelska och i måttligt tempo. väsentliga detaljer i talad engelska och i måttligt tempo. Kan förstå såväl helhet som detaljer i talad

Läs mer

Automatisk igenkänning av tal och talare. Automatisk igenkänning av tal. Översikt - taligenkänning. Varför taligenkänning?

Automatisk igenkänning av tal och talare. Automatisk igenkänning av tal. Översikt - taligenkänning. Varför taligenkänning? GSLT Tal- och talarigenkänning M Blomberg 22-9-9 [ ] Automatisk igenkänning av tal och talare DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ Automatisk igenkänning av tal DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ GSLT Tal- och

Läs mer

Tisdag den 27 september 2016

Tisdag den 27 september 2016 Tisdag den 27 september 2016 Att arbeta i projekt Det vi gör idag hänger samman med det vi gjorde i går och kommer att påverka det vi ska göra i morgon Vad är projektarbete? Ett utforskande arbetssätt

Läs mer

KOMMUNIKATIVT LEDARSKAP

KOMMUNIKATIVT LEDARSKAP KOMMUNIKATIVT LEDARSKAP EN ANALYS AV INTERVJUER MED CHEFER OCH MEDARBETARE I FEM FÖRETAG NORRMEJERIER SAAB SANDVIK SPENDRUPS VOLVO Mittuniversitetet Avdelningen för medieoch kommunikationsvetenskap Catrin

Läs mer

Tentamen: Programutveckling ht 2015

Tentamen: Programutveckling ht 2015 Tentamen: Programutveckling ht 2015 Datum: 2015-11-04 Tid: 09:00-13:00 Sal: Ansvarig: Resultat: Hjälpmedel: Maxpoäng: Betygsgränser: Anslås inom 3 veckor. Inga 40 p 20 p för G, 32 p för VG. Iakttag följande:

Läs mer

Lärarmaterial. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: Författare: Thomas Halling

Lärarmaterial. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: Författare: Thomas Halling SIDAN 1 Författare: Thomas Halling Vad handlar boken om? Boken handlar om Emil, som går i femman. Alla hans klasskamrater har ett husdjur. Men inte Emil. Hans mamma är allergisk och hans pappa förstår

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk behandlar olika former av kommunikation mellan människor. Kärnan i ämnet är språket och litteraturen. I ämnet ingår kunskaper om språket, skönlitteratur

Läs mer

Får jag använda Wikipedia?

Får jag använda Wikipedia? Får jag använda Wikipedia? Wikipedia är ett unikt uppslagsverk som skapas av sina läsare. Det innebär att vem som helst kan skriva och redigera artiklar. Informationen på Wikipedia kan vara vinklad eller

Läs mer

Upprepade mönster (fortsättning från del 1)

Upprepade mönster (fortsättning från del 1) Modul: Algebra Del 2: Resonemangsförmåga Upprepade mönster (fortsättning från del 1) Anna-Lena Ekdahl och Robert Gunnarsson, Högskolan i Jönköping Ett viktigt syfte med att arbeta med upprepade mönster

Läs mer

LÅNGÖGON OCH GLASKALSONGER. Junibackens pedagogiska program för förskoleklass på temat språk och kommunikation

LÅNGÖGON OCH GLASKALSONGER. Junibackens pedagogiska program för förskoleklass på temat språk och kommunikation LÅNGÖGON OCH GLASKALSONGER Junibackens pedagogiska program för förskoleklass på temat språk och kommunikation INNEHÅLL Varmt välkomna till oss på Junibacken!... 3 Språkaktiviteter i förskoleklass... 4

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.

Läs mer

Viktiga begrepp. Algoritm. Array. Binärkod. Blockprogrammering. Bugg / fel och felsökning. Dataspel. Dator

Viktiga begrepp. Algoritm. Array. Binärkod. Blockprogrammering. Bugg / fel och felsökning. Dataspel. Dator Viktiga begrepp Den här ordlistan är till för dig som går kursen Om Programmering. Eftersom detta är en grundläggande kurs har vi i vissa fall gjort en del förenklingar. En del begrepp är svåra att förenkla,

Läs mer

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen

Läs mer

Innehåll. Föreläsning 12. Binärt sökträd. Binära sökträd. Flervägs sökträd. Balanserade binära sökträd. Sökträd Sökning. Sökning och Sökträd

Innehåll. Föreläsning 12. Binärt sökträd. Binära sökträd. Flervägs sökträd. Balanserade binära sökträd. Sökträd Sökning. Sökning och Sökträd Innehåll Föreläsning 12 Sökträd Sökning Sökning och Sökträd 383 384 Binärt sökträd Används för sökning i linjära samlingar av dataobjekt, specifikt för att konstruera tabeller och lexikon. Organisation:

Läs mer

Att orientera i den närliggande natur- och utemiljön med hjälp av kartor, såväl med som utan digitala verktyg. Kartors uppbyggnad och symboler.

Att orientera i den närliggande natur- och utemiljön med hjälp av kartor, såväl med som utan digitala verktyg. Kartors uppbyggnad och symboler. Centralt innehåll 4-6 DIGITALISERING Idrott och hälsa Att orientera i den närliggande natur- och utemiljön med hjälp av kartor, såväl med som utan digitala verktyg. Kartors uppbyggnad och symboler. Matematik

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

RÖDA TRÅDEN SVENSKA F-KLASS ÅK

RÖDA TRÅDEN SVENSKA F-KLASS ÅK RÖDA TRÅDEN SVENSKA F-KLASS ÅK 5 F-KLASS Sambandet mellan ljud och bokstav Språket lyfter A3 läsa Alfabetet och alfabetisk ordning Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen

Läs mer

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret 2014-2015. Lektion 1

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret 2014-2015. Lektion 1 Kattis Lektion 1 I kursen används onlinedomaren Kattis (från http://kattis.com) för att automatiskt rätta programmeringsproblem. För att få ett konto på Kattis anmäler du dig på Programmeringsolympiadens

Läs mer

Anna: Bertil: Cecilia:

Anna: Bertil: Cecilia: Marco Kuhlmann 1 Osäkerhet 1.01 1.02 1.03 1.04 1.05 Intelligenta agenter måste kunna hantera osäkerhet. Världen är endast delvist observerbar och stokastisk. (Jmf. Russell och Norvig, 2014, avsnitt 2.3.2.)

Läs mer

Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen

Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen Man ska vara positiv för att skapa något gott. Ryttare är mycket känslosamma med hänsyn till resultatet. Går ridningen inte bra, faller

Läs mer

INFORMATION. Victor Hugo. Vad är det? Johan H Bendz FMV. Dennes svar. Korrespondens med förläggaren avseende publiceringen av Samhällets olycksbarn

INFORMATION. Victor Hugo. Vad är det? Johan H Bendz FMV. Dennes svar. Korrespondens med förläggaren avseende publiceringen av Samhällets olycksbarn INFORMATION Vad är det? Johan H Bendz FMV Victor Hugo? Dennes svar! Korrespondens med förläggaren avseende publiceringen av Samhällets olycksbarn Kunskap utanför huvudet Kunskap utanför huvudet -300.000-40.000-3000

Läs mer

IP-telefoni för nybörjare

IP-telefoni för nybörjare IP-telefoni för nybörjare Erik Morin 1 Det talas mycket om IP och IP-telefoni... 2 Det talas mycket om IP och IP-telefoni... 3 Från ett system till ett annat De flesta användare behöver inte alls bry sig

Läs mer

Språkglädje och Språkleka Tips och Trix i vardagen!

Språkglädje och Språkleka Tips och Trix i vardagen! Språkglädje och Språkleka Tips och Trix i vardagen! Catarina Sjöberg Leg. Logoped Halmstad Ulrika Thorbjörnsson Barnbibliotekarie Halmstad Prata mest med de som pratat minst! Steg för steg putta och locka

Läs mer