NELL - Never-Ending Language Learner
|
|
- Lovisa Håkansson
- för 5 år sedan
- Visningar:
Transkript
1 NELL - Never-Ending Language Learner,
2 Innehåll 1. Inledning Termer Allmänt om NELL-projektet Uppgift Initialisering Hur fungerar NELL? Uppbyggnad Bootstrap learning Coupled Semi-Supervised Learning Beskrivning av subsystemskomponenter CPL (Coupled Pattern Learner): Extraktion av kategoriinstanser- och mönster Extraktion av relationsinstanser- och mönster CSEAL (Coupled SEAL): CMC (Coupled Morphological Classifier): RL (Rule Learner): Avslutning Referenser
3 1. Inledning De senaste årens kraftiga teknologiska utveckling har haft stor betydelse för människors vardagsliv. Sedan internetrevolutionen under nittiotalet har mängden information som går att finna på internet växt med en svindlande hastighet och numera kan man hitta svaret på det mesta på mindre än en minut. Internet har blivit en gigantisk kunskapsbas Never-Ending Language Learner (NELL) är ett system som initierades i januari 2010 av ett forskningsteam på Carnegie Mellon University. Systemet har till uppgift att få sin egen kunskapsbas att växa genom att lära sig läsa. Dygnet runt extraherar NELL information från internet som läggs till i den egna kunskapsbasen. Syftet med detta är att skapa en intelligent agent som autonomt skaffar sig nya kunskaper. 3
4 2. Termer För att till fullo kunna tillgodogöra sig detta arbete bör läsaren vara införstådd i vissa begrepp som är ofta förekommande. NELL använder sig av två olika typer av kunskap; kategorier och relationer[1]. Kategorier är nominalfraser, så som city, company och sportsteam och dessa tilldelas i sin tur relationer, exempelvis hasofficesin(company, city), teamplaysincity(sportsteam, city)[2]. I detta arbete kommer samlingsnamnet predikat att användas där syftningen gäller både kategorier och relationer och de nominalfraser som utgör predikaten (t.ex. Pittsburgh för kategorin city) kommer att benämnas instanser. 3. Allmänt om NELL-projektet 3.1 Uppgift Att mata in information i en kunskapsbas kan tyckas vara en simpel uppgift som inte har någonting med artificiell intelligens att göra. Det unika med NELL är att det inte handlar om enkel informationsinmatning utan systemet skall vid varje upprepning utföra två uppgifter: 1. Extrahera information från internet och lägga till sin egen kunskapsbas. 2. Utveckla färdigheten att läsa så systemet gör det bättre än dagen innan, dvs. den ska kunna gå tillbaka till samma kunskapskälla och kunna utvinna mer information än vad den gjorde dagen innan. Detta innebär i praktiken att systemet på egen hand skall kunna dra paralleller mellan olika delar av den inlästa informationen och sedan använda sig av denna kunskap för att vid varje iteration lära sig att utföra denna procedur på ett mer bättre och mer effektivt sätt[1]. 3.2 Initialisering Vid uppstarten av NELL i januari 2010 fick systemet indata bestående en relativt liten ontologi som definierade cirka 500 kategorier och relationer, några exempel för varje predikat i ontologin samt 500 miljoner internetsidor. 4
5 4. Hur fungerar NELL? 4.1 Uppbyggnad NELL är uppbyggt av separata subsystemskomponenter som samarbetar i arbetet att extrahera information från internet. Genom att subsystemskomponenterna är oberoende av varandra minimeras de korrelerade felen och systemet blir mer pålitligt[1]. Komponenterna läser systematiskt igenom internet efter nominalfraser, extraherar dem och sätter ihop en statistisk profil av i vilka sammanhang nominalfraserna går att finna. Genom att se till kontexten har systemet lärt sig att känna igen vilka sammanhang som definierar olika instanser av predikat och kan använda dessa mönster i syfte att generera nya instanser. En mer utförlig fördjupning av samtliga subsystemskomponenter och deras exakta funktioner går att läsa om i avsnitt 5. Figur 1: En schematisk representation av NELL:s uppbyggnad. Den information som NELL tillgodogör sig läggs till den egna kunskapsbasen, där det finns information av två typer; candidate facts, som är det som NELL inte riktigt är säker på är sanna och beliefs, vilket är information med hög sannolikhet. Då det läggs till nya instanser i kunskapsbasen konsulteras externa källor, exempelvis internet, och varje ny information tilldelas ett sannolikhetsvärde. Om Knowledge Integrator anser att informationen är tillräckligt sannolik upphöjs candidate facts till belief-status. 5
6 NELL körs i en iterativ loop, vilket innebär att mängden beliefs i kunskapsbasen växer för varje upprepning och dessa, tillsammans med viss kunskap om candidate facts, kan sedan användas av subsystemskomponenterna i syfte att utveckla förmågan att läsa till nästa iteration. I syfte att korrigera eventuella missuppfattningar får NELL ibland interagera en kortare stund med medlemmar ur forskargruppen som kan ge upplysningar om direkt felaktig information[1]. 4.2 Bootstrap learning Denna typ av lärande då man utgår från en liten andel märkt data och använder denna för att kunna göra någonting med en mycket större andel omärkt data kallas bootstrap learning[4]. Om NELL utgår från ett antal exempelstäder (Stockholm, Linköping, Örebro) och den kontext de förekommer i (live in..., mayor of... osv.) i syfte att hitta ytterligare städer kommer det dyka upp exempel som förorenar systemet. Detta illustreras i exemplet nedan: Iteration 1 Iteration 2 Iteration3 Stockholm Norrköping Linköping London Örebro Förnekelse leva i arg1 Här blir det tydligt vad som är problemet med denna typ av lärandemetod. Det språk som människan använder i dagligt tal är långt mer komplicerat än en maskin kan hantera. På grund av det naturliga språkets olika nivåer, med element som bildspråk och flertydigheter, kan man exempelvis både leva i Örebro och leva i förnekelse. Ordet förnekelse kommer NELL att finna i andra kontexter vilket leder till att det i nästa iteration kommer genereras fler exempel som bygger på det felaktiga ordet. Det kan tyckas vara ett litet problem med ett enda misstag i de nygenererade orden men faktum är att det sedan sker en explosionsartad ökning av felaktiga instanser och efter bara ett fåtal iterationer kommer det inte finnas en enda instans av kategorin stad bland de nya orden. Detta kallas semantic drift och är ett stort problem inom maskininlärning. Att tillämpa bootstrap learning innebär problem då det är, som exemplet 6
7 ovan visar, opålitligt. Det är för svårt för systemet att fånga ett helt koncept då den endast blivit tilldelad en handfull exempelord. Lösningen till detta finner man i en något mer utvecklad och komplex metod, kallad Coupled Semi-Supervised Learning[4]. 4.3 Coupled Semi-Supervised Learning Med den enkla bootstrap learning-metoden görs enkla kopplingar mellan nominalfraserna: exempelvis person nominalfras samt atlet nominalfras. Med denna metod får nominalfraserna inte några inbördes kopplingar utan är simpla och enkelriktade. Genom att se till att systemet lär sig att koppla ihop de olika kategorierna i ett nätverk och lära den relationer mellan dessa är det möjligt att skapa ett mer pålitligt lärandesystem som till viss del undviker de problem som uppstår i samband med bootstrap learning. Det som tillkommer i Coupled Semi-Supervised Learning är i praktiken ett antal restriktioner. Att sätta regler som systemet måste följa resulterar i en stor begränsning i lärandeprocessen vilket ger en högre grad av tillförlitlighet[5]. Det ger visserligen ett något mer komplext system (jfr. Figur 2(A) och figur 2(B)) men fördelarna överväger eftersom andelen felaktigheter reduceras[3][4]. Ett exempel på restriktioner är de som man tillämpar på de predikat som är ömsesidigt uteslutande (mutually exclusive), det vill säga predikat som inte tar samma indata x. Person och sport är exempel på detta eftersom en nominalfras för en person aldrig kan vara samma som samma nominalfras för sport Genom att mata in en lista på predikat som är ömsesidigt uteslutande visar man systemet vilka kopplingar som är omöjliga och inte alls behövs bearbetas. Detta illustreras i figur 2(B) där de röda linjerna representerar de predikat som är ömsesidigt uteslutande. De predikat som inte är ömsesidigt uteslutande markeras också i systemet, som exempelvis lag och stad. Det kan finnas ett sportlag som tar samma nominalfras som en stad ( Örebro slog Norrköping borta med 3-2 ) och på detta vis kan NELL undvika att restriktionerna blir för starka och begränsar allt för många kategorier[3]. 7
8 Figur 2: Visar tydligt att Coupled Semi-Supervised Learning (B) har högre tillförlitlighet jämför med vanligt halvövervakat lärande (A). På samma sätt används de predikat som inte är ömsesidigt uteslutande, som i exemplet med sportlag och städer. Ett annat exempel på restriktioner som NELL tillämpar är då nödvändiga kopplingar sätts ut mellan predikaten. För de flesta är det självklart att en idrottsman automatiskt är en person men för ett system utan dessa nödvändiga kopplingar skulle de två instanserna inte ha någon inbördes förbindelse utan stå oberoende av varandra. Restriktioner i lärandeprocessen leder alltså till att felaktigheterna i de nygenererade orden minimeras, även om det inte går att säga att det blir felfritt. 5. Beskrivning av subsystemskomponenter 5.1 CPL (Coupled Pattern Learner): CPL är en textextraktor som extraherar instanser av både relationer och kategorier genom att se till sammanhanget i texten. Komponenten använder sig av statistiskt underlag för att lära sig extraktionsmönster för predikat och kan sedan använda sig av dessa samma mönster i följande iteration i syfte att finna ytterligare instanser för varje predikat[1][3]. 8
9 5.1.1 Extraktion av kategoriinstanser- och mönster För att finna instanser av kategorier söker CPL efter vad som sannolikt är nominalfraser. Detta görs genom att komponenten ser till antalet kategorimönster som instansen uppkommer tillsammans med för att de kandidatinstanser som finns tillsammans med flest kategorimönster skall rankas högst. Detta sker enligt formeln: Där I står för uppsättningen instanser som blivit upphöjda till belief-status för predikatet som analyseras, count (i,p) är hur många gånger instansen i uppkommer tillsammans med instansmönstret p och count(p) är antalet gånger mönstret p går att finna i texten.[3] När en kategori med tillräckligt högt sannolikthetsvärde har hittats använder CPL sammanhanget där instansen hittades och väljer ut vilka ord som skall ingå i kategorimönstret beroende på den grammatiska strukturen. Detta innebär att CPL extraherar de ord som kommer innan instansen om det rör sig om verb, adjektiv eller substantiv som följs av en sekvens av adjektiv, prepositioner, determinerare. Om det istället är verb som följs av en nominalfras eller en preposition så extraheras de ord som kommer efter kategoriinstansen. Detta tillvägagångssätt gör att CPL får semantiskt korrekta kategorimönster som går att implementera på andra instanser Extraktion av relationsinstanser- och mönster När ett kategorimönster bedöms vara tillräckligt sannolikt extraherar CPL det som den tror är en möjlig relationsinstans. Den ser detta som sannolikt om båda argumenten är nominalfraser (exempelvis arg1 lives in arg2 ) och om CPL anser att de i övrigt verkar passa in i kategorin som de kandiderar för. Kandidatinstanserna rangordnas enligt samma formel som för kategorier. Om två argument från en relationsinstans hittas i en mening extraheras de ord som ligger i mellan och ses som ett möjligt relationsmönster. För att den ska ses som sannolik analyserar CPL sekvensen för att se att den inte innehåller fler än fem ord, har ett innehållsord samt innehåller ett ord skrivet med gemener[3]. 9
10 5.2 CSEAL (Coupled SEAL): En extraktor som tar en uppsättning beliefs från varje kategori eller relation och tillfrågar internet. CSEAL utgår från ett fåtal exempelinstanser och undersöker dessa gentemot den egna kunskapsbasen. De candidate facts som CSEAL lyckas extraheras tilldelas ett sannolikhetsvärde på liknande sätt som i CPL[1]. CSEAL är egentligen en förbättrad version av SEAL, en redan existerande extraktionsalgoritm specialiserad på att anpassa extraktionsmetoden efter hemsidan. Den använder sig av wrappers som inte är beroende av mänskligt språk utan kan finna den information som eftersöks i webbaserat språk. Den ursprungliga algoritmen hade exempelvis ingen funktion som tog fram och utnyttjade ömsesidigt uteslutande predikat vilket har lagts till i CSEAL (därav Coupled SEAL )[3]. 5.3 CMC (Coupled Morphological Classifier): CMC ser till orden som ingår och flertalet morfologiska särdrag så som användande av versaler eller affix i syfte att klassificera nominalfraser. CMC utreder candidate facts som tas fram av de andra komponenterna och skapar av dessa upp till 30 nya beliefs per predikat vid varje omkörning. CMC använder sig av ömsesidigt uteslutande predikat på liknande sätt som CSEAL men är även begränsad på så sätt att komponenten vid varje iteration använder sig av predikat som har minst 100 instanser upphöjda till belief-status. 5.4 RL (Rule Learner): En algoritm som lär sig probabilistiska regler som sedan tillämpas på relationsinstanser i kunskapsbasen i syfte att generera nya instanser[1]. 10
11 6. Avslutning I dagsläget (september 2011) har NELL samlat ihop 838,890 instanser av 636 olika kategorier och relationer och antalet ökar hela tiden. Jag tycker att det är ett väldigt fascinerande projekt eftersom det inte bara är en enorm databas som byggs upp, utan det som gör NELL så speciellt är att det är ett system som autonomt finner mening i språket, ett område som tidigare har varit maskinernas akilleshäl. Kan man utveckla system som kan hantera och i viss mening förstå naturligt språk kan man tänka sig en rad möjliga tillämpningsområden från mer effektiva sökmotorer till virtuella agenter som kan interagera på ett mänskligt sätt och på så sätt assistera människan i vardagen. Det är enkelt att följa NELL-projektets framsteg på dess hemsida ( och där är det även möjligt att bläddra i kunskapsbasen och se vad NELL har lärt sig nyligen. 11
12 7. Referenser [1] A. Carlson, J. Betteridge, et al., Toward an Architecture for Never-Ending Language Learning, Proceedings of the Twenty-Fourth Conference on Artificial Intelligence (2010) [2] T.P. Mohamed, E.R. Hruschka Jr. & T.M. Mitchell Discovering Relations between Noun Categories Proceedings of the Conference on Empirical Methods in Natural Language Processing (2011) [3] A. Carlson, J. Betteridge, et al., Coupled Semi-Supervised Learning for Information Extraction Proceedings of the ACM International Conference on Web Search and Data Mining (2010) [4] A. Carlson, J. Betteridge, et al., Coupled Semi-Supervised Learning of Categories and Relations Proceedings of the NAACL HLT Workshop on Semi-supervised Learning for Natural Language Processing (2009). [5] A. Carlson, Coupled Semi-Supervised Learning (2010) Hämtad
Stina Nyman 2012-09-16
LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
de var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Tentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Personifierad Netflix
Linköpings universitet Personifierad Netflix Lisa Rönnqvist 2016-08-24 Sammanfattning INNEHÅLLSFÖRTECKNING 1. Inledning... 1 1.1 Bakgrund... 1 1.2 Syfte... 2 2. Netflix... Fel! Bokmärket är inte definierat.
KONSTEN ATT FÖRSTÅ EN LEDTRÅD
KONSTEN ATT FÖRSTÅ EN LEDTRÅD Hur IBM Watson analyserar och förstår frågor i Jeopardy! DEN 10 JANUARI 2014 FRIDA ENGSLÄTT 729G43 Sammanfattning Den här rapporten beskriver hur IBM Watson, en intelligent
Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan.
Workshop Portaler och länkbibliotek Resurserna på Internet är om inte oändliga så åtminstone väldigt många. Att välja blir då ett bekymmer i sig. Portaler och länkbibliotek specialiserar sig på att samla
Statistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson
Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som
Språkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Ontologier. Cassandra Svensson 2014-01-09
Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt
The microtheories and language of CYC KB. Anna Svedberg Artificiell Intelligens II Linköpings Universitet Ht 2010 (Kompletterad ht 2012)
The microtheories and language of CYC KB 890919 Artificiell Intelligens II Linköpings Universitet Ht 2010 (Kompletterad ht 2012) Innehållsförteckning 1 Inledning... 1 2 Uppbyggnad av CYC... 2 2.1 Kunskapsbasen...
Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Ansiktsigenkänning. Anna Ericsson Linköpings Universitet Linköping
Ansiktsigenkänning Anna Ericsson Linköpings Universitet Linköping 2011-09-18 Innehållsförteckning Sammanfattning... 1 Introduktion... 2 Ansiktsigenkänning med Eigenfaces... 3 Eigenfaces steg för steg...
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Linköpings universitet
2016-08-24 Vad är kognition? tt ta in, lagra och bearbeta information: Kognitionsvetenskaplig introduktionskurs Perception Information tas in och flödar genom begränsade informationskanaler Föreläsning
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Statistisk Maskinöversättning eller:
729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...
Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse
Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar
Business research methods, Bryman & Bell 2007
Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data
0. Meta-etik Grunderna
Vad är meta-etik? Vilka typer av frågor försöker man besvara inom metaetiken? 1. Semantiska. T. ex.: Vad betyder moraliska utsagor? 2. Metafysiska/ontologiska. T. ex.: Finns det moraliska fakta? 3. Kunskapsteoretiska.
Cristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4
Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa
Imperativ programmering. Föreläsning 4
Imperativ programmering 1DL126 3p Föreläsning 4 Imperativa paradigmer Ostrukturerad programmering Strukturerad programmering Procedurell programmering Objektorienterad programmering Klassbaserad programmering
Linköpings universitet
2014-09-08 Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 5 Integrationsutmaningen Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga
Grammatisk teori III Praktisk analys
Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas
Vad behövs för att skapa en tillståndsrymd?
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Artificiell Intelligens den nya superkraften
Artificiell Intelligens den nya superkraften Socialchefsdagarna, 4 oktober 2018 #CGINext Artificiell Intelligens Förmågan hos mjukvara att agera självständigt på ett intelligent sätt tidigare bara associerat
Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium. v. 2.0, den 29/ III. Metalogik 17-19
Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium IV v. 2.0, den 29/4 2013 III. Metalogik 17-19 Modeller för satslogiken 18.1 Vi har tidigare sagt att en modell är en tolkning av en teori
Bevis för ett modulärt perspektiv: (tidiga studier av) afasi.
UPPSALA UNIVERSITET Institutionen för lingvistik och filologi SPRIND, HT 2006, Tillfälle 6 SPRÅKPSYKOLOGI SPRÅKPSYKOLOGISKA GRUNDBEGREPP (kap 1 + 2) I språkpsykologin finner man begrepp från - språkvetenskap
Grim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Vad säger WCAG om kognition?
Vad säger WCAG om kognition? Stefan Johansson och Anita Hildén stefan.johansson@funkanu.se leknyttan@gmail.com Så här säger W3C-konsortiet: Web Content Accessibility Guidelines (WCAG) 2.0 innehåller ett
Vindkraft och ML. - hur kan vindkraft dra nytta avml
Vindkraft och ML - hur kan vindkraft dra nytta avml AI och ML Intelligens: förmågan att utnyttja kunskap för att bättre lösa en klass av uppgifter Lärande: förmågan att förbättra sin förmåga att lösa uppgifterna
HKGBB0, Artificiell intelligens
HKGBB0, Artificiell intelligens Kortfattade lösningsförslag till tentan 3 november 2005 Arne Jönsson 1. Vad karaktäriserar dagens AI-forskning jämfört med den AI-forskning som bedrevs perioden 1960-1985.
Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord
Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord
Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
tidskrift för politisk filosofi nr 1 2012 årgång 16
tidskrift för politisk filosofi nr 1 2012 årgång 16 Bokförlaget thales recension daniel j. solove: Nothing to Hide: The False Tradeoff between Privacy and Security, New Haven: Yale University Press 2011.
Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Algoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 10 Anton Grensjö grensjo@csc.kth.se 9 november 2017 1 Idag En konstruktionsreduktion Fler bevis av NP-fullständighet 2 Teori Repetition Ett problem tillhör
7. Konstruera Koncept
7. Konstruera Koncept 7.1 Systemarkitektur För att bestämma delar i konstruktionen som kommer att utvecklas in-house eller externt skapas nedan funktionsmodeller och ett träddiagram för att se över alla
Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1
Lexikal semantik Lingvistik 1 Uppsala universitet 1 Nyckelord idag Semantiska egenskaper Komponentanalys Prototypteori Relationer mellan ord Kognitiv lexikal semantik Uppsala universitet 2 Semantiska egenskaper
1. En oreglerad marknad involverar frihet. 2. Frihet är ett fundamentalt värde. 3. Därav att en fri marknad är moraliskt nödvändigt 1
Linköpings Universitet Gabriella Degerfält Hygrell Politisk Teori 2 930427-7982 733G36 Frihet är ett stort och komplext begrepp. Vad är frihet? Hur förenligt är libertarianismens frihetsdefinition med
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom
Tommy Färnqvist, IDA, Linköpings universitet
Föreläsning 8 Sortering och urval TDDC70/91: DALG Utskriftsversion av föreläsning i Datastrukturer och algoritmer 1 oktober 2013 Tommy Färnqvist, IDA, Linköpings universitet 8.1 Innehåll Innehåll 1 Sortering
7. Moralisk relativism
Fisher skiljer på två huvudsakliga former av relativism: 1. Agentrelativism: vad en agent bör göra bestäms av den agentens existerande motivation. 2. Talarrelativism (också känd som subjektivism): när
Introduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information
ARTIFICIELL INTELLIGENS II INSTITUTUINEN FÖR DATAVETENSKAP LINKÖPINGS UNIVERSITET Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information Anna
Övningshäfte 2: Induktion och rekursion
GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2017 INLEDANDE ALGEBRA Övningshäfte 2: Induktion och rekursion Övning D Syftet är att öva förmågan att utgående från enkla samband, aritmetiska och geometriska,
Algoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 10 Anton Grensjö grensjo@csc.kth.se 18 november 2015 Anton Grensjö ADK Övning 10 18 november 2015 1 / 20 Översikt Kursplanering Ö9: NP-fullständighetsbevis
Linköpings universitet 1
Vad är kognitionsvetenskap? Kognitionsvetenskaplig introduktionskurs Föreläsning 7 Tvärvetenskap Delvetenskaper, metoder Integrationsutmaningen Kognitionsvetenskap är ett tvärvetenskapligt kunskaps- och
Lingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Digitalitet. Kontinuerlig. Direkt proportionerlig mot källan. Ex. sprittermometer. Elektrisk signal som representerar ljud.
Analog Digitalitet Kontinuerlig Direkt proportionerlig mot källan Ex. sprittermometer Elektrisk signal som representerar ljud Diskret Digital Representation som siffror/symboler Ex. CD-skiva Varje siffra
JAVAUTVECKLING LEKTION 4
JAVAUTVECKLING LEKTION 4 2016 Mahmud Al Hakim mahmud.al.hakim@nackademin.se www.alhakim.se AGENDA Iterationer (loopar) Algoritmer Mer om felsökning 1 WHILE-SATSEN String s = JOptionPane.showInputDialog("Talet
b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
Symboler och abstrakta system
Symboler och abstrakta system Warwick Tucker Matematiska institutionen Uppsala universitet warwick@math.uu.se Warwick Tucker, Matematiska institutionen, Uppsala universitet 1 Vad är ett komplext system?
Dependensregler - Lathund
Dependensregler - Lathund INTRODUKTION I textprogrammet TeCST är det möjligt för en skribent att skriva, redigera och klistra in text för att få ut läsbarhetsmått och få förslag på hur texten kan skrivas
3. Instruktioner för att genomföra provet
INSTRUKTIONER FÖR ATT GENOMFÖRA PROVET 3. Instruktioner för att genomföra provet I det här kapitlet beskrivs hur samtliga delprov som ingår i provet ska genomföras. Genomförande av Delprov A Tabell 2 Praktisk
Inlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Grafisk visualisering av en spårbarhetslösning
Datavetenskap Opponenter Johan Kärnell och Linnea Hjalmarsson Respondenter Agni Rizk och Tobias Eriksson Grafisk visualisering av en spårbarhetslösning Oppositionsrapport, C-nivå Report 2011:06 1. Generell
Kognitionsvetenskap C, HT-04 Mental Rotation
Umeå Universitet 041025 Kognitionsvetenskap C, HT-04 Mental Rotation Grupp 3: Christina Grahn, dit01cgn@cs.umu.se Dan Kindeborg, di01dkg@cs.umu.se David Linder, c01dlr@cs.umu.se Frida Bergman, dit01fbn@cs.umu.se
Kapitel 1. Slutligen vänder sig Scanlon till metafysiska och kunskapsteoretiska frågor.
Kapitel 1 Slutligen vänder sig Scanlon till metafysiska och kunskapsteoretiska frågor. Till att börja med förnekar han att skälomdömen kan reduceras till påståenden om den naturliga världen (d.v.s. naturalism).
Designmönster, introduktion. Vad är det? Varför skall man använda mönster?
Designmönster, introduktion. Vad är det? Varför skall man använda mönster? Kent Petersson EMW, Mölndal Datavetenskap, Chalmers epost1: kentp@cs.chalmers.se epost2: kent.petersson@emw.ericsson.se URL: http://www.cs.chalmers.se/~kentp
Automatisk textsammanfattning
Språkteknologi 2001-10-14 Nada Kungliga Tekniska högskolan Automatisk textsammanfattning Per Karefelt (d98-pka) Marcus Hjelm (d98-mhj) Sammanfattning (manuell) Denna rapport belyser en del av de problem
2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.
2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen
Objektorienterad programmering Föreläsning 8. Copyright Mahmud Al Hakim Agenda (halvdag)
Objektorienterad programmering Föreläsning 8 Copyright Mahmud Al Hakim mahmud@webacademy.se www.webacademy.se Agenda (halvdag) Objektorienterad programutveckling Algoritmer Algoritmkonstruktionerna Relationer
Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en
o m e r f a r e n h e t o c h s p r å k Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en skapelseakt där
Ansiktsigenkänning med MATLAB
Ansiktsigenkänning med MATLAB Avancerad bildbehandling Christoffer Dahl, Johannes Dahlgren, Semone Kallin Clarke, Michaela Ulvhammar 12/2/2012 Sammanfattning Uppgiften som gavs var att skapa ett system
Arkitektur och Regelverk Definition av kodverk och klassifikation. Version 1.0
Arkitektur och Regelverk Definition av kodverk och klassifikation Version 1.0 Innehållsförteckning 1. Inledning... 3 2. Definitioner... 3 Referenser och underlag... 5 Revisionshistorik Version, datum Författare
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Övergripande planering
Övergripande planering Ämne: Svenska Årskurs: 7 Ansvarig lärare: Marie Nilsson Torbjörn Wahlén Resurs: Reviderad: Bilaga 1. Kursplan för ämnet Bilaga 2. Kunskapskrav Bilaga 3. Planering för året Bilaga
Objektorienterad programmering
Objektorienterad programmering Emil Ahlqvist (c10eat@cs.umu.se) Didrik Püschel (dv11dpl@cs.umu.se) Johan Hammarström (c08jhm@cs.umu.se) Hannes Frimmel Moström (c10hml@cs.umu.se) 1 1. Introduktion 1.1 Objektorienterad
Snabbguide. Kalendersynkronisering
Snabbguide Kalendersynkronisering Snabbguide Kalendersynkronisering Allmänt Kalendersynkronisering är en webbaserad applikation som automatiskt synkroniserar kalendern i Microsoft Exchange med växelns
Datorrepresentation av vårdriktlinjer
Datorrepresentation av vårdriktlinjer Innehåll Introduktion/bakgrund Behov Uppdateringsproblem Metoder PROforma Asgaard/Arbru Arden Praktiska implementeringar Hypertoni-behandling Guidelines/vårdriktlinjer
Grundläggande begrepp inom lexikal semantik. Hanna Seppälä Uppsala universitet 1
Grundläggande begrepp inom lexikal semantik Föreläsning 2 Uppsala universitet 1 Teman idag Semiotik Lexikal semantik kompositionell semantik Teorier om hur man kan beskriva betydelse Språklig relativism
Föreläsning 6: Analys och tolkning från insamling till insikt
Föreläsning 6: Analys och tolkning från insamling till insikt FSR: 1, 5, 6, 7 Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera
Att referera till objekt
Att referera till objekt En algoritm för generering av refererande uttryck 729G43: Artificiell intelligens Examinator: Arne Jönsson 2 Innehållsförteckning 1. Inledning... 4 1.1 Bakgrund... 4 1.2 Syfte...
MASTER. Mining and selecting texts for easy reading. Katarina Mühlenbock
Mining and selecting texts for easy reading Katarina Mühlenbock DART, Drottning Silvias barn- och ungdomssjukhus, SU Institutionen för svenska språket, GU Mining and selecting texts for easy reading (Användaranpassad
Vinjetter TDDC91 Datastrukturer och algoritmer
Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.
AI utmaningar inom kvalitetssäkring. Henrik Emilsson Teststrateg, Nordic Medtest AB
AI utmaningar inom kvalitetssäkring Henrik Emilsson Teststrateg, Nordic Medtest AB Först lite om Artificiell intelligens General AI vs. Narrow AI Maskininlärning Supervised Learning Unsupervised Learning
Nonogram
Nonogram. Vad är nonogram? Nonogram är små enkla men fascinerande pyssel som ursprungligen kommer från Japan. De har också givits ut i söndagsbilagan i engelska dagstidningar under flera år. Idén bakom
Web Crawlers. TDTS09, Datornät och internetprotokoll. Denis Golubovic Fredrik Salin Linköpings universitet Linköping 2011-02-23
Web Crawlers TDTS09, Datornät och internetprotokoll Denis Golubovic Fredrik Salin Linköpings universitet Linköping 2011-02-23 Omslagsbild: Spider robot Google 3d model Källa: turbosquid.com Sammanfattning
Kommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
STRÄNGAR DATATYPEN. Om du vill baka in variabler eller escape-tecken måste du använda dubbla citattecken. strängar
STRÄNGAR En av de mest avancerade av de normala datatyperna är. Här skall vi grundläggande gå igenom hur den datatypen fungerar och vidare flertalet funktioner som hör till datatypen. Låt oss kasta oss
Kunskapskraven i modersmål - kommentarmaterial
Kunskapskraven i modersmål - kommentarmaterial Västerås 20131030 Gunnar Stenberg Stödmaterial Skollag Skolformsförordningar Läroplan Allmänna råd Kommentarmaterial Syfte ge lärare stöd i hur de kan resonera
AI, musik & PLCGalgoritmen
LINKOPINGS UNIVERSITET, IDA AI, musik & PLCGalgoritmen AI inom en artistisk domän sarwi387 9/18/2012 ABSTRAKT AI har anpassats på de flesta naturvetenskapliga ämnen tidigare men man har de senaste årtionden
Vad är mönsterspråk?
Vad är mönsterspråk? Språk består av meningsbärande byggstenar på olika nivåer. Texter Meningar Ord Orden har vi en överenskommen betydelse för. Men den kan vara väldigt tvetydig och mångtydig. Orden är
Neurolingvistik - Grammatik
Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -
PROGRAMMERING. Ämnets syfte. Kurser i ämnet
PROGRAMMERING Ämnet programmering behandlar programmeringens roll i informationstekniska sammanhang som datorsimulering, animerad grafik, praktisk datoriserad problemlösning och användaranpassad konfiguration
Utbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå
1. Identifikation Programmets namn Omfattning Nivå Programkod Ev. koder på inriktningar Beslutsuppgifter Ändringsuppgifter Masterprogram i kognitionsvetenskap 120 hp Avancerad nivå HAKOG Fastställd av
Ansökan till Yrkes-sfi i Skåne EN INTRODUKTION TILL PANELEN
2017 Ansökan till Yrkes-sfi i Skåne EN INTRODUKTION TILL PANELEN Innehållsförteckning ANSÖKAN... 2 BEKRÄFTELSE... 3 PANELEN... 4 INLOGGNING... 4 STARTSIDAN... 5 BYTA BEHÖRIGHET ( ROLL )... 5 MIN PROFIL...
Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson
Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...
Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping
Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett
Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad för att man skall
Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står
Algoritmer och maskininlärning
Algoritmer och maskininlärning Olof Mogren Chalmers tekniska högskola 2016 De här företagen vill Tjäna pengar Hitta mönster i stora datamängder Göra förutsägelser Klassificera data Förstå människan Maskininlärning
Grammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
FTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
Framtidens vårdinformationsstöd FVIS 12 OKTOBER 2017
Framtidens vårdinformationsstöd FVIS 12 OKTOBER 2017 Vad är Framtidens Vårdinformationsstöd Framtidens Vårdinformationsstöd (FVIS) är en sammanhållen digital vårdmiljö som ska innehålla stöd för verksamhetens