729G17 Språkteknologi / Introduktion. Marco Kuhlmann Institutionen för datavetenskap
|
|
- Amanda Isaksson
- för 7 år sedan
- Visningar:
Transkript
1 729G17 Språkteknologi / 2016 Introduktion Marco Kuhlmann Institutionen för datavetenskap
2 Vad är språkteknologi?
3 Vad är språkteknologi? Språkteknologi är all teknologi som skapas för att förstå eller generera naturligt språk. Språkteknologi är ett tvärvetenskapligt forskningsområde med inslag av datalogi, lingvistik och kognitionsvetenskap. annat namn: datorlingvistik; engelska: natural language processing
4 We are drowning in information but starved for knowledge. John Naisbitt (1982)
5 Biljontals sidor på nätet Källa: statisticbrain.com
6 Kunskapsglappet ostrukterade data (text) analytiker språkteknologi (textanalys) strukturerade data (kunskapsdatabas) analytiker
7 Informationsutvinning Three bombs have exploded in north-eastern Nigeria, killing 25 people and wounding 12 in an attack carried out by an Islamic sect. Authorities said the bombs exploded on Sunday afternoon in the city of Maiduguri. Attribut Värde Type Crisis Subtype Bombing Location Maiduguri Dead-Count 25 Injured-Count 12 Perpetrator Islamic sect Time
8 Kommersiellt intresse Källa: ACL 2015
9 Två utmaningar: Flertydighet och kontextualitet Flertydighet Ett och samma språkliga yttrande kan betyda flera olika saker. Time flies like an arrow. Fruit flies like a banana. Kontextualitet Ett språkligt yttrande kan endast tolkas i ett sammanhang. A: Kommer du ikväll? B: Jag har träning.
10 Flertydighet orsakar kombinatorisk explosion jag bad om en kort bit PN VB PP DT JJ NN NN NN SN PN AB VB PL RG NN AB NN
11 Ytterligare en utmaning: Många olika språk Källa: Har jag glömt bort
12 Vad jag forskar på Teoretisk datalogi Hur kan vi utveckla effektiva algoritmer för att tolka text? Maskininlärning Hur kan våra algoritmer lära sig från stora datamängder? Kunskapsingenjörskonst Hur kan vi relatera våra tolkningar till existerande ontologier?
13 Kursens innehåll och uppläggning
14 Lärandemål Efter avslutad kurs ska du kunna: redogöra för grundläggande metoder och tekniker för automatisk analys och tolkning av ord och meningar; föreläsningar, kurslitteratur redogöra för delproblem och standardlösningar i samband med automatisk textförståelse; föreläsningar, kurslitteratur
15 Lärandemål Efter avslutad kurs ska du kunna: tillämpa reguljära uttryck, formell grammatik och statistiska metoder för analys av ord och meningar i löpande text; laborationer utvärdera algoritmer och system med avseende på korrekthet, precision och recall; föreläsningar, kurslitteratur, laborationer
16 Lärandemål Efter avslutad kurs ska du kunna: redogöra för de vanligaste arkitekturerna i språkteknologiska tillämpningssystem; föreläsningar, kurslitteratur, projektarbete värdera svårighetsgrad och görbarhet av olika språkteknologiska tillämpningar. projektarbete
17 Schemalagd undervisning Föreläsningar (22 h) Marco Kuhlmann Laborationer (20 h) Sarah Albertsson, Per Fallgren, Robin Kurtz, Marcus Liw Projektredovisningar (4 h) Sarah Albertsson, Per Fallgren, Marco Kuhlmann, Robin Kurtz, Marcus Liw
18 måndag måndag 15 17, tisdag 8 10 fredag v 3 F01 Introduktion TDDD01 L0 Grundläggande textanalys F02 Maskininlärning v 4 F03 Introduktion 729G17 L1 Textklassificering F04 Textklassificering v 5 F05 Ordpredicering L2 Ordpredicering F06 Ordklasstaggning 1 v 6 F07 Ordklasstaggning 2 L3 Ordklasstaggning F08 Syntaktisk analys 1 v 7 F09 Syntaktisk analys 2 L4 Syntaktisk analys F10 Semantisk analys v 8 F11 Informationsutvinning L5 Semantisk analys F12 Frågebesvarande system v 9 Projekt v 10 SEM Slutkonferens (7/3, 13 17) FRÅG Frågestund inför tentan
19 Kurslitteratur Daniel Jurafsky, James H. Martin. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. International edition of 2nd revised edition. Pearson Education, Utkast av den 3:e upplagan:
20 Kurshemsida
21 Textklassificering
22 Skräppostfiltrering inget ärende dolda mottagare stavfel misstänkta ord många frågetecken obskyra adresser
23 Författaridentifiering Alexander Hamilton James Madison
24 Attitydpredicering The gorgeously elaborate continuation of The Lord of the Rings trilogy is so huge that a column of words cannot adequately describe co-writer/director Peter Jackson s expanded vision of J.R.R. Tolkien s Middle-earth. positiv is a sour little movie at its core; an exploration of the emptiness that underlay the relentless gaiety of the 1920 s, as if to stop would hasten the economic and global political turmoil that was to come. negativ
25 Predicera talarens blocktillhörighet Herr talman! Bostadsministern är kategorisk. Inget samhällsstöd för byggnation av bostäder. Bostaden ska vara en handelsvara, ingen social rättighet. Bostadspolitiken avpolitiseras och rangeras ut från välfärdspolitiken. Men det är ok med RUT, att någon kommer hem och hjälper till med serveringen. 2 miljarder är kostnaden. Det är ok med ROT, reparation och ombyggnad i sommarstugan eller bostadsrätten 13,2 miljarder. Det är ok med sänkt restaurangmoms 5,4 miljarder. Hamburgare och korv kan subventioneras, medan bostadsköerna växer. Det är sorgligt, i sanning mycket sorgligt att bostadsministern har den uppfattningen om vikten av politisk prioritering. Jag vill upprepa för tredje gången: Kan bostadsministern här i kammaren tala om vad han säger till det unga par som har flyttat till Stockholm från arbetslösheten på någon annan plats i landet men inte har någon bostad? Vad säger bostadsministern till det paret?
26 Handskrivna regler Vi kan tilldela ett dokument en klass genom handskrivna regler. om anonyma mottagare och texten innehåller ditt konto kommer att raderas då sortera som skräp Handskrivna regler kan ha hög precision, men att utveckla och att underhålla dem är kostsamt.
27 Klassificering som övervakad inlärning UK China Elections Sports congestion London Olympics Beijing recount votes diamond baseball Parliament Big Ben tourism Great Wall seat run-off forward soccer Windsor The Queen Mao Communist TV-ads campaign team captain first private Chinese airline
28 Utvärdering För att utvärdera en klassificerare kan vi jämföra dess prediktioner med en guldstandard: dokument taggade med korrekt klass. En sådan testmängd har samma form som träningsmängden, men används på ett annat sätt. Klassificeraren ser inte guldstandardklassen. En guldstandard kan vara objektivt eller subjektivt korrekt. riksdagsanföranden vs. spam
29 Utvärderingsmått: Korrekthet Korrekthet (eng. accuracy) mäter andelen av alla dokument i testmängden för vilka systemet har predicerat rätt klass. Korrekthet är ett enkelt och överskådligt mått, men kan ibland vara missvisande. detektering av sällsynta sjukdomar
30 Problem med korrekthetsmåttet Ett system för textklassificering analyserar texter skrivna av patienter på en geriatrimottagning och predicerar om patienterna har eller inte har en ovanlig neurologisk sjukdom. Systemet utvärderas på en testmängd bestående av texter och får 99,9% korrekthet. Hur många av dokumenten skrivna av patienter som faktiskt har sjukdomen har systemet hittat?
31 Korrekthet klassificerare ja klassificerare nej guldstandard ja sanna positiva falska negativa guldstandard nej falska positiva sanna negativa
32 Utvärderingsmått: Precision och täckning Precision och täckning (eng. recall) zoomar in på hur bra systemet är på att identifiera dokument av en specifik klass K. Hur bra är systemet på att detektera sjukdomen? Precision är andelen korrekt klassificerade instanser bland alla dokument som systemet klassificerat tillhöra klass K. Om systemet predicerar sjukdomen, hur ofta har patienten verkligen den? Täckning är andelen korrekt klassificerade instanser bland alla dokument som enligt guldstandarden har klass K. Om patienten har sjukdomen, hur ofta predicerar klassificeraren detta?
33 Precision klassificerare ja klassificerare nej guldstandard ja sanna positiva falska negativa guldstandard nej falska positiva sanna negativa
34 Täckning (recall) klassificerare ja klassificerare nej guldstandard ja sanna positiva falska negativa guldstandard nej falska positiva sanna negativa
35 Precision och täckning guldstandard G K klassificerare precision = G K K täckning = G K G
36 Precision och täckning fn fp guldstandard G sp K klassificerare precision = G K K täckning = G K G
37 Övningsuppgift Ett namnigenkänningssystem utvärderades på en samling testdata innehållande 800 namn. Av dessa bestod 500 av ett ord, 250 av två ord och 50 av tre ord. Tabellen nedan anger systemets resultat. rätt fel ettordsnamn tvåordsnamn treordsnamn Ställ upp bråk för följande: täckning på ettordsnamn precision på tvåordsnamn täckning på alla namn
38 F1-måttet Ett bra system bör balansera precision och täckning. Dessa mått slås därför ofta ihop till ett enda mått som heter F1: F1 = 2 precision täckning precision + täckning (F1 är det harmoniska medelvärdet mellan precision och täckning.)
39 Baseline Absoluta värden för korrekthet, precision och täckning säger egentligen inte särskilt mycket. 80% täckning bra eller dåligt? Istället så bör man fråga efter korrekthet, precision och täckning relativt till en referensmetod, en baseline. En vanlig baseline för klassificering är Most Frequent Class: predicera alltid den mest frekventa dokumentklassen. som den observerats i träningsmängden
40 Sammanfattning Vad är språkteknologi? kunskapsglappet, flertydighet, kombinatorisk explosion, kontextualitet Textklassificering träningsmängd, testmängd, korrekthet, precision, täckning Läsanvisningar: JM kapitel 1 2, 3.1, Textklassificering med Naive Bayes 1 2
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Läs merTDDD02 Språkteknologi för informationssökning (2016) Textklassificering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Textklassificering Marco Kuhlmann Institutionen för datavetenskap Textklassificering Skräppostfiltrering spam ham Författaridentifiering Alexander Hamilton
Läs merSPRÅKTEKNOLOGI. Marco Kuhlmann Institutionen för datavetenskap
SPRÅKTEKNOLOGI Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? all teknologi som hanterar mänskligt språk Exempel: analys, förståelse, produktion ett tvärvetenskapligt
Läs merTDDD02 Språkteknologi för informationssökning / 2015. Textklassificering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Textklassificering Marco Kuhlmann Institutionen för datavetenskap Textklassificering UK China Elections Sports congestion London Olympics Beijing recount
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs mer729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Språk och datorer Korpuslingvistik och
Läs merb) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
Läs merKursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)
729G49 Språk och datorer (2019) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Detta verk är licensierat under en Creative Commons Erkännande 4.0 Internationell Licens. Filosofi Psykologi
Läs mer729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Språk och datorer Korpuslingvistik och
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merTentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merTentamen Del A. Marco Kuhlmann
TDDD01 Språkteknologi (2016) Tentamen 2016-03-16 Marco Kuhlmann Tentamen består två delar, A och B. Varje del omfattar ett antal frågor à 3 poäng. Del A omfattar 8 frågor som kan besvaras kortfattat. Det
Läs merWord- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Läs merPerceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens
Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning
Läs merMatematiska metoder för språkvetare, 7,5 hp
Vårterminen 2017 Kurskod: LIN420 Matematiska metoder för språkvetare, 7,5 hp Kursbeskrivning Version: 19/3 2017 Institutionen för lingvistik, Avdelningen för datorlingvistik Undervisande lärare Kursansvarig
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merSPRÅKTEKNOLOGIPROGRAMMET
SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Mats Dahllöf Institutionen för lingvistik och filologi Augusti 2012 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 1. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 1 Marco Kuhlmann Institutionen för datavetenskap Introduktion Maskininlärning Tack vare maskininlärning kan AI-system idag bl.a. producera och förstå
Läs merINFORMATIONSUTVINNING. MARCO KUHLMANN Linköpings universitet
INFORMATIONSUTVINNING MARCO KUHLMANN Linköpings universitet Informationsutvinning Informationsutvinning är uppgiften att extrahera strukturerad information från textdokument. Engelskt begrepp: Information
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merpoäng i del B Lycka till!
TDDD02 Språkteknologi för informationssökning (2016) Tentamen 2017-01-11 Examinator: Marco Kuhlmann Denna tentamen består av två delar: 1. Del A består av 5 uppgifter som prövar din förståelse av de grundläggande
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merSPRÅKTEKNOLOGIPROGRAMMET
SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi Augusti 2013 (Mats Dahllöf) 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system
Läs merINFORMATIONSUTVINNING. MARCO KUHLMANN Linköpings universitet
INFORMATIONSUTVINNING MARCO KUHLMANN Linköpings universitet Informationsutvinning Informationsutvinning är uppgiften att extrahera strukturerad information från textdokument. Engelskt begrepp: Information
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merMaskininlärning. Regler eller ML?
Maskininlärning Field of study that gives computers the ability to learn without being explicitly programmed (Samuel, 1959) DD2418 Språkteknologi, Johan Boye Regler eller ML? System som bygger på handskrivna
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merBootstrapping för substantivtaggning
Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson j0j0@kth.se Mikael Melin mime@kth.se Handledare: Jonas
Läs merMarco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014
Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap
ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full
Läs merHUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng
Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är
Läs merDatamodeller och databaser, avancerad kurs
1(6) Datamodeller och databaser, avancerad kurs Programkurs 6 hp Advanced Data Models and Databases TDDD43 Gäller från: Fastställd av Programnämnden för data- och medieteknik, DM Fastställandedatum LINKÖPINGS
Läs merTDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merCristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Läs merFör universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.
HUMANISTISKA FAKULTETEN Dnr: U 2016/417 Allmän studieplan för licentiatexamen i Datalingvistik Studieplanen är fastställd av Humanistiska fakultetsstyrelsen vid Göteborgs universitet den 30 mars 2017.
Läs merProgrammering, grundkurs
DNR LIU-2018-02499 1(5) Programmering, grundkurs Programkurs 8 hp Introduction to Computer Programming TDDE44 Gäller från: 2019 VT Fastställd av Programnämnden för elektroteknik, fysik och matematik, EF
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs merTDDD02 Språkteknologi för informationssökning (2016) Semantisk analys. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys Marco Kuhlmann Institutionen för datavetenskap Semantik pragmatik semantik analys generering syntax morfologi Denna föreläsning ordbetydelsebestämning
Läs merEngelska GR (B), 30 hp
1 (5) Kursplan för: Engelska GR (B), 30 hp English BA (B), 30 Credits Allmänna data om kursen Kurskod Ämne/huvudområde Nivå Progression EN006G Engelska Grundnivå (B) Inriktning (namn) Högskolepoäng 30.0
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merEngelska GR (B), Ämneslärarutbildning för gymnasieskolan, 30 hp
1 (5) Kursplan för: Engelska GR (B), Ämneslärarutbildning för gymnasieskolan, 30 hp English BA (B), Upper Secondary Level Teacher Education, 30 credits Allmänna data om kursen Kurskod Ämne/huvudområde
Läs merKognition TEK210 (4,5 hp)
Kognition TEK210 (4,5 hp) Idag Kort introduktion till kurs och kursmål Praktisk information om hur kursen är upplagd Frågor Registrering skriv upp dig på listan! Användbarhet https://www.youtube.com/watch?
Läs merKursinformation och schema Lingvistik 729G08 (6 hp)
LINKÖPINGS UNIVERSITET Institutionen för kultur och kommunikation Kognitionsvetenskapliga kandidatprogrammet V1 Kursinformation och schema Lingvistik 729G08 (6 hp) HT 2016 Lärare och examinatorer: Mathias
Läs merTMV166/186 Linjär Algebra M/TD 2009/2010
TMV166/186 Linjär Algebra M/TD 2009/2010 Examinator och föreläsare Carl-Henrik Fant E-post: carl-henrik.fant@chalmers.se Tel: 772 3557, kontor: Matematik L 3037 Övningsledare: ML11: Staffan Hägglund ML12:
Läs mer729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Läs merSPRÅKTEKNOLOGIPROGRAMMET (STP)
SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket
Läs merKURSPLAN Engelska, 31-60 hp, 30 högskolepoäng
1(6) KURSPLAN Engelska, 31-60 hp, 30 högskolepoäng English, 31-60 credits, 30 credits Kurskod: LENB17 Fastställd av: Utbildningsledare 2013-11-01 Gäller fr.o.m.: Hösten 2015 Version: 8 Diarienummer: HLK
Läs merSpråkteknologi vt09. Diskursmodellering. Diskursmodell: exempel. Koherensrelationer. Koreferens. Att bestämma koherensrelationer
Språkteknologi vt09 Diskursmodellering Diskursmodellering koherensrelationer anaforisk referens Informationsutvinning Mallar Delproblem Namnigenkänning Referensresolution Mallifyllning / Relationsigenkänning
Läs merFör universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.
HUMANISTISKA FAKULTETEN Dnr: U 2016/663 Allmän studieplan för doktorsexamen i Datalingvistik Studieplanen är fastställd av Humanistiska fakultetsstyrelsen vid Göteborgs universitet den 17 november 2016.
Läs merFullgjorda kursutvärderingar: 15 Frågor: 27. Lärarens kommentar. Tack till alla er som deltog i kursutvärderingen!
Kursutvärdering för kursen: HRM, organisation och arbetsliv, moment 1, Introduktion och vetenskapligt arbete, 6 hp - Hösten 2016 Publicerad 2016-10-26 av Johan Örestig Fullgjorda kursutvärderingar: 15
Läs merDifferentiell psykologi
Differentiell psykologi Måndagen den 19/9 2011 Sensitivitet och specificitet Version 1.1 Dagens agenda Validering av kriterietolkningar Diagnostiska studier Exempel på diagnostisk studie av MDI Olika prövningar
Läs merKursinformation Grundkurs i programmering med Python
Hösten 2009 Två kurser i en 5DV105 - Programmeringsteknik med Python och MATLAB Programmeringsteori Föreläsningar om Python Färdighetsövning Laborationer i Python 5DV106 - Programmering i Python Praktisk
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merTurismvetenskap GR (B), E-turism: digital distribution, marknadsföring och information, 15 hp
1 (5) Kursplan för: Turismvetenskap GR (B), E-turism: digital distribution, marknadsföring och information, 15 hp Tourism Studies BA (B) E-tourism: digital distribution and e-marketing, 15 Credits Allmänna
Läs merTDIU01 (725G67) - Programmering i C++, grundkurs
TDIU01 (725G67) - Programmering i C++, grundkurs Introduktion till kursen och programmering Eric Elfving Institutionen för datavetenskap 2 september 2014 Översikt Kursinformation Personal Kursmål Upplägg
Läs merProjektförslag. Datalingvistisk projektkurs VT mars 2007
Projektförslag Datalingvistisk projektkurs VT 2007 26 mars 2007 Möjliga projekt Utvärdering Att utvärdera ett befintligt program/system utifrån ett datalingvistiskt perspektiv. Exempel: Utvärdera hur ett
Läs merKvantmekanik II, 7,5 hp (FK5012) HT 2015
2015-09-29 Kvantmekanik II, 7,5 hp (FK5012) HT 2015 Innehåll: Fördjupad kunskap om grundläggande begrepp och metoder inom icke-relativistisk kvantmekanik: osäkerhetsprincipen; Dirac-notation; rörelsemängdsmoment,
Läs merInformationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)
Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)
Läs merAutomatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår
Läs merOntologier. Cassandra Svensson 2014-01-09
Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merKvantmekanik II, 7,5 hp (FK5012)
2013-10-01 Kvantmekanik II, 7,5 hp (FK5012) Innehåll: Fördjupad kunskap om grundläggande begrepp och metoder inom icke-relativistisk kvantmekanik: osäkerhetsprincipen; Dirac-notation; rörelsemängdsmoment,
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merCUSTOMER READERSHIP HARRODS MAGAZINE CUSTOMER OVERVIEW. 63% of Harrods Magazine readers are mostly interested in reading about beauty
79% of the division trade is generated by Harrods Rewards customers 30% of our Beauty clients are millennials 42% of our trade comes from tax-free customers 73% of the department base is female Source:
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)
Läs merKognitionsvetenskapligt kandidatprogram Bachelor Programme in Cognitive Science 180 Högskolepoäng
Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachelor Programme in Cognitive Science 180 Högskolepoäng Kognitionsvetenskap är ett tvärvetenskapligt kunskaps- och forskningsområde som studerar
Läs merPsykologi GR (C), Arbets- och organisationspsykologi med kandidatuppsats för psykologprogrammet, 22,5 hp
1 (5) Kursplan för: Psykologi GR (C), Arbets- och organisationspsykologi med kandidatuppsats för psykologprogrammet, 22,5 hp Psychology Ba (C), Work- and organizational psychology with bachelor thesis,
Läs merGrundläggande datavetenskap 4p
Grundläggande datavetenskap 4p Stefan.Pettersson@mh.se http://www.itm.mh.se/~stepet Kursinformation Planering Läsanvisningar Föreläsningsbilder Övningsuppgifter Laborationer 2004-11-04 IT och Medier 1
Läs merVälkomna till Statistik och kvantitativa undersökningar Lars Bohlin Syfte: Lärandemål. Lärandemål forts.
Föreläsningsanteckningar till: F1 introduktion, deskriptiv statistik 1 Välkomna till Statistik och a undersökningar Lars Bohlin 021-103198 lars.bohlin@mdh.se Syfte: Att ge studenten insikter i grunderna
Läs merEP1020, Introduktion till global ekonomi, 7,5 högskolepoäng An introduction to Global Economy, 7.5 higher education credits
HANDELSHÖGSKOLANS FAKULTETSNÄMND EP1020, Introduktion till global ekonomi, 7,5 högskolepoäng An introduction to Global Economy, 7.5 higher education credits Grundnivå/First Cycle 1. Fastställande Kursplanen
Läs merThis is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?
This is England 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied? 2. Is Combo s speech credible, do you understand why Shaun wants to stay with Combo?
Läs mer- A Scrum Planning Tool Case Study to Evaluate the The Rich AJAX Platform
Datavetenskap Opponent(er): Jhonny Carvajal Johan Bjärneryd Respondent(er): Fredrik Häggbom Erik Olsson Haglund Scrumptious - A Scrum Planning Tool Case Study to Evaluate the The Rich AJAX Platform Oppositionsrapport,
Läs merInkvarteringsstatistik. Göteborg & Co
Inkvarteringsstatistik Göteborg & Co Mars 2012 FoU/ Marknad & Försäljning Gästnätter storstadsregioner Mars 2012, hotell och vandrarhem Gästnattsutveckling storstadsregioner Mars 2012, hotell och vandrarhem
Läs merDatavetenskapligt program, 180 högskolepoäng
GÖTEBORGS UNIVERSITET UTBILDNINGSPLAN IT-fakultetsstyrelsen 2013-02-14 Datavetenskapligt program, 180 högskolepoäng (Computer Science, Bachelor s Programme, 180 credits) Grundnivå/First level 1. Fastställande
Läs merKursinformation och schema för Lingvistik 6 hp 729G08
LINKÖPINGS UNIVERSITET Institutionen för kultur och kommunikation Kognitionsvetenskapliga programmet 2012-10-29 Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2012 Lärare: Mathias Broth (281851)
Läs merSOCA45, Sociologi: Klass, kön och etnicitet, 30 högskolepoäng Sociology: Class, Gender and Ethnicity, 30 credits Grundnivå / First Cycle
Samhällsvetenskapliga fakulteten SOCA45, Sociologi: Klass, kön och etnicitet, 30 högskolepoäng Sociology: Class, Gender and Ethnicity, 30 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd
Läs merINSTITUTIONEN FÖR FILOSOFI, LINGVISTIK OCH VETENSKAPSTEORI
INSTITUTIONEN FÖR FILOSOFI, LINGVISTIK OCH VETENSKAPSTEORI AMP011 Grekiska för filosofer, 10 högskolepoäng Greek for Philosophers, 10 credits Fastställande Kursplanen är en skiss, höstterminen 2018. Utbildningsområde:
Läs merSocialpsykologiska teorier, 7,5 hp
Socialpsykologiska teorier, 7,5 hp Masterprogrammet i psykologi, HT- 13 Psykologiska institutionen Stockholms universitet Kursansvarig: Charlotte Alm Övergripande syfte och innehåll Syftet med kursen är
Läs merIntroduktionsmöte Innehåll
Introduktionsmöte Innehåll Introduktion till kursen Kursens mål och innehåll Undervisning Datavetenskap (LTH) Introduktionsmöte ST 2019 1 / 14 EDAA01 Programmeringsteknik - fördjupningskurs Ingen sommarkurs
Läs merCOMPUTABILITY BERÄKNINGSBARHET. Källa: Goldschlager, Lister: Computer Science A Modern Introduction 2. upplaga 1988, Prentice Hall
COMPUTABILITY BERÄKNINGSBARHET Källa: Goldschlager, Lister: Computer Science A Modern Introduction 2. upplaga 1988, Prentice Hall Den centrala frågan: givet ett problem, kan det ha en algoritmisk lösning?
Läs merMathematical Cryptology (6hp)
Time to sign up for the continuation course Mathematical Cryptology (6hp) 12 lectures (2 hours) + 2 small projects Exercises are done on your own and discussed in class (6*2 hours). Contents: Elliptic
Läs merDo you Think there is a problem with the car traffic to or from the inner city weekdays ?
Do you Think there is a problem with the car traffic to or from the inner city weekdays 06.00 18.00? Tycker du att det finns några problem med biltrafiken till/från eller genom innerstaden under vardagar
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Läs merAPPENDIX. Den enkät som skickades ut.
APPENDIX Den enkät som skickades ut. 2(11) 00-01-19 Institutionen för datavetenskap Lena Strömbäck Till: Studerande på utbildningar med stora inslag av dataämnen vid Linköpings Universitet. Hej! Högskoleverket
Läs merVad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Läs merHur man kan tillämpa Data Science och AI i säkerhetsarbetet. Magnus Sahlgren
Hur man kan tillämpa Data Science och AI i säkerhetsarbetet Magnus Sahlgren FOI Totalförsvarets forskningsinstitut (ett av Europas ledande forskningsinstitut inom försvar och säkerhet) Mer än 900 forskare
Läs merKursplan för kurs på grundnivå
Kursplan för kurs på grundnivå Lingvistik I Linguistics I 30.0 Högskolepoäng 30.0 ECTS credits Kurskod: LIN130 Gäller från: HT 2018 Fastställd: 2013-03-13 Ändrad: 2018-02-13 Institution Institutionen för
Läs merTDDD02 Språkteknologi för informationssökning / Textsammanfattning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Textsammanfattning Marco Kuhlmann Institutionen för datavetenskap Textsammanfattning Textsammanfattning går ut på att extrahera den mest relevanta informationen
Läs merKungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Läs merKursplan. EN1088 Engelsk språkdidaktik. 7,5 högskolepoäng, Grundnivå 1. English Language Learning and Teaching
Kursplan EN1088 Engelsk språkdidaktik 7,5 högskolepoäng, Grundnivå 1 English Language Learning and Teaching 7.5 Higher Education Credits *), First Cycle Level 1 Mål Efter genomgången kurs ska studenten
Läs merKandidatprogram i kognitionsvetenskap, 180 högskolepoäng
IT- fakultetsstyrelsen Ä8 ITFS 2013-09-26/bil 1 Kandidatprogram i kognitionsvetenskap, 180 högskolepoäng (Bachelor in Cognitive Science, 180 higher education credits) Grundnivå 1. Fastställande Utbildningsplan
Läs merÄFRD02, Franska 2 med utbildningsvetenskaplig inriktning, 30 högskolepoäng French for Secondary Education, Level 2, 30 credits Grundnivå / First Cycle
Humanistiska och teologiska fakulteterna ÄFRD02, Franska 2 med utbildningsvetenskaplig inriktning, 30 högskolepoäng French for Secondary Education, Level 2, 30 credits Grundnivå / First Cycle Fastställande
Läs mer