Inlämningsuppgift: Pronomenidentifierare
|
|
- Pernilla Jakobsson
- för 5 år sedan
- Visningar:
Transkript
1 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi 1
2 2 (7) 1 Uppgiften Algoritmen i korthet Representation av data Indikatorer Definiteness Lexical reiteration Non-prepositional noun phrases Collocation pattern reference Givenness Indicating verbs Section heading preference Immediate reference Referencial distance Term preference Personliga pronomen Resultat Sammanfattning
3 3 (7) 1 Uppgiften Detta är en presentation av en mindre projektuppgift i kursen Språkteknologi på KTH. Uppgiften består i att implementera och utvärdera en algoritm för att hitta ett förslag till antecedent till ett pronomen i löpande text. Algoritmen är föreslagen av Ruslan Mitkov Den har blivit omarbetad sedan dess men vi skulle alltså implementera denna. Mitkovs algoritm är anpassad för engelsk text, och dessutom för tekniska manualer. I vårt fall var det föreslaget att vi skulle titta på resolution i svensk nyhetstext. Detta innebär att algoritmen inte kan implementeras utan modifikation. Vi återkommer till varför, och hur det påverkade detta projekt i praktiken. 2 Algoritmen i korthet Algoritmen bygger på heuristik och styrkan är att den är kunskapsfattig och inte kräver någon lingvistisk analys av den aktuella texten. Algoritmen är konceptuellt sett ganska enkel och rättfram. Indata förutsätts vara en textström med ordklass- och IOB-taggade ord. Stega igenom meningarna. Sök efter pronomen i varje mening. Vid funnet pronomen sök igenom den aktuella meningen, samt de två tidigare, efter nominalfraser. Sök endast till vänster om anaforen. Välj ut de nominalfraser som stämmer överens med anaforen i genus och numerus som tänkbara kandidater. Varje kandidat poängsätts med en mängd indikatorer. Välj den kandidat som har högst poäng som antecedent. Om två eller flera kandidater får samma poäng, välj någon av dessa till antecedent med lämplig strategi. Det centrala i algoritmen är hur dessa indikatorer fungerar. I avsnitt 4 ska vi titta närmare på dessa. Där ska vi också titta på hur en strategi vid lika poäng kan se ut. 3 Representation av data För att få det indata som söks måste den obehandlade texten först analyseras och taggas med hjälp av någon textanalysator. Till vår hjälp hade vi Granskas Text Analysator (GTA), som tar in en textström och returnerar en taggad textström i XML-format
4 4 (7) Meningen bollen är rund taggad med GTA Denna XML-text måste parsas in i en lämplig datastruktur. Vi valde att representera texten i en objektmodell, där meningar och ord håller en mängd data som t.ex. ordets lemma, ordklasstaggar och IOB-taggar. Orden håller också information om aktuell kandidatpoäng, vald antecedent (om det är ett pronomen) och annan data av den typen. Detta skulle kunna representas i listor utanför också men vi tyckte att detta verkade enkelt. Text Sentence -Word Denna modell är som synes lite förenklad. För att implementera ett mer generellt ramverk där det är möjligt att lägga till nya tänkbara indikatorer i algoritmen så behövs det en finare uppdelning av textmassan, där man håller reda på klausuler och frasgränser också. För de indikatorer vi har valt att implementera så räcker det emellertid med ovanstående representation. 4 Indikatorer En indikator är en funktion som tar en anafor och en mängd nominalfraser som indata. Dessutom behöver den tillgång till hela texten och dess beståndsdelar för att kunna avgöra vissa egenskaper hos nominalfraserna. Vi återkommer till detta senare i texten. Indikatorn poängsätter varje kandidat efter en given preferens. När alla indikatorer har körts så väljs den bästa kandidaten. Mitkov använder sig av tio olika indikatorer. Dessa är som sagt anpassade för att användas på en engelsk teknisk manual. I denna uppgift var strävan att implementera Mitkovs indikatorer och sedan modifiera dem för att passa svensk nyhetstext. För att detta ska kunna göras fullt ut krävs mycket empiriskt arbete och tid. Arbete som tyvärr inte ryms inom ramarna för denna laboration. Bland annat så skulle en frekvensanalys på vanliga ord i svensk nyhetstext behövas. Detta skulle kunna göras på KTH news corpus. För att skapa adekvata indikatorer krävs också stor kunskap om det aktuella språket och dess egenskaper. När dessa indikatorer är definierade så måste man sedan också empiriskt testa dem och ställa in poängnivåerna för att nå ett så när optimalt resultat som möjligt. Detta är som förståeligt ett mycket omfattande arbete. Nedan följer en presentation av Mitkovs indikatorer. Kom ihåg att de är anpassade för tekniska manualer på engelska. För att vi inte ska göra oss skyldiga till svengelska så behåller vi de engelska namnen. 4
5 5 (7) 4.1 Definiteness Nominalfraser i bestämd form är med högre sannolikhet antecedent än en obestämd sådan. (Bestämd nominalfras får 0 poäng och obestämd får -1 poäng). GTA:s taggning ger oss inte direkt information om ett nomen tillhör en bestämd nominalfras. Här måste man alltså inte bara kolla på nomenets species utan också avgöra om det bestäms av ett possessivt pronomen (Hans bil). I engelska undersöks också om det bestäms av demonstrativa pronomen. 4.2 Lexical reiteration Nomen (tillhörande lemma) som upprepas i det stycke som pronomenet befinner sig i får högre poäng. (0 om det inte upprepas någon gång, 1 vid en upprepning och 2 om ordet upprepas två eller flera gånger). Detta verkar rimligt i en svensk nyhetstext också. Här är också ett exempel på då man måste läsa in hela texten, eller åtminstone det aktuella stycket, innan man kan beräkna poängen för kandidaterna. 4.3 Non-prepositional noun phrases Ett nomen som inte är i en prepositionsfras får högre poäng än ett som är i en (0, -1). 4.4 Collocation pattern reference Här tittar man på hur en kandidat förhåller sig till verbet i en mening (klausul). Om det förekommer i samma ordning som anaforen gör så får det högre poäng (2, 0). Mitkov begränsar sig till att undersöka följderna nominalfras/pronomen verb och verb nominalfras/pronomen Vi är dock inte övertygade om hur väl detta stämmer överens med svenska. Kanske kan det till och med vara tvärt om, att det är större chans att ett nomen är antecedent om verbföljden är tvärtom. Det enklaste vore att titta på subjekt/predikat men GTA stöder inte det. 4.5 Givenness Ofta är det den första nominalfrasen i en mening som utgör den centrala (givna) informationen som också behandlas senare i texten. Med andra ord kan man dra slutsatsen att pronomen oftare syftar till nominalfraser som förekommer tidigt i en föregående mening, förutsatt att meningen inte är imperativ. Dessa nomen får en 1 poäng och andra icke-centrala nomen får 0 poäng. 4.6 Indicating verbs Nomen som direkt följer vissa kontextspecifika verb utgör oftare antecedenten än nomen som följer mindre kontextspecifika verb. Exempel på dessa verb är i Mitkovs fall för en teknisk manual; analysera, utveckla, definiera, sammanfatta m.m. Dessa verb bestäms på empirisk väg utifrån det kontext som ska behandlas. Nomen som följer dessa verb ger Mitkov 1 poäng. 5
6 6 (7) 4.7 Section heading preference Nominalfraser som förekommer i rubriken är ofta antecedenter till pronomen i det efterföljande stycket. Dessa kandidater får därför 1 poäng. 4.8 Immediate reference En heuristik som kan komma till nytta vid pronomenidentifiering inom tekniska manualer är att det för meningar med instruktioner ofta går att identifiera antecedenten som det nomen som efterföljer den första uppmaningen. Ett förklarande exempel är För att öppna locket ska man skruva det och sedan lyfta det. Här är ordet efter första verbet (locket) antecedent till det. Man kan tänka sig andra former av heuristiken för svenska där orden är omkastade i uppmaningsfrasen som t.ex. För att öppna locket ska det skruvas och sedan ska det lyftas då verben förekommer i s-form. 4.9 Referencial distance För komplicerade meningar poängsätts nominalfraser i den föregående klausulen med 2 poäng, därefter nominalfraser i den föregående meningen med 1 poäng och nominalfraser ytterligare en mening bakåt får 0 poäng. Nominalfraser ännu längre bakåt straffas med en poäng Term preference Nominalfraser som ingår i terminologin för ett specifikt område utgör oftare också antecedenten till pronomen. Dessa kandidater får därför 1 poäng Personliga pronomen När personliga pronomen han och hon förekommer syftar dessa på ett egennamn. Dessa poängsätts med 1 poäng. 5 Resultat I vår algoritm valde vi, i brist på tid att implementera de av Mitkovs indikatorer som var mest generella och passade för en svensk nyhetstext. En av Mitkovs indikatorer som inte implementerades men ändå faller i denna kategori är section heading preference. De indikatorer som vi valde är: definiteness, lexical reiteration, non-prepositional noun phrases och collocation pattern reference. Vi valde också att implementera en egen indikator för personliga pronomen som poängsätter pronomen för han och hon då dessa är vanligt förekommande i nyhetstexter. Resultatet består av enkla meningar med utmärkta antecedenter. Anledningen till att vi inte lyckades pronomenidentifiera en större textmassa beror på ett problem med uppkopplingen till GTA. Exempel på meningar som pronomenidentifieraren lyckades med är: Pojken kastar en boll. Han (pojken) är glad. En bil och en moped krockade och mopeden gick sönder. Den (mopeden) gick inte att laga. En kille sprang in i en vägg. I efterhand tyckte han (kille) att det var lite onödigt. 6
7 7 (7) Räven sprang fram och då ropade hönan på hjälp. Han (räven) jagade hönan runt huset. Pelle åkte hem till mannen och han (Pelle) var glad. 6 Sammanfattning Vi har implementerat Mitkovs algoritm för pronomenidentifiering och strävat efter att anpassa denna till en svensk nyhetstext. Algoritmen baseras på heuristik där indikatormetoder poängsätter kandidater till pronomen utefter specifika preferenser. Mitkov redogör för 10 indikatorer och vi har valt att implementera fyra av dessa plus ytterligare en indikator för personliga pronomen. 7
Grammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merInstuderingsmaterial: Adjektiv, Substantiv och Verb
Instuderingsmaterial: Adjektiv, Substantiv och Verb Vad är Substantiv? Saker, namn, länder, städer etc. Man ska kunna sätta flera, en eller ett framför När ska substantiven ha stor begynnelsebokstav? -
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merKODNING AV MAXIMALA GRAMMATISKA ENHETER Manual
KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala
Läs merGrim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merGränssnitt för FakeGranska. Lars Mattsson
Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs mergramma%k pronomen, a-ribut, adjek%v (fraser), räkneord och syntak%sk funk%on
Svenska språkets struktur: gramma%k pronomen, a-ribut, adjek%v (fraser), räkneord och syntak%sk funk%on Helen Winzell (rum 4315, Key- huset) 013-28 69 28 helen.winzell@liu.se hon pronomen Pronomen istället
Läs merOrdklasser och satsdelar
Ordklasser och satsdelar Vi kommer under de kommande fyra veckorna att arbeta med ordklasser och satsdelar. Under det här arbetsområdet kommer du att få öva på följande förmågor: formulera sig och kommunicera
Läs merHarry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.
Uppgifter i svenska till Harry Potter och De Vises Sten Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.
Läs merORDKLASSERNA I SVENSKA SPRÅKET
ORDKLASSERNA I SVENSKA SPRÅKET SUBSTANTIV 1 Namn på saker, människor, djur, växter. Du kan sätta en, ett eller flera, den det eller de framför ordet. Konkreta substantiv: stol, bord, gubbe, boll (du kan
Läs merBootstrapping för substantivtaggning
Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson j0j0@kth.se Mikael Melin mime@kth.se Handledare: Jonas
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merFrasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Läs merOrdklasser. Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.
Ordklasser Substantiv Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv. Konkreta och abstrakta substantiv Konkreta substantiv kallas
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Läs merTräningshäfte ordklasser (Venus)
Träningshäfte ordklasser (Venus) Substantiv 1. Stryk under substantiven bland följande ord (8 st) glad simma luft koka barnslig tre oj därifrån vikt nej pojke moln lycka jord överenskommelse Pelle femte
Läs mer1 Vilka ord är substantiv? Läs texten.
3 Ordklasser Ordklasser har du säkert hört talas om förut. Men varför finns det ordklasser? Hur ska man veta vilka ord som hör till vilken ordklass? Och varför ska man veta det? Tänk dig att du har alla
Läs merPROV ORDKLASSER SV Förklara vad ett konkret substantiv är och ge två exempel (3p)
PROV ORDKLASSER SV 8-9 1. Förklara vad ett konkret substantiv är och ge två exempel (3p) 2. Förklara vad ett abstrakt substantiv är och ge två exempel (3p) 3. Vilket genus har orden? Skriv dem i rätt spalt.
Läs merglad simma luft koka barnslig pojke moln lycka jord överenskommelse Pelle femte varför arg ropa
Träningshäfte - ordklasser- facit Substantiv 1. Stryk under substantiven bland följande ord. (8 ord) glad simma luft koka barnslig tre oj därifrån vikt nej pojke moln lycka jord överenskommelse Pelle femte
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merDependensregler - Lathund
Dependensregler - Lathund INTRODUKTION I textprogrammet TeCST är det möjligt för en skribent att skriva, redigera och klistra in text för att få ut läsbarhetsmått och få förslag på hur texten kan skrivas
Läs merCristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merSpråkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:
Grammatikprov svenska Nu är det dags att kolla av vad eleverna lärt sig under vårens grammatik arbete. Efter påsklovet tar vi paus från veckans-ord och pluggar grammatik. För att det inte ska bli för mycket
Läs merHemtentamen HT13 Inlämning senast Lärare: Tora Hedin
Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara
Läs mergrammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Läs merFörfattare: Eeva-Liisa Järvinen, Projektet På väg mot kommunikativ kompetens: tillägnandet av svenskans struktur/ Åbo Universitet
Titelblad Titel: Val av species och bestämdhetsform i ett test för finska grundskolelever. Författare: Eeva-Liisa Järvinen, Projektet På väg mot kommunikativ kompetens: tillägnandet av svenskans struktur/
Läs merTaggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger
Läs merFacit för diagnostiska provet i grammatik
Facit för diagnostiska provet i grammatik Textutdrag: De tio vanligaste namnen på honhundar i Sverige är också vanliga kvinnonamn. Mest sällsynt är Bella med 1065 bärare, men åtskilliga av landets 11 954
Läs mer2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.
Ordklasser SUBSTANTIV 1. Substantiv kan delas in i följande grupper: egennamn (Nilsson, Kalle, Märsta, SAAB) växter (gräs, träd, buske) personer (häxa, flicka, svensk) djur (lejon, hund, spindel) föremål,
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merFraser, huvuden och bestämningar
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merSvenska - Läxa ORD att kunna förklara
Svenska - Läxa ORD att kunna förklara Substantiv är namn på ting; t ex boll och ring Adjektiven sen oss lär hurudana tingen är Verb det är vad man kan göra; skriva läsa, se och höra Ordklasser som vi lärt
Läs merLärarmaterial. H som i häxa. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: Författare: Mårten Melin
SIDAN 1 Författare: Mårten Melin Vad handlar boken om? Boken handlar om Vera som är häxa. Hennes kompis Sira fick en häxkvast när hon fyllde år. Vera vill också ha en kvast. Problemet är att hennes föräldrar
Läs merFörslag på instruktioner och arbete med bedömning av muntlig presentation, från MMT-utredning 2003
Förslag på instruktioner och arbete med bedömning av muntlig presentation, från MMT-utredning 2003 Instruktioner för muntlig redovisning: Uppgift Håll ett kort föredrag (15-20 minuter presentation + 10
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merKongruensböjningen av adjektivet påverkas av substantivets genus och numerus.
Kongruensböjningen av adjektivet påverkas av substantivets genus och numerus. substantivet genus och numerus. En lycklig man gick på gatan. Maskulint substantiv i plural form: Lyckliga män gick på gatan.
Läs merLogging Module into the PRIME Core
Datavetenskap Opponent: Andreas Lavén Respondenter: Anders Ellvin, Tobias Pulls Implementing a Privacy-Friendly Secure Logging Module into the PRIME Core Oppositionsrapport, E-nivå 2005:xx 1 Sammanfattat
Läs merVerb. "Verb" är ord som är namn på en handling eller visar att någon eller något är i ett visst tillstånd. Ordet verb betyder ursprungligen "ord".
Verb Verb "Verb" är ord som är namn på en handling eller visar att någon eller något är i ett visst tillstånd. Ordet verb betyder ursprungligen "ord". Verb som är namn på en handling Springa, hoppa, studsa,
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merMorfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,
Läs merGrammatikprov åk 8 ORDKLASSER
Grammatikprov åk 8 ORDKLASSER Gör hela provet innan du rättar med facit. Du sätter själv ut dina poäng när du rättar! A. Placera de 30 orden efter rätt ordklass katt, vi, springer, men, vacker, eftersom,
Läs merÖvningstillfälle 1, Kognitionsvetenskapliga programmet. Ordklasser och fraser. Facit. 2. lyftes VERB 28. överseende PARTICIP
Övningstillfälle 1, Kognitionsvetenskapliga programmet. Ordklasser och fraser. Facit. 1.Äntligen ADVERB 27. om PREPOSITION 2. lyftes VERB 28. överseende PARTICIP 3. där ADVERB 29. att INFINITIVMÄRKE 4.
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merSkäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.
Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten
Läs merSnabb introduktion till LäsDax & SkrivDax 1 De fyra tillfällena
Snabb introduktion till LäsDax & SkrivDax 1 De fyra tillfällena Första tillfället Gemensam läsning Inled lektionen med en aktivitet som anknyter till texten. Samla sedan klassen kring storboken. Täck gärna
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merKungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Läs merDet här dokumentet är till för att ge en översikt över ASP.NET MVC samt hur WCF Services används från.net applikationer.
Informationsinfrastruktur 7.5 hp Mattias Nordlindh Inledning Det här dokumentet är till för att ge en översikt över ASP.NET MVC samt hur WCF Services används från.net applikationer. Dokumentet består av
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merSUBSTANTIV = namn på saker, personer, känslor
KONKRETA = de du ta på, ex: hus, Kalle ABSTRAKTA = de du inte kan ta på, ex: mod, sanning, kärlek SUBSTANTIV = namn på saker, personer, känslor EGENNAMN Ex: Linda, Sverige, Vättern, Sydsvenskan NUMERUS
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merTDDD92 Artificiell intelligens -- projekt
jonas.kvarnstrom@liu.se 2018 TDDD92 Artificiell intelligens -- projekt Individuella uppgifter UPG2: Individuell skriftlig rapport 2 Vad? Läsa och förstå vetenskaplig litteratur Varför? Framtiden: Inte
Läs merPersiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi
Persiska Albin Finne 2002-10-10 Sammanfattning Den här uppsatsen beskriver det persiska språket. Språkets historia, morfologi, syntax och ordförråd behandlas. Tonvikten läggs på morfologi och syntax. Avslutningsvis
Läs merStudiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is.
Háskóli Íslands Svenska lektoratet Höstterminen Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is Studiebrev 13 Uppgift 1 I det här sista Studiebrevet vill jag att du kommer med lite
Läs merSubstantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.
Ordklasser Substantiv Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv. Konkreta och abstrakta substantiv Konkreta substantiv kallas
Läs merDatum: Date: Provkodr: KTR1 Exam code:
Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. En dag upptäcker min treåriga dotter (1) att det finns kärnor i äpplen. En snabb (2) genomgång av hur och varför visar (3) sig bli
Läs merAbstraktion. Objektorientering. Kartor. Kartor. Hus. Generalisering
Abstraktion Objektorientering Process som bygger på att känna igen och fokusera på viktiga karakteristika hos objekt eller i en situation. Förmågan att kunna filtrera bort eller bortse från oviktiga detaljer.
Läs merSvenskans struktur, 7,5 hp Tentamensexempel 1
Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merTentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Läs merFår jag använda Wikipedia?
Får jag använda Wikipedia? Wikipedia är ett unikt uppslagsverk som skapas av sina läsare. Det innebär att vem som helst kan skriva och redigera artiklar. Informationen på Wikipedia kan vara vinklad eller
Läs merAlgoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 12 Anton Grensjö grensjo@csc.kth.se 10 december 2015 Anton Grensjö ADK Övning 12 10 december 2015 1 / 19 Idag Idag Komplexitetsklasser Blandade uppgifter
Läs merDelkurs grammatik (5 hp, 7,5 hp) - studiehandledning vt 2015
Linköpings universitet Institutionen för kultur och kommunikation Avdelningen för svenska och litteraturvetenskap STUDIEHANDLEDNING 2014-12- 15 714G01 Svenska språket 1, grundkurs 91SV11 Svenska (1-30hp)
Läs merProgrammering II (ID1019) :00-11:00
ID1019 Johan Montelius Programmering II (ID1019) 2015-06-11 08:00-11:00 Instruktioner Du får inte ha något materiel med dig förutom skrivmateriel. Mobiler etc, skall lämnas till tentamensvakten. Svaren
Läs merInstruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python
Instruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python Hjälpmedel Följande hjälpmedel är tillåtna: Exakt en valfri bok, t.ex. den rekommenderade kursboken. Boken får ha anteckningar,
Läs merORDKLASSERNA I. Ett sätt att sortera våra ord
ORDKLASSERNA I Ett sätt att sortera våra ord Vilka ordklasser finns det? Hur många kan ni komma på? 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Hur sorterar man orden? Morfologiskt Syntaktiskt Semantiskt SUBSTANTIV
Läs merUtveckling av ett grafiskt användargränssnitt
Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat
Läs merSTRÄNGAR DATATYPEN. Om du vill baka in variabler eller escape-tecken måste du använda dubbla citattecken. strängar
STRÄNGAR En av de mest avancerade av de normala datatyperna är. Här skall vi grundläggande gå igenom hur den datatypen fungerar och vidare flertalet funktioner som hör till datatypen. Låt oss kasta oss
Läs merGRUNDKURS I C-PROGRAMMERING
SAMMANSTÄLLNING 1 (9) Inst för informationsteknologi GRUNDKURS I C-PROGRAMMERING del av 1TD442 ALGORITMER OCH DATASTRUKTURER DV1/ 1IT022 PROGRAMKONSTRUKTION II Period 3, 2006 DV/IT Sammanfattning: Vad
Läs merVälkomna till DIT012 IPGO
Välkomna till DIT012 IPGO 1 Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare Joachim von Hacht, hajo@chalmers.se, 772 1003 Handledare (se även kurssida) Alexander Sjösten, sjosten@chalmers.se
Läs merTema Antiken år 6 Svenska
TEMA ANTIKEN ÅR 6 Uppgift: Designa mönster med inspiration av antikens krukor och vaser. Mål: Utveckla sitt kunnande för att främja lust och vilja att på ett personligt sätt framställa bilder med hjälp
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merRelativa, kriteriebaserade och målrelaterade betyg. Målrelaterade kriterier. Relationen betygskriterier lärandemål
1 Relativa, kriteriebaserade och målrelaterade betyg Verkliga eempel på betygskriterier och eamination Viggo Kann Relativa betyg Kriteriebaserade betyg Målrelaterade betyg Skolan för datavetenskap och
Läs merTräningshäfte ordklasser facit
Träningshäfte ordklasser facit Substantiv 1. Stryk under substantiven bland följande ord (8 st) glad simma luft koka barnslig tre oj därifrån vikt nej pojke moln lycka jord överenskommelse Pelle femte
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
Läs merDet är principer och idéer som är viktiga. Skriv så att du övertygar rättaren om att du har förstått dessa även om detaljer kan vara felaktiga.
Tentamen Programmeringsteknik II 2014-0-27 Skrivtid: 0800 100 Tänk på följande Skriv läsligt! Använd inte rödpenna! Skriv bara på framsidan av varje papper. Börja alltid ny uppgift på nytt papper. Lägg
Läs mera = a a a a a a ± ± ± ±500
4.1 Felanalys Vill man hårddra det hela, kan man påstå att det inte finns några tal i den tillämpade matematiken, bara intervall. Man anger till exempel inte ett uppmätt värde till 134.78 meter utan att
Läs merSatslära introduktion
Satslära introduktion Dolores Meden Dolores Meden 2010-08-27 1 Skillnaden mellan ordklass och ett ords funktion (syntax): * ett ords tillhörighet i en ordklass är konstant och påverkas inte av användningen
Läs merViktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med:
Viktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med: UPPNÅENDEMÅL ENGELSKA, ÅR 5 TIPS År 2 Eleven skall Tala - kunna delta i enkla samtal om vardagliga och välbekanta ämnen, - kunna i enkel
Läs merTräningsguide för barn och ungdom inom IK Huge Fotboll
Träningsguide för barn och ungdom inom IK Huge Fotboll Detta dokument är en bilaga till Riktlinjer för träning och beskriver hur ett träningsprogram kan läggas upp, vad man ska tänka på under övningarna
Läs merBG306A Strukturmekanik, bärverksanalys MT129A Finita elementmetoden
BG306A Strukturmekanik, bärverksanalys MT129A Finita elementmetoden Antal svar: 16 (14+28) 1. Flervalsfråga Andel Allmänt Hur tycker du kursen har varit? 1. Dålig 0% 2. Ganska bra 12,5% 3. Bra 50% 4. Mycket
Läs merFrågor för bedömning av utvärdering av projekt
Sida 1 (11) Projekt: Projektledare: : Frågor för bedömning av utvärdering av projekt Alla projekt som genomförs bör utvärderas för att säkerställa att vi lär oss så mycket som möjligt av de insatser som
Läs mersom har en integrerad hörselskadad elev i sin grupp
som har en integrerad hörselskadad elev i sin grupp Tips från deltagare i distanskursen Skolsituationen för elever med hörselskada Sammanställd av Specialpedagogiska institutet Carin Norman/Birgitta Bellman
Läs merDiskussionsforum - Lärarmanual
Diskussionsforum i Blackboard Diskussionsforum i Blackboard (Bb), Diskussioner är ett forum där alla kan se varandras diskussionsinlägg, svar och kommentarer. Allt som läggs in på diskussionsforum kan
Läs merÖversikt i stolpform. Terminologin följer i stort sett Gunlög Josefsson (2009), Svensk universitetsgrammatik för nybörjare, Lund: Studentlitteratur.
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2014 Ord och ordklasser Översikt i stolpform. Terminologin följer
Läs merMÖSG ht 2005 Maskinöversättningssystemet MATS
MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?
Läs merHUR SKRIVER MAN EN LABORATIONSRAPPORT OCH VARFÖR?
HUR SKRIVER MAN EN LABORATIONSRAPPORT OCH VARFÖR? Du kommer med största sannolikhet att skriva rapporter senare i livet (träning!) Om man jobbar som forskare använder man sig av laborationsrapporter när
Läs merAutomatisk igenkänning av nominalfraser i löpande text
A b str a k t Automatisk igenkänning av nominalfraser i löpande text B jö r n R a u c h S to c k h o lm I uppsatsen redogörs för en samling algoritmer för automatisk nominalfrasmarkering i löpande text.
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merKursbeskrivning med litteraturlista HT-13
Kursbeskrivning med litteraturlista HT-13 Skriftlig språkfärdighet, 7,5 hp Delkurs inom Italienska I, 30 hp. Består av: I. Italiensk grammatik med inlämningsuppgifter, 6 hp, och II. Skriftlig produktion,
Läs merFörord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.
Förord Grammatikövningar för Sfi består av två delar, del 1 2, för kurserna B C resp C D och liknande utbildningar. Det är ett övningsmaterial som tränar svensk basgrammatik. Utgångspunkten för uppläggningen
Läs merRekryteringsprocess. Rekryteringssteg. 1. CV-screening 2. IQ Test 3. Intervju med Säljcoach, Extern konsult samt VD 4. Referenser.
Rekryteringsprocess Rekryteringssteg 1. CV-screening 2. IQ Test 3. Intervju med Säljcoach, Extern konsult samt VD 4. Referenser Tänk på att: - Alltid uppträda professionellt och artigt - Alltid klargöra
Läs merTDP Regler
Regler Student får lämna salen tidigast en timme efter tentans start. Vid toalettbesök eller rökpaus ska pauslista utanför salen fyllas i. All form av kontakt mellan studenter under tentans gång är strängt
Läs merFöreläsning 10. Besiktningsprotokollet
Föreläsning 10 Besiktningsprotokollet 1 Besiktningsprotokollet 2 Användarvänlighet Informativa utskrifter Programmet ska tala om för användaren vad programmet gör i varje steg och vilken inmatning som
Läs merVälkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1.
Välkomna till DIT012 IPGO 1 Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1. Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare
Läs mer