Bootstrapping för substantivtaggning

Storlek: px
Starta visningen från sidan:

Download "Bootstrapping för substantivtaggning"

Transkript

1 Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson Mikael Melin Handledare: Jonas Sjöbergh

2 Inledning Den här rapporten beskriver vårt arbete med inlämningsuppgiften i språkteknologi kursen 2D1418. Vi har valt att göra en laborations uppgift med maskininlärning. Det problem vi valt är att klassificera substantiv som djur eller icke djur. Vi har modifierat det python program som används i laboration 5 i denna kurs. I stället för egennamn arbetar det nu med substantiv. Vi har skapat små träningstexter, optimeringstexter och testtexter. För att förenkla inlärningen av djur i träningstexten har vi tagit fram ett enkelt program som använder sig av Granska för att göra om alla substantiv till grundform. Vi har provat lite olika regler och hittat några som ger ett resultat som är bättre än slumpen. Rapport Uppgiftsbeskrivning Försöka klassificera substantiv som djur eller inte, med hjälp av en modifierad version av maskininlärningsprogrammet som användes i laboration 5. Allmänt om uppgiften Vi ska försöka hitta vilka substantiv som är djur. Till detta använder vi maskininlärningsprogrammet som används på laboration 5 i denna kurs. Programmet bygger på bootsrapping tekniken. Det innebär att programmet får exempel på vilka ord som tillhör de klasser som de ska klassificeras i. Programmet får även regler som säger vad de ska titta på när den ska göra generella regler från exemplen. Reglerna kan antingen titta på ord, taggning eller tidigare gissning på ord runt omkring det aktuella ordet eller på detta. Förberedande arbete. För att kunna träna och utvärdera substantivs igenkänningen har vi samlat in texter från internet. Vi har tagit texter om djur i huvudsak från djurparker t.ex. Borås djurpark. Texten utan djur är tagen från Aftonbladet. Texterna är fördelade enligt följande: Mängd Antal ord ca Substantiv Djur % djur Träning 5000 ca 1350 ca 300 ca 22 Optimering Test Utan djur Tabell 1. Textmängder Tokenisering och taggning. Vi har använt ett tillhandahållet program som tokeniserar och taggar texten. Det för att indatat till maskininlärningsprogrammet måste vara tokeniserat och taggat. Substantiven i träningstexten har lemmatiserats efter att den taggats, så vi har alla substantiv i grundfrom men taggning som i texten. Detta gjordes för att inte behöva ta med alla böjningsformer av orden i träningsexemplen. Vi har gjort ett program som för varje substantiv anropar granska servern. Från den data som returneras plockar vi ut lemmatiseringen.

3 Modifiering av program Programmet från bootsrappings labben har modifierats så att det känner igen substantiv i stället egennamn. Detta har gjorts genom att generera alla möjliga taggningar av substantiv och sedan jämföra dem med taggingen av det aktuella ordet. Vi har bytt ut dom olika klasserna i ursprungsprogrammet till djur och icke djur. Vi har gjort en ganska vid klassificering av vilka substantiv som är djur. Förutom dom uppenbara som t.ex. björn och älg har vi valt att även klassificera substantiv som syftar på djur som djur. Exempelvis klassificerar vi människa, insekt, hona och unge som substantiv. Detta för att dom förekommer i samma kontext i texten och nästan alltid kan bytas ut mot ett djur namn. Startgissningen har bytts från entity till att vara djur om substantivet finns med i djurexempel listan annars icke djur. Träning av program Träningen började med att vi letade igenom våran träningsmängd efter substantiv. Vi tog ut dem som förekom flest gånger och skrev in dem som exempel för de olika klasserna. Vi testade sedan många olika regler. Några regler var mer genomtänkta andra mindre. Reglerna testades på optimeringsmängden med varierande resultat. Vi testade även att variera antalet exempelord i varje klass. Resultat I optimeringsmängden och testmängden var det enligt våran klassificering 25 respektive 31 % av substantiven som var djur. Vi bestämde att baseline skulle vara att de som inte var djur skulle få en täckning på ca 70 % och de som var djur skulle få en täckning på 30 %. Detta då det är vad som fås om slumpning med 30 % chans att det blir djur tillämpas. Vårt mål med träningen av reglerna var att få upp täckningen av djur så högt som möjligt utan att försämra täckningen av icke djur. Detta då det är djur som är intressanta att klassificera, men förbättringen får inte ske på bekostnad av icke djuren. Det bästa resultatet vi lyckade komma fram till visas i tabellen nedan. Mängd Täckning Täckning Precision Precision Totalt djur icke djur djur icke djur Baseline Optimering Test Utan djur Test (utan Lemma) Tabell 2. Resultat, alla värden i procent. I resultaten ovan använde vi 24 exempel på djur och 50 exempel på icke djur i våran träning. Varje exempel förekommer flera gånger i träningstexten, tre gånger eller fler. Vi har valt att ha fler icke djur då hela texten innehåller fler icke djur. Detta för att om vi hade för många djur så drogs djur precision och icke djurs täckning ner.

4 Analys av resultat. Det framgår av resultatet att vi kanske har optimerat lite för mycket då det blev ett tydligt sämre resultat på testmängden än på optimeringsmängden. Detta beror på att fler icke djur blev klassificerade som djur. När vi inte använde lemmatiserade substantiv i träningsmängden så drogs täckningen på djur ner och precisionen på både djur och icke djur sjönk. Detta beror på att vi täcker in en mycket mindre del av alla substantiv i träningsmängden med våra exempel. Regler De regler vi använde för att komma fram till resultatet ovan var: 1. [(1,1), (0, 1)] taggning av ordet efter och ordet före. 2. [(1, 1)] taggning av ordet före 3. [(1,0)] taggning av ordet 4. [(0,1), (0, 1)] ordet efter och ordet före 5. [(1,1), (1, 1)] taggning av ordet efter och taggning av ordet före Det som står innanför varje hakparenteserna är en regel. Inom parenteserna står vad som ska kontrolleras och var. I den första positionen betyder en 0 ord, 1 taggning och 2 tidigare gissning. I den andra positionen anges var i texten ordet står i för hållande till det aktuella. Där 0 betyder ordet själv, 1 ordet före, 1 ordet efter o.s.v.. Om reglerna Regel 3 tittar på ordklassen på ordet och gör att dom flesta substantiven blir klassificerade som djur eller icke djur. Syftet är att alla substantiv ska klassificeras som något och de andra reglerna ska ändra på klassificeringen i dom fall som det inte blev rätt. Regel 5 tittar på vilka ordklasser som omger det aktuella ordet. Den hittar t.ex. verb i aktiv form något som kan tänkas skilja djur från icke djur, då djur gör saker och icke djur görs det saker med. Regel 2 tittar på vilken ordklass ordet före har. Den hittar bl.a. att det ofta står prepositioner före icke djur. Man är oftare t.ex. på eller i platser, men det går inte att relatera till djur på det sättet så ofta. Regel 1 tittar på taggningen efter och ordet för. Hittar mönster för hur det brukar se ut runt djur och icke djur. Har visat sig vara effektiv att hitta saker som reglerna ovan inte klarat av att klassificera rätt. Regel 4 tittar på vilka ord som omger det aktuella ordet. Hittar mönster för hur det brukar se ut runt djur och icke djur. Har visat sig vara effektiv att hitta saker som reglerna ovan inte klarat av att klassificera rätt. Felkällor En felkälla är att vi har en liten träningsmängd. Detta leder till att vi inte får tillräckligt generella regler utan att de blir för specialiserade. Vi vet även att taggaren taggar bara rätt med ca 96% säkerhet, detta kan medföra (speciellt med liten träningsmängd) att regler som egentligen inte finns skapas. Våran definition av djur är även det en felkälla då vi t.ex. i texten utan djur har ett ord

5 som "kasinobesökare" som enligt våran definition inte är ett djur. Ordet har dock klassificerats som djur och ju kan ses syfta på en människa som enligt våran definition är ett djur. Sammanfattning Vi har gjort ett program för att klassificera substantiv som bygger på bootstrapping. Vi har lyckats få upp både täckningen och precisionen för djur utan att detta skett på bekostnad av klassificeringen av icke djur. Att vi inte fått bättre resultat än vi fått kan delvis bero på att vi har en relativt liten träningsmängd. Vi upptäckte även att om vi lemmatiserade substantiven så fick vi bättre täckning och precision på djuren. Referenser Kursboken Speech and Language Processing, Jurafsky & Martin, ISBN , Prentice Hall. Föreläsningsanteckningar i kursen 2D1418 (Språkteknologi). Program som taggar och tokeniserar text tillhandahållet av handledaren. Bilagor Koddelar vi ändrat Körningsresultat av testmängden

6 Bilaga 1, Koddelar vi ändrat # det här är gissningarna animals = ["älg","insekt","lodjur","zebra","hona","fågel","människa","skogshare","rovdjur","må rd","kattdjur","kyckling","elandantilopen","däggdjur","djur","unge","tjäder","rådjur", "orren","kalv","höna","hare","älgtjur","grävling"] # alla ord listade här kommer annoteras med "animal" nomals = ["år","vinter","tid","sjö","kg","älgstam","träd","plats","horn","föda","dag","art","vatte n","skog","meter","del","skada","land","jakt","grund","form","gran","form","del","be stånd","ved","ph värde","förekomst","hänsyn","bestånd","vintertid","tillgång", "terräng","tallskog","tall","stam","sommartid","sommar","skydd","skogsbruk","rand", "område","natur","myr","mark","jakttid","hänsyn","förekomst","björk","asp"] # allt utom djur possible_tags = ["entity", " ","animal","nomal"] # en lista på alla annoteringar som får förekomma #Regler patterns = [ [(1,1),(0, 1)], #taggning av ordet efter och ordet före. [(1, 1)], #taggning av ordet före [(1,0)], #taggning av ordet [(0,1),(0, 1)], #ordet efter och ordet före [(1,1),(1, 1)], #taggning av ordet efter och taggning av ordet före ] #Startgissning # sätt initialtillståndet, ge alla Substantiv # taggen "animal" om de finns med i exemplen för animal # annars "nomal", alla andra ord taggen " " def initial_guess(): for i in range(size): if corpus[1][i] in nn: if invlex[0][corpus[0][i]] in animals: corpus[ 2].append(int(lex[ 2]["animal"])) else: corpus[ 2].append(int(lex[ 2]["nomal"])) else: corpus[ 2].append(int(lex[ 2][" "]))

7 #läser in och sparar substantiv global nn # sparar alla substantiv gender = [".utr",".neu",".utr/neu",".mas",""] num = [".sin",".plu",".sin/plu",""] spec = [".ind",".def",".ind/def",""] case = [".nom",".gen",""] nntype = [".set",".dat",""] for i in gender: tmp = "nn" tmp = tmp + i for j in num: tmp2 = tmp tmp2 = tmp2 + j for k in spec: tmp3 = tmp2 tmp3 = tmp3 + k for l in case: tmp4 = tmp3 tmp4 = tmp4 + l for m in nntype: tmp5 = tmp4 tmp5 = tmp5 + m try: nn.append(lex[1][tmp5]) except KeyError: pass

8 Bilaga 2, körningsresultat av testmängden Resultat magenta12:~/sprak/inlupp>python inlupp.py eval test.facit test.resultat Då rätt svar var animal gissades: animal 30 ; nomal 22 ; % Då rätt svar var nomal gissades: animal 33 ; nomal 81 ; % 111 av 166 blev rätt, % Regler. magenta12:~/sprak/inlupp>python inlupp.py train text.annoterad 1... kör TBL best score: 78 byt gissning till nomal OM: PoS 0 är nn.utr.sin.ind.nom best score: 51 byt gissning till nomal OM: PoS 1 är pp best score: 41 byt gissning till nomal OM: PoS 0 är nn.utr.plu.ind.nom best score: 31 byt gissning till animal OM: PoS 0 är nn.utr.sin.def.nom best score: 24 byt gissning till nomal OM: PoS 0 är nn.neu.plu.ind.nom best score: 16 byt gissning till animal OM: PoS 0 är nn.neu.sin.ind.nom best score: 12 byt gissning till nomal OM: PoS 1 är pp best score: 10 byt gissning till nomal OM: PoS 0 är nn.neu.sin.ind.nom.set best score: 10 byt gissning till animal OM: PoS 0 är nn.utr.plu.def.nom best score: 9 byt gissning till nomal OM: PoS 0 är nn.neu.sin.def.nom best score: 6 byt gissning till nomal OM: PoS 0 är nn.neu.plu.def.nom best score: 5 byt gissning till nomal OM: PoS 0 är nn.utr.sin.ind.nom.set best score: 5 byt gissning till animal OM: PoS 1 är mad best score: 5 byt gissning till animal OM: PoS 1 är kn best score: 4 byt gissning till nomal OM: PoS 0 är nn.utr.sin.ind.nom best score: 3 byt gissning till animal OM: PoS 1 är kn OM: ord 1 är, best score: 3 byt gissning till nomal OM: PoS 1 är jj.pos.neu.sin.ind.nom best score: 3 byt gissning till animal OM: PoS 1 är vb.prs.akt.mod best score: 3 byt gissning till nomal OM: PoS 1 är ps.neu.sin.def best score: 3 byt gissning till animal OM: PoS 0 är nn.utr.plu.def.gen best score: 3 byt gissning till nomal OM: PoS 0 är nn.utr.sin.def.gen best score: 3 byt gissning till animal OM: PoS 1 är nn.neu.sin.def.nom.set best score: 2 byt gissning till nomal OM: PoS 1 är sn best score: 2 byt gissning till animal OM: PoS 1 är ab OM: PoS 1 är sn best score: 2 byt gissning till nomal OM: PoS 1 är pp OM: ord 1 är. best score: 2 byt gissning till animal OM: ord 1 är, OM: ord 1 är även best score: 2 byt gissning till nomal OM: PoS 1 är mad OM: ord 1 är i best score: 2 byt gissning till animal OM: PoS 1 är kn OM: ord 1 är. best score: 2 byt gissning till animal OM: ord 1 är. OM: ord 1 är med best score: 2 byt gissning till animal OM: PoS 1 är kn OM: PoS 1 är jj.kom.utr/neu.sin/plu.ind/def.nom best score: 2 byt gissning till animal OM: PoS 1 är kn OM: PoS 1 är kn best score: 2 byt gissning till nomal OM: PoS 1 är jj.suv.utr/neu.sin/plu.def.nom best score: 2 byt gissning till nomal OM: PoS 1 är pp OM: PoS 1 är pp best score: 2 byt gissning till animal OM: PoS 1 är nn.utr.sin.ind.nom OM: ord 1 är av best score: 1 byt gissning till animal OM: PoS 1 är nn.utr.plu.ind.nom OM: ord 1 är moderna best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är är

9 best score: 1 byt gissning till animal OM: PoS 1 är ab OM: PoS 1 är pc.prs.utr/neu.sin/plu.ind/def.nom best score: 1 byt gissning till nomal OM: PoS 1 är vb.prs.akt.kop OM: PoS 1 är jj.pos.utr/neu.sin.def.nom best score: 1 byt gissning till animal OM: ord 1 är uppväxande OM: ord 1 är även best score: 1 byt gissning till animal OM: ord 1 är är OM: ord 1 är med best score: 1 byt gissning till nomal OM: PoS 1 är ab OM: PoS 1 är jj.pos.utr/neu.plu.ind/def.nom best score: 1 byt gissning till animal OM: PoS 1 är vb.prs.akt.kop OM: ord 1 är att best score: 1 byt gissning till nomal OM: PoS 1 är nn.neu.sin.ind.nom OM: PoS 1 är vb.prs.akt best score: 1 byt gissning till animal OM: PoS 1 är vb.prt.akt best score: 1 byt gissning till animal OM: ord 1 är som OM: ord 1 är till best score: 1 byt gissning till animal OM: PoS 1 är nn.neu.sin.ind.nom OM: ord 1 är är best score: 1 byt gissning till animal OM: PoS 1 är pad OM: PoS 1 är jj.pos.utr/neu.plu.ind/def.nom best score: 1 byt gissning till nomal OM: PoS 1 är nn.utr.sin.ind.nom OM: PoS 1 är pc.prs.utr/neu.sin/plu.ind/def.nom best score: 1 byt gissning till animal OM: PoS 1 är mad OM: ord 1 är vinter best score: 1 byt gissning till animal OM: PoS 1 är vb.sup.akt OM: PoS 1 är jj.pos.utr/neu.plu.ind/def.nom best score: 1 byt gissning till animal OM: PoS 1 är vb.prs.akt.kop OM: ord 1 är många best score: 1 byt gissning till animal OM: PoS 1 är hp OM: ord 1 är grupp best score: 1 byt gissning till animal OM: ord 1 är som OM: ord 1 är antal best score: 1 byt gissning till animal OM: PoS 1 är kn OM: PoS 1 är jj.suv.utr/neu.sin/plu.def.nom best score: 1 byt gissning till animal OM: PoS 1 är pad OM: ord 1 är " best score: 1 byt gissning till animal OM: PoS 1 är sn OM: PoS 1 är jj.pos.utr/neu.plu.ind.nom best score: 1 byt gissning till animal OM: PoS 1 är ab.pos OM: ord 1 är mot best score: 1 byt gissning till animal OM: PoS 1 är kn OM: PoS 1 är ab best score: 1 byt gissning till animal OM: PoS 1 är pp OM: ord 1 är dressera best score: 1 byt gissning till nomal OM: PoS 1 är dt.utr.sin.def OM: PoS 1 är vb.prs.akt best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är, best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är attackerande best score: 1 byt gissning till animal OM: ord 1 är gärna OM: ord 1 är jagar best score: 1 byt gissning till nomal OM: ord 1 är för OM: ord 1 är t.ex. best score: 1 byt gissning till animal OM: ord 1 är vistas OM: ord 1 är ensamma best score: 1 byt gissning till animal OM: PoS 1 är hp OM: PoS 1 är pm.gen best score: 1 byt gissning till nomal OM: PoS 1 är mad OM: PoS 1 är pad best score: 1 byt gissning till animal OM: PoS 1 är mad OM: ord 1 är europeiska best score: 1 byt gissning till nomal OM: PoS 1 är ab.pos OM: ord 1 är återetablerades best score: 1 byt gissning till nomal OM: PoS 1 är ps.neu.sin.def OM: ord 1 är får best score: 1 byt gissning till animal OM: PoS 1 är kn OM: ord 1 är med best score: 1 byt gissning till animal OM: ord 1 är inte OM: ord 1 är andra best score: 1 byt gissning till animal OM: PoS 1 är mad OM: ord 1 är kontroversiellt best score: 1 byt gissning till nomal OM: ord 1 är ökar OM: ord 1 är då

10 best score: 1 byt gissning till animal OM: ord 1 är hör OM: ord 1 är grants best score: 1 byt gissning till animal OM: PoS 1 är mid OM: PoS 1 är jj.pos.utr/neu.plu.ind/def.nom best score: 1 byt gissning till nomal OM: PoS 1 är mid OM: ord 1 är svarta best score: 1 byt gissning till nomal OM: ord 1 är, OM: ord 1 är forna best score: 1 byt gissning till animal OM: PoS 1 är kn OM: PoS 1 är rg.utr/neu.plu.ind/def.nom best score: 1 byt gissning till animal OM: PoS 1 är vb.prt.akt OM: ord 1 är egna best score: 1 byt gissning till animal OM: PoS 1 är hp OM: ord 1 är stora best score: 1 byt gissning till animal OM: PoS 1 är pp OM: ord 1 är sina best score: 1 byt gissning till nomal OM: PoS 1 är pp OM: ord 1 är allmänna best score: 1 byt gissning till nomal OM: ord 1 är vinner OM: ord 1 är. best score: 1 byt gissning till animal OM: PoS 1 är mad OM: PoS 1 är pc.prs.utr/neu.sin/plu.ind/def.nom best score: 1 byt gissning till nomal OM: ord 1 är. OM: ord 1 är uppväxande best score: 1 byt gissning till nomal OM: PoS 1 är pp OM: ord 1 är och best score: 1 byt gissning till nomal OM: ord 1 är har OM: ord 1 är men best score: 1 byt gissning till animal OM: ord 1 är i OM: ord 1 är visst best score: 1 byt gissning till animal OM: PoS 1 är mad OM: ord 1 är mot best score: 1 byt gissning till nomal OM: ord 1 är. OM: ord 1 är minska best score: 1 byt gissning till animal OM: PoS 1 är pp OM: ord 1 är jagades best score: 1 byt gissning till nomal OM: PoS 1 är mad OM: PoS 1 är hp best score: 1 byt gissning till nomal OM: PoS 1 är mad OM: PoS 1 är dt.neu.sin.ind best score: 1 byt gissning till nomal OM: ord 1 är minst OM: ord 1 är är best score: 1 byt gissning till animal OM: PoS 1 är mad OM: ord 1 är best score: 1 byt gissning till animal OM: PoS 1 är vb.prs.akt OM: PoS 1 är jj.pos.utr.sin.ind.nom best score: 1 byt gissning till nomal OM: PoS 1 är dt.utr.sin.def best score: 1 byt gissning till animal OM: PoS 1 är kn OM: ord 1 är sig best score: 1 byt gissning till nomal OM: PoS 1 är ab OM: ord 1 är börjar best score: 1 byt gissning till nomal OM: PoS 1 är pp OM: PoS 1 är vb.inf.akt.kop best score: 1 byt gissning till animal OM: ord 1 är kan OM: ord 1 är åt best score: 1 byt gissning till animal OM: PoS 1 är vb.prs.sfo OM: ord 1 är vuxna best score: 1 byt gissning till nomal OM: ord 1 är återhämtade OM: ord 1 är. best score: 1 byt gissning till nomal OM: PoS 1 är vb.sup.akt.mod OM: PoS 1 är vb.prs.akt.aux best score: 1 byt gissning till animal OM: ord 1 är finner OM: ord 1 är med best score: 1 byt gissning till animal OM: ord 1 är beräknas OM: ord 1 är av best score: 1 byt gissning till animal OM: PoS 1 är vb.prs.akt OM: ord 1 är mängd best score: 1 byt gissning till animal OM: ord 1 är framför OM: ord 1 är bergslagsskogarnas best score: 1 byt gissning till nomal OM: PoS 1 är mid OM: ord 1 är något best score: 1 byt gissning till animal OM: PoS 1 är nn.neu.plu.ind.nom OM: PoS 1 är pp best score: 1 byt gissning till nomal OM: PoS 1 är pp OM: ord 1 är hålla best score: 1 byt gissning till nomal OM: ord 1 är, OM: ord 1 är täta best score: 1 byt gissning till animal OM: ord 1 är. OM: ord 1 är andra best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är sort best score: 1 byt gissning till animal OM: ord 1 är med OM: ord 1 är förutom best score: 1 byt gissning till animal OM: ord 1 är ) OM: ord 1 är vanlig best score: 1 byt gissning till animal OM: ord 1 är under OM: ord 1 är om

11 best score: 1 byt gissning till animal OM: ord 1 är ner OM: ord 1 är ofta best score: 1 byt gissning till nomal OM: ord 1 är började OM: ord 1 är och best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är till best score: 1 byt gissning till animal OM: ord 1 är nervösa OM: ord 1 är trots best score: 1 byt gissning till nomal OM: ord 1 är. OM: ord 1 är djupa best score: 1 byt gissning till animal OM: ord 1 är kan OM: ord 1 är och best score: 1 byt gissning till animal OM: ord 1 är, OM: ord 1 är som best score: 1 byt gissning till animal OM: ord 1 är med OM: ord 1 är en

Maskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi

Maskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning

Läs mer

Grundläggande textanalys, VT2013

Grundläggande textanalys, VT2013 Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska

Läs mer

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil? Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Innehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson

Innehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson GRAMMATIKKONTROLL I GRANSKA Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder för grammatikkontroll Granska Granskas regelspråk Att skriva regler i Granska Inför laborationen

Läs mer

Kungl. Tekniska högskolan NADA Grundformer med Stava

Kungl. Tekniska högskolan NADA Grundformer med Stava Kungl. Tekniska högskolan NADA Grundformer med Stava Språkteknologi 2D1418 Höstterminen 2004 Författare: Andreas Pettersson az@kth.se 1. Bakgrund Om man automatiskt ska plocka ut de informationsbärande

Läs mer

Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?

Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns? Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning. Granska Att skriva regler i Granska.

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Gränssnitt för FakeGranska. Lars Mattsson

Gränssnitt för FakeGranska. Lars Mattsson Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken

Läs mer

Morfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)

Morfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag) Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Tentamen 2016-01-13. Marco Kuhlmann

Tentamen 2016-01-13. Marco Kuhlmann TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga

Läs mer

Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad

Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort

Läs mer

Dependensregler - Lathund

Dependensregler - Lathund Dependensregler - Lathund INTRODUKTION I textprogrammet TeCST är det möjligt för en skribent att skriva, redigera och klistra in text för att få ut läsbarhetsmått och få förslag på hur texten kan skrivas

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas

Läs mer

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap 729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001

Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001 Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger

Läs mer

Laboration: Whitebox- och blackboxtesting

Laboration: Whitebox- och blackboxtesting Tilda11 höstterminen 2011 Laboration: Whitebox- och blackboxtesting Mål med laborationen Du ska lära dig begreppen white-box testing och black-box testing Du ska öva dig på att konstruera testfall Du ska

Läs mer

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Grim. Några förslag på hur du kan använda Grim. Version 0.8 Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform

Läs mer

GRUNDKURS I C-PROGRAMMERING

GRUNDKURS I C-PROGRAMMERING SAMMANSTÄLLNING 1 (9) Inst för informationsteknologi GRUNDKURS I C-PROGRAMMERING del av 1TD442 ALGORITMER OCH DATASTRUKTURER DV1/ 1IT022 PROGRAMKONSTRUKTION II Period 3, 2006 DV/IT Sammanfattning: Vad

Läs mer

Kunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt.

Kunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt. Kunskapsgraf Fredrik Åkerberg j.f.akerberg@gmail.com Tommy Kvant tommy.kvant@gmail.com 1 Introduktion Målet med projektet var att undersöka huruvida DBpedia.org, kan användas för att besvara frågor på

Läs mer

Korpuslingvistik vt 2007

Korpuslingvistik vt 2007 Korpuslingvistik vt 2007 Metoder för annotering II och utvärdering Beata B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk

Läs mer

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår

Läs mer

Meningssegmentering i SUC och Talbanken

Meningssegmentering i SUC och Talbanken Meningssegmentering i SUC och Talbanken Mattias Edlund och Gvargis Demir Institutionen för lingvistik och filologi Uppsala Universitet Box 635 SE-751 26 Uppsala SWEDEN {matted,gevargis}@stp.lingfil.uu.se

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser

Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Richard Johansson richard.johansson@svenska.gu.se 19 februari 2014 praktiska detaljer: tenta vilket datum föredrar ni när det gäller tentan?

Läs mer

Majoritetsgranskaren ett sätt att förbättra grammatikgranskare genom att kombinera dem LINDA NORELIUS

Majoritetsgranskaren ett sätt att förbättra grammatikgranskare genom att kombinera dem LINDA NORELIUS Majoritetsgranskaren ett sätt att förbättra grammatikgranskare genom att kombinera dem LINDA NORELIUS Examensarbete Stockholm, Sverige 2009 Majoritetsgranskaren ett sätt att förbättra grammatikgranskare

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Ordklasser. Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.

Ordklasser. Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv. Ordklasser Substantiv Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv. Konkreta och abstrakta substantiv Konkreta substantiv kallas

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna

Läs mer

b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)

b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.) LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk

Läs mer

Identifiering av ordvitsar med Granska

Identifiering av ordvitsar med Granska Identifiering av ordvitsar med Granska jonord@kth.se Inledning För att försöka identifiera ordvitsar med Granska användes ett litet urval av ordvitsar hämtade från olika ställen. Målet med identifiering

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

C++ Slumptalsfunktioner + switch-satsen

C++ Slumptalsfunktioner + switch-satsen C++ Slumptalsfunktioner + switch-satsen Veckans avsnitt består av ett antal lite udda funktioner man kan ha nytta av när man skriver program. Det är en slumptalsgenerator och lite annat smått och gott.

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Statistisk Maskinöversättning eller:

Statistisk Maskinöversättning eller: 729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Sätt att skriva ut binärträd

Sätt att skriva ut binärträd Tilpro Övning 3 På programmet idag: Genomgång av Hemtalet samt rättning Begreppet Stabil sortering Hur man kodar olika sorteringsvilkor Inkapsling av data Länkade listor Användning av stackar och köer

Läs mer

TDDC74 Lab 04 Muterbara strukturer, omgivningar

TDDC74 Lab 04 Muterbara strukturer, omgivningar TDDC74 Lab 04 Muterbara strukturer, omgivningar 1 Översikt I den här laborationen kommer ni att lära er mer om: Tillstånd, och skillnader mellan ren funktionell programmering och imperativ. Skillnaden

Läs mer

DD1311 Programmeringsteknik för S1 Laborationer läsåret 2007-2008

DD1311 Programmeringsteknik för S1 Laborationer läsåret 2007-2008 DD1311 meringsteknik för S1 Laborationer läsåret 2007-2008 Fyll i ditt namn och personnummer med bläck eller motsvarande. Kursledare är Linda Kann, linda@nada.kth.se. Namn... Personnr... Laborationer Labb

Läs mer

Välkommen att träna skriva!

Välkommen att träna skriva! Välkommen att träna skriva! B-kurs I det här häftet ska du träna på olika skrivövningar. De hjälper dig att bli bättre på att skriva. Om du är på C- eller D-kurs kan du repetera. Du behöver träna på både

Läs mer

Lingvistiska grundbegrepp

Lingvistiska grundbegrepp 729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga

Läs mer

Föreläsning 4 Programmeringsteknik DD1310. Felhantering. Syntax. try och except är reserverade ord som används för hantering av exekverings fel.

Föreläsning 4 Programmeringsteknik DD1310. Felhantering. Syntax. try och except är reserverade ord som används för hantering av exekverings fel. Föreläsning 4 meringsteknik DD1310 Definiering av egna funktioner Parametrar Lokala och globala variabler Retursats None try och except är reserverade ord som används för hantering av exekverings fel.

Läs mer

Tentamen i Introduktion till programmering

Tentamen i Introduktion till programmering Tentamen i Introduktion till programmering Kurskod: Skrivtid: D0009E 09:00-13:00 (4 timmar) Totalt antal uppgifter: 7 Totalt antal poäng: 38 Tentamensdatum: 2014-05-17 Jourhavande lärare: Tillåtna hjälpmedel:

Läs mer

Föreläsning 2 Programmeringsteknik och Matlab DD1312. Programspråk. Utskrift på skärmen

Föreläsning 2 Programmeringsteknik och Matlab DD1312. Programspråk. Utskrift på skärmen Föreläsning 2 Programmeringsteknik och Matlab DD1312 Introduktion till python Variabler,datatyper, omvandling av typer sfunktioner Två olika typer av program omvandlar högnivå till lågnivå program: Interpreterande

Läs mer

Planering Programmering grundkurs HI1024 HT TIDAA

Planering Programmering grundkurs HI1024 HT TIDAA Planering Programmering grundkurs HI1024 HT 2016 - TIDAA Föreläsning V35 Föreläsning 1 Programmering Kurs-PM Programmeringsmiljö Hello World! Variabler printf scanf Föreläsning 2 Operatorer Tilldelning

Läs mer

Variator Automatisk synonymvariering av text

Variator Automatisk synonymvariering av text Variator Automatisk synonymvariering av text Magnus Rosell 27 mars 2006 Sammanfattning Detta är en rapport om min individuella uppgift i kursen Språkgranskningsverktyg inom GSLT. Den beskriver ett litet

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019 Labb 1: KORP vid

Läs mer

MMA132: Laboration 2 Matriser i MATLAB

MMA132: Laboration 2 Matriser i MATLAB MMA132: Laboration 2 Matriser i MATLAB Introduktion I den här labben skall vi lära oss hur man använder matriser och vektorer i MATLAB. Det är rekommerad att du ser till att ha laborationshandledningen

Läs mer

Klassificering av homonymer Inlämningsuppgift språkteknologi

Klassificering av homonymer Inlämningsuppgift språkteknologi Klassificering av homonymer Inlämningsuppgift språkteknologi 2013-01-10 Kurskod: DD2418 Författare Gustav Ribom 910326-0593 Erik Aalto 861108-0212 Kontaktperson Johan Boye Abstract Ordet fil har flera

Läs mer

1/15/2013. DD1310/DD1314/DA3009 Programmeringsteknik. Lärandemål... Vilka läser kursen? ...fler lärandemål VARFÖR? Föreläsning 1

1/15/2013. DD1310/DD1314/DA3009 Programmeringsteknik. Lärandemål... Vilka läser kursen? ...fler lärandemål VARFÖR? Föreläsning 1 Skolan för Datavetenskap och kommunikation DD1310/DD1314/DA3009 Programmeringsteknik Föreläsning 1 Kursinfo Diagnostiskt prov Python-intro: print variabler reserverade ord input kommentarer beräkningar

Läs mer

Föreläsning 2 Programmeringsteknik och Matlab DD1312. Programspråk. Utskrift på skärmen

Föreläsning 2 Programmeringsteknik och Matlab DD1312. Programspråk. Utskrift på skärmen Föreläsning 2 Programmeringsteknik och Matlab DD1312 Introduktion till python Variabler, datatyper, omvandling av typer sfunktioner Två olika typer av program omvandlar högnivå till lågnivå program: Interpreterande

Läs mer

Planering Programmering grundkurs HI1024 HT 2015 - data

Planering Programmering grundkurs HI1024 HT 2015 - data Planering Programmering grundkurs HI1024 HT 2015 - data Föreläsning V36 Föreläsning 1 Programmering Kurs-PM Programmeringsmiljö Hello World! Variabler printf scanf Föreläsning 2 Operatorer Tilldelning

Läs mer

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2016) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Från form till betydelse pragmatik semantik analys generering syntax morfologi Skolans

Läs mer

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen:

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen: Modul: Algebra Del 8: Avslutande reflektion och utvärdering Distributiva lagen Cecilia Kilhamn, Göteborgs Universitet Distributiva lagen a (b + c) = a b + a c Den distributiva lagen kallas den räknelag

Läs mer

Datalogi, grundkurs 1

Datalogi, grundkurs 1 Datalogi, grundkurs 1 Tentamen 10 december 2008 konverterad till Python Hjälpmedel: Kommer att finnas i skrivsalarna, bl.a. Revised 6 Report on the Algorithmic Language Scheme och två olika s.k. Cheat

Läs mer

Använda Python Laboration 1 GruDat, DD1344

Använda Python Laboration 1 GruDat, DD1344 Använda Python Laboration 1 GruDat, DD1344 Örjan Ekeberg 14 oktober 2008 Målsättning Målet med denna laboration är att du ska prova på att använda Python, framförallt interativt. Du ska också lära dig

Läs mer

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31) Korpusannotering Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusannotering 1(31) Förra gången Att bygga en korpus sampling uppmärkning annotering

Läs mer

GIT L0006B. C# och Windowsbaserad applikationsutveckling. Information inför kursstart

GIT L0006B. C# och Windowsbaserad applikationsutveckling. Information inför kursstart GIT L0006B C# och Windowsbaserad applikationsutveckling Information inför kursstart Innehåll Registrering 2 Kursplan 2 Schema 2 Föreläsningar 2 Laborationer 2 Examination 2 Litteratur 3 Referenslitteratur

Läs mer

Korpuslingvistik vt 2007

Korpuslingvistik vt 2007 Korpuslingvistik vt 2007 Metoder för annotering I Beáta B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk segmentering/analys,

Läs mer

Chapter 3: Using Classes and Objects

Chapter 3: Using Classes and Objects Chapter 3: Using Classes and Objects I dessa uppgifter kommer du att lära dig om hur man använder klasser och metoder från java biblioteket. Du kommer inte att förstå allt som händer bakom metod anrop

Läs mer

Partiell parsning Parsning som sökning

Partiell parsning Parsning som sökning Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater

Läs mer

TDDC74 - Lektionsmaterial C

TDDC74 - Lektionsmaterial C TDDC74 - Lektionsmaterial C Lektioner innehåller uppgifter av varierande slag. En del är mer diskussionsartade, andra mer experimentella. Ni behöver inte lämna in eller visa upp lösningarna på dessa för

Läs mer

L04.1 Marodören. Inledning. Mål. Genomförande. Uppgift 1 Hello World. Moment I

L04.1 Marodören. Inledning. Mål. Genomförande. Uppgift 1 Hello World. Moment I L04.1 Marodören Inledning Genom att öva sig på de grundläggande koncepten i JavaScript öppnas vägen allteftersom till de mer avancerade funktionerna. Man måste lära sig krypa innan man kan gå, även i JavaScript!

Läs mer

Introduktion till programmering med hjälp av Lego Mindstorm

Introduktion till programmering med hjälp av Lego Mindstorm Kungliga Tekniska Högskolan Introduktion till programmering med hjälp av Lego Mindstorm Laborationsrapport gällande programmering inom NXC Simon Jansson 31 08 2014 simonjan@kth.se Introduktionskurs i datateknik

Läs mer

Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: på läger Lärarmaterial. Författare: Kirsten Ahlburg

Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: på läger Lärarmaterial. Författare: Kirsten Ahlburg sidan 1 Författare: Kirsten Ahlburg Vad handlar boken om? Boken handlar om Noa som ska på läger med scouterna. När de kommer fram till stugan går alla ut i skogen för att samla ved. Noa kommer ifrån de

Läs mer

Användarhandledning Version 1.2

Användarhandledning Version 1.2 Användarhandledning Version 1.2 Innehåll Bakgrund... 2 Börja programmera i Xtat... 3 Allmänna tips... 3 Grunderna... 3 Kommentarer i språket... 4 Variabler... 4 Matematik... 5 Arrayer... 5 på skärmen...

Läs mer

Grundläggande datalogi - Övning 1

Grundläggande datalogi - Övning 1 Grundläggande datalogi - Övning 1 Björn Terelius October 30, 2008 Python är ett tolkat språk som kan köras interaktivt. tcs-ray:~/grudat08>python >>> 11+3*4 23 >>> a = 15 >>> b=a >>> print "a =", a, "b

Läs mer

Torun Berlind Elin Önstorp Sandra Gustavsson Klas Nordberg. Föreläsningar Lektioner Laborationer Projekt

Torun Berlind Elin Önstorp Sandra Gustavsson Klas Nordberg. Föreläsningar Lektioner Laborationer Projekt 1 (6) TSBB09-Bildsensorer Sändlista Håkan Örman Torun Berlind Elin Önstorp Sandra Gustavsson Klas Nordberg Kurskod TSBB09 Examinator Klas Nordberg Kursen gavs Årskurs 4 Termin 1 Period 2 Kursens delar

Läs mer

Välkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1.

Välkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1. Välkomna till DIT012 IPGO 1 Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1. Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare

Läs mer

Programmering och algoritmiskt tänkande. Tema 3, föreläsning 1 Jody Foo

Programmering och algoritmiskt tänkande. Tema 3, föreläsning 1 Jody Foo Programmering och algoritmiskt tänkande Tema 3, föreläsning 1 Jody Foo Tema 3: Översikt Objektorienterad programmering: fortsättning Tema 1 och 2: Exempel på att använda och skapa algoritmer Tema 3: strukturera

Läs mer

Laboration 3 HI1024, Programmering, grundkurs, 8.0 hp

Laboration 3 HI1024, Programmering, grundkurs, 8.0 hp Laboration 3 HI1024, Programmering, grundkurs, 8.0 hp Dataingenjörsprogrammet, elektroingenjörsprogrammet och medicinsk teknik KTH Skolan för Teknik och Hälsa Redovisning: Se Kurs-PM om hur redovisningen

Läs mer

Automatisk Sentimentklassificering av Twitter-inlägg

Automatisk Sentimentklassificering av Twitter-inlägg [TYPE THE COMPANY NAME] Automatisk Sentimentklassificering av Twitter-inlägg Språkteknologi DD2418 Binxin Su, Christian Davilém 1/8/2013 [Type the abstract of the document here. The abstract is typically

Läs mer

JavaScript del 5 Funktioner

JavaScript del 5 Funktioner JavaScript del 5 Funktioner När man skriver JavaScriptkod eller program i andra programmeringsspråk för den delen så kan det finnas anledningar till att man vill dela upp sitt stora program i flera mindre

Läs mer

Signalbehandling Röstigenkänning

Signalbehandling Röstigenkänning L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1

Läs mer

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala

Läs mer

Lycka till med pluggandet! Tro på dig själv! VI HAR FÖRHÖRET TORSDAG DEN 7/4-16.

Lycka till med pluggandet! Tro på dig själv! VI HAR FÖRHÖRET TORSDAG DEN 7/4-16. Ordklasser Alla orden i svenska språket kan delas in i grupper som kallas ordklasser. Vi har nu arbetat med ordklasserna substantiv, adjektiv och verb. Nu ska du repetera hemma, så att du verkligen vet

Läs mer

1 Vilka ord är substantiv? Läs texten.

1 Vilka ord är substantiv? Läs texten. 3 Ordklasser Ordklasser har du säkert hört talas om förut. Men varför finns det ordklasser? Hur ska man veta vilka ord som hör till vilken ordklass? Och varför ska man veta det? Tänk dig att du har alla

Läs mer

Enkätresultat för SIK15 Omvärldsanalys och informationssökning 7,5 hp. 31SOI1 H15-1 Kursansvariga: Rolf Hasslöw, Ingrid Johansson

Enkätresultat för SIK15 Omvärldsanalys och informationssökning 7,5 hp. 31SOI1 H15-1 Kursansvariga: Rolf Hasslöw, Ingrid Johansson Enkätresultat för SIK15 Omvärldsanalys och informationssökning 7,5 hp. 31SOI1 H15-1 Kursansvariga: Rolf Hasslöw, Ingrid Johansson Enkäten är besvarad av 16 studenter (av 42 möjliga) vilket motsvarar 38%.

Läs mer

Bahati. En simulering att använda i undervisningen om internationella frågor

Bahati. En simulering att använda i undervisningen om internationella frågor En simulering att använda i undervisningen om internationella frågor Sida 2 Inledning Bahati är en simulering där deltagarna får pröva på att leva i två olika kulturer; Fabel och Abel. Människorna i Fabel

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019 Labb 1: KORP vid

Läs mer

Laboration i datateknik

Laboration i datateknik KUNGLIGA TEKNISKA HÖGSKOLAN Laboration i datateknik Felsökning och programmering av LEGO NXT robot Daniel Willén 2012 09 06 dwill@kth.se Introduktionskurs i datateknik II1310 Sammanfattning Syftet med

Läs mer

LABBINTRODUKTION. Laboranter: Kurs: - Sonny Johansson, Sigurd Israelsson. Utskriftsdatum: 2015-08-20

LABBINTRODUKTION. Laboranter: Kurs: - Sonny Johansson, Sigurd Israelsson. Utskriftsdatum: 2015-08-20 LABBINTRODUKTION Laboranter: Kurs: - Klass: DD15 Handledare: Sonny Johansson, Sigurd Israelsson Utskriftsdatum: 2015-08-20 Mål, syfte, förutsättningar Mål Labbintroduktionen skall ge studenten en chans

Läs mer

Idag: Centrerad utskrift. Granskning. DD1311 Programmeringsteknik med PBL. Granskning Felhantering GUI. Föreläsning 15.

Idag: Centrerad utskrift. Granskning. DD1311 Programmeringsteknik med PBL. Granskning Felhantering GUI. Föreläsning 15. Skolan för Datavetenskap och kommunikation Idag: DD1311 Programmeringsteknik med PBL Granskning Felhantering GUI Föreläsning 15 På torsdag: Mer om GUI På grupptimmen: genomgång av granskningsprotokollet

Läs mer

grammatik Ordklasser, nominalfraser, substantiv

grammatik Ordklasser, nominalfraser, substantiv Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,

Läs mer

PAROLE Exempel Förklaring SUC. PARTICIP AF00000A tf particip förkortning PC AN. pluralis obestämd/bestämd genitiv. pluralis obestämd/bestämd nominativ

PAROLE Exempel Förklaring SUC. PARTICIP AF00000A tf particip förkortning PC AN. pluralis obestämd/bestämd genitiv. pluralis obestämd/bestämd nominativ Nyckel till SUCs taggset i PAROLE-format Från Språkbanken: http://spraakbanken.gu.se/ PAROLE Exempel Förklaring SUC PARTICIP AF00000A tf particip förkortning PC AN AF00PG0S deporterades AF00PN0S kallade

Läs mer

Programmering II (ID1019) :00-11:00

Programmering II (ID1019) :00-11:00 ID1019 Johan Montelius Programmering II (ID1019) 2015-06-11 08:00-11:00 Instruktioner Du får inte ha något materiel med dig förutom skrivmateriel. Mobiler etc, skall lämnas till tentamensvakten. Svaren

Läs mer

DD1310/DD1314/DA3009 Programmeringsteknik LÄRANDEMÅL... Vilka läser kursen? ...FLER LÄRANDEMÅL. Föreläsning 1

DD1310/DD1314/DA3009 Programmeringsteknik LÄRANDEMÅL... Vilka läser kursen? ...FLER LÄRANDEMÅL. Föreläsning 1 Skolan för Datavetenskap och kommunikation DD1310/DD1314/DA3009 Programmeringsteknik Föreläsning 1 Kursinfo Python-intro: print variabler reserverade ord input kommentarer beräkningar datatyper if-satser

Läs mer

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering...

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering... Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering... 4 Bussen (projektförslag)... 5 Bakgrund... 5 Klassen Buss

Läs mer