Grundläggande textanalys, VT2012
|
|
- Carina Åkesson
- för 5 år sedan
- Visningar:
Transkript
1 Grundläggande textanalys, VT2012 Rum (Tack till ofia Gustafson-Capkovâ för material.)
2 Repetition 2
3 Exempel parvspråket parvspråket består av ett godtyckligt antal pip sammanbundet med - och avslutas med!. Exempel: pip! pip-pip! pip-pip-pip! Hur ser det reguljära uttrycket för sparvspråket ut? 3
4 Exempel parvspråket parvspråket består av ett godtyckligt antal pip sammanbundet med - och avslutas med!. Exempel: pip! pip-pip! pip-pip-pip! Hur ser det reguljära uttrycket för sparvspråket ut? Lösning: Ordet börjar med: pip 4
5 Exempel parvspråket parvspråket består av ett godtyckligt antal pip sammanbundet med - och avslutas med!. Exempel: pip! pip-pip! pip-pip-pip! Hur ser det reguljära uttrycket för sparvspråket ut? Lösning: Ordet börjar med: pip Ordet fortsätter med 0 eller flera -pip : pip(-pip)* 5
6 Exempel parvspråket parvspråket består av ett godtyckligt antal pip sammanbundet med - och avslutas med!. Exempel: pip! pip-pip! pip-pip-pip! Hur ser det reguljära uttrycket för sparvspråket ut? Lösning: Ordet börjar med: pip Ordet fortsätter med 0 eller flera -pip : pip(-pip)* Ordet avslutas med! : pip(-pip)*! var: pip(-pip)*! 6
7 Exempel parvspråket Hur ser den deterministiska finita automaten för sparvspråket ut? Lösning: Automaten ska tillåta: pip p I i P p T 7
8 Exempel parvspråket Hur ser den deterministiska finita automaten för sparvspråket ut? Lösning: Automaten ska tillåta: pip Automaten ska tillåta: pip(-pip)* p I i P p T - 8
9 Exempel parvspråket Hur ser den deterministiska finita automaten för sparvspråket ut? Lösning: Automaten ska tillåta: pip Automaten ska tillåta: pip(-pip)* Automaten ska acceptera: pip(-pip)*! p I i P p T -! F 9
10 Exempel parvspråket Hur ser typ3-grammatiken för sparvspråket ut? Lösning: pi I ip P pt T - T! 10
11 Exempel parvspråket Hur ser typ3-grammatiken för sparvspråket ut? Lösning: pi I ip P pt T - T! Om vi vill tillåta piip piip-pip!, osv. Hur ska grammatiken se ut då? 11
12 Exempel parvspråket Hur ser typ3-grammatiken för sparvspråket ut? Lösning: pi I ip I ii P pt T - T! Lägg till den här regeln 12
13 Idag - Chomsky hierarki - Icke-deterministiska automater - ökning i automater - The pumpning lemma (sv. Pumpsatsen) - Tvånivåmorfologi 13
14 Chomsky hierarki 14
15 Chomsky hierarki - typ 3 reguljärt språk ändlig automat Regler: A xa A x 15
16 Chomsky hierarki - typ 2 ammanhangsfritt språk Regel: A β där : β är en godtycklig sträng Α måste innehålla någon icke-terminal 16
17 Chomsky hierarki - typ 2 ammanhangsfritt språk Ex: () ( ) pushdown automat (, ε / ( ), ( /ε 1 ), (/ ε 2 ε, ε/ε 3 a, b / c - betyder att om man läser a och hittar b på stacken(minnet) så ersätter man b med c 17
18 Chomsky hierarki - typ 2 ammanhangsfritt språk Ex: () ( ) pushdown automat (, ε / ( ), ( /ε 1 ), (/ ε 2 ε, ε/ε 3 indata: (()) stack: 18
19 Chomsky hierarki - typ 2 ammanhangsfritt språk Ex: () ( ) pushdown automat (, ε / ( ), ( /ε 1 ), (/ ε 2 ε, ε/ε 3 indata: (()) stack: ( 19
20 Chomsky hierarki - typ 2 ammanhangsfritt språk Ex: () ( ) pushdown automat (, ε / ( ), ( /ε 1 ), (/ ε 2 ε, ε/ε 3 indata: (()) stack: (( 20
21 Chomsky hierarki - typ 2 ammanhangsfritt språk pushdown automat (, ε / ( ), ( /ε 1 ), ( / ε 2 ε, ε/ε 3 indata: (()) stack: ( 21
22 Chomsky hierarki - typ 2 ammanhangsfritt språk pushdown automat (, ε / ( ), ( /ε 1 ), ( / ε 2 ε, ε/ε 3 indata: (()) stack: 22
23 Chomsky hierarki - typ 2 ammanhangsfritt språk pushdown automat (, ε / ( ), ( /ε 1 ), ( / ε 2 ε, ε/ε 3 indata: (()) stack: 23
24 Chomsky hierarki - typ1 ammanhangskänslig grammatik. α β där : α, och β är godtyckliga α måste innehålla någon icke-terminal - β måste ha minst samma längd som α Motsvarande automat är en turingmaskin med begränsad storlek på indatan. 24
25 Chomsky hierarki - typ0 Restriktionsfria språk Regel: α β Där : α, och β är godtyckliga α måste innehålla någon icke-terminal Exempel: ε abnc bna abn bnb bbn bnc bc Genererar: {abc, aabbcc,...} Motsvarande automat är en turingmaskin 25
26 Chomsky hierarki (presenterades 1959) Enkelt pråk Grammatik maskin Exempel regulärt regulär ändlig automat m* sammanhangsfritt sammanhangsfri pushdown automat m n u n sammanhangskänsligt sammanhangskänslig linjär-bunden automat m n u n! n Rekusiv enumerbart orestriktiv turingmaskin vilken funktion som helst Komplext 26
27 Icke deterministiska finita automater 27
28 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: a 1 2 b 3 a 4 c indata: ab 28
29 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: a 1 2 b 3 a 4 c indata: a b Vi väljer övergången 1 a 2. 29
30 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: a 1 2 b 3 a 4 c indata: ab Vi hamnar i finalståndet s3 och strängen ab accepteras av automaten. 30
31 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Vad händer om vi väljer 1 a 4? a 1 2 b 3 a 4 c Indata: ab 31
32 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Vad händer om vi väljer 1 a 4? a 1 2 b 3 a 4 c Indata: a b Vi väljer övergången 1 a 4 32
33 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Vad händer om vi väljer 1 a 4? a 1 2 b 3 a 4 c Indata: a b Vi har ingen övergång som innehåller b så nu har vi hamnat i en återvändsgränd. Vad gör vi nu? 33
34 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Vad händer om vi väljer 1 a 4? a 1 2 b 3 a 4 c Indata: a b Vi har ingen övergång som innehåller b så nu har vi hamnat i en återvändsgränd. Vad gör vi nu? Vi inför en backup. 34
35 Icke deterministiska finita automater Backup - När vi kommit till ett tillstånd där vi kan välja vilken övergång vi ska använda, sparar vi följande information: - vilket tillstånd vi är i när vi kan göra ett val, - vilken symbol vi läser från indata-tapen. 35
36 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: ac Backup: 36
37 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: a c Backup: <1, a> 37
38 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: a c Backup: <1, a> Vi kan inte läsa c så vi backar i automaten. 38
39 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: a c Backup: <1, a> Vi kan inte läsa c så vi backar i automaten. Enligt <1, a> ska vi backa till 1 39
40 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: ac Backup: <1, a> Vi kan inte läsa c så vi backar i automaten. Enligt <1, a> ska vi backa till 1 och låta a vara läst. 40
41 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: a c Backup: <4, a> Nu testar vi övergången 1 a 4 istället. 41
42 Icke deterministiska finita automater En automat där en symbol kan leda till mer än ett tillstånd. Exempel: Med backup a 1 2 b 3 a 4 c Indata: ac Backup: <4, a> Det gick och automaten accepterar ac 42
43 ökning i automater - depth-first-search Tekniken vi använde för att vandra i automaten kallas för depth-first-search. Depth-first-search innebär följande: - Följ en väg så långt du kan i automaten - Om du fastnat i automaten och inte befinner dig i ett finaltillstånd så backar du i automaten och prövar en annan väg. 43
44 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. 44
45 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata: ab 45
46 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : a b Backup: 2, 4 // Lägg till tillstånden 2, 4 46
47 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : a b Backup: 4 //Välj att gå till det första tillståndet, 2, i // backup 47
48 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : ab Backup: 4, 3 //Lägg till tillståndet 3 i backup 48
49 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : a b Backup: 3 //Välj att gå till det första tillståndet, 4, i // backup 49
50 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : a b Backup: 3 //Vi kan inte läsa c så vi lägger därför inte till // något tillstånd 50
51 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : a b Backup: //Välj att gå till det första tillståndet, 3, i // backup 51
52 ökning i automater- breadt-first-search En annan teknik man kan använda för att söka i en auomat kallas för breadth-first-search och den innebär följande: - para alla övergångar du kan komma till - När du läst färdigt innehållet i tapen undersöker du följande: om du befinner dig i ett finaltillstånd så accepterar automaten indatan annars inte. Exempel: a 1 2 b 3 a 4 c Indata : ab Backup: 52
53 ökning svagheter Med depth-first-search kan vi hamna i en oändlig loop. 53
54 ökning svagheter Breadth-first-search kan vara minneskrävande om automaten har många övergångar och vi behöver spara undan alla möjligheter. Exempel: T a a a a U X Y 54
55 ökning svagheter För att angripa problemen med oändlig loop och krävande minneshantering har man arbetat med olika algoritmer. Till exempel: - Dynamisk programmering - Första gången nånting beräknas, sparar man undan resultatet så att det kan hämtas vid ett senare tillfälle - Virterbi-algoritmen 55
56 Finita automater - Fakta - Deterministiska och icke-deterministiska finita automater har samma komplexitet - Varje icke-deterministisk finit automat kan skrivas om till en deterministiska automat - En icke-deterministisk finit automat är ofta färre tillstånd än en än en deterministisk automat och är därför ofta enklare. 56
57 Pumping Lemma 57
58 Hur vet man att ett språk är reguljärt? - Ett reguljärt språk har begränsat minne och man kan inte till exempel beskriva språk som detta: {mu, mmuu, mmmuuu,...} m n u n dvs, där n > 0 Hur kan vi då avgöra att reguljärt språk? m n u n inte är ett 58
59 Hur vet man att ett språk är reguljärt? - Ett reguljärt språk har begränsat minne och man kan inte till exempel beskriva språk som detta: {mu, mmuu, mmmuuu,...} m n u n dvs, där n > 0 Hur kan vi då avgöra att reguljärt språk? m n u n inte är ett Jo, med hjälp av The pumping lemma (sv. pumpsatsen). 59
60 The pumping lemma Låt L vara ett reguljärt språk som innehåller oändligt många strängar. Då finns strängarna x,y och z där: y ϵ -, dvs y är skilt från den tomma strängen x y n z L -, för n > 0 - Vi kan pumpa y N gånger utan att ramla ut ur språket Automaten för L ser ut så här: y 3 x 1 2 z 60
61 The pumping lemma Vad händer när man pumpar? y x z pumpa en gång : xyz 61
62 The pumping lemma Vad händer när man pumpar? y x z pumpa en gång pumpa två gånger : xyz : xyyz 62
63 The pumping lemma Vad händer när man pumpar? y x z pumpa en gång pumpa två gånger pumpa tre gånger : xyz : xyyz : xyyyz 63
64 The pumping lemma Vad händer när man pumpar? y x z pumpa en gång pumpa två gånger pumpa tre gånger pumpa n gånger : xyz : xyyz : xyyyz : x yy...y z n 64
65 The pumping lemma Vad händer när man pumpar? y x z pumpa en gång : xyz pumpa två gånger : xyyz pumpa tre gånger : xyyyz pumpa n gånger : x yy...y z = x y n z n 65
66 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ bb ab
67 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ pumpa 0 gånger: ab bb ab
68 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ pumpa 0 gånger: ab pumpa 1 gång : bbab bb ab
69 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ pumpa 0 gånger: ab pumpa 1 gång : bbab pumpa 2 gånger: bbbbab bb ab
70 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ bb pumpa 0 gånger: ab pumpa 1 gång : bbab pumpa 2 gånger: bbbbab pumpa 3 gånger: bbbbbbab ab
71 The pumping lemma Man kan ersätta x, y och z med andra strängar. Exempel: x=ϵ y=bb z=ab ϵ bb ab pumpa 0 gånger: ab pumpa 1 gång : bbab pumpa 2 gånger: bbbbab pumpa 3 gånger: bbbbbbab... Automaten accepterar språket (bb)*ab 71
72 The pumping lemma - Tillämpning Exempel: Är m n u n där n>0 reguljärt? 72
73 The pumping lemma - Tillämpning Exempel: Är m n u n där n>0 reguljärt? Vi tittar på följande sträng: mm...muu...u n n 73
74 The pumping lemma - Tillämpning Exempel: Är m n u n där n>0 reguljärt? Vi tittar på följande sträng: mm...muu...u n n Fall1: pumpa m m n u n Om är reguljärt, då kan vi pumpa antalet m N gånger utan att vi ramlar ut ur språket. Detta medför dock att vi får en sträng med olika många m och u, vilket innebär att vi ramlar ut ur. m n u n 74
75 The pumping lemma - Tillämpning Exempel: Är m n u n där n>0 reguljärt? Vi tittar på följande sträng: mm...muu...u n n Fall2: pumpa u m n u n Om är reguljärt, då kan vi pumpa antalet u N gånger utan att vi ramlar ut ur språket. Detta medför dock att vi får en sträng med olika många m och u, vilket innebär att vi ramlar ut ur. m n u n 75
76 The pumping lemma - Tillämpning Exempel: Är m n u n där n>0 reguljärt? Vi tittar på följande sträng: mm...muu...u n n Fall3: pumpa både m och u m n u n Om är reguljärt, då kan vi pumpa antalet m och u N gånger utan att vi ramlar ut ur språket. Men vi kan inte kontrollera att vi pumpat m och u lika många gånger vi ramlar ut ur språket. 76
77 Men naturliga språk? m n u n Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? 77
78 Men naturliga språk? m n u n Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. 78
79 Men naturliga språk? Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. Exempel: m n u n The cat 1 died 1 79
80 Men naturliga språk? Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. Exempel: m n u n The cat 1 died 1 The cat 1 the dog 2 chased 2 died 1 80
81 Men naturliga språk? Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. Exempel: m n u n The cat 1 died 1 The cat 1 the dog 2 chased 2 died 1 The cat 1 the dog 2 the rat 3 bit 3 chased 2 died 1 81
82 Men naturliga språk? Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. Exempel: m n u n The cat 1 died 1 The cat 1 the dog 2 chased 2 died 1 The cat 1 the dog 2 the rat 3 bit 3 chased 2 died 1 (The N ) n (verb) n 82
83 Men naturliga språk? Men om inte är ett reguljärt språk, vad säger det då om naturliga språk som engelska och svenska? var: Det avgör att engelska och svenska inte är ett reguljärt språk. eftersom det beskriver depentenser (beroenden) mellan olika delar av en sats. Exempel: m n u n The cat 1 died 1 The cat 1 the dog 2 chased 2 died 1 The cat 1 the dog 2 the rat 3 bit 3 chased 2 died 1 (The N ) n (verb) n (The N ) n (transitivt verv) n 1 (transitivt verb) 1 83
84 pråklig komplexitet m n u n - pråket kan beskrivas med kontextfria regler: mu m u reglerna kallas för typ 2- grammatik, dvs grammatiken är mer komplex än typ 3- grammatik 84
85 pråklig komplexitet m n u n - pråket kan beskrivas med kontextfria regler: mu m u reglerna kallas för typ 2- grammatik, dvs grammatiken är mer komplex än typ 3- grammatik - Kan man beskriva naturliga språk med kontextfria regler, eller behöver man en kontextkänslig grammatik, typ 1- grammatik? 85
86 pråklig komplexitet m n u n - pråket kan beskrivas med kontextfria regler: mu m u reglerna kallas för typ 2- grammatik, dvs grammatiken är mer komplex än typ 3- grammatik - Kan man beskriva naturliga språk med kontextfria regler, eller behöver man en kontextkänslig grammatik, typ 1- grammatik? Det kan bli problem med kontextfria regler, men det enda exempel som citeras i litteraturen är från en schweizertysk dialekt, sid 572 i Jurafsky och Martin. Det språket kan beskrivas som a n b m c n d m 86
87 Tvånivåmorfologi 87
88 Tvånivåmorfologi - Översikt Tvånivåmorfologi är en morfologisk parsning där man arbetar med följande: - ett lexikon som innehåller följande: rotmorfem affix (prefix, suffix, etc) specifikation som beskriver i vilken ordning rotmorfem och affix förekommer 88
89 Tvånivåmorfologi - Översikt Tvånivåmorfologi är en morfologisk parsning där man arbetar med följande: - ett lexikon som innehåller följande: rotmorfem affix (prefix, suffix, etc) specifikation som beskriver i vilken ordning rotmorfem och affix förekommer - en regelkomponent som innehåller morfologiska och ortografiska regler, till exempel hur man bildar en pluralisform från ett visst rotmorfem 89
90 Tvånivåmorfologi och transduktorer En transduktor kopplar samman två olika strängar: - en ytnivå. - en lexikal nivå - I tvåmorfologi består nivåerna av följande: - ytnivå som motsvarar grafordet - den lexikala nivån motsvarar grundform + morfologisk analys Exempel: ytnivå : cats lexikal nivå: cat + N + Pl 90
91 Transduktorer vs Automater - I en automat har vi ett alfabet, men I en transduktor har vi istället följande alfabet: Σ = är en ändlig mängd, alfabetet för indata = är en ändlig mängd, alfabetet för utdata 91
92 Transduktorer vs Automater - I en automat har vi ett alfabet, men I en transduktor har vi istället följande alfabet: Σ = är en ändlig mängd, alfabetet för indata = är en ändlig mängd, alfabetet för utdata - Varje övergång i en automat har en symbol, i en transduktor har varje övergång två symboler. Exempel: Istället för att skriva: <,x,t> kriver vi : <,x:y,t> där x är en symbol från Σ Och y är en symbol från 92
93 Transduktor: Lexikal nivå mellannivå f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: fox+n+g mellannivå : 93
94 Transduktor: Lexikal nivå mellannivå f f x 1 f 2 f 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: f ox+n+g mellannivå: f 94
95 Transduktor: Lexikal nivå mellannivå f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: fo x+n+g mellannivå: fo 95
96 Transduktor: Lexikal nivå mellannivå f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: fox +N+g mellannivå: fox 96
97 Transduktor: Lexikal nivå mellannivå f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: fox+n +g mellannivå: fox 97
98 Transduktor: Lexikal nivå mellannivå f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N +Pl ^s# lexical nivå: fox+n+g mellannivå: fox# 98
99 Transduktor: Lexikal nivå mellannivå Transduktorn ger oss följande resultat: Lexical nivå fox+n+g fox+n+pl mellannivå fox# fox^s# # - talar om när strängen är slut ^ - talar om när nästa morfem börjar 99
100 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fox^s# ytnivå : 100
101 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: f ox^s# ytnivå : f 101
102 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fo x^s# ytnivå : fo 102
103 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fox ^s# ytnivå : fox 103
104 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fox^ s# ytnivå : fox 104
105 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fox^s # ytnivå : foxs 105
106 Transduktor: mellannivå ytnivå f o x 1 f 2 o 3 x 4 ε 5 6 ^ s s 7 # ε # ε mellannivå: fox^s# ytnivå : foxs 106
107 Transduktor: mellannivå ytnivå Transduktorn ger oss följande resultat: mellannivå fox# fox^s# ytnivå fox foxs # - talar om när strängen är slut ^ - talar om när nästa morfem börjar 107
108 Transduktor: mellannivå ytnivå Vi fick följande resultat: mellannivå fox# fox^s# ytnivå fox foxs foxs är felstavat. # - talar om när strängen är slut ^ - talar om när nästa morfem börjar 108
109 Transduktor: mellannivå ytnivå Vi fick följande resultat: mellannivå fox# fox^s# ytnivå fox foxs foxs är felstavat. Orsaken till att foxs är felstavat beror på att det inte alltid räcker att endast sätta ihop morfem till ett ord. 109
110 Transduktor: mellannivå ytnivå Vi fick följande resultat: mellannivå fox# fox^s# ytnivå fox foxs foxs är felstavat. Orsaken till att foxs är felstavat beror på att det inte alltid räcker att endast sätta ihop morfem till ett ord. För att korrigera fox behöver vi en transduktor som lägger till e efter x. 110
111 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e a:a b:b r: r t:t w:w y:y # : # # : # 111
112 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox^s# ytnivå : 112
113 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : f ox^s# ytnivå : f 113
114 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fo x^s# ytnivå : fo 114
115 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox ^s# ytnivå : fox 115
116 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox^ s# ytnivå : fox 116
117 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox^ s# ytnivå : foxe 117
118 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox^s # ytnivå : foxes 118
119 Transduktor: E-insättning (förenklad) a:a b:b r: r t:t w:w y:y s:s x:x z:z ^ : ε 5 s:s # : # ^ : ε ε : e 6 a:a b:b r: r t:t w:w y:y # : # # : # mellannivå : fox^s# ytnivå : foxes# 119
120 Transduktor: E-insättning (förenklad) Vi fick följande resultat: mellannivå fox^s# ytnivå foxes# För att ta bort # kan man antingen göra det i samma transduktor eller använda en transduktor som tar bort #. 120
121 Transduktor: E-insättning (förenklad) Vi fick följande resultat: mellannivå fox^s# ytnivå foxes# För att ta bort # kan man antingen göra det i samma transduktor eller använda en transduktor som tar bort #. E-insättning är ett exempel på en ortografisk regel. 121
122 Ortografiska regler En ortografisk regler används när man behöver korrigera tavningen i ett ord. Exempel på regler: E-insättning Lägger till ett e sist i morfem som slutar p -s, x, z, -ch, -sh och före +s. Exempel: fox +s foxes E-borttagning tyst e som tas bort före -ing och -ed Exempel: make+ing making Konsonantdubblering dubblerar en konstant före -ing/-ed Exempel: beg+ing begging Y-ersättning ersätter y med ie före -s -i, -ed Exempel: try+s tries K-insättning lägger till k på verb som slutar med vokal + c. Exempel: panic panicked 122
123 Kaskadkoppling Vi har nu följande transduktorer: - Lexikal mellannivå f o 1 f 2 o 3 x 4 ε 5 6 +g # - E-insättning. Exempel: fox^s# foxes# x +N +Pl ^s# Kan vi sätta ihop dem till en transduktor? 123
124 Kaskadkoppling Vi har nu följande transduktorer: - Lexikal mellannivå f o 1 f 2 o 3 x 4 ε 5 6 +g # - E-insättning. Exempel: fox^s# foxes# x +N +Pl ^s# Kan vi sätta ihop dem till en transduktor? Ja, det kan vi. Tekniken kallas för kaskadkoppling. 124
125 Kaskadkoppling Lexikal nivå fox+n+pl f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N ^s# Mellannivå: fox^s# E-insättning Ytnivå: foxes 125
126 Kaskadkoppling Lexikal nivå fox+n+pl f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N ^s# Mellannivå: fox^s# Först körs den här transduktor. E-insättning Ytnivå: foxes 126
127 Kaskadkoppling Lexical nivå fox+n+pl f o x 1 f 2 o 3 x 4 ε 5 6 +g # +N ^s# Mellannivå: fox^s# Därefter körs den här. E-insättning Ytnivå: foxes 127
128 Kaskadkoppling -generellt Lexikal nivå En stor transduktor som kan hantera många strängar på lexikal nivå och som kan genera många strängar på mellannivå Mellannivå Många transduktorer för de ortografiska reglerna: Transduktor 1 Transduktor 2... Transduktor n Ytnivå 128
129 Tvånivåmorfologi ammanfattning - Tvånivåmorfologi är en morfologisk parsning baserat på transduktorer. Man arbetar med: - Ett lexikon som innehåller rotmorfem och affix samt regler för i vilken ordning dessa förkommer. 129
130 Tvånivåmorfologi ammanfattning - Tvånivåmorfologi är en morfologisk parsning baserat på transduktorer. Man arbetar med: - Ett lexikon som innehåller rotmorfem och affix samt regler för i vilken ordning dessa förkommer. - En regelkomponent som innehåller morfologiska och ortografiska regler (hur bildar man en pluralform från ett visst rotmorfem) 130
131 Tvånivåmorfologi ammanfattning - Tvånivåmorfologi är en morfologisk parsning baserat på transduktorer. Man arbetar med: - Ett lexikon som innehåller rotmorfem och affix samt regler för i vilken ordning dessa förkommer. - En regelkomponent som innehåller morfologiska och ortografiska regler (hur bildar man en pluralform från ett visst rotmorfem) - Via transduktorer kan med göra följande: - generera en ytform utifrån de ingående morfemen - acceptera en ytform och returnera den morfologiska analysen 131
132 Nästa gång - Preprocessing - Tokenisering - Meningssegmentering - Laboration 1 132
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Först några definitioner: Alfabet = en ändlig mängd av tecken. Ex. {0, 1}, {a,b}, {a, b,..., ö} Betecknas ofta med symbolen Σ Sträng =
Läs merLite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer
Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders
Läs merb) S Ø aa, A Ø aa» bb, B Ø aa» bc, C Ø ac» bc» 2. Låt L vara språket över 8a< som nedanstående NFA accepterar.
Salling, 070-6527523 TID : 9-14 HJÄLPMEDEL : Inga BETYGSGRÄNSER : G 18p, VG 28p SKRIV TYDLIGT OCH MOTIVERA NOGA! PROV I MATEMATIK AUTOMATEORI & FORMELLA SPRÅK DV1, 4 p 20 MARS 2002 1. Språket L över alfabetet
Läs merDAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Läs merFöreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk
Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två
Läs merFöreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står
Läs merTuringmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står skrivna: Oändligt
Läs merMatematik för språkteknologer
1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merMÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP
MÄLARDALENS HÖGSKOLA CD5560 Formella språk, automater och beräkningsteori Användarmanual för simulatorn JFLAP Innehållsförteckning Att komma igång med JFLAP... 3 Att köra en sträng... 5 Att köra flera
Läs merFöreläsning 7: Syntaxanalys
DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merProgrammering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater
Programmering för språkteknologer II OH-serie: ändliga automater reguljära uttryck i Java Mats Dahllöf Ändliga automater Abstrakt maskin, tillståndsmaskin, transitionssystem. (Den enklaste typ man brukar
Läs merReguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm
Syntaxanalys Douglas Wikström KTH Stockholm popup-help@csc.kth.se Reguljära uttryck Reguljära uttryck förutsätter att en mängd bokstäver är givna, ett så kallat alfabet, som oftast betecknas med Σ. Uttryck
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merPROV I MATEMATIK Automatateori och formella språk DV1 4p
UPPSALA UNIVERSITET Matematiska institutionen Salling (070-6527523) PROV I MATEMATIK Automatateori och formella språk DV1 4p 19 mars 2004 SKRIVTID: 15-20. POÄNGGRÄNSER: 18-27 G, 28-40 VG. MOTIVERA ALLA
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära
Läs merAlfabeten, strängar och språk. String
Alfabeten, strängar och språk Objektorienterad modellering och diskreta strukturer / design Språk och reguljära uttryck Ett alfabet är en ändlig icketom mängd vars element kallas symboler. Lennart Andersson
Läs merKontextfria grammatiker
Kontextfria grammatiker Kontextfria grammatiker 1 Kontextfria grammatiker En kontextfri grammatik består av produktioner (regler) på formen S asb S T T # Vänsterledet består av en icke-terminal (variabel)
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Läs merAutomatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA
Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 4 Per Austrin 2015-11-20 Idag Rekursiv medåkning, fortsättning Olika klasser av språk och grammatiker Parsergeneratorer Sammanfattning
Läs merTDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg
TDDD02 Föreläsning 2 HT-2013 Reguljära uttryck och reguljära språk Lars Ahrenberg Översikt Reguljära uttryck sökproblem i texter definitioner och exempel UNIX-funktionen grep Reguljära transformationer
Läs merMorfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)
Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver
Läs merFöreläsning 7: Syntaxanalys
DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2009-10-27 Skribent(er): Carl-Fredrik Sundlöf, Henrik Sandström, Jonas Lindmark Föreläsare: Fredrik Niemelä 1 Syntaxanalys
Läs merObjektorienterad modellering och diskreta strukturer. 13. Problem. Sven Gestegård Robertz. Datavetenskap, LTH
Objektorienterad modellering och diskreta strukturer 13. Problem Sven Gestegård Robertz Datavetenskap, LTH 2014 Rekaputilation Vi har talat om satslogik och härledning predikatlogik och substitution mängder
Läs mer10. Mängder och språk
Objektorienterad modellering och diskreta strukturer 10. Mängder och språk Sven Gestegård Robertz Institutionen för datavetenskap, LTH 2013 Rekaputilation Vi har talat om satslogik, predikatlogik och härledning
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs merMorfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs mer1 Inledning 1. 4 Utvärdering 7. 5 Diskussion 7
Innehåll 1 Inledning 1 2 Bakgrund 1 2.1 Svensk fonetik.................................. 1 2.1.1 IPA.................................... 1 2.1.2 ASTA................................... 1 2.2 Svensk fonotax..................................
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Ordklasstaggning (Sätta
Läs merAutomater. Matematik för språkteknologer. Mattias Nilsson
Automater Matematik för språkteknologer Mattias Nilsson Automater Beräkningsmodeller Beräkning - (eng) Computation Inom automatateorin studeras flera olika beräkningsmodeller med olika egenskaper och olika
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD36 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning Per Austrin 26--3 Kursavsnittet syntax/formella språk Teori om formella språk verktygslåda för strängmatchning: Ändliga automater och
Läs merVarför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Läs merVektorgeometri för gymnasister
Vektorgeometri för gymnasister Per-Anders Svensson http://homepage.lnu.se/staff/psvmsi/vektorgeometri/gymnasiet.html Fakulteten för teknik Linnéuniversitetet Räta linjens och planets ekvationer II Innehåll
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Preprocessing - Tokeniserings-
Läs merVektorgeometri för gymnasister
Vektorgeometri för gymnasister Per-Anders Svensson http://homepage.lnu.se/staff/psvmsi/vektorgeometri/gymnasiet.html Fakulteten för teknik Linnéuniversitetet Räta linjens och planets ekvationer III Innehåll
Läs merTekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Läs merFaktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 00-1-03 Lars Engebretsen 00-1-03 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
Läs merFaktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 003-11-18 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner i polynomisk tid. Kanske
Läs merLäsanvisningar och övningsuppgifter i MAA150, period vt Erik Darpö
Läsanvisningar och övningsuppgifter i MAA150, period vt1 2015 Erik Darpö ii 0. Förberedelser Nedanstående uppgifter är avsedda att användas som ett självdiagnostiskt test. Om du har problem med att lösa
Läs merREGULJÄRA SPRÅK (8p + 6p) 1. DFA och reguljära uttryck (6 p) Problem. För följande NFA över alfabetet {0,1}:
CD58 FOMEA SPÅK, AUTOMATE, OCH BEÄKNINGSTEOI, 5 p JUNI 25 ÖSNINGA EGUJÄA SPÅK (8p + 6p). DFA och reguljära uttryck (6 p) Problem. För följade NFA över alfabetet {,}:, a) kovertera ovaståede till e miimal
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merÖvning 5 - Tillämpad datalogi 2013
/afs/nada.kth.se/home/w/u1yxbcfw/teaching/13dd1320/exercise5/exercise5.py October 1, 2013 1 0 # coding : latin Övning 5 - Tillämpad datalogi 2013 Automater, reguljära uttryck, syntax Sammanfattning Idag
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 3 Per Austrin 2015-11-13 Huvudkoncept hittils: Snabb repetition Formellt språk en mängd strängar Reguljära språk den klass av formella
Läs merH1009, Introduktionskurs i matematik Armin Halilovic
LOGARITMER Definition av begreppet logaritm Betrakta ekvationen aa xx = bb. Om a är ett positivt tal skilt från 1 och b >0 då finns det exakt en exponent x som satisfierar ekvationen. Den okända exponent
Läs merUppgifter i TDDC75: Diskreta strukturer Kapitel 8 Ordning och oändlighet
Uppgifter i TDDC75: Diskreta strukturer Kapitel 8 Ordning och oändlighet Mikael Asplund 19 oktober 2016 Uppgifter 1. Avgör om följande relationer utgör partialordningar. Motivera varför eller varför inte.
Läs merFL 6: Definite Clause Grammars (kap. 7)
FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor
Läs merModul 1: Komplexa tal och Polynomekvationer
Modul : Komplexa tal och Polynomekvationer. Skriv på formen a + bi, där a och b är reella, a. (2 + i)( 2i) 2. b. + 2i + 3i 3 4i + 2i 2. Lös ekvationerna a. (2 i)z = 3 + i. b. (2 + i) z = + 3i c. ( 2 +
Läs merLabb 1 - Textbearbetning med reguljära uttryck. Formella språk. Definitioner. Chomskyhierarkin. Formella språk. Formella språk
Labb 1 - Textbearbetning med reguljära uttryck Textbearbetning: Dela upp en text i meningar Hitta alla namn i en text Hitta adjektiv i superlativ Lektion reguljära uttryck re modulen i Python Formella
Läs merProgrammering för språkteknologer II, HT2011. Rum
Programmering för språkteknologer II, HT2011 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv11/pst2/ Idag - Hashtabeller - Flerdimensionella arrayer (2D) 2 Repetition -
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merUniversitetet i Linköping Institutionen för datavetenskap Anders Haraldsson
1 2 Grundläggande datavetenskap, IT1 Perspektiv på datateknik, D1 Perspektiv på datavetenskap, C1 Breddföreläsning orientering om: formella språk grammatik parsing Att läsa mer: Brookshear, Computer Science
Läs merTDDC74 Programmering: Abstraktion och modellering Datortenta , kl 14-18
TDDC74 Programmering: Abstraktion och modellering Datortenta - 017-10-7, kl 14-18 Läs alla frågorna först och bestäm dig för i vilken ordning du vill lösa uppgifterna. Uppgifterna är inte nödvändigtvis
Läs merMoment Viktiga exempel Övningsuppgifter I Ö5.1b, Ö5.2b, Ö5.3b, Ö5.6, Ö5.7, Ö5.11a
Moment 5.1-5.5 Viktiga exempel 5.1-5.10 Övningsuppgifter I Ö5.1b, Ö5.2b, Ö5.3b, Ö5.6, Ö5.7, Ö5.11a Kvadratiska linjära ekvationssystem Vi startar vår utredning med det vi känner bäst till, ekvationssystem
Läs meri=1 c i = B och c i = a i eller c i = b i för 1 i n. Beskriv och analysera en algoritm som löser detta problem med hjälp av dynamisk programmering.
Algoritmer och Komplexitet ht 8 Övning 3+4 Giriga algoritmer och Dynamisk programmering Längsta gemensamma delsträng Strängarna ALGORITM och PLÅGORIS har den gemensamma delsträngen GORI Denlängsta gemensamma
Läs merFöreläsning 15: Faktorförsök
Föreläsning 15: Faktorförsök Matematisk statistik Chalmers University of Technology Oktober 17, 2016 Ensidig variansanalys Vi vill studera om en faktor A påverkar en responsvariabel. Vi gör totalt N =
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merGrundläggande datalogi - Övning 9
Grundläggande datalogi - Övning 9 Björn Terelius January 30, 2009 Ett formellt språk är en (oftast oändlig) mängd strängar. Språket definieras av en syntax som är en samling regler för hur man får bilda
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merKällkodning. Egenskaper hos koder. Några exempel
Källkodning Källkodning innebär att vi avbildar sekvenser av symboler ur en källas alfabet på binära sekvenser (kallade kodord). Mängden av alla kodord kalls för en kod. (Man kan förstås tänka sig att
Läs merÖvning: Träna skrivning!
Övning: Träna skrivning! nnehåll Skriv i nivåer 2 Repetition... sidan 2 Diagnos... sidan 5 lfabetisk ordning... sidan 6 rdbilder... sidan 12 Skriva ord... sidan 18 Skriva meningar... sidan 22 Berätta...
Läs merMoment 4.11 Viktiga exempel 4.32, 4.33 Övningsuppgifter Ö4.18-Ö4.22, Ö4.30-Ö4.34. Planet Ett plan i rummet är bestämt då
Moment 4.11 Viktiga exempel 4.32, 4.33 Övningsuppgifter Ö4.18-Ö4.22, Ö4.30-Ö4.34 Planet Ett plan i rummet är bestämt då två icke parallella riktningar, v 1 och v 2, och en punkt P 1 i planet är givna.
Läs merSnabba tips på hur du kan plugga till XYZ och KVA
Introduktion en här boken skapades för att hjälpa dig att maximera din poäng på XYZ och KV. Jag räknade genom alla tidigare XYZ och KV och resultatet är 1000 övningsuppgifter som starkt påminner om och
Läs merProgrammering för språkteknologer II, HT2011. Rum
Programmering för språkteknologer II, HT2011 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv11/pst2/ Kursplan Mål Efter avslutad kurs skall studenten för att förtjäna betyget
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs merDär a = (1, 2,0), b = (1, 1,2) och c = (0,3, 1) Problem 10. Vilket är det enda värdet hos x för vilket det finns a och b så att
Här följer 3 problem att lösa. Längre bak i dokumentet finns utförliga penna-papper lösningar. Filen Föreläsning08.zip finns motsvarande lösningar utförda med Mathematica. Problem 1. Bestäm a så att avståndet
Läs merDIAGONALISERING AV EN MATRIS
DIAGONALISERING AV EN MATRIS Definition ( Diagonaliserbar matris ) Låt A vara en kvadratisk matris dvs en matris av typ n n. Matrisen A är diagonaliserbar om det finns en inverterbar matris P och en diagonalmatris
Läs merPCP-satsen på kombinatoriskt manér
austrin@kth.se Teorigruppen Skolan för Datavetenskap och Kommunikation 2005-10-24 Agenda 1 Vad är ett bevis? Vad är ett PCP? PCP-satsen 2 Vad, hur och varför? Lite definitioner Huvudresultatet 3 Ännu mer
Läs merLösningsförslag till skrivningen i Vektorgeometri (MAA702) måndagen den 30 maj 2005
VÄXJÖ UNIVERSITET Matematiska och systemtekniska institutionen Per-Anders Svensson Lösningsförslag till skrivningen i Vektorgeometri (MAA702) måndagen den 30 maj 2005 Uppgift. Bestäm samtliga vektorer
Läs merKap Inversfunktion, arcusfunktioner.
Kap 3. 3.5. Inversfunktion, arcusfunktioner. 30. (A) Förenkla uttrycken så långt som möjligt a. ln 8 ln + ln 8 ln + ln b. ln 3 log 0 3 log 0 e + 3 ln 3 log 3 e 30. (A) Lös ekvationerna a. e x = e x b.
Läs merDefinition. Mängden av reguljära uttryck på alfabetet Σ definieras av. om α och β är reguljära uttryck så är (α β) ett reguljärt uttryck
Lunds tekniska högskola Datavetenskap Lennart Andersson Föreläsningsanteckningar EDAF10 6 Reguljära uttryck I unix-skal finns ange enkla mönster för filnamn med * och?. En del program, t ex emacs, egrep
Läs merLivet i Bokstavslandet Läsebok åk 1
Livet i Bokstavslandet Läsebok åk 1 Livet i Bokstavslandet är ett grundläromedel för åk F 3 med läseböcker, arbetsböcker, lärarhandledningar, och ett digitalt material för interaktiv skrivtavla/projektor.
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merNumerisk Analys, MMG410. Exercises 2. 1/33
Numerisk Analys, MMG410. Exercises 2. 1/33 1. A är en kvadratisk matris vars alla radsummor är noll. Visa att A är singulär. Låt e vara vektorn av ettor. Då är Ae = 0 A har icke-trivialt nollrum. 2/33
Läs merDatum: 24 okt Betygsgränser: För. finns på. Skriv endast på en. omslaget) Denna. Uppgift. Uppgift Beräkna. Uppgift Låt z. Var god. vänd.
Tentamen i Linjär algebra, HF94 Datum: 4 okt 8 Skrivtid: 4:-8: Lärare: Marina Arakelyan, Elias Said Examinator: Armin Halilovic För godkänt betyg krävs av max 4 poäng Betygsgränser: För betyg A, B, C,
Läs merGrundläggande textanalys, VT2012
Grundläggnde textnlys, VT2012 evelin.ndersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelin/uv/uv12/gt/ (Tck till Sofi Gustfson-Cpkovâ för mteril.) Idg - Kurspln - Kort historik - Ändlig utomter
Läs meroch kallas ytintegral AREAN AV EN BUKTIG YTA
YTINTEGRALER Definition. Vi betraktar en funktion (xx, yy, zz) som är definierad på ytan Y. Vi delar ytan i ej- överlappande delar S i, väljer en punkt T i i varje S i och beräknar summan ii= ff(tt ii
Läs merOrd och morfologi. Morfologi
Ord och morfologi DH2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Läs merTDDC74 Lab 04 Muterbara strukturer, omgivningar
TDDC74 Lab 04 Muterbara strukturer, omgivningar 1 Översikt I den här laborationen kommer ni att lära er mer om: Tillstånd, och skillnader mellan ren funktionell programmering och imperativ. Skillnaden
Läs mer2+t = 4+s t = 2+s 2 t = s
Extra 1. Ta fram räta linjens ekvation på parameterform då linjen går genom punkterna (1, 1,0) och (2,0,1) (3, 1,4) och ( 1,1,6) (4,3, 1) och (7, 2,5) (11,3, 6) och (9, 1,3) Lösning: (x,y,z) = (1+t, 1+t,t)
Läs merParsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion
Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som
Läs merAsymptotisk komplexitetsanalys
1 Asymptotisk komplexitetsanalys 2 Lars Larsson 3 4 VT 2007 5 Lars Larsson Asymptotisk komplexitetsanalys 1 Lars Larsson Asymptotisk komplexitetsanalys 2 et med denna föreläsning är att studenterna skall:
Läs mer1 Inledning. 1.1 Programförklaring. 1.2 Innehållet. 1.3 Beteckningskonventioner - 1 -
- 1-1 Inledning 1.1 Programförklaring Detta kompendium är utvecklat för en introduktionskurs i datalingvistik som vänder sig till studenter med tidigare kännedom om grundläggande lingvistik och datavetenskap.
Läs merAlgoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 12 Anton Grensjö grensjo@csc.kth.se 10 december 2015 Anton Grensjö ADK Övning 12 10 december 2015 1 / 19 Idag Idag Komplexitetsklasser Blandade uppgifter
Läs merTAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen
Läs merabbcba a) A regular expression over
1 CD5560 FABER Forml Lnguges, Automt nd Models of Computtion Exerise Mälrdlen University 007 NEXT WEEK! Midterm Exm 1 Regulr Lnguges Ple: U-114 Time: Tuesdy 007-04-4, 10:15-1:00 t is OPEN BOOK. This mens
Läs merLexikon: ordbildning och lexikalisering
Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merDiskret matematik: Övningstentamen 1
Diskret matematik: Övningstentamen 1 1. Bevisa att de reella talen är en icke-uppräknelig mängd.. För två mängder av positiva heltal A och B skriver vi A C B, om det är så att A innehåller ett heltal som
Läs merK2 Något om modeller, kompakthetssatsen
KTH Matematik Bengt Ek Maj 2005 Kompletteringsmaterial till kursen 5B1928 Logik för D1: K2 Något om modeller, kompakthetssatsen Vi skall presentera ett enkelt (om man känner till sundhets- och fullständighetssatsen
Läs merInnehåll. Föreläsning 12. Binärt sökträd. Binära sökträd. Flervägs sökträd. Balanserade binära sökträd. Sökträd Sökning. Sökning och Sökträd
Innehåll Föreläsning 12 Sökträd Sökning Sökning och Sökträd 383 384 Binärt sökträd Används för sökning i linjära samlingar av dataobjekt, specifikt för att konstruera tabeller och lexikon. Organisation:
Läs merFö relä sning 2, Kö system 2015
Fö relä sning 2, Kö system 2015 Vi ska börja titta på enskilda kösystem som ser ut på följande sätt: Det kan finnas en eller fler betjänare och bufferten kan vara ändlig eller oändlig. Om bufferten är
Läs merTentamen 1 i Matematik 1, HF1903 Torsdag 22 augusti Skrivtid: 14:00-18:00 Examinator: Armin Halilovic
Tentamen i Matematik, HF90 Torsdag augusti Skrivtid: 4:00-8:00 Examinator: Armin Halilovic För godkänt betyg krävs 0 av max 4 poäng Betygsgränser: För betyg A, B, C, D, E krävs, 9, 6, respektive 0 poäng
Läs merFöreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
Läs merFöreläsning 1 Datastrukturer (DAT037)
Föreläsning 1 Datastrukturer (DAT037) Fredrik Lindblad 1 30 oktober 2017 1 Slides skapade av Nils Anders Danielsson har använts som utgångspunkt. Se http://www.cse.chalmers.se/edu/year/2015/course/dat037
Läs mer