Grundläggande textanalys, VT2013
|
|
- Monica Pålsson
- för 7 år sedan
- Visningar:
Transkript
1 Grundläggande textanalys, VT2013 Rum (Tack till Sofia Gustafson-Capkovâ för material.)
2 Idag - Stavningskontroll - Granska - Laboration 3 - Fördjupningsuppgift 2
3 Varför behöver vi stavnings- och grammatikkontroll? 3
4 Varför behöver vi stavnings- och grammatikkontroll? - För att upptäcka slarvfel 4
5 Varför behöver vi stavnings- och grammatikkontroll? - För att upptäcka slarvfel - Stilkontroll Är man konsekvent när man skriver: ska skall mej - mig 5
6 Varför behöver vi stavnings- och grammatikkontroll? - För att upptäcka slarvfel - Stilkontroll Är man konsekvent när man skriver: ska skall mej - mig Minusord: - talspråk - ålderdomliga - byråkratiska 6
7 Varför behöver vi stavnings- och grammatikkontroll? - För att upptäcka slarvfel - Stilkontroll Är man konsekvent när man skriver: ska skall mej - mig Minusord: - talspråk - ålderdomliga - byråkratiska - Andraspråksinlärning 7
8 Varför behöver vi stavnings- och grammatikkontroll? - För att upptäcka slarvfel - Stilkontroll Är man konsekvent när man skriver: ska skall mej - mig Minusord: - talspråk - ålderdomliga - byråkratiska - Andraspråksinlärning - Dyslexi 8
9 Varför är inte stavningskontroll tillräckligt? 9
10 Varför är inte stavningskontroll tillräckligt? - Vi kan hitta icke-ord: råf får 10
11 Varför är inte stavningskontroll tillräckligt? - Vi kan hitta icke-ord: råf får - Men vi missar följande: om lexikonet inte är tillräckligt stort missar vi särskrivna sammansättningar: hus vagn husvagn 11
12 Varför är inte stavningskontroll tillräckligt? - Vi kan hitta icke-ord: råf får - Men vi missar följande: om lexikonet inte är tillräckligt stort missar vi särskrivna sammansättningar: hus vagn husvagn stavfel som är riktiga ord (real word errors): Du er duktig på att går. 12
13 Vad gör grammatikkontroll? 13
14 Vad gör grammatikkontroll? - Accepterar de korrekta grammatiska strukturerna 14
15 Vad gör grammatikkontroll? - Accepterar de korrekta grammatiska strukturerna - Känner igen och talar om de grammatiska fel som finns i texten fokuserar på de fel som är lätt att hitta 15
16 Vad gör grammatikkontroll? - Accepterar de korrekta grammatiska strukturerna - Känner igen och talar om de grammatiska fel som finns i texten fokuserar på de fel som är lätt att hitta - Ger ersättningsförslag för: ogrammatiska strukturer felaktiga ordformer 16
17 Grammatikkontrollens faser 17
18 Grammatikkontrollens faser - Feldetektering(detection) Fel i nominalfrasen(np): den röda stolarna 18
19 Grammatikkontrollens faser - Feldetektering(detection) Fel i nominalfrasen(np): den röda stolarna - Feligenkänning (recognition) numeriusinkongruens: artikel huvudord: den röda stolarna 19
20 Grammatikkontrollens faser - Feldetektering(detection) Fel i nominalfrasen(np): den röda stolarna - Feligenkänning (recognition) numeriusinkongruens: artikel huvudord: den röda stolarna - Feldiagnos (diagnosis) artikeln står i singularis istället för pluralis: den de substantivet står i pluralis istället för singularis: stolarna stolen 20
21 Grammatikkontrollens faser - Feldetektering(detection) Fel i nominalfrasen(np): den röda stolarna - Feligenkänning (recognition) numeriusinkongruens: artikel huvudord: den röda stolarna - Feldiagnos (diagnosis) artikeln står i singularis istället för pluralis: den de substantivet står i pluralis istället för singularis: stolarna stolen - Felkorrigering(correction) de röda stolarna den röda stolen 21
22 Problem 22
23 Problem - Hur kan man hitta så många fel som möjligt utan att alltför många korrekta meningar bedöms som felaktiga? 23
24 Problem - Hur kan man hitta så många fel som möjligt utan att alltför många korrekta meningar bedöms som felaktiga? - Komplexa strukturer: Exempel: De i stycket 7 stadgade punkterna. 24
25 Problem - Hur kan man hitta så många fel som möjligt utan att alltför många korrekta meningar bedöms som felaktiga? - Komplexa strukturer: Exempel: De i stycket 7 stadgade punkterna. - Begränsning på meningsnivå: Exempel: Jag såg bra datorer i butiken. Den vara ganska dyr. 25
26 Problem - Hur kan man hitta så många fel som möjligt utan att alltför många korrekta meningar bedöms som felaktiga? - Komplexa strukturer: Exempel: De i stycket 7 stadgade punkterna. - Begränsning på meningsnivå: Exempel: Jag såg bra datorer i butiken. Den vara ganska dyr. - Hur gör man med dialekter? Exempel: Denna stolen är svart. 26
27 Granska 27
28 Granska - Utvecklat på Nada, KTH - Använder ett lexikon och en samling regler 28
29 Granska uppbyggnad Tokeniseraren Tokeniserar med hjälp av reguljära uttryck Taggaren Lexikon(SUC och SAOL) Statistik(SUC) Regelmatcharen 300 granskningsregler ordböjningsfunktion Grafiskt gränsnitt 29
30 Granska uppbyggnad Exempel på taggningar: kvinnan kvinna nn.utr.sin.def.nom hade ha vb.prt.akt.aux gått gå vb.sup.akt 30
31 Granska Körexempel Källa: 31
32 Granska Körexempel Skriv in en mening här. Skicka iväg meningen till Granska. Källa: 32
33 Granska Körexempel - Resultat Källa: 33
34 Granska Körexempel - Resultat detection Källa: 34
35 Granska Körexempel - Resultat detection diagnosis Källa: 35
36 Granska Körexempel - Resultat detection diagnosis Källa: correction 36
37 Granska Skapa regler 37
38 Granska Skapa regler - Först skapar men en kategori som man kan samla reglerna i ( jämför klass i java) 38
39 Granska Skapa regler - Först skapar men en kategori som man kan samla reglerna i ( jämför klass i java) - Sedan skapar man reglerna och talar om i vilken varje regel tillhör (jämför metoder i java) 39
40 Granska Deklarera en kategori Syntaxen för att deklarera en kategori ser ut så här: category regelkategori info("exempelregler") link ("url" "namn på länk") 40
41 Granska Deklarera en kategori Syntaxen för att deklarera en kategori ser ut så här: category regelkategori info("exempelregler") link ("url" "namn på länk") category reserverat ord som talar om att vi skapar en kategori 41
42 Granska Deklarera en kategori Syntaxen för att deklarera en kategori ser ut så här: category regelkategori info("exempelregler") link ("url" "namn på länk") category reserverat ord som talar om att vi skapar en kategori regelkategori samlingsnamn för de regler man skapar 42
43 Granska Deklarera en kategori Syntaxen för att deklarera en kategori ser ut så här: category regelkategori info("exempelregler") link ("url" "namn på länk") category reserverat ord som talar om att vi skapar en kategori regelkategori samlingsnamn för de regler man skapar info("exempelregler") innehåller en generell kommentar om reglerna 43
44 Granska Deklarera en kategori Syntaxen för att deklarera en kategori ser ut så här: category regelkategori info("exempelregler") link ("url" "namn på länk") category reserverat ord som talar om att vi skapar en kategori regelkategori samlingsnamn för de regler man skapar info("exempelregler") innehåller en generell kommentar om reglerna link("url", "namn på länk") 44 innehåller håller url:en till sidan med mer information om reglerna
45 Granska Exempel Så här skapar man kategorin minaregler: category minaregler info("mina regler") link("" "") 45
46 Granska Deklarera en regel Syntaxen för att skapa en regel ser ut så här: X_0()... X_n() konsekvens_0... konsekvens_n 46
47 Granska Deklarera en regel Syntaxen för att skapa en regel ser ut så här: X_0(),..., X_n() konsekvens_0... konsekvens_n regelnamn Namnet på regeln 47
48 Granska Deklarera en regel Syntaxen för att skapa en regel ser ut så här: X_0(),..., X_n() konsekvens_0... konsekvens_n regelnamn Namnet på regeln regelkategori Vilken kategori regeln tillhör 48
49 Granska Deklarera en regel Syntaxen för att skapa en regel ser ut så här: X_0(),..., X_n() konsekvens_0... konsekvens_n X_0(),..., X_n() Matchningsvariabler som måste vara uppfyllda innan man kan använda regeln. 49
50 Granska Deklarera en regel Syntaxen för att skapa en regel ser ut så här: X_0(),..., X_n() konsekvens_0... konsekvens_n konsekvens_0... konsekvens_n Det som ska hända när man exekverar regeln. 50
51 Granska Exempel ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) 51
52 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln 52
53 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör 53
54 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1 det första ordet som vi hittar 54
55 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1 det första ordet som vi hittar ORD2(text=ORD1.text) den lexikala strängen för ORD2 måste vara samma som för ORD1 55
56 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1 det första ordet som vi hittar ORD2(text=ORD1.text) den lexikala strängen för ORD2 måste vara samma som för ORD1 mark(ord1, ORD2) markera ORD1 och ORD2 56
57 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1 det första ordet som vi hittar ORD2(text=ORD1.text) den lexikala strängen för ORD2 måste vara samma som för ORD1 mark(ord1, ORD2) ORD1.delete() markera ORD1 och ORD2 ta bort ORD1 57
58 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) tabortdubletter namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1 det första ordet som vi hittar ORD2(text=ORD1.text) den lexikala strängen för ORD2 måste vara samma som för ORD1 mark(ord1, ORD2) ORD1.delete() corr() markera ORD1 och ORD2 ta bort ORD1 talar om att man vill ändra på något 58
59 Granska Exempel1 ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) talar om att regeln är en granskningsregel för stavnings- och grammatikkontroll 59
60 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: 60
61 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: 61
62 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: 62
63 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: ett träd träd 63
64 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: ett träd träd träd träd 64
65 Granska Exempel1 Exekvering ORD1(), ORD2(text=ORD1.text) mark(ord1 ORD2) corr(ord1.delete()) indata: ett träd träd utdata: ett träd träd träd träd träd 65
66 Ersättningsförslag 66
67 Ersättningsförslag - ORD1.delete() -- tar bort ordet ORD1 67
68 Ersättningsförslag - ORD1.delete() -- tar bort ordet ORD1 - ORD1.insert(ORD2) -- sätter in ORD2 före ORD1 68
69 Ersättningsförslag - ORD1.delete() -- tar bort ordet ORD1 - ORD1.insert(ORD2) -- sätter in ORD2 före ORD1 - ORD1.join(ORD2) -- sätter ihop ORD1 och ORD2 till ett ord ORD1ORD2 69
70 Ersättningsförslag - ORD1.delete() -- tar bort ordet ORD1 - ORD1.insert(ORD2) -- sätter in ORD2 före ORD1 - ORD1.join(ORD2) -- sätter ihop ORD1 och ORD2 till ett ord ORD1ORD2 - ORD1.replace(ORD2) -- ersätter ORD1 med ORD2 70
71 Ersättningsförslag - ORD1.delete() -- tar bort ordet ORD1 - ORD1.insert(ORD2) -- sätter in ORD2 före ORD1 - ORD1.join(ORD2) -- sätter ihop ORD1 och ORD2 till ett ord ORD1ORD2 - ORD1.replace(ORD2) -- ersätter ORD1 med ORD2 - form(ord1.särdrag:=särdragsvärde) -- ersätter särdrag med särdragsvärde 71
72 Hur känner vi igen sammansättningar? 72
73 Hur känner vi igen sammansättningar? - enklaste strategin: ord = ord + ord Exempel: hus + bil = husbil 73
74 Hur känner vi igen sammansättningar? - enklaste strategin: ord = ord + ord Exempel: hus + bil = husbil - bättre strategi: ord = förled + ord Exempel: skola + bok = skolbok tangent + bord = tangentbord 74
75 Hur känner vi igen sammansättningar? - enklaste strategin: ord = ord + ord Exempel: hus + bil = husbil - bättre strategi: ord = förled + ord Exempel: skola + bok = skolbok tangent + bord = tangentbord - positivt: minskar antal felaktiga bedömningar 75
76 Hur känner vi igen sammansättningar? - enklaste strategin: ord = ord + ord Exempel: hus + bil = husbil - bättre strategi: ord = förled + ord Exempel: skola + bok = skolbok tangent + bord = tangentbord - positivt: minskar antal felaktiga bedömningar - negativt: kan öka antalet missade fel 76
77 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) sammansattning namnet på regeln 77
78 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) sammansattning namnet på regeln minaregler den kategori av regler som regeln tillhör 78
79 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) sammansattning namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1(wordcl=dt) det första ordet vi hittar och som har ordklassen artikel(dt) 79
80 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) sammansattning namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1(wordcl=dt) det första ordet vi hittar och som har ordklassen artikel(dt) ORD2(wordcl=nn & gender!=ord1.gender) ordet som kommer efter ORD1 måste vara ett substantiv(nn) och inte ha samma genus(gender) som ORD1 80
81 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) ORD2(wordcl=nn & gender!=ord1.gender) ordet som kommer efter ORD1 måste vara ett substantiv(nn) och inte ha samma genus(gender) som ORD1 ORD3(wordcl=nn & gender=ord1.gender) ordet som kommer efter ORD1 måste vara ett substantiv(nn) och ha samma genus(gender) som ORD1 81
82 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) mark(ord2, ORD3) markera ORD2 och ORD3 82
83 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) mark(ord2, ORD3) ORD3.real_text markera ORD2 och ORD3 - ordets teckensträng 83
84 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) mark(ord2, ORD3) ORD3.real_text join() markera ORD2 och ORD3 - ordets teckensträng - sätter ihop två strängar till en 84
85 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) mark(ord2, ORD3) ORD3.real_text join() corr() markera ORD2 och ORD3 - ordets teckensträng - sätter ihop två strängar till en - talar om att man vill ändra på något 85
86 Granska Exempel2 ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) mark(ord2, ORD3) ORD3.real_text join() corr() markera ORD2 och ORD3 - ordets teckensträng - sätter ihop två strängar till en - talar om att man vill ändra på något talar om att regeln är en granskningsregel för stavnings- och grammatikkontroll 86
87 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 87
88 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 88
89 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 89
90 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 90
91 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 91
92 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: 92
93 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: en spel korg 93
94 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: en spel korg spel korg spel 94
95 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: en spel korg spel korg spelkorg 95
96 Granska Exempel2 Exekvering ORD1(wordcl=dt), ORD2(wordcl=nn & gender!=ord1.gender), ORD3(wordcl=nn & gender=ord1.gender) mark(ord2 ORD3) corr(ord2.join(ord3.real_text)) indata: en <dt.utr.sin.ind> spel <nn.neu.sin.ind.nom> korg <nn.utr.sin.ind.nom> utdata: en spel korg spel korg spelkorg 96
97 Kongruensfel Exempel: det stora katten Hur skriver vi en regel för att upptäcka att det ska bytas ut mot den? 97
98 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) 98
99 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) nykongruens namnet på regeln 99
100 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) nykongruens minaregler namnet på regeln den kategori av regler som regeln tillhör 100
101 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) nykongruens namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1(wordcl=dt) det första ordet vi hittar och som har ordklassen artikel(dt) 101
102 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) Nykongruens namnet på regeln minaregler den kategori av regler som regeln tillhör ORD1(wordcl=dt) det första ordet vi hittar och som har ordklassen artikel(dt) ORD2(wordcl=jj) det andra ordet vi hittar och som har ordklassen adjektiv(jj) 102
103 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) wordcl=nn % ordet måste vara ett substantiv 103
104 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) wordcl=nn % ordet måste vara ett substantiv gender!=ord1.gender % ordet får inte ha samma genus som % ORD1 104
105 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) wordcl=nn % ordet måste vara ett substantiv gender!=ord1.gender % ordet får inte ha samma genus som % ORD1 gender==ord2.gender % ordet ska ha samma genus som % ORD2 105
106 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) num=ord2.num % ordet ska ha samma numerus som ORD2 106
107 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) spec=ord2.spec % ordet ska ha samma species som ORD2 107
108 Granska Exempel3 ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) ORD3 är ett substantiv(nn), har inte samma genus som ORD1, har samma genus som ORD2, har samma numerus som ORD2 och samma species som ORD2. 108
109 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 109
110 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 110
111 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 111
112 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 112
113 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 113
114 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 114
115 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 115
116 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> 116
117 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> utdata: det stora katten 117
118 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> utdata: det stora katten den <dt.utr.sin.def> 118
119 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> utdata: det stora katten den <dt.utr.sin.def> 119
120 Granska Exempel3 Exekvering ORD1(wordcl=dt), ORD2(wordcl=jj), ORD3(wordcl=nn & gender!=ord1.gender & gender=ord2.gender & num=ord2.num & spec=ord2.spec) mark(ord1 ORD2 ORD3) corr(ord1.form(gender:=ord3.gender)) indata: det <dt.neu.sin.def> stora <jj.pos.utr/neu.sin.def.nom> katten <nn.utr.sin.def.nom> utdata: det stora katten den <dt.utr.sin.def> stora katten 120
121 Alternativa ersättningsförslag Exempel: en dator Ersättningsförslag: en dator några datorer Hur skriver man en regel för detta? 121
122 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet 122
123 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet DT(wordcl=dt) det första ordet är en artikel(dt) 123
124 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet DT(wordcl=dt) det första ordet är en artikel(dt) NN(wordcl=nn & num!=dt.num) det andra ordet är ett substantiv(nn) och har inte samma numerus(num) som artikeln 124
125 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet corr(dt.form(num:=nn.num)) artikeln får samma numerus som substantivet 125
126 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet corr(dt.form(num:=nn.num)) artikeln får samma numerus som substantivet corr(nn.form(num:=dt.num)) substantivet får samma numerus som artikeln 126
127 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet 127
128 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> 128
129 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> 129
130 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> 130
131 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> 131
132 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> utdata: några <dt.utr/neu.plu.ind> datorer 132
133 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> utdata: en dator <nn.utr.sin.ind.nom> några <dt.utr/neu.plu.ind> datorer 133
134 Alternativa ersättningsförslag Exempel DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) corr(dt.form(num:=nn.num)) % byt ut artikeln corr(nn.form(num:=dt.num)) % byt ut substantivet indata: en <dt.utr.sin.ind> datorer <nn.utr.plu.ind.nom> utdata: en dator <nn.utr.sin.ind.nom> några <dt.utr/neu.plu.ind> datorer 134
135 Hoppa mellan reglerna 135
136 Hoppa mellan reglerna - Reglerna i granska exekveras i samma ordning som de står i 136
137 Hoppa mellan reglerna - Reglerna i granska exekveras i samma ordning som de står i - För att hoppa frammåt i reglerna, kan man använda jump(läge) 137
138 Hoppa mellan reglerna - Reglerna i granska exekveras i samma ordning som de står i - För att hoppa frammåt i reglerna, kan man använda jump(läge) - För att skapa ett läge skriver man läge: 138
139 Hoppa mellan reglerna - Reglerna i granska exekveras i samma ordning som de står i - För att hoppa frammåt i reglerna, kan man använda jump(läge) - För att skapa ett läge skriver man läge: - Regelsamlingen blir då så här: regler... läge-etikett: fler regler
140 Hoppa mellan reglerna - Reglerna i granska exekveras i samma ordning som de står i - För att hoppa frammåt i reglerna, kan man använda jump(läge) - För att skapa ett läge skriver man läge: - Regelsamlingen blir då så här: regler... läge-etikett: fler regler... - Om man vill hoppa till början av reglerna kan man skriva jump(beginlabel) 140
141 Hoppa mellan reglerna - Exempel minjump@minaregler DT(wordcl=dt), NN(wordcl=nn & num!=dt.num) mark(dt, NN) jump(etikett)... etikett: När jump(etikett) körs, hoppar man ner till etikett. 141
142 Nästa gång Minsta redigeringsavstånd (för strängar) - Fler verktyg 142
Innehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson
GRAMMATIKKONTROLL I GRANSKA Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder för grammatikkontroll Granska Granskas regelspråk Att skriva regler i Granska Inför laborationen
Läs merInnehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad
Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort
Läs merBootstrapping för substantivtaggning
Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson j0j0@kth.se Mikael Melin mime@kth.se Handledare: Jonas
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merTaggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger
Läs merInnehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?
Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning. Granska Att skriva regler i Granska.
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2014 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merGrim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Läs merGranskas regelspråk. Ola Knutsson. Uppdaterad IPLab, Nada, KTH
Granskas regelspråk Ola Knutsson Uppdaterad 2001-03-08 knutsson@nada.kth.se IPLab, Nada, KTH Innehåll 1. Ett generellt regelspråk... 1 1.1 Förbättrad och utökad funktionalitet... 1 1.2 Definitioner och
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Läs merInnehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG
Innehåll SPRÅKGRANSKNINGSVERKTYG F1:INTRODUKTION Ola Knutsson KTH CSC, knutsson@csc.kth.se Språkgranskningsverktyg Språk vs. skrivet språk Språkriktighet och grammatikalitet, vad är en bra text? Felanalysens
Läs merStavningskontroll. Metoder och tillämpningar inom språkteknologin. ht Allmänt om språkgranskning. Stavningskontroll.
Föreläsningsöversikt Metoder och tillämpningar inom språkteknologin, ht 2006 Språkgranskning evapet@stp.lingfil.uu.se Allmänt om språkgranskning Stavningskontroll Grammatikkontroll Stilkontroll Några exempel
Läs merSpråkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 8 Scania Checker evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kontrollerat språk Scania-svenska Scania Checker Demo 2 Kontrollerat språk Delmängd av naturligt språk Restriktioner
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merInkongruens och särskrivna sammansättningar en beskrivning av två typer av fel och möjligheten att granska dem automatiskt
SveBe 24/05 Domeij et al 1 Inkongruens och särskrivna sammansättningar en beskrivning av två typer av fel och möjligheten att granska dem automatiskt Rickard Domeij, Ola Knutsson och Lena Öhrman Sammanfattning
Läs merIntroduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Läs merInkongruens och särskrivna sammansättningar
SveBe 24/05 Domeij et al 1 Inkongruens och särskrivna sammansättningar En beskrivning av två typer av fel och möjligheten att granska dem automatiskt Rickard Domeij, Ola Knutsson och Lena Öhrman Sammanfattning
Läs mer3. Granskas regelspråk
Ett generellt regelspråk 3. Granskas regelspråk Ett viktigt övergripande mål inom Granska-projektet var att skapa ett system där vi hade full kontroll över samtliga moduler. Vi önskade oss full kontroll
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merspråkgranskning, ht 2007
Maskinöversättning och språkgranskning, ht 2007 Föreläsning 3 Grammatikkontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll Språkgranskningssystem
Läs merGrundläggande Textanalys VT 2014. Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se
Grundläggande Textanalys VT 2014 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Denna gång Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merObesvarade frågor från F1
Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll
Läs merGranskas regelspråk. Tentativ version, Ola Knutsson IPLab, Nada, KTH
Granskas regelspråk Tentativ version, 1999-10-14 Ola Knutsson Innehållsförteckning 1 Ett nytt och generellare regelspråk... 1 1.1 Förbättrad och utökad funktionalitet... 1 2 Definitioner och förklaringar...
Läs merVarför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Läs merSkrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord
Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord
Läs merGrundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word. Eva Pettersson UU/Convertus
Grundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word Eva Pettersson UU/Convertus evapet@stp.lingfil.uu.se Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll
Läs merSvårigheter med kurslitteraturen
Svårigheter med kurslitteraturen Forskningsanknuten kurs Litteraturen är skriven i syfte att presentera forskningsresultat och ofta argumentera för vissa lösningar; undantag: uppfriskningslitteraturen
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Preprocessing - Tokeniserings-
Läs merGränssnitt för FakeGranska. Lars Mattsson
Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken
Läs merWord- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Läs mergrammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Läs merMaskinöversättning och språkgranskning, ht 2006
Maskinöversättning och språkgranskning, ht 2006 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll:
Läs merKongruensböjningen av adjektivet påverkas av substantivets genus och numerus.
Kongruensböjningen av adjektivet påverkas av substantivets genus och numerus. substantivet genus och numerus. En lycklig man gick på gatan. Maskulint substantiv i plural form: Lyckliga män gick på gatan.
Läs merGrundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2015 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Referatuppgiften 10 minuters muntlig presentation av vetenskaplig artikel med 5 minuters efterföljande diskussion
Läs merKungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Läs merspråkgranskning, ht 2007
Maskinöversättning och språkgranskning, ht 2007 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kursöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll:
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Läs merSkrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier
Skrivstöd Christian Hardmeier (efter Joakim Nivre) 205-- Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Stavning fungerar som bildningsmarkör Standardiserad stavning
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi
Läs merMålet är att ge maskiner förmågan att plocka ut information ur
Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:
Läs merORDKLASSERNA I. Ett sätt att sortera våra ord
ORDKLASSERNA I Ett sätt att sortera våra ord Vilka ordklasser finns det? Hur många kan ni komma på? 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Hur sorterar man orden? Morfologiskt Syntaktiskt Semantiskt SUBSTANTIV
Läs mer12 Programstege Substantiv
Det här är en programstege för substantiv. Du kan alltså lära dig om substantiven på ett enkelt sätt, en liten bit i taget. Varje sida innehåller fakta om substantiv, tillsammans med uppgifter som du också
Läs merMaskinöversättning och språkgranskning. F6: Grammatikkontroll
Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.
Läs merEn arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ
DATORER Så klarar man språkkontrollen RICKARD DOMEIJ Är datorns språkkontroll skribentens bästa vän? Eller kommer den mest med löjliga förslag? I april gav Svenska språknämnden ut Datorn granskar språket,
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Läs merObesvarade frågor från F4
Obesvarade frågor från F4 Antal ord i sista upplaga av SAOL 90 000 el 120 000? Varför har barnförbjuden tagits bort och barnförbjuda införts? Formellt singularis, reellt pluralis Mången fotbollsspelare
Läs merSpråkgranskningsverktyg. F1: Introduktion
Språkgranskningsverktyg F1: Introduktion Kursplan http://www.selma.uu.se/publik/main?af=0200&funktion=kplan&kurs=5ln442&startv=200804 Kurssida http://stp.lingfil.uu.se/~evapet/undervisning/sgv08/ Språkgranskningsverktyg
Läs merSpråkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Läs merBehov av språklig granskning. Granska och automatisk språkgranskning av svensk text. Datorn som språkgranskare
Granska och automatisk språkgranskning av svensk text Ola Knutsson knutsson@nada.kth.se Behov av språklig granskning Datorn är det viktigaste skrivverktyget Det är enkelt att producera text som ser bra
Läs merDATORSTÖDD SPRÅKGRANSKNING OCH
Institutionen för lingvistik Stockholms Universitet VT-2000 DATORSTÖDD SPRÅKGRANSKNING OCH ANDRASPRÅKSINLÄRARE Lena Öhrman I denna uppsats undersöks vilka fel några andraspråksinlärare gör när de lär sig
Läs merMorfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)
Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merInnehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Läs merDependensregler - Lathund
Dependensregler - Lathund INTRODUKTION I textprogrammet TeCST är det möjligt för en skribent att skriva, redigera och klistra in text för att få ut läsbarhetsmått och få förslag på hur texten kan skrivas
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merMorfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs mer2. Utgångspunkter och angreppssätt för automatisk språkgranskning
Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet
Läs merHur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk
Beteckning: Institutionen för humaniora och samhällsvetenskap Hur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk Emma Selin December 2009 Examensarbete med didaktisk
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merGrammatifix Svensk grammatikkontroll i MS Word
2D1418, Språkteknologi Grammatifix Svensk grammatikkontroll i MS Word Innehållsförteckning Sida 1 Inledning 3 2 Grammatifix 3 2.1 Detektering av grammatiska fel i Grammatifix 4 2.1.1 Förbehandling 4 2.1.2
Läs merProgrammering med Java. Grunderna. Programspråket Java. Programmering med Java. Källkodsexempel. Java API-exempel In- och utmatning.
Programmering med Java Programmering med Java Programspråket Java Källkodsexempel Källkod Java API-exempel In- och utmatning Grunderna Ann Pan panda@nada.kth.se Rum 1445, plan 4 på Nada 08-7909690 Game.java
Läs merSpråkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Läs merSpråkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Läs merDet görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling
Uppsala universitet Institutionen för nordiska språk C-uppsats 15 hp Svenska som andraspråk C VT 2013 Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling Anna Arvidson
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merGrammatik, det fixar väl datorn?
Grammatik, det fixar väl datorn? rickard.domeij@sprakradet.se Innehåll Fixar den det? Hur? Då slipper man alltså själv? Ska man stänga av skiten då? Men hur fan ska man då göra? :/ 1 Babelfish Ska är vi
Läs merSpråkets struktur och funktion, 7,5 hp
Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag
Läs merInledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock
Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.
Läs merParsning i Granska. Föreläsningens innehåll. Granskas uppbyggnad. Inspiration och förebilder. Regelmatchning/parsning. Granskas regelspråk
Parsning i Granska Ola Knutsson Språkteknologikursen ht 2001 Föreläsningens innehåll Inspiration och förebilder Målsättningar, designval Granskas regelsyntax Regler och tillämpningar Inspiration och förebilder
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merGrundläggande textanalys, VT2012
Grundläggande textanalys, VT2012 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv12/gta/ (Tack till ofia Gustafson-Capkovâ för material.) Repetition 2 Exempel parvspråket
Läs mer4. Bedömning av delprov C
4. Bedömning av delprov C Bedömningen av delprov C genomförs utifrån bedömningsmatriser, kommentarer till bedömningsmatriserna samt med hjälp av exempel på elevlösningar med analys. På grund av skillnader
Läs merIntroduktion till programmering och Python Grundkurs i programmering med Python
Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära
Läs merPROV ORDKLASSER SV Förklara vad ett konkret substantiv är och ge två exempel (3p)
PROV ORDKLASSER SV 8-9 1. Förklara vad ett konkret substantiv är och ge två exempel (3p) 2. Förklara vad ett abstrakt substantiv är och ge två exempel (3p) 3. Vilket genus har orden? Skriv dem i rätt spalt.
Läs merGranskaprojektet: Rapport från arbetet med granskningsregler och kommentarer. *** Rickard Domeij Ola Knutsson IPLab, Nada, KTH
Granskaprojektet: Rapport från arbetet med granskningsregler och kommentarer *** Rickard Domeij Ola Knutsson IPLab, Nada, KTH Domeij, R. & Knutsson, O.Rapport från arbetet med granskningsregler och kommentarer
Läs merHar adjektivets a och e former någon reell betydelse i dagens svenska? Om den så kallade sexusböjningen. Theres Brännmark Grammatikdagen 17 mars 2017
Har adjektivets a och e former någon reell betydelse i dagens svenska? Om den så kallade sexusböjningen Theres Brännmark Grammatikdagen 17 mars 2017 Den nye/nya Nils Erik den helige Anna den allsmäktig?
Läs merVidareutvecklat korpusverktyg med Granska som grund EMMA JOHANSSON
Vidareutvecklat korpusverktyg med Granska som grund EMMA JOHANSSON Examensarbete Stockholm, Sverige 2009 Vidareutvecklat korpusverktyg med Granska som grund EMMA JOHANSSON Examensarbete i datalogi om 30
Läs merTräningshäfte ordklasser (Venus)
Träningshäfte ordklasser (Venus) Substantiv 1. Stryk under substantiven bland följande ord (8 st) glad simma luft koka barnslig tre oj därifrån vikt nej pojke moln lycka jord överenskommelse Pelle femte
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs merspecialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet
www.sprakenshus.se https://larportalen.skolverket.se/#/modul/4- specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet Faktorer av betydelse för en flerspråkig utveckling Sociala faktorer
Läs merAllmänt om programvaror och filer i Windows.
Allmänt om programvaror och filer i Windows. Vart sparade du dokumentet? I Word. Jag har fått detta svar mer än en gång när jag försökt hjälpa någon att hitta ett dokument som de tappat bort i sin dator.
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merMorfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT10 Dag 2
Morfologi, språktyper och skriftsystem Allmän Grammatik och Fonetik HT10 Dag 2 Skriftsystem i världen Skriftsystem: bokstavsalfabeten Varje skrivtecken motsvarar ett separat ljud, konsonant (C) eller vokal
Läs merDatorn har utvecklats till vårt viktigaste. Datorn som språkgranskare SPRÅKTEKNOLOGI OLA KNUTSSON
SPRÅKTEKNOLOGI Datorn som språkgranskare OLA KNUTSSON Datorerna kan inte bara rätta stavfel utan också särskrivningar, böjningsfel, syftningsfel och grammatiska fel. Men fortfarande förslår språkgranskningsprogrammen
Läs merFöreläsning 2. Operativsystem och programmering
Föreläsning 2 Operativsystem och programmering Behov av operativsystem En dator så som beskriven i förra föreläsningen är nästan oanvändbar. Processorn kan bara ges enkla instruktioner såsom hämta data
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merSvenskans struktur, 7,5 hp Tentamensexempel 1
Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt
Läs merUttryck, satser och strömhantering
Linköpings Universitet Institutionen för datavetenskap (IDA) UPP-gruppen 2018-09-06 Mål Uttryck, satser och strömhantering I denna laboration ska du lära dig Formaterad inläsning och utskrift Vanliga repetitions-
Läs merLabb 2: Syntax och ordklasstaggning. Att arbeta med grammatiskt analyserade data
Labb 2: Syntax och ordklasstaggning Att arbeta med grammatiskt analyserade data Labb 2 Arbete med grammatiskt analyserad text Vilka ord finns i texten? Hur många ordtyper innehåller den? Hur ser fördelningen
Läs merSpråkgranskningsverktyg. Grammatikkontroll i Word
Språkgranskningsverktyg Grammatikkontroll i Word Allmänt om grammatikkontroll Grammatikkontrollprogrammen inriktas mot en i förväg definierad felrepertoar. Fastställs vanligen genom analys av korpusmaterial.
Läs merKungl. Tekniska högskolan NADA Grundformer med Stava
Kungl. Tekniska högskolan NADA Grundformer med Stava Språkteknologi 2D1418 Höstterminen 2004 Författare: Andreas Pettersson az@kth.se 1. Bakgrund Om man automatiskt ska plocka ut de informationsbärande
Läs merFOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide
FOR BETTER UNDERSTANDING Kom igång med WordFinder Snabbguide Installationsanvisning 1 Sätt i programskivan i datorn. Installationsprogrammet startar automatiskt. En gemensam startbild för WordFinder Professional,
Läs merDANTEK ELEVWEB HJÄLP. Dantek ElevWeb Hjälp. Version 1 Copyright 2016 by Dantek AB. Sidan 1
Dantek ElevWeb Hjälp Version 1 Copyright 2016 by Dantek AB Sidan 1 Innehåll Introduktion till Dantek ElevWeb 3 Att söka i Dantek ElevWeb 4 3 sätt att söka 5 Trunkering 5 Fritextsökning 6 Hjälp via stavningskontroll
Läs merNetBeans 5.5. Avsikt. Projektfönster
NetBeans 5.5 Avsikt Att bekanta dig med NetBeans programmeringsmiljö, dvs att med hjälp av NetBeans 1. skapa ett nytt projekt 2. skriva in källkod (sparas som.java-fil) 3. kompilera (översätta) koden till
Läs merInstruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python
Instruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python Hjälpmedel Följande hjälpmedel är tillåtna: Exakt en valfri bok, t.ex. den rekommenderade kursboken. Boken får ha anteckningar,
Läs merSvenska språket 1, delkurs 2 Språkets byggstenar 714G47 Svenska språket Svenska språkets byggstenar 714G57
Studiehandledning vt 2018 Svenska språket 1, Delkurs Språkets byggstenar, grammatikdelen 5 hp Svenska språket Svenska språkets byggstenar, grammatikdelen 5 hp Välkommen till grammatikdelen i Svenska språket
Läs mer