Morfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix

Storlek: px
Starta visningen från sidan:

Download "Morfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix"

Transkript

1 Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll Sökmotorer Textsammanfattning i all språkteknik, alltid Vad är ett ord? Graford omges av mellanslag och andra skiljetecken, ordet behöver inte tillhöra språket Problem: i dag - idag Lexem abstrakt ordenhet (lexikonord), tillhör språket, ett lexem flera graford: New York; cyklar - cyklade Ordformer olika former av samma ord Token en enhet med språkligt innehåll (tokenisering) Morfem Morfem språkets minsta betydelsebärande enhet (HÄLL+DE) Morf morfemförekomst(häll+de) Allomorfer varianter på samma morfem (häll+de, köp+te), preteritumändelse, nyckel-nyckl Stam gemensam ordstam (häll) Lemma (hälla) Lexikalt morfem har självständigt betydelseinnehåll Grammatiskt morfem har grammatisk betydelse Fria morfem BIL Bundna morfem (affix) kan inte stå självständigt Fritt grammatiskt morfem -DEN Stam och affix Stam: flick Affix: -or, be-, -m- ge-*-t Suffix: -or flickor Prefix: be- betänka, för- fördriva Infix: -m- korrumpera Circumfix: ge-sag-t 1

2 Språktypologi Isolerande språk (kinesiska) övervägande fria morfem Syntetiska språk kombinerar morfem: 1. Flekterande (svenska) sammansmälta morfem med mycket variation 2. Agglutinerande (finska) tydligt urskiljbara morfem (se exempel) Ordbildningsexempel järjestelmättömyydellänsäkäänköhän järki =förnuft, förstånd järjestää=ordna, arrangera järjestellä=ordna, arrangera (durativt, iterativt) järjestelmä = system (det man fått då man ordnat och ordnat!) järjestelmä+ttöm+yyde+llä+nsä+kään+kö+hän -ttöm av tön, -ttömän: negerande ändelse, -lös: systemlös -yyde, av -yys, -yyden: substantivderivation, -het: systemlöshet -llä:kasusändelsen i ordet: med,på: med systemlöshet -nsä:possessivsuffix 3p: med sin systemlöshet järjestelmä+ttöm+yyde+llä+nsä+kään+kö+hän -kään:negerande ändelse: inte ens: inte ens med sin systemlöshet -kö: frågepartikel: inte ens med sin systemlöshet? hän:affirmativ artuikel: väl, men ju, nog: inte ens med sin systemlöshet, väl? Ordbildning Prefix+rot+suffix (be+ställ+de) Böjning de Avledning ning Sammansättning - förtur+s+beställning Fogförändringar: flick+cykel, gatu+korsning Produktiv ordbildning I Produktiva avledningsändelser: Prefix: för- förlägga Suffix: -ning läggning Avledning byter ofta ordklass 2

3 Produktiv ordbildning II Sammansättningar: minst två fria morfem Lexikaliserade (finns i SAOL) äppelträd, polisbil Nybildningar Språkteknologi+klubben halk+trattar Automatisk morfologisk analys Frekvensbaserat ordformslexikon vs. Morfologisk analys Historik Ta bort ändelser stemming (Chapin & Norton, 1968), Lovins 1969 Nusvensk frekvensordbok (NFO) Sture Allén 1970) Hellberg, stam och böjningar utan lexikon Kaplan & Kay, 1981, generativ fonologi, jämför lexikala former och ytformer hos ord. Koskenniemi, 1983, fortsätter i Kaplan & Kays anda, tvånivåregler, parallella regler och finita automater. Frekvensbaserat ordformslexikon Ingen morfologisk analys Täcker inte hela paradigmet Kräver en taggad korpus Liten arbetsinsats Morfologisk analys Datareducerande Ger böjningsinformation Morfologiskt komplicerade språk Analys och generering Språkvetenskaplig beskrivning Oregelbundna former En klar tendens att oregelbundna former är frekventa i ett språk. är varit bra bättre mindre liten Ej lönt att bygga morfologisk analys för dessa. 3

4 Taggar från Stockhom-Umeå- Corpus (SUC) SIN PLU IND DEF NOM GEN singular plural indefinit definit nominativ genitiv Bilen <bil NN UTR SIN DEF NOM> Analys och generering Analys: Indata: bilen Utdata: bil NN UTR SIN DEF NOM Generering: Indata: bil NN UTR SIN DEF NOM Utdata: bilen 1. Trunkering Avskiljer stam från ändelse utan segmentering inom ändelsen. Lexikon: bil: BIL>AR-deklination häst: HÄST>AR-deklinationen AR-deklinationen: 0 SIN IND NOM -s SIN IND GEN -en SIN DEF NOM -ens SIN DEF GEN -ar PLU IND NOM -ars PLU IND GEN -arna PLU DEF NOM -arnas PLU DEF GEN Flertydighet och variation Inget entydigt förhållande mellan ändelse och morfem -en SIN DEF bilen - husen Morfologisk variation: en, na häll+de, köp+te PRT Fonologisk variation fågel - fågl Analys med nollmorfer Ordform Stam Num Spec Kas bord Bord bords Bord 0 0 s bordet Bord 0 et 0 bordets Bord 0 et s bord Bord bords Bord 0 0 s borden Bord 0 en 0 bordens Bord 0 en s 2. Morfologisk analys - minilexikon Klarar morfologisk variation Går ej: Stam+(Num) + (Spec) + (Kas) bilna, bilare stam Pl Na Kas START---->1---->2---->3---->SLUT Sg 4

5 Lexikon: Stam: bil:bil; häst:häst; Pl: ar:plu Na: na: DEF; 0: IND Sg: en: SIN DEF; 0: SIN IND Kas: s: GEN; 0: NOM 3. System av minilexikon Stam: bil: BIL Num Num: ar: PL Na en: SIN DEF Kas 0: SIN IND Kas Na: Na: DEF Kas 0:IND Kas Kas: s:gen 0: Nom Vilken stam finns i lexikon? fågl eller fågel Det behövs omskrivningsregler Omskrivningsregler a->b/lc _ RC (Chomsky & Halle) l -> el/v(c)c_v fågel - fåglar l -> el/åg_a C=konsonant V=vokal Nackdelar med omskrivningsregler av ytformer Övergenerering: fågelar Endast ortografisk struktur Kan analysera/godkänna felaktiga ord: fågltorn Onödiga omskrivningar: Gävle Gävele Endast en riktning: el l /V(C)C_V Tvånivåmorfologi I Abstrakta lexikonformer Två nivåer: Ortografisk Lexikalisk-morfologisk Finite-state-system Analys och generering 5

6 Tvånivåregler och minilexikon Minilexikon: bil NN PLU DEF GEN Lexikal nivå: bil+ar+na+s Ortografisk nivå: bil0ar0na0s Flertydighet: In: bilar Utdata 1: bila VB PRS AKT Utdata 2: bil NN PLU IND NOM Tvånivåregler Regelsyntax: realisering operator kontext X:x LC _ RC X:x X kan/måste realiseras som x om vänsterkontexten är LC och högerkontexten är RC Exempel: fågel fåglar abstrakt lexikonform: E=inget alls el. e E:0 V(C)C_L+V E:e annars Lexikal nivå: fågel+ar Ortografisk nivå: fåg0l0ar Analys av sammansättningar Lexikal: Ortografisk: fågel#ansikte fågel0ansikte # sammansättningsgräns Lokal disambiguering: pol#is#hus el. polis#hus Heuristiska metoder: Välj: 1. Lexikaliserad sammansättning 2. Så få led som möjligt TWOL - SWETWOL Utvecklad av Kimmo Koskenniemi 1983 Implementerad av Lauri Karttunen 1983 (engelska) Svenska: Bygga egna regler: PCKIMMO Swetwol, Fred Karlsson, 1992 Alla aspekter av böjningsmorfologi behandlas Nästan alla ordformer i löpande text får en morfologisk analys Valens, animat, abstrakt ord - ej med De mest produktiva avledningar behandlas Sammansättningsanalys görs Kärnvokabulären i svenska språket lexikonord 6

7 Statistisk morfologisk analys II Statistisk morfologisk analys I -ar substantiv, utr, plu, ind, nom 60 % -ar verb, prs, akt 40 % Info om ordformernas användning i text Låga utvecklingskostnader, enklare att underhålla, sämre kontroll, risk för skräp och framförallt svårt med generering 7

När är det bra med morfologi? Morfologi (formlära) Vad är ett ord? Ordbildning och ordböjning. Antal bokstäver i mamma? Morfem

När är det bra med morfologi? Morfologi (formlära) Vad är ett ord? Ordbildning och ordböjning. Antal bokstäver i mamma? Morfem Morfologi (formlära) Ordbildning och ordböjning Automatisk morfologisk analys När är det bra med morfologi? Stavnings- och grammatikkontroll Sökmotorer Textsammanfattning i all språkteknik, alltid Ordbildning

Läs mer

Innehåll. Morfologi Kan man inte bara köpa de här systemen och plugga in? Varför morfologisk analys?

Innehåll. Morfologi Kan man inte bara köpa de här systemen och plugga in? Varför morfologisk analys? Morfologi 2002 Ola Knutsson knutsson@nada.kth.se Innehåll Ord och ordbildning Enkel morfologisk analys Tvånivå-modellen Statistisk morfologisk analys När är det bra med morfologi? Morfologisk parsning

Läs mer

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil? Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap

Läs mer

Morfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)

Morfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag) Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver

Läs mer

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan

Läs mer

Ord och morfologi. Morfologi

Ord och morfologi. Morfologi Ord och morfologi DH2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande

Läs mer

Korpuslingvistik vt 2007

Korpuslingvistik vt 2007 Korpuslingvistik vt 2007 Metoder för annotering I Beáta B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk segmentering/analys,

Läs mer

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Ord och morfologi. Morfologi

Ord och morfologi. Morfologi Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Maskinöversättning och språkgranskning. F6: Grammatikkontroll Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.

Läs mer

Obesvarade frågor från F1

Obesvarade frågor från F1 Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Grundläggande textanalys, VT2013

Grundläggande textanalys, VT2013 Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Ordklasstaggning (Sätta

Läs mer

Flera nivåer i språkets uppbyggnad

Flera nivåer i språkets uppbyggnad Flera nivåer i språkets uppbyggnad dubbel artikulation flernivåsystem fonem = minsta betydelsskiljande enhet morfem = minsta betydelsebärande enhet fonem/fon > morfem-morf > lexem-ordform > fras-? > sats-?

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol) Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den

Läs mer

Språkgranskningsverktyg. Grammatikkontroll i Word

Språkgranskningsverktyg. Grammatikkontroll i Word Språkgranskningsverktyg Grammatikkontroll i Word Allmänt om grammatikkontroll Grammatikkontrollprogrammen inriktas mot en i förväg definierad felrepertoar. Fastställs vanligen genom analys av korpusmaterial.

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk

Läs mer

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten Svenskan i tvärspråkligt perspektiv Språktypologi Solveig Malmsten Klassifikation av språk Olika sätt att dela in världens språk i grupper typologiskt: strukturella likheter ekologist: storlek och status

Läs mer

Ordförråd och Ordbildning

Ordförråd och Ordbildning Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande

Läs mer

Grundläggande textanalys, VT2012

Grundläggande textanalys, VT2012 Grundläggande textanalys, VT2012 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv12/gta/ (Tack till ofia Gustafson-Capkovâ för material.) Repetition 2 Exempel parvspråket

Läs mer

Lingvistiska grundbegrepp

Lingvistiska grundbegrepp 729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga

Läs mer

Ordbildning/morfologi

Ordbildning/morfologi Morfologi Ordbildning/morfologi Inom morfologin studeras ords olika form, dess inre struktur, hur ord bildas samt indelning i olika klasser Föreläsning 4 Magnus Merkel 2006-01-29 1 2 Morfem, allomorf Olika

Läs mer

Lingvistik III Morfem och morfologi. 729G49 10 April

Lingvistik III Morfem och morfologi. 729G49 10 April Lingvistik III Morfem och morfologi 729G49 10 April Morfem Rot Affix Ordskapande Morfemstruktur Lexikon Neologismer Språkvetenskapliga områden Fonologi: Principerna för hur man kombinerar språkljud, fonem,

Läs mer

Lexikon: ordbildning och lexikalisering

Lexikon: ordbildning och lexikalisering Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke

Läs mer

9/2/2013. Lingvistik 1: föreläsning 3. Mål. Grammatik: Ordbildning / Morfologi. Therese Lindström Tiedemann

9/2/2013. Lingvistik 1: föreläsning 3. Mål. Grammatik: Ordbildning / Morfologi. Therese Lindström Tiedemann Lingvistik 1: föreläsning 3 Grammatik: Ordbildning / Morfologi Therese Lindström Tiedemann Mål Grundläggande morfologiska begrepp beskriv, ge exempel: ord, morfem, allomorf, slutna/öppna klasser (tas upp

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,

Läs mer

Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser

Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Richard Johansson richard.johansson@svenska.gu.se 19 februari 2014 praktiska detaljer: tenta vilket datum föredrar ni när det gäller tentan?

Läs mer

Språktypologi och språksläktskap

Språktypologi och språksläktskap Språktypologi och språksläktskap Andersson 2e december 2010 Andersson () Språktypologi och språksläktskap 2e december 2010 1 / 11 Språkklassifikation Genetisk klassifikation Hur är språk släkt med varandra?

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Automatisk morfologisk segmentering för svenska substantiv

Automatisk morfologisk segmentering för svenska substantiv Automatisk morfologisk segmentering för svenska substantiv Veronika Ekström verek@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Institutionen för lingvistik och filologi Uppsala

Läs mer

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,

Läs mer

1 Inledning. 1.1 Bakgrund

1 Inledning. 1.1 Bakgrund 1 Inledning 1.1 Bakgrund Vid språkvetenskapligt arbete och bearbetning av texter av olika slag är morfosyntaktisk uppmärkning (ordklasstaggning) oftast ett av de första stegen. Ordklasstaggning kan utföras

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Morfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT09 Dag 2

Morfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT09 Dag 2 Morfologi, språktyper och skriftsystem Allmän Grammatik och Fonetik HT09 Dag 2 Morfologi flick-a flick-a-n flick-a-n-s flick-or flick-or-na flick-or-na-s Morfologi flick-a flick-a-n flick-a-n-s flick-or

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2016) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Från form till betydelse pragmatik semantik analys generering syntax morfologi Skolans

Läs mer

Lingvistik III - Morfem och morfologi

Lingvistik III - Morfem och morfologi Lingvistik III - Morfem och morfologi Dagens föreläsning kommer att ta upp: Morfem - Rot - Affix Ordskapande Morfemstruktur Lexikon Neologismer Fonologi, morfologi och syntax I föreläsningen om ord och

Läs mer

Institutionen för lingvistik, Uppsala universitet Morfologi 5p. Vt 2002. Tomas Riad (08-163638, tomas.riad@nordiska.su.se)

Institutionen för lingvistik, Uppsala universitet Morfologi 5p. Vt 2002. Tomas Riad (08-163638, tomas.riad@nordiska.su.se) Institutionen för lingvistik, Uppsala universitet Morfologi 5p. Vt 2002. Tomas Riad (08-163638, tomas.riad@nordiska.su.se) Övningar för aktualisering av grundläggande svensk morfologi Gör övningarna i

Läs mer

Omtenta Svenska - ett andraspråk S S2GA01/04. ht 2014/vt 2015 fredag den 13 mars Inga hjälpmedel! VG G U 0-84

Omtenta Svenska - ett andraspråk S S2GA01/04. ht 2014/vt 2015 fredag den 13 mars Inga hjälpmedel! VG G U 0-84 Omtenta Svenska - ett andraspråk S S2GA01/04 ht 2014/vt 2015 fredag den 13 mars 8.15 13.15 Inga hjälpmedel! VG 114-142 G 85-113 U 0-84 Information: Skriv din anonymitetskod på denna sida samt högst upp

Läs mer

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer

Läs mer

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap 729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Introduktion i lingvistik 6

Introduktion i lingvistik 6 Introduktion i lingvistik 6 Objekt Vi har stött på tre olika typer: Direkt objekt (jfr gamla ackusativobjekt ): Tar alltså ackusativ i tex ryska och tyska (vanligtvis). Jag äter mat. Jag studerar lingvistik.

Läs mer

Institutionen för lingvistik och filologi HT 2009

Institutionen för lingvistik och filologi HT 2009 Instruktioner: Du har 15 minuter på dig per prov. Varje fråga har enbart ett rätt svar. För godkänt krävs minst 6 rätta svar/prov. Facit finns i slutet av dokumentet. Miniprov för Dag 1, 1 september 2009:

Läs mer

Kursplaneöversättaren. Lina Stadell

Kursplaneöversättaren. Lina Stadell Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad

Läs mer

Morfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT10 Dag 2

Morfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT10 Dag 2 Morfologi, språktyper och skriftsystem Allmän Grammatik och Fonetik HT10 Dag 2 Skriftsystem i världen Skriftsystem: bokstavsalfabeten Varje skrivtecken motsvarar ett separat ljud, konsonant (C) eller vokal

Läs mer

grammatik Ordklasser, nominalfraser, substantiv

grammatik Ordklasser, nominalfraser, substantiv Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

SUBSTANTIVETS PLURALFORMER I FINSKSPRÅKIGA GYMNASISTERS UPPSATSER. Saila Tullinen

SUBSTANTIVETS PLURALFORMER I FINSKSPRÅKIGA GYMNASISTERS UPPSATSER. Saila Tullinen SUBSTANTIVETS PLURALFORMER I FINSKSPRÅKIGA GYMNASISTERS UPPSATSER Saila Tullinen Pro gradu-avhandling i svenska språket Institutionen för språk Jyväskylä universitet Våren 2007 ABSTRAKT JYVÄSKYLÄ UNIVERSITET

Läs mer

Grundläggande textanalys, VT2013

Grundläggande textanalys, VT2013 Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska

Läs mer

Grammatik skillnader mellan svenska och engelska

Grammatik skillnader mellan svenska och engelska UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning

Läs mer

Världens språk. Lingvistik och grammatik Världens språk Språkstrukturer och skriftsystem. Allmän Grammatik och Fonetik HT07 Dag 1

Världens språk. Lingvistik och grammatik Världens språk Språkstrukturer och skriftsystem. Allmän Grammatik och Fonetik HT07 Dag 1 Världens språk Lingvistik och grammatik Världens språk Språkstrukturer och skriftsystem Allmän Grammatik och Fonetik HT07 Dag 1 Världens språk Världens sex största språk Kinesiska Engelska Spanska Arabiska

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Några skillnader mellan svenska och engelska

Några skillnader mellan svenska och engelska UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2011 Några skillnader mellan svenska och engelska 1 Inledning

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys

Läs mer

stinaka@stp.ling.uu.se

stinaka@stp.ling.uu.se !"# $ %& ' % )(* +-,/.1032 5#687:9'; 4 stinaka@stp.ling.uu.se = 2@? 7 0AB2 9'687, 7.)C 2D,FE 9'G.10 ;IH.1A',J.LK +NM 9 2@K-, 4 7 KN0E G E ;.1M 9 E ;O9 2I?P? 7, Q MMAB2 G 2SR0. HT7:9 A!.U, 7,VWX0A',J.U,JRY,J.LEZ0

Läs mer

Institutionen för lingvistik och filologi HT 2007

Institutionen för lingvistik och filologi HT 2007 Övningsfrågor för Dag 1, 3 september 2007: Lingvistik och grammatik, världens språk, språktyper och skriftsystem 1. Vad är skillnaden mellan infallsvinklarna deskriptiv och preskriptiv lingvistik? Vilken

Läs mer

Morfologisk typologi. Världens språk, 7,5hp vt Affix (II) 5. Lingvistisk typologi II: Morfologisk typologi, m.m.

Morfologisk typologi. Världens språk, 7,5hp vt Affix (II) 5. Lingvistisk typologi II: Morfologisk typologi, m.m. Niklas Edenmyr niklas.edenmyr@lingfil.uu.se Världens språk, 7,5hp vt 2012 5. Lingvistisk typologi II: Morfologisk typologi, m.m. Morfologisk typologi 2 Affix (I) Prefix och suffix är de huvudsakliga markeringstyperna

Läs mer

12 Programstege Substantiv

12 Programstege Substantiv Det här är en programstege för substantiv. Du kan alltså lära dig om substantiven på ett enkelt sätt, en liten bit i taget. Varje sida innehåller fakta om substantiv, tillsammans med uppgifter som du också

Läs mer

Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad

Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort

Läs mer

Världens språk, 7,5hp vt 2012

Världens språk, 7,5hp vt 2012 Niklas Edenmyr niklas.edenmyr@lingfil.uu.se Världens språk, 7,5hp vt 2012 3. Språkets arkitektur II: Form & funktion; Morfem, ord och ordklasser; Fraser, satser och satsanalys Form & funktion (I) Två viktiga

Läs mer

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson 008 Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Morfologi eller formlära

Morfologi eller formlära Morfologi eller formlära Inom morfologin behandlas ordböjning, dvs. böjningen av orden i de böjbara ordklasserna i olika former med hjälp av ändelser, liksom ordbildning, dvs. bildningen av nya ord genom

Läs mer

Labb 2: Syntax och ordklasstaggning. Att arbeta med grammatiskt analyserade data

Labb 2: Syntax och ordklasstaggning. Att arbeta med grammatiskt analyserade data Labb 2: Syntax och ordklasstaggning Att arbeta med grammatiskt analyserade data Labb 2 Arbete med grammatiskt analyserad text Vilka ord finns i texten? Hur många ordtyper innehåller den? Hur ser fördelningen

Läs mer

Kort presentation av Korp, Sveriges nationalkorpus

Kort presentation av Korp, Sveriges nationalkorpus Kort presentation av Korp, Sveriges nationalkorpus Göteborgs universitet 19 januari 2017 vid Avdelningen för nordiska språk, L Orientale-universitetet i Neapel Fil.dr. i slaviska språk. Undervisat i slovenska,

Läs mer

Extramaterial 3 Morfologi

Extramaterial 3 Morfologi Extramaterial 3 Morfologi Yair Sapir Morfologi är läran om former (av grek. morphē). I princip ska man med hjälp av morfolign kunna analysera vilken som helst form eller ord i världens språk. Morfem är

Läs mer

Ordböjning morfologisk utveckling

Ordböjning morfologisk utveckling Ordböjning morfologisk utveckling Språkstruktur! Principen bakom alla mänskliga språks struktur är att små delar bygger upp större delar som bygger upp ännu större delar Barns tidiga språkutveckling Institutionen

Läs mer

Kognitiv Psykologi HT11 Språk, föreläsning 1

Kognitiv Psykologi HT11 Språk, föreläsning 1 Kognitiv Psykologi HT11 Språk, föreläsning 1 Mål för föreläsning 1 är att veta mer om: Vad språk är Vilken språklig kunskap vi behöver som språkanvändare Hur vårt mentala lexikon är uppbyggt Vilka processer

Läs mer

Perl. ~ Redovisning. Alla filer som behövs för att lösa uppgifterna finns dels på ~martin/pubperl/ på mumin, samt på http://www.nada.kth.

Perl. ~ Redovisning. Alla filer som behövs för att lösa uppgifterna finns dels på ~martin/pubperl/ på mumin, samt på http://www.nada.kth. Perl ~ Redovisning Övningsuppgifterna är rena övningsuppgifter och på intet sett obligatoriska, men gör dem gärna i alla fall. Det kommer att delas ut inlämningsuppgifter från och med Lektion 2. Dessa

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi

Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi Persiska Albin Finne 2002-10-10 Sammanfattning Den här uppsatsen beskriver det persiska språket. Språkets historia, morfologi, syntax och ordförråd behandlas. Tonvikten läggs på morfologi och syntax. Avslutningsvis

Läs mer

TDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg

TDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg TDDD02 Föreläsning 2 HT-2013 Reguljära uttryck och reguljära språk Lars Ahrenberg Översikt Reguljära uttryck sökproblem i texter definitioner och exempel UNIX-funktionen grep Reguljära transformationer

Läs mer

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31) Korpusannotering Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusannotering 1(31) Förra gången Att bygga en korpus sampling uppmärkning annotering

Läs mer

Meningssegmentering i SUC och Talbanken

Meningssegmentering i SUC och Talbanken Meningssegmentering i SUC och Talbanken Mattias Edlund och Gvargis Demir Institutionen för lingvistik och filologi Uppsala Universitet Box 635 SE-751 26 Uppsala SWEDEN {matted,gevargis}@stp.lingfil.uu.se

Läs mer

Till särskrivningens försvar. Nils Dverstorp Europeiska språkdagen 25 september 2015

Till särskrivningens försvar. Nils Dverstorp Europeiska språkdagen 25 september 2015 Till särskrivningens försvar Nils Dverstorp Europeiska språkdagen 25 september 2015 Ordbildningslära Två principer för att skapa nya ord: Avledning Sammansättning Avledning Till en stam fogas ett prefix

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

Semantiska relationer. Hanna Seppälä Uppsala universitet 1

Semantiska relationer. Hanna Seppälä Uppsala universitet 1 Semantiska relationer Föreläsning 6 Uppsala universitet 1 Teman idag Lexikal semantik Kollokation och idiom Ambiguitet och vaghet Semantiska relationer mellan ord Lexikala universalier Uppsala universitet

Läs mer

SALDO. En ruta kommer upp och du uppmanas att skriva in ett ord inte nödvändigtvis en lexikonform, det kan också vara en böjd form.

SALDO. En ruta kommer upp och du uppmanas att skriva in ett ord inte nödvändigtvis en lexikonform, det kan också vara en böjd form. SALDO Beskrivningen av SALDO finner du på adressen http://spraakbanken.gu.se/saldo För att söka i SALDO går du till den här adressen: http://spraakbanken.gu.se/ws/saldo-ws/fl/html En ruta kommer upp och

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

Några skillnader mellan svenska och engelska

Några skillnader mellan svenska och engelska UPPSALA UNIVERSITET Datorlingvistisk grammatik Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf Mars 2012 Några skillnader mellan svenska och engelska 1 Inledning likheter

Läs mer

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till? Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar

Läs mer

MÖSG ht 2005 Maskinöversättningssystemet MATS

MÖSG ht 2005 Maskinöversättningssystemet MATS MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?

Läs mer

Automatisk morfologisk analys av ungerska substantiv med PC-KIMMO

Automatisk morfologisk analys av ungerska substantiv med PC-KIMMO Institutionen för lingvistik och filologi Språkteknologiprogrammet Examensarbete i datorlingvistik 26 augusti 2005 Automatisk morfologisk analys av ungerska substantiv med PC-KIMMO Jennie Gadeborg Handledare:

Läs mer

Jonas Löfström Språkdata Göteborgs universitet DOLDA ORDBILDNINGSMÖNSTER. LEXIKOLOGI

Jonas Löfström Språkdata Göteborgs universitet DOLDA ORDBILDNINGSMÖNSTER. LEXIKOLOGI 154 Jonas Löfström Språkdata Göteborgs universitet DOLDA ORDBILDNINGSMÖNSTER. LEXIKOLOGI n Ag r a p r o b l e m i n o m d a t a m a s k i n e l l Med dolda ordbildningsmönster avses de regelbundenheter

Läs mer

Precodia. Manual. Precodia 1.0. Elevdata AB. Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten. (www.spsm.se)

Precodia. Manual. Precodia 1.0. Elevdata AB. Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten. (www.spsm.se) Precodia Manual Precodia 1.0 Elevdata AB Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten (www.spsm.se) Elevdata i Malmö AB, Fosievägen 13 21431 Malmö Tel: 040-939150 www.elevdata.se

Läs mer

Kardía. fåglar en sol. ett berg en gungställning. ett träd. en bro. gräs. en å. Substantiv. Hanna Hägerland

Kardía. fåglar en sol. ett berg en gungställning. ett träd. en bro. gräs. en å. Substantiv. Hanna Hägerland Kardía fåglar en sol ett berg en gungställning ett träd en bro gräs en å Substantiv Hanna Hägerland Innehåll Vad är substantiv? 2 Substantivens ordlista 3 Ringa in substantiv 4 Substantiv i bestämd form

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling

Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling Uppsala universitet Institutionen för nordiska språk C-uppsats 15 hp Svenska som andraspråk C VT 2013 Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling Anna Arvidson

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer