Innehåll. Morfologi Kan man inte bara köpa de här systemen och plugga in? Varför morfologisk analys?
|
|
- Max Engström
- för 7 år sedan
- Visningar:
Transkript
1 Morfologi 2002 Ola Knutsson Innehåll Ord och ordbildning Enkel morfologisk analys Tvånivå-modellen Statistisk morfologisk analys När är det bra med morfologi? Morfologisk parsning Parsning = att känna igen indata och tilldela indata någon sorts struktur Morfologisk parsning? Begreppet parsning har ofta varit synonymt med syntaktisk parsning, men parsning kan göras på flera nivåer. En syntaktisk parser behöver en morfologisk parser. Varför? Varför morfologisk analys? Svenska språket innehåller många ordformer Engelskan har mycket färre böjningsformer, men många avledningar: compute computer, computerize, computerization, recomputerize, noncomputerized Kan man inte bara köpa de här systemen och plugga in? Ja, om man är rik Att bygga lexikon har kräver ofta mycket manuellt arbete. Ordanalysen behövs nästan i alla språksystem Det dyker ständigt upp nya ord Vi kan skapa nya ord genom sammansättningar 1
2 Ordbildning och ordböjning Grammatik: Morfologi Syntax Morfologi är läran om ords former och bildning Hur man kombinerar orddelar (morfem) för att bilda hela ord. Några angränsande begrepp: Fonem: språkljudsenhet med betydelsebärande funktion Fonetik: språkljudens produktion, perception och akustik Fonologi:språkljuden som funktionellt system Fonotax: språkets regler för hur språkljud (fonem) kombineras till stavelser Vad är ett ord? Graford omges av mellanslag och andra skiljetecken, ordet behöver inte tillhöra språket Problem: i dag - idag Lexem abstrakt ordenhet (lexikonord), tillhör språket, ett lexem flera graford: New York; cyklar - cyklade Ordformer olika former av samma ord Token en enhet med språkligt innehåll (tokenisering) Morfem Morfem språkets minsta betydelsebärande enhet (HÄLL+DE) Morf morfemförekomst(häll+de) Allomorfer varianter på samma morfem (häll+de, köp+te), preteritumändelse, nyckle-nyckl Antal bokstäver i mamma? Förekomster Typer Ljud FON FONEM Bokstäver GRAF GRAFEM Morfem MORF MORFEM Ord GRAFORD LEXEM Stam gemensam ordstam (häll) Lemma (hälla) Lexikalt morfem har självständigt betydelseinnehåll Grammatiskt morfem har grammatisk betydelse Fria morfem BIL Bundna morfem (affix) kan inte stå självständigt Fritt grammatiskt morfem -DEN 2
3 Ordbygge morf+o+logi = form+fogemorfem+lära stam affix cykla -r cykla -de cykla -t cykla -nde Stam och affix Stam: flick Affix: -or, be-, -m- ge-*-t Suffix: -or flickor Prefix: be- betänka, för- fördriva Infix: -m- korrumpera Circumfix: ge-sag-t Stamförändringar Springa sprang sprungit (starka verb) OMLJUD: man:män, son:söner AVLJUD: i:a:u springa y:ö:u flyga flög flugit REDUPLIKATION (fördubbling): (latin) currit han springer, cu-currit han sprang/har sprungit STAMBYTE: är varit, liten-små-mindre Indelning av morfologin Böjningsmorfologi - böjer lexem cykla, cyklar, cyklade, cyklat Avledningsmorfologi skapar nya lexem god-het Morfologisk typologi Analytiska Isolerande språk (vietnamesiska) övervägande fria morfem Syntetiska språk kombinerar morfem: polysyntektiska. 1. Flekterande (svenska) sammansmälta morfem med mycket variation. 2. Agglutinerande (finska) tydligt urskiljbara morfem (se exempel) 3
4 Analytisk och syntetisk Suffix eller prefix? spännande fin mer spännande finare mest spännande finast analytisk syntetisk, agglutinerande Suffix är vanligare än prefix i världens språk Infix är mycket ovanligt, i svenskan mest i latinska låneord låg lägre lägst syntetisk, flekterande Ordbildningsexempel järjestelmättömyydellänsäkäänköhän järki =förnuft, förstånd järjestää=ordna, arrangera järjestellä=ordna, arrangera (durativt, iterativt) järjestelmä = system (det man fått då man ordnat och ordnat!) järjestelmä+ttöm+yyde+llä+nsä+kään+kö+hän -ttöm av tön, -ttömän: negerande ändelse, -lös: systemlös -yyde, av -yys, -yyden: substantivderivation, -het: systemlöshet -llä:kasusändelsen i ordet: med,på: med systemlöshet -nsä:possessivsuffix 3p: med sin systemlöshet järjestelmä+ttöm+yyde+llä+nsä+kään+kö+hän -kään:negerande ändelse: inte ens: inte ens med sin systemlöshet -kö: frågepartikel: inte ens med sin systemlöshet? hän:affirmativ artuikel: väl, men ju, nog: inte ens med sin systemlöshet, väl? Ordbildning Prefix+rot+suffix (be+ställ+de) Böjning de Avledning ning Sammansättning - förtur+s+beställning Fogförändringar: flick+cykel, gatu+korsning 4
5 Produktiv ordbildning II Produktiv ordbildning I Produktiva avledningsändelser: Prefix: för- förlägga Suffix: -ning läggning Avledning byter ofta ordklass Sammansättningar: minst två fria morfem Lexikaliserade (finns i SAOL) äppelträd, polisbil Nybildningar Språkteknologi+klubben halk+trattar Sammansättningar II Determinativ: efterleden bestämmer tolkningen: badhus Kopulativ: blågul=blå och gul, leden är samordnade, strumpbyxor Böjning Konjugationer verbens böjningsmönster Tempus(nutid, dåtid, framtid?) Diates(aktiv, passiv) mat-a mat-ar, -as mat-ade, ades har/hade mat-at, -ats mat-ande, andes Deklinationer substantivens böjningsmönster (numerus, species, kasus) I: neutrum, äpple:äpplen, hus:hus II: -are lärare:lärare III: utrumord a, flick-a,-an,-or IV: utrumord, obetonat e, pojke:pojkar V: andra utrum ord: -er, -or, -r.specialfall och undantagsregler Morfotax Hur används morfemet och vilka grannar får det ha? Det regelsystem som styr detta kallas morfotax. Hund+ar+na+s inte hund+ar+s+na 5
6 Taggar från Stockhom-Umeå- Corpus (SUC) SIN PLU IND DEF NOM GEN singular plural indefinit definit nominativ genitiv Bilen <bil NN UTR SIN DEF NOM> Ordform bil bils bilen bilens bilar bilars bilarna bilarnas Ordparadigm Lexem Num Spec BIL SIN IND BIL SIN IND BIL SIN DEF BIL SIN DEF BIL PLU IND BIL PLU IND BIL PLU DEF BIL PLU DEF Kas NOM GEN NOM GEN NOM GEN NOM GEN Automatisk morfologisk analys Automatisk morfologisk analys Indata hund hundarnas såg blindhund Morfologiskt analyserad utdata hund +NN +UTR +SIN +IND +NOM hund +NN +UTR +PLU +DEF +GEN se +VB +PRT +AKT såg +NN +UTR + blind+hund +NN +UTR +SIN +IND +NOM Frekvensbaserat ordformslexikon vs. Morfologisk analys Historik Frekvensbaserat ordformslexikon Ta bort ändelser stemming (Chapin & Norton, 1968), Lovins 1969 Nusvensk frekvensordbok (NFO) Sture Allén 1970) Hellberg, stam och böjningar utan lexikon Kaplan & Kay, 1981, generativ fonologi, jämför lexikala former och ytformer hos ord. Koskenniemi, 1983, fortsätter i Kaplan & Kays anda, tvånivåregler, parallella regler och finita automater. Ingen morfologisk analys Täcker inte hela paradigmet Kräver en taggad korpus Liten arbetsinsats 6
7 Morfologisk analys Datareducerande Ger böjningsinformation Morfologiskt komplicerade språk Analys och generering Språkvetenskaplig beskrivning Oregelbundna former En klar tendens att oregelbundna former är frekventa i ett språk. är varit bra bättre mindre liten Ej lönt att bygga morfologisk analys för dessa. Analys och generering Analys: Indata: bilen Utdata: bil NN UTR SIN DEF NOM Generering: Indata: bil NN UTR SIN DEF NOM Utdata: bilen 1. Trunkering Avskiljer stam från ändelse utan segmentering inom ändelsen. Lexikon: bil: BIL>AR-deklination häst: HÄST>AR-deklinationen AR-deklinationen: 0 SIN IND NOM -s SIN IND GEN -en SIN DEF NOM -ens SIN DEF GEN -ar PLU IND NOM -ars PLU IND GEN -arna PLU DEF NOM -arnas PLU DEF GEN Flertydighet och variation Inget entydigt förhållande mellan ändelse och morfem -en SIN DEF bilen - husen Morfologisk variation: en, na häll+de, köp+te PRT Fonologisk variation fågel - fågl Byggstenar för morfologisk analys Lexikon Morfotaktiska beskrivningar Ortografiska regler: fågel fåglar 7
8 Morfologisk igenkänning Vilka ord tillhör språket? Vilka ord hör sannolikt till språket? Vilka ord tillhör inte språket? Eller skall alla ord får rimligaste möjliga analys? Analys med nollmorfer Ordform Stam Num Spec Kas bord Bord bords Bord 0 0 s bordet Bord 0 et 0 bordets Bord 0 et s bord Bord bords Bord 0 0 s borden Bord 0 en 0 bordens Bord 0 en s 2. Morfologisk analys - minilexikon Klarar morfologisk variation Går ej: Stam+(Num) + (Spec) + (Kas) bilna, bilare stam Pl Na Kas START---->1---->2---->3---->SLUT Sg Lexikon: Stam: bil:bil; häst:häst; Pl: ar:plu Na: na: DEF; 0: IND Sg: en: SIN DEF; 0: SIN DEF Kas: s: GEN; 0: NOM 3. System av minilexikon Stam: bil: BIL Num Num: ar: PL Na en: SIN DEF Kas 0: SIN IND Kas Na: Na: DEF Kas 0:IND Kas Kas: s:gen 0: Nom Vilken stam finns i lexikon? fågl eller fågel Det behövs omskrivningsregler 8
9 Omskrivningsregler a->b/lc _ RC (Chomsky & Halle) l -> el/v(c)c_v fågel - fåglar l -> el/åg_a C=konsonant V=vokal Nackdelar med omskrivningsregler av ytformer Övergenerering: fågelar Endast ortografisk struktur Kan analysera/godkänna felaktiga ord: fågltorn Onödiga omskrivningar: Gävle Gävele Endast en riktning: el l /V(C)C_V Tvånivåmorfologi I Abstrakta lexikonformer Två nivåer: Ortografisk Lexikalisk-morfologisk Finite-state-system Analys och generering De två nivåerna Morfologisk gräns: + el. ^ Null character: 0 el. Ø ε Strängslut; # Lexikalisk: bil+ar+na+s Ortografisk: bil0ar0na0s Korresponderande par: b:b i:i l:l +:0 a:a r:r +:0 n:n a:a +:0 s:s In: bilarnas Ut: bil+ar+na+s Tvånivåregler och minilexikon Minilexikon: bil NN PLU DEF GEN Lexikal nivå: bil+ar+na+s Ortografisk nivå: bil0ar0na0s Flertydighet: In: bilar Utdata 1: bila VB PRS AKT Utdata 2: bil NN PLU IND NOM Tvånivåregler Regelsyntax: realisering operator kontext X:x LC _ RC X:x X kan/måste realiseras som x om vänsterkontexten är LC och högerkontexten är RC 9
10 Exempel: fågel fåglar abstrakt lexikonform: E=inget alls el. e E:0 V(C)C_L+V E:e annars Lexikal nivå: fågel+ar Ortografisk nivå: fåg0l0ar Analys av sammansättningar Lexikal: Ortografisk: fågel#ansikte fågel0ansikte # sammansättningsgräns Lokal disambiguering: pol#is#hus el. polis#hus Heuristiska metoder: Välj: 1. Lexikaliserad sammansättning 2. Så få led som möjligt Tvånivåmorfologi forts. Variation efter tonlös konsonant hos några svaga verb i preteritum: Ortografisk form: läs0te böj0de bada0de Lexikalisk form: läs+de böj+de bada+de T= tonlös konsonant {f,k,p,s,t} Tvånivåregel: D:t T+_ läste D:d annars böjde, badade TWOL - SWETWOL Utvecklad av Kimmo Koskenniemi 1983 Implementerad av Lauri Karttunen 1983 (engelska) Svenska: Bygga egna regler: PCKIMMO Swetwol, Fred Karlsson, 1992 Alla aspekter av böjningsmorfologi behandlas Nästan alla ordformer i löpande text får en morfologisk analys Valens, animat, abstraktord - ej med De mest produktiva avledningar behandlas Sammansättningsanalys görs Kärnvokabulären i svenska språket lexikonord Swetwol II 299 minilexikon Varje post i ett minilexikon innehåller en pekare till ett minilexikon eller # 10
11 Swetwol III Endast 8 tvånivåregler Exempel: m:0 <=>: m _ N -ning simma --> simning Utvärdering: ord (8432 typer) 0,65 % lämnades utan analys ord 0,4 % utan analys Statistisk morfologisk analys I -ar substantiv, utr, plu, ind, nom 60 % -ar verb, prs, akt 40 % Statistisk morfologisk analys II Info om ordformernas användning i text Låga utvecklingskostnader, enklare att underhålla, sämre kontroll, risk för skräp och framförallt svårt med generering Stemming Regler, inget lexikon Främsta tillämpning: informationssökning cykel ->cykl cyklar -> cykl cykling -> cykl cyklande -> cykl Porters stemmingalgoritm Kaskader av omskrivningsregler ar ε / C_# Olika steg med längsta möjliga matchning som krav inom varje steg. Utgår ifrån mönster av Vokaler (V) och konsonanter (C). övergenerering? Regering -> reger regerande -> reger Stemming versus lemmatisering behövs det ett lexikon? Stemming: banan (stam=ban) banan (stam=ban) Lemmatisering: banan (lemma=bana) banan(lemma=banan) Täckning eller precision Stemmers gör fel, men lemmatiserare gör också fel Disambiguering? Indexets storlek? 11
12 Uppsatsuppgifter 1. Utred tvånivåmodellen för svenska 2. Bygg en enkel stemmer 3. Utforska PC-KIMMO 12
Morfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Läs merNär är det bra med morfologi? Morfologi (formlära) Vad är ett ord? Ordbildning och ordböjning. Antal bokstäver i mamma? Morfem
Morfologi (formlära) Ordbildning och ordböjning Automatisk morfologisk analys När är det bra med morfologi? Stavnings- och grammatikkontroll Sökmotorer Textsammanfattning i all språkteknik, alltid Ordbildning
Läs merVarför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Läs merMorfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)
Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merOrd och morfologi. Morfologi
Ord och morfologi DH2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs mergrammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Läs merOrd och morfologi. Morfologi
Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Läs merKorpuslingvistik vt 2007
Korpuslingvistik vt 2007 Metoder för annotering I Beáta B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk segmentering/analys,
Läs merLexikon: ordbildning och lexikalisering
Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merLingvistik III Morfem och morfologi. 729G49 10 April
Lingvistik III Morfem och morfologi 729G49 10 April Morfem Rot Affix Ordskapande Morfemstruktur Lexikon Neologismer Språkvetenskapliga områden Fonologi: Principerna för hur man kombinerar språkljud, fonem,
Läs merSvenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten
Svenskan i tvärspråkligt perspektiv Språktypologi Solveig Malmsten Klassifikation av språk Olika sätt att dela in världens språk i grupper typologiskt: strukturella likheter ekologist: storlek och status
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merInstitutionen för lingvistik och filologi HT 2009
Instruktioner: Du har 15 minuter på dig per prov. Varje fråga har enbart ett rätt svar. För godkänt krävs minst 6 rätta svar/prov. Facit finns i slutet av dokumentet. Miniprov för Dag 1, 1 september 2009:
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs merSpråkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merSpråktypologi och språksläktskap
Språktypologi och språksläktskap Andersson 2e december 2010 Andersson () Språktypologi och språksläktskap 2e december 2010 1 / 11 Språkklassifikation Genetisk klassifikation Hur är språk släkt med varandra?
Läs merFlera nivåer i språkets uppbyggnad
Flera nivåer i språkets uppbyggnad dubbel artikulation flernivåsystem fonem = minsta betydelsskiljande enhet morfem = minsta betydelsebärande enhet fonem/fon > morfem-morf > lexem-ordform > fras-? > sats-?
Läs merMorfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT09 Dag 2
Morfologi, språktyper och skriftsystem Allmän Grammatik och Fonetik HT09 Dag 2 Morfologi flick-a flick-a-n flick-a-n-s flick-or flick-or-na flick-or-na-s Morfologi flick-a flick-a-n flick-a-n-s flick-or
Läs merAutomatisk morfologisk segmentering för svenska substantiv
Automatisk morfologisk segmentering för svenska substantiv Veronika Ekström verek@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Institutionen för lingvistik och filologi Uppsala
Läs merInstitutionen för lingvistik, Uppsala universitet Morfologi 5p. Vt 2002. Tomas Riad (08-163638, tomas.riad@nordiska.su.se)
Institutionen för lingvistik, Uppsala universitet Morfologi 5p. Vt 2002. Tomas Riad (08-163638, tomas.riad@nordiska.su.se) Övningar för aktualisering av grundläggande svensk morfologi Gör övningarna i
Läs merGrundläggande textanalys, VT2012
Grundläggande textanalys, VT2012 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv12/gta/ (Tack till ofia Gustafson-Capkovâ för material.) Repetition 2 Exempel parvspråket
Läs merMorfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT10 Dag 2
Morfologi, språktyper och skriftsystem Allmän Grammatik och Fonetik HT10 Dag 2 Skriftsystem i världen Skriftsystem: bokstavsalfabeten Varje skrivtecken motsvarar ett separat ljud, konsonant (C) eller vokal
Läs merLingvistik III - Morfem och morfologi
Lingvistik III - Morfem och morfologi Dagens föreläsning kommer att ta upp: Morfem - Rot - Affix Ordskapande Morfemstruktur Lexikon Neologismer Fonologi, morfologi och syntax I föreläsningen om ord och
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merMaskinöversättning och språkgranskning. F6: Grammatikkontroll
Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.
Läs mer12 Programstege Substantiv
Det här är en programstege för substantiv. Du kan alltså lära dig om substantiven på ett enkelt sätt, en liten bit i taget. Varje sida innehåller fakta om substantiv, tillsammans med uppgifter som du också
Läs merOrdklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)
Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den
Läs merSpråkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser
Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Richard Johansson richard.johansson@svenska.gu.se 19 februari 2014 praktiska detaljer: tenta vilket datum föredrar ni när det gäller tentan?
Läs merOrdförråd och Ordbildning
Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Ordklasstaggning (Sätta
Läs merVärldens språk. Lingvistik och grammatik Världens språk Språkstrukturer och skriftsystem. Allmän Grammatik och Fonetik HT07 Dag 1
Världens språk Lingvistik och grammatik Världens språk Språkstrukturer och skriftsystem Allmän Grammatik och Fonetik HT07 Dag 1 Världens språk Världens sex största språk Kinesiska Engelska Spanska Arabiska
Läs merSUBSTANTIVETS PLURALFORMER I FINSKSPRÅKIGA GYMNASISTERS UPPSATSER. Saila Tullinen
SUBSTANTIVETS PLURALFORMER I FINSKSPRÅKIGA GYMNASISTERS UPPSATSER Saila Tullinen Pro gradu-avhandling i svenska språket Institutionen för språk Jyväskylä universitet Våren 2007 ABSTRAKT JYVÄSKYLÄ UNIVERSITET
Läs mer9/2/2013. Lingvistik 1: föreläsning 3. Mål. Grammatik: Ordbildning / Morfologi. Therese Lindström Tiedemann
Lingvistik 1: föreläsning 3 Grammatik: Ordbildning / Morfologi Therese Lindström Tiedemann Mål Grundläggande morfologiska begrepp beskriv, ge exempel: ord, morfem, allomorf, slutna/öppna klasser (tas upp
Läs merVärldens språk, 7,5hp vt 2012
Niklas Edenmyr niklas.edenmyr@lingfil.uu.se Världens språk, 7,5hp vt 2012 3. Språkets arkitektur II: Form & funktion; Morfem, ord och ordklasser; Fraser, satser och satsanalys Form & funktion (I) Två viktiga
Läs merLäs och skrivsvårigheter är inte synonymt med dyslexi. Ur boken Barn utvecklar sitt språk 2010) redaktörer Louise Bjar och Caroline Liberg
Läs och skrivsvårigheter är inte synonymt med dyslexi Ur boken Barn utvecklar sitt språk 2010) redaktörer Louise Bjar och Caroline Liberg Dyslexi vad är det? Dyslexi innebär bl.a. svårigheter att urskilja
Läs merDet görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling
Uppsala universitet Institutionen för nordiska språk C-uppsats 15 hp Svenska som andraspråk C VT 2013 Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling Anna Arvidson
Läs merOrdklasser och satsdelar
Ordklasser och satsdelar Vi kommer under de kommande fyra veckorna att arbeta med ordklasser och satsdelar. Under det här arbetsområdet kommer du att få öva på följande förmågor: formulera sig och kommunicera
Läs merLyssna, Skriv och Läs!
Lyssna, Skriv och Läs! Läsinlärning från grunden Gunnel Wendick Innehållsförteckning Introduktion 5-8 Sidhänvisningar till uppgifterna 9 Förklaring av uppgifterna 10-13 O o 15-19 S s 20-24 A a 25-29 L
Läs merObesvarade frågor från F1
Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Datorlingvistisk grammatik Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf Mars 2012 Några skillnader mellan svenska och engelska 1 Inledning likheter
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merInstitutionen för lingvistik och filologi HT 2007
Övningsfrågor för Dag 1, 3 september 2007: Lingvistik och grammatik, världens språk, språktyper och skriftsystem 1. Vad är skillnaden mellan infallsvinklarna deskriptiv och preskriptiv lingvistik? Vilken
Läs merExtramaterial 3 Morfologi
Extramaterial 3 Morfologi Yair Sapir Morfologi är läran om former (av grek. morphē). I princip ska man med hjälp av morfolign kunna analysera vilken som helst form eller ord i världens språk. Morfem är
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys
Läs merEXEMPELSIDOR SPELBOKEN
EXEMPELSIDOR SPELBOKEN 1 JA OCH NEJ I samiska svarar man vanligtvis genom att böja frågans verb jakande eller nekande. Det fungerar med alla verb, men används framförallt med leat, att vara. Man måste
Läs merOrdbildning/morfologi
Morfologi Ordbildning/morfologi Inom morfologin studeras ords olika form, dess inre struktur, hur ord bildas samt indelning i olika klasser Föreläsning 4 Magnus Merkel 2006-01-29 1 2 Morfem, allomorf Olika
Läs merKognitiv Psykologi HT11 Språk, föreläsning 1
Kognitiv Psykologi HT11 Språk, föreläsning 1 Mål för föreläsning 1 är att veta mer om: Vad språk är Vilken språklig kunskap vi behöver som språkanvändare Hur vårt mentala lexikon är uppbyggt Vilka processer
Läs merORDKLASSERNA I. Ett sätt att sortera våra ord
ORDKLASSERNA I Ett sätt att sortera våra ord Vilka ordklasser finns det? Hur många kan ni komma på? 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Hur sorterar man orden? Morfologiskt Syntaktiskt Semantiskt SUBSTANTIV
Läs merLäs s , 28 samt G1 (s. 219) om ordklasser och G2 (s. 220) samt separat dokument om satsdelar (i studiehandledningen).
Appell Förlag Latin. En introduktion. Studiehandledning, kap. 2, s. 1 (5) Kapitel 2 GRAMMATIK I det här kapitlet introduceras flera centrala begrepp i latinsk grammatik. Det är därför viktigt att läsa
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merDet sätt på vilket vuxna talar till barn. Även barn lär sig detta och talar så till yngre barn. - förlängning och betoning av semantiskt viktiga ord
UPPSALA UNIVERSITET Institutionen för lingvistik och filologi SPRIND, HT 2006, Tillfälle 9 SPRÅKPSYKOLOGI SPRÅKINLÄRNING (de två artiklarna om barnspråk) TALET TAR FORM (Björn Lindblom) Förståelse kommer
Läs merGrammatik skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2011 Några skillnader mellan svenska och engelska 1 Inledning
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merfem olika sätt fem olika grupper obestämd form bestämd form Den bestämda formen
Substantiv plural Man bildar (=gör) plural i svenskan på fem olika sätt. Man delar in substantiven i fem olika grupper. har precis som singular en obestämd form och en bestämd form. Den bestämda formen
Läs mertentaplugg.nu av studenter för studenter
tentaplugg.nu av studenter för studenter Kurskod Kursnamn UMU-14401 Spanish A1 Datum Material Sammanfattning Kursexaminator Betygsgränser Tentamenspoäng Övrig kommentar Innehåller frågor/ begrepp med svar
Läs merSärdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,
Läs merTekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Läs merSyntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax
Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Läs merSvenskans struktur, 7,5 hp Tentamensexempel 1
Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt
Läs merOrdklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,
Läs merPrecodia. Manual. Precodia 1.0. Elevdata AB. Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten. (www.spsm.se)
Precodia Manual Precodia 1.0 Elevdata AB Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten (www.spsm.se) Elevdata i Malmö AB, Fosievägen 13 21431 Malmö Tel: 040-939150 www.elevdata.se
Läs merKongruensböjningen av adjektivet påverkas av substantivets genus och numerus.
Kongruensböjningen av adjektivet påverkas av substantivets genus och numerus. substantivet genus och numerus. En lycklig man gick på gatan. Maskulint substantiv i plural form: Lyckliga män gick på gatan.
Läs merLycka till med pluggandet! Tro på dig själv! VI HAR FÖRHÖRET TORSDAG DEN 7/4-16.
Ordklasser Alla orden i svenska språket kan delas in i grupper som kallas ordklasser. Vi har nu arbetat med ordklasserna substantiv, adjektiv och verb. Nu ska du repetera hemma, så att du verkligen vet
Läs merOrdböjning morfologisk utveckling
Ordböjning morfologisk utveckling Språkstruktur! Principen bakom alla mänskliga språks struktur är att små delar bygger upp större delar som bygger upp ännu större delar Barns tidiga språkutveckling Institutionen
Läs merSyntax, Ordklasser och Satsdelar. Allmän Grammatik och Fonetik HT10 Dag 3
Syntax, Ordklasser och Satsdelar Allmän Grammatik och Fonetik HT10 Dag 3 Svenskans ordklasser Substantiv Adjektiv Verb Adverb Pronomen Räkneord Preposition Konjunktioner och subjunktioner Interjektioner
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2013 Kursens lärandemål (ur kursplanen) (LM 1) förklara grunderna
Läs merSpråkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:
Grammatikprov svenska Nu är det dags att kolla av vad eleverna lärt sig under vårens grammatik arbete. Efter påsklovet tar vi paus från veckans-ord och pluggar grammatik. För att det inte ska bli för mycket
Läs merOrdklasser. Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.
Ordklasser Substantiv Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv. Konkreta och abstrakta substantiv Konkreta substantiv kallas
Läs merIntroduktion i lingvistik 6
Introduktion i lingvistik 6 Objekt Vi har stött på tre olika typer: Direkt objekt (jfr gamla ackusativobjekt ): Tar alltså ackusativ i tex ryska och tyska (vanligtvis). Jag äter mat. Jag studerar lingvistik.
Läs merHemtentamen HT13 Inlämning senast Lärare: Tora Hedin
Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara
Läs merHur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?
Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i
Läs merTDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg
TDDD02 Föreläsning 2 HT-2013 Reguljära uttryck och reguljära språk Lars Ahrenberg Översikt Reguljära uttryck sökproblem i texter definitioner och exempel UNIX-funktionen grep Reguljära transformationer
Läs merEn byggmodell över språket fonemet morfemet
En byggmodell över språket Tänk dig att språket är en byggnad, en jättestor byggnad naturligtvis. Byggnaden är av lego. Tänk dig att de enklaste legobitarna är orden. Kombinationerna är oändliga men inte
Läs merSvenska med didaktisk inriktning mot arbete i grundskolans årskurs 4-6, I
Svenska med didaktisk inriktning mot arbete i grundskolans årskurs 4-6, I 3,5 högskolepoäng Provmoment: Språkkunskap TE01 Ladokkod: C46S20 vt-18: Språkkunskap: Det svenska språksystemet Tentamen ges för:
Läs merAnsvarig lärare: Jörgen Larsson Mariann Bourghardt Telefonnummer:
11F320 15 högskolepoäng Provmoment: Salstentamen svenska, nr 1 Ladokkod: Tentamen ges för: Grundläggande svenska och matematik i förskoleklass och årskurs 1-3 TentamensKod: Tentamensdatum: 8 mars 2012
Läs merSpråkgranskningsverktyg. Grammatikkontroll i Word
Språkgranskningsverktyg Grammatikkontroll i Word Allmänt om grammatikkontroll Grammatikkontrollprogrammen inriktas mot en i förväg definierad felrepertoar. Fastställs vanligen genom analys av korpusmaterial.
Läs merInnehållsförteckning till Svenska Online. Adress: www.sweol.se Uppdaterat 2011 01 18
Innehållsförteckning till Svenska Online Adress: www.sweol.se Uppdaterat 2011 01 18 ABC kapitel 1, Alfabetisering 1 Skriv bokstaven a/a Se och lyssna Mus 2 Skriv bokstaven b/b Se och lyssna Mus 3 Skriv
Läs merSvenskans struktur, 7,5 hp Tentamensexempel 3
Svenskans struktur, 7,5 hp Tentamensexempel 3 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt
Läs merInnehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad
Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort
Läs merMorgan Nilsson. A L L M ƒ N G R A M M A T I K
Morgan Nilsson A L L M ƒ N G R A M M A T I K 2 2004 Morgan Nilsson Inledning Av tradition bygger grammatiska beskrivningar av västerländska språk till stora delar på beskrivningar som en gång gjorts av
Läs merJonas Löfström Språkdata Göteborgs universitet DOLDA ORDBILDNINGSMÖNSTER. LEXIKOLOGI
154 Jonas Löfström Språkdata Göteborgs universitet DOLDA ORDBILDNINGSMÖNSTER. LEXIKOLOGI n Ag r a p r o b l e m i n o m d a t a m a s k i n e l l Med dolda ordbildningsmönster avses de regelbundenheter
Läs merFonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?
Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet
Läs merstinaka@stp.ling.uu.se
!"# $ %& ' % )(* +-,/.1032 5#687:9'; 4 stinaka@stp.ling.uu.se = 2@? 7 0AB2 9'687, 7.)C 2D,FE 9'G.10 ;IH.1A',J.LK +NM 9 2@K-, 4 7 KN0E G E ;.1M 9 E ;O9 2I?P? 7, Q MMAB2 G 2SR0. HT7:9 A!.U, 7,VWX0A',J.U,JRY,J.LEZ0
Läs merKardía. fåglar en sol. ett berg en gungställning. ett träd. en bro. gräs. en å. Substantiv. Hanna Hägerland
Kardía fåglar en sol ett berg en gungställning ett träd en bro gräs en å Substantiv Hanna Hägerland Innehåll Vad är substantiv? 2 Substantivens ordlista 3 Ringa in substantiv 4 Substantiv i bestämd form
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merFlerordsenheter: Så många frågor, så få svar
Flerordsenheter: Så många frågor, så få svar Lars Borin Flerordsworkshop 19/3 2013 några centrala frågor Vilken sorts ord är det flera av? Ska de beskrivas som en sorts lexikonenheter eller en sorts syntaktiska
Läs merCSVE20 vt-18: Språkkunskap A 11SV20 vt-17: Språkkunskap A. Tillfälle 4) 11SV20 vt-17 (LASEAht16)
Svenska med didaktisk inriktning för ämneslärare i grundskolans årskurs 7-9 4,0 högskolepoäng Provmoment: Språkkunskap A Ladokkod: CSVE20 vt-18: Språkkunskap A 11SV20 vt-17: Språkkunskap A Tentamen ges
Läs mer!!! Några verb är oregelbundna vara är var!!!
1 VERB I PRESENS Svenska verb har fem olika böjningsformer: presens, infinitiv, preteritum (imperfekt), supinum och imperativ. Presens använder man om nutid. Man kan också använda det om framtid om det
Läs mer