Anna-Lena Sågvall Hein CHARTANALYS OCHMORFOLOGI
|
|
- Kerstin Lindqvist
- för 8 år sedan
- Visningar:
Transkript
1 Anna-Lena Sågvall Hein CHARTANALYS OCHMORFOLOGI Med automatisk grammatisk analys menas vanligen en automatiserad process, varigenom cn grammatisk interpretation tillordnas t ill en språklig enhet. Beroende på om den språkliga enheten utgörs av en isolerad ordform eller ett längre uttryck brukar man traditionellt skilja mellan automatisk morfologisk resp syntaktisk analys. Skiljelinjen mellan morfologi och syntax tenderar inom området datalingvistik att få en extra, artificiell markering av det faktum att existerande dataprogram som regel är inriktade antingen på morfologi eller syntax. Det rör sig om programsystem med helt skild uppbyggnad och komplexitet. Existerande program för morfologisk analys är vanligen specifika till sin uppbyggnad i två avseenden; dels avgränsar man sig mot syntaxen genom vissa allmänna restriktioner som t ex att man utgår från att analysenheten utgörs av en teckensträng, avgränsad i löpande text genom mellanslag eller skiljetecken, dels anpassar man sig vanligen t ill de språkspecifika dragen i det språk man v ill analysera. En sådan anpassning Sr givetvis eftersträvansvärd; problemen ligger i att dessa begränsningar vanligen byggs in i själva programlogiken. Man kan därför inte utveckla ett sådant system utöver de i förväg uppställda ramarna, t ex t ill att handskas med ett språk med större morfologisk variation eller t ill att klara av syntaktiska problem. Sålunda kan man t ex inte i ett traditionellt system för morfologisk analys känna igen analytiskt resp syntetiskt bildad komparativform som varianter. Inom förefintliga system för syntaktisk analys, vilka vanligen skrivits för analys av engelska, har å andra sidan morfologin en rudimentär behandling. Man v ill koncentrera sig på de 'intressanta' problemen och strävar efter att komna förbi snarare än igenom morfologin. Den morfologiska komponenten i sådana system är därför sällan utvecklingsbar. Möjligheterna att inom ramen för ett och samma system kunna utföra såväl morfologisk som syntaktisk analys är en av grundtankarna bakom MKay's 'Chartanalys' (1). Oen kommer t ill uttryck bl a däri att analysenheten antingen den utgörs av en eller flera ordformer representeras med hjälp av samma struktur, en chart. Fig 1 visar en grafisk representation av charten för den finska ordformen 'yskäisyin' (*'hostning* i instr sg el pl) sådan den ter sig innan själva bearbetningen påbörjats. f ig l 87
2 Charten består av numrerade vertices (1 till 11), sammanbundna av riktade, etiketterade edgar (1-2 'y ', 2-3 's ', etc). Den intar en central plats i det avray föreslagna systemet för grammatisk analys. Den används inte bara för att representera analysenheten sådan den ser ut innan analysen påbörjats utan även för att lagra såväl delresultat under pågående analys som slutresultat efter avslutad bearbetning. Väsentlig b lir härvid möjligheten att inom charten representera alternativa analyser. Fig 2 visar hur charten för 'yskäisyn' skulle kunna se ut efter avslutad morfologisk analys. fig Omvi jämför med fig 1, så finner vi att 4 nya edgar har införts, nämligen från 1 t ill 8, från 8 t ill 70, från 8 t ill 9 och från 9 t ill 10. De svarar mot två alternativa låsningar, d v s två alternativa segmenteringar, nämligen 1. 'yskäisy' - 'in* (subst 'yskäisy' i instruktiv) och.. 2. 'yskäisy' - 'i ' - 'n' (subst 'yskäisy' i instruktiv pl). ^ Dessa analyser förutsätter att systemet konsulterat ett stamlexikon (huvudlexikon enl Kay's terminologi), där stammen 'yskäisy' med informationen 'substantiv' återfinns, ett suffixlexikon, som upptar suffixet 'i* med informationen 'pluralis', ett suffixlexikon, som upptar suffixen 'n' och 'in ', båda med informationen^jinstruktiv' samt slutligen ett 'separatorlexikon', som upptar ' ' Det finns i det generella systemet som sådant inga begränsningar på hur många morfemsegment som kan följa på varandra i en ordform eller någon uppgift omvilka de är eller omden inbördes ordningen mellan dem.'*5om språkspecifik information måste man därför, förutom ett huvudlexikon, även tillföra systemet ett antal lexikon (Kay's terminologi) som upptar de faktiska realisationerna av de granmatiska morfémen, jämte de morfotaktiska reglerna. Morfotaxen avspeglas i en hänvändelse vid de olika segmenten i huvudlexikon f?esp suffixlexikon t ill vilket lexikon skall konsulteras för igenkänning av följande segment. Kopplingen mellan de olika lexikonen, som ligger bakom analysen i fig 2, dvs den bakomliggande morfotaxen illustreras i fig 3. fig 3 1) Tolkningen av morfemsegmenten ligger som synes i etiketterna för motsvarande edgar. 2) Konsultationen i separatorlexikonet har t ill uppgift att kontrollera att ordformen i fråga år slut, d v s i det anförda exemplet att analysenheten verkligen år uttömd i och med återfinnandet av kasussegmentet. 88
3 Införandet av ett särskilt separatorlexikon bidrar t i ll systemets general itet och konsistens. Det innebär, att kontroll av huruvida en ordform är slut eller inte kan ske helt i analogi med hur en jämförelse mellan en bokstav i analysenheten - en edge i charten - och en bokstav i något av lexikonen, går t i ll. Det allmänna begreppet för en sådan aktion är 'task' (uppgift). En uppgift kan t ex också svara mot tillämpningen av en grammatisk regel på en eller flera edgar. Under bearbetningens gång lagras uppgifterna i en (eller flera) agenda (agendor), varifrån de ^ aktiveras. Hela analysprocessen kan beskrivas som en följd av uppgifter.*^ Att låta de morfotaktiska reglerna komma t ill uttryck enbart via kopplingen mellan de olika lexikonen år emellertid inte tillräckligt för att garantera korrekta analysresultat. Vi kan illustrera problematiken med ett exempel. Antag att våra lexikon (för den finska morfologin) innehåller bl a följande uppslagsord, fig 4. fig 4 89
4 f ig 5 Denna chartstruktur medger två läsningar, nämligen 1. substantivet MAA i inessiv plur och 2. pronominet MA i iness plur, varav endast den första år korrekt. Orsaken till att vi i fall av homografi, t ex stamhonografi som ovan, får en felaktig alternativ analys år tvåfaldig; dels beror det givetvis på själva chartstrukturen, dels på det faktum att lexikonsökningen och segmenteringen sker helt kontextoberoende, d v s att en ny edge läggs in i charten så snart man finner överensstämmelse mellan ett segment (uppslagsord) i något av lexikonen och en följd av edgar i charten. Med bibehållande av chartstrukturen kan vi nalkas problematiken på två sätt, antingen genom $tt göra segmenteringsprocessen kontextsensitiv eller genom att formulera fristående kompatibilitetsregler, som appliceras på den kontextfritt genererade chartstrukturen, och vars tillämpning leder t ill att övergripande edgar införs för att markera kompatibilitet mellan segment. I min egen implementering av chartanalysen har jag valt att göra segmenteringsprocessen kontextkänslig. Här arbetar jag på så sätt, att ingen ny edge introduceras i charten förräri systemet verifierat, att det segment, som representeras av edgen, år kompatibelt med angränsande segment. När man arbetar med en ordform som analysenhet innebår det i praktiken, att införandet av nya (segment-)edgar måste undertryckas, t ill dess man undersökt hela ordformen, inkl separatorn. I exemplet ovan (fig 5) skulle alternativet 'pron' aldrig ha införts i charten, enligt min implementering, då systemet ej återfunnit den förväntade separatorn. Fördelen med den här metoden är dels den, att man får ett väsentligt mindre belastat chart, eftersom endast de korrekta alternativen återspeglas i charten, dels den att analysen kommer att ske i färre etapper, då man i samma bearbetningssteg både segmenterar och verifierar kompatib ilite t.^ Detta tillvägagångssätt har å andra sidan den nackdelen, att det år svårt att vara lika generell som vid en kontextfri segmenteringsprocess. Språkspecifik information smyger sig lått in i programmen, varför programsystemet måste ha en modulär uppbyggnad, som gör de språkspecifika programmen lått utbytbara. Låt oss diskutera det andra alternativet, dår man bibehåller en kontextoberoende segmenteringsprocess och låter kompatibiliteten mellan segmenten kontrolleras i påföljande bearbetningssteg. fig 5 illustrerar då endast en etapp i analysen av 'maissa*. En möjlig slutgiltig chartstruktur visas i fig 6.. 1) för en illustration av denna metod, se (3). 90
5 f ig 6 Vid låsningen av chartstrukturen tillämpar man den konventionen, att det slutgiltiga analysresultatet finns i etiketten (etiketterna) t ill den (eller de) edge (edgar) som går från första t ill sista vertex. Omden resulterande charten inte uppvisar någon sådan edge har analysen inte lyckats. Felaktiga delanalyser, som i exemplet tolkningen av 'ma* som ett pronomen, stör därigenom inte slutresultatet. Edgen från vertex 1 t ill vertex 7 representerar enbart en del analys, då man ännu inte har något belägg för att ordet de facto slutar efter kasussegmentet. Återfinnandet av separatorn tillfö r här igen ny information utan har endast kontrollfunktion. Vilka år då problemen inom chartanalysens ram, då det gäller att komma fram t ill en sådan analys som i fig 6? Successivt måste man verifiera kompatibiliteten mellan segmenten, t ex 'noun - p!', 'pron - p!'. Omdet råder kompatibilitet, skall en övergripande edge införas, som i sin etikett bår den relevanta informationen från de båda edgarna. Oetta skall ske genom att en regel appliceras på de båda edgarna. Tillämpningen av en regel på en eller flera edgar formuleras som alla andra aktioner inom chartanalysteorin som en uppgift. Når skall nu den uppgiften genereras och varifrån skall den hämta information omvilket test, som skall utföras, samt omvad, som skall ingå i etiketten t ill den övergripande edgen? Jag har valt följande strategi: 1. Kompatibilitetstestet jämte informationen om etikettens innehåll och uppbyggnad sammanförs i en regel. & 2. Reglerna skall formuleras enligt samma notation, i vilken de syntaktiska reglerna år uttryckta samt kunna utnyttja samma grammatiska operatorer, se (4). 3. Reglerna skall sammanföras i en morfologisk grammatik, helt i analogi med den syntaktiska grammatiken. 4. Namn på aktuell regel skall ingå i lexikoninformationen t ill resp suffix. 5. Reglerna skall initieras, d v s leda t i l l generering av aktuell uppg ift, i samband med återfinnandet av suffix-segmenten. 6. Reglerna skall verka från höger t ill vånster, d v s på aktuellt suffix jämte föregående segment. Strategin fungerar, och jag har formulerat 3 morfologiska regler, som garanterar kompatibilitet mellan stamsegment, numerussegment, kasussegment och separator hos finska nomina. Kopplingen t ill de syntaktiska faciliteterna, d v s möjlighet att utnyttja de våldefinierade grammatiska operatorerna, har också gjort det möjligt att utan ytterligare utveckling av Kay-systemet kunna utföra kompatibilitetskontroll, som motiveras av förekomst av såväl stam- som suffixallomorfer. 91
6 Låt oss gå tillbaka t i ll fig 2. Här betraktas distinktionen mellan singularis och pluralis som en distinktion markerad/omarkerad, där pluralis är den markerade parten, d v s om inget uttryck for pluralis återfinns, så tolkas formen i fråga som singulär. Alternativt kan man v ilja betrakta uttryck för numerus som obligatoriskt, där det singulära segmentet realiseras som ett noll-segment. Systemet erbjuder denna möjlighet. Då får man som alternativ t ill segmenteringen i fig 2 den segmentering som presenteras i fig 7. fig 7 Som synes sker en omskrivning i ursprungscharten på så sått att ett noll-segment explicit läggs in i charten som en edge (8-12 u j). Denna omskrivning sker selektivt, nämligen vid morfemgräns vars andra morfem kan realiseras som ett noll-segment. Motsvarande suffixlexikon upptar noll-segmentet med tillhörande tolkning. Med denna strategi kommer också kopplingen mellan de olika lexikonen att se något annorlunda ut, jfr fig 8 och fig 3. Behovet av att kunna göra omskrivning ('rewriting') av ursprungscharten aktualiseras inte bara i samband med noll-segment utan även vad det gäller hela det problemkomplex som rör hantering av morfofonematiska växlingar, såvida man ej väljer att i sina lexikon explicit uttrycka alla varianter. Det senare alternativet tvingar oss att avstå från att 92
7 fånga upp intressanta generaliseringer i det språkliga materialet och därigenom skapa ett mindre insiktsfullt system, förutom att det leder t ill en väsentlig belastning på de olika lexikonen, för finskans del gäller det såväl fonologiskt som granmatiskt betingad morfofonematisk växling, nämligen volkalharmoni, vokalstrykning, kvantitativ resp kvalitativ stadievåxling, vokalföråndring före suffix på -i och vokalassimilation. Hela detta problemkomplex kan spaltas upp i ett antal mindre frågor. Hur skall omskrivningsreglerna formuleras? Vilken altemant skall väljas som lexikonrepresentant? Hur skall reglerna integreras i den övriga bearbetningen? Kan och bör skillnaderna mellan de fonologiskt och de granmatiskt betingade aorfofenomatiska växlingarna reflekteras genom principiellt olika behandling under analysen? Av de språkliga fenomenen ovan har jag h ittills endast bearbetat vokalharmonin. Den metod jag utarbetat ger möjlighet att behandla den finska vokalharmonin i icke sammansatta ord. Som arkisymboler för harmonivokalerna har jag valt /a,o,u/. Sålunda representeras t ex inessivmorfemet, med allomorfarna 'ssa', 'ssä', sv segmentet 'ssa' i kasuslexikonet. Omskrivningen av 'å' t ill 'a ', 'ö' t ill 'o* samt *u* till 'y' sker helt kontextfritt i samband med uppbyggandet av ursprungscharten, varvi^ ett speciellt 'bokstavslexikon* konsulteras. Erforderlig kompatibil i teskontroll sker med hjälp av den ovan skisserade metodiken. Stammar, som enbart innehåller de neutrala vokalerna 'e' och 'i', måste markeras som främre i lexikon. Uvriga stammar innehåller ingen lexikoninformation om huruvida de år främre eller bakre, utan den informationen härleds under analysens gång. Anm. För Irmare Information om status på projektet 'Chartanalys och finsk morfologi', vilket jag bedriver i samarbete med Erling Mande från Pinsk-ugriska institutionen i Uppsala hänvisas till (5). Referenser 1. Kay, M, Morfological and syntactic analysis, Lecture notes from the 3rd International Sumner School of Computational and Mathematical linguistics, Pisa Kay M, Syntactic Processing and Functional Sentence Perspective, Handbook from 1977 Nordic Summer School in Computational Linguistics 3. Sågvall Hein, A-L, An Approach to the Construction of a Text Comprehension System for X-ray Reports, Proc of the IFIP Working Conference on Computational Linguistics in Medicine, eds HSchneider, A- L Sågvall Hein, North-Holland Publ Comp 1977, pp Kay, M, Reversible Grammar, A Summary of the Formalism, Handbook from 1977 Nordic Summer School in Computational Linguistics 5. Analysresultat, lexikon, grammatiska regler och funktionsdefinitioher från projektet 'Chartanalys och finsk morfologi', Datalistor, UDAC, Uppsala 93
För närmare upplysningar om bakgrunden till UCP samt om hur den är relaterad till tidigare arbeten, se Sägvall 80b.
95 Anna StAgvall Hein UCDL Centrum för Hatorlingvistik Uppsala Universitet UPPSALA CHART PARSER, Version 2 (UCP-2) - En översikt. 1. Inledning Uppsala Chart Parser är en lingvistisk processor för analys
Djupstruktur och ytstruktur
Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)
729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära
Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Språkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Anna Sågvall Hein Centrum för datorlingvistik Sturegatan 13 B, 5 tr U P P S A L A
Anna Sågvall Hein Centrum för datorlingvistik Sturegatan 13 B, 5 tr 752 23 U P P S A L A REGELA K T I V E RI N G I EN P A R S E R F Ö R S V ENSKA (SVE.UCP) 1. Inledning. Parsing är den process i vilken
Språkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 7 Chartparsning i allmänhet och UCP i synnerhet evapet@stp.lingfil.uu.se 1 Djupstruktur och ytstruktur Jag läste en bok igår Igår läste jag en bok 2 Chartparsning - bakgrund Utvecklades
Grammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Datorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Om ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Lexikon: ordbildning och lexikalisering
Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke
Ansvarig lärare: Jörgen Larsson Mariann Bourghardt Telefonnummer:
11F320 15 högskolepoäng Provmoment: Salstentamen svenska, nr 1 Ladokkod: Tentamen ges för: Grundläggande svenska och matematik i förskoleklass och årskurs 1-3 TentamensKod: Tentamensdatum: 8 mars 2012
729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Svensk nationell datatjänst, SND BAS Online
Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata
Morfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Flerordsenheter: Så många frågor, så få svar
Flerordsenheter: Så många frågor, så få svar Lars Borin Flerordsworkshop 19/3 2013 några centrala frågor Vilken sorts ord är det flera av? Ska de beskrivas som en sorts lexikonenheter eller en sorts syntaktiska
Grundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
INSTITUTIONEN FÖR SVENSKA SPRÅKET
INSTITUTIONEN FÖR SVENSKA SPRÅKET LGS210 Svenska som andraspråk, 1, för gymnasielärare, 30 högskolepoäng Swedish as Second Language 1 for Teachers in Upper Secondary School, 30 higher education credits
Betygskriterier. CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II.
Betygskriterier CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II. Gäller fr.o.m. ht 2016. Delkurs 1: Flerspråkighet individ och samhälle, 7,5 hp Fastställda av institutionsstyrelsen
Neurolingvistik - Grammatik
Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -
grammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Kursplan för kurs på grundnivå
Kursplan för kurs på grundnivå Lingvistik I Linguistics I 30.0 Högskolepoäng 30.0 ECTS credits Kurskod: LIN130 Gäller från: HT 2018 Fastställd: 2013-03-13 Ändrad: 2018-02-13 Institution Institutionen för
Lyssna, Skriv och Läs!
Lyssna, Skriv och Läs! Läsinlärning från grunden Gunnel Wendick Innehållsförteckning Introduktion 5-8 Sidhänvisningar till uppgifterna 9 Förklaring av uppgifterna 10-13 O o 15-19 S s 20-24 A a 25-29 L
Tornedalsfinska - Meänkieli - Kan språkteknologiska verktyg för finska anpassas till meänkieli?
Kungl. Tekniska Högskolan NADA Tornedalsfinska - Meänkieli - Kan språkteknologiska verktyg för finska anpassas till meänkieli? ht:02 Kurs: Språkteknologi Kurskod: 2D1418 Författare: Sanna Huhta e-post:
Språktypologi och språksläktskap
Språktypologi och språksläktskap Andersson 2e december 2010 Andersson () Språktypologi och språksläktskap 2e december 2010 1 / 11 Språkklassifikation Genetisk klassifikation Hur är språk släkt med varandra?
MODIFIERAD STANDARDORTOGRAFI (MSO6)
MODIFIERAD STANDARDORTOGRAFI (MSO6) Version 6 Januari 1999 Institutionen för lingvistik Göteborgs universitet Joakim Nivre 1 1 Allmänna principer MSO6 är en modifierad standardortografi för svenska avsedd
Fastställande. Allmänna uppgifter. Kursens mål
Humanistiska och teologiska fakulteterna LLYU70, Svenska som andraspråk för lärare i svenska för invandrare, 30 högskolepoäng Swedish as a Second Language for Teachers of Newly Arrived Immigrants, 30 credits
En svårighetshierarki för species och artikelbruk
Nissilä, N. & N. Siponkoski (toim.) 2012. Kielet liikkeessä, Språk i rörelse, Languages in Motion, Sprachen in Bewegung. VAKKI-symposiumi XXXII 11. 12.2.2012. VAKKI Publications 1. Vaasa, 241 251. En svårighetshierarki
US116G - Svenska för grundlärare i grundskolan årskurs 4-6, I, 15 hp
1 (6) US116G - Svenska för grundlärare i grundskolan årskurs 4-6, I, 15 hp Kursen behandlar teoretiska och didaktiska perspektiv på språkutveckling i tal och skrift för elever i grundskolans mellanår samt
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
EAs krav vid ackreditering av flexibel omfattning
SWEDAC DOC 12:1 2012-05-10 Utgåva 1 Inofficiell översättning av EA 2/15 M:2008 EAs krav vid ackreditering av flexibel omfattning Swedac, Styrelsen för ackreditering och teknisk kontroll, Box 878, 501 15
Riktlinjer för bedömning av examensarbeten
Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar
Kartläggning och bedömning av nyanlända elevers kunskaper och språkutveckling
Kartläggning och bedömning av nyanlända elevers kunskaper och språkutveckling Stockholm, 30 januari 2015 Sofia Engman och Mikael Olofsson, Institutionen för språkdidaktik vid Stockholms universitet Vår
Syntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
FOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide
FOR BETTER UNDERSTANDING Kom igång med WordFinder Snabbguide Installationsanvisning 1 Sätt i programskivan i datorn. Installationsprogrammet startar automatiskt. En gemensam startbild för WordFinder Professional,
HUR STÄMMER IAS 1 ÖVERENS MED DIREKTIVEN OM ÅRSREDOVISNING?
XV/7030/98 SV HUR STÄMMER IAS 1 ÖVERENS MED DIREKTIVEN OM ÅRSREDOVISNING? GENERALDIREKTORAT- XV Inre marknad och finansiella tjänster Detta dokument är avsett att användas som diskussionsunderlag inom
Frasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
ÄSAD11, Svenska som andraspråk 1, 30 högskolepoäng Swedish as a Second Language 1, 30 credits Grundnivå / First Cycle
Humanistiska och teologiska fakulteterna ÄSAD11, Svenska som andraspråk 1, 30 högskolepoäng Swedish as a Second Language 1, 30 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av
Kommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Lingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi
Persiska Albin Finne 2002-10-10 Sammanfattning Den här uppsatsen beskriver det persiska språket. Språkets historia, morfologi, syntax och ordförråd behandlas. Tonvikten läggs på morfologi och syntax. Avslutningsvis
REV Dnr: 1-563/ Sid: 1 / 8
REV 170518 Dnr: 1-563/2017 2017-05-29 Sid: 1 / 8 Arbetsgruppen för kvalitetsgranskning av examensarbeten Kriterier för bedömning av examensarbeten Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga
Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?
Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet
Kursplaneöversättaren. Lina Stadell
Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad
Kommentarer till bedömningsmatris för Skriva Kurs C
Kommentarer till bedömningsmatris för Skriva Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar ett första intryck och är en övergripande
Kommentarer till bedömningsmatris för Tala Kurs B
Kommentarer till bedömningsmatris för Tala Kurs B Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER LAT110 Latin, grundkurs, 30 högskolepoäng Latin, Introductory Course, 30 higher education credits Fastställande Kursplanen är preliminär, fastställd av Humanistiska
LSI110, Svenska som andraspråk för blivande lärare I, 30 högskolepoäng
Gäller fr.o.m. ht 08 LSI110, Svenska som andraspråk för blivande lärare I, 30 högskolepoäng Swedish as a Second Language for Teacher Education and Training I, Introductory course, 30 higher education credits
Obesvarade frågor från F1
Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll
Kommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Tekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Grim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Grammatik i Samtal I. Mathias Broth Lingvistik (729G08) ht -12
Grammatik i Samtal I Mathias Broth Lingvistik (729G08) ht -12 1 Per Linell Språkande. Samtal, språk och grammatik 2 Ett dialogiskt perspektiv på språk och språkande: människor är sociala varelser betonar
US116G, Svenska för grundlärare i grundskolan, årskurs 4-6, I, 15 hp
Betygskriterier US116G, Svenska för grundlärare i grundskolan, årskurs 4-6, I, 15 hp Fastställda av institutionsstyrelsen 2015-11-04. Gäller fr.o.m. vt 2016. Delkurs 2: Sociolingvistik, språkhistoria och
Kandidatexjobb vid Industriell Marknadsföring. Process, tidsplan och opponenter samt krav
Kandidatexjobb vid Industriell Marknadsföring Process, tidsplan och opponenter samt krav Dagens agenda Själva processen och vem gör vad när Förväntningar Krångliga passager i själva skrivandet IEI:s exjobbssida
Ord och morfologi. Morfologi
Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Lässvårigheter och språklig förmåga en studie om lässvårigheter i tidiga skolår
Lässvårigheter och språklig förmåga en studie om lässvårigheter i tidiga skolår SPSM konferens om Grav Språkstörning Uppsala September 2015 Maria Levlin, leg logoped/lektor i språkdidaktik Umeå universitet
Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3)
TORSTEN BENGTSSON SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? Lea tycker om att spela trummor. Hon spelar på pappas trummor som hon fått. Pappa bor i en annan stad och Lea träffar honom sällan. En dag
Introduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Lektionsplanering. Grammatik vad är det? Språkets nivåer; vad är inte grammatik; ordbetydelse; morfologi. Öppen lektion. Bolander: kap.
Introduktion Information Gunnar Eriksson, 9-2035, 08-163156, 070-3274028, gunnar@ling.su.se, guer@stp.lingfil.uu.se Litteratur: kurslitteratur, referenslitteratur Kurssidan: planering, ljusbilder Termer
Inledande exempel. Levinson och informationsstruktur. Vad är informationsstruktur? Informationsstruktur och pragmatik
Pragmatik VT06 Informationsstruktur Informativitet och koherens i dialog och diskurs Inledande exempel 1. Vad gör du? Jag tittar ut genom fönstret 2. Tittar du in eller ut genom fönstret? Jag tittar ut
Riktlinjer och krav för våra leverantörer
1 INTRODUKTION Nitators affärsidé handlar i korta drag om att vara en miljömedveten samarbetspartner för kunder med högt ställda krav på kvalitet, leveranssäkerhet och flexibilitet. 1.1 Krav Syftet med
Anpassning av problem
Modul: Problemlösning Del 7: Anpassning av problem Anpassning av problem Kerstin Hagland och Eva Taflin Detta är en något omarbetad text från boken: Hagland, K., Hedrén R., & Taflin, E. (2005). Rika matematiska
Riktlinjer för styrdokument
STYRDOKUMENT KOMMUNSTYRELSENS FÖRVALTNING Gäller fr o m Diarienummer 2019-03-18 KS-2018/296.111 Beslutad av Dokumentansvarig Typ av styrdokument Kommunfullmäktige Kanslidirektör Riktlinjer 1 (6) Riktlinjer
Teoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Maskinöversättning möjligheter och gränser
Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?
Kursplan i svenska. Mål att sträva mot för år F-5
Kursplan i svenska En av skolans viktigaste uppgifter är att skapa goda möjligheter för elevernas språkutveckling. Skolans undervisning ska ge eleverna möjlighet att använda och utveckla sina färdigheter
Lyssna Ljuda Läs 1(6) Lyssna Ljuda Läs ISLORMUA Lyssna Ljuda Läs ÅNBEKÄVWTPY Lyssna Ljuda Läs GÖJFDHXCZQ
1(6) C LÄROMEDEL Lyssna Ljuda Läs Lyssna Ljuda Läs ISLORMUA 7762-512-4 Lyssna Ljuda Läs ÅNBEKÄVWTPY 7762-513-1 Lyssna Ljuda Läs GÖJFDHXCZQ 7762-514-8 Serien Lyssna Ljuda Läs är tre på varandra följande
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Användarhandledning för det kompensatoriska. läshjälpmedlet Precodia. http://www.precodia.se
Användarhandledning för det kompensatoriska läshjälpmedlet Precodia Målgrupper för programvaran Precodia Personer med lässvårigheter av olika slag (läs- och skrivsvårigheter, dyslexi, koncentrationssvårigheter,
Ord och morfologi. Morfologi
Ord och morfologi DH2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Kommentarer till bedömningsmatris för Tala Kurs C
Kommentarer till bedömningsmatris för Tala Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Från tal till text. Ingvar Lundberg Psykologiska institutionen Göteborgs universitet
Från tal till text Ingvar Lundberg Psykologiska institutionen Göteborgs universitet I vardagligt tal behöver man aldrig tänka på de enskilda språkljuden. Talets ljudström kommer av sig själv. Fonemen,
Nederländska I 30 högskolepoäng Termin 1 (15 högskolepoäng) Välkommen till Nederländska I, 30 högskolepoäng
STOCKHOLMS UNIVERSITET Institutionen för baltiska språk, finska och tyska Nederländska avdelningen Höstterminen 2014 Kursinformation med litteraturförteckning Nederländska I 30 högskolepoäng Termin 1 (15
MODERSMÅL FINSKA 1. Syfte
MODERSMÅL FINSKA 1 Sverigefinnar, judar, tornedalingar och romer är nationella minoriteter med flerhundraåriga anor i Sverige. Deras språk finska, jiddisch, meänkieli och romani chib är officiella nationella
Statsvetenskap G02 Statsvetenskapliga metoder Metoduppgift
METOD-PM PROBLEM Snabb förändring, total omdaning av en stat. Detta kan kallas revolution vilket förekommit i den politiska sfären så långt vi kan minnas. En av de stora totala omdaningarna av en stat
Joniskt kapitäl på kolonn, som idag är placerad som prydnad på tempelområdet i Delfi.
Joniskt kapitäl på kolonn, som idag är placerad som prydnad på tempelområdet i Delfi. Hästar framför vagn från sydfrisen på sifniernas skattehus i Delfi. 111 Ynglingarna Kleobis och Biton av Polymedes,
LSI110, Svenska som andraspråk för blivande lärare I, 30 högskolepoäng
= Gäller fr.o.m. vt 10 LSI110, Svenska som andraspråk för blivande lärare I, 30 högskolepoäng Swedish as a Second Language for Teacher Education and Training I, Introductory course, 30 higher education
Läs- och skrivinlärning Danderyd 15 augusti 2017
Läs- och skrivinlärning Danderyd 15 augusti 2017 Inger Fridolfsson The Simple View of Reading L = A x F Läsförståelse Avkodning Språklig förståelse (Gough och Tunmer, 1986) Subgrupper utifrån the Simple
JAEN53, Affärsförhandlingar, 3 högskolepoäng Business Negotiations, 3 credits Avancerad nivå / Second Cycle
Juridiska fakulteten JAEN53, Affärsförhandlingar, 3 högskolepoäng Business Negotiations, 3 credits Avancerad nivå / Second Cycle Fastställande Kursplanen är fastställd av Juridiska fakultetens nämnd för
M2016/1849/R, Remissyttrande över Promemorian Miljöbedömningar (Ds 2016:25)
2016-10-10 Till Miljö- och energidepartementet m.registrator@regeringskansliet.se anna.berglund@regeringskansliet.se M2016/1849/R, Remissyttrande över Promemorian Miljöbedömningar (Ds 2016:25) Alrutz Advokatbyrå
SVEA20, Svenska: Språklig inriktning - fortsättningskurs, 30 högskolepoäng Swedish Language: Level 2, 30 credits Grundnivå / First Cycle
Humanistiska och teologiska fakulteterna SVEA20, Svenska: Språklig inriktning - fortsättningskurs, 30 högskolepoäng Swedish Language: Level 2, 30 credits Grundnivå / First Cycle Fastställande Kursplanen
Grafisk visualisering av en spårbarhetslösning
Datavetenskap Opponenter Johan Kärnell och Linnea Hjalmarsson Respondenter Agni Rizk och Tobias Eriksson Grafisk visualisering av en spårbarhetslösning Oppositionsrapport, C-nivå Report 2011:06 1. Generell
RIKTLINJER FÖR STYRDOKUMENT
RIKTLINJER FÖR STYRDOKUMENT Fastställt av: Kommunfullmäktige Datum: 2012-06-19, 81 För revidering ansvarar: Kommunstyrelsen För eventuell uppföljning och tidplan ansvarar: - Dokumentet gäller för: Alla
FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ
Engelska, 450 verksamhetspoäng Ämnet handlar om hur det engelska språket är uppbyggt och fungerar samt om hur det kan användas. Det engelska språket omger oss i vardagen och används inom så skilda områden
Statistisk Maskinöversättning eller:
729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...
Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser
Språkteknologi (SV2122) Föreläsning 7: Morfologi och ordklasser Richard Johansson richard.johansson@svenska.gu.se 19 februari 2014 praktiska detaljer: tenta vilket datum föredrar ni när det gäller tentan?
Tekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Betygskriterier. CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II.
Betygskriterier CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II. Gäller fr.o.m. ht 2016. Delkurs 1: Flerspråkighet individ och samhälle, 7,5 hp Fastställda av institutionsstyrelsen
Manual. till. Cantor 2000. Madison Medri
Manual till Cantor 2000 Madison Medri 2 InnehÄllsfÅrteckning Installation Inledning Pedagogisk bakgrund Anpassning fär funktionshindrade Arbeta med Cantor 2000 InstÅllningar Namn Ljud Tangentbord Resultat
Logisk semantik I. 1 Lite om satslogik. 1.1 Konjunktioner i grammatisk bemärkelse. 1.2 Sant och falskt. 1.3 Satssymboler. 1.
UPPSALA UNIVERSITET Datorlingvistisk grammatik I Institutionen för lingvistik och filologi Oktober 2007 Mats Dahllöf http://stp.ling.uu.se/ matsd/uv/uv07/dg1/ Logisk semantik I 1 Lite om satslogik 1.1
Likhetstecknets innebörd
Modul: Algebra Del 5: Algebra som språk Likhetstecknets innebörd Följande av Görel Sterner (2012) översatta och bearbetade text bygger på boken: Carpenter, T. P., Franke, M. L. & Levi, L. (2003). Thinking
Ramverk för projekt och uppdrag
Peter Yngve IT-centrum 2011-02-10 1.0 1 (9) Ramverk för projekt och uppdrag Peter Yngve IT-centrum 2011-02-10 1.0 2 (9) BAKGRUND/MOTIV... 3 MÅL OCH SYFTE... 3 DEFINITIONER AV PROJEKT... 3 MODELL FÖR PROJEKTSTYRNING...
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER LAT110 Latin, grundkurs, 30 högskolepoäng Latin, Introductory Course, 30 higher education credits Fastställande Kursplanen är fastställd av Humanistiska fakultetsnämnden
Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)
Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket