Introduktion till språkteknologi

Storlek: px
Starta visningen från sidan:

Download "Introduktion till språkteknologi"

Transkript

1 1 Preliminär version 7 Får ej kopieras Introduktion till språkteknologi Ett kompendium av Anna Sågvall Hein Reviderad Anna Sågvall Hein, 2002

2 2

3 3 Innehåll Förord 1 1 Språkteknologi Språkteknologiska delområden Det svenska språkteknologiprogrammet Språkteknologisk utveckling 9 2 Datorlingvistik språkteknologins teoretiska bas Olika lingvistiska ansatser Språket som en kunskapsbaserad kommunikativ process Flertydighet och andra problem för datorlingvistiken Om modellering av språkförståelse 29 3 Ord- och textbehandling Stavning Avstavning Grammatik- och stilkontroll Läsbarhet Lexikonstöd Textbehandling 58 4 Dokumenthantering Framställning Optisk läsning Märkning Lagring Sökning 72 5 Datorstödd språkinlärning Ordkunskap Grammatik och grammatiska begrepp Läromedelsutveckling 90 6 Maskinöversättning och datoriserade översättningsstöd Direktöversättning Transferbaserad översättning Textberoenden över meningsgränserna Interlinguaöversättning Utvecklingslinjer Datorbaserade lexikon Från SOB till lexikonet i Sve.Ucp Gränssnitt i naturligt språk 125 Litteratur 130

4 4

5 1 Förord Föreliggande material utgör ett försök till sammanställning av ett introducerande undervisningsmaterial om språkteknologi. Det utgör bakgrund till de föreläsningar som givits av författaren på Introduktionskurs i språkteknologi från språkteknologiprogrammets start ht 1994 till och med ht 2001.

6 2

7 3 1 Språkteknologi Språkteknologi är läran om språktekniken. Språktekniken omfattar alla former av tekniker för bearbetning av naturligt språk i elektronisk form samt överföring av naturligt språk till elektronisk form. Rent allmänt kan man alltså säga, att det handlar om att få datorer att utföra språkliga uppgifter, både sådana som tidigare utförts av människor, och sådana som inte varit aktuella före datorernas tillkomst. Ofta blir det fråga om att understödja människan i utförandet av de språkliga uppgifterna, snarare än att få datorn att ta över hela uppgiften. Aktuella teknikområden är datorteknik, datorkommunikation och telefoni. Språkteknologin är sålunda en del av informationsteknologin, läran om informationstekniken. Med naturligt språk avses språk som vuxit fram naturligt i kommunikationen mellan människor som svenska, engelska, tyska etc. Man använder sig av termen naturligt språk för att göra åtskillnad mellan sådana språk och formella språk som konstruerats för speciella användningar som t.ex. logikens, algebrans och datorns språk. (För olika användningar av ordet språk i den "naturliga bemärkelsen", se Linell 1982, 1.) Språkteknologin omfattar såväl det skrivna som det talade språket. Av ett språkteknologiskt datorprogram kräver man inte bara att det skall vara tillämpligt på naturligt språk utan även att det skall innehålla något mått av språkkunskap. Att bestämma vari språkkunskapen består samt att uttrycka den på ett sådant sätt att den kan användas av ett datorprogram är en central uppgift för språkteknologin. Beroende på komplexiteten i den språkkunskap som används skiljer man ofta mellan s.k. lågnivåprodukter som t.ex. stavningsprogram och högnivåprodukter som maskinöversättningssystem. I ett stavningsprogram kan språkkunskapen inskränka sig till en lista över korrekt stavade ord och underlag för att generera rättelseförslag, medan ett avancerat översättningssystem måste kunna använda sig av lexikal och grammatisk kunskap om både källspråk och målspråk samt av regler för översättning mellan dem. Språkteknologisk grundforskning bedrivs inom datorlingvistiken. Termen datorlingvistik är en översättning av engelskans computational linguistics, CL. Parallellt med datorlingvistik

8 4 finner man svenska benämningar som datalingvistik, språklig databehandling och språkvetenskaplig databehandling. Datorlingvistiken är en gren av lingvistiken, och som sådan har den de naturliga språken som sitt forskningsobjekt. Datorlingvistisk forskning bedrivs också vid teknisk-naturvetenskapliga institutioner och benämns då vanligen Natural Language Processing, NLP. NLP utgör ett huvudområde inom den gren av datavetenskapen som kallas Artificiell Intelligens, AI. Inom såväl datorlingvistik som NLP har man hittills koncentrerat sig på det skrivna språket. Forskning kring och utveckling av datamaskinella metoder för hantering av talat språk, s.k. talteknologi, har i stort sett bedrivits oberoende av den metodutveckling som skett inom datorlingvistiken. Det är en situation som man nu söker råda bot på, i Sverige såväl som i EU och övriga världen. Språkteknologin är inne i ett expansivt utvecklingsskede både i Sverige och utomlands. Drivande för denna utveckling är den allmänna utvecklingen inom informationsteknologin. Merparten av den information som skickas över de "elektroniska motorvägarna" är i form av naturligt språk, och det är svårt att överblicka omfattningen av de språkteknologiska uppgifter som väntar. Vad beträffar de tekniska aspekterna på informationsteknologin, se vidare Närings- och teknikutvecklingsverket, NUTEK (1993). Inom EU intar språkteknologi (Language Engineering, LE; Human Language Technology, HLT) en framskjuten plats. Området utgör en egen sektor i Telematikprogrammet, som ingår i EUs tredje och fjärde ramprogram. Programmet får nu sin fortsättning i ett femte ramprogram och betydande satsningar planeras för perioden 1999 och framåt. 1.1 Språkteknologiska delområden I en av EU-kommissionen beställd marknadsstudie LE Executive Summary (Lockwood. R. 1993) identifieras ett antal språkteknologiska delområden av strategisk betydelse för informationsteknikens framtida utveckling, nämligen: Programvaror för kontorssystem Översättningsstöd

9 5 Datorstödd språkinlärning Dokumenthantering On-line informationstjänster Telekommunikation i realtid Elektroniska meddelandesystem Programvaror för kontorssystem Det gäller här avancerad programvara för kontorsbruk, särskilt de språkliga stödfunktionerna i ord- och textbehandlingssystem. De kan ge hjälp med Stavning Avstavning Grammatikkontroll Stilkontroll Ordval Alla dessa funktioner bygger på språkspecifik kunskap och mycket återstår att göra innan behoven tillgodosetts för alla EU-språken. Kvaliteten på existerande program varierar också kraftigt med kvaliteten på de lexikon och grammatiker som används. Man kan förutskicka, att det är i fråga om kvalitet och funktionalitet på de språkliga funktionerna som framtidens ordbehandlingssystem kommer att skilja sig åt, medan de i fråga om andra funktioner torde komma att uppvisa en jämn standard. Översättningsstöd Mångårig forskning baserad på tanken på ett komplett, självständigt och fullfjädrat maskinöversättningssystem följs nu av forskning och utveckling av datoriserade arbetsmiljöer, s.k. arbetsbänkar, för översättaren. Arbetsbänkarna kopplas till ordbehandlingssystem och erbjuder funktioner som Terminologistöd Lexikonstöd Återanvändning av tidigare översättningar

10 6 Vissa avancerade system förses också med en "motor" i form av ett maskinöversättningssystem, som översättaren kan utnyttja efter eget val. Om detta område gäller i än högre grad än om föregående, att mycket återstår att göra; behoven av översättningsstöd är enorma och bristen på adekvata språkliga resurser i form av lexikon, grammatiker, och översättningsregler utgör en bromsande faktor. Här räcker det ju inte med kunskap om ett språk, utan om minst ytterligare ett och förhållandet dem emellan. Vad man vill åstadkomma med införandet av datoriserade översättningsstöd är ökad översättningsproduktion och förbättrad kvalitet på de översättningar som görs. Ett steg på vägen är att utrusta alla europeiska facköversättare med bra översättningsstöd. Man måste också ge översättarna kunskap om hur stöden skall användas och olika organisationer måste informeras om deras användbarhet och de möjligheter de erbjuder. Enligt de uppskattningar som gjorts finns det ungefär heltidsanställda översättare inom EU-organisationerna och den årliga kostnaden för översättning inom EU ligger runt 12 miljarder ECU. Mycket få av EU-översättarna är utrustade med adekvata datoriserade översättningsstöd. Datorstödd språkinlärning Datorstödd språkinlärning (Computer-Aided Language Learning, CALL) är ett brett och expansivt språkteknologiskt delområde. Inte minst vuxnas behov av ökade kunskaper i främmande språk betonas i LE 2000, och man för fram tanken på preciserad kunskap i främmande språk som grund för "lingvistiska pass". Området inrymmer bl.a. datorstöd för Ordförrådsinlärning (inkl. böjning och uttal) Grammatikträning Inlärning av grammatiska begrepp Läsning Läromedelsframställning Aktuell forskning och utveckling av program för datorstödd språkinlärning inriktas mot ett ökat multimedialt utnyttjande och bättre funktionalitet, t.ex. integrering av tal och bild.

11 7 Dokumenthantering Området omfattar framställning inmatning (ev. via optisk läsning och teckentolkning) lagring sökning och åtkomst av och i olika typer av dokument. De språkteknologiskt mest intressanta och utvecklingsbara av dessa delproblem är de som gäller stöd för dokumentframställning, s.k. skrivstöd eller författarstöd, samt för sökning och åtkomst. Gängse sökmetodik inbegriper förutom s.k. strängsökning även automatisk nyckelordsindexering. I forskningsfronten ligger utveckling av metoder för intelligent igenkänning av intressanta textavsnitt och innehållsbearbetning. Området omfattar således såväl lågnivå- som högnivåprodukter. On-line informationstjänster Här handlar det om utnyttjande av informationstjänster som bygger på att datorn via datornät eller telefon är uppkopplad till någon informationsdatabas. Användningen av sådana tjänster förväntas öka kraftigt när informationsinhämtandet underlättas. Det kan ske på olika sätt, t.ex. genom att man skapar tillgång till fråge-svar-system och andra s.k. gränssnitt i naturligt språk. Utveckling av sådana gränssnitt hör till de centrala språkteknologiska uppgifterna. De bör helst finnas i användarens eget modersmål och helst vara röststyrda. Uppgiften löses sålunda företrädesvis genom en integrering av traditionellt datorlingvistisk och talteknologisk metodik. Telekommunikation i realtid Telekommunikation i realtid är ett talteknologiskt område med fokus på röstbaserad telekommunikation. Här är sålunda ett exempel på ett område där två teknologier förenas, telefoni och datorteknik. Dels gäller det användning av tekniker för röstigenkänning vid uppringning (voice dialling), dels utnyttjande av röstbaserade gränssnitt till offentliga onlinesystem för olika slags transaktioner, huvudsakligen ekonomiska. Man uppskattar antalet affärssamtal per telefon inom EG till 60 miljarder årligen. Röstuppringning skulle väsentligen

12 8 reducera den tid som läggs ned på sådana samtal. Den skulle också stimulera användningen av offentliga on-linesystem för olika transaktioner i väsentlig grad. Elektroniska meddelandesystem Elektronisk post är en av de mest utnyttjade tjänsterna på datornätet. Varje brev/meddelande kan betraktas som ett dokument och antalet dokument växer snabbt hos den enskilda användaren. Samma behov av dokumenthantering som gäller för traditionella dokument kommer sålunda också att gälla för de elektroniska breven (med undantag för inmatningsfasen); de behöver lagras och ordnas på sådant sätt att intelligent sökning blir möjlig. Ytterligare ett språkteknologiskt område aktualiseras av den elektroniska posten - datorstödd översättning. 1.2 Det svenska språkteknologiprogrammet En av de bärande tankarna i LE 2000, nämligen den att språkteknologi skall omfatta både talat och skrivet språk betonas också i det Svenska språkteknologiprogrammet. Det är ett nationellt program för forskning och utveckling i språkteknologi som finansieras av Humanistisk- Samhällsvetenskapliga Forskningsrådet, HSFR, och NUTEK i förening. Programmet startade 1990 och är nu inne på sin tredje period. En naturlig indelning av programmet uppstår om man betraktar språk som input till och output från en dator och samtidigt iakttar distinktionen mellan talat och skrivet språk, d.v.s. om man betraktar de fyra språkliga processerna läsning, skrivning, lyssnande och talande och deras datorsimulering var för sig. TEXT TAL INPUT Textförståelse Talförståelse OUTPUT Textgenerering Talproduktion Figur 1: Språkteknologiska dimensioner Citatet och figuren är hämtade ur den bakgrundstext till programmet som formulerades vid inledningen av den andra perioden, se vidare (HSFR/NUTEK 1993).

13 9 Ett typiskt exempel på en uppgift som kräver att man integrerar talteknologisk och datorlingvistisk forskning är maskinöversättning av talat språk. Det förutsätter analys och syntes av tal, vilket är klassiska problem inom talteknologin. Därtill krävs språkanalys, språkgenerering och bestämning av översättningsekvivalenter i det skrivna språket, vilket är centrala datorlingvistiska utmaningar. Ett stort europeiskt projekt med denna inriktning är det tyska Verbmobil: Speech Translation on Demand (xxx). Vid igångsättningen av det svenska språkteknologiprogrammet 1990 bedömde man följande uppgifter som särskilt intressanta (STUinfo ): 1 maskinell textöversättning och översättningsstöd 2 sammanlänkning av text och tal i meddelandesystem 3 datorstödd textgenerering 4 datorstödd undervisning, speciellt språkundervisning 5 användning av naturligt språk i dialoger med datorer och kunskapssystem 6 strukturering och sökning av information i databaser 7 röststyrning av maskiner 8 taldialog vid användning av informationssystem via telefon Listan ovan stämmer väl överens med den syn på området som presenteras i LE Språkteknologisk utveckling Språkteknologisk utveckling förutsätter inte bara datatekniska resurser i form av datornät, plattformar och redskap utan också språkliga resurser i form av lexikon (inkl. ord- och termdatabaser), grammatiker och korpusar (för olika ändamål valda textmaterial). Det råder brist på språkliga resurser vilket utgör en bromsande faktor. Utveckling av lexikon och grammatiker är tidsödande och dyrbart, och till de strategiska ansatser som förordas inom EU hör standardisering av språkliga resurser så att de kan återanvändas. Forskning kring och utveckling av metoder för automatiserad lexikonuppbyggnad från text är en väg till nya och utökade lexikon.

14 10 Kvaliteten på de språkteknologiska funktionerna är beroende av hur väl de anpassas till ämnesområde, s.k. domän, och användare. Graden av domänanpassning och användaranpassning är således andra kritiska faktorer som måste uppmärksammas. Till användaranpassningen kan man också hänföra behovet av flerspråkighet. Användaren skall kunna få bruka sitt eget språk även i kommunikationen med språkbrukare inom andra språkområden. Utveckling av metoder för automatisk igenkänning av översättningsekvivalenter i korpusar bestående av parallelltexter, d.v.s. en grundtext med översättningar till andra språk, är en särskilt intressant del av den textbaserade lexikonuppbyggnaden. Utveckling av språkteknologiska produkter är en komplicerad, krävande och kostsam process, och ännu är blott få av de resulterande produkterna ekonomiskt lönsamma. Det gäller därför att få ned kostnaderna för de komplicerade och kunskapsintensiva lingvistiska metoderna. Ett sätt är att utveckla återanvändbara språkliga resurser. Det är också målet för flera europeiska utvecklings- och forskningsprojekt. Sammanfattningsvis kan man konstatera att ord som flerspråkighet, språkliga resurser och deras återanvändning, domänanpassning, användaranpassning, robusthet, pilotprojekt och utprovning är centrala begrepp i framtidens språkteknologiska utveckling.

15 11 2 Datorlingvistik Datorlingvistiken utgör språkteknologins teoretiska bas. Det är en lingvistisk inriktning, och som sådan har den de naturliga språken som sitt studie- och forskningsobjekt. 2.1 Olika lingvistiska ansatser Lingvistikens rötter går ända tillbaka till sanskritgrammatikerna, som verkade för två tusen år sedan, och under lingvistikens långa historia har man studerat språk ur många olika aspekter. Den amerikanske AI-forskaren T. Winograd (1983) tar upp några av dem och jämför dem med forskningsinriktningar inom andra discipliner. Därvid använder han sig av följande bilder, metaforer (fig. 2). Lingvistiken som: juridik: biologi: kemi: matematik föreskrivande historisk och jämförande atomistisk och strukturell generativ och processinriktad Figur 2: Lingvistiska metaforer enl. Winograd (1983) Som lingvist (språkvetare, språkforskare) möter man många olika slags förväntningar på sig i sin yrkesroll. Till de vanligaste hör att man skall ha en klar uppfattning i flera språkvårdsfrågor. Man antas kunna utreda frågor som t.ex. om man får säga Han är äldre än mig. eller om det måste heta Han är äldre än jag. Man uppfattas som språkvårdare och lingvistiken som en föreskrivande verksamhet. Språkvårdsfrågorna är viktiga, och i vårt land hanteras de av organ som Svenska språknämnden och Svenska Akademien. Däremot är det knappast någon lingvist som idag ser de språkvårdande frågorna som de centrala för lingvistiken. En annan förväntan på lingvisten gäller kunskap om ords ursprung (etymologi) och släktskap. Det är sålunda ett uttryck för Winograds biologimetafor. Den syftar på det lingvistiska paradigm (begreppssystem) som utvecklades under 1800-talet under benämningen jämförande filologi. Man studerade språkens släktskap och förändring över tiden. På grundval av språklikheter, främst i fråga om ordskatt och ljudsystem byggde man släktträd över

16 12 språken i samma anda som biologerna utvecklade klassifikationssystem (taxonomier) över organismer. Så småningom hade filologerna utforskat de kända språken, och vissa övergick till att studera mer udda språk som antropologerna bidrog med. Den biologiskt inspirerade forskningsmetoden fick alltmer karaktär av repetition och intresset kom att svalna efter en lång och framgångsrik forskningsperiod. I början på seklet kom lingvisternas intressen att förskjutas från jämförande studier av flera språk till metodutveckling för systematisk beskrivning av regelbundenheter i enskilda språk. Banbrytande för denna strukturella ansats var schweizaren Ferdinand de Saussure och amerikanen Leonard Bloomfield. Paradigmet kom att dominera den lingvistiska forskningen genom hela femtiotalet, och metoderna tillämpas fortfarande på många håll. De strukturella lingvisterna stod under påverkan av de amerikanska behaviouristerna, vilket fick till följd att man koncentrerade sitt lingvistiska studium till observerbara datamängder, till en korpus av naturligt förekommande yttranden. I analysen av de språkliga uttrycken följde man en modell som var inspirerad av kemisterna. På samma sätt som kemisten analyserade olika ämnen i primitiva element som molekyler och deras beståndsdelar, sökte lingvisterna efter språkens minsta enheter. Detta sökande ledde bl.a. fram till fonemet (se Linell 1982: 42), en distinkt, betydelseskiljande ljudkategori. Även om den mänskliga talapparaten kan producera en oändlig ljudvariation, har varje språk ett litet antal (mellan tjugo och femtio) sådana betydelseskiljande ljudkategorier. Mängden fonem är olika för varje språk, och strukturalisterna koncentrerade sig på att utveckla igenkänningsprocedurer, med vars hjälp man på ett objektivt och systematiskt vis kunde bestämma fonembeståndet i ett okänt språk. Samma metoder tillämpades på syntaxen - hur ord kombineras till större enheter som fraser och satser - men med mindre framgång. Antalet minimala betydelsebärande element, morfem (se Linell 1992: 36), i ett språk är mycket större än antalet fonem och därtill kommer att morfemen är mindre välstrukturerade och svårare att bestämma än fonemen. Via Noam Chomsky (1957) introducerades ett nytt paradigm, som förkastar strukturalismens empiriska metodik med dess bundenhet till observerbara data till förmån för språkbrukarnas intuitioner om sina modersmål. De har en abstrakt mental kompetens, en grammatik, som ligger till grund för språkandet, och som bl.a. skiljer ut språkligt tillåtna satser från otillåtna. Begreppet abstrakt kompetens är nära besläktat med begreppet bevis i matematiken. Vi kan betrakta matematiken som ett språk av formler, och matematikernas uppgift består i att

17 13 förklara vilka kombinationer av symboler som är sanna (tillåtna) givet en viss mängd axiom och inferensregler. Den generativa lingvistiken ser språk som ett matematiskt objekt och bygger teorier som liknar matematikens mängder av axiom och inferensregler. En mening är grammatisk (tillåten) om det finns någon härledning (eng. derivation) som visar att dess struktur överensstämmer med den (för det aktuella språket) definierade regelmängden. Språket består av en oändlig mängd satser, och kan därför inte beskrivas genom uppräkning. Man måste finna former för att med en ändlig mängd regler, en grammatik, beskriva denna oändliga mängd. Härför utnyttjar man det matematiska begreppet rekursivitet, som exemplet nedan får visa. I Noaks ark fanns minst en åsna och en häst och en mula och en ko och en kamel och en get och en gris och en antilop och en älg... För varje nytt samordningsled får vi en ny sats. Eftersom det inte finns någon (principiell, teoretisk) gräns för hur många led det kan finnas i en samordning, så följer att vi kan konstruera ett oändligt antal satser utifrån denna grundmodell. Hur skall nu denna situation beskrivas? Låt oss börja med ett enkelt substantivuttryck, en nominalfras (NP), bestående av en obestämd artikel, en determinerare (D), följd av ett substantiv, ett nomen (N). en åsna: NP D N en åsna och en häst: NP D N C D N en åsna och en häst och en mula: NP D N C D N C D N D en N åsna N häst N mula N ko N kamel 1. NP D N 2. NP NP C NP

18 14 3. D {en, ett} 4. N {åsna, häst, ko, kamel, get, gris, antilop, älg} 5. C {och} en åsna NP 1 D N 3, 4 en åsna en åsna och en häst NP 2 NP C NP 1, 5, 1 D N och D N 3, 4, 3, 4 en åsna en häst en åsna och en häst och en mula NP 2 NP C NP 1, 5, 2 D N och NP C NP 3, 4, 1, 5, 1 en åsna D N och D N 3, 4, 3 en häst en mula

19 15 Den generativa lingvistiken har främst varit inriktad på syntax och fonologi, där den också varit framgångsrik. En aspekt som inte omfattas av den generativa lingvistiken, är frågan om hur grammatiken engageras vid språkförståelse och språkproduktion. Utforskandet av de språkliga processerna ligger sålunda utanför den generativa lingvistikens intressesfär. De står däremot i centrum för forskningen inom det datorlingvistiska paradigmet, som tagit över mycket av den generativa lingvistikens metodik och synsätt. 2.2 Språket som en kunskapsbaserad kommunikativ process Lingvistikens främsta uppgift är att utforska förhållandet mellan en text och dess betydelse, hävdade den sovjetiske lingvisten I. A. Mel cuk (1974) i presentationen av sin lingvistiska teori Meaning - Text. En sådan uppfattning ligger helt i linje med det datorlingvistiska synsättet. Man utgår från att det finns ett systematiskt förhållande mellan en text och dess betydelse, och inriktar forskningen på att utforska och modellera de processer som leder från en text och till dess betydelse, språkförståelse, och omvänt, språkproduktion. De språkliga Producer Current goals Comprehender Understood meaning Cognitive processing Knowledge base Knowledge of the language Knowledge of the world Knowledge of the Situation Speech or writing Cognitive processing Knowledge base Knowledge of the language Knowledge of the world Knowledge of the situation Figur 3: Basic model of cooperative communication (Winograd 1983)

20 16 processerna förutsätter många olika slags kunskap: kunskap om språket, kunskap om den situation i vilken texten mottas resp. produceras, och allmän kunskap om hur det brukar vara i världen. Sålunda talar man om språket som en kunskapsbaserad process i ett kommunikativt sammanhang. Detta synsätt får illustreras av Winograd (1983), se fig. 3. Det är ett perspektiv på språket som man återfinner inom andra grenar inom lingvistiken, t.ex. psykolingvistiken. Vad som framför allt skiljer den datorlingvistiska forskningen från den psykolingvistiska är metodiken. Inom datorlingvistiken utforskar man de språkliga processerna genom att utveckla och prova ut datoriserade modeller (med utnyttjande av befintlig evidens), medan man inom psykolingvistiken söker ny evidens genom att undersöka det språkliga beteendet hos enskilda individer i kontrollerade experimentsituationer. En viktig ingrediens i de datoriserade språkmodellerna är formaliserade beskrivningar av språk och annan nödvändig kunskap. Utveckling av sådana beskrivningar och definition av formella språk att uttrycka dem i utgör sålunda en väsentlig del av den datorlingvistiska forskningen. 2.3 Flertydighet och andra problem för datorlingvistiken Inom traditionell språkvetenskap har det naturliga språket självt varit den dominerande beskrivningsformen, och för att traditionella lexikon och grammatiker skall kunna brukas av de datorlingvistiska processmodellerna måste de först formaliseras, d.v.s. deras utsagor omvandlas till strikta och fullständiga betydelserepresentationer. Man säger ibland att de datorlingvistiska betydelserepresentationerna skall vara beräkningsmässigt motiverade, där man med beräkning främst avser operationer av logisk natur, av relevans för slutsatsdragning och sökning. Tillgång till beräkningsmässiga betydelserepresentationer är en förutsättning för många språkteknologiska högnivåprodukter, t.ex. system för maskinöversättning, informations- och faktasökning i fri text, fråge-svar-system och andra gränssnitt i naturligt språk. Vägen från ett uttryck i naturligt språk till en formaliserad betydelserepresentation är lång och komplicerad. De formella språken har konstruerats för att man på ett exakt och härledningsmässigt motiverat sätt skall kunna beskriva avgränsade kunskapsområden t.ex. matematiken med dess algebraiska språk, kemin med dess formelspråk osv. Av dessa vetenskapens språk har man krävt ett entydigt förhållande mellan uttryck och innehåll. Så är det inte i de naturliga språken, vilka kännetecknas av flertydighet, vaghet och variation. Vidare uppvisar de redundans och ofullständighet (se fig. 4). Låt oss i tur och ordning titta på

21 17 dessa fenomen och fundera över vad de spelar för roll i datormodelleringen av de språkliga processerna. Entydighet Uttryck Flertydighet Innehåll Uttryck Variation Innehåll Uttryck Redundans Innehåll Uttryck + + Vaghet Innehåll Uttryck Innehåll ~ Ofullständighet Uttryck - Innehåll Figur 4: Förhållanden mellan uttryck och innehåll i naturligt språk Flertydighet Flertydighet (eng. ambiguity) är ett genomgående drag i språket. Den kan vara av olika slag och gälla såväl enskilda ord som strukturer och syftningsförhållanden.

22 18 Exempel på lexikal flertydighet a) formflertydighet; intern homografi fiska infinitiv el. imperativ b) ordklassflertydighet; extern homografi fiskar var verb el. nomen (substantiv) verb el. adverb el. bestämningsord el. nomen el. adjektiv c) flertydighet inom en ordklass; polysemi bank nomen 1 långsträckt undervattensgrund; anlagd vall; långsträckt anhopning 2 kreditinrättning; penningsumma i spel Kombinationer av de olika typerna förekommer också, t.ex. bar (adjektiv, verb, nomen i betydelsen matställe, och nomen i betydelsen lokal för rusdrycksservering). Av det språkliga sammanhang, den kontext, i vilket orden ingår, framgår som regel vilket alternativ som åsyftas, och flertydigheterna vållar sällan problem i den mänskliga kommunikationen. Många gånger uppmärksammas de inte ens av språkanvändarna. Annorlunda är det för datorn; dess lexikon måste redovisa de olika alternativen, och på formell grund måste den välja rätt alternativ i sammanhanget. Igenkänning av meningsbyggnaden, den syntaktiska strukturen, utgör en sådan formell grund för att lösa två av typerna ovan, d.v.s. formflertydighet och ordklassflertydighet. Nedan ges exempel på fem olika kontexter för det flertydiga ordet var, vilka illustrerar dess olika användningar: 1 Stackars Kalle var rädd. 2 Eva går till arbetet var dag. 3 Var bildades i såret. 4 Kalle blev var problemen. 5 Var bor Pelle? I 1 är var verb, i 2 determinerare, i 3 nomen, i 4 adjektiv och i 5 frågande adverb. Det är något man kan konstatera efter att ha känt igen den syntaktiska strukturen i de olika

23 19 meningarna, d.v.s. hur orden hänger ihop. Den syntaktiska strukturen yttrar sig i två principer, ordning (ordföljd) och hierarki. Den representeras vanligen inom den formella lingvistiken av en trädstruktur. Nedan presenteras en trädstruktur, som visar den syntaktiska strukturen för 1 ovan: S NP VP A N V A stackars Kalle var rädd Enligt den här strukturen är stackars och Kalle samt var och rädd nära förbundna med varandra (mer så än t.ex. Kalle och var vilket torde svara mot våra språkliga intuitioner). De bildar enheter, fraser, som representeras i trädet av s.k. fraskonstituenter med benämningen NP för nominalfras (eng. nominal phrase) och VP för verbfras (eng. verb phrase). De två fraskonstituenterna bygger upp meningen, som symboliseras av S (för sentence). I trädet finns vidare enkla lexikala konstituenter som A, N och V. En trädstruktur som innehåller fraskonstituenter brukar benämnas frasstrukturträd. Mot frasstrukturen ovan svarar följande syntaxregler, vilka kan sägas bilda en svensk minigrammatik: (1) S NP VP NP A N VP V A A stackars, rädd N Kalle V var Reglerna i (1) är exempel på omskrivningsregler (eng. rewrite rule). Omskrivningsregler är en typ av formella regler som är matematiskt väldefinierade och som datorn kan tillämpa i syntaxanalys. Efter syntaxanalys enligt grammatiken ovan kan således datorn konstatera att inget annat alternativ än var (V) är tillämpligt i den givna kontexten (Stackars Kalle var trött), och övriga alternativ kan avvisas; därmed har den fullgjort sin uppgift att lösa den

24 20 ordklassflertydighet som är förknippad med var i detta fall. För de andra exemplen ovan måste vi utvidga grammatiken ovan med fler regler, något som vi återkommer till i samband med en laboration. Med detta exempel har vi visat hur datorn kan lösa ordklassflertydighet via syntaxanalys. Samma sak gäller för formflertydighet (a), förutsatt att de syntaktiska reglerna specificeras ytterligare så att de också tar hänsyn till forminformation. (En imperativ verbform förekommer i andra syntaktiska sammanhang än en infinitivform etc.; man säger ibland att formerna har olika distribution.) När det gäller polysemi, d.v.s. flertydighet inom en ordklass (se c ovan), så handlar valet om betydelseskillnader som det är svårare att beskriva och formalisera. En mening som Han gick till en bar. ger oss inget underlag för att välja mellan den bar som serverar mat och den som serverar alkohol. Valet här kräver ett sammanhang som går utöver den enskilda meningen. Vi måste veta något om den situation i vilken satsen hör hemma. Ingår den i en text i vilken det förekommer en man som är hungrig eller törstig? På frågan om hur större textavsnitt än den enskilda meningen skall representeras och analyseras finns inga standardsvar. Den hör hemma i den datorlingvistiska forskningsfronten. Exempel på strukturell flertydighet : a) druckna män och kvinnor druckna män å ena sidan, kvinnor å den andra el. druckna män och druckna kvinnor snälla pojkar och flickor snälla pojkar å ena sidan, flickor å den andra el. snälla pojkar och snälla flickor b) Lisbeth och Olof Palme Lisbeth å ena sidan, Olof Palme å den andra el. Lisbeth Palme och Olof Palme Silvia och Carl Bildt Silvia å enda sidan, Carl Bildt å den andra el.

25 21 Silvia Bildt och Carl Bildt Exemplen visar två vanliga typer av tvetydiga svenska konstruktioner. Tvetydigheten kommer sig av samordningen, i kombinationen med det framförställda attributet i a) och det efterställda attributet, efternamnet i b). Språket tillåter oss att undertrycka attributet i det andra samordningsledet i a) och det i första ledet i b); vi får använda oss av en elliptisk konstruktion. Sådana konstruktioner sammanfaller med konstruktioner där ingen ellips förekommer, och vi får tvetydigheter. Valet av rätt alternativ i såväl a) som b) kräver tillgång till ett textsammanhang eller kunskap av erfarenhetsmässig eller encyklopedisk natur. Det kan framgå av texten om det förekommer druckna kvinnor resp. snälla flickor i den värld som skildras; det kan också vara så, att vi utifrån vår egen erfarenhet drar den slutsatsen att kvinnor inte är druckna, och att flickor är snälla och väljer i enlighet härmed. I b) kan det handla om att vi vet vilka de refererade personerna är och vem som är gift med vem. I varje fall handlar det vid modellering av textförståelsen i liknande fall om att bygga in mekanismer för slutsatsdragning som opererar på den samlade kunskap som finns tillgänglig vid den punkt i textförståelseförloppet vid vilken den tvetydiga konstruktionen skall behandlas. Vi benämner en sådan kunskapsbas för en diskursrepresentation. Den utvidgas kontinuerligt med ny kunskap allteftersom förståelseförloppet avancerar. Ett klassiskt exempel på strukturell flertydighet utgör. Jag såg mannen i parken med teleskopet med sina olika läsningar. (Vilka är de?) Flertydigheten har sin grund i de efterställda prepositionsuttrycken, som antingen kan föras till framförstående nomen eller till verbet. Samma osäkerhet beträffande prepositionsuttrycket återfinner vi i satsen c) Eva gjorde salladen i köket. Skall i köket föras till salladen eller till görandet? Båda läsningarna är fullt möjliga. Skillnaderna kan visas med hjälp av frasträdstrukturer. De träd som visas på nästa sida innehåller ytterligare än fraskategori jämfört med trädet ovan, nämligen PP, prepositionsfras. Allmänt gäller, att en nominalfras har ett nomen som sitt huvudord, en verbfras ett verb och en prepositionsfras en preposition. De båda träden har genererats utifrån en grammatik, som omfattar följande omskrivningsregler: S NP VP NP N PP NP N PP Prep NP

26 22 VP V NP VP V NP PP N Eva, salladen, köket V gjorde, P i, S NP VP N V NP PP Eva gjorde N P NP salladen i N resp. köket S NP VP N V NP Eva gjorde N PP salladen P NP i N Beträffande meningsgrammatiken, se vidare Linell (1982: 57-65). köket

27 23 I en datoriserad förståelsemodell måste vi kräva att den datamaskinella syntaxanalysen identifierar och redovisar flertydiga strukturer, vilka svarar mot olika läsningar (betydelser) av satsen, på samma sätt som lexikonet måste redogöra för de lexikala flertydigheterna. Sedan måste det finnas mekanismer för val av aktuellt alternativ utifrån textsammanhanget (diskursen) eller annan kunskap utanför satsen. Om vi byter ut köket mot kylskåpet i exemplet, är det uppenbart för den mänskliga läsaren, att den läsning som avses är den som svarar mot det andra alternativet. Kylskåp är små och kalla utrymmen vilka inte lämpar sig för matlagning. Däremot är det vanligt att man förvarar mat i dem. En titt i Svensk Ordbok (1986) ger oss följande information om ordet: kylskåp subst. ~et = skåp som är försett med en temperatursänkande anordning och används för förvaring av vissa matvaror [...] Här ges sålunda stöd för den tolkning av satsen där i kylskåpet bestämmer salladen. Däremot sägs ingenting som maskinen direkt skulle kunna använda sig av för att avfärda den tolkningen att salladen lagas i kylskåpet. För att underbygga ett sådant avfärdande krävs kunskap om vad skåp är, om deras storlek, om människor och människors krav på en matlagningsmiljö etc. Vidare måste det finnas mekanismer för slutsatsdragning som opererar på kunskapen och kommer fram till ett avfärdande. Medan satslösning är ett område där man nått väsentliga resultat, måste man konstatera att frågor om kunskap, kunskapsrepresentation och slutsatsdragning ännu befinner sig i den datorlingvistiska forskningsfronten. Exempel på strukturell/lexikal flertydighet: De två satserna Han heter Henrik resp. Han träffar Henrik betyder helt olika saker. Den första handlar om en person, medan den andra handlar om två olika personer. Ändå skulle de tilldelas samma frasstruktur enl. VP-regeln i grammatiken ovan. I det här fallet är frasstrukturgrammatiken inte ett tillräckligt skarpt instrument för att redovisa de väsentliga betydelseskillnaderna. För detta krävs en grammatik som inte bara skiljer mellan fraskategorier (NP, VP etc.), och ordklasser (enkla lexikala kategorier), utan som också säger något om ordens funktion i satsen, vilka satsdelar de står som. Enligt traditionell grammatik, skulle vi väl säga att nominet Henrik står som predikatsfyllnad i den första satsen och som

28 24 objekt i den andra. Här bygger vi på vår kunskap om de båda verben. heter tar predikatsfyllnad, medan träffar på motsvarande sätt tar ackusativobjekt. I begreppet predikatsfyllnad ligger vidare att det utsäger (predicerar) något om subjektet i satsen, medan objektet vanligen hänför sig till någon annan än subjektet (undantagandes reflexiva pronomina). Med hjälp av en grammatikteori som inte bara redogör för frasstruktur utan som också anger ordens grammatiska funktion (satsdel), tas ett väsentligt steg på vägen mot förståelsen av satsen. Det traditionella satsdelsbegreppet har återkommit i vidareutvecklad och formaliserad skepnad i modern grammatikteori. Den första modell av detta slag som presenterades var Lexikalisk-Funktionell Grammatik, LFG (Kaplan & Bresnan 1982). LFG har fått ett stort genomslag inom datorlingvistiken och också flera efterföljare Exempel på satsbunden semantisk flertydighet: Det finns också flertydigheter som varken hänför sig till enskilda ord eller till satsstrukturen, och vilka inte kan redovisas via en grammatisk beskrivning. Ett exempel härpå är: Alla älskar någon. Här har vi ett subjekt, ett verb och ett objekt. Längre kommer vi inte i den grammatiska beskrivningen av satsen. Ändå kan det läsas på två olika sätt. I det ena fallet finns det någon (en viss person) som alla älskar; i det andra finns det för var och en en person som älskas. För att redovisa detta slags flertydigheter måste man tillgripa komplicerade logiska uttryck. Hur detta görs på bästa sätt är också en aktuell datorlingvistisk forskningsuppgift. Exempel på syftningsflertydighet. He dropped the vase on the floor and broke it. Problemet här gäller referenten till it. Syftar pronominet på vase eller på floor? Det är en fråga som måste besvaras t.ex. för att vi skall kunna översätta meningen till svenska och få rätt form (neutrum eller utrum) på pronominet. Rent formellt kan det vara på båda sätten, även om vi som läsare mer eller mindre automatiskt för det till vas. Vi vet, att vaser ofta är gjorda av sköra material till skillnad från golv och därför lätt går sönder. Ändå är detta inte information av det slag som brukar räknas till språkkunskapen utan snarare till vår allmänna kunskap om

29 25 världen. Även för ett så till synes enkelt fall som detta måste sålunda ett datorsystem förlita sig på bakgrundskunskap för att kunna göra en korrekt analys. En indikation av mer generell natur, som talar till förmån för vase som referent är det faktum att det står som direkt objekt. Det har gjorts psykolingvistiska experiment, som visar att det direkta objektet föredras som referent framför prepositionsobjektet i ett adverbial (Sanford & Garrod 1981). Så långt det är möjligt vill man finna generella lingvistiska tendenser, som kan bidra till att minimera beroendet av bakgrundskunskap i de datorlingvistiska förståelsemodellerna. Anledningen är den, att det är mycket svårt att dra gränsen för hur mycket bakgrundskunskap som egentligen krävs. Det är också svårt att strukturera kunskapsmassan på ett generellt vis så att den blir överskådlig och utgör en bra grund för effektiv sökning och slutsatsdragning. Man tvingas många gånger tillgripa ad hoc-lösningar, något som AI-forskningen visat (Schank 1972; Nirenburg 1989). Flertydigheten utgör ett problem för modellering av förståelseprocessen. Detsamma gäller vagheten och ofullständigheten. Vaghet Med språkets hjälp strukturerar vi omvärlden och sätter namn på delarna, så att vi kan beskriva den och orientera oss i den. Det är fråga om en behovsstyrd process som sker naturligt i samspel mellan människor utan i förväg uppställa regler. Den värld vi lever i är komplicerad, och gränserna mellan de fenomen som vi benämner med språkets hjälp blir naturligt nog vaga. Var går t.ex. gränsen mellan eftermiddag och kväll, mellan natt och morgon? Eller mellan en stor och en liten hund? Det är fråga om relativa begrepp, som ändå visat sig fylla sin funktion i konkreta kommunikativa situationer, där parterna är kooperativa. Skall de språkliga begreppen omfattas av en språkförståelsemodell, så måste de preciseras. Det kan t.ex. vara fråga om att bestämma normen för vad som skall räknas som stor respektive liten i fråga om hundar i en given situation. Normen varierar sannolikt mellan en situation där det handlar om att få plats med ett antal människor och hundar i en bil, och en situation där en hund förväntas dra en kärra.

30 26 Den språkliga vagheten kännetecknar inte bara enskilda ord utan även grammatiska fenomen som t.ex. numerus och tempus. Låt oss titta på ett intressant exempel från Winograd (1984). Roses will be blooming in the dark gardens we abandoned long ago. Inom den logiskt baserade semantiken brukar man se på betydelse som mängden av de villkor som skall vara uppfyllda för att en sats skall vara sann, dess sanningsvillkor. Vilka villkor är det fråga om här? Bland annat skall det finnas en mängd X sådana att varje medlem av X uppfyller villkoren för att benämnas dark garden. Men hur skall en trädgård se ut (eller vara) för att benämnas dark? Vidare skall det råda ett sådant förhållande mellan mängden av X och subjektet i relativsatsen, Y (we) som uppfyller villkoren för att benämnas abandon, och det förhållandet skall ha inträtt long ago. Men vad menas med long ago? För två månader sedan, två år eller eventuellt två decennier sedan? Det är också så att läsaren/lyssnaren förutsätts vara i stånd att identifiera mängden av X, och tidpunkten då övergivandet inträffade, vilket framgår av att nominalfrasen står i bestämd form. Vidare skall det vid en inte angiven tidpunkt i framtiden finnas en mängd Y, sådana att varje medlem i mängden uppfyller villkoren för att benämnas rose, och varje medlem av Y skall ingå i en relation som uppfyller villkoren för att benämnas bloom. Men hur många rosor måste det vara fråga om? Och vad beror antalet på? Har det att göra med storleken på trädgårdarna? Plural brukar ju tolkas som fler än en, men räcker det med två i det här fallet? Modellering av förståelsen av satser av detta slag ställer givetvis mycket stora och långtgående krav på diskursrepresentation, och på mekanismer för slutsatsdragning i den. Ofullständighet Med språklig ofullständighet avses betydelseaspekter som inte har någon språklig motsvarighet, utan vilka lyssnaren eller läsaren förutsätts kunna sluta sig till utifrån sin allmänna bakgrundskunskap. Ofta gäller det syftningsförhållanden och textsammanhang som i inledningen till Sagan om Sigurd Fafnersbane och Gjukungarne i Erik Jolins version från 1924.

31 27 I Gjukungarnes borg. I konung Gjukes borg vid den brusande Rhen rådde en dag liv och rörelse. Gästabudssalen var festligt smyckad, björnfällar med silverklor lågo utbredda på bänkarna, guldfotade dryckeshorn och tallrikar av silver stodo på de långa borden och bonader av sällsynta och glänsande tyger prydde väggarna. Läsaren av det här textfragmentet uppfattar säkert den gästabudssal som nämns i andra meningen som en del av den borg som nämns i den första, även om det inte uttryckligen sägs i texten. Däremot signalerar den bestämda formen på nominet gästabudssal att dess referent antas vara känd för läsaren. Vi kan inte heller härleda sambandet ur någon allmän lexikal kunskap om borgar, åtminstone inte som den avgränsas av lexikograferna bakom Svensk Ordbok (1986), som förklarar ordet borg på följande sätt: borg [-å-] subst. ~en ~ar 1 byggnadsverk som fungerar såsom fästning förutom som bostad etc.; särsk. i fråga om äldre förh. Det faktum, att borgar vanligen har gästabudssalar hör snarast till vår allmänna, encyklopediska kunskap. Samma sak gäller förhållandet mellan gästabudssalen och dess bänkar, långa bord och väggar i nästa mening. För att kunna fastställa syftningsförhållandena i exemplet förutsätter sålunda förståelsemodellen tillgång till bakgrundskunskap av typen Borgar har vanligen gästabudssalar. Gästabudssalar har vanligen bänkar, långa bord och väggar. Medan de datorlingvistiska förståelsemodellerna utgår från uttryck i naturligt språk och utmynnar i formella betydelserepresentationer, går produktionsmodellerna motsatt väg. Flertydighet och ofullständighet är dominerande problem vid modellering av textförståelse, och deras motsvarigheter (fritt uttryckt) variation och redundans präglar produktionsprocessen.

32 28 Variation Språklig variation är ett välkänt fenomen som yttrar sig som synonymi och parafras. Medan flicka, tjej, tös, jänta får exemplifiera synonymibegreppet, illustreras parafrasen med följande exempel: Han bor i Uppsala. I Uppsala bor han. Det är i Uppsala han bor. Det är i Uppsala som han bor. I Uppsala är det han bor. I Uppsala är det som han bor. Han bor i den stad som har Sveriges äldsta universitet. I den stad som har Sveriges äldsta universitet är det han bor.. Man kan inte välja fritt mellan de olika alternativen. Valet är beroende av stil och textsammanhang. Redundans Språklig redundans yttrar sig i att ett och samma betydelseelement signaleras på flera sätt. Ett exempel är satsen Igår sken solen i vilken förfluten tid uttrycks både genom tempusvalet hos verbet och genom adverbet i går. Visst är det så, att igår tillför satsen mer än information om förfluten tid. Adverbet specificerar tidpunkten till dagen innan yttrandet fälls. Å andra sidan skulle man kunna anföra, att eftersom tidpunkten specificeras fullt ut via adverbet, så skulle inte verbet behöva vara tempusbärare. Andra exempel på redundans finner vi i uttryck som en ny cykel vilket visar en obestämd nominalfras i singularis. Obestämdheten signaleras på tre vis, genom den obestämda artikeln (en inte den), formen på adjektivet (ny inte nya) och formen på nominet (cykel inte cykeln). Detsamma gäller numerus. Man kan fråga sig, varför just dessa kategorier uttrycks på flera vis. Kanske det beror på, att de är fundamentala för förståelsen,

33 29 eftersom de hjälper oss att ringa in referenterna, d.v.s. de objekt som språkandet handlar om. Bestämdhetskategorin säger oss som regel huruvida referenten antas vara känd eller inte, medan numeruskategorin anger hur många referenter vi skall söka. Behovet av redundans i språksignalen ökar under otillfredsställande yttre omständigheter (buller och andra störningar). I medicinsk text kan man konstatera hur läkarna ibland reducerar redundansen genom att utelämna den obestämda artikeln, t.ex. Röntgen oesophagus visar välavgränsad bönstor främmande kropp i höjd med aorta. 2.4 Om modellering av språkförståelse Vad innebär det att förstå ett språkligt yttrande? Linell (1978: 95) urskiljer följande grader av förståelse: A uppfatta inkommande ljud (eller skrivtecken) som en språksignal, B förstå vilka orden är, C förstå yttrandets konventionella betydelse, D tolka yttrandet i den givna situationen, E reagera adekvat. Under A urskiljs sålunda språksignalen som en sådan till skillnad från oartikulerat buller och brus (eller från allmänt klotter). Under B känns de enskilda orden och deras betydelser igen. Under C fastställs relationen mellan de olika orden i yttrandet och dess betydelse bestäms. Betydelse uppfattas här som de villkor som skall gälla för att satsen skall vara sann (jfr. Roses will be blooming... ovan). Med konventionell avses här att det är fråga om den betydelse satsen har frikopplad från sitt yttre sammanhang. De olika delarna i satsen har ännu inte kopplats till de företeelser (individer, objekt, handlingar, relationer) i omvärlden som de syftar på. Dessa kopplingar utförs under tolkningsfasen D. Om jag sålunda säger Här bor jag, så utmynnar C i ett antal villkor av typen: det skall finnas ett X sådant att X uppfyller villkoren för att benämnas jag (vara en person och identisk med den som fäller yttrandet) det skall finnas en lokation Y sådan att den uppfyller villkoren för att benämnas här (vara identisk med den plats där X befinner sig) det skall råda en relation mellan X och Y sådan att den uppfyller villkoren för att benämnas bo (vara bosatt, d.v.s...).

34 30 Ett centralt problem i utarbetandet av en semantisk modell är givetvis att formulera dessa villkor. Här finns inga standardsvar, vare sig på frågan om hur de skall uttryckas eller hur noggrant de skall vara formulerade. Man kan heller inte förvänta sig att kunna ange denna noggrannhet i någon generell bemärkelse utan endast i relation till specificerade förståelsemål. Ett kriterium på noggrannheten i formuleringen av de semantiska villkoren får vi genom att betrakta nästa nivå i förståelseförloppet, d.v.s. tolkningen. De semantiska villkoren utgör sammantaget en semantisk beskrivning av de enheter och företeelser i omvärlden som de språkliga uttrycken refererar till, deras referenter. Beskrivningarna måste vara tillräckligt noggranna för att lyssnaren (läsaren) med deras hjälp skall kunna identifiera dessa referenter. Utan sådan identifiering (tolkning) kan ingen förståelse anses ha ägt rum. Med andra ord; om lyssnaren inte lyckas koppla beskrivningarna av jag och här till en viss person och en viss plats samt identifiera arten av den relation som råder mellan dem (bo), har han/hon heller inte förstått satsen. Det faktum att ett och samma språkliga yttrande kan fällas i ett stort antal situationer och ha lika många betydelser som antalet möjliga referenter brukar ibland refereras till som språkets effektivitet (effectiveness, se Barwise, J. & Perry 1983). Förståelsen av ett yttrande kan anses avslutat först när lyssnaren/läsaren har reagerat adekvat. Vid datormodellering av de språkliga processerna har man hämtat inspiration från aktuell lingvistisk forskning av det slag som Linell redovisar. Sålunda har man t.ex. tagit upp tanken på att man kan urskilja en konventionell betydelse som är frikopplad från den situation i vilken

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik

Läs mer

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på

Läs mer

Lexikon: ordbildning och lexikalisering

Lexikon: ordbildning och lexikalisering Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Grim. Några förslag på hur du kan använda Grim. Version 0.8 Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Genusforskning och politik en nödvändig eller olycklig symbios?

Genusforskning och politik en nödvändig eller olycklig symbios? Anne-Marie Morhed Genusforskning och politik en nödvändig eller olycklig symbios? Idag kan vi betrakta genusforskningens genombrott med viss historisk distans. I Sverige har den funnits både som studieinriktning

Läs mer

Auktorisation som tolk

Auktorisation som tolk PROVSPECIFIKATION Auktorisation som tolk Prov i allmän språkfärdighet Sid 2 (6) 2014-04-24 Prov i språkfärdighet För att kunna bli auktoriserad som tolk krävs bland annat att man ska behärska svenska och

Läs mer

Vad är semantik? LITE OM SEMANTIK I DATORLINGVISTIKEN. Språkteknologi semantik. Frågesbesvarande

Vad är semantik? LITE OM SEMANTIK I DATORLINGVISTIKEN. Språkteknologi semantik. Frågesbesvarande LITE OM SEMANTIK I DATORLINGVISTIKEN (FORMELL SEMANTIK) Vad är semantik? Form (abstrakt struktur): grammatik Innehåll (betydelse): semantik Användning: pragmatik/diskurs Mats Dahllöf Språkteknologisk motivation

Läs mer

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. o Ofta fogas

Läs mer

Mediafostran och användandet av nya kommunikativa redskap påbörjas redan på nybörjarstadiet.

Mediafostran och användandet av nya kommunikativa redskap påbörjas redan på nybörjarstadiet. BILAGA: REVIDERAD LÄROPLAN I LÄROÄMNET MODERSMÅL OCH LITTERATUR Språket är av avgörande betydelse för all form av inlärning. Språkinlärningen är en fortlöpande process, och därför är modersmålsinlärningen

Läs mer

Har/hade-bortfall i svenskan Hur finit är ett naket supinum?

Har/hade-bortfall i svenskan Hur finit är ett naket supinum? Har/hade-bortfall i svenskan Hur finit är ett naket supinum? Maia Andréasson, Susanna Karlsson, Erik Magnusson och Sofia Tingsell Att de finita formerna av verbet ha, dvs. har och hade, kan utelämnas när

Läs mer

ATT NÅ FRAMGÅNG GENOM SPRÅKET

ATT NÅ FRAMGÅNG GENOM SPRÅKET 1 (10) ATT NÅ FRAMGÅNG GENOM SPRÅKET Detta informationsmaterial är skapat i syfte att sprida en likvärdig information i Jämtlands län om vad det innebär att lära sig ett andraspråk. Men också ge information

Läs mer

1. Vad är ett språk? 1. Vad är ett språk? 2. Språkets struktur och delar. 2. Språkets struktur och delar 2012-01-19

1. Vad är ett språk? 1. Vad är ett språk? 2. Språkets struktur och delar. 2. Språkets struktur och delar 2012-01-19 Språket i skolan och samhället Ulf Fredriksson Stockholms universitetet, Avdelningen för internationell pedagogik / institutionen för pedagogik och didaktik vt 2012 Språket i skolan och samhället 1) Vad

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Tankar om språkundervisning

Tankar om språkundervisning in Lingua Nr 1, 1983.. 1 Tankar om språkundervisning Jens Allwood, Inst. för lingvistik, Göteborg universitet Om man funderar över undervisning inom något visst område, är det naturligt att ta sin utgångspunkt

Läs mer

FTEA12:2 Filosofisk metod. Att värdera argumentation I

FTEA12:2 Filosofisk metod. Att värdera argumentation I FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:

Läs mer

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,

Läs mer

el o;; Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachefor Programmein Cognitive Science 180 Högskolepoäng

el o;; Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachefor Programmein Cognitive Science 180 Högskolepoäng el o;; Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachefor Programmein Cognitive Science 180 Högskolepoäng Kognitionsvetenskap är ett tvärvetenskapligt kunskaps- och forskningsområde som

Läs mer

Dynamisk programvara, ett didaktiskt verktyg?

Dynamisk programvara, ett didaktiskt verktyg? Dynamisk programvara, ett didaktiskt verktyg? På SMDF:s årsmöte 24 jan 2003 höll Sveriges första professor i matematikdidaktik, Rudolf Strässer, ett föredrag rubricerat Learning Geometry in Secondary Schools.

Läs mer

KLARSPRÅK PÅ WEBBEN riktlinjer för webbskribenter

KLARSPRÅK PÅ WEBBEN riktlinjer för webbskribenter *Skatteverket 1(10) KLARSPRÅK PÅ WEBBEN riktlinjer för webbskribenter Våra webbtexter, liksom alla texter vi producerar för externt bruk på Skatteverket, ska vara skrivna på ett sätt som gör att läsaren

Läs mer

0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ

0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ 63((&+ (UNNL/LLNDQHQ Ledamot av Europeiska kommissionen med ansvar för näringspolitik och informationssamhället 0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ Norden digitalt konferens +HOVLQJIRUVGHQRNWREHU

Läs mer

Frasstrukturgrammatik

Frasstrukturgrammatik 729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON

Läs mer

Bevis för ett modulärt perspektiv: (tidiga studier av) afasi.

Bevis för ett modulärt perspektiv: (tidiga studier av) afasi. UPPSALA UNIVERSITET Institutionen för lingvistik och filologi SPRIND, HT 2006, Tillfälle 6 SPRÅKPSYKOLOGI SPRÅKPSYKOLOGISKA GRUNDBEGREPP (kap 1 + 2) I språkpsykologin finner man begrepp från - språkvetenskap

Läs mer

Stina Nyman 2012-09-16

Stina Nyman 2012-09-16 LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

Kompetenser och matematik

Kompetenser och matematik ola helenius Kompetenser och matematik Att försöka skapa strukturer i vad det innebär att kunna matematik är en mångårig internationell trend. Denna artikel anknyter till Vad är kunskap i matematik i förra

Läs mer

6 Svenska som andraspråk

6 Svenska som andraspråk 6 Svenska som andraspråk Syftet med utbildningen i ämnet svenska som andraspråk är att eleverna skall uppnå en funktionell behärskning av det svenska språket som är i nivå med den som elever med svenska

Läs mer

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007) Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

12 Programstege Substantiv

12 Programstege Substantiv Det här är en programstege för substantiv. Du kan alltså lära dig om substantiven på ett enkelt sätt, en liten bit i taget. Varje sida innehåller fakta om substantiv, tillsammans med uppgifter som du också

Läs mer

Remissvar avseende Mer trygghet och bättre försäkring (SOU 2015:21) SBU saknar resonemang och förslag som är inriktade på preventiva insatser.

Remissvar avseende Mer trygghet och bättre försäkring (SOU 2015:21) SBU saknar resonemang och förslag som är inriktade på preventiva insatser. Remissvar 1 (9) Datum Vår beteckning 2015-08-13 STY2015/21 Socialdepartementet Er beteckning S2015/1554/SF Remissvar avseende Mer trygghet och bättre försäkring (SOU 2015:21) Sammanfattning SBU anser att

Läs mer

Språkteknologi. Språkteknologi

Språkteknologi. Språkteknologi Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade

Läs mer

Innehållsförteckning till Svenska Online. Adress: www.sweol.se Uppdaterat 2011 01 18

Innehållsförteckning till Svenska Online. Adress: www.sweol.se Uppdaterat 2011 01 18 Innehållsförteckning till Svenska Online Adress: www.sweol.se Uppdaterat 2011 01 18 ABC kapitel 1, Alfabetisering 1 Skriv bokstaven a/a Se och lyssna Mus 2 Skriv bokstaven b/b Se och lyssna Mus 3 Skriv

Läs mer

BARNS SPRÅKUTVECKLING

BARNS SPRÅKUTVECKLING BARNS SPRÅKUTVECKLING BARNS SPRÅKUTVECKLING Hur lär sig barn sitt språk? Vad skiljer barns språkutveckling från vuxnas språkinlärning? Hur kan vi forska om barns språkutveckling? Vad säger språkutvecklingen

Läs mer

Liten introduktion till akademiskt arbete

Liten introduktion till akademiskt arbete Högskolan Väst, Inst för ekonomi och IT, Avd för medier och design 2013-09-14 Pierre Gander, pierre.gander@hv.se Liten introduktion till akademiskt arbete Den här texten introducerar tankarna bakom akademiskt

Läs mer

Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan.

Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan. Workshop Portaler och länkbibliotek Resurserna på Internet är om inte oändliga så åtminstone väldigt många. Att välja blir då ett bekymmer i sig. Portaler och länkbibliotek specialiserar sig på att samla

Läs mer

Smakprov för bloggen lärare karin i januari 2016 Inledningen och kapitel 1 4.

Smakprov för bloggen lärare karin i januari 2016 Inledningen och kapitel 1 4. Smakprov för bloggen lärare karin i januari 2016 Inledningen och kapitel 1 4. Gun Hägerfelth, Språkarbete i alla ämnen En kort- kort studiehandledning för lärare på Östra Real Karin Rehman, december 2015

Läs mer

Digitalt festivalengagemang

Digitalt festivalengagemang VOLANTE WORKING PAPER 15:07 Digitalt festivalengagemang Festivalbesökare och platsvarumärken i sociala medier VOLANTE WORKING PAPER 15:07 Digitalt festivalengagemang Festivalbesökare och platsvarumärken

Läs mer

Generellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:

Generellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier: FTEA12:2 Föreläsning 3 Att värdera en argumentation I: Vad vi hittills har gjort: beaktat argumentet ur ett mer formellt perspektiv. Vi har funnit att ett argument kan vara deduktivt eller induktivt, att

Läs mer

Objektorienterad programmering

Objektorienterad programmering Objektorienterad programmering Emil Ahlqvist (c10eat@cs.umu.se) Didrik Püschel (dv11dpl@cs.umu.se) Johan Hammarström (c08jhm@cs.umu.se) Hannes Frimmel Moström (c10hml@cs.umu.se) 1 1. Introduktion 1.1 Objektorienterad

Läs mer

ETIK VT2011. Föreläsning 13: Relativism och emotivism

ETIK VT2011. Föreläsning 13: Relativism och emotivism ETIK VT2011 Föreläsning 13: Relativism och emotivism DELKURSENS STRUKTUR Mån 4/4: Moralisk kunskap (epistemologi) Tis 5/4: Relativism och emotivism Ons 6/4: Moraliskt språkbruk (semantik) Mån 11/4: Moralisk

Läs mer

Förord. ra och Ackordspel (Reuter&Reuter), men andra böcker kan naturligtvis också användas (se

Förord. ra och Ackordspel (Reuter&Reuter), men andra böcker kan naturligtvis också användas (se Förord Lär av Mästarna har vuxit fram under min tid som lärare i ämnet satslära med arrangering vid Musikhögskolan i Malmö. Materialet har under ett decennium provats både i grupp- och individuell undervisning

Läs mer

Slutrapport för projektet Programmeringsundervisning i skolor med webbaserad konstprogrammering Annika Silvervarg, Linköping universitet

Slutrapport för projektet Programmeringsundervisning i skolor med webbaserad konstprogrammering Annika Silvervarg, Linköping universitet Slutrapport för projektet Programmeringsundervisning i skolor med webbaserad konstprogrammering Annika Silvervarg, Linköping universitet Inledning Dagens barn och ungdomar är flitiga användare av datorer,

Läs mer

Sfi-läromedel ur ett processbarhetsperspektiv

Sfi-läromedel ur ett processbarhetsperspektiv Lunds universitet Kandidatuppsats Institutionen för nordiska språk Svenska som andraspråk Jonna Pleijel Vt 2013 Sfi-läromedel ur ett processbarhetsperspektiv Handledare: Gunlög Josefsson Innehållsförteckning

Läs mer

MÅL OCH BETYGSKRITERIER I SVENSKA

MÅL OCH BETYGSKRITERIER I SVENSKA MÅL OCH BETYGSKRITERIER I SVENSKA MÅL ATT UPPNÅ I ÅR 7 Delta i samtal samt lyssna på andra Redovisa ett arbete muntligt utifrån stödord om något man sett, läst, hört eller upplevt Kunna läsa och tillgodogöra

Läs mer

Trycket beror på ytan

Trycket beror på ytan Inledning Trycket beror på ytan Du har två föremål med samma massa och balanserar dem på varsin handflata. Det ena föremålet har en mycket smalare stödyta än det andra. Förmodligen känns föremålet med

Läs mer

STUDIETEKNIK. Till eleven

STUDIETEKNIK. Till eleven STUDIETEKNIK Till eleven Tro på dig själv! För att du ska lyckas riktigt bra med dina studier, måste du tro på din egen förmåga. Försök tänka på något som du är bra på, för då stärker du ditt självförtroende

Läs mer

Vetenskapsmetodik. Föreläsning inom kandidatarbetet 2015-01-28. Per Svensson persve at chalmers.se

Vetenskapsmetodik. Föreläsning inom kandidatarbetet 2015-01-28. Per Svensson persve at chalmers.se Vetenskapsmetodik Föreläsning inom kandidatarbetet 2015-01-28 Per Svensson persve at chalmers.se Detta material är baserad på material utvecklat av professor Bengt Berglund och univ.lektor Dan Paulin Vetenskapsteori/-metodik

Läs mer

Mått på arbets- marknadsläget i den officiella statistiken

Mått på arbets- marknadsläget i den officiella statistiken Mått på arbets- marknadsläget i den officiella statistiken Ossian Wennström SACO 2001 Tryck: SACO, Stockholm ISSN 1401-7849 Innehåll Sammanfattning 1 Inledning 2 Definitioner och urval i arbetsmarknadsstatistiken

Läs mer

UTBILDNINGSPLAN. Högskoleingenjörsutbildning i datateknik, 180 högskolepoäng. Computer Engineering Programme, 180 ECTS Credits

UTBILDNINGSPLAN. Högskoleingenjörsutbildning i datateknik, 180 högskolepoäng. Computer Engineering Programme, 180 ECTS Credits Dnr: 1013/2007-510 Grundutbildningsnämnden för matematik, naturvetenskap och teknik UTBILDNINGSPLAN Högskoleingenjörsutbildning i datateknik, 180 högskolepoäng Computer Engineering Programme, 180 ECTS

Läs mer

Programmering. Seminarier i datavetenskap, datorteknik och informationsteknik. Niklas Broberg niklas.broberg@chalmers.

Programmering. Seminarier i datavetenskap, datorteknik och informationsteknik. Niklas Broberg niklas.broberg@chalmers. Programmering Seminarier i datavetenskap, datorteknik och informationsteknik Niklas Broberg niklas.broberg@chalmers.se 2015-09-24 Hur många från Datavetenskap? Datateknik? Informationsteknik? Översikt

Läs mer

Abstrakt algebra för gymnasister

Abstrakt algebra för gymnasister Abstrakt algebra för gymnasister Veronica Crispin Quinonez Sammanfattning. Denna text är föreläsningsanteckningar från föredraget Abstrakt algebra som hölls under Kleindagarna på Institutet Mittag-Leffler

Läs mer

Semantik och pragmatik

Semantik och pragmatik Semantik och pragmatik OH-serie 4 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Om barnet har svårt att andas eller har ont i bröstet

Läs mer

Satssemantik. Semantik: Föreläsning 4 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet

Satssemantik. Semantik: Föreläsning 4 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet Satssemantik Semantik: Föreläsning 4 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet 1 Dagens föreläsning Saeed 2009, kap.5-6 (Flera av exemplen här är anpassade från Saeed) Betydelse inom satser

Läs mer

Kärlekens språk En analys

Kärlekens språk En analys (publ. i Ottar - boktidningen om sexualitet samlevnad samhälle Nr 3/1988) Kärlekens språk En analys AV JENS ALLWOOD 1 "Det är, åtminstone i de bästa faserna, frågan om en så total och öppen kommunikation

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Att analysera andraspråkstexter

Att analysera andraspråkstexter Handledare: Britta Herder Examinator: Sofia Ask G3 GO1183 15 hp 2011-01-30 G2 G3 Avancerad nivå Att analysera andraspråkstexter En undersökning av två analysmetoder: processbarhetsteorin och performansanalysen

Läs mer

Grammatisk teori III Praktisk analys

Grammatisk teori III Praktisk analys Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas

Läs mer

Samverkan kring ämnen på ett högskoleförberedande program ett exempel

Samverkan kring ämnen på ett högskoleförberedande program ett exempel Utvecklingspaket 2012-06-14 Samverkan kring ämnen på ett högskoleförberedande program ett exempel Läroplanen för gymnasieskolan lyfter fram vikten av att eleverna ska kunna välja studie- och yrkesinriktning

Läs mer

7, Diskreta strukturer

7, Diskreta strukturer Objektorienterad modellering och diskreta strukturer 7, Diskreta strukturer Sven Gestegård Robertz Datavetenskap, LTH 2015 Modeller Matematiska modeller Kontinuerliga modeller Kontinuerliga funktioner

Läs mer

Hur definieras ett jämställt samhälle? (vad krävs för att nå dit? På vilket sätt har vi ett jämställt/ojämställt samhälle?)

Hur definieras ett jämställt samhälle? (vad krävs för att nå dit? På vilket sätt har vi ett jämställt/ojämställt samhälle?) BILAGA 1 INTERVJUGUIDE Vad är jämställdhet? Hur viktigt är det med jämställdhet? Hur definieras ett jämställt samhälle? (vad krävs för att nå dit? På vilket sätt har vi ett jämställt/ojämställt samhälle?)

Läs mer

Kommentarmaterial, Skolverket 1997

Kommentarmaterial, Skolverket 1997 Att utveckla förstf rståelse för f r hela tal Kommentarmaterial, Skolverket 1997 Att lära sig matematik handlar om att se sammanhang och att kunna föra logiska resonemang genom att känna igen, granska

Läs mer

Målet är att ge maskiner förmågan att plocka ut information ur

Målet är att ge maskiner förmågan att plocka ut information ur Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:

Läs mer

Kursplan för Naturorienterande ämnen

Kursplan för Naturorienterande ämnen Kursplan för Naturorienterande ämnen Inrättad 2000-07 SKOLFS: 2000:135 ÄMNEN: Biologi Fysik Kemi BIOLOGI, FYSIK, KEMI Den gemensamma kursplanetexten, utformad i ett naturorienterande perspektiv, utgör

Läs mer

Seminarier - instruktioner och instuderingsfrågor

Seminarier - instruktioner och instuderingsfrågor Uppsala universitet vt 2014, Filosofins klassiker, den nya tiden. Lärare: Robert Callergård Seminarier - instruktioner och instuderingsfrågor På seminarierna diskuterar vi tre klassiska texter två seminarier

Läs mer

Satslära introduktion

Satslära introduktion Satslära introduktion Dolores Meden Dolores Meden 2010-08-27 1 Skillnaden mellan ordklass och ett ords funktion (syntax): * ett ords tillhörighet i en ordklass är konstant och påverkas inte av användningen

Läs mer

Grupparbete om PBL Problembaserat Lärande

Grupparbete om PBL Problembaserat Lärande TÄRNA FOLKHÖGSKOLA Grupparbete om PBL Problembaserat Lärande 2009-09-18 - 2 - Innehåll Bakgrund... - 3 - Syfte... - 4 - Metod... - 4 - Fakta... - 5 - Resultat... - 7 - Diskussion... - 9 - Referenser...-

Läs mer

Visionen om att lära eleverna engelska under mattelektionen hur fungerar den i verkligheten?

Visionen om att lära eleverna engelska under mattelektionen hur fungerar den i verkligheten? Visionen om att lära eleverna engelska under mattelektionen hur fungerar den i verkligheten? Liss Kerstin Sylvén, fil.dr i engelska I Sverige talar de flesta av oss svenska. Svenskan är ett litet språk.

Läs mer

Fraser, huvuden och bestämningar

Fraser, huvuden och bestämningar UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

Lägga till olika dokument i en fil

Lägga till olika dokument i en fil Lägga till olika dokument i en fil Om du vill kombinera flera dokument och göra en enda fil kan du kopiera och klistra in innehållet från alla dokumenten i en enda fil. Eller så kan du öppna det första

Läs mer

Problem att fundera över

Problem att fundera över Problem att fundera över Här får du öva dig på att formulera en förmodan och försökabevisaden. Jag förväntar mig inte att du klarar av att gå till botten med alla frågorna! Syftet är att ge dig smakprov

Läs mer

Skriva berättande texter

Skriva berättande texter Skriva berättande texter Skriva berättande texter stavning, stor bokstav och punkter styckeindelning och struktur utvecklade svar textbindning och ett varierat språk grammatik Stavning, stor bokstav och

Läs mer

Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01

Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har

Läs mer

Lässvårigheter, språklig förmåga och skolresultat i tidiga skolår. Maria Levlin, lektor i språkvetenskap/leg logoped Institutionen för språkstudier

Lässvårigheter, språklig förmåga och skolresultat i tidiga skolår. Maria Levlin, lektor i språkvetenskap/leg logoped Institutionen för språkstudier Lässvårigheter, språklig förmåga och skolresultat i tidiga skolår Maria Levlin, lektor i språkvetenskap/leg logoped Institutionen för språkstudier Bakgrund Språkutvecklingen i förskolan påverkar tidig

Läs mer

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Kursplan: SVENSKA Ämnets syfte Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Förmåga att tala inför andra på ett sätt som är lämpligt i kommunikationssituationen

Läs mer

Centralt innehåll Centralt innehåll för årskurserna 1-3 Kommunikation Texter

Centralt innehåll Centralt innehåll för årskurserna 1-3 Kommunikation Texter 1 Under rubriken Kunskapskrav kommer det så småningom finnas en inledande text. Den ska ge en övergripande beskrivning av hur kunskapsprogressionen ser ut genom årskurserna och mellan de olika betygsstegen.

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Styrdokumentkompendium

Styrdokumentkompendium Styrdokumentkompendium Information och kommunikation 2 Sammanställt av Joni Stam Inledning Jag brukar säga till mina elever, halvt på skämt och halvt på allvar, att jag förhåller mig till kursens centrala

Läs mer

En nybörjarkurs i kritiskt tänkande

En nybörjarkurs i kritiskt tänkande En nybörjarkurs i kritiskt tänkande Jesper Jerkert Andreas Anundi & CJ Åkerberg: Skeptikerskolan. Handbok i kritiskt tänkande. Stockholm: Forum, 2010, 226 s. ISBN 978-91-37-13588-5. Andreas Anundi och

Läs mer

2012-01-12 FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

2012-01-12 FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ Kemi, 150 verksamhetspoäng Ämnet handlar om vad olika ämnen består av, hur de är uppbyggda, vilka egenskaper de har och vad som händer när de kommer i kontakt med varandra, om materiens egenskaper, struktur

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Just nu pågår flera satsningar för att förbättra svenska elevers måluppfyllelse

Just nu pågår flera satsningar för att förbättra svenska elevers måluppfyllelse Andersson, Losand & Bergman Ärlebäck Att uppleva räta linjer och grafer erfarenheter från ett forskningsprojekt Författarna beskriver en undervisningsform där diskussioner och undersökande arbetssätt utgör

Läs mer

1-6:an skriver sig till läsning läsåret 2006-2007.

1-6:an skriver sig till läsning läsåret 2006-2007. Utvärdering av projektet 1-6:an skriver sig till läsning läsåret 2006-2007. Teknisk utrustning. Vi startade ht 2005 med att få nya datorer till gupp 1 och grupp 3. Platta skärmar installerades i alla 3

Läs mer

SVENSKA. Ämnets syfte. Kurser i ämnet

SVENSKA. Ämnets syfte. Kurser i ämnet SVENSKA Kärnan i ämnet svenska är språk och litteratur. Språket är människans främsta redskap för reflektion, kommunikation och kunskapsutveckling. Genom språket kan människan uttrycka sin personlighet,

Läs mer

Läkemedelsverket. Det nationella Läkemedelsverket

Läkemedelsverket. Det nationella Läkemedelsverket Inblick Läkemedelsverket Maj 2015 Foto: Helena Mohlin Läkemedelsverket, EMA och framtiden Artikeln baseras på en intervju med Tomas Salomonson som är ordförande i CHMP, den europeiska läkemedelsmyndigheten

Läs mer

1) Introduktion. Jonas Aspelin

1) Introduktion. Jonas Aspelin 1) Introduktion Jonas Aspelin Uttrycket relationell förekommer i många sammanhang. Man talar till exempel om relationell psykoterapi, relationell estetik, relationell sociologi och relationell psykologi.

Läs mer

Granskning av kvaliteten på de skriftliga omdömena i grundskolan

Granskning av kvaliteten på de skriftliga omdömena i grundskolan Alla elever ska nå målen! E-post: info@infomentor.se Telefon: 044-200 123 Granskning av kvaliteten på de skriftliga omdömena i grundskolan Kvalitativ analys, mars 2012 InfoMentor Kvalitativ analys av skriftliga

Läs mer

Fisketurism. Inspirationsträff för ännu bättre fisketurism i Sjuhärad

Fisketurism. Inspirationsträff för ännu bättre fisketurism i Sjuhärad Fisketurism Inspirationsträff för ännu bättre fisketurism i Sjuhärad Rådde gård onsdag 8 januari 2014 Inspirationsträff om fisketurism arbetsgrupp skapad för fortsatt analys Ett 60-tal personer samlades

Läs mer

Att arbeta med öppna uppgifter

Att arbeta med öppna uppgifter Modul: Samband och förändring Del: 1 Öppna uppgifter Att arbeta med öppna uppgifter Ingemar Holgersson, Högskolan Kristianstad Kursplanen i matematik betonar att undervisningen ska leda till att eleverna

Läs mer

Förskoleenkäten 2015 Förskoleförvaltningen

Förskoleenkäten 2015 Förskoleförvaltningen Förskoleenkäten 2015 Förskoleförvaltningen Datum: Version: Ansvariga: Förvaltning: Enhet: 2015-06-04 1.0 Christina Persson & Jimmie Brander Förskoleförvaltningen Kvalitetsenheten Innehållsförteckning Inledning...

Läs mer

Facit för diagnostiska provet i grammatik

Facit för diagnostiska provet i grammatik Facit för diagnostiska provet i grammatik Textutdrag: De tio vanligaste namnen på honhundar i Sverige är också vanliga kvinnonamn. Mest sällsynt är Bella med 1065 bärare, men åtskilliga av landets 11 954

Läs mer

På jakt med geocaching

På jakt med geocaching På jakt med geocaching Text: Lena Lithén & Kamilla Aspgren-Kvarnström (Publicerad i Förskoletidningen, 2014) På förskolan Uppfinnaren i Gävle geocachar barnen tillsammans med trollet Trulle. Detta efter

Läs mer

Allmän studieplan för doktorsexamen i engelska

Allmän studieplan för doktorsexamen i engelska = Allmän studieplan för doktorsexamen i engelska Studieplanen är fastställd av humanistiska fakultetsnämnden vid Göteborgs universitet den 18 januari 2008. Studieplanen kompletteras med följande dokument,

Läs mer

Hur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk

Hur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk Beteckning: Institutionen för humaniora och samhällsvetenskap Hur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk Emma Selin December 2009 Examensarbete med didaktisk

Läs mer

Datavetenskapliga programmet, 180 hp

Datavetenskapliga programmet, 180 hp HÖGSKOLAN I GÄVLE UTBILDNINGSPLAN GRUNDNIVÅ DATAVETENSKAPLIGA PROGRAMMET Programkod: TGDAK Inriktningskod IT-arkitekt: ITAR Inriktningskod visiomatik: VISI Fastställd av NT-nämnden 2006-09-21 Reviderad

Läs mer