Projektförslag. Datalingvistisk projektkurs VT mars 2007

Relevanta dokument
Att lära sig skriva i IT-samhället

Att lära sig skriva i IT-samhället

Att skriva i nya medier. Innebär det anpassning, försämring eller förändring? Översikt. Forskningsbakgrund. Projektet. Ursprunget till projektidén

Introduktion till språkteknologi. Datorstöd för språkgranskning

Skrivaktivitet på fritiden textproduktion ungefär samma och av samma typ:

Skriftspråk i förändring möter förlegade skrivstöd

TextIT Hjälp. Om du vill ha all text uppläst trycker du på knappen spela

En samling fårskallar

Så här fungerar Stava Rex

Projektets syfte. Att lära sig skriva i IT-samhället. Forskningsfrågor, forts. Forskningsfrågor. Hur skriver barn? Ursprunget till projektidén

En arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ

X-jobbs katalog. Medius R&D November 2011

Lässvårigheter och språklig förmåga en studie om lässvårigheter i tidiga skolår

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.

Exjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson

Innehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG

Teoretisk lingvistik och datalingvistik. Robin Cooper

Kursplaneöversättaren. Lina Stadell

EXAMENSARBETE. Norska medborgares förvärv av småhusfastigheter inom vissa kommuner i Bohuslän, Dalsland och Värmland

Att lära sig skriva i IT-samhället Vetenskapsrådet

SLAVISKA MEDELTIDSSTUDIER Masterexamen 120 hp

Språkteknologi och Open Source

Föreläsningens upplägg. Språket, individen och samhället HT Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)

Vad är ett examensarbete?

TIG085, IKT och specialpedagogik som stöd för lärande, 15 högskolepoäng

Olika slags datornätverk. Föreläsning 5 Internet ARPANET, Internet började med ARPANET

Kom igång med SpellRight

IKT SOM. Kursmoment. Digital nagves. Tillgång Gll tekniken. Digitala klyjor PEDAGOGISKT VERKTYG - I LÄSNING OCH SKRIVANDE 4/6/10

Engelska. Programkurs 30 hp English 973G06 Gäller från: Fastställd av. Fastställandedatum. Styrelsen för utbildningsvetenskap

Litteraturlista ht10 ALLMÄN SPRÅKVETENSKAP och FONETIK. GRUNDKURS Period Period 1

Tal- och skriftspråksutveckling i förskola och förskoleklass 15 högskolepoäng, Grundnivå 2

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Disposition, Att läsa och skriva. Modeller för word recognition / ordigenkänning Behrns, Oslo, Att läsa och skriva

svenska som andraspsråk

Distansundervisning. Anna Anu Viik. tel +46(0) Facebook: Modersmål Sverige

Metod och material. Etnografisk ansats. Fältarbete: 3 klasser, 2 skolor, 42 lektioner

Fastställande. Allmänna uppgifter. Kursens mål

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

Elektronisk referenstjänst Fråga biblioteket

svenska kurskod: sgrsve7 50

Välkommen till. Särskild utbildning för vuxna i Trelleborg

Kort om World Wide Web (webben)

TEACHING AND LECTURING

SC1210, Sociologi: Klass, kön, etnicitet, 15,0 högskolepoäng Class, Gender, Ethnicity: Sociological Perspectives, 15.0 higher education credits

Tekniken bakom språket

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Lyssna på nätet med Social Media Analytics

Examensarbete hos företag

Appar och funktioner för smarta mobiler och lärplattor

IT-FAKULTETSNÄMNDEN. Grundnivå/First Cycle

Matris i engelska, åk 7-9

L6EN20, Engelska 2 för lärare åk 4-6, 15,0 högskolepoäng English 2 for Teachers, 4th-6th grade, 15.0 higher education credits

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Elevers användning av maskinöversättning vid skrivande på främmande språk.

Den digitala världen hot eller möjlighet för det lilla barnet? Fil Dr Susanne Kjällander

Lathund för SpellRight

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA

Elevernas skriftspråkande i skolan och nya medier

TDDD92 Artificiell intelligens -- projekt

Kursplan. EN1088 Engelsk språkdidaktik. 7,5 högskolepoäng, Grundnivå 1. English Language Learning and Teaching

Institutionen för individ och samhälle Kurskod SAF200

Digital Conversion Manager

Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson

Introduktion till biblioteket och informationssökning Språk och litteraturer

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap

Kunskapsgraf. Fredrik Åkerberg Tommy Kvant 1 Introduktion. 2 Relaterade projekt.

Att lära sig skriva i IT-samhället

Abelin, Å. (1999) Studies in Sound Symbolism Gothenburg Monographs in Linguistics 17. Göteborg, 279 sid.

Språk, kommunikation och kontakt avgörande för vårdmötets kvalitet. Lorna Bartram

MÖTESPLATS INFÖR FRAMTIDEN. Borås 8-9 oktober Helena Söderlund, Länsbiblioteket i Örebro län

Använda Stava Rex i Word 2010

Matris för engelska, åk 7-9

Kartläggning och bedömning av nyanlända elevers kunskaper och språkutveckling

SKRIV HANDLEDNING ELLER SKRIVHANDLEDNING? Maria Nyman, CSK

Beslut om tilldelning av MFS stipendier för år 2012, per lärosäte och institution.

Att använda Stava Rex i Word 2007

Språkgranskningsverktyg. F1: Introduktion

Answers submitted by 8/21/ :27:00 AM (1.22:32:05)

Österlengymnasiet

LÄRARUTBILDNINGSNÄMNDEN. Avancerad nivå/second Cycle

Examensarbete i Diagnostisk Cytologi (15hp)

SASKO, Masterprogram i strategisk kommunikation, 120 högskolepoäng Master of Science Programme in Strategic Communication, 120 credits

Använda SpellRight 2 i Word 2010

Utbildning och forskning i somaliska

Samhället och skolan förändras och matematikundervisningen som den

Svenska som andraspråk för lärare åk hp (1-30). Ingår i lärarlyftet

Svenska som andraspråk för lärare åk 7-9, 45 högskolepoäng (1-45 högskolepoäng). Ingår i Lärarlyftet II.

Word- sense disambiguation

Teknikens inflytande på lågstadieelevers skriftspråk

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

MER FÖRÄNDRING NÄSTA 20 ÅR ÄN GENOM HELA VÅR HISTORIA

Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011

Nyhetsbevakning och Information Retrieval. Utvärdering av nyhetsbevakningssystem. Syfte med IR-system. Vilket system är bättre?

Användarstudie utav GRIM på SFI (Svenska För Invandrare)

RY1101, Ryska, grundkurs, del 1, 15,0 högskolepoäng Russian, Introductory Course, Part 1, 15.0 higher education credits

Mälardalens högskola

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 4. Peter Dalenius Institutionen för datavetenskap

Nationella prov och anpassning.

Dialogue Technologies April 2005

Samarbete Stockholms Universitet, Barn och Ungdomsvetenskap & Nackas kommunala förskolor

Transkript:

Projektförslag Datalingvistisk projektkurs VT 2007 26 mars 2007

Möjliga projekt Utvärdering Att utvärdera ett befintligt program/system utifrån ett datalingvistiskt perspektiv. Exempel: Utvärdera hur ett befintligt system hanterar stavfel i texter skrivna av skolelever Användarstudie Att utvärdera ett befintligt program/system utifrån ett användarperspektiv, dvs. utifrån de behov och krav en användare har. Exempel: Att låta användare lösa olika uppgifter i ett befintligt skrivsystem Projektförslag VT 2007 1

Möjliga projekt (forts) Implementation Att bygga ett enkelt system eller del av ett system, eller implementera en algoritm som hanterar en viss typ av data. Exempel: Stavningskontroll för barnspråk Språkträningsprogram Översätta chatt-/mejlspråk till vanlig svenska Projektförslag VT 2007 2

Utvärdering Stavfel i skolelevers texter Att utvärdera hur ett program för stavningskontroll (t.ex. Word, StavaRätt, Granska) hanterar vanliga stavfel i texter skrivna av skolelever. Uppgiften består i att utifrån en samling skoltexter generera och kategorisera stavfel, testa texterna med stavningskontrollen och analysera resultaten. Analysen ska svara på frågor som: Vilka sorters fel klarar systemet av/inte av? Varnar systemet för fel som inte är fel? Litteratur: Nauclér, K. (1980). Perspectives on misspellings. A phonetic, phonological and psycholinguistic study. Liber Läromedel, Lund. Kukich, K. (1992) Techniques for automatically correcting words in text. ACM Computing Surveys, 24(4): 377-439. Projektförslag VT 2007 3

Användarstudie Att lösa uppgifter i ett skrivsystem Att utvärdera hur användare löser olika slags uppgifter i ett system (t.ex. Word, Grimm, T9 för SMS). Först måste målgruppen definieras (barn, vuxna, annat modersmål). En grupp ska väljas ut, helst så representativ som möjligt, även om det är svårt att få det helt bra. Uppgifterna måste också definieras. Exempel på uppgifter kan vara att rätta stavfel i en befintlig text, skicka ett SMS med ett givet innehåll, etc. Mätmetoderna ska också definieras vilka egenskaper vill ni (kan ni) mäta? Exempel är: hur lång tid tar det? hur många raderingar och/eller förflyttningar görs i texten? Slutligen ska resultaten analyseras. Projektförslag VT 2007 4

Implementation Stavningskontroll för barnspråk Att implementera en eller flera algoritmer för stavningskontroll, speciellt för att rätta vanliga fel i texter skrivna av skolbarn. Uppgiften består i att utifrån en samling skoltexter generera och kategorisera stavfel, undersöka existerande stavningsalgoritmer och implementera egen algoritm som hanterar de stavfel vanligt förekommande i skoltexter. Algoritmen testas sedan mot en testkorpus och analyseras utifrån hur täckande (recall) och precisa (precision) resultaten blev. Många implementerade stavningsalgoritmer beskrivs och kan hämtas direkt på Internet. Läs gärna litteraturen och leta sedan. Projektförslag VT 2007 5

Stavningskontroll (forts) Litteratur: Nauclér, K. (1980). Perspectives on misspellings. A phonetic, phonological and psycholinguistic study. Liber Läromedel, Lund. Kukich, K. (1992) Techniques for automatically correcting words in text. ACM Computing Surveys, 24(4): 377-439. Gladh, U. och Karlsson, M. (2002) TANGO TANdemstrukturerade stavningsalgoritmer med taggning av Grammatik och stavning samt Ontologi. Examensarbete i datalingvistik, Göteborgs universitet. Projektförslag VT 2007 6

Implementation CALL / språkträning Att implementera ett program för att lära sig ett språk. Ett förslag är att göra meningar med hål, och låta användaren välja ord från en lista och böja med korrekt morfologi. Meningarna specificeras som en korpus, och hålen ska väljas ut slumpmässigt bland de möjliga platser som finns. Vill man automatisera uppgiften helt och hållet kan man utgå från en stor korpus, och välja ordförslag efter vilka ord som inte kan förekomma på samma plats i den kontexten. Det finns mängder med information om CALL på nätet. En möjlig utgångspunkt är Wikiboken ATALL (http://en.wikibooks.org/wiki/atall), som ger massor av exempel på hur språkträningsmoduler kan se ut. Projektförslag VT 2007 7

Implementation Chattomvandlare Att implementera ett program som översätter chattspråk/mejlspråk till vanlig svenska. Först måste en korpus med chatt-/mejl-/mejllista-texter samlas in och analyseras. Vilka är de vanliga förkortningarna, smileys, talspråksuttrycken, slanguttrycken? Sedan ska en applikation tillverkas: Ett förslag är att göra ett program som läser in en text (t.ex. en HTML-sida) och taggar alla specialuttryck som förkortningar i HTML, tillsammans med en förklaring. Ett annat förslag är att översätta texten till mer utförlig standardsvenska. Projektförslag VT 2007 8

Chattomvandlare (forts) Litteratur: Hård af Segerstad, Y. och Sofkova Hashemi, S. (2005). Skrivandet, nya media och skrivstöd hos grundskoleelever. Tidskrift för lärarutbildning och forskning, Inst. för svenska och samhällsvetenskapliga ämnen, Umeå universitet. Hård af Segerstad, Y. (2002). Use and Adaptations of Written Language to the Conditions of Computer-Mediated Communication. Doctoral dissertation. Gothenburg Monographs in Linguistics 22. Department of Linguistics, Göteborg University. Projektförslag VT 2007 9