Datorbaserade verktyg i humanistisk forskning

Storlek: px
Starta visningen från sidan:

Download "Datorbaserade verktyg i humanistisk forskning"

Transkript

1 Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet [email protected]

2 Föreläsningsöversikt Vad är en korpus? Vad är korpuslingvistik? Varför korpuslingvistik? Sökmotorer och korpussökning på Internet Upphovsrätt Nätresurser (ordböcker och online-databaser) Dagens labb

3 Vad är en korpus? Korpus av latinets corpus = kropp Nationalencyklopedins definition: text eller texter som är föremål för språkvetenskapliga studier, i synnerhet med hjälp av dator Samling språkliga data som: o består av en samling skrivna texter eller transkriptioner av talspråk o är mer eller mindre representativt för språket i fråga o lagras elektroniskt Internet = Världens största korpus!

4 Vad är korpuslingvistik? Huvudsyftet med en korpus är att verifiera hypoteser om språket, t.ex. att undersöka hur ett visst ljud, ord eller syntaktisk konstruktion faktiskt används: När började man skriva ''mejl'' istället för ''mail''? Säger man ''bättre än jag'' eller ''bättre än mig''? Gammal idé (dialektstudier, studier av utdöda språk etc.) Förverkligad genom modern teknik (framfart sedan 80- talet)

5 Varför korpuslingvistik? Objektiv lingvistik: Man studerar språket som det används i verkligheten (ej påhittade exempel) Enda sättet att undersöka frekvens i språkbruket Talforskning (talspråkskorpusar): prosodi, ålder, klass, kön etc. Korpusbaserad grammatik: empiriska data för att testa hypoteser om grammatik Historisk lingvistik: diakroniska korpusar för jämförande studier ur olika tidsepoker

6 Korpusannotering/taggning Att märka upp korpusen med lingvistisk information, ex: Ordklass (part-of-speech) Böjningsinformation (morfo-syntaktisk information) Lemma (grundform, d.v.s. uppslagsord i lexikon) Syntax Fonetik (uttal) - transkription Semantik Annoteringen kan göras för hand eller automatiskt.

7 Olika korpustyper Skriftspråkskorpusar Talspråkskorpusar Balanserade korpusar Består av olika texttyper i bestämda proportioner, avsett att representera ett språk eller en aspekt av ett språk. Monitorkorpusar Korpusen växer ständigt. Möjliggör studier av hur språkbruket förändras över tiden.

8 Fler korpustyper Trädbanker - Grammatiskt uppmärkta korpusar Flerspråkiga korpusar Innehåller texter på flera olika språk. Två undertyper: jämförbara korpusar (Samma texttyper på flera olika språk) parallellkorpusar (Samma texter på flera olika språk) Specialkorpusar Korpusar som utvecklats för att studera en viss språktyp, t.ex. ungdomsspråk eller fornengelska.

9 Välkända korpusar Engelska BNC (British National Corpus, 100 milj ord) Brown corpus (1 milj ord) Svenska SUC (Stockholm-Umeå Corpus, 1 milj ord) PAROLE (19 milj ord) Flerspråkiga Hansard (Kanadensiska parlamentstexter på engelska och franska) EUROPARL (Europaparlamentstexter på EU-språk) JRC-Acquis (Lagtexter från EU)

10 Hur hittar man korpusar på Internet? Sökning med hjälp av sökmotor o lämpliga sökord o lämplig sökmotor Leta hos tillgänglig korpusdistributör, t.ex. Linguistic Data Consortium Samla ihop texter till en egen korpus...

11 Sökmotorer och korpussökning på Internet Informationssökning o att söka upp dokument som är relevanta för det som användaren efterfrågar o Sökmotorer, ex: Google, AltaVista Informationsextraktion o att dessutom svara på en fråga som användaren ställer o ex: Ask Jeeves,

12 Ask Jeeves

13 Avancerad sökning med Google

14 Informationssökning hur fungerar det? Ledtrådar som sökmotorer använder för att få fram och rangordna dokument: o nyckelord och frekvensberäkningar i de hittade texterna o automatisk morfologisk analys för att hitta alla ordformer, t.ex. flicka-flickor-flickornas o automatisk stavningskontroll

15 Korpusdistributörer Linguistic Data Consortium (LDC): o stödjer språkrelaterad forskning, utbildning och teknologi genom att skapa och distribuera lingvistiska resurser: data, verktyg och standarder o distribuerar korpusar (text och tal för många olika språk), lexikon etc. Oxford Text Archive (OTA): o samlar in, katalogiserar och bevarar elektroniska texter av hög kvalitet för forskning och undervisning o distribuerar mer än 2000 resurser för över 20 språk.

16 Korpusdistributörer European Language Resources Association (ELRA): Evaluations and Language Resources Distribution Agency (ELDA): o Distribuerar, producerar, standardiserar och utvärderar språkresurser (lexikon, korpusar etc) o Organiserar konferenser: The Language Resources and Evaluation Conference, LREC o Ger underlag för utvärdering av olika applikationer

17 Korpusdistributörer International Computer Archive of Modern English (ICAME): osamordnar och underlättar distribution av korpusar oorganiserar konferens, ger ut tidskriften ICAME Journal TELRI: osamlar in och distribuerar en- och flerspråkiga språkresurser med speciellt fokus på central- och östeuropeiska språk.

18 Användbara länkar för den korpusintresserade CORPORA-listan: oelektronisk mejlinglista för alla som är intresserade av korpusar ohär kan man få tips och svar på frågor ACL SIGLEX: Special Interest Group on the Lexicon of the Association for Computational Linguistics olänkar till elektroniska lexikon, korpusar etc.

19 Bygg din egen korpus Välj ut lämpliga nyckelord och kombinera dessa på bästa sätt i lämplig sökmotor Samla ihop de webbadresser du fått fram och sätt ihop dem till din egen korpus Ordklasstagga gärna din korpus med allmänt tillgänglig taggare Var laglig: Tänk på upphovsrätten!

20 Tänk på upphovsrätten! Vilka lagar gäller för material som man hittar på nätet? Bara för att en text är publicerad på Internet, så betyder det inte att den är fri att använda och sprida vidare! Upphovsrätt till ett verk gäller intill utgången av sjuttionde året efter det år då upphovsmannen avled eller [...] efter den sist avlidne upphovsmannens dödsår. Många korpusar som finns på Internet kräver licens för att man ska få tillgång till dem

21 Vad säger lagen? Du kan alltid ladda hem ett verk som finns tillgängligt på Internet, kopiera från digital till digital form och/eller skriva ut det om du endast gör det för ditt privata bruk. Förlagan du kopierar från får inte vara en olovlig förlaga (piratkopia). Du får inte sprida det kopierade exemplaret utanför din närmaste familj eller vänkrets. Du får aldrig, inte ens för privat bruk, kopiera datorprogram eller databaser.

22 Upphovsrätt på Internet Problem med lagtolkningen: Internet är internationellt, medan upphovsrättslagarna ser olika ut i olika länder Indien: Ett verk är skyddat i 60 år efter upphovsmannens död (jmf Sverige 70 år) Internationella överenskommelser om upphovsrätt, t.ex. Bernkonventionen (Victor Hugo, 1880-talet) Kuba: Har ej skrivit under Bernkonventionen, upphovsrätten inget skydd

23 Ordböcker och online-databaser (1) Ontologier o Betydelsebaserade lexikon o Visar de semantiska relationerna mellan ord (synonymi, antonymi, hyponymi och meronymi) o WordNet: o Svenskt OrdNät: o EuroWordNet: holländska, italienska, spanska, tyska, franska, tjeckiska och estniska

24 Ur Svenskt Ordnät av Åke Viberg: Grundläggande semantiska relationer i ordnät

25 WordNet

26 Svenskt OrdNät

27 Ordböcker och online-databaser (2) Thesaurusar/synonymordböcker Flerspråkiga lexikon Lexin: o Framtaget av Myndigheten för skolutveckling för användning i invandrarundervisningen o Cirka svenska uppslagsord o Fjorton olika språk o De svenska orden kan man få upplästa (öva uttal)

28 synonymer.se

29 Lexin

30 Ordböcker och online-databaser (3) Enspråkiga lexikon Nationalencyklopedin: o ca uppslagsord o kräver licens Oxford English Dictionary: o ca uppslagsord o innehåller ord från hela engelskspråkiga världen o visar etymologi, uttal och stavning o autentiska exempel från texter o kräver licens

31 Nationalencyklopedin (NE)

32 Oxford English Dictionary (OED)

33 Ordböcker och online-databaser (4) Databaser med samlat material Språkbanken: outvecklat av Göteborgs universitet otillhandahåller referensmaterial i form av lexikon, korpusar och verktyg för sökning i korpusarna m.m. oinnehåller bl.a. Lexin, SUC-korpusen och Svenska Akademiens Ordbok i datorläsbar form

34 Språkbanken

35 Ordböcker och online-databaser (4) Korpussamlingar Gutenberg: o innehåller ca fritt nedladdbara e-böcker o när författaren har varit död i 70 år skyddas verket inte längre av upphovsrättslagarna Runeberg: o som Gutenberg, fast för nordisk litteratur o skapat av Linköpings universitet Gallica: o fransk motsvarighet

36 Runeberg

37 Gallica

38 Labben Deluppgift 1: Ta reda på mer om några av de mest kända korpusdistributörerna Deluppgift 2: Hitta korpusar på Internet för det språk ni är intresserade av Labbinstruktioner:

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet [email protected] Föreläsningsöversikt Sökmotorer

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Föreläsning 1: Introduktion till korpuslingvistik [email protected] 1 Kursplan - Syfte 5 poäng, grundnivå, huvudområde: språkteknologi Syfte: Kursen skall förmedla

Läs mer

Elementära verktyg för korpusbearbetning

Elementära verktyg för korpusbearbetning Elementära verktyg för korpusbearbetning Föreläsning 1: Introduktion till korpuslingvistik [email protected] 1 Kursplan - Syfte 5 poäng. Ämne: Språkteknologi. Nivå: A Syfte: Kursen behandlar

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik [email protected] 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE Språteknologi på SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE digital kompetens kring ordböcker, språkkontroller, korpusar och söktjänster! Följer teknikens påverkan på språk och språkanvändning! Bevakar språkteknisk

Läs mer

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik?

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik? Metoder och tillämpningar inom språkteknologin - ht 07 Korpuslingvistik Innehåll Vad är en korpus? Vad är korpuslingvistik? Korpusurval och sammanställning Annotering Korpusexempel Parallellkorpusar Internet

Läs mer

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31) Korpusannotering Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi [email protected] Korpusannotering 1(31) Förra gången Att bygga en korpus sampling uppmärkning annotering

Läs mer

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41) Korpusar Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi [email protected] Korpusar 1(41) Förra gången Kursinformation Empiriska studier av språk Kvantitativa vs.

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik [email protected] 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga data Används traditionellt om alla verk av en viss typ,

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 [email protected] 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik [email protected] 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi

Läs mer

Kort presentation av Korp, Sveriges nationalkorpus

Kort presentation av Korp, Sveriges nationalkorpus Kort presentation av Korp, Sveriges nationalkorpus Göteborgs universitet 19 januari 2017 vid Avdelningen för nordiska språk, L Orientale-universitetet i Neapel Fil.dr. i slaviska språk. Undervisat i slovenska,

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI Mats Lundälv Senior IKT-pedagog f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM Det fria ordet och AKK / ASK Kommunikativ och språklig tillgänglighet för alla...byggt på en infrastruktur av fria

Läs mer

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad? Språkbanken: lite historia Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur Lars Borin Språkbanken/svenska språket, Göteborgs universitet Giellatekno, UiT 19/2 2014 1970: första

Läs mer

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1

Läs mer

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp UNIVERSITY OF Richard Johansson November 11, 2015 dagens presentation sökverktyget Korp Språkbankens korpusar: vilka nns och hur

Läs mer

Att söka information (med betoning på Internet)

Att söka information (med betoning på Internet) Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson [email protected] 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019 Labb 1: KORP vid

Läs mer

Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet

Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet SALETEK-möte Jokkmokk, 13 14 juni 2004 vad är en korpus? korpusar är (stora) textsamlingar

Läs mer

ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle

ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Humanistiska och teologiska fakulteterna ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av Prodekanen med ansvar för grundutbildning

Läs mer

Introduktion till språkteknologi. Datorstöd för språkgranskning

Introduktion till språkteknologi. Datorstöd för språkgranskning Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Föreläsning 4: Korpussökning Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet [email protected] Föreläsningsöversikt Språkbanken

Läs mer

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019) 729G49 Språk och datorer (2019) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Detta verk är licensierat under en Creative Commons Erkännande 4.0 Internationell Licens. Filosofi Psykologi

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Kursintroduktion 2015-04-08 Lars Ahrenberg 1 Plan Kursens innehåll och organisation Text, språk och datorer Textformat och textrepresentationer Korpuslingvistik

Läs mer

KN - Seminarium. (Litteratursökning)

KN - Seminarium. (Litteratursökning) KN - Seminarium (Litteratursökning) Elektroniska medier Åbo Akademis bibliotek http://www.abo.fi/library/dbs Virtuellt bibliotek / länksamling för sökning på internet Referensdatabaser, som innehåller

Läs mer

ÄEND02, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle

ÄEND02, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Humanistiska och teologiska fakulteterna ÄEND02, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av Prodekanen med ansvar för grundutbildning

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019 Labb 1: KORP vid

Läs mer

Målet är att ge maskiner förmågan att plocka ut information ur

Målet är att ge maskiner förmågan att plocka ut information ur Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna

Läs mer

Tekniken bakom språket

Tekniken bakom språket Tekniken bakom språket Red. Rickard Domeij Småskrift utarbetad av SPRÅKRÅDET 2008 NORSTEDTS AKADEMISKA FÖRLAG INNEHÅLL Språkteknologi för språken i Sverige 13 Rickard Donieij Tekniken bakom språket 13

Läs mer

Korpusar och deras användning

Korpusar och deras användning Korpusar och deras användning Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi [email protected] Korpusar och deras användning 1(39) Förra gången Studiet av språk

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata

Läs mer

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas

Läs mer

Semantik. Semantik och språkteknologi

Semantik. Semantik och språkteknologi Semantik Semantik studiet av innebörd(mening) Går tillbaka till Platon (dialogen Kratylos) Relationen språk verklighet Betydelsen av ett ord är dess användning i språket (Wittgenstein) Semantik och språkteknologi

Läs mer

Våren 2010. Nationalencyklopedin. Avancerad guide

Våren 2010. Nationalencyklopedin. Avancerad guide Nationalencyklopedin Avancerad guide Nationalencyklopedin Våren 2010 Nationalencyklopedins uppdrag är att sprida kunskap, texterna är skrivna av drygt 4 000 experter och bearbetad av redaktionen. På nätet

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

1.1: allmänt om korpuslingvistik. Lars Borin. Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet

1.1: allmänt om korpuslingvistik. Lars Borin. Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet 1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet korpuslingvistiska metoder och verktyg i andraspråksforskning forskarutbildningskurs HT

Läs mer

vad är korpuslingvistik? (stora) textsamlingar, 1 (stora) textsamlingar, och annoterade... sammanställda... så, korpuslingvistik innebär:

vad är korpuslingvistik? (stora) textsamlingar, 1 (stora) textsamlingar, och annoterade... sammanställda... så, korpuslingvistik innebär: 1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet vad är korpuslingvistik? korpusar är (stora) textsamlingar, sammanställda och annoterade

Läs mer

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb.

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb. Att söka information Marie Gustafsson [email protected] Dagens föreläsning: Att söka vetenskaplig litteratur Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga

Läs mer

Introduktion till biblioteket och informationssökning Språk och litteraturer

Introduktion till biblioteket och informationssökning Språk och litteraturer Introduktion till biblioteket och informationssökning Språk och litteraturer HT 2014 Göteborgs universitetsbibliotek Humanistiska biblioteket Böcker och tidskrifter inom humaniora Kursböcker inom de humanistiska

Läs mer

Att skriva en språkvetenskaplig uppsats. Ingmar Söhrman

Att skriva en språkvetenskaplig uppsats. Ingmar Söhrman Att skriva en språkvetenskaplig uppsats Ingmar Söhrman [email protected] Ingen stor skillnad Språkvetenskap eller litteraturvetenskap skiljer sig inte åt beträffande struktur, men när det gäller

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Lässtrategier för att förstå, tolka och analysera texter från olika medier.

Lässtrategier för att förstå, tolka och analysera texter från olika medier. 2012-12-06 19:12 Sida 1 (av 11) ESS i svenska, Läsa och skriva Lässtrategier för att förstå, tolka och analysera texter från olika medier. Kapitel Läsa för att lära Kapitel Uppslagsboken Kapitel Uppslagsboken

Läs mer

Kursplan. Introduktion till översättning. Introduction to translation. Nordiska språk, engelska, franska, tyska

Kursplan. Introduktion till översättning. Introduction to translation. Nordiska språk, engelska, franska, tyska Kursplan Institutionen för humaniora Kurskod HUX 140 Dnr 04:81D Beslutsdatum 2004-08-16 Kursens benämning Engelsk benämning Undervisningsspråk Ämnen Introduktion till översättning Introduction to translation

Läs mer

Internets historia Tillämpningar

Internets historia Tillämpningar 1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle

Läs mer

Inledande programmering med C# (1DV402) Introduktion till C#

Inledande programmering med C# (1DV402) Introduktion till C# Introduktion till C# Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt innehåll i

Läs mer

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1 Lexikal semantik Lingvistik 1 Uppsala universitet 1 Nyckelord idag Semantiska egenskaper Komponentanalys Prototypteori Relationer mellan ord Kognitiv lexikal semantik Uppsala universitet 2 Semantiska egenskaper

Läs mer

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar.

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar. Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar. 1 Bibliotekets uppdrag i samarbete med utbildningen framgår i kursplanerna. 2 Se innehållet

Läs mer

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet

Läs mer

INFOKOLL. Formulera frågor Söka information

INFOKOLL. Formulera frågor Söka information INFOKOLL Att söka, bearbeta och presentera information på ett effektivt sätt är avgörande när du arbetar med projekt, temaarbeten och fördjupningar. Slutmålet är att du ska få ny kunskap och mer erfarenheter.

Läs mer

Vad är upphovsrätt och hur uppstår den? Hur lång är skyddstiden? Vad skyddas av upphovsrätten? Vad innebär symbolen?

Vad är upphovsrätt och hur uppstår den? Hur lång är skyddstiden? Vad skyddas av upphovsrätten? Vad innebär symbolen? S V E R I G E S F Ö R FAT TA R F Ö R B U N D I N F O R M E R A R O M U P P H OV S R ÄT T E N i Vad är upphovsrätt och hur uppstår den? Upphovsrättslagen ger upphovsmän ensamrätt att förfoga över sitt verk

Läs mer

Elevers användning av maskinöversättning vid skrivande på främmande språk.

Elevers användning av maskinöversättning vid skrivande på främmande språk. Elevers användning av maskinöversättning vid skrivande på främmande språk. Kent Fredholm, Karlstads och Uppsala universitet [email protected] Skolverkets språklärargala, Stockholm 8 december 2017 Personlig

Läs mer

Använd WordFinder från Mac App Store optimalt! Snabbguide med nyttiga tips och trix.

Använd WordFinder från Mac App Store optimalt! Snabbguide med nyttiga tips och trix. Använd WordFinder från Mac App Store optimalt! Snabbguide med nyttiga tips och trix. Tekniska förutsättningar För WordFinder från Mac App Store krävs följande: Processor: Intel Mac OS X 10.6.6 eller senare.

Läs mer

Terminsplanering i Svenska årskurs 9 Ärentunaskolan

Terminsplanering i Svenska årskurs 9 Ärentunaskolan På arbetar vi tematiskt med läromedlet Svenska Direkt. I årskurs 9 arbetar vi med arbetsområdena Konsten att påverka, Konsten att berätta, Konsten att söka och förmedla information, Praktisk svenska och

Läs mer

Centralt innehåll årskurs 7-9

Centralt innehåll årskurs 7-9 SVENSKA Språk är människans främsta redskap för att tänka, kommunicera och lära. Genom språket utvecklar människor sin identitet, uttrycker känslor och tankar och förstår hur andra känner och tänker. Att

Läs mer

Lathund för Gustavas ordböcker

Lathund för Gustavas ordböcker Lathund för Gustavas ordböcker Gustavas ordböcker har länge funnits som bok men finns även i digitalt format vilket underlättar för elever med läs- och skrivsvårigheter. Starta Gustavas ordböcker genom

Läs mer

Beslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden

Beslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden Utbildningsplan för Kandidatprogram i moderna språk Bachelor's Programme in Modern Languages 180.0 Högskolepoäng 180.0 ECTS credits Programkod: HMOLK Gäller från: HT 2015 Fastställd: 2015-03-05 Värdinstitution:

Läs mer

Upphovsrätten sätter maten på upphovsmannens bord

Upphovsrätten sätter maten på upphovsmannens bord Upphovsrätten sätter maten på upphovsmannens bord Var och en har rätt till skydd för de ideella och materiella intressen som härrör från vetenskapliga, litterära och konstnärliga verk till vilka han eller

Läs mer

Tabell 4. Indelningar av enskilda språk och språkfamiljer

Tabell 4. Indelningar av enskilda språk och språkfamiljer Tabell 4. Indelningar av enskilda språk och språkfamiljer 0 Tabell 4. Indelningar av enskilda språk och språkfamiljer Följande notation används aldrig ensam, men kan användas när tillfogningsanmärkning

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk behandlar olika former av kommunikation mellan människor. Kärnan i ämnet är språket och litteraturen. I ämnet ingår kunskaper om språket, skönlitteratur

Läs mer

Exempel på gymnasiearbete inom humanistiska programmet språk

Exempel på gymnasiearbete inom humanistiska programmet språk Exempel på gymnasiearbete september 2012 Exempel på gymnasiearbete inom humanistiska programmet språk Ungdomsspråk i spanska bloggar Elevens idé Calle är genuint språkintresserad. Han har studerat spanska,

Läs mer

729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp

729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp 729G17/729G66 Lexikal semantik och ordbetydelsebestämning Olika ordbegrepp Ordbetydelser Vad är ett ord? Lemman, lexem och betydelser Semantiska relationer Semantiskt strukturerade lexikon Hitta relationer

Läs mer

Den ständiga strömmen av människor, i boken s Ett barndomsminne, i boken s Skrivuppgift, i boken s

Den ständiga strömmen av människor, i boken s Ett barndomsminne, i boken s Skrivuppgift, i boken s Etablera Skriv är en övningsbok i att skriva och den riktar sig till flerspråkiga elever som studerar svenska som andraspråk. Den är lämplig för studerande på den senare delen av den grundläggande nivån,

Läs mer

PIM Lärresurser http://www.pim.skolutveckling.se/

PIM Lärresurser http://www.pim.skolutveckling.se/ PIM Lärresurser http://www.pim.skolutveckling.se/ Examination http://pimbevis.skolutveckling.se/ Nivå 1 Frågefilm om sökning på internet Inlämningsuppgift - Word dokument med bilder http://www.pim.skolutveckling.se/upload/pimpresentation.ppt

Läs mer

Digital inkludering i det uppkopplade samhället för grupper med speciella behov. Arne Jönsson Linköpings universitet och RISE SICS East

Digital inkludering i det uppkopplade samhället för grupper med speciella behov. Arne Jönsson Linköpings universitet och RISE SICS East Digital inkludering i det uppkopplade samhället för grupper med speciella behov Arne Jönsson Linköpings universitet och RISE SICS East Inkludering av alla medborgare i det digitala samhället Utlandsfödda

Läs mer

Det bästa är att kombinera flera olika metoder och källor. TIPS - för informationssökning på webben!

Det bästa är att kombinera flera olika metoder och källor. TIPS - för informationssökning på webben! Sök effektivt 1. Uppslagsböcker - i biblioteket eller på webben 2. Sök böcker direkt på hyllan eller använd ämnesdatabaser - eventuellt också tidningsartiklar 3. Länkbibliotek - kvalitetskontrollerade

Läs mer

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Eva Pettersson [email protected] 2016-11-09 Förra gången Kursmål och kursintroduktion Språkteknologiska tillämpningar OCR - Dialogsystem

Läs mer

Internet En enkel introduktion

Internet En enkel introduktion Internet En enkel introduktion Innehåll: Inledning 2 Datorns olika delar 3 Starta datorn 4 Hur du gör om du kan webbadressen 6 Hur du gör om du inte kan webbadressen 9 Kortfattad repetition 11 Jan Andrée

Läs mer

Lathund för webbpublicering av bilder

Lathund för webbpublicering av bilder Lathund för webbpublicering av bilder Innehåll Lathund för webbpublicering av bilder... 1 Vilka bilder får du publicera på webben?... 2 Bilder på Google... 3 Creative Commons bilder... 4 Bilder utan upphovsrätt

Läs mer

DET MODERNA SPRÅKSAMHÄLLET, 714G47 (1 30 HP). DELKURS 1. SPRÅK, SPRÅKANDE, SPRÅKVETENSKAP (7.5 hp)

DET MODERNA SPRÅKSAMHÄLLET, 714G47 (1 30 HP). DELKURS 1. SPRÅK, SPRÅKANDE, SPRÅKVETENSKAP (7.5 hp) STUDIEANVISNING DET MODERNA SPRÅKSAMHÄLLET, 714G47 (1 30 HP). DELKURS 1. SPRÅK, SPRÅKANDE, SPRÅKVETENSKAP (7.5 hp) FRISTÅENDE KURS SVENSKA SPRÅKET - SPRÅK, SPRÅKANDE, SPRÅKVETENSKAP 714G56 (7,5 HP) Kursansvariga:

Läs mer

Mer aktuell eller aktuellare? En korpusbaserad undersökning av svenskans adjektivkomparation de senaste årtiondena

Mer aktuell eller aktuellare? En korpusbaserad undersökning av svenskans adjektivkomparation de senaste årtiondena UPPSALA UNIVERSITET Institutionen för nordiska språk C-UPPSATS Svenska språket/nordiska språk Vt. 2009 AnnaMaria Tahlén Vaksalagatan 44 A 753 31 Uppsala [email protected] Mer aktuell eller

Läs mer

svenska kurskod: sgrsve7 50

svenska kurskod: sgrsve7 50 Svenska Kurskod: SGRSVE7 Språk är människans främsta redskap för att tänka, kommunicera och lära. Ämnet handlar om hur språket är uppbyggt och fungerar samt hur det kan användas. Kärnan i ämnet är språk

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Centralt innehåll. I årskurs 1 3

Centralt innehåll. I årskurs 1 3 75 3.17 Svenska Språk är människans främsta redskap för att tänka, kommunicera och lära. Genom språket utvecklar människor sin identitet, uttrycker känslor och tankar och förstår hur andra känner och tänker.

Läs mer

VADÅ UPPHOVSRÄTT? Att använda andras material i skolarbete

VADÅ UPPHOVSRÄTT? Att använda andras material i skolarbete VADÅ UPPHOVSRÄTT? Att använda andras material i skolarbete Hämtar du material från Internet till dina skolarbeten? Bränner du ditt färdiga arbete på en cd-skiva för att visa inför klassen? Publicerar du

Läs mer

Packa kappsäcken till translatorprovet

Packa kappsäcken till translatorprovet Packa kappsäcken till translatorprovet Mina erfarenheter och tips jag samlat på mig (med benäget bidrag från Kammarkollegiet och Föreningen Auktoriserade Translatorer) Del 1 Vad innebär en auktorisation

Läs mer

Korpussökning och korpusmått 1(44)

Korpussökning och korpusmått 1(44) Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi [email protected] Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer

Läs mer

LITK10 Teckenspråk i teori och praktik I, 30 hp

LITK10 Teckenspråk i teori och praktik I, 30 hp LITK10 Teckenspråk i teori och praktik I, 30 hp Samläses med LIT400 Teckenspråk som nybörjarspråk I, 30 hp (dk 1 till 5) LITN03 Språkvetenskaplig introduktion till svenskt teckenspråk, 5 hp (dk 1) LIT403

Läs mer

FR1201, Franska: Fortsättningskurs på distans, 30 högskolepoäng. (French: Intermediate course, 30 higher education credits)

FR1201, Franska: Fortsättningskurs på distans, 30 högskolepoäng. (French: Intermediate course, 30 higher education credits) Humanistisk fakultetsnämnd FR1201, Franska: Fortsättningskurs på distans, 30 högskolepoäng (French: Intermediate course, 30 higher education Grundnivå (First cycle) 1. Fastställande Kursplanen är fastställd

Läs mer