Korpusuppbyggnad Från textsamling till korpus

Storlek: px
Starta visningen från sidan:

Download "Korpusuppbyggnad Från textsamling till korpus"

Transkript

1 Korpusuppbyggnad Från textsamling till korpus Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi Korpusuppbyggnad Från textsamling till korpus 1(53)

2 Förra gången Fördjupningsuppgift och labbrapport Termer: token, typ, lemma, lexem Frekvenslista: råa och relativa frekvenser Korpusuppbyggnad Från textsamling till korpus 2(53)

3 Ämnen idag Mittkursvärdering, om muntliga presentationer, labbinfo Mer om ordfrekvenser, nyckelord, kollokationer och konkordanser Korpusbalans Korpusrepresentativitet Korpusen som standardreferens Att bygga en korpus Korpusuppbyggnad Från textsamling till korpus 3(53)

4 Muntliga presentationer Gruppindelning och schema finns nu upplagda på kurshemsidan: matsd/uv/uv11/sdt/grupper.html Helst inga byten, men om det är nödvändigt måste det göras mellan två bestämda grupper Presentationen ska vara 10 minuter och ca 5 minuter för frågor och diskussion. Alla förväntas vara aktiva under seminariet. Korpusuppbyggnad Från textsamling till korpus 4(53)

5 Muntliga presentationer Alla i gruppen ska presentera. Dela gärna in presentationen i 2-3 tydliga delar som ni fördelar rättvist er emellan. Öva hemma själv på din del och minst en gång i hela gruppen innan så ni kan ta tiden. Berätta det viktiga, tala tydligt. Plast-OH/1 ppt/1 pdf. Anpassa vem som talar efter hur ni vill presentera. Korpusuppbyggnad Från textsamling till korpus 5(53)

6 Labb Labb 3 för grupp 1: extra tillfälle p.g.a. problem med WordSmith: 17/ Labb 4: ordklasstaggade korpusar, konkordanser, egna undersökningar... Grupp 1: Ons 19/ Grupp 2: To 20/ Korpusuppbyggnad Från textsamling till korpus 6(53)

7 Ordfrekvenser Kvantitativ ansats som visar antal förekomster av en enhet. Råfrekvenser det faktiska antalet gånger ett ord förekommer i en viss korpus. Går bra att använda om man enbart arbetar inom en korpus och jämför ordförekomster inom denna korpus. Relativa frekvenser den procentandel ordet utgör av orden i korpusen. Används när man jämför ordfrekvenser mellan olika korpusar. Man kan räkna frekvenser på olika sätt: löpord, lemma, specifika ordklasser, ordformer av ett viss lemma, etc. Korpusuppbyggnad Från textsamling till korpus 7(53)

8 Relativa frekvenser: exempel we förekommer 2142 i en delkorpus av storlek token och 2666 i en annan delkorpus av storlek token. 2142/148624*100=1,4% 2666/483913*100=0,55% 2142/148624*1000 = 14,41 alltså 14 förekomster på tusen ord 2666/483913*1000 = 5,5 alltså 6 förekomster på tusen ord we är alltså mer än dubbelt så vanligt i vår första delkorpus. Korpusuppbyggnad Från textsamling till korpus 8(53)

9 Bakers exempel: referat Baker har gjort en undersökning av diskursen i resebroschyrer från club Mer precist vill han undersöka huruvida bolaget anspelar på sun, fun and sex i sin reklam samt uppmuntrat till högt alkoholintag på sina resmål, något som tidigare påståtts om bolaget, och som bolaget påstått sig ha arbetat bort. Baker har baserat sin undersökning på en frekvensanalys, där han sedan gått vidare och närstuderat ett antal specifika ord. Korpusuppbyggnad Från textsamling till korpus 9(53)

10 Bakers experiment En liten korpus, token. 12 korta texter. Frekvensordlista i Wordsmith. Råfrekvenser, eftersom alla jämförelser görs inom samma korpus, ej delkorpusar eller underkorpusar. Funktionsord sorteras bort. De mest frekventa innehållsorden har analyserats vidare avseende kluster i Wordsmith samt demografisk utbredning med hjälp av BNC Web. Korpusuppbyggnad Från textsamling till korpus 10(53)

11 Bar bars Ett högfrekvent ord visade sig vara bar bars. (Frekvensordlista). bar bars undersöks avseende kluster med ett fönster om tre ord. Man finner bars and clubs, och söker vidare avseende alkoholintag. Baker anser att han utifrån de korpusresultat han finner inte kan hävda att club aktivt uppmuntrat till alkoholintag. Korpusuppbyggnad Från textsamling till korpus 11(53)

12 Verb Efter att ha undersökt nomen undersöker Baker verb. Han finner höga frekvenser för verb som sleep, book, want (se Baker sid. 58). Dessa sorteras dock bort eftersom de i hög grad relaterar till detaljer i rumsbeskrivningarna, och kvarstår gör verb som miss, chill, relax, work. Med kluster finner han don t miss out, chill out, make sure, work 2 live, work on your tan. Korpusuppbyggnad Från textsamling till korpus 12(53)

13 Formell informell Baker bedömer vissa ord och ordkombinationer som informella (chill out, heaps of bars). För att verifiera att språket är informellt kontrollerar Baker dessa termer mot BNC Web, där det finns möjlighet att kontrollera frekvenser i tal och text samt över olika demografiska variabler. På detta sätt kan Baker alltså verifiera sina hypoteser om att språket är mer informellt, att vissa ord företrädesvis används av män eller kvinnor, unga eller gamla etc. Korpusuppbyggnad Från textsamling till korpus 13(53)

14 Resultat Explicita referenser till alkohol och sex, som researrangörerna blivit anklagade för tidigare, förekommer inte i de broschyrer som undersöks. Baker påstår dock att budskapet ändå finns implicit. Club ser de semesterfirare de vänder sig till som individer som är intresserade av information om platser att inta alkohol på, att de förmodligen behöver chilla och att de behöver hämta sig efter baksmälla. Baker kommenterar också på bilderna som finns i broschyrerna, och anser att dessa stöder de tolkningar han gjort. Korpusuppbyggnad Från textsamling till korpus 14(53)

15 Konkordanser och kluster Konkordanser är sökord i sin kontext ordnad efter förekomst, alfabetiskt efter förekomst eller kontext KWIC KeyWord In Context (OBS! Ej blanda ihop med nyckelord). Att arbeta med konkordanser innebär att man undersöker vilka ord som förekommer kring ett givet ord. Kluster innebär fasta sekvenser om t.ex. tre ord (clubs and bars), medan konkordanser innebär att ett ord presenteras i ett utsnitt av sin kontext. Flera ord i kontexten kan vara intressant; före sökordet, efter, ett eller ett par ord före eller efter. Korpusuppbyggnad Från textsamling till korpus 15(53)

16 Konkordanser Idén här är att ord som förekommer tillsammans påverkar varandra. Ett tydligt exempel är hur adjektiv och particip kan modifiera substantiv. En glad flicka, Flickan är glad. Genom att se vilka ord ett givet ord förekommer tillsammans med anser man att man kan ge en bild av värderingar och attityder är kopplade till ordet i fråga; vi kan säga något om ordets semantiska preferens/prosodi eller diskursprosodi. Korpusuppbyggnad Från textsamling till korpus 16(53)

17 Kollokationer När vi arbetar med konkordanser får vi som resultat en lista som vi behöver gå igenom för att finna mönster i kontexten. Ett verktyg som tar fram kollokationer är en hjälp med denna sortering. Vi kan få syn på intressanta återkommande mönster. (Om man inte har tillgång till ett verktyg som gör kollokationer får man försöka att kontrollera kontexten med sina sökmönster.) Korpusuppbyggnad Från textsamling till korpus 17(53)

18 Kollokationer och kolligationer Ibland gör man skillnad mellan kollokationer och kolligationer. Kollokationer samförekomster med sökord och lexikala ord. Kolligationer samförekomster mellan sökord och grammatiska ord. Korpusuppbyggnad Från textsamling till korpus 18(53)

19 Bakers exempel, bachelor Baker tar upp ett exempel med ordet bachelor/bachelors och spinster/spinsters. BNC, 100 milj. ord. Vilka ord omger och modifierar bachelor och spinster? Vad säger detta om våra attityder till företeelserna? Baker fann......generellt att bachelor hade mer positiva konnotationer än spinster....att fler betydelseaspekter av bachelor kunde urskiljas (examen, livsstil, egenskaper). Kollokationer ett sätt att underlätta arbetet med att sovra i kontexten. OBS! att analysen inte görs automatiskt. INGET program gör ALLT! Korpusuppbyggnad Från textsamling till korpus 19(53)

20 Intressanta återkommande mönster Vilka återkommande mönster är intressanta och vilka är det inte? Wordsmith kan räkna fram vilka kollokationer som är mer intressanta än andra, kollokationsstyrka genom t.ex. MI (mutual information). För att kunna söka på vilka ord man vill och verkligen få fram intressanta mönster krävs en rätt stor korpus. Olika algoritmer rankar kollokationsstyrka på olika sätt (se Baker:102). (Vi kommer inte att gå in på detta i detalj, bara nämna att olika ansatser kan ge något olika resultat). Korpusuppbyggnad Från textsamling till korpus 20(53)

21 Nyckelord Nyckelord ger information om vad en text handlar om. Nyckelord är inte nödvändigtvis de mest frekventa innehållsorden i en text. De identifieras genom att statistiskt jämföra ordfrekvenser mellan målkorpus och en större referenskorpus (benchmark). Nyckelord utgörs av ord som är speciella för en viss text. Det är alltså ord som kan vara lågfrekventa i en större samling texter, men relativt mer högfrekventa i ett (eller ett par) dokument. Nyckelordet karakteriserar innehållet eller diskursen inom ett visst dokument eller en viss textsamling. Korpusuppbyggnad Från textsamling till korpus 21(53)

22 Nyckelord Positiva nyckelord: signifikant frekventa ord Negativa nyckelord: signifikant infrekventa/underrepresenterade ord, ord som förekommer mindre sällan i målkorpus än förväntat jämfört med en stor referenskorpus. Korpusuppbyggnad Från textsamling till korpus 22(53)

23 Representativitet och balans Använder man sig av korpora är det alltid viktigt att man som användare vet hur de är uppbyggda. Två viktiga begrepp vid korpusundersökningar: Representativitet Hur väl passar korpusen min frågeställning? Balans Vad kan jag vänta mig av min korpus i form av skevheter? Korpusen som standardreferens Korpusuppbyggnad Från textsamling till korpus 23(53)

24 Viktiga egenskaper hos korpusar En korpus i modern lingvistik är inte bara en eller flera texter utan med begreppet korpus följer också: Ett maskinläsbart format. Ett representativt urval. En standardreferens. (Ett balanserat urval). Korpusuppbyggnad Från textsamling till korpus 24(53)

25 Korpusurval och representativitet Korpusar fungerar som ett representativt stickprov av en (mycket större) population (t.ex. ett språk) med ett syfte i åtanke. Biber ( Representativeness in corpus design, 1993) diskuterar representativitet i texturval för korpusar. Vad är mitt universum? Definiera populationen ( sampling frame ) Hur är detta universum strukturerat? Fastställ den hierarkiska strukturen i populationen ( strata ) - genre, texttyper, ursprung Hur skall korpusen struktureras? Skall korpustexten utgöras av hela texter eller kortare sampel? Storlek? Bestäm storleken (vad är den optimala storleken?). Korpusuppbyggnad Från textsamling till korpus 25(53)

26 En standardreferens Man skiljer ibland på representativitet och balans. När man talar om en korpus som en standardreferens menar man att korpusen kan ses som representativ för allmänt språk. För att uppfylla detta anses ofta att korpusen skall vara balanserad, dvs innehålla material från alla (?) genrer/texttyper. Korpusuppbyggnad Från textsamling till korpus 26(53)

27 En balanserad korpus En balanserad korpus (generell eller specialiserad täcker många olika textkategorier. Man utgår normalt från redan befintliga korpusmodeller när de bygger sina egna. Exempel: BNC fungerade som mall för ANC, SUC, Koreansk nationell korpus, Polsk nationell korpus. Korpusuppbyggnad Från textsamling till korpus 27(53)

28 BNC 100 miljoner ord: 90 % skriven, 10 % transkriptioner av tal kriterier för skrivna texter: domän: innehåll tid: när texten producerades medium: typ av publikation (böcker, tidskrifter, ej publicerade manuskript) kriterier för talat material: demografisk: åldersgrupp, kön, samhällsklass, region sammanhang: möten, föreläsningar, radiosändningar Korpusuppbyggnad Från textsamling till korpus 28(53)

29 Sammansättning av skrivet material i BNC DOMÄN % TID % Skönlitteratur 21, ,26 Konst 8, ,23 Tro och tanke 3,40 Ej klassificerad 8,49 Maknad/finans 7,93 MEDIUM % Fritid 11,13 Bok 58,58 Naturvetenskap 4,18 Tidskrift 31,08 Tillämpad vetenskap 8,21 Misc. publicerad 4,38 Samhällsvetenskap 14,80 Misc. ej publicerad 4,00 Världspolitik 18,39 Talad 1,52 Ej klassificerad 1,93 Ej klassificerad 0,40 Korpusuppbyggnad Från textsamling till korpus 29(53)

30 Sammansättning av talmaterial i BNC REGION % SAMMANHANG % Söder 45,61 Utbildning 20,56 Mitten 23,33 Affärer 21,47 Nord 25,43 Institutionell 21,86 Ej klassificerad 5,61 Fritid 23,71 Ej klassificerad 12,38 INTERAKTION % Monolog 18,64 Dialog 74,87 Ej klassificerad 6,48 Korpusuppbyggnad Från textsamling till korpus 30(53)

31 Korpusbalans In selecting texts for inclusion in the corpus, account was taken of both production, by sampling a wide variety of distinct types of material, and reception, by selecting instances of those types which have a wide distribution. Thus, having chosen to sample such things as popular novels, or technical writings, best-seller lists and library circulation statistics were consulted to select particular examples of them. (Aston and Burnard s (1998) summary of the design criteria of the BNC). Korpusuppbyggnad Från textsamling till korpus 31(53)

32 SUC Hur gjorde de? Stockholm Umeå Corpus SUC. 1 miljon löpord fördelade på 500 excerpt om 2000 ord (liten). Svensk 1990-talstext. Balanserad......enligt kriteria från tidigare projekt (Brown!) Brown: the collection of books and periodicals in the Brown university and the Providence Athenaeum (Biber, 1993, B1)...och ekonomiska ramar! SGML-format, TEI-kompatibel. Korpusuppbyggnad Från textsamling till korpus 32(53)

33 Kriteria för insamling av SUC (1) (1) Balanserad korpus: Omfattar olika texttyper och olika stilistiska nivåer. Kontrollera förlagskataloger. (2) Skall spegla vad en person kan förväntas ha läst (jfr Atkins et al., B1129; reception production) på tidigt 1990-tal (men jämför med senare kriteria). Kontrollera biblioteksstatistik. Korpusuppbyggnad Från textsamling till korpus 33(53)

34 Kriteria för insamling av SUC (2) (3) SUC innehåller enbart svensk originaltext, inga översättningar. Detta sätter möjligen kriterium 2 något ur spel. (4) Alla texter i korpusen skall vara möjliga att gratis distribuera för icke-kommersiell forskning, d.v.s. copyright-frågor måste lösas. Var mycket noga med licensavtal med textgivarna!...vad tillåter licensavtalen att du gör med korpusen när du väl är färdig? Korpusuppbyggnad Från textsamling till korpus 34(53)

35 Kriteria för insamling av SUC (3) (5) Korpusen skulle bara innehålla publicerad text, d.v.s. inga privata brev etc. Detta för med sig implikationer på flera nivåer, t.ex. taggning & taggset. (6) Så länge det inte står i konflikt med andra principer skall urvalet av texter vara parallellt med det i Brown och LOB korpora, så att komparativa studier kan göras. Detta kan göra korpora jämförbara både synkront och diakront. Korpusuppbyggnad Från textsamling till korpus 35(53)

36 Kriteria för insamling av SUC (4) (7) Texterna skulle finnas i maskinläsbar form, eftersom det inte fanns resurser till inscanning av nya data. Detta kriterium fick vägas mot balans och parallelism (en del texter fick trots allt scannas in...). På tidigt 1990-tal sparade förlagen en hel del som papperskopior. Korpusuppbyggnad Från textsamling till korpus 36(53)

37 Kriteria för insamling av SUC (5) Den lista av material som svarade mot alla kriterier ovan kan sägas utgöra populationen för SUC. Den lista av böcker, tidningsmaterial etc. som faktiskt valdes ur populationen (och som står upptagen i SUC:s bibliografifil) är samplingsramen. Varje artikel i samplingsramen utgör en samplingsenhet. Vad som till slut förekommer i korpusen är i de flesta fall ett excerpt ur en samplingsenhet (ca 2000 ord). Korpusuppbyggnad Från textsamling till korpus 37(53)

38 Samplingsdimensioner i SUC Språk: Svenska Ursprung: Svenskt Kanal: Text/Prosa Intervall: 1990-talet Formalitetsgrad: Publicerad text Interaktivitet: Monolog Riktning: Svensk genomsnittsläsare Korpusuppbyggnad Från textsamling till korpus 38(53)

39 Genrekategorisering SUC Facklitteratur A Press: Reportage B Press: Ledare/Debatt C Press: Recensioner E Arbete och fritid F Populärvetenskap G Biografier, essäer H Blandat J Lärda och vetenskapliga texter Skönlitteratur K Skönlitteratur Korpusuppbyggnad Från textsamling till korpus 39(53)

40 En balanserad korpus Går det??? Vissa forskare anser att en balanserad korpus är en illusion. En korpus kan vara representativ utan att vara balanserad och balanserad utan att vara representativ. Representativitet relation mellan frågeställning och korpus. Balans relation mellan korpus och population. Om vi har en standardreferens för ett språk kan vi exempelvis jämföra mer specifika genrer (sporttext, modetidningar) mot denna standardreferens och finna drag som är specifika för denna genre. SUC brukar användas som standardreferens för svenska korpusundersökningar. Korpusuppbyggnad Från textsamling till korpus 40(53)

41 Att bygga en korpus Om man inte hittar en korpus som passar för den tilltänkta undersökningen, måste man själv bygga en korpus. Hur bygger man en korpus? Hur skulle du gå till väga för att samla material och vilka problem ser du för varje steg? Korpusuppbyggnad Från textsamling till korpus 41(53)

42 Nästa gång Att bygga en korpus Korpusannotering Taggning, PoS-taggad korpus Parsning, syntaktiskt annoterade korpusar, s.k. trädbanker Parallella korpusar Korpusuppbyggnad Från textsamling till korpus 42(53)

43 Labb Labb 3 för grupp 1: extra tillfälle p.g.a. problem med WordSmith: 17/ Labb 4: ordklasstaggade korpusar, konkordanser, egna undersökningar... Grupp 1: Ons 19/ Grupp 2: To 20/ Korpusuppbyggnad Från textsamling till korpus 43(53)

Korpusmått, korpusbalans och korpusrepresentativitet

Korpusmått, korpusbalans och korpusrepresentativitet Korpusmått, korpusbalans och korpusrepresentativitet Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusmått, korpusbalans och korpusrepresentativitet

Läs mer

Korpussökning och korpusmått 1(44)

Korpussökning och korpusmått 1(44) Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer

Läs mer

Att bygga en korpus. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se

Att bygga en korpus. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Att bygga en korpus Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Att bygga en korpus 1(42) Förra gången Mer om ordfrekvenser, nyckelord, kollokationer

Läs mer

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik?

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik? Metoder och tillämpningar inom språkteknologin - ht 07 Korpuslingvistik Innehåll Vad är en korpus? Vad är korpuslingvistik? Korpusurval och sammanställning Annotering Korpusexempel Parallellkorpusar Internet

Läs mer

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap 729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering

Läs mer

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31) Korpusannotering Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusannotering 1(31) Förra gången Att bygga en korpus sampling uppmärkning annotering

Läs mer

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41) Korpusar Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusar 1(41) Förra gången Kursinformation Empiriska studier av språk Kvantitativa vs.

Läs mer

ENGELSKA. Ämnets syfte. Kurser i ämnet

ENGELSKA. Ämnets syfte. Kurser i ämnet ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Ämne - Engelska. Ämnets syfte

Ämne - Engelska. Ämnets syfte Ämne - Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019 Labb 1: KORP vid

Läs mer

Förslag den 25 september Engelska

Förslag den 25 september Engelska Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Elementära verktyg för korpusbearbetning

Elementära verktyg för korpusbearbetning Elementära verktyg för korpusbearbetning Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng. Ämne: Språkteknologi. Nivå: A Syfte: Kursen behandlar

Läs mer

Korpusundersökningar, referat

Korpusundersökningar, referat Korpusundersökningar, referat Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusundersökningar, referat 1(38) Förra gången Korpustyper Korpusdistributörer

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng, grundnivå, huvudområde: språkteknologi Syfte: Kursen skall förmedla

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019 Labb 1: KORP vid

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp UNIVERSITY OF Richard Johansson November 11, 2015 dagens presentation sökverktyget Korp Språkbankens korpusar: vilka nns och hur

Läs mer

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande: ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt Kursplan ENGELSKA Ämnets syfte Undervisningen i ämnet engelska ska syfta till att deltagarna utvecklar språk- och omvärldskunskaper så att de kan, vill och vågar använda engelska i olika situationer och

Läs mer

Tekniker för storskalig parsning: Grundbegrepp

Tekniker för storskalig parsning: Grundbegrepp Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)

Läs mer

ENGELSKA FÖR DÖVA. Ämnets syfte

ENGELSKA FÖR DÖVA. Ämnets syfte ENGELSKA FÖR DÖVA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Översättningsuniversalier i svenska översatta texter

Översättningsuniversalier i svenska översatta texter EXAMENSARBETE VT 2014 MASTER I ÖVERSÄTTNING Specialisering i engelska Språk- och litteraturcentrum Översättarutbildningen Översättningsuniversalier i svenska översatta texter En undersökning av tecken

Läs mer

Arbeta med Selected Works en lathund

Arbeta med Selected Works en lathund Arbeta med Selected Works en lathund Att redigera din egen Selected Works-sida Ta fram din sida och logga in via My Account längts ner på sidan. Klicka på Edit My Site för att redigera sidan. Gå nu vidare

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Prövning i grundläggande Engelska

Prövning i grundläggande Engelska allmän mall Malmö stad Komvux Malmö Södervärn Prövning i grundläggande Engelska A. Skriftligt prov 1 Läsförståelse, ordkunskap ca 80 minuter 2 Hörförståelse ca 45 minuter 3 Uppsatsskrivning ca 80 minuter

Läs mer

Prövning i Engelska 5, ENGENG05, 100 poäng

Prövning i Engelska 5, ENGENG05, 100 poäng Prövning i Engelska 5, ENGENG05, 100 poäng Här följer information om prövning, skriftlig och muntlig del, kursplan samt länkar till Skolverkets sida med exempel från tidigare nationella prov. 1. Skriftlig

Läs mer

MÅL OCH BETYGSKRITERIER I SVENSKA

MÅL OCH BETYGSKRITERIER I SVENSKA MÅL OCH BETYGSKRITERIER I SVENSKA MÅL ATT UPPNÅ I ÅR 7 Delta i samtal samt lyssna på andra Redovisa ett arbete muntligt utifrån stödord om något man sett, läst, hört eller upplevt Kunna läsa och tillgodogöra

Läs mer

Vetenskaplig metodik

Vetenskaplig metodik Vetenskaplig metodik Vilka metoder används? Vi kan dela in metoder i flera grupper: Deduktiva metoder Metoder för hantering av experiment Metoder för publicering och liknande. Från föreläsning 3 Föreläsningen

Läs mer

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

Kursplan i svenska som andraspråk grundläggande GRNSVA2

Kursplan i svenska som andraspråk grundläggande GRNSVA2 Kursplan i svenska som andraspråk grundläggande GRNSVA2 Kursen ger elever med annat modersmål än svenska en möjlighet att utveckla sin förmåga att kommunicera på svenska. Ett rikt språk ger ökade förutsättningar

Läs mer

Kort och gott Svenskt basordförråd. Katarina Mühlenbock, DART

Kort och gott Svenskt basordförråd. Katarina Mühlenbock, DART Kort och gott Svenskt basordförråd Katarina Mühlenbock, DART Vad är ett ord? Vi kan göra pauser då vi uttalar ett ord Ett ord kan oftast bytas ut mot ett annat med liknande funktion och betydelse Kan (oftast)

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny

Läs mer

ÄLTA SKOLAS LOKALA KURSPLAN

ÄLTA SKOLAS LOKALA KURSPLAN 1(6) Förskoleklass mål för förskoleklass Exempel på genomförande Strävansmål mot år 2 få fonologisk medvetenhet känna lust att lära genom att LÄSA få möjlighet till att LYSSNA, TALA och BERÄTTA utveckla

Läs mer

Kort presentation av Korp, Sveriges nationalkorpus

Kort presentation av Korp, Sveriges nationalkorpus Kort presentation av Korp, Sveriges nationalkorpus Göteborgs universitet 19 januari 2017 vid Avdelningen för nordiska språk, L Orientale-universitetet i Neapel Fil.dr. i slaviska språk. Undervisat i slovenska,

Läs mer

Kvantitativ samhällsanalys med språkteknologiska metoder.

Kvantitativ samhällsanalys med språkteknologiska metoder. Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar

Läs mer

Förslag den 25 september Moderna språk

Förslag den 25 september Moderna språk Moderna språk Moderna språk är ett ämne som kan innefatta en stor mängd språk. Dessa kan sinsemellan vara mycket olika vad gäller allt från skriftsystem och uttal till utbredning och användning inom skiftande

Läs mer

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Eva Pettersson eva.pettersson@lingfil.uu.se 2016-11-09 Förra gången Kursmål och kursintroduktion Språkteknologiska tillämpningar OCR - Dialogsystem

Läs mer

Datorbaserade verktyg i humanistisk forskning

Datorbaserade verktyg i humanistisk forskning Datorbaserade verktyg i humanistisk forskning Introduktion till korpuslingvistik Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt

Läs mer

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied? This is England 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied? 2. Is Combo s speech credible, do you understand why Shaun wants to stay with Combo?

Läs mer

Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN:

Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: Prövning Engelska 7, 100 p Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: 978-91-47-9196-6 Dessutom ska du läsa en av följande böcker: Joseph Conrad, Heart of Darkness Charles

Läs mer

Workplan Food. Spring term 2016 Year 7. Name:

Workplan Food. Spring term 2016 Year 7. Name: Workplan Food Spring term 2016 Year 7 Name: During the time we work with this workplan you will also be getting some tests in English. You cannot practice for these tests. Compulsory o Read My Canadian

Läs mer

Korpusanalyser och Lab G09 Språkvetenskaplig databehandling

Korpusanalyser och Lab G09 Språkvetenskaplig databehandling Korpusanalyser och Lab 4 729G09 Språkvetenskaplig databehandling 2014-05-21 Laborationens syfte Öva användningen av webbaserade korpusar och korpusverktyg frekvensberäkningar konkordanser kollokationsverktyg

Läs mer

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10 Källkritik - om att kritiskt granska och värdera information Ted Gunnarsson 2014-04-10 Källkritik - Innehåll Vad är källkritik? Varför källkritik? De källkritiska kriterierna Exempel på källkritiska frågor

Läs mer

Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap K så måste alltså: Lite kunskaps- och vetenskapsteori

Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap K så måste alltså: Lite kunskaps- och vetenskapsteori Lite kunskaps- och vetenskapsteori Empiriska metoder: kvalitativa och kvantitativa Experiment och fältstudier Människor och etik 1 Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap

Läs mer

Statens skolverks författningssamling

Statens skolverks författningssamling Statens skolverks författningssamling ISSN 1102-1950 Förordning om ämnesplaner för de gymnasiegemensamma ämnena; Utkom från trycket den 1 mars 2011 utfärdad den 2 december 2010. Regeringen föreskriver

Läs mer

Engelska 7, ENGENG07, 100 p

Engelska 7, ENGENG07, 100 p Prövning Engelska 7, ENGENG07, 100 p Lärobok och litteratur McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: 978-91-47-9196-6 En list på litterära verk skickas ut av läraren till studenterna. Romanerna

Läs mer

DHGI!J*%$2(44!@!F-&&>$*6&6<1%(&5$,!5!KC4%.(4. A-C Ernehall, Fässbergsgymnasiet, Mölndal www.lektion.se

DHGI!J*%$2(44!@!F-&&>$*6&6<1%(&5$,!5!KC4%.(4. A-C Ernehall, Fässbergsgymnasiet, Mölndal www.lektion.se Svenska "#$%&'(&)*+'$,-*$,,*$.&'()/&0123-4)$*.56*$74$',$*(/'0118%59$*(0928,#$9'4('8%&'():;$%01.5,,&)*+''(%.88,,*

Läs mer

Förslag den 25 september Engelska

Förslag den 25 september Engelska Engelska Språk är människans främsta redskap för att tänka, kommunicera och lära. Att ha kunskaper i flera språk kan ge nya perspektiv på omvärlden, ökade möjligheter till kontakter och större förståelse

Läs mer

Svenska som andraspråk

Svenska som andraspråk Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny kunskap, klara vidare

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Talko korpus över den talade svenskan i Finland april 2016

Talko korpus över den talade svenskan i Finland april 2016 Talko korpus över den talade svenskan i Finland april 2016 Kort användarguide När du loggar in i Talko kommer du till korpusens söksida. Talko är gjort för att användas i Mozilla Firefox med Flash eller

Läs mer

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc.

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc. Matris och checklista för språkprogression IMSPR1 (jobbar mot nivå A1-/A1) - Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc. - Kan skriva en enkel

Läs mer

Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet

Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet SALETEK-möte Jokkmokk, 13 14 juni 2004 vad är en korpus? korpusar är (stora) textsamlingar

Läs mer

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ Engelska, 450 verksamhetspoäng Ämnet handlar om hur det engelska språket är uppbyggt och fungerar samt om hur det kan användas. Det engelska språket omger oss i vardagen och används inom så skilda områden

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga data Används traditionellt om alla verk av en viss typ,

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009. Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009. Listorna i det här dokumentet kommer från Göteborgs Talspråkskorpus

Läs mer

Genrekoden svarar mot kursplanen i svenska i Lgr 11

Genrekoden svarar mot kursplanen i svenska i Lgr 11 Genrekoden svarar mot kursplanen i svenska i Lgr 11 Genrekoden har allt du behöver för att arbeta med svenskämnet enligt Lgr 11. Genrekoden utgår ifrån den nya kursplanens syn på att det i all kommunikation

Läs mer

Writing with context. Att skriva med sammanhang

Writing with context. Att skriva med sammanhang Writing with context Att skriva med sammanhang What makes a piece of writing easy and interesting to read? Discuss in pairs and write down one word (in English or Swedish) to express your opinion http://korta.nu/sust(answer

Läs mer

Genom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att:

Genom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att: Pedagogisk planering Engelska årskurs 8, vecka 45-49 Television Broadcast och oregelbundna verb Varför: Genom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Momentguide: Samhällsvetenskaplig metod

Momentguide: Samhällsvetenskaplig metod Momentguide: Samhällsvetenskaplig metod Naturvetenskap kan verka komplicerat med matematiska formler, fysikens lagar och periodiska systemet. Men tar man till sig systematiken går det å andra sidan ofta

Läs mer

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Kursplan: SVENSKA Ämnets syfte Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Förmåga att tala inför andra på ett sätt som är lämpligt i kommunikationssituationen

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Datorbaserade verktyg i humanistisk forskning

Datorbaserade verktyg i humanistisk forskning Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt

Läs mer

Svenska Läsa

Svenska Läsa Svenska Läsa utvecklar sin fantasi och lust att lära genom att läsa litteratur samt gärna läser på egen hand och av eget intresse, utvecklar sin förmåga att läsa, förstå, tolka och uppleva texter av olika

Läs mer

Ämnets syfte. Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande:

Ämnets syfte. Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Kursplan: Svenska Ämnets syfte Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Förmåga att tala inför andra på ett sätt som är lämpligt i kommunikationssituationen

Läs mer

Välkommen till kursen Flerspråkig utveckling, litteracitet och lärande

Välkommen till kursen Flerspråkig utveckling, litteracitet och lärande Välkommen till kursen Flerspråkig utveckling, litteracitet och lärande 24.11-08 Kursen startar 17 november 2008 i sal F 331, Stockholms universitet (Se schema) Forskarskolekursen Flerspråkig utveckling,

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform

Läs mer

PM för kurs i Vetenskapsteori

PM för kurs i Vetenskapsteori PM för kurs i Vetenskapsteori Doktorandkurs, 5 poäng, HT-07 Allmän information Varje läsår ges en kurs i vetenskapsteori för LTU:s doktorander. Kursen är tänkt att motsvara 5 poäng i forskarutbildningen.

Läs mer

Smedingeskolan LPP och matris för tema klassiker. LPP och matris för tema klassiker

Smedingeskolan LPP och matris för tema klassiker. LPP och matris för tema klassiker Under den kommande perioden kommer vi att arbeta med temat klassiker. Ni ska få lära er vad som räknas som en klassiker samt olika författare. Ni ska läsa en klassiker - som ni själva väljer, läsa utdrag

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Pragmatisk och narrativ utveckling

Pragmatisk och narrativ utveckling Pragmatisk och narrativ utveckling Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Pragmatik! Pragma! handling! hur vi använder språket! hur vi handlar genom språket! Pragmatik!

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Automatisk identifiering av semantisk förändring med hjälp av distributionella faktorer

Automatisk identifiering av semantisk förändring med hjälp av distributionella faktorer Automatisk identifiering av semantisk förändring med hjälp av distributionella faktorer Karin Cavallin karin.cavallin@gu.se Institutionen för filosofi, lingvistik och vetenskapsteori Göteborgs universitet

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)

Läs mer

Mål som eleverna skall ha uppnått i slutet av femte skolåret Eleverna skall:

Mål som eleverna skall ha uppnått i slutet av femte skolåret Eleverna skall: SVENSKA - SPRÅKUTVECKLING Med språkutveckling menar vi: Genom språket sker kommunikation och samarbete med andra. Svenskämnet syftar till att tillsammans med andra ämnen i skolan utveckla elevernas kommunikationsförmåga,

Läs mer

Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska

Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska Engelska Kurskod: GRNENG2 Verksamhetspoäng: 450 Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens

Läs mer

Korp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016

Korp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016 Korp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/korplabb/ sb-korp@svenska.gu.se 17 oktober 2016 ÖVERSIKT Korp är Språkbankens korpusverktyg och en väsentlig del av vår korpusinfrastruktur.

Läs mer

Anvisningar till rapporter i psykologi på B-nivå

Anvisningar till rapporter i psykologi på B-nivå Anvisningar till rapporter i psykologi på B-nivå En rapport i psykologi är det enklaste formatet för att rapportera en vetenskaplig undersökning inom psykologins forskningsfält. Något som kännetecknar

Läs mer

Förändring, evidens och lärande

Förändring, evidens och lärande Förändring, evidens och lärande Runo Axelsson Professor i Health Management Den svenska utvecklingen Traditionell organisation Enkel men auktoritär struktur, byggd på militära ideal. Byråkratisering (1960/70-talet)

Läs mer

1.1: allmänt om korpuslingvistik. Lars Borin. Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet

1.1: allmänt om korpuslingvistik. Lars Borin. Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet 1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet korpuslingvistiska metoder och verktyg i andraspråksforskning forskarutbildningskurs HT

Läs mer

vad är korpuslingvistik? (stora) textsamlingar, 1 (stora) textsamlingar, och annoterade... sammanställda... så, korpuslingvistik innebär:

vad är korpuslingvistik? (stora) textsamlingar, 1 (stora) textsamlingar, och annoterade... sammanställda... så, korpuslingvistik innebär: 1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet vad är korpuslingvistik? korpusar är (stora) textsamlingar, sammanställda och annoterade

Läs mer

PLANERING FÖR ENGELSKA LAG SYD ÅK 7

PLANERING FÖR ENGELSKA LAG SYD ÅK 7 PLANERING FÖR ENGELSKA LAG SYD ÅK 7 TID: VECKA 45-51 S7:1 LEKTION 1: TORSDAGAR LEKTION 2: FREDAGAR S7:2 LEKTION 1: MÅNDAGAR LEKTION 2: TORSDAGAR ÄMNESOMRÅDE: FOOD, EATING OUT, TABLE TALK. Review of a movie.

Läs mer

Exempel på gymnasiearbete inom humanistiska programmet språk

Exempel på gymnasiearbete inom humanistiska programmet språk Exempel på gymnasiearbete september 2012 Exempel på gymnasiearbete inom humanistiska programmet språk Ungdomsspråk i spanska bloggar Elevens idé Calle är genuint språkintresserad. Han har studerat spanska,

Läs mer

1. Vad är ett språk? 1. Vad är ett språk? 2. Språkets struktur och delar. 2. Språkets struktur och delar 2012-01-19

1. Vad är ett språk? 1. Vad är ett språk? 2. Språkets struktur och delar. 2. Språkets struktur och delar 2012-01-19 Språket i skolan och samhället Ulf Fredriksson Stockholms universitetet, Avdelningen för internationell pedagogik / institutionen för pedagogik och didaktik vt 2012 Språket i skolan och samhället 1) Vad

Läs mer

Svenska mål och kriterier

Svenska mål och kriterier Svenska mål och kriterier Mål att sträva mot Vi strävar mot att varje elev ska - utveckla sin fantasi och lust att lära genom att läsa litteratur samt gärna läser på egen hand och av eget intresse. - utveckla

Läs mer

Lokal Pedagogisk planering i Spanska åk 6

Lokal Pedagogisk planering i Spanska åk 6 Lokal Pedagogisk planering i Spanska åk 6 Ansvariga lärare: Mimi Säverman Annika Fällman Felipe Sanhueza mimi.saverman@edu.upplandsvasby.se annika.fallman@edu.upplandsvasby.se felipe.sanhueza@edu.upplandsvasby.se

Läs mer

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår

Läs mer

Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011

Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011 Kort om Coxheads Academic Word List Emma Sköldberg, maj 2011 Två viktiga artiklar Coxhead, A. 2000: A New Academic Word List (TESOL Quarterly 34:2, 2000, 213-238). Coxhead, A. 2002: The Academic Word List:

Läs mer

Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd

Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd Håkan Jansson, Judy Ribeck & Emma Sköldberg Institutionen för svenska språket Göteborgs universitet NFL, Oslo 2013 En

Läs mer