Korpusmått, korpusbalans och korpusrepresentativitet

Storlek: px
Starta visningen från sidan:

Download "Korpusmått, korpusbalans och korpusrepresentativitet"

Transkript

1 Korpusmått, korpusbalans och korpusrepresentativitet Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi Korpusmått, korpusbalans och korpusrepresentativitet 1(46)

2 Förra gången Konkordanser och kollokationer Frekvenslista: råa och relativa frekvenser Referat, citat och plagiat Korpusmått, korpusbalans och korpusrepresentativitet 2(46)

3 Ämnen idag Mer om ordfrekvenser, nyckelord, kollokationer och konkordanser Korpusbalans Korpusrepresentativitet Korpusen som standardreferens Att skriva labbrapport Korpusmått, korpusbalans och korpusrepresentativitet 3(46)

4 Konkordanser och kluster Konkordanser är sökord i sin kontext ordnad efter förekomst, alfabetiskt efter förekomst eller kontext KWIC KeyWord In Context (OBS! Ej nyckelord). Man undersöker vilka ord som förekommer kring ett givet ord. Kluster innebär fasta sekvenser om flera ord t.ex. tre ord (clubs and bars) Korpusmått, korpusbalans och korpusrepresentativitet 4(46)

5 N-gram n-gram innebär en sekvens av n enhet ur en given sekvens av text eller tal; fonem, bokstav, stavelser, ord. unigram: 1, bigram: 2, trigram 3 t.ex. att vara eller inte vara unigram: att, vara, eller, inte, vara bigram: att vara, vara eller, eller inte, inte vara,... trigram: att vara eller, vara eller inte, eller inte vara,... Korpusmått, korpusbalans och korpusrepresentativitet 5(46)

6 Ordfrekvenser Kvantitativ ansats som visar antal förekomster av en enhet. Råfrekvenser det faktiska antalet gånger ett ord förekommer i en viss korpus. Går bra att använda om man enbart arbetar inom en korpus och jämför ordförekomster inom denna korpus. Relativa frekvenser den procentandel ordet utgör av orden i korpusen. Används när man jämför ordfrekvenser mellan olika korpusar. Man kan räkna frekvenser på olika sätt: löpord, lemma, specifika ordklasser, ordformer av ett viss lemma, etc. Korpusmått, korpusbalans och korpusrepresentativitet 6(46)

7 Relativa frekvenser: exempel we förekommer 2142 i en delkorpus av storlek token och 2666 i en annan delkorpus av storlek token. 2142/148624*100=1,4% 2666/483913*100=0,55% 2142/148624*1000 = 14,41 alltså 14 förekomster på tusen ord 2666/483913*1000 = 5,5 alltså 6 förekomster på tusen ord we är alltså mer än dubbelt så vanligt i vår första delkorpus. Korpusmått, korpusbalans och korpusrepresentativitet 7(46)

8 Konkordanser Idén här är att ord som förekommer tillsammans påverkar varandra. Genom att se vilka ord ett givet ord förekommer tillsammans med anser man att man kan ge en bild av värderingar och attityder är kopplade till ordet i fråga; Vi kan säga något om ordets semantiska preferens/prosodi eller diskursprosodi. Korpusmått, korpusbalans och korpusrepresentativitet 8(46)

9 Konkordanser och kollokationer Konkordanser en lista med träffarna centrerade och omgivna av sin kontext. Kollokationer en lista med ord som förekommer i närheten av ett sökord. Korpusmått, korpusbalans och korpusrepresentativitet 9(46)

10 Kollokationer När vi arbetar med konkordanser får vi som resultat en lista som vi behöver gå igenom för att finna mönster i kontexten. Ett verktyg som tar fram kollokationer är en hjälp med denna sortering. Vi kan få syn på intressanta återkommande mönster. Om man inte har tillgång till ett verktyg som gör kollokationer får man försöka att kontrollera kontexten med sina sökmönster. Korpusmått, korpusbalans och korpusrepresentativitet 10(46)

11 Kollokationer och kolligationer Ibland gör man skillnad mellan kollokationer och kolligationer. Kollokationer samförekomster med sökord och lexikala ord. Kolligationer samförekomster mellan sökord och grammatiska ord. Korpusmått, korpusbalans och korpusrepresentativitet 11(46)

12 Bakers exempel, bachelor Baker tar upp ett exempel med ordet bachelor/bachelors och spinster/spinsters. BNC, 100 milj. ord. Vilka ord omger och modifierar bachelor och spinster? Vad säger detta om våra attityder till företeelserna? Baker fann......generellt att bachelor hade mer positiva konnotationer än spinster....att fler betydelseaspekter av bachelor kunde urskiljas (examen, livsstil, egenskaper). Kollokationer ett sätt att underlätta arbetet med att sovra i kontexten. OBS! att analysen inte görs automatiskt. INGET program gör ALLT! Korpusmått, korpusbalans och korpusrepresentativitet 12(46)

13 Intressanta återkommande mönster Vilka återkommande mönster är intressanta och vilka är det inte? Wordsmith kan räkna fram vilka kollokationer som är mer intressanta än andra, kollokationsstyrka genom t.ex. MI (mutual information). För att kunna söka på vilka ord man vill och verkligen få fram intressanta mönster krävs en rätt stor korpus. Olika algoritmer rankar kollokationsstyrka på olika sätt (se Baker:102). (Vi kommer inte att gå in på detta i detalj, bara nämna att olika ansatser kan ge något olika resultat). Korpusmått, korpusbalans och korpusrepresentativitet 13(46)

14 Kollokationer Med hjälp av kollokationsverktyget görs inte en analys, men verktyget tar fram alternativ som forskaren kan gå vidare med. I Bakers exempel med bachelor fås genom kollokationer en uppsättning ord att undersöka vidare. Orden behöver kategoriseras (i semantiska kategorier, t.ex. positiv/negativ). Orden behöver undersökas vidare för att man skall få belägg för valören positiv/negativ. Korpusmått, korpusbalans och korpusrepresentativitet 14(46)

15 Nyckelord Nyckelord ger information om vad en text handlar om. Nyckelord är inte nödvändigtvis de mest frekventa innehållsorden i en text. De identifieras genom att statistiskt jämföra ordfrekvenser mellan målkorpus och en större referenskorpus (benchmark). Nyckelord utgörs av ord som är speciella för en viss text. Det är alltså ord som kan vara lågfrekventa i en större samling texter, men relativt mer högfrekventa i ett (eller ett par) dokument. Nyckelordet karakteriserar innehållet eller diskursen inom ett visst dokument eller en viss textsamling. Korpusmått, korpusbalans och korpusrepresentativitet 15(46)

16 Nyckelord Positiva nyckelord: signifikant frekventa ord Negativa nyckelord: signifikant infrekventa/underrepresenterade ord, ord som förekommer mindre sällan i målkorpus än förväntat jämfört med en stor referenskorpus. Korpusmått, korpusbalans och korpusrepresentativitet 16(46)

17 Bakers exempel: referat Baker har gjort en undersökning av diskursen i resebroschyrer från club Mer precist vill han undersöka huruvida bolaget anspelar på sun, fun and sex i sin reklam samt uppmuntrat till högt alkoholintag på sina resmål, något som tidigare påståtts om bolaget, och som bolaget påstått sig ha arbetat bort. Baker har baserat sin undersökning på en frekvensanalys, där han sedan gått vidare och närstuderat ett antal specifika ord. Korpusmått, korpusbalans och korpusrepresentativitet 17(46)

18 Bakers experiment En liten korpus, token. 12 korta texter. Frekvensordlista i Wordsmith. Råfrekvenser, eftersom alla jämförelser görs inom samma korpus, ej delkorpusar eller underkorpusar. Funktionsord sorteras bort. De mest frekventa innehållsorden har analyserats vidare avseende kluster i Wordsmith samt demografisk utbredning med hjälp av BNC Web. Korpusmått, korpusbalans och korpusrepresentativitet 18(46)

19 Bar bars Ett högfrekvent ord visade sig vara bar bars. (Frekvensordlista). bar bars undersöks avseende kluster med ett fönster om tre ord. Man finner bars and clubs, och söker vidare avseende alkoholintag. Baker anser att han utifrån de korpusresultat han finner inte kan hävda att club aktivt uppmuntrat till alkoholintag. Korpusmått, korpusbalans och korpusrepresentativitet 19(46)

20 Verb Efter att ha undersökt nomen undersöker Baker verb. Han finner höga frekvenser för verb som sleep, book, want (se Baker sid. 58). Dessa sorteras dock bort eftersom de i hög grad relaterar till detaljer i rumsbeskrivningarna, och kvarstår gör verb som miss, chill, relax, work. Med kluster finner han don t miss out, chill out, make sure, work 2 live, work on your tan. Korpusmått, korpusbalans och korpusrepresentativitet 20(46)

21 Formell informell Baker bedömer vissa ord och ordkombinationer som informella (chill out, heaps of bars). För att verifiera att språket är informellt kontrollerar Baker dessa termer mot BNC Web, där det finns möjlighet att kontrollera frekvenser i tal och text samt över olika demografiska variabler. På detta sätt kan Baker alltså verifiera sina hypoteser om att språket är mer informellt, att vissa ord företrädesvis används av män eller kvinnor, unga eller gamla etc. Korpusmått, korpusbalans och korpusrepresentativitet 21(46)

22 Resultat Explicita referenser till alkohol och sex, som researrangörerna blivit anklagade för tidigare, förekommer inte i de broschyrer som undersöks. Baker påstår dock att budskapet ändå finns implicit. Club ser de semesterfirare de vänder sig till som individer som är intresserade av information om platser att inta alkohol på, att de förmodligen behöver chilla och att de behöver hämta sig efter baksmälla. Baker kommenterar också på bilderna som finns i broschyrerna, och anser att dessa stöder de tolkningar han gjort. Korpusmått, korpusbalans och korpusrepresentativitet 22(46)

23 LIX - Läsbarhetsindex mått på hur avancerad en text är (Björnsson, 1968) antalet ord (O) och antalet meningar (M) i texten viktas mot antalet långa ord (L) (>6) i hela texten. LIX = O/M + L*100/O Barnböcker: - 25; Enkla texter: 25-30; Normal: 30-40; Sakinfo: (tidning); Facktext: (officiell); Svår facktext: >60 (byråkrat) Exempel: Texten innehåller 450 ord i 25 meningar, varav 115 är över 6 bokstäver. O=450, M=25, L=115 (450/25) + (115*100) / 450 = 43 LIX-räknare: Korpusmått, korpusbalans och korpusrepresentativitet 23(46)

24 Repetition: termer Konkordans: en lista med ord där träffarna vanligen centrerade och omgivna av sin kontext, kallas också KWIC (keyword-in-context) Kollokation: ord som förekommer tillsammans inom ett visst avstånd oftare än slumpen, ett ordsammanhang som ett ord kan eller brukar ingå i, t.ex. idiom, fasta fraser Kollokat: ord som ingår i en kollokation Nyckelord: innehållsord som återger det texten handlar om och förekommer mer frekvent i en text än vad vi skulle förvänta oss av slumpen Frekvenslista: en sorterad lista som visar antal förekomster av en enhet, t.ex. token, typ eller lemma i en korpus Korpusmått, korpusbalans och korpusrepresentativitet 24(46)

25 Representativitet och balans Använder man sig av korpora är det alltid viktigt att man som användare vet hur de är uppbyggda. Två viktiga begrepp vid korpusundersökningar: Representativitet Hur väl passar korpusen min frågeställning? Balans Vad kan jag vänta mig av min korpus i form av skevheter? Korpusen som standardreferens Korpusmått, korpusbalans och korpusrepresentativitet 25(46)

26 Viktiga egenskaper hos korpusar En korpus i modern lingvistik är inte bara en eller flera texter utan med begreppet korpus följer också: Ett maskinläsbart format. Ett representativt urval. En standardreferens. (Ett balanserat urval). Korpusmått, korpusbalans och korpusrepresentativitet 26(46)

27 Korpusurval och representativitet Korpusar fungerar som ett representativt stickprov av en (mycket större) population (t.ex. ett språk) med ett syfte i åtanke. Biber ( Representativeness in corpus design, 1993) diskuterar representativitet i texturval för korpusar. Vad är mitt universum? Definiera populationen ( sampling frame ) Hur är detta universum strukturerat? Fastställ den hierarkiska strukturen i populationen ( strata ) - genre, texttyper, ursprung Hur skall korpusen struktureras? Skall korpustexten utgöras av hela texter eller kortare sampel? Storlek? Bestäm storleken (vad är den optimala storleken?). Korpusmått, korpusbalans och korpusrepresentativitet 27(46)

28 En standardreferens Man skiljer ibland på representativitet och balans. När man talar om en korpus som en standardreferens menar man att korpusen kan ses som representativ för allmänt språk. För att uppfylla detta anses ofta att korpusen skall vara balanserad, dvs innehålla material från alla (?) genrer/texttyper. Korpusmått, korpusbalans och korpusrepresentativitet 28(46)

29 En balanserad korpus En balanserad korpus (generell eller specialiserad) täcker många olika textkategorier. Man utgår normalt från redan befintliga korpusmodeller när de bygger sina egna. Exempel: BNC fungerade som mall för ANC, SUC, Koreansk nationell korpus, Polsk nationell korpus. Korpusmått, korpusbalans och korpusrepresentativitet 29(46)

30 BNC 100 miljoner ord: 90 % skriven, 10 % transkriptioner av tal kriterier för skrivna texter: domän: innehåll tid: när texten producerades medium: typ av publikation (böcker, tidskrifter, ej publicerade manuskript) kriterier för talat material: demografisk: åldersgrupp, kön, samhällsklass, region sammanhang: möten, föreläsningar, radiosändningar Korpusmått, korpusbalans och korpusrepresentativitet 30(46)

31 Sammansättning av skrivet material i BNC DOMÄN % TID % Skönlitteratur 21, ,26 Konst 8, ,23 Tro och tanke 3,40 Ej klassificerad 8,49 Marknad/finans 7,93 MEDIUM % Fritid 11,13 Bok 58,58 Naturvetenskap 4,18 Tidskrift 31,08 Tillämpad vetenskap 8,21 Misc. publicerad 4,38 Samhällsvetenskap 14,80 Misc. ej publicerad 4,00 Världspolitik 18,39 Talad 1,52 Ej klassificerad 1,93 Ej klassificerad 0,40 Korpusmått, korpusbalans och korpusrepresentativitet 31(46)

32 Sammansättning av talmaterial i BNC REGION % SAMMANHANG % Söder 45,61 Utbildning 20,56 Mitten 23,33 Affärer 21,47 Nord 25,43 Institutionell 21,86 Ej klassificerad 5,61 Fritid 23,71 Ej klassificerad 12,38 INTERAKTION % Monolog 18,64 Dialog 74,87 Ej klassificerad 6,48 Korpusmått, korpusbalans och korpusrepresentativitet 32(46)

33 Korpusbalans In selecting texts for inclusion in the corpus, account was taken of both production, by sampling a wide variety of distinct types of material, and reception, by selecting instances of those types which have a wide distribution. Thus, having chosen to sample such things as popular novels, or technical writings, best-seller lists and library circulation statistics were consulted to select particular examples of them. (Aston and Burnard s (1998) summary of the design criteria of the BNC). Korpusmått, korpusbalans och korpusrepresentativitet 33(46)

34 SUC Hur gjorde de? Stockholm Umeå Corpus SUC. 1 miljon löpord fördelade på 500 excerpt om 2000 ord (liten). Svensk 1990-talstext. Balanserad......enligt kriteria från tidigare projekt (Brown!) Brown: the collection of books and periodicals in the Brown university and the Providence Athenaeum (Biber, 1993, B1)...och ekonomiska ramar! SGML-format, TEI-kompatibel. Korpusmått, korpusbalans och korpusrepresentativitet 34(46)

35 Kriteria för insamling av SUC (1) (1) Balanserad korpus: Omfattar olika texttyper och olika stilistiska nivåer. Kontrollera förlagskataloger. (2) Skall spegla vad en person kan förväntas ha läst (jfr Atkins et al., B1129; reception production) på tidigt 1990-tal (men jämför med senare kriteria). Kontrollera biblioteksstatistik. Korpusmått, korpusbalans och korpusrepresentativitet 35(46)

36 Kriteria för insamling av SUC (2) (3) SUC innehåller enbart svensk originaltext, inga översättningar. Detta sätter möjligen kriterium 2 något ur spel. (4) Alla texter i korpusen skall vara möjliga att gratis distribuera för icke-kommersiell forskning, d.v.s. copyright-frågor måste lösas. Var mycket noga med licensavtal med textgivarna!...vad tillåter licensavtalen att du gör med korpusen när du väl är färdig? Korpusmått, korpusbalans och korpusrepresentativitet 36(46)

37 Kriteria för insamling av SUC (3) (5) Korpusen skulle bara innehålla publicerad text, d.v.s. inga privata brev etc. Detta för med sig implikationer på flera nivåer, t.ex. taggning & taggset. (6) Så länge det inte står i konflikt med andra principer skall urvalet av texter vara parallellt med det i Brown och LOB korpora, så att komparativa studier kan göras. Detta kan göra korpora jämförbara både synkront och diakront. Korpusmått, korpusbalans och korpusrepresentativitet 37(46)

38 Kriteria för insamling av SUC (4) (7) Texterna skulle finnas i maskinläsbar form, eftersom det inte fanns resurser till inscanning av nya data. Detta kriterium fick vägas mot balans och parallelism (en del texter fick trots allt scannas in...). På tidigt 1990-tal sparade förlagen en hel del som papperskopior. Korpusmått, korpusbalans och korpusrepresentativitet 38(46)

39 Kriteria för insamling av SUC (5) Den lista av material som svarade mot alla kriterier ovan kan sägas utgöra populationen för SUC. Den lista av böcker, tidningsmaterial etc. som faktiskt valdes ur populationen (och som står upptagen i SUC:s bibliografifil) är samplingsramen. Varje artikel i samplingsramen utgör en samplingsenhet. Vad som till slut förekommer i korpusen är i de flesta fall ett excerpt ur en samplingsenhet (ca 2000 ord). Korpusmått, korpusbalans och korpusrepresentativitet 39(46)

40 Samplingsdimensioner i SUC Språk: Svenska Ursprung: Svenskt Kanal: Text/Prosa Intervall: 1990-talet Formalitetsgrad: Publicerad text Interaktivitet: Monolog Riktning: Svensk genomsnittsläsare Korpusmått, korpusbalans och korpusrepresentativitet 40(46)

41 Genrekategorisering SUC Facklitteratur A Press: Reportage B Press: Ledare/Debatt C Press: Recensioner E Arbete och fritid F Populärvetenskap G Biografier, essäer H Blandat J Lärda och vetenskapliga texter Skönlitteratur K Skönlitteratur Korpusmått, korpusbalans och korpusrepresentativitet 41(46)

42 En balanserad korpus Går det??? Vissa forskare anser att en balanserad korpus är en illusion. En korpus kan vara representativ utan att vara balanserad och balanserad utan att vara representativ. Representativitet relation mellan frågeställning och korpus. Balans relation mellan korpus och population. Om vi har en standardreferens för ett språk kan vi exempelvis jämföra mer specifika genrer (sporttext, modetidningar) mot denna standardreferens och finna drag som är specifika för denna genre. SUC brukar användas som standardreferens för svenska korpusundersökningar. Korpusmått, korpusbalans och korpusrepresentativitet 42(46)

43 Att bygga en korpus Om man inte hittar en korpus som passar för den tilltänkta undersökningen, måste man själv bygga en korpus. Hur bygger man en korpus? Hur skulle du gå till väga för att samla material och vilka problem ser du för varje steg? Korpusmått, korpusbalans och korpusrepresentativitet 43(46)

44 Laboration 3 Skapa ordlistor från en text Frekvensanalys Löpord, typ Konkordanslistor Kluster Kollokationer Nyckelord Korpusmått, korpusbalans och korpusrepresentativitet 44(46)

45 Om labbrapporter Titel, Författare, Kursnamn, Termin, År Introduktion: relevans, syfte, frågeställning Ev. Bakgrund: tidigare arbeten, förklara termer/begrepp Metod, Genomförande, Data, Verktyg Resultat, utvärdering Diskussion: jämför ev. dina resultat med andras där det går. Sammanfattning: svara på fråga Ev. Acknowledgments: tack! Referenser Korpusmått, korpusbalans och korpusrepresentativitet 45(46)

46 Nästa gång Att bygga en korpus Korpusannotering Muntlig redovisning Korpusmått, korpusbalans och korpusrepresentativitet 46(46)

Korpusuppbyggnad Från textsamling till korpus

Korpusuppbyggnad Från textsamling till korpus Korpusuppbyggnad Från textsamling till korpus Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusuppbyggnad Från textsamling till korpus 1(53)

Läs mer

Korpussökning och korpusmått 1(44)

Korpussökning och korpusmått 1(44) Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer

Läs mer

Korpusundersökningar, referat

Korpusundersökningar, referat Korpusundersökningar, referat Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusundersökningar, referat 1(38) Förra gången Korpustyper Korpusdistributörer

Läs mer

Förslag den 25 september Engelska

Förslag den 25 september Engelska Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

ENGELSKA. Ämnets syfte. Kurser i ämnet

ENGELSKA. Ämnets syfte. Kurser i ämnet ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Ämne - Engelska. Ämnets syfte

Ämne - Engelska. Ämnets syfte Ämne - Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap 729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019 Labb 1: KORP vid

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019 Labb 1: KORP vid

Läs mer

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt Kursplan ENGELSKA Ämnets syfte Undervisningen i ämnet engelska ska syfta till att deltagarna utvecklar språk- och omvärldskunskaper så att de kan, vill och vågar använda engelska i olika situationer och

Läs mer

ENGELSKA FÖR DÖVA. Ämnets syfte

ENGELSKA FÖR DÖVA. Ämnets syfte ENGELSKA FÖR DÖVA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande: ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Svenska Läsa

Svenska Läsa Svenska Läsa utvecklar sin fantasi och lust att lära genom att läsa litteratur samt gärna läser på egen hand och av eget intresse, utvecklar sin förmåga att läsa, förstå, tolka och uppleva texter av olika

Läs mer

Förslag den 25 september Moderna språk

Förslag den 25 september Moderna språk Moderna språk Moderna språk är ett ämne som kan innefatta en stor mängd språk. Dessa kan sinsemellan vara mycket olika vad gäller allt från skriftsystem och uttal till utbredning och användning inom skiftande

Läs mer

Anvisningar till rapporter i psykologi på B-nivå

Anvisningar till rapporter i psykologi på B-nivå Anvisningar till rapporter i psykologi på B-nivå En rapport i psykologi är det enklaste formatet för att rapportera en vetenskaplig undersökning inom psykologins forskningsfält. Något som kännetecknar

Läs mer

ÄLTA SKOLAS LOKALA KURSPLAN

ÄLTA SKOLAS LOKALA KURSPLAN 1(6) Förskoleklass mål för förskoleklass Exempel på genomförande Strävansmål mot år 2 få fonologisk medvetenhet känna lust att lära genom att LÄSA få möjlighet till att LYSSNA, TALA och BERÄTTA utveckla

Läs mer

Checklista för systematiska litteraturstudier 3

Checklista för systematiska litteraturstudier 3 Bilaga 1 Checklista för systematiska litteraturstudier 3 A. Syftet med studien? B. Litteraturval I vilka databaser har sökningen genomförts? Vilka sökord har använts? Har författaren gjort en heltäckande

Läs mer

Kursplan i svenska som andraspråk grundläggande GRNSVA2

Kursplan i svenska som andraspråk grundläggande GRNSVA2 Kursplan i svenska som andraspråk grundläggande GRNSVA2 Kursen ger elever med annat modersmål än svenska en möjlighet att utveckla sin förmåga att kommunicera på svenska. Ett rikt språk ger ökade förutsättningar

Läs mer

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10 Källkritik - om att kritiskt granska och värdera information Ted Gunnarsson 2014-04-10 Källkritik - Innehåll Vad är källkritik? Varför källkritik? De källkritiska kriterierna Exempel på källkritiska frågor

Läs mer

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik?

Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik? Metoder och tillämpningar inom språkteknologin - ht 07 Korpuslingvistik Innehåll Vad är en korpus? Vad är korpuslingvistik? Korpusurval och sammanställning Annotering Korpusexempel Parallellkorpusar Internet

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna

Läs mer

DHGI!J*%$2(44!@!F-&&>$*6&6<1%(&5$,!5!KC4%.(4. A-C Ernehall, Fässbergsgymnasiet, Mölndal www.lektion.se

DHGI!J*%$2(44!@!F-&&>$*6&6<1%(&5$,!5!KC4%.(4. A-C Ernehall, Fässbergsgymnasiet, Mölndal www.lektion.se Svenska "#$%&'(&)*+'$,-*$,,*$.&'()/&0123-4)$*.56*$74$',$*(/'0118%59$*(0928,#$9'4('8%&'():;$%01.5,,&)*+''(%.88,,*

Läs mer

Prövning i Engelska 5, ENGENG05, 100 poäng

Prövning i Engelska 5, ENGENG05, 100 poäng Prövning i Engelska 5, ENGENG05, 100 poäng Här följer information om prövning, skriftlig och muntlig del, kursplan samt länkar till Skolverkets sida med exempel från tidigare nationella prov. 1. Skriftlig

Läs mer

Att bygga en korpus. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se

Att bygga en korpus. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Att bygga en korpus Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Att bygga en korpus 1(42) Förra gången Mer om ordfrekvenser, nyckelord, kollokationer

Läs mer

Vetenskaplig metodik

Vetenskaplig metodik Vetenskaplig metodik Vilka metoder används? Vi kan dela in metoder i flera grupper: Deduktiva metoder Metoder för hantering av experiment Metoder för publicering och liknande. Från föreläsning 3 Föreläsningen

Läs mer

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41) Korpusar Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusar 1(41) Förra gången Kursinformation Empiriska studier av språk Kvantitativa vs.

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny

Läs mer

TDDD02 Föreläsning 7 HT-2013

TDDD02 Föreläsning 7 HT-2013 TDDD02 Föreläsning 7 HT-2013 Textsammanfattning Lars Ahrenberg Litt: Våge et al.170-185; Das & Martins, A Survey on Automatic Text Summarization sid 1-4, 11-14, 23-25. Översikt Textstruktur Problemet textsammanfattning

Läs mer

Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN:

Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: Prövning Engelska 7, 100 p Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: 978-91-47-9196-6 Dessutom ska du läsa en av följande böcker: Joseph Conrad, Heart of Darkness Charles

Läs mer

Arbeta med Selected Works en lathund

Arbeta med Selected Works en lathund Arbeta med Selected Works en lathund Att redigera din egen Selected Works-sida Ta fram din sida och logga in via My Account längts ner på sidan. Klicka på Edit My Site för att redigera sidan. Gå nu vidare

Läs mer

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

Bilaga 18: Ämnesplan svenska för döva Skolverkets förslag till förändringar - Nationella it-strategier (U2015/04666/S) Dnr 6.1.

Bilaga 18: Ämnesplan svenska för döva Skolverkets förslag till förändringar - Nationella it-strategier (U2015/04666/S) Dnr 6.1. Svenska för döva SVN Svenska för döva Kärnan i ämnet svenska för döva är tvåspråkighet, svenska språket och litteratur. Språket är människans främsta redskap för reflektion, kommunikation och kunskapsutveckling.

Läs mer

Statens skolverks författningssamling

Statens skolverks författningssamling Statens skolverks författningssamling ISSN 1102-1950 Förordning om ämnesplaner för de gymnasiegemensamma ämnena; Utkom från trycket den 1 mars 2011 utfärdad den 2 december 2010. Regeringen föreskriver

Läs mer

Mål som eleverna skall ha uppnått i slutet av femte skolåret Eleverna skall:

Mål som eleverna skall ha uppnått i slutet av femte skolåret Eleverna skall: SVENSKA - SPRÅKUTVECKLING Med språkutveckling menar vi: Genom språket sker kommunikation och samarbete med andra. Svenskämnet syftar till att tillsammans med andra ämnen i skolan utveckla elevernas kommunikationsförmåga,

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ Engelska, 450 verksamhetspoäng Ämnet handlar om hur det engelska språket är uppbyggt och fungerar samt om hur det kan användas. Det engelska språket omger oss i vardagen och används inom så skilda områden

Läs mer

översikt som visar centralt innehåll i GY 11 i relation till innehåll i Ämnets syfte 1 SVENSKA RUM 1

översikt som visar centralt innehåll i GY 11 i relation till innehåll i Ämnets syfte 1 SVENSKA RUM 1 Tala & SAMTALA Ämnets syfte översikt som visar centralt innehåll i GY 11 i relation till innehåll i KURSLÄROMEDLET Svenska rum 1. Svenska rum 1, allt-i-ett-bok Kunskapskrav 1. Förmåga att tala inför andra

Läs mer

Svenska som andraspråk

Svenska som andraspråk Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny kunskap, klara vidare

Läs mer

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Kursplan: SVENSKA Ämnets syfte Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Förmåga att tala inför andra på ett sätt som är lämpligt i kommunikationssituationen

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Checklista för systematiska litteraturstudier*

Checklista för systematiska litteraturstudier* Bilaga 1 Checklista för systematiska litteraturstudier* A. Syftet med studien? B. Litteraturval I vilka databaser har sökningen genomförts? Vilka sökord har använts? Har författaren gjort en heltäckande

Läs mer

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied? This is England 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied? 2. Is Combo s speech credible, do you understand why Shaun wants to stay with Combo?

Läs mer

Prövning i grundläggande Engelska

Prövning i grundläggande Engelska allmän mall Malmö stad Komvux Malmö Södervärn Prövning i grundläggande Engelska A. Skriftligt prov 1 Läsförståelse, ordkunskap ca 80 minuter 2 Hörförståelse ca 45 minuter 3 Uppsatsskrivning ca 80 minuter

Läs mer

Automatisk extraktion av idiom ur text ANDREAS PETTERSSON

Automatisk extraktion av idiom ur text ANDREAS PETTERSSON Automatisk extraktion av idiom ur text ANDREAS PETTERSSON Examensarbete Stockholm, Sverige 2012 Automatisk extraktion av idiom ur text ANDREAS PETTERSSON 2D1021, Examensarbete i datalogi om 30 högskolepoäng

Läs mer

Korpusanalyser och Lab G09 Språkvetenskaplig databehandling

Korpusanalyser och Lab G09 Språkvetenskaplig databehandling Korpusanalyser och Lab 4 729G09 Språkvetenskaplig databehandling 2014-05-21 Laborationens syfte Öva användningen av webbaserade korpusar och korpusverktyg frekvensberäkningar konkordanser kollokationsverktyg

Läs mer

Förslag den 25 september Engelska

Förslag den 25 september Engelska Engelska Språk är människans främsta redskap för att tänka, kommunicera och lära. Att ha kunskaper i flera språk kan ge nya perspektiv på omvärlden, ökade möjligheter till kontakter och större förståelse

Läs mer

Anvisningar för skriftlig rapport av fältstudien Hälsans villkor i HEL-kursen

Anvisningar för skriftlig rapport av fältstudien Hälsans villkor i HEL-kursen Anvisningar för skriftlig rapport av fältstudien Hälsans villkor i HEL-kursen Kursen Hälsa, Etik och Lärande 1-8p, T1, Vt 2006 Hälsouniversitetet i Linköping 0 Fältstudien om hälsans villkor i ett avgränsat

Läs mer

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc.

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc. Matris och checklista för språkprogression IMSPR1 (jobbar mot nivå A1-/A1) - Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc. - Kan skriva en enkel

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng, grundnivå, huvudområde: språkteknologi Syfte: Kursen skall förmedla

Läs mer

Undervisningen ska erbjuda möjlighet till anpassning av stoff efter elevernas intresse och utbildning.

Undervisningen ska erbjuda möjlighet till anpassning av stoff efter elevernas intresse och utbildning. SVENSKT TECKENSPRÅK Ett välutvecklat teckenspråk är av betydelse för dövas och hörselskadades lärande i och utanför skolan. När språket utvecklas ökar förmågan att reflektera över, förstå, värdera och

Läs mer

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011

Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011 Kort om Coxheads Academic Word List Emma Sköldberg, maj 2011 Två viktiga artiklar Coxhead, A. 2000: A New Academic Word List (TESOL Quarterly 34:2, 2000, 213-238). Coxhead, A. 2002: The Academic Word List:

Läs mer

Aspekt Nivå 1 Nivå 2 Nivå 3

Aspekt Nivå 1 Nivå 2 Nivå 3 Bedömningsmatris i engelska Elev: Årskurs: Termin: Aspekt Nivå 1 Nivå 2 Nivå 3 Hörförståelse: Uppfattar det Förstår det huvudsakliga Förstår både helhet och förstå, återge huvudsakliga innehållet och några

Läs mer

Elementära verktyg för korpusbearbetning

Elementära verktyg för korpusbearbetning Elementära verktyg för korpusbearbetning Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng. Ämne: Språkteknologi. Nivå: A Syfte: Kursen behandlar

Läs mer

Översättningsuniversalier i svenska översatta texter

Översättningsuniversalier i svenska översatta texter EXAMENSARBETE VT 2014 MASTER I ÖVERSÄTTNING Specialisering i engelska Språk- och litteraturcentrum Översättarutbildningen Översättningsuniversalier i svenska översatta texter En undersökning av tecken

Läs mer

SVENSKA. Lokal kursplan för ämnet Svenska. Kungsmarksskolan Strävansmål år 9

SVENSKA. Lokal kursplan för ämnet Svenska. Kungsmarksskolan Strävansmål år 9 Kungsmarksskolan 2007-08-16 SVENSKA Lokal kursplan för ämnet Svenska. Strävansmål år 9 Skolan skall i sin undervisning i svenska sträva efter att eleven: - utvecklar sin fantasi och lust att lära genom

Läs mer

Business research methods, Bryman & Bell 2007

Business research methods, Bryman & Bell 2007 Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data

Läs mer

Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska

Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska Engelska Kurskod: GRNENG2 Verksamhetspoäng: 450 Det engelska språket omger oss i vardagen och används inom så skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens

Läs mer

MÅL OCH BETYGSKRITERIER I SVENSKA

MÅL OCH BETYGSKRITERIER I SVENSKA MÅL OCH BETYGSKRITERIER I SVENSKA MÅL ATT UPPNÅ I ÅR 7 Delta i samtal samt lyssna på andra Redovisa ett arbete muntligt utifrån stödord om något man sett, läst, hört eller upplevt Kunna läsa och tillgodogöra

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Writing with context. Att skriva med sammanhang

Writing with context. Att skriva med sammanhang Writing with context Att skriva med sammanhang What makes a piece of writing easy and interesting to read? Discuss in pairs and write down one word (in English or Swedish) to express your opinion http://korta.nu/sust(answer

Läs mer

Tekniker för storskalig parsning: Grundbegrepp

Tekniker för storskalig parsning: Grundbegrepp Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Prövning i Moderna språk 5

Prövning i Moderna språk 5 Prövning i Moderna språk 5 Prövningsansvarig lärare: Franska: Catherine Tyrenius, email: catherine.tyrenius@vellinge.se Spanska: Antonio Vazquez, email: antonio.s.vazquez@vellinge.se Tyska: Renate Nordenfelt

Läs mer

Workplan Food. Spring term 2016 Year 7. Name:

Workplan Food. Spring term 2016 Year 7. Name: Workplan Food Spring term 2016 Year 7 Name: During the time we work with this workplan you will also be getting some tests in English. You cannot practice for these tests. Compulsory o Read My Canadian

Läs mer

Ämnets syfte. Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande:

Ämnets syfte. Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Kursplan: Svenska Ämnets syfte Undervisningen i ämnet svenska ska ge eleverna förutsättningar att utveckla följande: Förmåga att tala inför andra på ett sätt som är lämpligt i kommunikationssituationen

Läs mer

Engelska 7, ENGENG07, 100 p

Engelska 7, ENGENG07, 100 p Prövning Engelska 7, ENGENG07, 100 p Lärobok och litteratur McKay/Brodin/Clayton/Webster, Blueprint C, ISBN: 978-91-47-9196-6 En list på litterära verk skickas ut av läraren till studenterna. Romanerna

Läs mer

Förändring, evidens och lärande

Förändring, evidens och lärande Förändring, evidens och lärande Runo Axelsson Professor i Health Management Den svenska utvecklingen Traditionell organisation Enkel men auktoritär struktur, byggd på militära ideal. Byråkratisering (1960/70-talet)

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Kvantitativ samhällsanalys med språkteknologiska metoder.

Kvantitativ samhällsanalys med språkteknologiska metoder. Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar

Läs mer

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp UNIVERSITY OF Richard Johansson November 11, 2015 dagens presentation sökverktyget Korp Språkbankens korpusar: vilka nns och hur

Läs mer

Skrivstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig

Skrivstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig 1 Skrivstrategier En framgångsrik språkinlärare: Tror på sin förmåga att lära sig Är motiverad Är medveten om varför hon/han vill lära sig Är inte rädd för att göra misstag Tar risker Är bra på att gissa

Läs mer

Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet engelska

Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet engelska Betyg i årskurs 6 Betyg i årskurs 6, respektive årskurs 7 för specialskolan, träder i kraft hösten 2012. Under läsåret 2011/2012 ska kunskapskraven för betyget E i slutet av årskurs 6 respektive årskurs

Läs mer

ENGELSKA 3.2 ENGELSKA

ENGELSKA 3.2 ENGELSKA 3.2 GELSKA Språk är människans främsta redskap för att tänka, kommunicera och lära. Att ha kunskaper i flera språk kan ge nya perspektiv på omvärlden, ökade möjligheter till kontakter och större förståelse

Läs mer

Prövning i grundläggande engelska: GRNENG 2

Prövning i grundläggande engelska: GRNENG 2 prövning engelska grund Malmö stad Komvux Malmö Södervärn Prövning i grundläggande engelska: GRNENG 2 A Muntligt prov 1. Samtal kring ett ämne som delas ut vid provet. 2. Romanredovisning (både muntlig

Läs mer

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande: MODERNA SPRÅK Moderna språk är ett ämne som kan innefatta en stor mängd språk. Dessa kan sinsemellan vara mycket olika vad gäller allt från skriftsystem och uttal till utbredning och användning inom skiftande

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Svenska 1 Centralt innehåll och Kunskapskrav

Svenska 1 Centralt innehåll och Kunskapskrav Svenska 1 Centralt innehåll och Kunskapskrav Varför svenska? Vi använder språket för att kommunicera, reflektera och utveckla kunskap uttrycka vår personlighet lära känna våra medmänniskor och vår omvärld

Läs mer

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga data Används traditionellt om alla verk av en viss typ,

Läs mer

Korp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016

Korp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016 Korp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/korplabb/ sb-korp@svenska.gu.se 17 oktober 2016 ÖVERSIKT Korp är Språkbankens korpusverktyg och en väsentlig del av vår korpusinfrastruktur.

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Kursintroduktion 2015-04-08 Lars Ahrenberg 1 Plan Kursens innehåll och organisation Text, språk och datorer Textformat och textrepresentationer Korpuslingvistik

Läs mer

Koppling mellan styrdokumenten på naturvetenskapsprogrammet och sju programövergripande förmågor

Koppling mellan styrdokumenten på naturvetenskapsprogrammet och sju programövergripande förmågor Koppling mellan styrdokumenten på naturvetenskapsprogrammet och sju programövergripande förmågor Förmåga att Citat från examensmålen för NA-programmet Citat från kommentarerna till målen för gymnasiearbetet

Läs mer

Funäsdalens skola VT 2008 LOKAL PLANERING SVENSKA FUNÄSDALENS CENTRALSKOLA

Funäsdalens skola VT 2008 LOKAL PLANERING SVENSKA FUNÄSDALENS CENTRALSKOLA Funäsdalens skola VT 2008 LOKAL PLANERING SVENSKA FUNÄSDALENS CENTRALSKOLA Nationella mål att sträva mot i ämnet svenska Skolan skall i sin undervisning i svenska sträva efter att eleven 1 utvecklar sin

Läs mer

Svenska mål och kriterier

Svenska mål och kriterier Svenska mål och kriterier Mål att sträva mot Vi strävar mot att varje elev ska - utveckla sin fantasi och lust att lära genom att läsa litteratur samt gärna läser på egen hand och av eget intresse. - utveckla

Läs mer

ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?

ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET? ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET? JOHAN FRID, HUMANISTLABORATORIET Lunds Matematiska Sällskap, Lund 7 November 2017 Humanistlaboratoriet

Läs mer

ENGELSKA FÖR DÖVA OCH HÖRSELSKADADE

ENGELSKA FÖR DÖVA OCH HÖRSELSKADADE ENGELSKA FÖR DÖVA OCH HÖRSELSKADADE Språk är människans främsta redskap för att tänka, kommunicera och lära. Att ha kunskaper i flera språk kan ge nya perspektiv på omvärlden, ökade möjligheter till kontakter

Läs mer

Kursplan - Grundläggande svenska som andraspråk

Kursplan - Grundläggande svenska som andraspråk 2012-11-06 Kursplan - Grundläggande svenska som andraspråk Grundläggande svenska som andraspråk innehåller fyra delkurser: Del 1, delkurs 1 (200 poäng) GRNSVAu Del 1, delkurs 2 (200 poäng) GRNSVAv Del

Läs mer

Momentguide: Samhällsvetenskaplig metod

Momentguide: Samhällsvetenskaplig metod Momentguide: Samhällsvetenskaplig metod Naturvetenskap kan verka komplicerat med matematiska formler, fysikens lagar och periodiska systemet. Men tar man till sig systematiken går det å andra sidan ofta

Läs mer

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar Sjuksköterskeprogrammet T3 Maj 2015 Camilla Persson camilla.persson@umu.se Idag tittar vi på: Repetition av sökprocessen: förberedelser

Läs mer

Annette Lennerling. med dr, sjuksköterska

Annette Lennerling. med dr, sjuksköterska Annette Lennerling med dr, sjuksköterska Forskning och Utvecklingsarbete Forskning - söker ny kunskap (upptäcker) Utvecklingsarbete - använder man kunskap för att utveckla eller förbättra (uppfinner) Empirisk-atomistisk

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK De första grunderna i språket, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta återkommande och rutinmässiga kommunikationssituationer.

Läs mer

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik

Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Eva Pettersson eva.pettersson@lingfil.uu.se 2016-11-09 Förra gången Kursmål och kursintroduktion Språkteknologiska tillämpningar OCR - Dialogsystem

Läs mer

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare Fibonacci / översättning från engelska IBSE Ett självreflekterande(självkritiskt) verktyg för lärare Riktlinjer för lärare Vad är det? Detta verktyg för självutvärdering sätter upp kriterier som gör det

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING,

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, , Det andra inhemska språket och främmande språk, Grunderna för läroplanen för den grundläggande utbildningen 2014 Kunskapsnivå A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta

Läs mer

SVENSKA. Ämnets syfte

SVENSKA. Ämnets syfte SVENSKA Kärnan i ämnet svenska är språk och litteratur. Språket är människans främsta redskap för reflektion, kommunikation och kunskapsutveckling. Genom språket kan människan uttrycka sin personlighet,

Läs mer