Korp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016

Relevanta dokument
Kort presentation av Korp, Sveriges nationalkorpus

GU-ISS Korp 6 - Användarmanual

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Karp. Övningar Språkbankens höstworkshop oktober 2016

GU-ISS Korpblickar. om möjliga ingångar med sökverktyget Korp för studier av orden tänka och tanke i korpusar.

SPF/MiRiaM Manual avancerad sökning

INNEHÅLLSFÖRTECKNING... 1 INLEDNING ORDBOKEN I VERKTYGSLISTEN ORDBOKEN... 3

Grim. Några förslag på hur du kan använda Grim. Version 0.8

I dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning.

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

Manual för bemanning i operationsprogrammet

Karp. Övningar Språkbankens höstworkshop oktober 2017

InExchange Network. Innehåll. Välkommen till InExchange Network!

Sö ka artiklar öch annan litteratur

SALDO. En ruta kommer upp och du uppmanas att skriva in ett ord inte nödvändigtvis en lexikonform, det kan också vara en böjd form.

Beskrivning - Hur fungerar Reseplaneraren

1. Enkel sökning Globalsökning Avancerad sökning Historik Söka via klassificeringsstruktur 14

So ka artiklar och annan litteratur

Hitta ditt vatten - en handledning

Manual för banläggning i OCAD IF ÅLAND

Sökning i medlemsregistret

NetDiver - Lathund LISA

En arbetssätt du bör lära dig Så använder du ort- och kartfunktionen

MANUAL FÖR JÄGAREFÖRBUNDETS KRETSAR

STOCKHOLMS UNIVERSITET. Handbok 2. Funktionaliteter moveon 4

HANDBOK NYHETER (inkl. logga och pdf) I OEW

MANUAL FÖR JÄGAREFÖRBUNDETS KRETSAR

Lathund - TimeEdit Introduktion

Synergi Användarhandbok för att söka rapporter

MANUAL FÖR JÄGAREFÖRBUNDETS KRETSAR

Heroma användarmanual Självservice i nya webben

MarinWiki. Manual. Copyright 2014 MarinWiki.se

Copyright 2014 Pausit AB medföljer programvaran Pausit. Pausit version 1.9 Användarmanual

Retriever Mediearkivet

UB:s sö ktjä nst - Söka artiklar och annan litteratur

2. Genom att klicka på actionknappen kommer du in till en meny:

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Länsstyrelsernas geodatakatalog ANVÄNDARMANUAL - SÖKNING. LÄNSSTYRELSERNA

Pausit version MAC 1.2 Användarmanual

Publicera material i Learn

IdrottOnline Klubb manual medlemsregistret

Appen Legimus. Användarmanual för IPhone och IPad

Programmets startmeny ser ut så här. För att få fram menyerna Avsluta, Inställningar och Användare måste du föra markören upp till det blåa fältet.

ANVÄNDARMANUAL FÖR WORDPRESS

Dessa tre fönster kan enbart visas i datavyn, inte i layoutvyn. Det är också möjligt att ha flera fönster öppna samtidigt.

Manual för ehp och HP:s digitala arkiv

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

SportAdmin i GF Nikegymnasterna

Användarmanual Legimus för. Android

ÄLTA SKOLAS LOKALA KURSPLAN

Appen Legimus Användarmanual för Android

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Så använder du Jajja Prospect

Manual för Medarbetare appen

2. Dels går det att klicka sig fram via appsamlingen (2a) (som liknar en rutig kvadrat). Klicka på E-post (2b). 2b.

Användarguide. Sök och administrera dina volontärer på Volontärbyrån

Aitelluguiden Venture Cup

Sö ka litteratur i ERIC

IVT Online manual Att göra en beställning

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Manual Version För registrering av aktiviteter på

Manual till Båstadkartans grundläggande funktioner

Aditro HR Portalen - logga in och byta lösenord

Inloggning 2 Var och hur loggar man in hemifrån?... 2 Hur skapar man engångskoder och ändrar användarnamn?... 2

Version

Lathund för webbpublicering på Vi Ungas distriktswebbplatser

ANVÄNDARMANUAL, INTERAXO

SymWriter. Lathund kring hur du arbetar med programmet SymWriter med de absolut vanligaste grunderna. Habilitering & Hjälpmedel

Personnummer och namn i denna manual är fiktiva.

Så använder du Socialstyrelsens statistikdatabas

Version lättläst. Så här använder du Legimus app. för Android

Manual. Registrera i Kvalitetsregister PsykosR

Översikt av inlagda tider i Interbook

Användarhandledning för VD Link för Småhus Vitec

Hur man lägger upp och redigerar dokument i Typo3.

Användarmanual MinoWeb

Testa gratis i 15 dagar

Att rikta information i en aktivitet

Låt "Personlig mappfil för Office Outlook (.pst)" vara markerad. Klicka på OK

Gör så här för att rapportera:

Manual Pausit 2.0. Klicka på Träna Nu kommer du direkt till övningsspelaren och ett pass startas.

Axiell Trend statistikverktyg

Guide till att använda Audacity för uttalsövningar

OptiWay GIS Vind. Manual - Version OptiWay

UTV5 Lathund för skolledning ( )

MANUAL ORDTEST. 1 Februari 1998 Madison-Medri

Handledning till FC 12 på webben

Användarmanual NeverLOST webbokning

Lathund Excel Nytt utseende. Skapa Nytt. Flikar

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Instruktioner för beställning och kontoadministration för abonnenter av inlästa läromedel

Manual för chefer om hur man hanterar organisationen via hälsoportalen AHA

NYORDEN SOM SPEGLAR NUTIDEN

LUVIT Utbildningsplanering Manual

Svensk nationell datatjänst, SND BAS Online

Manual för webbpublicering. Enköpings kommun

1 Allmänt. 2 Hur gör man. 2.1 Gå till lagets sida, Logga in genom att trycka på hänglåset

Lathund Hemsida för Astma- och Allergiförbundets föreningar

MÅL OCH BETYGSKRITERIER I SVENSKA

Transkript:

Korp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/korplabb/ sb-korp@svenska.gu.se 17 oktober 2016

ÖVERSIKT Korp är Språkbankens korpusverktyg och en väsentlig del av vår korpusinfrastruktur. Med hjälp av Korp kan man utforska flera hundra olika korpusar i både modern och äldre svenska och även i några andra språk. Om du har använt Korp tidigare - hoppa direkt till övning 6 för att testa ny funktionalitet. ATT SÖKA I KORP För att göra relevanta sökningar så måste man först välja de korpusar som man vill söka i. Längst upp till vänster ser man att man först kommer in i Korps moderna mode. Där hittar vi en mängd olika typer av material, t.ex. sociala medier, skönlitteratur, Wikipedia och myndighetstexter. För att komma åt äldre material eller material på andra språk så får man välja ett annat mode, t.ex. Kubhist, som innehåller äldre tidningstexter. När man har valt mode så kan man välja ut vilka korpusar man ska söka i med hjälp av korpusväljaren. I Korp finns tre olika typer av sökning: Enkel, utökad och avancerad. I övningsuppgifterna kommer vi endast att använda enkel och utökad sökning. Det finns också tre resultatlägen: KWIC, statistik och ordbild. Från statistikvyn kan man för vissa material få fram ett trenddiagram och en karta. För mer funktioner se användarmanualen: https://spraakbanken.gu.se/eng/research/infrastructure/korp/user-manual ÖVNING 1 - ENKEL SÖKNING OCH STATISTIK I enkel sökning kan man antingen söka på ett ord, fraser eller ett lemgram. När man söker på lemgram så söker man på alla ordformer som ingår i lemgrammets böjningstabell. När du matar in ett ord så kommer det upp en meny där du kan välja vilket lemgram du vill söka på. 1.1 Gör en sökning på alla ordformer av ordet fågel i kategorin Skönlitteratur. 1.2 Försök att enkelt ta dig till träffsidan där träffarna från korpusen Äldre svenska romaner börjar. 1.3 Bekanta dig med statistikfliken. Testa att sortera resultaten efter olika kolumner och klicka fram något cirkeldiagram. 1

ÖVNING 2 - UTÖKAD SÖKNING I den utökade sökningen kan man skapa avancerade sökuttryck. Man kan söka på alla attribut som stödjs av de valda korpusarna. Nästan alla korpusar stödjer sökning på ordklass, grundform, lemgram, betydelse, förled och efterled. Vissa korpusar har också textattribut, som titel, författare eller när texten är skriven. En låda representerar ett token i texten (t.ex. ett ord eller en punkt). För varje token kan man sätta flera krav. T.ex. ordform är blomma och/eller ordklass är substantiv. Man kan lägga till fler lådor för att göra sökningar som alla substantiv följt av verbet gå. Det går också att säga att ett token ska upprepas flera gånger om man vill hitta t.ex. flera adjektiv följt på varandra. Mer detaljerade instruktioner finns i användarmanualen. 2.1 I GP-korpusarna, försök hitta alla träffar där det är minst två adjektiv följt av ordet katt. ÖVNING 3 - UTÖKAD SÖKNING OCH SAMMANSTÄLLNING I STATISTIKEN I statistiktabellen kan man välja att sammanställa på alla attribut som de valda korpusarna stödjer. Svenska partiprogram och valmanifest innehåller valmanifest från 1887-2010. Genom att välja att sammanställa på på t.ex. parti så får man en rad per parti vars valmanifest nämner det som du sökt på. Man får även totala antalet träffar och relativt antal träffar per parti, där relativa antalet betyder antalet träffar per en miljon token. 3.1 Sök på något lemgram (t.ex. frihet, jämlikhet) och sammanställ på parti eller år. Se om du kan se några skillnader på hur mycket olika partier använder uttrycken eller under vilka år de var vanliga. 3.2 När man sammanställer på år så får man ofta väldigt många rader i tabellen. Det kan vara svårt att dra några slutsatser över tid. I trenddiagrammet kan man jämföra rader i tabellen över tid. Sök istället i utökad sökning på lemgram är fred eller lemgram är krig. Genom att sammanställa på lemgram får vi en rad för fred och en för krig. Välj ut dessa rader och klicka på Visa trenddiagram. Kan man se någon trend? I Svenska partiprogram och valmanifest finns texterna uppmärkta med år, men trenddiagrammet stödjer även sökningar ner på minutnivå. Det kan man se i Twitter-korpusarna. 3.2 Det visade sig också vara ganska krångligt att jämföra partiernas använding av uttrycken frihet och jämlikhet. Korp har en jämförelsefunktion som lämpar sig väl för den typen av frågor. Börja med att mata in din sökning på lemgrammet frihet. Istället för att söka kan du spara sökningen genom att trycka på den lilla pilen till höger på Sök-knappen. Gör samma sak för jämlikhet. Dina sökfrågor kommer då att finnas tillgängliga i Jämförelse-fliken. När du går dit kan du utföra jämförelsen. 2

ÖVNING 4 - ORDBILDEN I ordbilden visas det sökta ordet tillsammans med ord som det har olika syntaktiska relationer till i materialet, grupperat efter relation. För ett verb visas till exempel vanliga subjekt och objekt, och för ett substantiv visas vanliga attribut, och vanliga verb som substantivet är subjekt och objekt till. För att söka i ordbilden måste du först klicka i Visa ordbild. 4.1 Enligt GP-korpusarna, vad gör en hund ofta och vad gör man ofta med en hund? 4.2 Från ordbilden, plocka fram alla meningar där hundar skäller. ÖVNING 5 - JÄMFÖRA OLIKA KORPUSAR 5.1 Testa att välja Bloggmix och GP-korpusarna. Försök att komma på ett ord som borde vara vanligare i dagstidningarna är i bloggarna och se om du kan verifiera din idé. Tips: Sök på ditt ord som lemgram och välj även för- och efterled för att få bättre resultat. ÖVNING 6 - ORDBETYDELSEDISAMBIGUERING När man söker på visssa ord som har många betydelser kan man få fler träffar än man önskar sig. Genom att söka på specifika betydelser kan man få en mindre träffmängd där träffarna är mer relvanta. Den nya betydelsedisambigueringen finns i tidningarna Press 95-98 och GP 2012-2013 samt i Sociala medier, Bloggmix 1998-2004 och 2014-2015. 6.1 Sök på ordet fil. Sammanställ på betydelse. Notera att när du klickar på ett ord i KWIC-vyn så kan man se ordets betydelseannotering i sidopanelen. När man klickar på visa fler så får man se alla alternativ tillsammans med deras sannolikheter. Kolla även statistikfliken där man kan se frekvens för de olika betydelserna. 6.2 Gå till Utökad sökning. Välj betydelse. Om du skriver fil så kommer en meny fram där du kan välja vilken betydelse du vill söka på. När du söker får du fram alla ord som är uppmärkta med betydelsen som valts. 3

ÖVNING 7 - KARTA Med Korps nya kartfunktion kommer det att finnas möjlighet att visa en karta baserat på textattribut så som författarens hemort eller plats där en tweet skrevs. För nurvarande kan man för Bloggmix 1998-2004 och 2014-2015 visa en karta baserat på bloggarens hemort. I Press 95-98 och GP 2012-2013 kan man visa en karta baserat på vilka platser som samförekommer i träffarnas stycke. 7.1 Välj Bloggmix och gå till Utökad sökning. Sök på lemgram är palt eller lemgram är kroppkaka. Sammanställ på lemgram. I statstikfliken kan du markera alla rader och klicka på Visa karta. Du ser direkt att träffarna fördelas så som man förväntar sig på kartan. 7.2 Genom att klicka på en träff och sedan klicka på rutan som kommer upp kan du få fram en KWIC-vy över träffar på den plats som du valt. 7.3 Försök att hitta andra fenomen som borde vara vanligare i t.ex. Göteborg, Stockholm eller någon annan av storstäderna. 7.4 Gör samma som ovan i GP 2012-2013 med samförekomst. 4