Karp. https://spraakbanken.gu.se/karp Övningar Språkbankens höstworkshop oktober 2016

Relevanta dokument
Karp. Övningar Språkbankens höstworkshop oktober 2017

Korp. Övningar Språkbankens höstworkshop oktober 2016

INNEHÅLLSFÖRTECKNING... 1 INLEDNING ORDBOKEN I VERKTYGSLISTEN ORDBOKEN... 3

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

Kort presentation av Korp, Sveriges nationalkorpus

Lingvistiskt uppmärkt text

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

Lingvistiskt uppmärkt text

1 AVANCERAT FILTER enter Filtrera på

Dåtid:'' Perfekt'' Beskriver'att' något'har'skett.' Bildas'med' hjälpverbet' har.'

grammatik Ordklasser, nominalfraser, substantiv

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Precodia. Manual. Precodia 1.0. Elevdata AB. Produktionsstöd har erhållits från Specialpedagogiska skolmyndigheten. (

Sö ka artiklar öch annan litteratur

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Hur man lägger upp och redigerar dokument i Typo3.

ANVÄNDARMANUAL, INTERAXO

Grammatik för språkteknologer

So ka artiklar och annan litteratur

Sö ka artiklar öch annan litteratur

Sö ka artiklar öch annan litteratur

Våren Nationalencyklopedin. Avancerad guide

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk

PAROLE Exempel Förklaring SUC. PARTICIP AF00000A tf particip förkortning PC AN. pluralis obestämd/bestämd genitiv. pluralis obestämd/bestämd nominativ

Hur man skapar samt tar bort relationer mellan fastighetstyngdpunkten och fastighetsytan.

SALDO. En ruta kommer upp och du uppmanas att skriva in ett ord inte nödvändigtvis en lexikonform, det kan också vara en böjd form.

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens

Lathund - system för tillbud och arbetsskador

GU-ISS Korp 6 - Användarmanual

SUBSTANTIV = namn på saker, personer, känslor

Svensk grammatik Ordklasser!

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Dokumentnamn. Införandet av ny generell kursvärderingsenkät HT2011

Ordklasser och satsdelar

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

Infobank kvickguide. Kom i gång med Infobank. Logga in till Infobank. Installationsguiden

Snabbguide till de nya funktionerna

Manual för. LO-TCO Biståndsnämnds bildbank på

Kom igång med FolkhälsoStudio en manual

Datum: Date: Provkodr: KTR1 Exam code:

Delkurs grammatik (5 hp, 7,5 hp) - studiehandledning vt 2015

Hur konstigt som helst!

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

UB:s sö ktjä nst - Söka artiklar och annan litteratur

Manual. It s learning. Målgruppen: externa utförare inom Vård och Omsorg

Handbok Kiten. Jason Katz-Brown Daniel E. Moctezuma Översättare: Stefan Asserhäll

InExchange Network. Innehåll. Välkommen till InExchange Network!

Länka in bilder från webben hjälper dig att använda bilder som du inte har sparade på din egen dator.

Heroma användarmanual Självservice i nya webben

LUVIT Portal Användarmanual

Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse

2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.

Ordbok arabiska - svenska. Denna ordboks webbadress är:

Träningshäfte ordklasser (Venus)

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Grammatik för språkteknologer

Innehåll. Omslagsfoto: Daniel Sahlberg. Liber AB Version 2.1 Sida 1

Lathund Excel Nytt utseende. Skapa Nytt. Flikar


Svenskans struktur, 7,5 hp Tentamensexempel 1

Lathund. Joint Collaboration AB Korta Gatan Stockholm Tel interaxo@joint.se. Org.nr.

Din jävel! Vokativa nominalfraser med possessivpronomen

Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998

Lingvistiska grundbegrepp

Ordförråd och Ordbildning

2 (16)

Outlook - Lägstanivå för användning av Outlook på Hedda Wisingskolan

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet.

Vad är Atea Register? Hur navigerar jag till Atea Register? Manualens syfte

Grammatik för språkteknologer

Labb 2: Syntax och ordklasstaggning. Att arbeta med grammatiskt analyserade data

Skapa listor i Statuslistan

Praktisk Svenska 2. Jag kan Skapa och använda olika minnesknep Studieteknik 1

Svensk minigrammatik

Grammatik för språkteknologer

Användarmanual Research

Övningstillfälle 1, Kognitionsvetenskapliga programmet. Ordklasser och fraser. Facit. 2. lyftes VERB 28. överseende PARTICIP

Rullningslisten. Klicka på rullningslistpilar (pil upp eller pil ner) 1 för att förflytta dig i önskad riktning, en liten bit i taget.

Ändring av lösenord: Öppna en webläsare och gå till adressen Logga in enligt instruktion på skärmen.

Blackboard Studentmanual - Att arbeta med Wikis

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Lexikon: ordbildning och lexikalisering

Morfologi, språktyper och skriftsystem. Allmän Grammatik och Fonetik HT09 Dag 2

Språk, datorer och textbehandling

Användarutbildning i SiteVision

Få ett utökat ordförråd och därmed förbättrad läsförståelse och förmåga att uttrycka sig.

CSVE20 vt-18: Språkkunskap A 11SV20 vt-17: Språkkunskap A. Tillfälle 4) 11SV20 vt-17 (LASEAht16)

TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap

ÄLTA SKOLAS LOKALA KURSPLAN

VEM TROR DU ATT DU ÄR? En konstruktionsgrammatisk undersökning. Tina From

Datum: Date: Provkodr: KTR1 Exam code:

Facit för diagnostiska provet i grammatik

Kommentar [k1]: Behöver vi kommentera det som finns till höger ovanför schematyp?

MÅL OCH BETYGSKRITERIER I SVENSKA

Språk, datorer och textbehandling

Facit Mango Grammatik Ordklasser Fortsättning

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Transkript:

Karp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/karp sb-karp@svenska.gu.se 17 oktober 2016

ÖVERSIKT När du går in på https://spraakbanken.gu.se/karp kan du välja att söka i ett eller flera av våra 26 lexikon. Du väljer vilka genom att bocka för dem i Lexikonväljaren längst upp på sidan. I de här övningarna kommer vi göra sökningar i flera olika resurser. ATT SÖKA I KARP Enkel sökning är en fritextssökning som låter en söka efter ett eller flera ord. Sökningen görs i all text i de valda lexikonen. Vill man göra en snävare sökning kan man använda Utökad sökning. Exakt vad som är sökbart här avgörs av lexikonets struktur och uppmärkning. Att söka efter "vad som helst" motsvarar en fritextssökning. Knappen "Sammanställ på..." öppnar upp en meny där man kan välja olika attribut som man vill visa en mer kompakt statistik över. Tryck på Sök när du gjort dina val. Resultatet kommer visas i fliken "Statistik", bredvid "Träffar". Om du håller musen över ett attribut visas en liten ikon till höger om checkboxen. Med hjälp av denna kan du flytta på attributet och därmed ändra ordning på kolumnerna i sammanställningen. 1

ÖVNING 1 Saldo beskriver modern svenska och är ett av våra största lexikon med ca 130 000 ingångar. Här har alla ingångar grundform och lemgram, så för att hitta alla kan du t.ex. göra en sökning efter "där grundform finns". Vi kommer nu göra ett antal övningar i Saldos morfologi med hjälp av statistiken från "Sammanställ på..." 1.1 Vilka ordklasser förekommer i lexikonet? (Se Appendix A) 1.2 Klicka på den lilla miniräknaren över kolumnen med ordklasser, längst till väster, för att se en mer kompakt sammanställning av de förekommande värdena. Är fördelningen mellan ordklasserna så som du förväntat dig? 1.3 Vilka inherenta drag finns för substantiv i lexikonet? 1.4 Kan du hitta en ordform som kan ha mer än fyra ordklasser? (Tips: sammanställ på ordform och därefter ordklass) ÖVNING 2 Resursen Konstruktikon samlar uttryckssätt och språkliga strukturer. Det lättaste sättet att navigera i lexikonet är att använda listningen, till höger i fönstret. 2.1 Slå upp konstruktionen stå_där_med_x. Kolla på fältet Struktur och på Exempel för att få en bättre bild av vilket språkligt fenomen som beskrivs. Den här konstruktionen länkar till det svenska frasnätet, SweFN (framenet). Det är en resurs som beskriver betydelse i förhållande till semantiska ramar, dvs händelser, relationer etc. En länk innebär i det här fallet att konstruktionens betydelse beskrivs av framenetramen. 2.2 Vilken ram i frasnätet länkar stå_där_med_x till? Genom att klicka på länken kommer du till SweFN. Gör det! Nu befinner vi oss Frasnätets visningsläge. Under Exempel hittar du nu en samling meningar som belyser den aktuella semantiska ramen. Under Lexikala enheter finns ord och flerordsuttryck (vilka är länkade till Saldo) som är kopplade till ramen. 2.3 Gruppera de lexikala enheterna per ordklass och välj ut din favorit! 2.4 SweFN länkar i sin tur tillbaka till Konstruktikon (SweCxn). Ta dig tillbaka till konstruktikonet genom att följa en av länkarna och passa på att se om du kan lära dig några nya bra uttryck från den valda konstruktionens exempel. 2

ÖVNING 3 Hellqvists Svensk etymologisk ordbok är en av de resurser som är under utveckling, men vi ska titta på hur man kan använda den informationen som finns redan nu. En del av informationen såsom ordklass och grundform är uppmärkt och därmed sökbar. Större delen av texten i ingångarna har däremot ingen uppmärkning och kan därför bara sökas i med fritextsökning. Hellqvist ger anvisningar om ords ursprung och använder förkortningarna grek. för (forn)- grekiska, fsv. för fornsvenska och lat. för latin. Förutom ursprung anger Hellqvist även besläktade ord och deras ursprung, vilket gör att sökningar efter ord med ett visst ursprung resulterar i ett visst brus. För att få exakta resultat behövs bättre uppmärkning, alternativt manuell genomgång av resultaten. 3.1 Gör en sökning efter substantiv som härstammar från grekiska. För att få ett smalare resultat kan du testa att söka efter ingångar som nämner grek men inte fsv. 3.2 Vilka ordklasser är vanligast förekommande bland ord med fornsvenska rötter? Kanske hittar du något fel i lexikonet under sökningarna. Om du gör det kan du välja att lämna ett förbättringsförslag genom att klicka på det lilla kugghjulet bredvid den aktuella ingången. ÖVNING 4 Dalins ordbok utkom på 1850-talet. Den kan vara till god hjälp om man läser äldre litteratur. Som ett experiment ska vi ta en titt på ord som beskriver olika slags människor. 4.1 Sök fram alla adjektiv som börjar med antingen "bond" eller "adel". Ögna igenom resultatet och bilda dig en uppfattning om hur dåtidens bönder porträtteras. 4.2 Att resultaten inte visas i bokstavsordning beror på att de rankas efter sökmotorns egen poängskala. Om du lätt vill ha en överblick över orden i alfabetisk ordning kan du använda dig av listningen. Klicka på pilen bredvid "Dalin" ovanför träffarna, och välj "Skapa listning". 4.3 Om du vill fortsätta, så gör en fritextsökning efter "qvinna" eller "karl". 3

APPENDIX A nn av vb pm ab in pp nl pn sn kn al ie mxc sxc abh avh nnh nnm nna avm ava vbm vba pmm pma abm aba pnm inm ppm ppa nlm knm snm kna ssm ORDKLASSER I SALDO substantiv adjektiv verb egennamn adverb interjektion preposition numeral pronomen subjunktion konjunktion artikel infinitivmärke flerordsprefix prefix adverbsuffix adjektivsuffix substantivsuffix substantiv, flerording substantiv, förkortning adjektiv, flerording adjektiv, förkortning verb, flerording verb, förkortning egennamn, flerording egennamn, förkortning adverb, flerording adverb, förkortning pronomen, flerording interjektion, flerording preposition, flerording preposition, förkortning numeral, flerording konjunktion, flerording subjunktion, flerording konjunktion, förkortning flerording, sats 4