Språk, datorer och textbehandling

Relevanta dokument
Språk, datorer och textbehandling

Språk, datorer och textbehandling

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Korp. Övningar Språkbankens höstworkshop oktober 2016

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Kort presentation av Korp, Sveriges nationalkorpus

Installation av Virtual Skipper Online

Översikt 732G11 PROGRAMMERING 1. Personal. Kursens mål. Litteratur. Kursens innehåll

Översättningsminnen laboration

Karp. Övningar Språkbankens höstworkshop oktober 2016

ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Snabbguide Genuine Text. Manual och snabbguide, Version 3.0 av GenuineText (manual för lärare):

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

Korpussökning och korpusmått 1(44)

BlueStacks Användarhandbok

Grundläggande textanalys. Joakim Nivre

Svensk nationell datatjänst, SND BAS Online

Korpusuppbyggnad Från textsamling till korpus

Korpusmått, korpusbalans och korpusrepresentativitet

Installation Hogia Smart Kassa

Word-guide Introduktion

Språkets struktur och funktion, 7,5 hp

Språk, datorer och textbehandling

Att söka i Korp med CQP och Regexp - en introduktion

SAMMANSTÄLLNING 1 (13) Datum för sammanställningen Period 3, 2007

Så här fungerar Stava Rex

Uppgift 1 Denna uppgift består av två steg där du i första steget ska skapa formatmallar som sedan används i steg två för att skapa ett dokument.

Under Kurser visas dina kurser som kort och om där finns nya uppgifter eller anslag visas antalet i kurskortet.

Karlstads universitetsbibliotek

Tekniker för storskalig parsning

INSTALLATIONS ANVISNING

LABORATION 1 Pingpong och Installation av Server 2008 R2

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Datorbaserade verktyg i humanistisk forskning

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.

Introduktionskurs i datavetenskap, 3p.

Språkbanken en (inter)nationell forskningsinfrastruktur

Lingvistiskt uppmärkt text

Referenshantering med Zotero 1

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

TDDC30 Programmering i Java, Datastrukturer och Algoritmer Lektion 5. Laboration 4 Lådplanering Exempel på grafik, ett avancerat program Frågor

Manual till bt. bildbank

Installationsguide för mysql och OLA Server/OLA Klient

Använd WordFinder optimalt! Lathund med nyttiga tips och trix.

En jämförelse av ilex och Elan

Word Online Version 1.0 Skolkontoret

SourceTech Tellus Mobile

Instruktionsbok för Fjärrskrivbord

Hogia Administration AB bedriver kontinuerlig utveckling av programmen och reserverar sig för avvikelse mellan program och handbok.

Språk, datorer och textbehandling

Hjälper dig att kontrollera din text efter felstavningar och lättförväxlade ord. Manual

Använd WordFinder optimalt! Lathund med nyttiga tips och trix.

Objektorienterad Programkonstruktion. Föreläsning 8 30 nov 2015

Skapa en mall för inlämning av skriftliga uppgifter. med hjälp av Open Office Writer

Online modulen är en tilläggsmodul som också ger tillgång till Näsgård Mobile.

GU-ISS Korp 6 - Användarmanual

TDDC74 Lab 02 Listor, sammansatta strukturer

Installationsanvisning för Su Officemallar 2007 För PC

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Godkänn användarvillkoren. 2. Klicka på Verktyg och du kommer till Min samling som från början är tom 3.

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

MANUAL. Ver. 1.0,

Installationsanvisning för Su Officemallar 2013 För PC

Inställningstips. Visuella anpassningar Windows

Manual för. LO-TCO Biståndsnämnds bildbank på

KARLSTADS UNIVERSITETSBIBLIOTEK

Godkänn användarvillkoren. 2. Klicka på Verktyg och du kommer till Min samling som från början är tom. 3. Välj Bibliotek

Studenter drillar Lärkas sång om hur studenter lär grammatik via korpusverktyget Lärka

Användarnamn, lösenord och e-postadress får du tilldelade av skolans IT-ansvarige, efter att din ansökan är mottagen och godkänd av administratören.

Evaluation Summary - CT3380 Grundäggande webbdesign HT06 Dan Levin

Systemintegration 2019 YRGO. Introduktion till kursen

Välkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1.

Eltec VoteAid är ett system som används av kommuner och landsting för att sköta möten via trådlösa knappsatser.

Installation av FEBDOK version 5.4 Singel

Övergripande planering

För att använda detta system behöver du en dator med internetåtkomst samt din G&D iphone.

Installationsguide för FAR Komplett Offline 2.1.2

Allmän information ITS Fjärrskrivbord

Lektion G43 Artificiell intelligens. Robin Keskisärkkä Ellinor Ihs Håkansson Cornelia Böhm

Att använda Stava Rex i Word 2007

Innehåll Net ID installation... 2 Instruktion för nedladdning av HCC... 7 Låsa upp kort med hjälp av PUK-koden Byt säkerhetskod...

Så, ska det taggas som adverb?

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER. Kursguide: TY1114 Modern tyska i tal och skrift, 7,5 hp

Manual för nedladdning och installation av Skolavtalets program på hemdatorer.

729G09 Språkvetenskaplig databehandling

Introduktion till Datalogi DD1339. Föreläsning 1 8 sept 2014

Introduktion till datormiljön och Python

INNEHÅLLSFÖRTECKNING... 1 INLEDNING ORDBOKEN I VERKTYGSLISTEN ORDBOKEN... 3

Svenska Skidförbundets tävlingsadministrativa system på IdrottOnline

Kom igång med Advance Online portal med certifikatsverifiering

Office 365 Windows 10

Välkomna till DIT012 IPGO

Kursbeskrivning. Institutionen för folkhälsovetenskap. Kursnamn: Grundläggande statistik med SPSS Högskolepoäng: 3 hp

Transkript:

Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019

Labb 1: KORP vid Språkbanken, GU Endast muntlig genomgång (ej inlämning) Labb 2: Korpusverktyg: webcorp, AntConc, BNCweb, Xaira Endast muntlig genomgång (ej inlämning) Labb 3: SWEGRAM Skriftlig inlämning inom ca en vecka, se labbsidan Labb 4: WordSmith Tools Skriftlig inlämning inom ca en vecka, se labbsidan

Laborationer: datasal 9-1064 eller 9-1070 (se schema, endast tillgängliga under labbtid) Öppna datasalar datasal 9-0044 (tyst sal) datasal 7-0019 studentsalarna i källaren i hus 2

Labbrapport Försök begränsa omfånget till ett fåtal sidor (2-3) Ange överst vilken labb det är samt ditt namn 1. Använd en större stil för detta 2. Namn och labbnamn och -nr gärna som sidhuvud Avsnitt i rapporten 1. Ange kortfattat labbens syfte, metod (hjälpmedel) och (data)material 2. Ange analysresultat, använd tabeller där lämpligt, redovisa svar punktvis i den ordning de ges i labbuppgiften 3. Avrunda med en kort diskussion och slutsatser Rapporttexten 1. Använd helst radavstånd 1,5 och numrera figurer/tabeller för hänvisning 2. Skriv korrekt svenska, rätta stavfel, undvik jag och skilj på de och dem.

Labb 1: KORP KORP är en resurs för korpussökningar vid Språkbanken, GU. Omfattar idag 237 olika textkorpusar Språkbanken inrättades 1975 för att vara en nationell enhet med uppdrag att samla in, utveckla och tillgängliggöra språkresurser såsom korpusar, lexikon och språkteknologiska verktyg åt forskare och allmänhet OBS. Ingen skriftlig inlämning av denna labb!

Labb 1: KORP Sökning i KORP sker via ett webbaserat gränssnitt. Man kan välja vilka korpusar man vill söka i. Resultat ges som konkordanser (KWIC). Olika delkorpusar kan ha skilda typer av annotering. Sökning kan ske efter uppmärkning, antingen via enkelt eller utökad sökning (menystyrt) eller via ett avancerat sökspråk, som kallas CQP.

KORP: CQP (Corpus Query Processor) Exempel på CQP-uttryck för sökning: [word = "steg" & pos = "VB"] 53 [word = "steg" & pos = "NN"] 166 [word = "steg" & pos = "NN VB"] 219

CQP Fler exempel på CQP-uttryck för sökning: [word = "ombuds.*" & pos = "NN" & word!= "ombudsman"] 5 [word = "på" ][word = "grund"][word = "av"] 167 [word!= "på" ][word = "grund"][word = "av"] 17

CQP Exempel på CQP: [word = "vara var är" & pos="vb"] [word =.*köping"] [pos = "JJ"] [pos = "PL"] [pos = "PN"] [msd = "VB.*.*"] [msd = "VB.INF.*"] [msd = "VB.INF.AKT"] [msd = "PN.UTR.*"]

CQP Exempel på CQP: [word = hej ] [word!= hej ] [word = hej Hej ] eller [word = hej ] [word = då ] [word = hej ]+ 1 el flera även [word = hej ]{1,} [word = hej ]? 0 el 1 även [word = hej ]{0,1} [word = hej ]* 0 el flera

CQP Exempel på CQP: [word = får ] [word = får %c] både gemena och versaler [] godtyckligt ord [lemma contains vara & pos = VB ] grundform + övriga former, verb Se även http://spraakbanken.gu.se/parole/formulera.phtml

Labb 2: Olika korpusverktyg 1. webcorp.org Använd enbart webbläsare 2. BNCweb Logga in på http://bncweb.engelska.uu.se 3. AntConc Ikon på skrivbordet eller via Start > All programs 4. Xaira och OANC Xaira finns lokalt på datorerna i labbsalarna OBS. Ingen skriftlig inlämning av denna labb!

Labb 3: Korpusannotering och analys med Swegram Labbsida: https://cl.lingfil.uu.se/~evapet/undervisning/sdtvt19/labb-swegram.html Verktyg: http://stp.lingfil.uu.se/swegram/

Labb 4, WordSmith Tools Vid start kan man få några frågor: 1. Vill du köra programmet, svara Ja 2. Körs snabbare på C: svara Ja 3. Licens accepteras svara Ja

Labb 4, WordSmith Tools Skapa ordlistor från text Skapa konkordanslistor Ta fram nyckelord

Labb 4, WordSmith Tools Läs gärna innan och till labben den step-by-step guide som finns för Word Smith Tools: https://lexically.net/wordsmith/step_by_step_en glish6/index.html?introduction.htm Konsultera under labbens gång vid behov den online-manual som finns för Word Smith Tools: https://lexically.net/downloads/version6/html/in dex.html?getting_started.htm

Labb 4, WordSmith Tools Tips vid hantering av programmet. Beroende på textens språk, ändra vid behov i Language Setting i huvudfönstet Spara den skapade ordlistan, den behövs i senare steg vid nyckelordsanalysen OBS. Den nedladdade referenskorpusen måste packas upp (extract) innan användning