Språk, datorer och textbehandling

Relevanta dokument
Språk, datorer och textbehandling

Språk, datorer och textbehandling

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Översättningsminnen laboration

Kort presentation av Korp, Sveriges nationalkorpus

Korpussökning och korpusmått 1(44)

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Korp. Övningar Språkbankens höstworkshop oktober 2016

Karp. Övningar Språkbankens höstworkshop oktober 2016

ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?

Svensk nationell datatjänst, SND BAS Online

Grundläggande textanalys. Joakim Nivre

Språk, datorer och textbehandling

Att söka i Korp med CQP och Regexp - en introduktion

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Datorbaserade verktyg i humanistisk forskning

Språkbanken en (inter)nationell forskningsinfrastruktur

Översikt 732G11 PROGRAMMERING 1. Personal. Kursens mål. Litteratur. Kursens innehåll

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Snabbguide Genuine Text. Manual och snabbguide, Version 3.0 av GenuineText (manual för lärare):

Språk, datorer och textbehandling

Korpusmått, korpusbalans och korpusrepresentativitet

Språkets struktur och funktion, 7,5 hp

SNABBSTART AV WIS WEBBASERAT INFORMATIONSSYSTEM

Korpusuppbyggnad Från textsamling till korpus

Manual för nedladdning och installation av Skolavtalets program på hemdatorer.

Objektorienterad Programkonstruktion. Föreläsning 8 30 nov 2015

Instruktionsbok för Fjärrskrivbord

SAMMANSTÄLLNING 1 (13) Datum för sammanställningen Period 3, 2007

Installation av Virtual Skipper Online

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

Introduktionskurs i datavetenskap, 3p.

INSTALLATIONS ANVISNING

GU-ISS Korp 6 - Användarmanual

Installation Hogia Smart Kassa

Lingvistiskt uppmärkt text

LABORATION 1 Pingpong och Installation av Server 2008 R2

Manual för. LO-TCO Biståndsnämnds bildbank på

Studenter drillar Lärkas sång om hur studenter lär grammatik via korpusverktyget Lärka

Installation av FEBDOK version 5.4 Singel

Övergripande planering

För att använda detta system behöver du en dator med internetåtkomst samt din G&D iphone.

Lektion G43 Artificiell intelligens. Robin Keskisärkkä Ellinor Ihs Håkansson Cornelia Böhm

En jämförelse av ilex och Elan

729G09 Språkvetenskaplig databehandling

Referenshantering med Zotero 1

Introduktion till datormiljön och Python

BlueStacks Användarhandbok

Systemintegration 2019 YRGO. Introduktion till kursen

Välkomna till DIT012 IPGO

Tekniker för storskalig parsning

Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan.

Karp. Övningar Språkbankens höstworkshop oktober 2017

Installationsbeskrivning för CAB Service Platform med CABInstall

Registrering i EU login

Installation av FEBDOK version 6.0 Singel

Beställa varor från webbutiken för provtagningsmateriel, remisser och övrigt materiel.

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Objektorienterad Programmering (TDDC77)

TDDC77 Objektorienterad Programmering

INSTALLATIONSHANDBOK

Datorbaserade verktyg i humanistisk forskning

KARLSTADS UNIVERSITETSBIBLIOTEK

Välkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1.

Snabbguide IP-kamera Kom igång med din kamera

Manual Databas VFU-11:an VFU-samordnare / VFU-koordinatorer

Installationsguide för FAR Komplett Offline 2.1.2

Översikt. Programmering tillämpningar och datastrukturer. Vad kursen täcker. Lärare. Rekommenderad litteratur. Kursmål 729G58 (HKGBB7)

Installationsanvisningar. till IST Analys

Installationsguide för mysql och OLA Server/OLA Klient

VEM TROR DU ATT DU ÄR? En konstruktionsgrammatisk undersökning. Tina From

Allmän information ITS Fjärrskrivbord

Övergripande planering

Installation Hogia Small Office. Bokföring. Se hur vi förenklar vardagen för dig som småföretagare på

Bootstrapping för substantivtaggning

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Skapa en mall för inlämning av skriftliga uppgifter. med hjälp av Open Office Writer

Hämta via databaser Se Hämta referenser från databaser.

KURSUPPLÄGG OM PRESENTATIONER OCH OPPOSITIONER SYFTE MED RAPPORTER OCH OPPOSITIONER DAGENS PROGRAM. UPG1 (klart)!

Installation av FEBDOK version 5.4 Server (nätverk)

Du kan installera Widgitprodukter på ett nätverk. Följande program och tillägg hanteras (du kanske inte har licens att installera all dessa):

TeamViewer Installation och användning

Användarnamn, lösenord och e-postadress får du tilldelade av skolans IT-ansvarige, efter att din ansökan är mottagen och godkänd av administratören.

Innehåll. Länkar Ladda ner ny version av dokument Radera dokument Noteringar och markeringar Protokoll Sök Dela handling Logga ut Kontaktvägar

Grammatik för språkteknologer

Datorsystem. Laboration 3: Operativsystem Senast uppdaterad: 14 oktober 2012 Version 1.3. Student: Underskrift: Underskrift: Datum:

Hogia skatt. installationsanvisning

Sjukhusbiblioteket i Karlstad, september 2012, Modifierad av Linköpings universitetsbibliotek tisdag den 11 december 2018

Svenskans digitala resurser. Elzbieta Strzelecka

ClaroReadPro Kom igång med talsyntesen

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Lathund Skolverkets bedömningsportal

Transkript:

Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019

Labb 1: KORP vid Språkbanken, GU Endast muntlig genomgång (ej inlämning) Labb 2: Korpusverktyg: webcorp, AntConc, BNCweb, Xaira Endast muntlig genomgång (ej inlämning) Labb 3: Korpusannotering och analys med Swegram Skriftlig inlämning inom ca en vecka, se labbsidan Labb 4: WordSmith Tools Skriftlig inlämning inom ca en vecka, se labbsidan

Laborationer: datasal 9-1064 (tillgänglig under labbtid) datasal 9-1070 (tillgänglig under labbtid) Öppna datasalar datasal 9-0044 (tyst sal) datasal 7-0019 studentsalarna i källaren i hus 2

Labbrapport Försök begränsa omfånget till två sidor Ange vilken labb det är och ditt namn som rubrik Avsnitt i rapporten: 1. Ange kortfattat labbens syfte, metod och material 2. Ange analysresultat, använd tabeller där lämpligt, redovisa svar punktvis i den ordning de ges i labbuppgiften 3. Avrunda med en kort diskussion och slutsatser

Labb 1: KORP KORP är en resurs för korpussökningar vid Språkbanken, GU. Omfattar idag 232 olika textkorpusar Språkbanken inrättades 1975 för att vara en nationell enhet med uppdrag att samla in, utveckla och tillgängliggöra språkresurser såsom korpusar, lexikon och språkteknologiska verktyg åt forskare och allmänhet OBS. Ingen skriftlig inlämning av denna labb!

Labb 1: KORP Sökning i KORP sker via ett webbaserat gränssnitt. Man kan välja vilka korpusar man vill söka i. Resultat ges som konkordanser (KWIC). Olika delkorpusar kan ha skilda typer av annotering. Sökning kan ske efter uppmärkning, antingen via enkelt eller utökad sökning (menystyrt) eller via ett avancerat sökspråk, som kallas CQP.

KORP: CQP (Corpus Query Processor) Exempel på CQP-uttryck för sökning: [word = "steg" & pos = "VB"] 53 [word = "steg" & pos = "NN"] 166 [word = "steg" & pos = "NN VB"] 219

CQP Fler exempel på CQP-uttryck för sökning: [word = "ombuds.*" & pos = "NN" & word!= "ombudsman"] 5 [word = "på" ][word = "grund"][word = "av"] 167 [word!= "på" ][word = "grund"][word = "av"] 17

CQP Exempel på CQP: [word = "vara var är" & pos="vb"] [word =.*köping"] [pos = "JJ"] [pos = "PL"] [pos = "PN"] [msd = "VB.*.*"] [msd = "VB.INF.*"] [msd = "VB.INF.AKT"] [msd = "PN.UTR.*"]

CQP Exempel på CQP: [word = hej ] [word!= hej ] [word = hej Hej ] eller [word = hej ] [word = då ] [word = hej ]+ 1 el flera även [word = hej ]{1,} [word = hej ]? 0 el 1 även [word = hej ]{0,1} [word = hej ]* 0 el flera

CQP Exempel på CQP: [word = får ] [word = får %c] både gemena och versaler [] godtyckligt ord [lemma contains vara & pos = VB ] grundform + övriga former, verb Se även http://spraakbanken.gu.se/parole/formulera.phtml

Labb 2: Olika korpusverktyg 1. webcorp.org Använd enbart webbläsare 2. BNCweb Logga in på http://bncweb.engelska.uu.se 3. AntConc Ikon på skrivbordet eller via Start > All programs 4. Xaira och OANC Xaira finns lokalt på datorerna i labbsalarna OBS. Ingen skriftlig inlämning av denna labb!

Labb 3: Korpusannotering och analys med Swegram Labbsida: http://stp.lingfil.uu.se/~evapet/undervisning/sdtht17/labb-swegram.html Verktyg: http://stp.lingfil.uu.se/swegram/

Labb 4, WordSmith Tools Vid start kan man få några frågor: 1. Vill du köra programmet, svara Ja 2. Körs snabbare på C: svara Ja 3. Licens accepteras svara Ja

Labb 4, WordSmith Tools Skapa ordlistor från text Skapa konkordanslistor Ta fram nyckelord

Labb 4, WordSmith Tools Beroende på textens språk, ändra vid behov i Language Setting i huvudfönstet Spara skapad ordlista, den behövs i senare steg för nyckelord OBS. Nedladdad engelsk referenslista måste packas upp (unzip) innan användning