Språk, datorer och textbehandling

Relevanta dokument
Språk, datorer och textbehandling

Språk, datorer och textbehandling

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Kort presentation av Korp, Sveriges nationalkorpus

Översättningsminnen laboration

Korp. Övningar Språkbankens höstworkshop oktober 2016

Karp. Övningar Språkbankens höstworkshop oktober 2016

ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?

Installation av Virtual Skipper Online

Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)

Språk, datorer och textbehandling

Att söka i Korp med CQP och Regexp - en introduktion

För att använda detta system behöver du en dator med internetåtkomst samt din G&D iphone.

INSTALLATIONS ANVISNING

Allmän information ITS Fjärrskrivbord

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Språkbanken en (inter)nationell forskningsinfrastruktur

Svensk nationell datatjänst, SND BAS Online

Grundläggande textanalys. Joakim Nivre

Installationsanvisningar. till IST Analys

Objektorienterad Programkonstruktion. Föreläsning 8 30 nov 2015

Instruktionsbok för Fjärrskrivbord

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

DGC IT Manual Citrix Desktop - Fjärrskrivbord

En jämförelse av ilex och Elan

SAMMANSTÄLLNING 1 (13) Datum för sammanställningen Period 3, 2007

LICENSAKTIVERINGSGUIDE. Design Collaboration Suite

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

Korpussökning och korpusmått 1(44)

LABORATION 1 Pingpong och Installation av Server 2008 R2

GU-ISS Korp 6 - Användarmanual

Installationsguide för mysql och OLA Server/OLA Klient

Lingvistiskt uppmärkt text

Manual för. LO-TCO Biståndsnämnds bildbank på

729G09 Språkvetenskaplig databehandling

Datorbaserade verktyg i humanistisk forskning

Användarhandledning. Cisco Leverantörs VPN. Användarhanledning VPN

Bootstrapping för substantivtaggning

Laboration 0. Enhetsbokstaven anges med ett kolon efter och man läser ofta ut detta, exempelvis C:(sekolon).

Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan.

Tekniker för storskalig parsning

Installationsmanual för OnCourse

Registrering i EU login

Dokumentation. Användarmanual. Aastra CMG Server 7.5 för HiPath 4000 Aastra CMG Office Webb 7.5. Konfidentiellt Sida 1 av 23

Karp. Övningar Språkbankens höstworkshop oktober 2017

Korpusmått, korpusbalans och korpusrepresentativitet

Korpusuppbyggnad Från textsamling till korpus

Tomas Borg, konsult, SAS Institute Elin Rydell, konsult, SAS Institute Copyright 2003, SAS Institute Inc. All rights reserved.

ARX på Windows Vista, Windows 7 eller Windows 2008 server

Word- sense disambiguation

Datorsystem. Laboration 3: Operativsystem Senast uppdaterad: 14 oktober 2012 Version 1.3. Student: Underskrift: Underskrift: Datum:

Objektorienterad Programkonstruktion

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Snabbguide Genuine Text. Manual och snabbguide, Version 3.0 av GenuineText (manual för lärare):

Språk, datorer och textbehandling

Klientinstallation VSS Driftservice

Installationsguide. Innehållsförteckning

LABORATION 2 DNS. Laboranter: Operativsystem 1 HT12. Martin Andersson. Utskriftsdatum:

Hogia Administration AB bedriver kontinuerlig utveckling av programmen och reserverar sig för avvikelse mellan program och handbok.

Installation Hogia Smart Kassa

Översikt 732G11 PROGRAMMERING 1. Personal. Kursens mål. Litteratur. Kursens innehåll

Referenshantering med Zotero 1

Studenter drillar Lärkas sång om hur studenter lär grammatik via korpusverktyget Lärka

Innehåll. Kurs i Windows

Introduktion till datormiljön och Python

Installation av FEBDOK version 5.4 Server (nätverk)

Startanvisning för Bornets Internet

Hämta via databaser Se Hämta referenser från databaser.

Manual för nedladdning och installation av Skolavtalets program på hemdatorer.

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

TeamViewer Installation och användning

Introduktionskurs i datavetenskap, 3p.

Installationsguide. Innehållsförteckning

Du kan installera Widgitprodukter på ett nätverk. Följande program och tillägg hanteras (du kanske inte har licens att installera all dessa):

Installation av FEBDOK version 5.4 Singel

Datorsystem och programmering

Språkets struktur och funktion, 7,5 hp

BlueStacks Användarhandbok

Nätverkslicens - Installation

SNABBSTART AV WIS WEBBASERAT INFORMATIONSSYSTEM

Föreläsning 1: Introduktion till kursen

ALEPH ver. 16 Introduktion

Axiell Arena Visa BOOK-IT:s resurser

Grammatik för språkteknologer

Lab1 inginfo07. Detta dokument innehåller övningar för introduktion till Media-programmets datorsystem (Mac OS X).

Netwise Office Web , Rev 1.0, CJ 1(30)

Svenskans digitala resurser. Elzbieta Strzelecka

Linnéuniversitetet. Laboration 1. 1DV416 Windowsadministraion I. 12 november 2013

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Handbok Dela Skrivbord. Brad Hards Översättare: Stefan Asserhäll

Installationsbeskrivning för CAB Service Platform med CABInstall

Quick Start CABAS. Generella systemkrav CABAS / CAB Plan. Kommunikation. Säkerhet

Transkript:

Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna salar: 9-0044,7-0019

Labb 1: KORP vid Språkbanken, GU Labb 2: Korpusverktyg: webcorp, AntConc, BNCweb, Xaira Endast muntlig genomgång (ej inlämning) Labb 3: SWEGRAM Skriftlig inlämning inom ca en vecka, se kurssidan Labb 4: WordSmith Tools Skriftlig inlämning inom ca en vecka, se kurssidan

Laborationer: datasal 9-1064 (tillgänglig under labbtid) datasal 9-1070 (tillgänglig under labbtid) Öppna datasalar datasal 9-0044 (webbläsare, WordSmith finns) datasal 7-0019 stråket utanför biblioteket i hus 9 (tunna klienter) de öppna studentsalarna i källaren i hus 2 (server kvk-ts2)

Labbrapport Försök begränsa omfång till två sidor Ange vilken labb och ditt namn Dela in i: 1. Ange kortfattat labbens syfte, metod och material 2. Ange analysresultat, använd tabeller där lämpligt, redovisa svar punktvis i den ordning de ges i labbuppgiften 3. Avrunda med en kort diskussion och slutsats

Labb 1: KORP En resurs vid Språkbanken, GU. Omfattar idag 198 olika textkorpusar Språkbanken inrättades 1975 för att vara en nationell enhet med uppdrag att samla in, utveckla och tillgängliggöra språkresurser såsom korpusar, lexikon och språkteknologiska verktyg åt forskare och allmänhet Ingen inlämning av denna labb!

Labb 1: KORP Sökning i KORP sker via ett webbaserat gränssnitt. Man kan välja vilka korpusar man vill söka i. Resultat ges som konkordanser (KWIC). Olika delkorpusar kan ha skilda typer av annotering. Sökning kan ske efter uppmärkning, antingen via enkelt eller utökad sökning (menystyrt) eller via ett avancerat sökspråk, som kallas CQP.

KORP: CQP (Corpus Query Processor) Exempel på CQP-uttryck för sökning: [word = "steg" & pos = "VB"] 53 [word = "steg" & pos = "NN"] 166 [word = "steg" & pos = "NN VB"] 219

CQP Fler exempel på CQP-uttryck för sökning: [word = "ombuds.*" & pos = "NN" & word!= "ombudsman"] 5 [word = "på" ][word = "grund"][word = "av"] 167 [word!= "på" ][word = "grund"][word = "av"] 17

CQP Exempel på CQP: [word = "vara var är" & pos="vb"] [word =.*köping"] [pos = "JJ"] [pos = "PL"] [pos = "PN"] [msd = "VB.*.*"] [msd = "VB.INF.*"] [msd = "VB.INF.AKT"] [msd = "PN.UTR.*"]

CQP Exempel på CQP: [word = hej ] [word!= hej ] [word = hej Hej ] eller [word = hej ] [word = då ] [word = hej ]+ 1 el flera även [word = hej ]{1,} [word = hej ]? 0 el 1 även [word = hej ]{0,1} [word = hej ]* 0 el flera

CQP Exempel på CQP: [word = får ] [word = får %c] både gemena och versaler [] godtyckligt ord [lemma contains vara & pos = VB ] grundform + övriga former, verb Se även http://spraakbanken.gu.se/parole/formulera.phtml

Labb 2: Olika korpusverktyg 1. webcorp.org Använd enbart webbläsare 2. BNCweb Logga in på http://bncweb.engelska.uu.se 3. AntConc Ikon på skrivbordet eller via Start > All programs 4. Xaira och OANC Xaira finns lokalt på datorerna i labbsalarna Ingen inlämning av denna labb!

Labb 3: SWEGRAM http://stp.lingfil.uu.se/swegram/

Labb 4, WordSmith Tools Vid start kan man få några frågor: 1. Vill du köra programmet, svara Ja 2. Körs snabbare på C: svara Ja 3. Licens accepteras svara Ja

Labb 4, WordSmith Tools Skapa ordlistor från text Skapa konkordanslistor Ta fram nyckelord

Labb 4, WordSmith Tools Beroende på textens språk, ändra vid behov i Language Setting i huvudfönstet Spara skapad ordlista, den behövs i senare steg för nyckelord Nedladdad engelsk referenslista måste packas upp (unzip) innan användning