Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet
|
|
- Ida Sandström
- för 5 år sedan
- Visningar:
Transkript
1 Vad är en korpus och vad kan man använda den till? Lars Borin Språkdata, Inst. för svenska språket Göteborgs universitet SALETEK-möte Jokkmokk, juni 2004
2 vad är en korpus? korpusar är (stora) textsamlingar (typiskt tiotals miljoner ord), sammanställda och annoterade med ett syfte i åtanke, (för vilket man utvecklar [dator]verktyg)
3 sammanställda... korpussammanställning är precis som opinionsundersökningar: man tar ett representativt och tillräckligt stort stickprov/urval ur en väldefinierad population för att kunna ställa frågor och få svar som ger (statistiskt) signifikant information om populationen
4 ... och annoterade strukturmärkning och textmetadata ordklass -taggning lemmatisering syntaxanalys ( trädbanker ) länkning (av parallellkorpusar) länkning (av modaliteter) textbindning, dialogakter, m.m.
5 korpusklassificering tal ~ skrift balanserade flerspråkiga: parallella ~ jämförbara inlärarkorpusar domänkorpusar (fackspråk, m.m.) monitorkorpusar små ~ stora
6 Kinnaurikorpusen \ref 07/007a/01 boa loshigyo // boba lo -sh-i -gyo \gl mother with father say-?-?-d.pst \tr Mother and father said: \ref 07/007a/02 \tx jo tshetsats-u tate // \mrep jo tshetsats-u ta -te \gl this girl-poss name(n) what keep-let's \tr "what should we name this girl?" \ref 07/007a/03 \tx sothlets tate // \mrep sothlets ta -te \gl name(n) EMP name keep-let's \tr Let's keep the name (=name her) Sothlets."
7 Stockholm Umeå Corpus: textmetadata <tei.2> <teiheader id=h.kl01> <filedesc> <titlestmt> <title>suc-kl01</title> </titlestmt> <extent words=2001>2001 word tokens</extent> <publicationstmt> <distributor>suc</distributor> </publicationstmt> <sourcedesc> <listbibl id="file-kl01"> <biblfull id="bib-kl01"> <titlestmt> <title level=m>akilles häl</title> <author>jan Mårtenson</author> </titlestmt> <extent words=2001>pp </extent> <publicationstmt> <publisher>wahlström & Widstrand</publisher> <pubplace>stockholm</pubplace> <idno type="isbn"> </idno> <date>1990</date> </publicationstmt> </biblfull> </listbibl> </sourcedesc> </filedesc> <profiledesc> <textclass> <catref target=suc.kl> </textclass> </profiledesc> </teiheader>
8 Stockholm Umeå Corpus: SUC-taggar <text id=kl01> <body> <p> <s id=kl01-001> <d n=1>-<ana><ps>mid<b>-</d> <w n=2>vilka<ana><ps>hd<m>utr/neu PLU IND<b>vilken</w> <w n=3>djävla<ana><ps>jj<m>pos UTR/NEU SIN/PLU IND/DEF.. <w n=4>optimister<ana><ps>nn<m>utr PLU IND NOM<b>opti... <d n=5>,<ana><ps>mid<b>,</d> <w n=6>frustade<ana><ps>vb<m>prt AKT<b>frusta</w> <name type=person> <w n=7>lasse<ana><ps>pm<m>nom<b>lasse</w> </name> <d n=8>.<ana><ps>mad<b>.</d> </s>
9 Stockholm Umeå Corpus: PAROLE-taggar <text id=kl01> <body> <p> <s id=kl01-001> <c lem='-' msd='fi' n=1>-</c> <w lem='vilken' n=2>vilka</w> <w lem='djävla' msd='aqp00n0s' n=3>djävla</w> <w lem='optimist' n=4>optimister</w> <c lem=',' msd='fi' n=5>,</c> <w lem='frusta' n=6>frustade</w> <name type=person> <w lem='lasse' n=7>lasse</w> </name> <c lem='.' msd='fe' n=8>.</c> </s>
10 Talbanken: Bruksprosa P << GM 086 P *DE PODPHH SS 086 P RC SSET 086 P SOM PORPHH SS 086 P TAGITS VVSN PAIV 086 P UT ABZA PL 086 P TILL PR OAPR 086 P UNDEROFFICERSUTBILDNING VN SS OA 086 P KOMMER KVPS FV 086 P ATT ID IM 086 P FÅ FVIV IV 086 P DET PODP OO DT 086 P STÖRSTA AJSU OO AT 086 P ANSVARET NNDD OO 086 P OCH ++OC OO P DE PODP OO DT 086 P SVÅRASTE AJSU OO AT 086 P UPPGIFTERNA NNDD OO 086 P AV PR OOETPR 086 P ALLA POTP OOETDT 086 P VÄRNPLIKTIGA AJ HS OOET 086
11 korpusar och språkvetenskap om inte den empiriskaste, så i alla fall mycket objektiv lingvistik enda sättet att undersöka frekvens [se N. Ellis, 'Frequency effects in language processing', Studies in Second Language Acquisition 24 (2002): , + fler i samma nummer]
12 konkreta exempel [1]
13 konkreta exempel [2]
14 konkreta exempel [3]
15 konkreta exempel [4]
16 konkreta exempel [5]
1.1: allmänt om korpuslingvistik. Lars Borin. Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet
1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet korpuslingvistiska metoder och verktyg i andraspråksforskning forskarutbildningskurs HT
vad är korpuslingvistik? (stora) textsamlingar, 1 (stora) textsamlingar, och annoterade... sammanställda... så, korpuslingvistik innebär:
1.1: allmänt om korpuslingvistik Lars Borin Språkdata/Språkbanken Inst. för svenska språket Göteborgs universitet vad är korpuslingvistik? korpusar är (stora) textsamlingar, sammanställda och annoterade
Meningssegmentering i SUC och Talbanken
Meningssegmentering i SUC och Talbanken Mattias Edlund och Gvargis Demir Institutionen för lingvistik och filologi Uppsala Universitet Box 635 SE-751 26 Uppsala SWEDEN {matted,gevargis}@stp.lingfil.uu.se
Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)
Korpusannotering Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusannotering 1(31) Förra gången Att bygga en korpus sampling uppmärkning annotering
Språk, datorer och textbehandling
Språk, datorer och textbehandling Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng, grundnivå, huvudområde: språkteknologi Syfte: Kursen skall förmedla
Elementära verktyg för korpusbearbetning
Elementära verktyg för korpusbearbetning Föreläsning 1: Introduktion till korpuslingvistik eva.pettersson@lingfil.uu.se 1 Kursplan - Syfte 5 poäng. Ämne: Språkteknologi. Nivå: A Syfte: Kursen behandlar
Korpusar. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusar 1(41)
Korpusar Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusar 1(41) Förra gången Kursinformation Empiriska studier av språk Kvantitativa vs.
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)
Att bygga en korpus. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se
Att bygga en korpus Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Att bygga en korpus 1(42) Förra gången Mer om ordfrekvenser, nyckelord, kollokationer
Korpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik?
Metoder och tillämpningar inom språkteknologin - ht 07 Korpuslingvistik Innehåll Vad är en korpus? Vad är korpuslingvistik? Korpusurval och sammanställning Annotering Korpusexempel Parallellkorpusar Internet
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Språkteknologi (SV2122) Föreläsning 2: Korpusar och deras annotering
Språkteknologi (SV2122) Föreläsning 2: Korpusar och deras annotering Richard Johansson richard.johansson@svenska.gu.se 24 januari 2014 översikt inledning Språkbankens korpusar och sökverktyget Korp annotering
Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp
Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp UNIVERSITY OF Richard Johansson November 11, 2015 dagens presentation sökverktyget Korp Språkbankens korpusar: vilka nns och hur
ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Lingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter
ASLA-information 24:1. 1998. 33 40. Lars Borin Uppsala universitet Institutionen för lingvistik Box 527 751 20 Uppsala Lars.Borin@ling.uu.se ETAP: Etablering och annotering av parallellkorpus för igenkänning
Datorbaserade verktyg i humanistisk forskning
Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi
Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1 2010 bakgrund och förutsättningar
Korpuslingvistik vt 2007
Korpuslingvistik vt 2007 Föreläsning 2: Korpusannotering, textkodning, textnormalisering Eva Pettersson evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Korpussammanställning Textkodning Textnormalisering
Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)
729G49 Språk och datorer (2019) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Detta verk är licensierat under en Creative Commons Erkännande 4.0 Internationell Licens. Filosofi Psykologi
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Lektion 3. Anteckningar
Lektion 3 Anteckningar Fraser: Tid Klockan Uttal (pronunciation) Långa och korta ljud + melodi Grammatik: Word order + Basics of the clause elements Vi lär oss klockan! Halv Kvart i, kvart över Tjugo i,
Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp
Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens
Språk, datorer och textbehandling
Språk, datorer och textbehandling Föreläsning 2: Korpusannotering, textkodning, textnormalisering eva.pettersson@lingfil.uu.se 1 Föreläsningsöversikt Textkodning Teckenkodning Textnormalisering Korpusannotering
bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO
bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1
Datorbaserade verktyg i humanistisk forskning
Datorbaserade verktyg i humanistisk forskning Introduktion till korpuslingvistik Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Korpusuppbyggnad Från textsamling till korpus
Korpusuppbyggnad Från textsamling till korpus Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusuppbyggnad Från textsamling till korpus 1(53)
Tekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik
Introduktion till språkteknologi Föreläsning 2: Korpuslingvistik Eva Pettersson eva.pettersson@lingfil.uu.se 2016-11-09 Förra gången Kursmål och kursintroduktion Språkteknologiska tillämpningar OCR - Dialogsystem
Studenter drillar Lärkas sång om hur studenter lär grammatik via korpusverktyget Lärka
Studenter drillar Lärkas sång om hur studenter lär grammatik via korpusverktyget Lärka Håkan Jansson*, Therese Lindström Tiedemann**, Elena Volodina*** *Högskolan Väst, **Helsingfors universitet / Uppsala
1. M öt et s öp pn an d e S ve n fö r k la r a r mö t et ö p p nat k lo c k a n 13. 5 0 i me d le ms k o nt o r et.
Styrels e möte 7mars 2010 Bila gor: 1. D ago r d ning 2. N är va r o lis t a 1. M öt et s öp pn an d e S ve n fö r k la r a r mö t et ö p p nat k lo c k a n 13. 5 0 i me d le ms k o nt o r et. 2. F o rma
Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?
Språkbanken: lite historia Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur Lars Borin Språkbanken/svenska språket, Göteborgs universitet Giellatekno, UiT 19/2 2014 1970: första
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
samhälle Susanna Öhman
Risker i ett heteronormativt samhälle Susanna Öhman 1 Bakgrund Riskhantering och riskforskning har baserats på ett antagande om att befolkningen är homogen Befolkningen har alltid varit heterogen när det
Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax
Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi
Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954
Projekt i språkteknologi Projektförslag Johanna Karlsson 870411-7129 joka1954 1. Inledning Opus är en växande parallell korpus med data från många olika språk (Tiedemann, 2009). Data som finns i OPUS i
Automatisk extraktion av idiom ur text ANDREAS PETTERSSON
Automatisk extraktion av idiom ur text ANDREAS PETTERSSON Examensarbete Stockholm, Sverige 2012 Automatisk extraktion av idiom ur text ANDREAS PETTERSSON 2D1021, Examensarbete i datalogi om 30 högskolepoäng
Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Projektförslag. Datalingvistisk projektkurs VT mars 2007
Projektförslag Datalingvistisk projektkurs VT 2007 26 mars 2007 Möjliga projekt Utvärdering Att utvärdera ett befintligt program/system utifrån ett datalingvistiskt perspektiv. Exempel: Utvärdera hur ett
Trygghet kring hållplatser Ett framtaget verktyg vid trygghetsanalysering i samband med hållplatser och dess närmaste omgivning
å å ä Ö öö ö ö Ö ö å å ä Ö ö Ö ö Ö Ö ö å å å å ä å å ö ö ä å å ä å ä å ä å å ä å å ö å ö ä ö å ä ä å å ö ä ö ö å ä ö ää ä ä ä å å ö ä å å ä å å ä ö ä åä å ä ö ä å ä å å ö ö å ö ö ö ö å å ä ä ö ö å ä ö
Svenska som additivt språk. Skolverket 20090907 Berit Lundgren FD, Umeå universitet Lilian Nygren Junkin FD, Göteborgs universitet
Svenska som additivt språk Skolverket 20090907 Berit Lundgren FD, Umeå universitet Lilian Nygren Junkin FD, Göteborgs universitet 2009 09 11 1 Språket börjar över potatismoset (A.M. Körling 2008) bas utbyggnad
Grammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
VECKANS LILLA POSTKODVINST á 1.000 kronor Inom nedanstående postkoder vinner följande 219 lottnummer 1.000 kronor vardera:
Dragningsresultat vecka 27-2015 Här nedan kan du se om du är en av de lyckliga vinnarna i veckans utlottning i Svenska PostkodLotteriet. När du har vunnit betalar vi automatiskt ut dina vinstpengar till
Att använda ELAN - Bruksanvisning för annotering och studie av teckenspråkstexter
Att använda ELAN - Bruksanvisning för annotering och studie av teckenspråkstexter Johanna Mesch Institutionen för lingvistik Avdelningen för teckenspråk Version 1. (2009-04-17) Arbete med teckenspråkstexter...
729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Kursintroduktion 2015-04-08 Lars Ahrenberg 1 Plan Kursens innehåll och organisation Text, språk och datorer Textformat och textrepresentationer Korpuslingvistik
Korpusbaserad Maskinöversättning
Linköpings Universitet Institutionen för Datavetenskap Artificiell Intelligens, HKGBB0, HT 2002 Korpusbaserad Maskinöversättning Anna Hillertz KogVet 3, fack14 annhi662@student.liu.se 1 Innehållsförteckning
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta
Tentamensschema VÅREN 2015 Uppdaterat (Anmälan på nätet senast en vecka innan)
Tentamensschema VÅREN 2015 Uppdaterat 2015-02-12 (Anmälan på nätet senast en vecka innan) Datum 150130 150130 Kurskod /schema kod Prov kod EN5006 1402 EN2030 1402 EN2029 1402 SH2009 1401 SH2008 1401 MA1006
ASU-korpusen. Dess sy&e, uppbyggnad och särart. Björn Hammarberg Stockholms universitet, för
ASU-korpusen Dess sy&e, uppbyggnad och särart Björn Hammarberg Stockholms universitet, Ins@tu@onen för lingvis@k Swe-Clarin på turné, Stockholms universitet 2018-05-16 Vad är ASU-korpusen tänkt för? Dataresurs
Statistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2016) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Språk och datorer Korpuslingvistik och
Opp, Amaryllis (Fredmans sång nr 31)
Opp, marylls (Fredmans sång nr 1) Text musk: Carl Mchael Bellman rr: Eva Toller 05 Tenor 1 1Opp, Tag - ma - ryl - ls, vak - na mn ll -! äd - ret stl -, d re - var dra-gen; bör - jar -gen, Tenor 2 Basso
Översikt. Mer om XML & TEI Kurstillfälle 2. Grundläggande principer 1. Grundläggande principer 2. Hierarkisk dokumentmodell. XML & flexibilitet
Mer om XML & TEI Kurstillfälle 2 Monica Langerth Zetterman Innehållsdesign av digitala resurser Kurs i masterprogrammet för digitala medier Uppsala universitet, Institutionen för utbildning, kultur och
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår
Språk, datorer och textbehandling
Språk, datorer och textbehandling Föreläsning 4: Korpussökning Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt Språkbanken
Språkbanken en (inter)nationell forskningsinfrastruktur
Språkbanken en (inter)nationell forskningsinfrastruktur 1 Språkbanken en (inter)nationell forskningsinfrastruktur Språkbanken som forskningsenhet Språkbanken inrättades 1975
Tranås vattenkuranstalt. Tranås vattenkuranstalt.
Tranås vattenkuranstalt Tranås vattenkuranstalt. 1916 EOD Miljoner böcker bara en knapptryckning bort. I mer än 10 europeiska länder! Tack för att du väljer EOD! Europeiska bibliotek har miljontals böcker
Changes in value systems in Sweden and USA between 1996 and 2006
Changes in value systems in Sweden and USA between 1996 and 2006 Per Sjölander Kristian Stålne Swedish network for Adult development Stages according to EDT (Loevinger) Stage Characteristics E4 Conformist/Diplomat
Introduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
äkta Bredband, ett krav för framtidens multiservice nät?
äkta Bredband, ett krav för framtidens multiservice nät? U lf V in n e ra s D e s ig n c o n s u lta n t, C is c o S y s te m s 2 0 0 2, C is c o S y s te m s, In c. A ll rig h ts re s e rv e d. U lf V
729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Språk och datorer Korpuslingvistik och
Korpusanalyser och Lab G09 Språkvetenskaplig databehandling
Korpusanalyser och Lab 4 729G09 Språkvetenskaplig databehandling 2014-05-21 Laborationens syfte Öva användningen av webbaserade korpusar och korpusverktyg frekvensberäkningar konkordanser kollokationsverktyg
Swell code book (error taxonomy + examples)
Swell code book (error taxonomy + examples) ## Lexical codes (5) L Wrong word This error code can be used only to mark existing Swedish words that have been used in an incorrect way or context Traditioner
om Stockholm Befolkning Basområdeslistan 2012
2012 IÅ I 1 1 2 2012 3 I 3 O 3 4 O 4 O 5 OC ÖCI 1 O, 20111231 2 3 20111231, 20111231,, 1 ÖO w 2012 2011,,,,, 1 O (O) U O : 2011 2011 ( ) ( ) ://www 2 OÅI 2012 I O : 1990 U (U) x / 1987 1999 I: (YO) (
Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
LABORATION 4: Textmanipulering Introduktion till lingvistik och datalingvistik XD1110
GÖTEBORGS UNIVERSITET Utbildningsprogrammet i datalingvistik Robert Andersson 14 november 2006 LABORATION 4: Textmanipulering Introduktion till lingvistik och datalingvistik XD1110 Inledning Samlingar
R app o r t T A n a l y s a v f as t p r o v. Ut f ä r dad A le xa n d e r G i r on
S i da 1 (13 ) A n k o m s tdatum 2016-05 - 31 T y r é n s AB Ut f ä r dad 2016-06 - 08 A le xa n d e r G i r on P r o j e kt Ka b el v e r k e t 6 B e s tnr 268949 P e t e r M y nd es B ac k e 16 118
NODALIDA '93. Proceedings of 9:e Nordiska Datalingvistikdagarna' Stockholm 3-5 June R o b e r t E k l u n d, e d i t o r
NODALIDA '93 Proceedings of 9:e Nordiska Datalingvistikdagarna' Stockholm 3-5 June 1993 R o b e r t E k l u n d, e d i t o r S t o c k h o l m 1 9 9 4 T h is v o lu m e w a s s p o n s o r e d b y : Humanistisk-Samhallsvetenskapliga
Thomas Gartz 24.10.2010
Thomas Gartz 24.10.2010 Kodningspraxis för Zacharias Topelius Skrifter A INLEDNING... 2 A.1 KODSPRÅKEN XML OCH TEI... 2 A.2 AUTOMATISKT OCH MANUELLT... 6 A.3 XML COPY EDITOR... 8 A.4 FILSTRUKTURER... 12
Information från Medborgarkontoret Hösten 2013
E ö hö ö! DENNA SIDA ÄR EN ANNONS G Im M Hö 2013 M G Yv P ch U Bjöm ö m ö G. M m hö! Å F ä! Ö ö M G M... 13-18 T... 13-16 O... 13-16 T... 13-18 m ä ä. A: Hcv. 1, 247 70 G T: 046-35 63 57 Fx: 046-35 70
L iv e t s b ö r ja n
L iv e t s b ö r ja n H u r h a r liv e t F R Ä M S T 4 O L I K A H Y P O T E S E R u p p k o m m it? S K A P E LS E TE O R IN : G U D S K A P A D E L I V U R A LS TR IN G S TE OR IN : L I V K A N U P
Read, work and talk! - och Lgr 11
! - och Lgr 11 Lgr 11 talar om att syftet med undervisningen i engelska är att ge eleverna förutsättningar att utveckla olika förmågor: att förstå och tolka innehållet i talad engelska och i olika slags
Kort och gott Svenskt basordförråd. Katarina Mühlenbock, DART
Kort och gott Svenskt basordförråd Katarina Mühlenbock, DART Vad är ett ord? Vi kan göra pauser då vi uttalar ett ord Ett ord kan oftast bytas ut mot ett annat med liknande funktion och betydelse Kan (oftast)
Teoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd
Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd Håkan Jansson, Judy Ribeck & Emma Sköldberg Institutionen för svenska språket Göteborgs universitet NFL, Oslo 2013 En
Mer aktuell eller aktuellare? En korpusbaserad undersökning av svenskans adjektivkomparation de senaste årtiondena
UPPSALA UNIVERSITET Institutionen för nordiska språk C-UPPSATS Svenska språket/nordiska språk Vt. 2009 AnnaMaria Tahlén Vaksalagatan 44 A 753 31 Uppsala annamariatahlen.3440@student.uu.se Mer aktuell eller
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Maskinöversättning möjligheter och gränser
Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?
Konventionaliserade fraser i en akademisk ordlista
Konventionaliserade fraser i en akademisk ordlista Forskning kring Academic Formulas List (AFL) Ellis, Simpson-Vlach & Maynard 2008 Simpson-Vlach & Ellis 2010 Julia Prentice, ISA, Julia.prentice@svenska.gu.se
Morfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Korpusmått, korpusbalans och korpusrepresentativitet
Korpusmått, korpusbalans och korpusrepresentativitet Beáta Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpusmått, korpusbalans och korpusrepresentativitet
Att undersöka språkmöten med datorn
Att undersöka språkmöten med datorn Lars Borin Vad är språkmöten och hur märker man av dem? Det som jag i rubriken syftar på med termen språkmöten studeras i språkvetenskapen under några olika rubriker;
Lingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2016) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Från form till betydelse pragmatik semantik analys generering syntax morfologi Skolans
Listen to me, please!
Till pedagogen är särskilt riktat mot det centrala innehållet Lyssna och läsa i ämnet engelska i Lgr11. Syftet med materialet är att: Eleverna ska ha roligt tillsammans i situationer där eleven är ledare.
Språk och begriplighet i journaler Mia Kvist
Språk och begriplighet i journaler Mia Kvist Inst. för data- och systemvetenskap (DSV), Stockholms universitet, och Läkaresällskapets språkkommitté maria.k.kvist@sll.se Hypertoni o DM, brtsm och St lyft
En pilotstudie för automatisk analys av elevtexter
En pilotstudie för automatisk analys av elevtexter Jesper Näsman Institutionen för lingvistik och filologi Språkteknologiprogrammet Kandidatuppsats i språkteknologi 29 maj 2015 Handledare: Beáta Megyesi
Bootstrapping för substantivtaggning
Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson j0j0@kth.se Mikael Melin mime@kth.se Handledare: Jonas
VECKANS LILLA POSTKODVINST á 1.000 kronor Inom nedanstående postkoder vinner följande 270 lottnummer 1.000 kronor vardera:
Dragningsresultat vecka 14-2015 Här nedan kan du se om du är en av de lyckliga vinnarna i veckans utlottning i Svenska PostkodLotteriet. När du har vunnit betalar vi automatiskt ut dina vinstpengar till
Så, ska det taggas som adverb?
UPPSALA UNIVERSITET Institutionen för nordiska språk EXAMENSARBETE, 15 hp Svenska språket/nordiska språk C Vt 2017 Så, ska det taggas som adverb? En granskning av hur annoteringsverktyget Swegram ordklasstaggar
eìã~åáëíáëâ~=ñ~âìäíéíéå= = = = c opi^d=======_n=numslmp= = OMMQJMRJOR= = = c~âìäíéíëå ãåçéåë=äéç~ã íéê
eìã~åáëíáëâ~ñ~âìäíéíéå c opi^d_nnumslmp OMMQJMRJOR c~âìäíéíëå ãåçéåëäéç~ã íéê Utlysning av medel till forskning inom språkteknologi ûêéåçéí c~âìäíéíëå ãåçéåäéü~åçä~çéommqjmpjmqñê Ö~åçãìíäóëåáåÖ~îãÉÇÉäÑ
Blåsen nu alla (epistel nr 25)
lås al (epstel nr 25) ext musk: Carl Mchael ellman oprano 4 3 rr: Eva oller 2004 lto or 4 3 4 3 lå - s Fåg - r - al - tt - ta, hör öl - jor - fs - kar - sval - ås - kan sprt - ta ur stt går rum; e - gas
Svenskans digitala resurser. Elzbieta Strzelecka elzbieta.strzelecka@miun.se
Svenskans digitala resurser Elzbieta Strzelecka elzbieta.strzelecka@miun.se 1 Utbildning och underhållning språkkurser, interaktiva övningar, diagnostiska prov, kvantitativa mått, radio- och teveprogram,
Korpussökning och korpusmått 1(44)
Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer
In Bloom CAL # 5. Virka inte v för hårt / don t crochet r to tight. V 35 / r 35 (5) Upprepa v 18. [38 1-lm-bågar / sida och 2 lm / hörn]
In Bloom CAL # 5 I del 5 använder du virknål 3.0 mm. Efter varje varvsnummer står numret (1-7) för den färg du skall använda för det varvet, se färg/garn-tabellen. Du kommer att repetera varv från del
Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE
Språteknologi på SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE digital kompetens kring ordböcker, språkkontroller, korpusar och söktjänster! Följer teknikens påverkan på språk och språkanvändning! Bevakar språkteknisk
Att använda ELAN. Bruksanvisning för annotering och studie av teckenspråkstexter. Johanna Mesch
Att använda ELAN Bruksanvisning för annotering och studie av teckenspråkstexter Johanna Mesch Institutionen för lingvistik Avdelningen för teckenspråk Projektet Korpus för det svenska teckenspråket, Riksbankens
Avtal om nyttjande av maskinellt läsbara texter för forskningsändamål
Avtal om nyttjande av maskinellt läsbara texter för forskningsändamål Mellan Institutionen för Lingvistik, Stockholms universitet, Institutionen för Lingvistik, Umeå universitet (gemensamt benämnda IL)