729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp
|
|
- Jonathan Olof Olofsson
- för 8 år sedan
- Visningar:
Transkript
1 729G17/729G66 Lexikal semantik och ordbetydelsebestämning Olika ordbegrepp Ordbetydelser Vad är ett ord? Lemman, lexem och betydelser Semantiska relationer Semantiskt strukturerade lexikon Hitta relationer i text Ordbetydelsebestämning Kontextindikatorer Beslutslistor Löpord, graford, token sträng av alfanumeriska tecken i löpande text Lemma formell enhet som representerar ett antal böjningsformer enligt ett visst böjningsparadigm. Jmf. uppslagsord i ett lexikon. Ordform löpord (eller typord) sett som en böjningsform av ett lemma Lexem ett lemma kopplat till en specifik betydelse Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Olika ordbegrepp Vad är ordbetydelse (1) Ordformer Lemman Betydelser fil filar filer fil-1 fil-2 fila-1 FIL_1 (verktyg) FIL_2 (vägbana) FIL_3 (datafil) FIL_4 (filmjölk) FILA_1 (bearbeta) Skillnad innehållsord funktionsord Den semiotiska triangeln (för innehållsord): ord begrepp företeelser (utanför språket) Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Vad är ordbetydelse (2) Ett lexikonutdrag (källa: Svensk Ordbok) Teoretiska svar: extension (mänder av företeelser) begrepp, intension, denotation + konnotation, Praktiskt svar: det som i ett (stort) lexikon är definierat som en betydelse, t.ex. Nationalencyklopedins ordbok, Wordnet, stryka, v. 1 föra handflatan längs med någonting (a) med användning av andra kroppsdelar, (b) i syfte att avlägsna ngt (c) i syfte att föra samman något 2 belägga en yta med färg eller annat mjukt ämne 3 släta ut tyg med hett strykjärn 4 dra streck med penna i anslutning till ngt skrivet (a) som markering, (b) för att ta bort ngt (c) bildligt utesluta, ta bort 5 hala ned flagga 6 förflytta sig smygande eller dold Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg)
2 Semantiska relationer mellan lexem Semantiska relationer mellan lexem synonymi strikt synonymi (utbytbarhet i alla kontexter) extensionellt överlapp (WordNet: synsets) pojke, kille, grabb, gosse,... flertydighet / ambiguitet homonymi/homografi (samma form, helt olika betydelse) kurs; fil;... polysemi (samma form, olika men relaterade betydelser) fot; grön; stryka;... hyponymi / hyperonymi semantisk under- resp. överordning häst är hyponym till däggdjur som är hyponym till djur del- helhetsrelationer knä är meronym till ben som är meronym till kropp motsatser (antonymi) stor ~ liten; död ~ levande; höger ~ vänster,... Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Semantiskt strukturerade lexikon Sökning i WordNet 3.0 Ordnät omfattar lexem, hierarkiska och icke-hierarkiska relationer och aspirerar på att täcka ett helt språk, Exempel: WordNet Tesaurus grupperar ord efter ämnesområden och/eller verksamheter, t.ex. sport, matlagning,... Exempel: Rogets Taxonomi / Kontrollerad vokabulär en hierarki av (validerade) termer, ofta för ett bestämt ämnesområde. Exempel: MeSH Terminologi begreppsbaserad taxonomi som innehåller definitioner av begreppen Ontologi formaliserad, begreppsbaserad struktur Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Information (delar) om ordet course i WordNet SALDO en resurs för svenska Sense 1 (education imparted in a series of lessons or meetings) course of study, course of instruction, class, education, instruction, teaching,... Synset Sense 2 (a connected series of events or actions or developments) line series Hypernyms Sense Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg)
3 MesH Medical Subject Headings MeSH Medical Subject Headings MeSH är en kontrollerad vokabulär av ämnesord som stöder sökning i artikeldatabasen Medline. Exempel: Body regions [A01]... Back Lumbosacral Region Sacrococcygeal Region Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Användning av ordnät/taxonomier Hitta semantiska relationer i text Informationssökning Expansion av sökfrågor mha synonymer, över- och underordnade begrepp Tvärspråklig informationssökning Textförståelse Frågebesvarande system Vilka frukter innehåller mest vitaminer? Diskursrelationer Bilen startade inte. Det kom bara ett svagt surr från motorn. Jmf. *Det kom bara ett svagt surr från humlan. Vissa satsmönster uttrycker typiskt vissa semantiska relationer. Dessa kan användas för att bygga ut ordnät: Ett exklusivare fruktfat som förutom originalfrukterna innehåller en mix av säsongens lyxigare frukt så som kiwi, physsalis, rambutan, bigaråer, sharon, mango, jordgubbar, papaya ect. Smoothie - Allt du behöver är en mixer, yoggi citron, och frukter typ nektarin eller melon, och bär i mängder... Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Betydelsebestämning Betydelsebestämning Betydelsebestämning innebär att bestämma en ordförekomsts betydelse i en given kontext. Exempel: Du stryker dig från sändlistan genom ett tomt mail till: leave-dagens@nyheter.skolporten.com Sampelbaserad betydelsebestämning ett stort antal förekomster av ett fåtal ord har märkts upp med avseende på sin betydelse i olika meningskontexter. Dessa delas upp i träningsdata och testdata. Uppgiften är att utforma ett ordbetydelsesystem som presterar så bra som möjligt på testdata Exempel: <s id= 36 sense= stryka-6 >Det visade sig alltså att det inte bara är en utan minst två, kanske tre vargar som stryker omkring bland villorna här på området</s> Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg)
4 Betydelsebestämning Prestandamätning av WSD-system Textbaserad betydelsebestämning: Alla förekomster av innehållsord i en mängd texter ska ges en korrekt betydelse. Som träningsmaterial ges ett lexikon med de betydelser som används. Korrekthet, dvs procent korrekt i jämförelse med ett facit. Jämförelse med ett baseline-system, ofta ett system skapat ur ett maskinläsbart system med hjälp av definitionerna i lexikonet. Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Ett lexikonutdrag (källa: Svensk Ordbok) Lexikonbaserad metod stryka, v. 1 föra handflatan längs med någonting (a) med användning av andra kroppsdelar, (b) i syfte att avlägsna ngt (c) i syfte att föra samman något 2 belägga en yta med färg eller annat mjukt ämne 3 släta ut tyg med hett strykjärn 4 dra streck med penna i anslutning till ngt skrivet (a) som markering, (b) för att ta bort ngt (c) bildligt utesluta, ta bort 5 hala ned flagga 6 förflytta sig smygande eller dold associera betydelser med ordmängder via lexikondefinitioner. Exempel: stryka 1 : {föra, handflata, längs, med} stryka 2 : {belägga, yta, med, färg, mjukt, ämne} stryka 6: {förflytta, sig, smygande, eller, dold } detta kan ev. göras i flera steg yta-1: yttersta skikt av något... yta-2: storlek som kan mätas i längd och bredd... Jämför dessa mängder med orden i ett fönster runt det ord som ska betydelsebestämmas och/eller motsvarande mängder för dessa ord. Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Lexikonbaserad metod (forts.) Hur stor kontext behövs? Välj den betydelse vars ordmängd har störst överlappning med mängderna för orden i fönstret. Exempel: stryker med den blå penseln... blå = som har samma färg som en klar himmel Förutsätter tillgång till ett lexikon med definitioner men kräver inte manuell uppmärkning av en korpus stryks då stryks fyra, då stryks fyra nollor Rumänien, då stryks fyra nollor från i Rumänien, då stryks fyra nollor från sedlarna Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg)
5 Indikatorbaserad metod Indikatorbaserad metod Identifiera ett antal indikatorer (eng. features, dvs ord, lemman, ordklasser) för ordet som ska betydelsebestämmas Dessa kan ses som element i en vektor V = (v 1,, v n ); Uppskatta från träningsdata för varje betydelse s, p(v i s); Utjämnning är nödvändig för att uppskatta sannolikheter för indikatorer som ej setts i träningsdata. Givet en förekomst av ordet vars kontext svarar mot vektorn V, välj den betydelse s* som är mest sannolik i kontexten, dvs s* = argmax p(s V) = (enligt Bayes regel) s argmax p(s)p(v s) / p(v) = argmax p(s)p(v s) s s Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Indikatorbaserad metod Positionsbaserade indikatorer p(s) uppskattas med den relativa frekvensen i träningsdata, ev. med smoothing, och anger hur vanlig betydelsen s är a priori p(v s) uppskattas med produkten p(v i s). 1i n OBS! Detta innebär ett antagande om oberoende som inte är korrekt. Smoothing är nödvändigt vid uppskattning av p(v i s). Det är också vanligt att överföra allt till log-skala för att inte få för små tal vid beräkning av p(v s) (OBS! boken använder collocation i stället för position.) Idé: den lokala kontexten ger tillräcklig information, t.ex. i form av ord och ordklass för de två närmaste orden till höger och vänster om ordet vars betydelse ska bestämmas. Exempel:... vargar som stryker omkring bland... <vargar, NN, som, RELPRO, omkring, ADV, bland, PREP> Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg) Indikatorer baserade på fönster Beslutslistor Orden i ett fönster på ca 20 positioner runt om fokusordet noteras och jämförs med de ord som hittats i träningsdata i samma fönster. Varje ord är en indikator. En kontext representeras då som en vektor med 1:or och 0:or där 1 noteras om ordet finns i kontexten. I stället för att låta indikatorerna vägas ihop kan de ordnas i beslutslistor Första indikatorn som ger utslag avgör. Exempel: stryka omkring stryka 6 bort i litet fönster stryka 1b <klädesplagg> i stort fönster stryka 3 omkring i litet fönster stryka 6 etc. Språkteknologi (Lars Ahrenberg) Språkteknologi (Lars Ahrenberg)
6 Betydelsebestämning vs ordklasstaggning Vad skiljer dessa två problem åt? Antal kategorier per ord? Antal kategorier totalt? Storleken på nödvändig kontext? Svårighetsgrad? Språkteknologi (Lars Ahrenberg)
TDDD02 Föreläsning 4 HT Klassificering av ord och dokument Lars Ahrenberg
TDDD02 Föreläsning 4 HT-2013 Klassificering av ord och dokument Lars Ahrenberg Översikt Ø Avslutning om ngram-modeller Dokumentrepresentation Ø Klassificering med Naive Bayes ett typexempel generell metod
Läs merSemantiska relationer. Hanna Seppälä Uppsala universitet 1
Semantiska relationer Föreläsning 6 Uppsala universitet 1 Teman idag Lexikal semantik Kollokation och idiom Ambiguitet och vaghet Semantiska relationer mellan ord Lexikala universalier Uppsala universitet
Läs merLexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1
Lexikal semantik Lingvistik 1 Uppsala universitet 1 Nyckelord idag Semantiska egenskaper Komponentanalys Prototypteori Relationer mellan ord Kognitiv lexikal semantik Uppsala universitet 2 Semantiska egenskaper
Läs merSemantik. Semantik och språkteknologi
Semantik Semantik studiet av innebörd(mening) Går tillbaka till Platon (dialogen Kratylos) Relationen språk verklighet Betydelsen av ett ord är dess användning i språket (Wittgenstein) Semantik och språkteknologi
Läs merSemantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse
Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merLexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet
Lexikal semantik & Kognitiv semantik Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet 1 Dagens föreläsning Saeed 2009, kap.3, 11 Lexikal semantik Lexikala relationer Kognitiv
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 3 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Lexikal semantik/begrepp (förra gången) Vaghet kontra
Läs merTDDD02 Språkteknologi för informationssökning (2016) Semantisk analys. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys Marco Kuhlmann Institutionen för datavetenskap Semantik pragmatik semantik analys generering syntax morfologi Denna föreläsning ordbetydelsebestämning
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merKommunikation. Språk och språkteknologier. Semiotik. Kommunikationsmodell. Saussures strukturalism. Finns betydelse? Teckenkod.
Kommunikation Språk och språkteknologier Rickard Domeij domeij@nada.kth.se Teckenkod ljud, skrift, gester, programkod... Verktyg kil, penna, tryckpress, dator... Medium lerplattor, böcker, radio, TV, internet...
Läs mer2D1418, språkteknologi. Vad är WordNet? Hans Eriksson december Datorpost personnummer:
2D1418, språkteknologi Vad är WordNet? Hans Eriksson 1 19 december 2000 1 Datorpost d97-hae@nada.kth.se, personnummer: 770628 1 WordNet WordNet är ett projekt som syftar till att konstruera ett digitalt
Läs merVad är semantik? LITE OM SEMANTIK I DATORLINGVISTIKEN. Språkteknologi semantik. Frågesbesvarande
LITE OM SEMANTIK I DATORLINGVISTIKEN (FORMELL SEMANTIK) Vad är semantik? Form (abstrakt struktur): grammatik Innehåll (betydelse): semantik Användning: pragmatik/diskurs Mats Dahllöf Språkteknologisk motivation
Läs merKort presentation av Korp, Sveriges nationalkorpus
Kort presentation av Korp, Sveriges nationalkorpus Göteborgs universitet 19 januari 2017 vid Avdelningen för nordiska språk, L Orientale-universitetet i Neapel Fil.dr. i slaviska språk. Undervisat i slovenska,
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merCinahl Headings. Sökguide. Sökning med kontrollerade ämnesord
Cinahl Headings Sökguide Sökning med kontrollerade ämnesord Cinahl Headings - en ämnesordlista för vården Cinahl Headings är uppbyggd på samma sätt som MeSH - Medical Subject Headings Ca 70% av alla ämnesord
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merSvensk nationell datatjänst, SND BAS Online
Pass 4: Metadatastandarder Mer om metadatastandarder Välkommen till presentation 3 i pass 4. Den här presentationen handlar om några olika teman som har att göra med metadatastandarder. Jag kommer att
Läs merWord sense disambiguation med Svenskt OrdNät
MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2006:34 ISSN 1404-0891 Word sense disambiguation med Svenskt OrdNät JENS CHRISTIANSSON
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merBetydelse och betydelse
Betydelse och betydelse Ordbetydelsedisambiguering i praktiken Stian Rødven Eide stian@fripost.org Självständigt arbete i lingvistik, 15 hp Göteborgs universitet Institutionen för filosofi, lingvistik
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merTerminologins terminologi: begreppsdiagrammen
Terminologins terminologi: sdiagrammen Förord Terminologins terminologi: sdiagrammen är en samling av sdiagram som åskådliggör relationer mellan alla som finns i Terminologins terminologi: ordlistan. Förklaringar
Läs merKursplaneöversättaren. Lina Stadell
Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad
Läs merDatorbaserade verktyg i humanistisk forskning
Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt
Läs merSvensk nationell datatjänst, SND BAS Online
Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 3 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Lexikal semantik och begreppsanalys Givet ett lemma hur många begrepp eller lexem står det för? Vem/vad bestämmer innehållet
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merKarp. https://spraakbanken.gu.se/karp Övningar Språkbankens höstworkshop oktober 2016
Karp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/karp sb-karp@svenska.gu.se 17 oktober 2016 ÖVERSIKT När du går in på https://spraakbanken.gu.se/karp kan du välja att söka i ett
Läs merStorlek Pris Antal frukter 4 kg 185:- 25-30 6kg 262:- 35-40 9kg 379:- 45-50 11kg 459:- 65-70
Fruktkorg Premium Vår exklusiva korg, innehåller en mix av lyxigare frukt. I denna korg återspeglar vi årstidernas och fruktsäsongernas svängningar. Korgen innehåller färre basfrukter, och fylls sedan
Läs merSALDO. En ruta kommer upp och du uppmanas att skriva in ett ord inte nödvändigtvis en lexikonform, det kan också vara en böjd form.
SALDO Beskrivningen av SALDO finner du på adressen http://spraakbanken.gu.se/saldo För att söka i SALDO går du till den här adressen: http://spraakbanken.gu.se/ws/saldo-ws/fl/html En ruta kommer upp och
Läs merSchema för semantikdelen i kognitionsvetenskap, ht 2008
Sören Sjöström Institutionen för lingvistik Göteborgs universitet Schema för semantikdelen i kognitionsvetenskap, ht 2008 1. Tisdagen den 25 november, kl 10-12 (i von Neuman) Inledning: kognitionsvetenskap
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merDagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering
Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)
Läs merTänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se
Tänk kreativt! Informationssökning Ha ett kritiskt förhållningssätt! Informationssökning steg för steg Innan du börjar behöver du formulera en fråga. Vad vill du hitta information om? Att utgå från: -
Läs merKritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II
Kritiskt tänkande HTXF04:3 FTEB05 Grundläggande semantik II Deskriptiv vs. värderande/känslomässig mening Ords betydelser kan ha både deskriptiva och värderande/känslomässiga komponenter. Det blir tydligt
Läs merUmeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013
Campus Örnsköldsvik Söka artiklar, kursen Människans livsvillkor, 22 januari 2013 Under Söka och skriva på http://ovik.u b.umu.se/ finns länkar till lexikon, Sökhjälp och guider, Medicin och Skriva uppsats,
Läs merEvidensbaserad informationssökning
Vetenskapligt förhållningssätt Evidensbaserad informationssökning Anna Wilner, NU-biblioteket www.nusjukvarden.se/nubiblioteket Mail: biblioteket.nu@vgregion.se Tel: 010-435 69 40 Jessica Thorn, Biblioteket
Läs merSkrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord
Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord
Läs merInformationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)
Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs merWord- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Läs merCinahl sökguide. Enkel sökning. Ämnesordsökning
Medicinska fakultetens bibliotek, Lund. Monica Landén. 2014-02-20 Cinahl sökguide Enkel sökning Select a Field (optional) sökningen görs som keyword i titel, abstract och subject heading (ämnesord). Genom
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merBLOCK 1. 1A. Att komma igång
BLOCK 1 1A. Att komma igång Blocket omfattar sidorna 8 23 i läseboken och sidorna 7 8 i grammatikboken samt hörövningar. 1. Vem är du? 2. Vilka fyra färdigheter är viktiga vid språkinlärning? 3. Hur många
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta
Läs merTDDD02 Föreläsning 7 HT-2013
TDDD02 Föreläsning 7 HT-2013 Textsammanfattning Lars Ahrenberg Litt: Våge et al.170-185; Das & Martins, A Survey on Automatic Text Summarization sid 1-4, 11-14, 23-25. Översikt Textstruktur Problemet textsammanfattning
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merI CINAHL hittar du referenser till artiklar inom omvårdnad och hälsa. Även en del böcker och avhandlingar finns med.
CINAHL Vad innehåller CINAHL? I CINAHL hittar du referenser till artiklar inom omvårdnad och hälsa. Även en del böcker och avhandlingar finns med. Fritextsökning Fritextsökning innebär att du söker i alla
Läs merPubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.
PubMed lathund 2018-07-19 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på Du kan välja hur träffarna ska sorteras. T ex efter Best Match eller
Läs merInternet. En enkel introduktion. Innehåll:
Internet En enkel introduktion Innehåll: Datorns olika delar Starta datorn Så gör du om du kan webbadressen Så gör du om du inte kan webbadressen Kortfattad repetition Alingsås bibliotek, 2012 2 3 4 6
Läs merMed Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi
Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1 2010 bakgrund och förutsättningar
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Läs merUmeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I
HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merSpråk, datorer och textbehandling
Språk, datorer och textbehandling Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt Sökmotorer
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merPublicera material i Blackboard
Marie Andersson, IKT-centrum E-post: iktcentrum@mdh.se 2012-06-25 (Bb Learn 9.1.8) Publicera material i Blackboard Innehåll Att tänka på... 2 Mappar och Lärmoduler... 2 Skapa en mapp... 2 Skapa en lärmodul...
Läs merSemantik och pragmatik (1) Inledning. Lexikal semantik. Mats Dahllöf Institutionen för lingvistik och filologi Mars / 55
Semantik och pragmatik (1) Inledning. Lexikal semantik. Mats Dahllöf Institutionen för lingvistik och filologi Mars 2015 1 / 55 Dagens punkter Kursformalia. Allmänna begrepp och idéer. Ordsemantik. 2 /
Läs mer2D1418, Språkteknologi
2D1418, Språkteknologi Uppsatsuppgift: Wordnets uppbyggnad Johnny Bigert, d95-jbi@nada.kth.se 19 oktober 2001 Bakgrund När man bygger system för stavningskontroll och grammatikkontroll behöver man stora
Läs merFTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
Läs merÅke Viberg. 1. WordNet
av Åke Viberg Syftet med projektet Svenskt OrdNät är att utveckla ett betydelsebaserat svenskt lexikon på dator som kan kopplas till ett antal parallella lexikon för andra europeiska språk utvecklade i
Läs merTDDC74 Programmering: Abstraktion och modellering Dugga 2, Tid: kl 08-10, Datum:
TDDC74 Programmering: Abstraktion och modellering Dugga 2, Tid: kl 08-10, Skriv tydligt så att inte dina lösningar missförstås. Använd väl valda namn på parametrar och indentera din kod. Även om det i
Läs merSemantik och pragmatik (serie 5)
Semantik och pragmatik (serie 5) (Predikat)logik Mängdlära överkurs (och repetition för en del). Mats Dahllöf Institutionen för lingvistik och filologi April 2015 1 / 41 Korsning av två egenskaper E 1
Läs merSöka artiklar i CSA-databaser Handledning
På Malmö högskola har vi flera databaser via CSA, bl.a. Sociological Abstracts, Social Services Abstracts, ERIC och PsychInfo, det betyder att gränssnittet för dessa databaser ser likadana ut. Om du har
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 2 http://stp.lingfil.uu.se/~matsd/uv/uv09/sempvt/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2009 Extension (igen) Extensionen för ett begrepp/ord:
Läs merMarco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014
Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng
Läs merSå här använder du termbanken
Lathund 2014-05-055 Dnr 1.3-25607/2014 1(5) Regler och behörighet Emma Leeb-Lundberg emma.leeb-lundberg@socialstyrelsen.se Så här använder du termbanken Sök i termbanken På ingångssidan kan du söka i termbanken
Läs merKorpussökning och korpusmått 1(44)
Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer
Läs merArbetsdokument Nationella riktlinjer för rörelseorganens sjukdomar
Arbetsdokument Nationella riktlinjer för rörelseorganens sjukdomar Detta arbetsdokument är resultatet av en litteratursökning utifrån ett tillstånds- och åtgärdspar. Dokumentet har använts som underlag
Läs merPilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering
Pilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering Eva Pettersson evapet@stp.ling.uu.se Uppsala universitet
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merVarför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv09/sempvt/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2009 Kursens lärandemål (ur kursplanen) (LM 1) förklara
Läs merKomma igång med 3L Pro 2014. Komma igång med 3L. Copyright VITEC FASTIGHETSSYSTEM AB
Komma igång med 3L Innehåll LOGGA IN I 3L... 3 Verktyg och kortkommandon... 6 Övriga tangenter... 9 RAPPORTUTSKRIFT I 3L... 10 Instruktioner för att skriva till fil:... 11 Logga in i 3L Ikonen för 3L Pro
Läs merSkäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.
Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 2 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2013 1 Grundläggande strukturella drag hos språk Reproducerbarhet:
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merFöreläsning 1. Grundläggande begrepp
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 1 Sannolikhetsteori (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merTentamen i Grundläggande programmering STS, åk 1 lördag 2002-05-25
Tentamen i Grundläggande programmering STS, åk 1 lördag 2002-0-2 Skrivtid: 09.00 14.00 Hjälpmedel: Inga Lärare: Anders Berglund. Elena Fersman besöker tentan vid två tillfällen: cirka kl. 10.30 samt cirka
Läs merKorpuslingvistik. Metoder och tillämpningar inom språkteknologin - ht 07. Innehåll. Vad är en korpus? Vad är korpuslingvistik?
Metoder och tillämpningar inom språkteknologin - ht 07 Korpuslingvistik Innehåll Vad är en korpus? Vad är korpuslingvistik? Korpusurval och sammanställning Annotering Korpusexempel Parallellkorpusar Internet
Läs merKognitiv semantik. Hanna Seppälä Uppsala universitet 1
Kognitiv semantik Föreläsning 3 Uppsala universitet 1 Kognitiv semantik det finns ingen skillnad mellan språklig kunskap och allmän n tänkandet alla språkliga nivåer är r sammankopplade Uppsala universitet
Läs merMöt svenskan. serien. Möt svenskan är avsedd för nyanlända ungdomar på högstadiet och språkintroduktion. Innehåller utdrag från alla tre böckerna!
Möt svenskan serien Möt svenskan är avsedd för nyanlända ungdomar på högstadiet och språkintroduktion. Innehåller utdrag från alla tre böckerna! Möt svenskan består av tre böcker som metodiskt tränar eleverna
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv08/sempht/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2008 (LM 1) förklara några olika sätt att definiera begreppet
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merAnvänd WordFinder från Mac App Store optimalt! Snabbguide med nyttiga tips och trix.
Använd WordFinder från Mac App Store optimalt! Snabbguide med nyttiga tips och trix. Tekniska förutsättningar För WordFinder från Mac App Store krävs följande: Processor: Intel Mac OS X 10.6.6 eller senare.
Läs merSkriv ditt sökord i sökrutan och markera rutan för att föreslå ämnesord (Suggest Subject Terms).
Guide - Avancerad Sökning i EBSCOs databaser Samtliga databaser har även fritextsökning som du hittar i Basic search. CINAHL och Medline Denna guide visar hur ni använder funktionerna Suggest Subject Terms
Läs merFlera nivåer i språkets uppbyggnad
Flera nivåer i språkets uppbyggnad dubbel artikulation flernivåsystem fonem = minsta betydelsskiljande enhet morfem = minsta betydelsebärande enhet fonem/fon > morfem-morf > lexem-ordform > fras-? > sats-?
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Läs merBiblioteken, Futurum 2017
Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken
Läs merKom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel: www.minsajt.
Kom igång Logga in Skriv in adressen till din webbsida följt av /login. Exempel: www.minsajt.se/login Nu dyker en ruta upp på skärmen. Fyll i ditt användarnamn och lösenord och klicka på "logga in". Nu
Läs merbalja ett stort kärl av metall eller plast som man t.ex. diskar eller tvättar i bank ett företag där man t.ex. kan låna pengar eller spara pengar
TUMBA BRUK anlägga börja bygga något anonym som inte talar om sitt namn ark ett blad av papper balja ett stort kärl av metall eller plast som man t.ex. diskar eller tvättar i bank ett företag där man t.ex.
Läs merspecialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet
www.sprakenshus.se https://larportalen.skolverket.se/#/modul/4- specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet Faktorer av betydelse för en flerspråkig utveckling Sociala faktorer
Läs merbakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO
bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1
Läs merSORSELE KOMMUN. Handbok OEW. 28 sept 2012 Mari-Anne Englund Barbro Olofsson. Sorsele kommun Version 2012-09-28, rev 131101 1 (19)
Handbok i OEW 28 sept 2012 Mari-Anne Englund Barbro Olofsson Sorsele kommun Version 2012-09-28, rev 131101 1 (19) Använd det användarnamn och lösenord som du fått. Fungerar det inte hör av dig till Mari-Anne
Läs merPubMed (Medline) Fritextsökning
PubMed (Medline) PubMed är den största medicinska databasen och innehåller idag omkring 19 miljoner referenser till tidskriftsartiklar i ca 5 000 internationella tidskrifter. I vissa fall får man fram
Läs mer