TDDD02 Föreläsning 5 HT-2013
|
|
- Viktor Pålsson
- för 8 år sedan
- Visningar:
Transkript
1 TDDD02 Föreläsning 5 HT-2013 Informationsutvinning Lars Ahrenberg Litteratur: H. Cunningham: Information Extraction, Automatic
2 Översikt Informationsutvinning (IE) Definition och jämförelser Något om semantik och faktarepresentation Ontologier och extraktion av semantiska relationer Komponenter i IE-system Namnigenkänning Koreferensbestämning Relationsbestämning bootstrapping av relationsuttryck Mallinstansiering Exempel Åsiktsanalys, Automatisk nyhetsläsning
3 IE gentemot IR Dokumentsökning (IR) möter givna informationsbehov genom att söka efter dokument Informationsutvinning (IE) möter informationsbehov genom att söka i dokument Informationsbehovet formuleras som en mall med en eller flera relationstyper, t.ex. <HOTELLATTRIBUT: OMDÖME> TYP: <företagstyp> ORT: <ort> ANSTÄLLDA: <antal>
4 IE gentemot IR Dokumentdatabas IR-system Dokument Analytiker Dokumentdatabas Strukturerade fakta IE-system IR-system
5 En karaktärisering Informationsutvinning ombildar textdata (dvs. ostrukturerade data) till strukturerade data. Systemen bygger på identifiering av relevanta ord och fraser, semantisk klassificering av dessa, strukturering av data efter givna typer eller mallar, sammankoppling av information via koreferenser
6 En enkel klassificering av dokument och meningar Subjektiva Objektiva Positiva Negativa
7 Varianter av informationsutvinning Message understanding / Automatisk nyhetsläsning Systemet söker information om en viss typ av händelse, t.ex. ekonomisk verksamhet, kriminell verksamhet, sjukdomsutbrott,... Systemet identifierar förekomster av händelsetypen och specificerar relevanta entiteter och deras relationer
8 Varianter av informationsutvinning Åsiktsanalys ( opinion mining ) Systemet söker information om vad folk tycker om en produkt, tjänst eller politiskt förslag, ( hotellet är prisvärt, ligger nära centrum,...) Associationer ( media distance ) Systemet extraherar omdömen som texten kopplar ihop med en person eller produkt. och klassificerar dem sedan t.ex. i positiva/negativa, starkt/svagt hopkopplade, etc.
9 Exempel: sammanställning av associerade begrepp Andel negativa begrepp associerade med Berlusconi under oktober Källa: 9
10 Varianter av informationsutvinning Sammanställning av information från flera dokument. relativt lätt för associerad information svårare att avgöra om olika dokument handlar om samma händelse eller inte. Presentation/Hopkoppling av dokument (t.ex. citeringar) t.ex. att skilja ett korrekt citat från ett plagiat. IE för prognoser Forecasting large-scale human behavior using global news media tone in time and space (Leetaru, 2011)
11 Varianter av informationsutvinning Ontologiorienterad informationsutvinning Systemet extraherar namn som instanser av givna klasser, t.ex. identifierar företag, platser, sjukdomar,... Systemet extraherar synonymer och begreppsrelationer, t.ex. hyponymi (specificering som i hylla - möbel ) del-helhetsrelationer (som kök - lägenhet)
12 Exempel på åsiktsanalys: hotellrecensioner Ett bra och prisvärt hotell som endast ligger en kort tunnelbaneresa bort från centrum. Personalen är trevlig och rummen är helt OK. Så länge själva hotellvistelsen inte är det huvudsakliga målet med resan är detta ett alternativ som kan rekommenderas. Är man ute efter en plats att sova på som inte kostar så mycket så är det perfekt. Sängarna är otroligt sköna. Läget är inte jättecentralt, men buss och t-station finns nära. Frukosten innehåller frallor, pålägg fil, cornflakes, musli, juice och kaffe. Ingen hotellfrukost i den vanliga bemärkelsen men den funkar. Är man däremot ute efter en mysig hotellvistelse ska man välja något annat. Hade jag fått bestämma så hade jag nog valt att kalla detta för vandrarhem istället för hotell. Minimala par: <hotell: prisvärt>, <hotell: bra>,...
13 Några krav på informationsstrukturerna Fullständighet Semantik
14 Några semantiska begrepp De flesta semantiska modeller bygger på en grundläggande distinktion mellan uttryck och innehåll, eller 'betydare' och 'betytt' Den semiotiska triangeln (Ogden & Richards, The meaning of meaning): begrepp SPRÅK VÄRLD ord entiteter
15 Logik och kunskapsrepresentation Gör relationen mellan betydare och betytt entydig och strukturen i utsagor transparent Linköping är en stad i Sverige Predikatlogisk representation Tillhör(lkpg,sverige) Stad(lkpg) lkpg och sverige antas här vara unikt (eller universellt) refererande. De är s.k. individkonstanter Tillhör och Stad är också konstanter som står för begrepp
16 Entiteter och relationer En entitet (eller individ) är något som kan urskiljas från sin omgivning och refereras. En relation (eller predikat) är något som uttrycker ett förhållande för en entitet eller mellan flera entiteter och som för givna entiteter kan bestämmas som sann eller falsk. Tillhör(lkpg,sverige) sant Tillhör(london,sverige) falskt
17 Semantiska webben the Semantic Web aims at converting the current web dominated by unstructured and semi-structured documents into a 'web of data' Länkade data: URIer (Universal Resource Identifiers) identifierar saker HTTP URIs gör det möjligt för både människor och maskiner att hitta saker och information om dem Informationen kan representeras i standardformat som RDF/XML Länkar till relaterade URIer kan inkluderas
18 Ontologisk information Plats underbegrepp_till Stad Land Tillhör instans_av instans_av lkpg sthlm sverige argument-2 Rel-141 argument-1
19 Linked Open Data (källa: bbc.co.uk)
20 Ontologiinlärning som 'reverse engineering' concepts Extraction words
21 Från text till begrepp Lemmatisering ge alla böjningsvarianter en gemensam representant book, books, book's book_n book, booked, books, booking book_vb Betydelsebestämning identifiera olika betydelser av lemman bar bar-1, as in chocolate bar bar bar-2, as in piano bar bar bar-3, as in standing at the bar...
22 Språkliga mönster för semantiska relationer Hyponymi (underbegrepp) datorer är en slags maskiner som mönster: X är (en/ett (slags)) Y som du kan även använda andra bär som röda vinbär eller björnbär... Instanser... Skandinavien omfattar Danmark, Sverige och Norge Palme var statsminister under åren
23 Informationsutvinning, delproblem Namnigenkänning (Named Entity Recognition) Identifiering av koreferens namnupprepning, pronomenreferens (ord som han, hon, de, den,...) Relationsigenkänning enkla mallattribut t.ex. ort, ålder, pris,... relationer mellan mallentiteter Mallifyllning koppla ihop relationer och namn på rätt sätt
24 Informationsutvinning, stödsystem Lemmatisering Ordklasstaggning Betydelsebestämning Chunkning identifiera fraser som uttrycker entiteter eller relationer av intresse Parsning identifiera grammatiska relationer för hela satser och meningar
25 Namnigenkänning Inom IE används begreppet namn (named entity) dels om vanliga namn personnamn, företagsnamn, geografiska namn, dels om sifferuttryck årtal, prisangivelser, antalsangivelser, dels om refererande uttryck som refererar till entiteter som är relevanta i domänen, t.ex., företag, sjukdomar, stöldgods,...
26 Namnigenkänning För namnigenkänning används t.ex. namnlistor, (eng. gazetteers) reguljära uttryck för sådana namn som följer specifika teckenmönster klassificering med hjälp av kontextinformation kodad som indikatorer ( features ) t.ex. Naive Bayes
27 Exempel: en namnlista över svenska kommuner Ale Alingsås Alvesta Aneby Arboga Arjeplog Arvidsjaur Arvika Askersund Östhammar Östra Göinge Överkalix Övertorneå
28 Utvärdering av namnigenkänning Namnigenkänning är ett sökproblem, varför precision och recall är lämpliga mått. Cunningham anger accuracy till 95% men olika typer av namn är olika svåra att känna igen. Flertydighet är inte ovanlig: Ericsson Klippan Ikeamöbler som Billy, Stockholm,...
29 En händelsemall Exempel: arbetsmarknadsförändringar Typ_av_förändring: Tid: Källa: Företag Namn: Typ: Ort: Antal_anställda: Omsättning: Berörda Antal: Typ:
30 En text om neddragningar 160 riskerar jobbet i Klippan Skogsbolaget Klippan AB planerar neddragningar i produktionen för att förbättra lönsamheten. Enligt ett förslag kan det innebära att 160 personer förlorar sina jobb i Klippan, skriver Helsingborgs Dagblad. I dag sysselsätter bruket i Klippan 216 personer. Klippan AB har också produktion i Lessebo. För de första nio månaderna förra året redovisade Klippan en förlust på 2,5 miljoner kronor efter finansnetto. Koncernens försäljning uppgick till 619 miljoner kronor.
31 Instansierad mall Typ_av_förändring: neddragningar Tid: - Källa: Helsingborgs Dagblad Företag Namn: Klippan AB Typ: skogsbolag Antal_anställda: 216 personer Ort: Klippan Omsättning: 619 miljoner kronor Berörda Antal: 160 Typ: personer
32 Entitetsbaserad representation (jmf. Cunninghams artikel) Klippan id: type: ENTITY-1 ort Klippan AB id: type: ort: ENTITY-2 Skogsbolag ENTITY personer id: type: ENTITY-3 berörda
33 Referenser till samma objekt 160 riskerar jobbet i Klippan Skogsbolaget Klippan AB planerar neddragningar i produktionen för att förbättra lönsamheten. Enligt ett förslag kan det innebära att 160 personer förlorar sina jobb i Klippan, skriver Helsingborgs Dagblad. I dag sysselsätter bruket i Klippan 216 personer. Klippan AB har också produktion i Lessebo. För de första nio månaderna förra året redovisade Klippan en förlust på 2,5 miljoner kronor efter finansnetto. Koncernens försäljning uppgick till 619 miljoner kronor.
34 Referenser till samma objekt Senare referenser använder (ofta) delar av (fullständigt) namn Klippan AB Klippan Bo Lennart Johansson Johansson anaforiska pronomen han, hon, den, det, de, dom,... beskrivande referenser i bestämd eller demonstrativ form företaget, koncernen,... denna åtgärd,...
35 En text med pronomen Jan Ahrenbring lämnar sin post som marknadsdirektör vid Ericssons division Konsumentprodukter efter elva år. Ahrenbring slutar på egen begäran. Han kommer dock att vara kvar i Ericssonkoncernen. Hans arbetsuppgifter övertas av holländaren Philip Vanhoutte, som sedan i november i fjol är ansvarig för marknadsstrategi. Philip Vanhoutte har sitt kontor i London. Han kommer närmast från amerikanska teleoperatören MCI-Worldcom. Ericsson beslutade nyligen att lägga ut all tillverkning av mobiltelefoner på amerikanska Flextronics. I stället ska Ericsson koncentrera sig på design, marknadsföring och distribution, de områden som Ahrenbring ansvarat för.
36 Villkor på anaforisk koreferens Morfologiska egenskaper Antecedent och anafor skall ha samma numerus och genus. Han kommer dock att vara kvar... Syntaktiska egenskaper Antecedentens och anaforens syntaktiska positioner måste tillåta koreferens Ericsson gav honom ett stort avgångsvederlag (Ericsson honom)
37 Villkor på anaforisk koreferens Syntaktiskt-semantiska egenskaper Semantiska villkor på anaforens referent som ges av den omedelbara syntaktiska kontexten måste passa in även på antecedenten. Erik köpte en pizza på bensinstationen. Han åt genast upp den. (bensinstationen den)
38 Mjuka villkor eller preferenser Antecedenten finns oftare i närmast föregående mening än längre bort. Antecedenten är oftare i en framträdande syntaktisk position, t.ex. subjekt, än i en mindre framträdande. Lisa ringde till Saras mormor. Hon... Finns flera möjliga kandidater som uppfyller de absoluta villkoren, väljs en kandidat utifrån mjuka villkor.
39 Att hitta relationer Klippan varslar 160 anställda... <X> varslar <ANTAL> <Y> Strindberg föddes 1849 i Stockholm... <PERSON> föddes <ÅR> Problem: det finns så många sätt att uttrycka samma relation
40 Olika sätt att identifiera relationer Expertdriven systemutveckling expert = lingvist Övervakad inlärning förutsätter uppmärkt korpus Så frön ('bootstrapping') gissa mönster och/eller instanser/tupler Exempel: /varslar [0-9]+ / /Volvo [a-zåäö]+ [a-zåäö0-9 \b]{0,3} anställda/
41 Att använda mönsterfrön Fröexempel: [FÖRETAG] varslar [ANTAL] [BERÖRD_PERSON] Tupelexempel: <Klippan, 160, anställda> Att ta reda på Vilken variation finns i hur relationen uttrycks? Vilken variation finns i ordningen mellan olika entiteter? Vad kan finnas mer än relationsuttryck och entitetsuttryck i meningarna?
42 Fröbaserad relationsutvinning ( bootstrapping ) Sökning Mönster Extraktion Mönsterfrön Tupelmängd Mönstermängd Extraktion Sökning Tupelfrön Tupler
43 Att välja ut nya mönster Ett nytt mönster kan värderas utifrån dess precision och recall på kända tupler antal nya tupler som föreslås precision på nya tupler
44 Utvärdering av IE-system Utvärdering på komponentnivå namnigenkänning: ca 95% precision och recall koreferens: ca 65-70% Utvärdering på systemnivå Vad är viktigt? precision vs. recall på händelsenivå? precision vs. recall på uppgiftsnivå.
45 Att visualisera data Positiva och negativa omdömen kan tabuleras och åskådliggöras grafiskt Positiva Negativa Hotell 1 Rum Personal Frukost 95 2 Hotell 2 Rum Personal 75 3 Frukost 24 28
46 Resultat för Hotell 1 och Hotell 2 (andel positiva av alla) 0,5 Rum Personal Frukost
47 kommersiell IE (exempel) demo.saplo.com
Språkteknologi vt09. Diskursmodellering. Diskursmodell: exempel. Koherensrelationer. Koreferens. Att bestämma koherensrelationer
Språkteknologi vt09 Diskursmodellering Diskursmodellering koherensrelationer anaforisk referens Informationsutvinning Mallar Delproblem Namnigenkänning Referensresolution Mallifyllning / Relationsigenkänning
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merTDDD02 Föreläsning 7 HT-2013
TDDD02 Föreläsning 7 HT-2013 Textsammanfattning Lars Ahrenberg Litt: Våge et al.170-185; Das & Martins, A Survey on Automatic Text Summarization sid 1-4, 11-14, 23-25. Översikt Textstruktur Problemet textsammanfattning
Läs merInformationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)
Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)
Läs merTDDD02 Föreläsning 6 HT-2013
TDDD02 Föreläsning 6 HT-2013 QA: Frågebesvarande system Lars Ahrenberg Litteratur: Brill m.fl. An Analysis of the AskMSR QA system Översikt Definition och exempel Utvärdering Standardkomponenter i QA-system
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merGenerellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:
FTEA12:2 Föreläsning 3 Att värdera en argumentation I: Vad vi hittills har gjort: beaktat argumentet ur ett mer formellt perspektiv. Vi har funnit att ett argument kan vara deduktivt eller induktivt, att
Läs merKritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II
Kritiskt tänkande HTXF04:3 FTEB05 Grundläggande semantik II Deskriptiv vs. värderande/känslomässig mening Ords betydelser kan ha både deskriptiva och värderande/känslomässiga komponenter. Det blir tydligt
Läs merFTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
Läs merIntroduction to the Semantic Web. Eva Blomqvist
Introduction to the Semantic Web Eva Blomqvist eva.blomqvist@liu.se Outline The original vision Meaning of data Current applications Revisiting the vision and looking ahead Scientific American, May 2001:
Läs merTommy Färnqvist, IDA, Linköpings universitet. 2 Strukturer 2 2.1 Domäner... 2 2.2 Tolkningar... 3
Föreläsning 2 Semantik 729G06 Logikdelen Föreläsningsanteckningar i Programmering och logik 27 januari 2014 Tommy Färnqvist, IDA, Linköpings universitet 2.1 Innehåll Innehåll 1 Lite mer syntax 1 2 Strukturer
Läs merINFORMATIONSUTVINNING. MARCO KUHLMANN Linköpings universitet
INFORMATIONSUTVINNING MARCO KUHLMANN Linköpings universitet Informationsutvinning Informationsutvinning är uppgiften att extrahera strukturerad information från textdokument. Engelskt begrepp: Information
Läs merTentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merSubjektivism & emotivism
Subjektivism & emotivism Föreläsning 4 Enligt Rachels så är grundtanken bakom etisk subjektivism att våra moraliska åsikter grundar sig på våra känslor Samt att det inte finns någonting sådant som objektivt
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merA. MENING OCH SANNINGSVÄRDE HOS IDENTITETSPÅSTÅENDE. antag att namn A står för objekt a och namn B står för objekt b antag att a och b är distinkta
FREGE, FÖRELÄSNINGSANTECKNINGAR HT17 IB A. MENING OCH SANNINGSVÄRDE HOS IDENTITETSPÅSTÅENDE Freges analys av identitetspåståenden antag att namn A står för objekt a och namn B står för objekt b antag att
Läs merINFORMATIONSUTVINNING. MARCO KUHLMANN Linköpings universitet
INFORMATIONSUTVINNING MARCO KUHLMANN Linköpings universitet Informationsutvinning Informationsutvinning är uppgiften att extrahera strukturerad information från textdokument. Engelskt begrepp: Information
Läs merSemantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse
Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merKommunikation. Språk och språkteknologier. Semiotik. Kommunikationsmodell. Saussures strukturalism. Finns betydelse? Teckenkod.
Kommunikation Språk och språkteknologier Rickard Domeij domeij@nada.kth.se Teckenkod ljud, skrift, gester, programkod... Verktyg kil, penna, tryckpress, dator... Medium lerplattor, böcker, radio, TV, internet...
Läs merFöreläsningar. Gruppövning, grupp A: Måndag 26/ sal 318 Gruppövning, grupp B: Måndag 26/ sal 318
Föreläsningar 1. Onsdag 14/11 13-15 sal 203 2. Torsdag 15/11 13-15 sal 203 3. Måndag 19/11 13-15 sal 203 4. Tisdag 20/11 13-15 sal 203 5. Onsdag 21/11 13-15 sal 203 6. Torsdag 22/11 13-15 sal 203 Gruppövning,
Läs merLogisk semantik I. 1 Lite om satslogik. 1.1 Konjunktioner i grammatisk bemärkelse. 1.2 Sant och falskt. 1.3 Satssymboler. 1.
UPPSALA UNIVERSITET Datorlingvistisk grammatik I Institutionen för lingvistik och filologi Oktober 2007 Mats Dahllöf http://stp.ling.uu.se/ matsd/uv/uv07/dg1/ Logisk semantik I 1 Lite om satslogik 1.1
Läs merMoralfilosofi. Föreläsning 4
Moralfilosofi Föreläsning 4 Subjektivism & emotivism Enligt Rachels så är grundtanken bakom etisk subjektivism att våra moraliska åsikter grundar sig på våra känslor Samt att det inte finns någonting sådant
Läs merFTEA21:3 Spr akfilosofi F orel asning I Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning I Martin Jönsson Att lära Varför Frege varken tror att ett ords mening är dess referens eller något mentalt. Freges egen teori om mening Tre semantiska principer Kompositionalitetsprincipen,
Läs merTDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merMoralfilosofi. Föreläsning 3
Moralfilosofi Föreläsning 3 Om minimiuppfattningens två krav är logiska krav så måste de ingå (på ett eller annat vis) i alla moralteorier (en teori som står i strid med dessa krav skulle inte kunna räknas
Läs merMoralfilosofi. Föreläsning 4
Moralfilosofi Föreläsning 4 Subjektivism & emotivism Enligt Rachels så är grundtanken bakom etisk subjektivism att våra moraliska åsikter grundar sig på våra känslor Samt att det inte finns någonting sådant
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merSvenska 1-2-3-4 GRAMMATIK ÖVNINGAR OCH SVAR
Svenska 1-2-3-4 GRAMMATIK ÖVNINGAR OCH SVAR This is a document containing all the grammar exercises and answers from the website www.svenska.digital ADJEKTIV ÖVNINGAR: Alla mina (fin) saker Jag har många
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merWebbtjänster med API er
Webbtjänster med API er Mål med lektionen! Titta på hur service:ar fungerar och hur vi programmerar dem. Vad lektionen omfattar WCF Service WCF Services Vad är en WCF service? En WCF Service är ett program
Läs merFilosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium. v. 2.0, den 29/ III. Metalogik 17-19
Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium IV v. 2.0, den 29/4 2013 III. Metalogik 17-19 Modeller för satslogiken 18.1 Vi har tidigare sagt att en modell är en tolkning av en teori
Läs merKungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Läs merLexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet
Lexikal semantik & Kognitiv semantik Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet 1 Dagens föreläsning Saeed 2009, kap.3, 11 Lexikal semantik Lexikala relationer Kognitiv
Läs merA. MENING OCH SANNINSGVÄRDE HOS IDENTITETSPÅSTÅENDE. Freges utgångspunkt: mening och meningsfullhet hos identitetspåståenden
II. FREGE A. MENING OCH SANNINSGVÄRDE HOS IDENTITETSPÅSTÅENDE Freges utgångspunkt: mening och meningsfullhet hos identitetspåståenden antag att namn A står för objekt a och namn B står för objekt b antag
Läs merRobin Stenwall Lunds universitet
Robin Stenwall Lunds universitet Avsnitt 14.1 Numerisk kvantifikation Kvantifikatorerna i FOL är begränsade till och. Detta innebär att vi kan uttrycka satser som säger någonting om allting och någonting.
Läs merde var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Läs merKommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merSVENSKA Inplaceringstest A
SVENSKA Inplaceringstest A Välj ett ord som passar i meningen. Använd bara ordet en gång. Exempel: Smöret står i kylskåpet. Det ringer på dörren. Han fick ett brev från mamma. De pratar om vädret. från
Läs merDATA ÖPPNA DATA LÄNKADE DATA LÄNKADE ÖPPNA DATA
DATA ÖPPNA DATA LÄNKADE DATA LÄNKADE ÖPPNA DATA Agenda 1. Nyttan med öppna data 2. Introduktion till länkade öppna data Några viktiga begrepp 1. Data? 2. PSI? 3. Öppna data? 4. Öppna offentliga data? 1.
Läs merKommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merGrundläggande begrepp inom lexikal semantik. Hanna Seppälä Uppsala universitet 1
Grundläggande begrepp inom lexikal semantik Föreläsning 2 Uppsala universitet 1 Teman idag Semiotik Lexikal semantik kompositionell semantik Teorier om hur man kan beskriva betydelse Språklig relativism
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 5 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Så här långt Konjunktion (p q): att två enklare satser
Läs merProgrammering och algoritmiskt tänkande. Tema 3, föreläsning 1 Jody Foo
Programmering och algoritmiskt tänkande Tema 3, föreläsning 1 Jody Foo Tema 3: Översikt Objektorienterad programmering: fortsättning Tema 1 och 2: Exempel på att använda och skapa algoritmer Tema 3: strukturera
Läs merSemantisk web i biblioteket
Semantisk web i biblioteket Anders Söderbäck LIBRIS, National Library of Sweden Vad är Linked Data? Praktisk tillämpning av semantisk web En metod för att exponera, dela och koppla samman data med hjälp
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merFTEA21:3 Spr akfilosofi F orel asning III Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning III Martin Jönsson Att lära Fyra argument mot tanken att mening är någonting mentalt. En semantisk princip (principen att mening fixerar referens) En ny filosofisk fråga
Läs mer- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
Läs merTDDD02 Föreläsning 4 HT Klassificering av ord och dokument Lars Ahrenberg
TDDD02 Föreläsning 4 HT-2013 Klassificering av ord och dokument Lars Ahrenberg Översikt Ø Avslutning om ngram-modeller Dokumentrepresentation Ø Klassificering med Naive Bayes ett typexempel generell metod
Läs mer729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp
729G17/729G66 Lexikal semantik och ordbetydelsebestämning Olika ordbegrepp Ordbetydelser Vad är ett ord? Lemman, lexem och betydelser Semantiska relationer Semantiskt strukturerade lexikon Hitta relationer
Läs merKommentarer till bedömningsmatris för Skriva Kurs C
Kommentarer till bedömningsmatris för Skriva Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar ett första intryck och är en övergripande
Läs merÖvningshäfte 1: Logik och matematikens språk
GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2014 INLEDANDE ALGEBRA Övningshäfte 1: Logik och matematikens språk Övning A Målet är att genom att lösa och diskutera några inledande uppgifter få erfarenheter
Läs merDD1350 Logik för dataloger. Fö 7 Predikatlogikens semantik
DD1350 Logik för dataloger Fö 7 Predikatlogikens semantik 1 Kryssprodukt av mängder Om A och B är två mängder så är deras kryssprodukt A B mängden av alla par (a,b), där a A och b B. Ex: A={1,2}, B={3,4},
Läs merSemantik VT Introduktion. Betydelse. Dagens föreläsning. Dahllöf: Språklig betydelse - semantik och pragmatik
Betydelse Semantik VT07 Allmän introduktion Stina Ericsson Vad är betydelse? Vad är det som bär på betydelse? Vilken roll spelar betydelse i en generell teori om språk och kommunikation? Vilken roll kan
Läs merKommentarer till bedömningsmatris för Tala Kurs C
Kommentarer till bedömningsmatris för Tala Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade
Läs merEssä introduktion till hur man skriver en akademisk essä
Essä introduktion till hur man skriver en akademisk essä Essä Den huvudsakliga examinerande uppgiften på kursen består av en individuell essä. Du ska skriva en essä som omfattar ca tio sidor. Välj ett
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merSVENSKA Inplaceringstest A
SVENSKA Inplaceringstest A Välj ett ord som passar i meningen. Använd bara ordet en gång. Exempel: Smöret står i kylskåpet. Det ringer på dörren. Han fick ett brev från mamma. De pratar om vädret. om /
Läs merFöreläsning 7: Kognition & perception
Föreläsning 7: Kognition & perception FSR: 3, 4 Att läsa: Kapitel 2-3 i Rogers et al.: Interaction design Översikt Att kunna om perception och kognition Konceptuella modeller Metaforer Paradigm, teorier,
Läs merTräna ordföljd Ett övningshäfte där du tränar rak ordföljd och omvänd ordföljd. Namn:
Träna ordföljd Ett övningshäfte där du tränar rak ordföljd och omvänd ordföljd. Namn: Träna rak ordföljd. Subjektet är först. Verbet är alltid på andra plats. Subjekt Verb Objekt Zlatan spelar fotboll.
Läs merPragmatisk och narrativ utveckling
Pragmatisk och narrativ utveckling Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Pragmatik! Pragma! handling! hur vi använder språket! hur vi handlar genom språket! Pragmatik!
Läs merLinköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson
Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som
Läs merVärdeteori: översikt. Föreläsning 3. Bergströms taxonomi: Det karaktäristiska för värdeteorin är:
Det karaktäristiska för värdeteorin är: Värdeteori: översikt Föreläsning 3 1. att den handlar om normer, värden och värderingar, och 2. att den studerar dessa ur just filosofisk synvinkel. Mer specifikt:
Läs merMänniskan och självkörande fordon. Mikael Ljung Aust, Volvo Cars
Människan och självkörande fordon Mikael Ljung Aust, Volvo Cars Vilken blir förarens roll? Varför ska man köpa körstöd/självkörande bil (vad får jag för mina pengar)? Jo för att kunna (förslag från klinikdeltagare
Läs merSatssemantik. Semantik: Föreläsning 4 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet
Satssemantik Semantik: Föreläsning 4 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet 1 Dagens föreläsning Saeed 2009, kap.5-6 (Flera av exemplen här är anpassade från Saeed) Betydelse inom satser
Läs mer!!! Några verb är oregelbundna vara är var!!!
1 VERB I PRESENS Svenska verb har fem olika böjningsformer: presens, infinitiv, preteritum (imperfekt), supinum och imperativ. Presens använder man om nutid. Man kan också använda det om framtid om det
Läs merStoppa tjuven med Skandinaviens mest kompletta märksystem!
För att den är min. 2 Foto: Kawasaki Stoppa tjuven med Skandinaviens mest kompletta märksystem! ATV-, snöskoter- och vattenskoterstölder är ett stort problem för människor med en aktiv fritid i hela Norden.
Läs merJavaScript del 3 If, Operatorer och Confirm
JavaScript del 3 If, Operatorer och Confirm Under förra uppgiften så kollade vi på hur användaren kan ge oss information via promt(), vi använde den informationen både för att skriva ut den och för att
Läs merSystem arbetssystem informationssystem
System arbetssystem informationssystem Vad är ett system? Exempel - Matsmältningssystemet - Immunförsvaret - Ett hemelektroniksystem -En skola System - definition Ett system är en uppsättning interagerande
Läs merSvenska GRAMMATIK: ÖVNINGAR OCH SVAR
Svenska 1-2-3-4 GRAMMATIK: ÖVNINGAR OCH SVAR This is a document containing all the grammar exercises and answers from the website www.svenska.digital ADJEKTIV: Alla mina (fin) saker Jag har många saker.
Läs merHemtentamen HT13 Inlämning senast Lärare: Tora Hedin
Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara
Läs merFTEA21:3 Spr akfilosofi F orel asning V Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning V Martin Jönsson Att lära Hur Davidson s teori ser ut, varför han förespråkar den och vad det finns för problem med den. M. Jönsson (Lund University) Språkfilosofi 1
Läs merVad är semantik? LITE OM SEMANTIK I DATORLINGVISTIKEN. Språkteknologi semantik. Frågesbesvarande
LITE OM SEMANTIK I DATORLINGVISTIKEN (FORMELL SEMANTIK) Vad är semantik? Form (abstrakt struktur): grammatik Innehåll (betydelse): semantik Användning: pragmatik/diskurs Mats Dahllöf Språkteknologisk motivation
Läs merKunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt.
Kunskapsgraf Fredrik Åkerberg j.f.akerberg@gmail.com Tommy Kvant tommy.kvant@gmail.com 1 Introduktion Målet med projektet var att undersöka huruvida DBpedia.org, kan användas för att besvara frågor på
Läs merLogik och modaliteter
Modallogik Introduktionsföreläsning HT 2015 Formalia http://gul.gu.se/public/courseid/70391/lang-sv/publicpage.do Förkunskaper etc. Logik: vetenskapen som studerar argument med avseende på (formell) giltighet.
Läs merSemantik och pragmatik
Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext
Läs merKvantitativ samhällsanalys med språkteknologiska metoder.
Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar
Läs merBEDÖMNINGSSTÖD till TUMMEN UPP! svenska åk 3
BEDÖMNINGSSTÖD till TUMMEN UPP! svenska åk 3 Det här är ett BEDÖMNINGSSTÖD till Tummen upp! svenska som hjälper dig att göra en säkrare bedömning av elevernas kunskaper i årskurs 3. Av tradition har man
Läs merFöreläsning 7: Kognition & perception
Föreläsning 7: Kognition & perception FSR: 3, 4 Att läsa: Kapitel 2-3 i Rogers et al.: Interaction design Översikt Vad är kognition, perception? Vad har kognition och perception med interaktionsdesign
Läs mer729G75: Programmering och algoritmiskt tänkande. Tema 1, föreläsning 1 Jody Foo
729G75: Programmering och algoritmiskt tänkande Tema 1, föreläsning 1 Jody Foo Föreläsningsöversikt Kursinfo / Om kursen Algoritmer Objektorienterad programmering i praktiken terminologi använda objekt
Läs merKommentarer till bedömningsmatris för Tala Kurs B
Kommentarer till bedömningsmatris för Tala Kurs B Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merSkäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.
Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten
Läs merOrdklasser och satsdelar
Ordklasser och satsdelar Vi kommer under de kommande fyra veckorna att arbeta med ordklasser och satsdelar. Under det här arbetsområdet kommer du att få öva på följande förmågor: formulera sig och kommunicera
Läs merMinnet - begrepp och principer
Minnet - begrepp och principer Ebbinghaus (1885)» nonsensstavelser» retention»test Två begreppsteorin för minnet» aktivitet»styrka bestämmer tillgängligheten hos ett minnesspår vid en viss tidpunkt bestämmer
Läs merSpråk för webben introduk4on 4ll HTML
Föreläsning i webbdesign Språk för webben introduk4on 4ll HTML Rune Körnefors Medieteknik 1 2012 Rune Körnefors rune.kornefors@lnu.se En webbsidas beståndsdelar Text (formaterad, strukturerad) Länkar Inkluderade
Läs merKritiskt tänkande HTXF04:3 FTEB05. Rekonstruktion av argument
Kritiskt tänkande HTXF04:3 FTEB05 Rekonstruktion av argument Utvärdering av definitioner Problem (generella) Cirkularitet (definiendum ingår i definiens) (i) Direkt cirkularitet Exempel: Frihet är rätten
Läs merNaturalism. Föreläsning Naturalismen (tolkad som en rent värdesemantisk teori) är en form av kognitivism
Naturalism Föreläsning 5 Naturalismen (tolkad som en rent värdesemantisk teori) är en form av kognitivism Som säger att värdesatser är påståenden om empiriska fakta Värdeomdömen kan (i princip) testas
Läs merResan ORDLISTA HANS PETERSON ARBETSMATERIAL FÖR LÄSAREN
ARBETSMATERIAL FÖR LÄSAREN HANS PETERSON ORDLISTA sällan (sida 11, rad 17),, inte ofta mullrar (sid 3, rad 1), högt ljud har hand om (sid 3, rad5), passar, tar hand om alperna (sid 4, rad 3), höga berg
Läs merManual HSB Webb brf 2004 03 23
TERMINOLOGI I Polopoly används ett antal grundläggande begrepp för publicering och hantering av information, eller innehåll som det också benämns. Nedan följer en kort genomgång av denna grundläggande
Läs mer729G75: Programmering och algoritmiskt tänkande. Tema 1. Föreläsning 1 Jody Foo
729G75: Programmering och algoritmiskt tänkande Tema 1. Föreläsning 1 Jody Foo Föreläsningsöversikt Kursinfo / Om kursen Algoritmer Objektorienterad programmering i praktiken terminologi använda objekt
Läs merFormell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet
Formell logik Kapitel 1 och 2 Robin Stenwall Lunds universitet Kapitel 1: Atomära satser Drömmen om ett perfekt språk fritt från vardagsspråkets mångtydighet och vaghet (jmf Leibniz, Russell, Wittgenstein,
Läs mer