TDDD02 Föreläsning 4 HT Klassificering av ord och dokument Lars Ahrenberg

Storlek: px
Starta visningen från sidan:

Download "TDDD02 Föreläsning 4 HT Klassificering av ord och dokument Lars Ahrenberg"

Transkript

1 TDDD02 Föreläsning 4 HT-2013 Klassificering av ord och dokument Lars Ahrenberg

2 Översikt Ø Avslutning om ngram-modeller Dokumentrepresentation Ø Klassificering med Naive Bayes ett typexempel generell metod Ø Andra exempel Textkategorisering Betydelsebestämning av ord

3 Unigrammodeller för dokument p Den röda kurvan representerar termernas unigramsannolikheter i databasen. Spikarna representerar relativa frekvenser i ett enskilt dokument. termer

4 Unigrammodeller för dokument Varje dokument tilldelas en modell, M D, som interpolerar hela databasens modell med MLE-modellen för dokumentet. Rangordningsprincip: Givet en sökfråga Q = q 1, q 2,..., q n, välj det dokument vars modell ger sökfrågan högst sannolikhet. D* = argmax p(q M D ) = p(q i M D ) n D i=1

5 Klassificeringsproblem (Automatisk) klassificering innebär att tilldela varje objekt, d, i en given mängd D, en kategori från en given taxonomi, C. Det kan ses som en funktion, D C, Det enklaste prestandamåttet är korrekthet (eng. accuracy), som bygger på jämförelse med ett facit för en given testmängd. Det anges ofta i procent: k = 100 x [antal rätt] / [antal objekt]

6 Klassificering och klustring Klassificering använder sig av fördefinierade klasser. Klustring för ihop dokument (eller andra objekt ) i grupper ( kluster ) utifrån antaganden om vad som gör dem lika. Exempel: - dokument representerade som termvektorer kan klustras baserat på närhet i vektorrummet.

7 Klassificering och sökning Ett vanligt fall av klassificering är att vi har en kategori som är särskilt intressant, t.ex. namn vs. ord som inte är namn spam vs. mejl som inte är spam I dessa fall är det ofta rimligt att se problemet som ett sökproblem och använda både precision och recall som kvalitetsmått. det är t.ex. (oftast) ett allvarligare fel att klassa ett riktigt mejl som spam än att släppa igenom ett spammejl.

8 Klassificeringsproblem Automatisk textkategorisering innebär att klassificera texter utifrån sitt innehåll ( orden i texten ). Det kan innebära att klassificera utifrån ämne genre språk attityd/perspektiv... Några speciella tillämpningar mejlklassificering vidarekoppling av samtal i kundtjänster författarbestämning av texter...

9 Klassificeringsproblem Betydelsebestämning av ord för en större eller mindre mängd av flertydiga ord bestämma vilken av de möjliga betydelserna som en viss förekomst har, Ordklasstaggning att bestämma ordklass för alla ord i en text Namnkategorisering att bestämma om ett ord är eller ingår i ett namn, att bestämma vilken slags entitet (person, plats, organisation,...) ett givet namn refererar till

10 Ett typproblem Namnigenkänning: klassificera ord i en text som (del av) namn eller icke-namn. En lösning: reguljära uttryck kan fånga ord som börjar på stor bokstav, men alla ord som börjar på stor bokstav är inte namn, omvänt kan delar av namn ibland skrivas med liten bokstav Speciellt: första ordet i en mening

11 En text Avspänningen mellan stormaktsblocken och nedrustningssträvanden i Europa har inte mycket motsvarighet i Mellanöstern. Gamla testamentet kan fortfarande ge en anvisning om bitterheten i konflikterna i området - och om tidsperspektivet. Don Kerr, en av de politiska tänkarna på det ansedda analysinstitutet IISS, är inte påfallande optimistisk när han talar om saken. Särskilt smygrustningen vad gäller missiler oroar. Hur är det då i Mellanöstern? - Jag kan tänka mig att en massa bedömare - och politiska aktörer - i regionen iakttar vad som händer på andra håll i världen med stort intresse, säger Don Kerr. Sedan konstaterar de förmodligen att det sker - just på andra håll i världen... Kerr skrattar lite åt den avfärdande formuleringen och fördjupar resonemanget. Den avgörande skillnaden mellan konflikter i exempelvis Europa och de som bygger under spänningarna i Mellanöstern är tidsfaktorn, påpekar han. Spänningarna mellan araber och perser och mellan araber och judar har gamla anor. Don Kerr talar om " den fruktansvärda kontinuiteten " som präglar områdets historia. Han berättar anekdoten som FN-medlaren Brian Urquhart myntat : - Han tillfrågades någon gång av en novis om var de bästa historiska källorna fanns att tillgå. Han hänvisade utan att blinka till Gamla testamentet.

12 Problemet Avgör för det första ordet i varje mening om det är (en del av) ett namn, eller inte. Kategorier: Namn ( första ordet är del av ett namn ) ~Namn ( första ordet är inte del av ett namn )

13 Resultat med enkla metoder Välj alltid vanligaste kategorin, dvs ej namn: Korrekthet: 10/14 = 0,78, men Recall av Namn = 0 Kategorisera ord som namn om de överallt i texten har stor bokstav: Precision = 3/9 = 0,33 Recall = 3/4 = 0,75 Korrekthet: 7/14 = 0,50

14 En lösning baserad på sannolikheter identifiera egenskaper som skiljer namn från ord som inte är namn, uppskatta för varje egenskap hur sannolikt det är att ett namn har den egenskapen, p(egenskap Namn) och, som jämförelse, att icke-namn har egenskapen, p(egenskap ~Namn). kombinera dessa sannolikheter i en beräkning, Naive Bayes: anta att de egenskaper och sannolikheter vi valt ut är oberoende

15 Några potentiellt intressanta egenskaper F1: återfinns någon annanstans i texten inuti i en mening och börjar med stor bokstav. F2: återfinns någon annanstans i texten inuti i en mening och börjar med liten bokstav. F3: följs av ett ord som också börjar med stor bokstav

16 Ord som uppfyller F1, F2, F3 Avspänningen mellan stormaktsblocken och nedrustningssträvanden i Europa har inte mycket motsvarighet i Mellanöstern. Gamla testamentet kan fortfarande ge en anvisning om bitterheten i konflikterna i området - och om tidsperspektivet. Don Kerr, en av de politiska tänkarna på det ansedda analysinstitutet IISS, är inte påfallande optimistisk när han talar om saken. Särskilt smygrustningen vad gäller missiler oroar. Hur är det då i Mellanöstern? - Jag kan tänka mig att en massa bedömare - och politiska aktörer - i regionen iakttar vad som händer på andra håll i världen med stort intresse, säger Don Kerr. Sedan konstaterar de förmodligen att det sker - just på andra håll i världen... Kerr skrattar lite åt den avfärdande formuleringen och fördjupar resonemanget. Den avgörande skillnaden mellan konflikter i exempelvis Europa och de som bygger under spänningarna i Mellanöstern är tidsfaktorn, påpekar han. Spänningarna mellan araber och perser och mellan araber och judar har gamla anor. Don Kerr talar om " den fruktansvärda kontinuiteten " som präglar områdets historia. Han berättar anekdoten som FN-medlaren Brian Urquhart myntat : - Han tillfrågades någon gång av en novis om var de bästa historiska källorna fanns att tillgå. Han hänvisade utan att blinka till Gamla testamentet.

17 Klassificering med Naive Bayes Ansätt ett antal egenskaper eller indikatorer ( features ) som för en given förekomst antingen är uppfylld (1) eller inte uppfylld (0). Indikatorerna ska ha olika sannolikheter för Namn och ~Namn Här har tre egenskaper valts <F1, F2, F3> Varje ord som ska klassificeras tilldelas en observation, O, i form av en kontextvektor, t.ex. <0,0,0>, <1,0,0>,... Beräkna sannolikheterna p 1 = p(namn O) p 0 = p(~namn O). Välj Namn om p 1 > p 0 dvs om p 1 / p 0 > 1

18 Kontextvektorer mening 1: Avspänningen, <0,0,0> mening 2: Gamla, <1,1,0> mening 3: Don, <1,0,1> mening 4: Särskilt: <0,0,0>... mening 8: Kerr, mening 12: Han,...

19 Klassificering med Naive Bayes Beräkning med Bayes regel: p 1 = p(namn O) = p(o Namn)p(Namn)/p(O) p 0 = p(~namn O) = p(o ~Namn) p(~namn)/p(o) Bildar vi kvoten p 1 /p 0 elimineras p(o) Oberoendeantagandet för indikatorerna ger p(o Namn) = p(<f 1 f 2 f 3 > Namn) = def = def p(f 1 Namn)p(f 2 Namn)p(f 3 Namn) På samma sätt: p(o ~Namn) = p(f 1 ~Namn)p(f 2 ~Namn)p(f 3 ~Namn)

20 Klassificering med Naive Bayes Beslutsregel: Välj Namn omm p(namn)p(f 1 Namn)p(f 2 Namn)p(f 3 Namn) p(~namn)p(f 1 ~Namn)p(f 2 ~Namn)p(f 3 ~Namn) > 1

21 Var kommer sannolikheterna ifrån? Alla sannolikheter kan uppskattas utifrån en träningskorpus av relevanta texter. Relativa frekvenser, och (vid behov) utjämning Observera p(namn) + p(~namn) = 1 p(f 1 =1 Namn) + p(f 1 =0 Namn) = 1

22 Räkneexempel: sannolikheter p(namn) 0,12 (apriori-sannolikhet) p(~namn) 0,88 p(stor bokstav Namn) 0,5 p(f1=1 Namn) p(ej stor bokstav Namn) 0,5 p(f1=0 Namn) p(liten bokstav Namn) 0,1 p(ej liten bokstav Namn) 0,9 p(namn efter Namn) 0,2 p(f3=1 Namn) p(ej namn efter Namn) 0,8 p(f3=0 Namn) p(stor bokstav ~Namn) 0,05 p(f1=1 ~Namn) p(ej stor bokstav ~Namn) 0,95 p(f1=0 ~Namn) p(liten bokstav ~Namn) 0,9 p(ej liten bokstav ~Namn) 0,1 p(namn efter ~Namn) 0,15 p(ej namn efter ~Namn) 0,85

23 Räkneexempel Givet dessa sannolikheter, vad blir beslutet Anställningar? Don? Gamla?...

24 Principer för klassificering med Naive Bayes Klassificeringen grundar sig på apriori-sannolikheter och ett större eller mindre antal indikatorer ("features"). Valet av dessa är viktigt och är avgörande för hur bra det blir. En indikator kan vara binär (uppfylld eller icke-uppfylld), men kan också ha flera värden. Varje värde förknippas med en sannolikhet att förekomma ihop med varje möjlig kategori, p(f=f C=c). Vid språktillämpningar uppskattas sannolikheterna från korpusdata. Utjämning tillämpas för att balansera för data med låg frekvens. Alla indikatorer betraktas som oberoende. Därför vägs de ihop som en produkt av sannolikheter.

25 Principer för Naive Bayes Naive Bayes är ett exempel på övervakad (eng. supervised) automatisk inlärning. Det krävs alltså en mängd träningsdata där enheter är klassificerade. Den teoretiska härledningen är baserad på sannolikheter, men i praktiken används ofta en logaritmisk skalförskjutning så att bästa kategori är den med lägst kostnad. sannolikheten p ger kostnaden -log(p) 0 < p < 1 ger - < log(p) < 0 log(pq) = log(p) + log(q)

26 Uppgift Textklassificering utifrån ämne modellera p(ämne dokument) Antalet ämnen kan vara stort, ekonomi, sport, inrikespolitik, utrikespolitik, hälsa,... Kategoriseringen kan vara envärd eller flervärd, Vid envärd klassificering väljs det ämne som har högst sannolikhet, Vid flervärd klassificering väljs alla kategorier som t.ex. överstiger ett givet tröskelvärde, baserat på ett antal binära klassificerare.

27 Textklassificering utifrån ämne Givet tillräckligt med klassificerade texter, kan valet av indikatorer göras automatiskt med användning av termer T = { t i } med störst diskriminerande förmåga. F i = förekomst av t i i dokumentet, C* = argmax p(c) p(t i C) Alternativt kan vi använda vektorrumsmodell, N C i = 1 D = <F 1,..., F N > jämförs med <p(t 1 C), p(t N C)> även fraser (bigram och trigram) kan användas,

28 Betydelsebestämning Betydelsebestämning innebär att bestämma en ordförekomsts betydelse i en given kontext. Exempel: Vilken betydelse av ordet 'stryka' används i följande mening: Du stryker dig från sändlistan genom ett tomt mail till: leavedagens@nyheter.skolporten.com

29 Ord och betydelser Vad är en ordbetydelse? Teoretiska svar ges av lingvister, språkfilosofer m.fl. Praktiskt svar: det som i ett (stort) lexikon är definierat som en betydelse, t.ex. Nationalencyklopedins ordbok, Wordnet,

30 Ett lexikonutdrag (källa: Svensk Ordbok) stryka, v. 1 föra handflatan längs med någonting (a) med användning av andra kroppsdelar, (b) i syfte att avlägsna ngt (c) i syfte att föra samman något 2 belägga en yta med färg eller annat mjukt ämne 3 släta ut tyg med hett strykjärn 4 dra streck med penna i anslutning till ngt skrivet (a) som markering, (b) för att ta bort ngt (c) bildligt utesluta, ta bort 5 hala ned flagga 6 förflytta sig smygande eller dold

31 Semantiska relationer mellan lexem synonymi strikt synonymi (utbytbarhet i alla kontexter) extensionellt överlapp (WordNet: synsets) pojke, kille, grabb, kis, gosse,... flertydighet homonymi/homografi (samma form, helt olika betydelse) kurs; fil;... polysemi (samma form, olika betydelse) fot; grön; stryka;...

32 Betydelsebestämning med korpusdata ett stort antal förekomster av ett ord märks upp med avseende på sin betydelse i olika meningskontexter. Dessa delas upp i träningsdata och testdata. Uppgiften är att utforma ett ordbetydelsesystem som presterar så bra som möjligt på testdata Exempel: <s id= 36 sense= stryka-6 >Det visade sig alltså att det inte bara är en utan minst två, kanske tre vargar som stryker omkring bland villorna här på området</s>

33 Betydelsebestämning med definitionsdata från stora lexikon eller ordnät ord i kontexten av en given förekomst jämförs med ord från definitionerna, ev. utvidgat med definitioner av ord som den första definitionen Exempel: gubben strök väggen med blå färg stryka-2: belägga en yta med färg eller annat mjukt ämne

34 Hur stor kontext behövs? stryks då stryks fyra, då stryks fyra nollor Rumänien, då stryks fyra nollor från i Rumänien, då stryks fyra nollor från sedlarna fönster

35 Betydelsebestämning med Naive Bayes Identifiera ett antal kontextindikatorer för ordet som ska betydelsebestämmas, t.ex. ord eller lemma före/efter, ord eller lemma två positioner bort, förekomst av en viss klass av ord i ett fönster runt ordet Låt dessa svara mot elementen i en vektor O = <f 1,, f n >; Uppskatta från träningsdata för varje betydelse s, p(f i s); Utjämnning är nödvändig för att uppskatta sannolikheter för indikatorer som ej setts i träningsdata.

36 Bästa gissning = mest sannolika betydelse Givet en förekomst av ordet vars kontext svarar mot vektorn O, välj den betydelse s* som är mest sannolik i kontexten, dvs s* = argmax p(s O) = (enligt Bayes regel) s argmax p(s)p(o s) / p(o) = argmax p(s)p(o s) s s

37 Naive Bayes - antagandet p(s) uppskattas med den relativa frekvensen i träningsdata, p(o s) uppskattas med produkten Π p(fi s) 1 i n Detta innebär som förut att vi räknar som om indikatorerna är oberoende.

729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp

729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp 729G17/729G66 Lexikal semantik och ordbetydelsebestämning Olika ordbegrepp Ordbetydelser Vad är ett ord? Lemman, lexem och betydelser Semantiska relationer Semantiskt strukturerade lexikon Hitta relationer

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

TDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning / 2015 Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.

Läs mer

TDDD02 Föreläsning 7 HT-2013

TDDD02 Föreläsning 7 HT-2013 TDDD02 Föreläsning 7 HT-2013 Textsammanfattning Lars Ahrenberg Litt: Våge et al.170-185; Das & Martins, A Survey on Automatic Text Summarization sid 1-4, 11-14, 23-25. Översikt Textstruktur Problemet textsammanfattning

Läs mer

Tentamen 2016-01-13. Marco Kuhlmann

Tentamen 2016-01-13. Marco Kuhlmann TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Textklassificering. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Textklassificering. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Textklassificering Marco Kuhlmann Institutionen för datavetenskap Textklassificering Skräppostfiltrering spam ham Författaridentifiering Alexander Hamilton

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Betydelse och betydelse

Betydelse och betydelse Betydelse och betydelse Ordbetydelsedisambiguering i praktiken Stian Rødven Eide stian@fripost.org Självständigt arbete i lingvistik, 15 hp Göteborgs universitet Institutionen för filosofi, lingvistik

Läs mer

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)

Läs mer

Klassificering av homonymer Inlämningsuppgift språkteknologi

Klassificering av homonymer Inlämningsuppgift språkteknologi Klassificering av homonymer Inlämningsuppgift språkteknologi 2013-01-10 Kurskod: DD2418 Författare Gustav Ribom 910326-0593 Erik Aalto 861108-0212 Kontaktperson Johan Boye Abstract Ordet fil har flera

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Hitta k största bland n element. Föreläsning 13 Innehåll. Histogramproblemet

Hitta k största bland n element. Föreläsning 13 Innehåll. Histogramproblemet Föreläsning 13 Innehåll Algoritm 1: Sortera Exempel på problem där materialet i kursen används Histogramproblemet Schemaläggning Abstrakta datatyper Datastrukturer Att jämföra objekt Om tentamen Skriftlig

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas

Läs mer

Probabilistisk logik 2

Probabilistisk logik 2 729G43 Artificiell intelligens / 2016 Probabilistisk logik 2 Marco Kuhlmann Institutionen för datavetenskap Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Partiell parsning Parsning som sökning

Partiell parsning Parsning som sökning Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Kombinatorik och sannolikhetslära

Kombinatorik och sannolikhetslära Grunder i matematik och logik (2018) Kombinatorik och sannolikhetslära Marco Kuhlmann Sannolikhetslära Detta avsnitt är för det mesta en kompakt sammanfattning av momentet sannolikhetslära som ingår i

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta

Läs mer

Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.

Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA5 Institutionen för teknik och naturvetenskap Linköpings universitet

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

Vad behövs för att skapa en tillståndsrymd?

Vad behövs för att skapa en tillståndsrymd? OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet

Läs mer

www.pts.se/archive/documents/ SE/Rapport_tillganglig_webb_2004_14.pdf 2 webzone.k3.mah.se/k99ac3hl/helenalackmagisterkogniton2003.

www.pts.se/archive/documents/ SE/Rapport_tillganglig_webb_2004_14.pdf 2 webzone.k3.mah.se/k99ac3hl/helenalackmagisterkogniton2003. 2 3 1 Är samhällsviktiga tjänster på Internet tillgängliga för personer med funktionshinder? PTS-ER-2004:14, ISSN 1650-9862. www.pts.se/archive/documents/ SE/Rapport_tillganglig_webb_2004_14.pdf 2 webzone.k3.mah.se/k99ac3hl/helenalackmagisterkogniton2003.pdf

Läs mer

729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap

729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap 729G43 Artificiell intelligens (2016) Maskininlärning 3 Marco Kuhlmann Institutionen för datavetenskap Modell med vektornotation parametervektor särdragsvektor Perceptron kombinerar linjär regression med

Läs mer

Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014

Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014 Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

Anpassning av problem

Anpassning av problem Modul: Problemlösning Del 7: Anpassning av problem Anpassning av problem Kerstin Hagland och Eva Taflin Detta är en något omarbetad text från boken: Hagland, K., Hedrén R., & Taflin, E. (2005). Rika matematiska

Läs mer

Tentamen Del A. Marco Kuhlmann

Tentamen Del A. Marco Kuhlmann TDDD01 Språkteknologi (2016) Tentamen 2016-03-16 Marco Kuhlmann Tentamen består två delar, A och B. Varje del omfattar ett antal frågor à 3 poäng. Del A omfattar 8 frågor som kan besvaras kortfattat. Det

Läs mer

Signalbehandling Röstigenkänning

Signalbehandling Röstigenkänning L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1

Läs mer

grafisk design & layout regler

grafisk design & layout regler & layout regler Grafisk design eller grafisk formgivning är ett kreativt och konstnärligt språk, men till skillnad från en fri konstnär så får en grafisk designer i uppdrag att föra ut ett speciellt budskap.

Läs mer

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5 1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt 2.1-2.2, 2.5 Introduktion till kursen. Grundläggande sannolikhetslära. Mängdlära, händelser, sannolikhetsmått Händelse följer samma räkneregler

Läs mer

Anna: Bertil: Cecilia:

Anna: Bertil: Cecilia: Marco Kuhlmann 1 Osäkerhet 1.01 1.02 1.03 1.04 1.05 Intelligenta agenter måste kunna hantera osäkerhet. Världen är endast delvist observerbar och stokastisk. (Jmf. Russell och Norvig, 2014, avsnitt 2.3.2.)

Läs mer

Semantik. Semantik och språkteknologi

Semantik. Semantik och språkteknologi Semantik Semantik studiet av innebörd(mening) Går tillbaka till Platon (dialogen Kratylos) Relationen språk verklighet Betydelsen av ett ord är dess användning i språket (Wittgenstein) Semantik och språkteknologi

Läs mer

Projektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.

Projektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Projektion av träningsdata på aktuell underrum av dim Föreläsning : Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA Institutionen för

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1 Sannolikhetslära (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

TAIU07 Matematiska beräkningar med Matlab

TAIU07 Matematiska beräkningar med Matlab TAIU07 Matematiska beräkningar med Matlab Laboration 3. Linjär algebra Namn: Personnummer: Epost: Namn: Personnummer: Epost: Godkänd den: Sign: Retur: 1 Introduktion 2 En Komet Kometer rör sig enligt ellipsformade

Läs mer

Definition 1 Ett vektorrum M (över R) är en mängd element, vektorer, sådan att det finns en kommutativ operation + på mängden M som uppfyller

Definition 1 Ett vektorrum M (över R) är en mängd element, vektorer, sådan att det finns en kommutativ operation + på mängden M som uppfyller April 27, 25 Vektorrum Definition Ett vektorrum M (över R) är en mängd element, vektorer, sådan att det finns en kommutativ operation + på mängden M som uppfyller. x M och y M = x + y M. 2. x + y = y +

Läs mer

Random Indexing för vektorbaserad semantisk analys

Random Indexing för vektorbaserad semantisk analys Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk

Läs mer

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring Kategorisering och klustring Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Skillnaden mellan kategorisering och klustring? Kategori är förutbestämt av någon Kluster är

Läs mer

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se Tänk kreativt! Informationssökning Ha ett kritiskt förhållningssätt! Informationssökning steg för steg Innan du börjar behöver du formulera en fråga. Vad vill du hitta information om? Att utgå från: -

Läs mer

1 Duala problem vid linjär optimering

1 Duala problem vid linjär optimering Krister Svanberg, april 2012 1 Duala problem vid linjär optimering Detta kapitel handlar om två centrala teoretiska resultat för LP, nämligen dualitetssatsen och komplementaritetssatsen. Först måste vi

Läs mer

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Markovkedjor. Patrik Zetterberg. 8 januari 2013 Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)

Läs mer

LÖSNINGAR TILL UPPGIFTER TILL RÄKNEÖVNING 1

LÖSNINGAR TILL UPPGIFTER TILL RÄKNEÖVNING 1 STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Linjär algebra II LÖSNINGAR TILL UPPGIFTER TILL RÄKNEÖVNING Lös ekvationssystemet x + y + z 9 x + 4y 3z 3x + 6z 5z med hjälp av Gausselimination Lösning:

Läs mer

FTEA12:4 Vetenskapsteori. Realism och anti-realism

FTEA12:4 Vetenskapsteori. Realism och anti-realism FTEA12:4 Vetenskapsteori Realism och anti-realism Realism vs. anti-realism Ontologi: Finns det en värld som är oberoende medvetandet? Semantik: Är sanning en objektiv språk-värld relation? Epistemologi:

Läs mer

TANA09 Föreläsning 8. Kubiska splines. B-Splines. Approximerande Splines. B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor.

TANA09 Föreläsning 8. Kubiska splines. B-Splines. Approximerande Splines. B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor. TANA09 Föreläsning 8 Kubiska splines Approximerande Splines s s s s 4 B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor. x x x x 4 x 5 Exempel Parametriska Kurvor. Ritprogram. Beziér kurvor.

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Aktiviteten, (Vad är mina chanser?), parvis, alla har allt material,

Aktiviteten, (Vad är mina chanser?), parvis, alla har allt material, Aktiviteten, (Vad är mina chanser?), parvis, alla har allt material, Hur stor är chansen? NAMN Ni kommer att utvärdera olika spel för att hjälpa er förstå sannolikheten. För varje spel, förutsäga vad som

Läs mer

Föreläsning 13 Innehåll

Föreläsning 13 Innehåll Föreläsning 13 Innehåll Exempel på problem där materialet i kursen används Hitta k största bland n element Histogramproblemet Schemaläggning PFK (Föreläsning 13) VT 2013 1 / 15 Hitta k största bland n

Läs mer

PRÖVNINGSANVISNINGAR

PRÖVNINGSANVISNINGAR PRÖVNINGSANVISNINGAR Prövning i Matematik D Kurskod Ma 104 Gymnasiepoäng 100 Läromedel Prov Muntligt prov Inlämningsuppgift Kontakt med examinator Övrigt Valfri aktuell lärobok för kurs Matematik D t.ex.

Läs mer

FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång

FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång FriendlyReader Språkteknologi för sammanfattningar och ökad läsbarhet Mål:! Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information

Läs mer

Publicera material i Blackboard

Publicera material i Blackboard Marie Andersson, IKT-centrum E-post: iktcentrum@mdh.se 2012-06-25 (Bb Learn 9.1.8) Publicera material i Blackboard Innehåll Att tänka på... 2 Mappar och Lärmoduler... 2 Skapa en mapp... 2 Skapa en lärmodul...

Läs mer

Föreläsning 1. Grundläggande begrepp

Föreläsning 1. Grundläggande begrepp Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 1 Sannolikhetsteori (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test SF1915 Sannolikhetsteori och statistik 6 hp Föreläsning 12 χ 2 -test Jörgen Säve-Söderbergh Anpassningstest test av given fördelning n oberoende försök med r möjliga olika utfall Händelse A 1 A 2... A

Läs mer

Föreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk

Föreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två

Läs mer

Grundläggande begrepp inom lexikal semantik. Hanna Seppälä Uppsala universitet 1

Grundläggande begrepp inom lexikal semantik. Hanna Seppälä Uppsala universitet 1 Grundläggande begrepp inom lexikal semantik Föreläsning 2 Uppsala universitet 1 Teman idag Semiotik Lexikal semantik kompositionell semantik Teorier om hur man kan beskriva betydelse Språklig relativism

Läs mer

Kom igång med Denna korta manual hjälper dig med att komma igång med programmen Vital och ViTex.

Kom igång med Denna korta manual hjälper dig med att komma igång med programmen Vital och ViTex. Kom igång med Denna korta manual hjälper dig med att komma igång med programmen Vital och ViTex. Kom igång med ViTre Sida 1 Kom i gång med ViTre ViTal Läshjälpen Anpassa ViTal Läshjälpen..... Sida 3 Anpassa

Läs mer

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full

Läs mer

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann Marco Kuhlmann Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 1 Enkel sannolikhet Den klassiska sannolikhetsteorin,

Läs mer

Approximerande Splines. B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor.

Approximerande Splines. B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor. TANA09 Föreläsning 8 Approximerande Splines B-splines. Minsta kvadrat anpassning. Design av kurvor och ytor. Exempel Parametriska Kurvor. Ritprogram. Beziér kurvor. Design av kurvor och ytor. Tillämpning

Läs mer

Sanning och lögnare. Rasmus Blanck VT2017. FT1200, LC1510 och LGFI52

Sanning och lögnare. Rasmus Blanck VT2017. FT1200, LC1510 och LGFI52 rasmus.blanck@gu.se FT1200, LC1510 och LGFI52 VT2017 Vad är sanning? Vi verkar använda begreppet utan större problem till vardags. Det kanske vore intressant att ha en definition: P är sann om och endast

Läs mer

Användning av informationsmängder Struktur Modeller Dokument Metadata

Användning av informationsmängder Struktur Modeller Dokument Metadata Informationsmängder Användning av informationsmängder Struktur Modeller Dokument Metadata 73 Användning av informationsmängder 74 FFi/Bo Johansson 1 Struktur 75 Identifiering 76 FFi/Bo Johansson 2 Klassificering

Läs mer

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1 Lexikal semantik Lingvistik 1 Uppsala universitet 1 Nyckelord idag Semantiska egenskaper Komponentanalys Prototypteori Relationer mellan ord Kognitiv lexikal semantik Uppsala universitet 2 Semantiska egenskaper

Läs mer

Språkteknologi vt09. Diskursmodellering. Diskursmodell: exempel. Koherensrelationer. Koreferens. Att bestämma koherensrelationer

Språkteknologi vt09. Diskursmodellering. Diskursmodell: exempel. Koherensrelationer. Koreferens. Att bestämma koherensrelationer Språkteknologi vt09 Diskursmodellering Diskursmodellering koherensrelationer anaforisk referens Informationsutvinning Mallar Delproblem Namnigenkänning Referensresolution Mallifyllning / Relationsigenkänning

Läs mer

*****************************************************************************

***************************************************************************** Statistik, 2p ANVISNINGAR Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel Detta häfte innehåller kortfattade anvisningar om hur ni använder Excel under denna laboration. Be om hjälp när/om

Läs mer

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,

Läs mer

Probabilistisk logik 1

Probabilistisk logik 1 729G43 Artificiell intelligens / 2016 Probabilistisk logik 1 Marco Kuhlmann Institutionen för datavetenskap Osäkerhet 1.01 Osäkerhet Agenter måste kunna hantera osäkerhet. Agentens miljö är ofta endast

Läs mer

TANA17 Matematiska beräkningar med Matlab

TANA17 Matematiska beräkningar med Matlab TANA17 Matematiska beräkningar med Matlab Laboration 1. Linjär Algebra och Avbildningar Namn: Personnummer: Epost: Namn: Personnummer: Epost: Godkänd den: Sign: Retur: 1 Introduktion I denna övning skall

Läs mer

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II Kritiskt tänkande HTXF04:3 FTEB05 Grundläggande semantik II Deskriptiv vs. värderande/känslomässig mening Ords betydelser kan ha både deskriptiva och värderande/känslomässiga komponenter. Det blir tydligt

Läs mer

Hur man kan tillämpa Data Science och AI i säkerhetsarbetet. Magnus Sahlgren

Hur man kan tillämpa Data Science och AI i säkerhetsarbetet. Magnus Sahlgren Hur man kan tillämpa Data Science och AI i säkerhetsarbetet Magnus Sahlgren FOI Totalförsvarets forskningsinstitut (ett av Europas ledande forskningsinstitut inom försvar och säkerhet) Mer än 900 forskare

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse

Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar

Läs mer

Pedagogisk beskrivning skolbarn

Pedagogisk beskrivning skolbarn Pedagogisk beskrivning skolbarn Barnets namn: Barnets personnummer: Formuläret är ifyllt av: Förälder Pedagog Förskola: Telnr: Datum: Till berörda pedagoger i skolan Beskriv eleven utifrån aspekterna nedan.

Läs mer

Sö ka artiklar öch annan litteratur

Sö ka artiklar öch annan litteratur 1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och

Läs mer

Föreläsningar. Gruppövning, grupp A: Måndag 26/ sal 318 Gruppövning, grupp B: Måndag 26/ sal 318

Föreläsningar. Gruppövning, grupp A: Måndag 26/ sal 318 Gruppövning, grupp B: Måndag 26/ sal 318 Föreläsningar 1. Onsdag 14/11 13-15 sal 203 2. Torsdag 15/11 13-15 sal 203 3. Måndag 19/11 13-15 sal 203 4. Tisdag 20/11 13-15 sal 203 5. Onsdag 21/11 13-15 sal 203 6. Torsdag 22/11 13-15 sal 203 Gruppövning,

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov OSÄKERHET Sannolikhetslära: Om det i ett område finns 32 % med universitetsexamen, vad är sannolikheten att ett stickprov kommer att innehålla 31-33 % med universitetsexamen? Om medelåldern i en population

Läs mer

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA 729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion

Läs mer

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen:

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen: Modul: Algebra Del 8: Avslutande reflektion och utvärdering Distributiva lagen Cecilia Kilhamn, Göteborgs Universitet Distributiva lagen a (b + c) = a b + a c Den distributiva lagen kallas den räknelag

Läs mer

För att logga in och få tillgång till Bildarkivet krävs att man är registrerad som Behörig Användare.

För att logga in och få tillgång till Bildarkivet krävs att man är registrerad som Behörig Användare. För att logga in och få tillgång till Bildarkivet krävs att man är registrerad som Behörig Användare. Alla betalande medlemmar i Klippans Hembygdsförening eller Åsbo Släkt- och Folklivsforskare har rätt

Läs mer

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning

Läs mer

Datastrukturer och algoritmer. Innehåll. Tabell. Tabell - exempel. Gränsyta till Tabell. Tabell. Modell. Hashtabell Relation, lexikon.

Datastrukturer och algoritmer. Innehåll. Tabell. Tabell - exempel. Gränsyta till Tabell. Tabell. Modell. Hashtabell Relation, lexikon. Datastrukturer och algoritmer Föreläsning 7 Tabell, hashtabell Relation & lexikon Innehåll Tabell Tabell Hashtabell Relation, lexikon Modell Uppslagsbok Organisation Ändlig avbildning av argument på värden

Läs mer

BLOCK 1. 1A. Att komma igång

BLOCK 1. 1A. Att komma igång BLOCK 1 1A. Att komma igång Blocket omfattar sidorna 8 23 i läseboken och sidorna 7 8 i grammatikboken samt hörövningar. 1. Vem är du? 2. Vilka fyra färdigheter är viktiga vid språkinlärning? 3. Hur många

Läs mer

X Y år provnr Därefter fritt 4 första kolumnerna villkorade

X Y år provnr Därefter fritt 4 första kolumnerna villkorade Skapa tilldelnings fil från externa data Förutsättningar Denna ger dig möjlighet att skapa värde kopplat med ett X och Y tal externt för att sedan importera dessa värde till Näsgård med en textfil. I exemplet

Läs mer

VEKTORRUMMET R n. 1. Introduktion

VEKTORRUMMET R n. 1. Introduktion VEKTORRUMMET R n RYSZARD RUBINSZTEIN 28--8. Introdktion Låt n vara ett heltal. Med R n kommer vi att beteckna mängden vars element är alla n-tipplar av reella tal (a, a 2,..., a n ), R n = { (a, a 2,...,

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

Kritiskt tänkande HTXF04:3 FTEB05. Rekonstruktion av argument

Kritiskt tänkande HTXF04:3 FTEB05. Rekonstruktion av argument Kritiskt tänkande HTXF04:3 FTEB05 Rekonstruktion av argument Utvärdering av definitioner Problem (generella) Cirkularitet (definiendum ingår i definiens) (i) Direkt cirkularitet Exempel: Frihet är rätten

Läs mer

Klustring av svenska tidningsartiklar

Klustring av svenska tidningsartiklar Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier

Läs mer

Upplägg. Binära träd. Träd. Binära träd. Binära träd. Antal löv på ett träd. Binära träd (9) Binära sökträd (10.1)

Upplägg. Binära träd. Träd. Binära träd. Binära träd. Antal löv på ett träd. Binära träd (9) Binära sökträd (10.1) Binära träd Algoritmer och Datastrukturer Markus Saers markus.saers@lingfil.uu.se Upplägg Binära träd (9) Binära sökträd (0.) Träd Många botaniska termer Träd, rot, löv, gren, Trädets rot kan ha ett antal

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys Marco Kuhlmann Institutionen för datavetenskap Semantik pragmatik semantik analys generering syntax morfologi Denna föreläsning ordbetydelsebestämning

Läs mer

SF1624 Algebra och geometri

SF1624 Algebra och geometri Föreläsning 10 Institutionen för matematik KTH 21 november 2016 Dagens och veckans ämnen Idag: Allmänna vektorrum, baser, koordinater, kap 4.1-4.4: Vektorrum och delrum, igen Bas, igen Koordinater med

Läs mer

Vi tror på att kommunikation ska vara roligt - därför är Prata utformad för att

Vi tror på att kommunikation ska vara roligt - därför är Prata utformad för att Instruktioner Lösenordet för Säkert Läge är edit. Välkommen till Prata! Vi tror på att kommunikation ska vara roligt - därför är Prata utformad för att locka till kommunikation genom färg, form och lekfullhet.

Läs mer

TAMS79: Föreläsning 10 Markovkedjor

TAMS79: Föreläsning 10 Markovkedjor TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer