TDDD02 Språkteknologi för informationssökning / Textsammanfattning. Marco Kuhlmann Institutionen för datavetenskap
|
|
- Håkan Olofsson
- för 7 år sedan
- Visningar:
Transkript
1 TDDD02 Språkteknologi för informationssökning / 2015 Textsammanfattning Marco Kuhlmann Institutionen för datavetenskap
2 Textsammanfattning Textsammanfattning går ut på att extrahera den mest relevanta informationen ur en text för att producera en förkortad version.
3 Typiska sammanfattningar översikt för godtyckliga dokument sammandrag för vetenskapliga artiklar rubriker för nyhetstexter textutdrag vid webbsökning svar på komplexa frågor
4 Två dimensioner inom textsammanfattning Ett versus flera dokument Finns den relevanta informationen i ett dokument eller är den utspridd över flera dokument? Generiska versus specifika sammanfattningar Finns det en tilltänkt användare eller ett tydligt kommunicerat informationsbehov? Extrakt versus abstrakt
5 En nyhetstext Dagens Nyheter Möbeljätten Ikea planerar att bli dubbelt så stort år För att uppnå målet ökar bolaget etableringstakten som ska sätta fart på omsättningen, rapporterar Dagens Industri. I dagsläget öppnar Ikea 10 nya varuhus om året. Exakt hur många varuhus som ska öppnas varje år framöver är inte klart men etableringstakten väntas mer än fördubblas med 25 nya varuhus varje år, enligt uppgifter till DI. På åtta år innebär det att mellan 160 och 200 nya varuhus ska öppnas. Ett kalas som beräknas kosta över 100 miljarder kronor.
6 Extrakt och abstrakt Extrakt Möbeljätten Ikea planerar att bli dubbelt så stort år Exakt hur många varuhus som ska öppnas varje år framöver är inte klart men etableringstakten väntas mer än fördubblas med 25 nya varuhus varje år. På åtta år innebär det att mellan 160 och 200 nya varuhus ska öppnas. Abstrakt Ikea planerar att bli dubbelt så stort år För att uppnå målet ökar bolaget etableringstakten från 10 till 25 nya varuhus per år. Kostnaderna under de närmaste åtta åren beräknas till över 100 miljarder kronor.
7
8 Delproblem i ett extraktionsbaserat system Innehållsurval Välj ut de mest centrala meningarna ur dokumentet. Informationsordning Välj en ordning för de utvalda meningarna. Meningsrealisering Fixa till meningarna så att texten blir koherent.
9 Syntaktisk och retorisk struktur Texter har en syntaktisk och en retorisk struktur som kan utnyttjas när man ämnar skapa kortare texter.
10 Kandidater för förkortning av meningar appositives Rajam, 28, an artist who was living at the time in Philadelphia, found the inspiration in the back of city magazines. attribution clauses Rebels agreed to talks with government officials, international observers said Tuesday. prepositional phrases without named entities The fishing restrictions in Washington will not be lifted unless the salmon population increases to a sustainable number. initial adverbials For example, On the other hand, As a matter of fact Jurafsky och Martin (2009), s. 796
11 Innehållsurval
12 Innehållsurval Innehållsurval kan formuleras som ett klassifikationsproblem. antingen extrahera eller inte extrahera En idé är att extrahera de meningar som innehåller de för texten mest karakteristiska orden. ordbaserat innehållsurval Varje ord i en mening får en poängsiffra; meningarna rankas sedan baserat på deras totala poäng, delad med antalet ord.
13 Kriterier för ordbaserat innehållsurval Metod 1: Ordfrekvens Metod 2: Tf idf Metod 3: Log-likelihood ratio
14 Metod 1: Ordfrekvens En enkel idé är att välja ut de meningar som innehåller många ord som förekommer ofta i dokumentsamlingen. Men ett ord kan ha en hög frekvens i dokumentsamlingen utan att vara särskilt karakteristiskt för ämnet. stoppord
15 Metod 2: Tf idf Istället för endast frekvens kan vi använda tf idf. tf idf(w, d) = tf(w, d) idf(w) Måttet ger hög vikt till ord som förekommer relativt ofta i det aktuella dokumentet men relativt sällan i andra dokument. En hög tf idf-vikt tolkas som ett tecken på att ordet är karakteristiskt för dokumentet.
16 Påminnelse: Invers dokumentfrekvens Den inversa dokumentfrekvensen för en term t är definierad som idf(t) = log N df(t) N = totala antalet dokument i samlingen df(t) = antalet dokument som innehåller termen t
17 Metod 3: Log-likelihood ratio Måttet log-likelihood ratio ställer två hypoteser mot varandra: Hypotes 1: Ordet w är lika vanligt i det aktuella dokumentet d som i hela dokumentsamlingen D (= inte särskilt karakteristiskt). P(w d) = P(w D) Hypotes 2: Ordet w är inte lika vanligt i det aktuella dokumentet d som i hela dokumentsamlingen D (= karakteristiskt). P(w d) P(w D) Sannolikheterna P(w d) och P(w D) kan skattas via MLE.
18 Textdokument som myntkast Vi har ett dokument d bestående av n stycken ord. Hur stor är sannolikheten att se ett visst ord w exakt k gånger i d? För att förenkla saken antar vi att sannolikheten p för att se w är oberoende av alla andra sannolikheter. Den beror t.ex. inte på de andra orden i dokumentet. Då är sannolikheten för att se w exakt k gånger samma som sannolikheten för att se k stycken kronor när vi kastar ett mynt n gånger och myntet visar krona med sannolikhet p.
19 Binomialfördelningen (n = 10, p = 0,5) 32 % 24 % 16 % 8 % 0 %
20 Att ställa två hypoteser mot varandra 32 % 24 % p = 20% p = 80% 16 % 8 % 0 %
21 Metod 3: Log-likelihood ratio Hypotes 1: Sannolikheten för att se k förekomster av w ges av en binomialfördelning med parameter P(w D). Hypotes 2: Sannolikheten för att se k förekomster av w ges av en binomialfördelning med parameter P(w d). Likelihood-kvoten är kvoten mellan dessa två värden.
22 Metod 3: Log-likelihood ratio Likelihood-kvoten säger oss hur mycket mera sannolikt vår observation av w är under hypotes H 1 än under hypotes H 2. En hög likelihood-kvot talar för hypotes H 1, dvs. att ordet w inte är karakteristiskt för dokumentet. En låg likelihood-kvot talar för hypotes H 2, dvs. att ordet w är karakteristiskt för dokumentet.
23 Metod 3: Log-likelihood ratio För att ranka meningarna i ett dokument: För varje mening och varje ord w i denna mening, beräkna score(w) = 1 score(w) = 0 om likelihood-kvoten för w är tillräcklig hög annars Räkna ut en poängsiffra för hela meningen genom att dela poängsumman med antalet ord i meningen.
24 Kriterier för ordbaserat innehållsurval Metod 1: Ordfrekvens Metod 2: Tf idf Metod 3: Log-likelihood ratio
25 Innehållsurval baserat på centralitet Vid dokumentsökning har vi använt avstånd mellan vektorer för att kvantifiera likheten mellan dokument. För att använda samma idé på textsammanfattning räknar vi först ut textens centralvektor. Räkna ut en vektor för varje mening och ta medelvärdena. Extrahera de meningar ur texten vars vektorer ligger närmast centralvektorn.
26 Liten vinkel, stor likhet d 1 d 2 θ sim(d 1, d 2 ) = cos θ
27 Utvärdering av sammanfattningssystem
28 Utvärdering av sammanfattningssystem Precis som andra språkteknologiska system kan system för textsammanfattning utvärderas antingen in vivo eller in vitro. Exempel på in vivo-utvärdering: Testpersoner samlar in information om ett givet ämne inom en given tidsram. Presterar de bättre om de har tillgång till dokumentsammanfattningar? Det vanligaste måttet för in vitro-utvärdering av sammanfattningssystem heter ROUGE.
29 ROUGE-n ROUGE = Recall-Oriented Understudy for Gisting Evaluation antal gemensamma n-gram mellan system och referenstext antal n-gram i referenstexten
30 Exempel på utvärdering med ROUGE-2 Referenstext Möbeljätten Ikea planerar att bli dubbelt så stort år På åtta år innebär det att mellan 160 och 200 nya varuhus ska öppnas. Systemtext Möbeljätten Ikea ska bli dubbelt så stort år Tusentals människor kommer att behöva anställas. antal 2-gram: 23 6 överlappande 2-gram ROUGE-2: 6/23
31 Fråga Hur skulle du kunna fuska i en utvärdering baserad på ROUGE-1?
32 Sammanfattning: Textsammanfattning Textsammanfattning går ut på att extrahera den mest relevanta informationen ur en text för att producera en förkortad version. Centrala begrepp: log-likelihood-kvot, centralitet, ROUGE Jag har fokuserat på extraktionsbaserade textsammanfattningssystem för enstaka dokument.
33 Hur kan en dator förstå vad ord betyder?
34 You shall know a word by the company it keeps. John Rupert Firth (1957)
35 Målord och kontextord krona tron regera Sverige match mål spela drottning kung fotboll bandy
36 Ordvektorer = rader i ord ord-matrisen krona tron regera Sverige match mål spela drottning kung fotboll bandy
37 Ord som vektorer krona drottning kung fotboll Sverige
38 Problem: Stort och glest krona tron regera Sverige match mål spela drottning kung fotboll bandy
39 Neuronnät vikt 1 invärden + utvärde vikt 2
40 Neuronnät regerar krona drottning spelar match
41 Neuronnät regerar 1 krona drottning spelar 0 + match 0
42 Neuronnät regerar 1 krona drottning spelar match 0
43 Att räkna med ordvektorer kvinna drottning man kung
44 A är till B som C är till D drottning kung kvinna man Stockholm Berlin Sverige Tyskland cykla cyklade gå gick tung tyngre lätt lättare Prova själv:
45 Tillämpningar av ordvektorer Som teknik för att föreslå synonymer och andra semantiskt relaterade ord. Som teknik för att automatiskt skapa ontologier (kunskapshierarkier) från en textmängd. Som utgångspunkt för mera avancerade tekniker. indata till artificiella neuronnät för ordklasstaggning, parsning, sentimentanalys, maskinöversättning,
TDDD02 Föreläsning 7 HT-2013
TDDD02 Föreläsning 7 HT-2013 Textsammanfattning Lars Ahrenberg Litt: Våge et al.170-185; Das & Martins, A Survey on Automatic Text Summarization sid 1-4, 11-14, 23-25. Översikt Textstruktur Problemet textsammanfattning
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merTentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Läs merTDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Läs merTDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merTentamen Del A. Marco Kuhlmann
TDDD01 Språkteknologi (2016) Tentamen 2016-03-16 Marco Kuhlmann Tentamen består två delar, A och B. Varje del omfattar ett antal frågor à 3 poäng. Del A omfattar 8 frågor som kan besvaras kortfattat. Det
Läs merb) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merFriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång
FriendlyReader Språkteknologi för sammanfattningar och ökad läsbarhet Mål:! Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information
Läs mer1 Ortogonalitet. 1.1 Skalär produkt. Man kan tala om vinkel mellan vektorer.
Ortogonalitet Man kan tala om vinkel mellan vektorer.. Skalär produkt Vi definierar längden (eller normen) av en vektor som ett reellt tal 0 (Se boken avsnitt.). Vi definierar skalär produkt (Inner product),
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 2 Marco Kuhlmann Institutionen för datavetenskap Förra gången: Gradientsökning tangentens lutning i punkt θ steglängdsfaktor Översikt Introduktion
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merLinköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson
Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som
Läs mer729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Läs merSF1624 Algebra och geometri
Föreläsning 16 Institutionen för matematik KTH 5 december 2017 Modul 6 Veckans arbete 1. Idag: Ortonormalt, kap 7.1-7.2 a. Ortogonala och ortonormala baser b. Gram-Schmidts metod c. Ortogonala matriser
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta
Läs merOmvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter
Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,
Läs merInstitutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).
UPPSALA UNIVERSITET Matematik för språkteknologer (5LN445) Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014). 9 Sannolikhet Detta kapitel
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 3. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 3 Marco Kuhlmann Institutionen för datavetenskap Modell med vektornotation parametervektor särdragsvektor Perceptron kombinerar linjär regression med
Läs merLinjär Algebra, Föreläsning 9
Linjär Algebra, Föreläsning 9 Tomas Sjödin Linköpings Universitet Euklidiska rum Vi ska nu införa en extra struktur på vektorrum, en så kallad skalärprodukt, vilken vi kan använda för att definiera längd
Läs merSF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2
Matematisk Statistik SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 1 Introduktion Denna laboration är inte poänggivande utan är till för den som vill bekanta sig med MATLAB. Fokusera
Läs merTDDD02 Språkteknologi för informationssökning (2016) Semantisk analys. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Semantisk analys Marco Kuhlmann Institutionen för datavetenskap Semantik pragmatik semantik analys generering syntax morfologi Denna föreläsning ordbetydelsebestämning
Läs mer5 Linjär algebra. 5.1 Addition av matriser 5 LINJÄR ALGEBRA
5 LINJÄR ALGEBRA 5 Linjär algebra En kul gren av matematiken som inte fått speciellt mycket utrymme i gymnasiet men som har många tillämpningsområden inom t.ex. fysik, logistik, ekonomi, samhällsplanering
Läs mer- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
Läs merAutomatisk textsammanfattning
Språkteknologi 2001-10-14 Nada Kungliga Tekniska högskolan Automatisk textsammanfattning Per Karefelt (d98-pka) Marcus Hjelm (d98-mhj) Sammanfattning (manuell) Denna rapport belyser en del av de problem
Läs merCrash Course Algebra och geometri. Ambjörn Karlsson c januari 2016
Crash Course Algebra och geometri Ambjörn Karlsson c januari 2016 ambjkarlsson@gmail.com 1 Contents 1 Projektion och minsta avstånd 4 2 Geometriska avbildningar och avbildningsmatriser 5 3 Kärnan 6 3.1
Läs merInnehåll. Informationssökning språkteknologiska hjälpmedel
Informationssökning språkteknologiska hjälpmedel Hercules Dalianis NADA-KTH Email: hercules@kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Hercules Dalianis sid 1 Innehåll Sökmotor Stemming,
Läs mer729G43 Artificiell intelligens / Maskininlärning 2. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 2 Marco Kuhlmann Förra gången: Linjär regression Gradientsökning Vandra ner i felets dal. Steg 0: Börja med ett godtyckligt värde för θ. Steg 1: Räkna
Läs mer1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)
UMEÅ UNIVERSITY Department of Mathematics and Mathematical Statistics Pre-exam in mathematics Linear algebra 2012-02-07 1. Compute the following matrix: (2 p 3 1 2 3 2 2 7 ( 4 3 5 2 2. Compute the determinant
Läs merDetta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.
Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas
Läs merTDDD02 Språkteknologi för informationssökning (2016) Textklassificering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Textklassificering Marco Kuhlmann Institutionen för datavetenskap Textklassificering Skräppostfiltrering spam ham Författaridentifiering Alexander Hamilton
Läs merSjälvkoll: Ser du att de två uttrycken är ekvivalenta?
ANTECKNINGAR TILL RÄKNEÖVNING 1 & - LINJÄR ALGEBRA För att verkligen kunna förstå och tillämpa kvantmekaniken så måste vi veta något om den matematik som ligger till grund för formuleringen av vågfunktionen
Läs merInformationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)
Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)
Läs merSannolikhetsbegreppet
Kapitel 3 Sannolikhetsbegreppet Betrakta följande försök: Ett symmetriskt mynt kastas 100 gånger och antalet krona observeras. Antal kast 10 20 30 40 50 60 70 80 90 100 Antal krona 6 12 16 21 25 30 34
Läs merMarco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014
Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng
Läs mer3x + y z = 0 4x + y 2z = 0 2x + y = Lös det överbestämda systemet nedan på bästa sätt i minsta kvadratmening. x = 1 x + y = 1 x + 2y = 2
TM-Matematik Sören Hector :: 7-46686 Mikael Forsberg :: 734-433 kurser:: Linjär Algebra ma4a Matematik för ingenjörer ma3a 3 7 Skrivtid: 9:-4:. Inga hjälpmedel. Lösningarna skall vara fullständiga och
Läs merCristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merRobotarm och algebra
Tekniska Högskolan i Linköping Institutionen för Datavetenskap (IDA) Torbjörn Jonsson 2010-12-07 Robotarm och algebra I denna laboration skall du lära dig lite mer om möjlighetera att rita ut mer avancerade
Läs merLINJÄRA AVBILDNINGAR
LINJÄRA AVBILDNINGAR Xantcha november 05 Linjära avbildningar Definition Definition En avbildning T : R Ñ R (eller R Ñ R ) är linjär om T pau ` bvq at puq ` bt pvq för alla vektorer u, v P R (eller u,
Läs merSNABBGUIDE TILL NEWSDESK
SNABBGUIDE TILL NEWSDESK Kom igång snabbt och enkelt 1 Om Newsdesk... 1.1 Så här går det till... 1.2 Informationen kan du få på olika sätt... 2 Vad kostar det?... 2.1 Registrera dig... 3 Inloggning...
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merÖvningshäfte 2: Komplexa tal
LMA100 VT007 ARITMETIK OCH ALGEBRA DEL Övningshäfte : Komplexa tal Övningens syfte är att bekanta sig med komplexa tal. De komplexa talen, som är en utvidgning av de reella talen, kom till på 1400 talet
Läs merFöreläsning 3: Dekomposition. Dekomposition
Föreläsning 3: Dekomposition Dekomposition Dekomposition är en generell metod för att lösa problem Metoden bygger på att man delar upp ett problem i delproblem av samma typ som ursprungsproblemet Uppdelningen
Läs merF5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab
Repetition: Gnuer i (o)skyddade områden χ 2 -metoder, med koppling till binomialfördelning och genetik. Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 Endast 2 av de 13 observationerna
Läs merTMV166 Linjär algebra för M, vt 2016
TMV166 Linjär algebra för M, vt 2016 Lista över alla lärmål Nedan följer en sammanfattning av alla lärmål i kursen, uppdelade enligt godkänt- och överbetygskriterier. Efter denna lista följer ytterligare
Läs merTextsammanfattning. En uppsats i kursen Språkteknologi, 2D1418. höstterminen Carolin Jonsson. kursledare: Hercules Dalianis
Textsammanfattning En uppsats i kursen Språkteknologi, 2D1418 höstterminen 2001 av d98-cjo@d.kth.se kursledare: Hercules Dalianis Sammanfattning I denna uppsats beskrivs kortfattat vad automatisk, d v
Läs merÖvningstenta 001. Alla Linjär Algebra. TM-Matematik Sören Hector Mikael Forsberg. 1. x 2y z + v = 0 z + u + v = 3 x + 2y + 2u + 2v = 4 z + 2u + 5v = 0
TM-Matematik Sören Hector Mikael Forsberg Alla Linjär Algebra Övningstenta. x z + v z + u + v 3 x + + u + v 4 z + u + 5v. (a) Bestäm storleken (absolutbeloppet) och argumentet till z i. (b) Uttrck på formen
Läs merExplorativ övning 7 KOMPLEXA TAL
Explorativ övning 7 KOMPLEXA TAL Övningens syfte är att bekanta sig med komplexa tal. De komplexa talen, som är en utvidgning av de reella talen, kom till på 1400 talet då man försökte lösa kvadratiska
Läs merSF1624 Algebra och geometri
SF1624 Algebra och geometri Föreläsning 2 David Rydh Institutionen för matematik KTH 28 augusti 2018 Detta gjorde vi igår Punkter Vektorer och skalärer, multiplikation med skalär Linjärkombinationer, spannet
Läs merTMV166 Linjär Algebra för M. Tentamen
MATEMATISKA VETENSKAPER TMV66 6 Chalmers tekniska högskola 6 8 kl 8:3 :3 (SB Multisal) Examinator: Tony Stillfjord Hjälpmedel: ordlistan från kurshemsidan, ej räknedosa Telefonvakt: Olof Giselsson, ankn
Läs merKravspecifikation Fredrik Berntsson Version 1.3
Kravspecifikation Fredrik Berntsson Version 1.3 Status Granskad FB 2017-01-27 Godkänd FB 2017-01-27 Dokumenthistorik Version Datum Utförda ändringar Utförda av Granskad 1.0 2014-01-15 Första versionen
Läs mer= ( 1) ( 1) = 4 0.
MATA15 Algebra 1: delprov 2, 6 hp Fredagen den 17:e maj 2013 Skrivtid: 800 1300 Matematikcentrum Matematik NF Lösningsförslag 1 Visa att vektorerna u 1 = (1, 0, 1), u 2 = (0, 2, 1) och u 3 = (2, 2, 1)
Läs merMer om analytisk geometri
1 Onsdag v 5 Mer om analytisk geometri Determinanter: Då man har en -matris kan man till den associera ett tal determinanten av som också skrivs Determinanter kommer att repeteras och studeras närmare
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.
Läs merSNABBGUIDE. Telia Anita 20 Bruksanvisning. Bläddra bland lagrade telefonnummer. Radera ett nummer. Radera alla nummer
SNABBGUIDE Bläddra bland lagrade telefonnummer Tryck eller en eller flera gånger. Radera ett nummer När numret visas i teckenrutan, tryck RADERA två gånger. Radera alla nummer Tryck eller. Håll RADERA
Läs merMatematisk statistik TMS063 Tentamen
Matematisk statistik TMS63 Tentamen 8-8- Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof Elias,
Läs merMultiplicera 7med A λ 1 I från vänster: c 1 (Av 1 λ 1 v 1 )+c 2 (Av 2 λ 1 v 2 )+c 3 (Av 3 λ 1 v 3 ) = 0
Diagonalisering Anm. Begreppet diagonaliserbarhet är relevant endast för linjära avbildningar mellan rum av samma dimension, d.v.s. sådana som representeras av kvadratiska matriser. När vi i fortsättningen
Läs merEDAA01 Programmeringsteknik - fördjupningskurs
EDAA01 Programmeringsteknik - fördjupningskurs Läsperiod lp 1+2 (Ges även lp 3) 7.5 hp anna.axelsson@cs.lth.se sandra.nilsson@cs.lth.se http://cs.lth.se/edaa01ht Förkunskapskrav: Godkänd på obligatoriska
Läs merMEDIEKOMMUNIKATION. Ämnets syfte
MEDIEKOMMUNIKATION Ämnet mediekommunikation behandlar journalistikens, informationens och reklamens innehåll, villkor och roll i samhället. Inom ämnet studeras kommunikationsprocessens olika steg utifrån
Läs merTemperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.
Hypotesprövning 1. En biolog undersöker om förekomsten av parasiten Gyrodactylus salaris är vanligare hos lax i södra Östersjön jämfört med norra. Han fångar in 111 laxar i norra Östersjön av vilka 56
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merAlgebraiska egenskaper hos R n i)u + v = v + U
Underrum till R n, nollrum, kolonnrum av en matris, rank, bas, koordinater, dimension. Påminnelse om R n s egenskaper: Algebraiska egenskaper hos R n i)u + v = v + U v) c(u + v) = cu + cv ii) ( u + v)
Läs merOändligtdimensionella vektorrum
Oändligtdimensionella vektorrum Vi har i den här kursen huvudsakligen studerat ändligtdimensionella vektorrum. Dessa är mycket användbara objekt och matriskalkyl ger en bra metod att undersöka dom med.
Läs merTentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''
Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Hjälpmedel:'Valfri'räknare,'egenhändigt'handskriven'formelsamling'(4''A4Esidor'på'2'blad)' och'till'skrivningen'medhörande'tabeller.''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
Läs merKurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Läs merDeterminanter, egenvectorer, egenvärden.
Determinanter, egenvectorer, egenvärden. Determinanter av kvadratiska matriser de nieras recursivt: först för matriser, sedan för matriser som är mest användbara. a b det = ad bc c d det a a a a a a a
Läs mer3. Lös det överbestämda systemet nedan på bästa sätt i minsta kvadratmening. x + y = 1 x + 2y = 3 x + 3y = 4 x + 4y = 6
TM-Matematik Sören Hector :: 7-46686 Mikael Forsberg :: 734-433 kurser:: Linjär Algebra ma4a Matematik för ingenjörer ma3a 5 4 Skrivtid: 9:-4:. Inga hjälpmedel. Lösningarna skall vara fullständiga och
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merFöreläsning 13 Innehåll
Föreläsning 13 Innehåll Exempel på problem där materialet i kursen används Hitta k största bland n element Histogramproblemet Schemaläggning PFK (Föreläsning 13) VT 2013 1 / 15 Hitta k största bland n
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merPbD rent konkret. Från en insnöad forskares perspektiv. Tobias Pulls. 7 September Karlstads universitet
PbD rent konkret Från en insnöad forskares perspektiv Tobias Pulls Karlstads universitet tobias.pulls@kau.se 7 September 2016 Vem är jag? Tobias Pulls postdoktor vid Datavetenskap på Karlstads universitet
Läs mer6. Matriser Definition av matriser 62 6 MATRISER. En matris är ett rektangulärt schema av tal: a 11 a 12 a 13 a 1n a 21 a 22 a 23 a 2n A =
62 6 MATRISER 6 Matriser 6 Definition av matriser En matris är ett rektangulärt schema av tal: A a a 2 a 3 a n a 2 a 22 a 23 a 2n a m a m2 a m3 a mn Matrisen A säges vara av typ m n, där m är antalet rader
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?
ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET? JOHAN FRID, HUMANISTLABORATORIET Lunds Matematiska Sällskap, Lund 7 November 2017 Humanistlaboratoriet
Läs mer2s + 3t + 5u = 1 5s + 3t + 2u = 1 3s 3u = 1
ATM-Matematik Mikael Forsberg 074-4 För studenter på distans och campus Linjär algebra ma04a 04 0 5 Skrivtid: 09:00-4:00. Inga hjälpmedel. Lösningarna skall vara fullständiga och lätta att följa. Börja
Läs merIntroduktion till statistik för statsvetare
"Det finns inget så praktiskt som en bra teori" November 2011 Bakgrund Introduktion till test Introduktion Formulera lämplig hypotes Bestäm en testvariabel Bestäm en beslutsregel Fatta ett beslut När det
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Läs merÖvningshäfte 2: Komplexa tal (och negativa tal)
LMA110 VT008 ARITMETIK OCH ALGEBRA DEL Övningshäfte : Komplexa tal (och negativa tal) Övningens syfte är att bekanta sig med komplexa tal och att fundera på några begreppsliga svårigheter som negativa
Läs merWord2Vec. Högkvalitativa vektorrepresentationer av ord tränat på stora mängder data. Innehåll LINKÖPINGS UNIVERSITET. 1. Inledning...
LINKÖPINGS UNIVERSITET Innehåll 1. Inledning... 2 2. Terminologi... 3 3. Allmänt om Word2Vec... 3 4. Continous Skip-gram model... 4 Word2Vec Högkvalitativa vektorrepresentationer av ord tränat på stora
Läs merpoäng i del B Lycka till!
TDDD02 Språkteknologi för informationssökning (2016) Tentamen 2017-01-11 Examinator: Marco Kuhlmann Denna tentamen består av två delar: 1. Del A består av 5 uppgifter som prövar din förståelse av de grundläggande
Läs merx + y z = 2 2x + 3y + z = 9 x + 3y + 5z = Gauss-Jordan elemination ger: Area = 1 2 AB AC = 4. Span(1, 1 + x, x + x 2 ) = P 2.
1 Matematiska Institutionen KTH Exam for the course Linjär algebra, 5B1307, Januari 14, 008, 14:00-19:00 Kursexaminator: Sandra Di Rocco Minst 15 poäng ger betyg 3, minst poäng ger betyg 4 och mins 8 poäng
Läs merVetenskaplig metodik
Vetenskaplig metodik Vilka metoder används? Vi kan dela in metoder i flera grupper: Deduktiva metoder Metoder för hantering av experiment Metoder för publicering och liknande. Från föreläsning 3 Föreläsningen
Läs merHitta k största bland n element. Föreläsning 13 Innehåll. Histogramproblemet
Föreläsning 13 Innehåll Algoritm 1: Sortera Exempel på problem där materialet i kursen används Histogramproblemet Schemaläggning Abstrakta datatyper Datastrukturer Att jämföra objekt Om tentamen Skriftlig
Läs merSannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann
Marco Kuhlmann Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 1 Enkel sannolikhet Den klassiska sannolikhetsteorin,
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression
Läs merSätt t = (x 1) 2 + y 2 + 2(x 1). Då är f(x, y) = log(t + 1) = t 1 2 t t3 + O(t 4 ) 1 2 (x 1) 2 + y 2 + 2(x 1) ) 2 (x 1) 2 + y 2 + 2(x 1) ) 3
Lektion 7, Flervariabelanalys den februari 000 9 Bestäm Taylorserien till funktionen log( + x + y + xy) i punkten (0, 0) Vi kan faktorisera argumentet till logaritmen och förenkla funktionen log( + x +
Läs merIsolda Purchase - EDI
Isolda Purchase - EDI Document v 1.0 1 Table of Contents Table of Contents... 2 1 Introduction... 3 1.1 What is EDI?... 4 1.2 Sending and receiving documents... 4 1.3 File format... 4 1.3.1 XML (language
Läs merEasyReader (FriendlyReader)
EasyReader (FriendlyReader) Arne Jönsson, Sture Hägglund Mål Ø Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information på
Läs merDEL I 15 poäng totalt inklusive bonus poäng.
Matematiska Institutionen KTH TENTAMEN i Linjär algebra, SF604, den 5 december, 2009. Kursexaminator: Sandra Di Rocco Svaret skall motiveras och lösningen skrivas ordentligt och klart. Inga hjälpmedel
Läs merLINJÄR ALGEBRA II LEKTION 3
LINJÄR ALGEBRA II LEKTION 3 JOHAN ASPLUND INNEHÅLL Basbyten Kolonnrum, radrum och nollrum 3 Linjära avbildningar från R n till R m 4 Uppgifter 3 46:3 3 47:a 3 48:3a 4 48:a 4 49:9 4 40:7a,b BASBYTEN Om
Läs merTMV142/186 Linjär algebra Z/TD
MATEMATIK Hjälpmedel: ordlistan från kurshemsidan, ej räknedosa Chalmers tekniska högskola Datum: 2018-08-27 kl 1400 1800 Tentamen Telefonvakt: Anders Hildeman ank 5325 TMV142/186 Linjär algebra Z/TD Skriv
Läs merLinjära avbildningar. Låt R n vara mängden av alla vektorer med n komponenter, d.v.s. x 1 x 2. x = R n = x n
Linjära avbildningar Låt R n vara mängden av alla vektorer med n komponenter, d.v.s. R n = { x = x x. x n } x, x,..., x n R. Vi räknar med vektorer x, y likandant som i planet och i rymden. vektorsumma:
Läs merSF1624 Algebra och geometri Tentamen Torsdag, 9 juni 2016
SF624 Algebra och geometri Tentamen Torsdag, 9 juni 26 Skrivtid: 8: 3: Tillåtna hjälpmedel: inga Examinator: Tilman Bauer Tentamen består av nio uppgifter som vardera ger maximalt fyra poäng. Del A på
Läs merFörslag den 25 september Engelska
Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala
Läs merDiagonalisering och linjära system ODE med konstanta koe cienter.
Diagonalisering och linjära system ODE med konstanta koe cienter. Variabelbyte i linjära system di erentialekvationer. Målet med det kapitlet i kursen är att lösa linjära system di erentialekvationer på
Läs mer