Klustring av svenska tidningsartiklar
|
|
- Gunnel Persson
- för 7 år sedan
- Visningar:
Transkript
1 Klustring av svenska tidningsartiklar Magnus Rosell rosell/
2 Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier Klustring dela in en mängd texter i kluster (grupper) efter innehåll, så att texterna inom ett kluster är mer lika varandra än texter i andra kluster. Detta skapar en (okänd) klassificering. Klustring har tidigare (missvisande) kallats Automatic Classification
3 Representation Representation av texter som i informationssökning; vector space model med tf- och idf-viktning Likhetsmått, tex cosine measure Ett kluster kan representeras med en vektor i samma rum. Denna kan kallas centroid eller klustercentrum och beräknas tex som medelvärdet (komponentvis) av alla de i klustret ingående texterna.
4 Utvärdering Hur ser en bra indelning av texter ut? Inre mått använder inte yttre information. Yttre mått använder yttre information, tex en färdig kategorisering.
5 Inre mått Likhetsmåttet kan användas till utvärdering. Ju mer lika klustren är sig själva desto mer samlade"är de. Problemet med inre mått är att de beror av representationen. Klustringar med olika representation kan inte jämföras med varandra.
6 Yttre mått Yttre mått litar till yttre information. Vad är en bra indelning? Precision, P, och täckning, R, ger värde för varje enskilt kluster: P ij = n ij /n i R ij = n ij /n j där n i är antalet texter i kluster i, n j antalet texter i kategori j och n ij är antalet texter ur kategori j iklusteri.
7 Yttre mått (forts) F-measure (högre bättre): F ij = 2P ijr ij P ij + R ij F-measure för hela klustringen (hierarkisk): F = i n i n max {F ij } j där max är taget över alla kluster på alla nivåer och n är totala antalet texter
8 Yttre mått (forts) Entropi (lägre bättre, mer ordnat) är det mått jag främst använt. Sannolikhet : p ij = n ij n i där n ij är antalet texter ur kategori j i kluster i och n i är antalet texter i kluster i.
9 Yttre mått (forts) Entropi för kluster i: E i = j p ij log p ij Entropi för hela klustringen: E tot = i n i n E i
10 Två algoritmer K-mean (icke hierarkisk, partionerande) Snabb: O(n) textjämförelser, n antal texter Agglomerativ klustring (hierarkisk) Långsam: O(n 2 ) textjämförelser Det finns många varianter av dessa båda. Jag beskriver dem enkelt och generellt.
11 K-mean Skapa k kluster med centroider (ta tex slumpmässigt k texter och låt dessa bilda var sitt kluster) Gå igenom alla texter och för varje text till det kluster den är mest lik Beräkna de nya centroiderna Upprepa 2 och 3 tills ett stoppkriterie uppfyllts
12 Agglomerativ klustring Låt alla texter bli ett eget kluster Beräkna likhet mellan alla kluster Slåihopdetvåmestlikaklustren Uppdatera likheterna mellan klustren Upprepa 3 och 4 tills ett stoppkriterie uppfyllts
13 Vilken av algoritmerna är bäst? Agglomerativ klustring har länge ansetts bättre än k-mean, men Steinbach et al visar med tester att k-mean är bättre för textklustring. De ger också en trolig förklaring: två texter kan ligga närmast varandra i representationsrummet utan att tillhöra samma klass. K-mean fångar globala tendenser medan agglomerativ klustring arbetar lokalt.
14 Feature reduction (Särdragsreduktion?) LSI Latent Semantic Indexing Reducera rummet till n dimensioner (mha SVD Singular Value Decomposition). Representera texterna i detta nya rum (global projektion). Tar lång tid. Trunkering spar bara de m viktigaste termerna i varje text (lokal projektion). Schütze et al visar med tester att trunkering ger lika bra resultat som LSI. Det räcker att trunkera centroiderna.
15 Svenska Stemming förbättrar klustringsresultat (entropi) med ungefär 10% i snitt (OBS uppskattning) Uppdelning av sammansatta ord förbättrar också resultatet.
16 Uppdelning av sammansatta ord Om man söker efter minister"vill man (kanske) även hitta försvarsminister". Bättre på engelska minister of defence". En sökning efter försvarsministerger goda resultat. Sämre på engelska träffar även enbart ministeröch defence". I klustring vill man att texter som handlar om liknande saker ska bli lika varandra.
17 Uppdelning av sammansatta ord (forts) Rättstavningsprogrammet STAVA ( viggo/stava/) delar upp sammansatta ord i ordled och kontrollerar dessa var för sig. Vissa ord som inte bör delas upp (ur ett "informationsperspektiv) delas upp: miss+förstånd, efter+gift, god+tar, rätt+visa, för+råda, till+dra, stor+slagen, upp+tagen Stopplista med ord som inte bör delas upp.
18 Uppdelning av sammansatta ord (forts) Vissa delord har väldigt liten betydelse: topp+form, upp+dela, ner+slagen, för+historia, till+fråga Stopplista för vissa ordled: miss, för, upp etc.
19 Uppdelning av sammansatta ord (forts) Hur ska orden och ordleden viktas?
20 Tidningsartikelspecifikt (ett sammansatt ord!) Tidningsartiklar har titlar och fetstil. Jag har försökt vikta ord som förekom i titel och fetstil högre. Det gav tyvärr ingen förbättring. Jag klustrade på bara titlarna. Det gav dåliga resultat.
21 Exempel KTH News Corpus Dagens Nyheter och Aftonbladet är indelade i kategorier (Inrikes, Sport, Kultur, Ekonomi etc)
22 Några referenser A Comparison of Document Clustering Techniques Michael Steinbach, George Karypis, Vipin Kumar Projections for Efficient Document Clustering Henrich Schütze, Craig Silverstein Scatter/Gather: A Cluster-based Approch to Browsing Large Document Collections Douglass R. Cutting, David R. Karger, Jan O. Pedersen, John W. Tukey Information Retrieval C.J. Van Rijsbergen Klustring av svenska tidningsartiklar (exjobb) Magnus Rosell
Klustring av svenska tidningsartiklar
Klustrig av sveska tidigsartiklar Magus Rosell rosell@ada.kth.se http://www.ada.kth.se/~rosell/ Klustrig Kategoriserig eller klassificerig att fra texter till p f rhad best mda kategori er Klustrig att
Läs merKategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring
Kategorisering och klustring Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Skillnaden mellan kategorisering och klustring? Kategori är förutbestämt av någon Kluster är
Läs merKlustring av svenska tidningsartiklar Clustering of swedish newspaper articles (Datalogi)
Klustring av svenska tidningsartiklar Clustering of swedish newspaper articles (Datalogi) Magnus Rosell Handledare: Viggo Kann Examinator: Stefan Arnborg 8 mars 2002 Sammanfattning En klustringsalgoritm
Läs merKlustring av svenska texter P E T E R J O H A N S S O N
Klustring av svenska texter P E T E R J O H A N S S O N Examensarbete Stockholm, Sverige 2006 Klustring av svenska texter P E T E R J O H A N S S O N Examensarbete i datalogi om 20 poäng vid Programmet
Läs merInnehåll. Informationssökning språkteknologiska hjälpmedel
Informationssökning språkteknologiska hjälpmedel Hercules Dalianis NADA-KTH Email: hercules@kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Hercules Dalianis sid 1 Innehåll Sökmotor Stemming,
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merBilverkstäder. Stemming. Tvetydigheter tas bort. Slå ihop till samma ord. Språkteknologiska stöd vid sökning och kategorisering
Språkteknologiska stöd vid sökning och kategorisering Hercules Dalianis NADA-KTH Email: hercules@nada.kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Hercules Dalianis sid 1 Språkteknologiska
Läs merDagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering
Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)
Läs merOmvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter
Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,
Läs merDimensionsreducerande vektorrumsmetoder för språkbehandling
Läskurs: Dimensionsreducerande vektorrumsmetoder för språkbehandling Magnus Rosell KTH Nada SE-100 44 Stockholm, Sweden rosell@nada.kth.se Jonas Sjöbergh KTH Nada SE-100 44 Stockholm, Sweden jsh@nada.kth.se
Läs mer(1/5) David Södermark (dv02sdd@cs.umu.se) Data Mining
(1/5) David Södermark (dv02sdd@cs.umu.se) Data Mining Data mining handlar om att med automatiska metoder få fram information ur stora datamassor. Det kan handla om att hitta relevant information i stora
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merAssociationsanalys och klustring
Johan Boye, CSC, KTH DD1371 Beslutstödssystem, VT2013 Associationsanalys och klustring 57. (Från tentamen augusti 2010) Byggvaruhuset Bygger vill ha mer information om sina kunders köpbeteenden och vill
Läs merEulercykel. Kinesiska brevbärarproblemet. Kinesiska brevbärarproblemet: Metod. Kinesiska brevbärarproblemet: Modell. Definition. Definition.
Eulercykel Definition En Eulercykel är en cykel som använder varje båge exakt en gång. Definition En nods valens är antalet bågar som ansluter till noden. Kinesiska brevbärarproblemet En brevbärartur är
Läs merPåverkar Dag 0 express däckförsäljningen?
Påverkar Dag 0 express däckförsäljningen? Utvärdering av hierarkiska klustringsmetoder med försäljningsdata & Enkätundersökning om efterfrågan på expressleverans Nadia Mena & Yun-ji Agnes Lee C-uppsats
Läs merAutomatisk tesauruskonstruktion med latent semantisk indexering
MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2005:40 ISSN 1404-0891 Automatisk tesauruskonstruktion med latent semantisk indexering
Läs merFöreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 7 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Fortsättning envägs-anova Scheffes test (kap 11.4) o Tvåvägs-ANOVA Korsade faktorer (kap 12.1, 12.3) Randomiserade blockförsök
Läs merSpråkteknologiska stöd. Förskolor. Stemming. Slå ihop till samma ord
Språkteknologiska stöd Språkteknologiska stöd Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Stemming, trunkering, frågeexpansion Långa frågor och frassökning Stavningsstöd
Läs merVariator Automatisk synonymvariering av text
Variator Automatisk synonymvariering av text Magnus Rosell 27 mars 2006 Sammanfattning Detta är en rapport om min individuella uppgift i kursen Språkgranskningsverktyg inom GSLT. Den beskriver ett litet
Läs merFöreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.
Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA5 Institutionen för teknik och naturvetenskap Linköpings universitet
Läs merConcept description genom klustring
MAGISTERUPPSATS (41-60 P) I INFORMATIK VID INSTITUTIONEN FÖR DATA OCH AFFÄRSVETENSKAP 2007:MI02 Concept description genom klustring Evy Rydin VT 2007 Svensk titel: Concept description genom klustring Engelsk
Läs merTrolldetektering. En undersökning i lämpligheten att använda ämnesmodellering och klustring förtrolldetektion. LILI DU ERIK SÖDERBERG
EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 Trolldetektering En undersökning i lämpligheten att använda ämnesmodellering och klustring förtrolldetektion. LILI DU ERIK SÖDERBERG
Läs merWEBBKLUSTRING SLUTRAPPORT
Arne Jönsson 2014-01-09 WEBBKLUSTRING SLUTRAPPORT 1. Inledning Inom projektet har vi utvecklat teknik som gör det möjligt att identifiera webbsidors innehåll och därefter klustra (gruppera) dem så att
Läs merInformation Retrieval. Information Retrieval (IR)
Information Retrieval Johan Boye, KTH Information Retrieval (IR) Att hitta relevantinformation i en stor mängd texter (och/eller bilder, audio, video, programkod, biomedicinsk data, ) Användaren ger en
Läs merEXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh
EXJOBBSOPPOSITION Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh Rapportens titel: Domän-Webb-Applikations-Fuzzer(DWAP) introduktion och implementation Opponent: Viktor Gummesson Var det
Läs merAutomatisk FAQ med Latent Semantisk Analys
Examensarbete Automatisk FAQ med Latent Semantisk Analys av Patrik Larsson LIU-IDA/KOGVET-A 09/014 SE Examensarbete Automatisk FAQ med Latent Semantisk Analys av Patrik Larsson LIU-IDA/KOGVET-A 09/014
Läs merRandom Indexing för vektorbaserad semantisk analys
Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merKan man lära datorer att läsa? NIKLAS LUNDBORG
Kan man lära datorer att läsa? NIKLAS LUNDBORG Examensarbete Stockholm, Sverige 2011 Kan man lära datorer att läsa? NIKLAS LUNDBORG Examensarbete i medieteknik om 15 högskolepoäng vid Programmet för medieteknik
Läs merE-biblioteket en tjänst från sjukhusbiblioteken
E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.
Läs merDatorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig.
Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 24 januari Datorlaboration 2 1 Inledning I denna laboration behandlas
Läs merProjektion av träningsdata på aktuell underrum av dim 1. Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.
Projektion av träningsdata på aktuell underrum av dim Föreläsning : Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA Institutionen för
Läs merRekommendationssystem. med fördjupning på collaborative filtering
Rekommendationssystem med fördjupning på collaborative filtering, majsc331 870325-1929 729G11 Artificiell Intelligens II Linköpings Universitet HT 2009 Innehållsförteckning Inledning... 1 Bakgrund...
Läs merRocchio, Ide, Okapi och BIM En komparativ studie av fyra metoder för relevance feedback
MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID INSTITUTIONEN BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2008:45 ISSN 1654-0247 Rocchio, Ide, Okapi och BIM En komparativ studie
Läs merVinjetter TDDC91 Datastrukturer och algoritmer
Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.
Läs merFöreläsning 4: Giriga algoritmer. Giriga algoritmer
Föreläsning 4: Giriga algoritmer Giriga algoritmer Denna typ av algoritmer arbetar efter följande princip: Gör i varje situation det som är lokalt optimalt, d.v.s. bäst för stunden. Några exempel vi redan
Läs mer7.5 Experiment with a single factor having more than two levels
Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att
Läs merSeminarium: Att skriva en akademisk uppsats. LT200X Stefan Stenbom
Seminarium: Att skriva en akademisk uppsats LT200X Stefan Stenbom Berätta om ditt exjobb! Vad skall du skriva om... Agenda Läsa och analysera kursens mål och kriterier. Svenska eller Engelska Rapportstruktur
Läs merDokumentrekommendationssystem och intranät
Dokumentrekommendationssystem och intranät Anders Gabrielsson anders@stp.ling.uu.se Examensarbete 20p Språkteknologiprogrammet Institutionen för lingvistik Uppsala universitet Handledare: Lars Borin och
Läs merMatematisk modellering fortsättningskurs Visuell variation
Matematisk modellering fortsättningskurs Visuell variation Johan Hedberg, Fredrik Svensson, Frida Hansson, Samare Jarf 12 maj 2011 1 1 Sammanfattning I denna rapport undersöker vi en modell för att beskriva
Läs merAtt söka information (med betoning på Internet)
Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning
Läs merObjektorienterad programmering Föreläsning 8. Copyright Mahmud Al Hakim Agenda (halvdag)
Objektorienterad programmering Föreläsning 8 Copyright Mahmud Al Hakim mahmud@webacademy.se www.webacademy.se Agenda (halvdag) Objektorienterad programutveckling Algoritmer Algoritmkonstruktionerna Relationer
Läs merTextsammanfattning av sökresultat
DEGREE PROJECT, IN COMPUTER SCIENCE, SECOND LEVEL STOCKHOLM, SWEDEN 2015 Textsammanfattning av sökresultat PONTUS PIAZZOLLA KTH ROYAL INSTITUTE OF TECHNOLOGY SCHOOL OF COMPUTER SCIENCE AND COMMUNICATION
Läs merDN/Ipsos: Valvinden samt väljarnas betyg på regeringen och alliansen
DN/Ipsos: Valvinden samt väljarnas betyg på regeringen och alliansen 3 april 20 Ipsos: David Ahlin, david.ahlin@ipsos.com 20 Ipsos Färre tror att Moderaterna kommer att leda nästa regering Tror du att
Läs merFEM ENKLA KNEP SOM HJÄLPER DIG SYNAS BÄTTRE PÅ GOOGLE
SÖKMOTOROPTIMERING FEM ENKLA KNEP SOM HJÄLPER DIG SYNAS BÄTTRE PÅ GOOGLE INLEDNING De flesta som har en webb-sida funderar då och då på hur de ska få sidan att komma så högt som möjligt i Google och andra
Läs merEn fråga som ibland dyker upp är den om illamående och kräkningar. Kan man med någon omvårdnadsintervention göra det lättare för patienten.
Sökexempel - EBM Sjuksköterskor En fråga som ibland dyker upp är den om illamående och kräkningar. Kan man med någon omvårdnadsintervention göra det lättare för patienten. Även om man bör börja med att
Läs merGenom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att:
Pedagogisk planering Engelska årskurs 8, vecka 45-49 Television Broadcast och oregelbundna verb Varför: Genom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla
Läs merEtt A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.
Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann
Läs merLösningsförslag till tentamen i SF1861 Optimeringslära för T. Torsdag 28 maj 2010 kl
Lösningsförslag till tentamen i SF86 Optimeringslära för T. Torsdag 28 maj 2 kl. 4. 9. Examinator: Per Enqvist, tel. 79 62 98. (a) Inför variablerna x = (x sr, x sm, x sp, x sa, x sd, x gr, x gm, x gp,
Läs mer1.6 Castiglianos 2:a Sats och Minsta Arbetets Princip
--8 FE för Ingenjörstillämpningar, SE rshen@kth.se.6 Castiglianos :a Sats och insta Arbetets rincip ilder ritade av Veronica Wåtz. Givet: k () L Sökt: Lösning: et står att ska beräknas med hjälp av energimetod
Läs merSpeciell användning av heltalsvariabler. Heltalsprogrammering. Antingen-eller-villkor: Exempel. Speciell användning av heltalsvariabler
Heltalsprogrammering Speciell användning av heltalsvariabler max z = då c j x j j= a ij x j b i j= x j 0 x j heltal i =,..., m j =,..., n j =,..., n ofta x j u j j =,..., n Oftast c, A, b heltal. Ibland
Läs merAsymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervarlsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merUppgift 1 - programmet, Uppg6.m, visade jag på föreläsning 1. Luftmotståndet på ett objekt som färdas genom luft ges av formeln
Matlab-föreläsning (4), 10 september, 015 Innehåll m-filer (script) - fortsättning från föreläsning 1 In- och utmatning Sekvenser, vektorer och matriser Upprepning med for-slingor (inledning) Matlab-script
Läs merTitel: Ett träningsbart verktyg för att klassificera nyhetstexter (A learnable tool for classifying news texts)
Examensarbete vid NADA, KTH Av Erik Herou Titel: Ett träningsbart verktyg för att klassificera nyhetstexter (A learnable tool for classifying news texts) Examensarbete inom datalogi Handledare: Anders
Läs merLinjära avbildningar. Definition 1 En avbildning mellan två vektorrum, F : V U, kallas linjär om. EX. Speglingar, rotationer, projektioner i R 3.
Linjära avbildningar Definition 1 En avbildning mellan två vektorrum, F : V U, kallas linjär om F (v +v ) = F (v)+f (v ) och F (cv) = cf (v) för alla v, v V och alla skalärer c. EX. Speglingar, rotationer,
Läs merPubMed gratis Medline på Internet 1946-
Klicka på 1. SÖK i E-biblioteket 2. Flik Databaser 3. PubMed PubMed gratis Medline på Internet 1946- www.ebiblioteket.vgregion.se Fritextsökning Skriv in de ord du vill söka på (AND läggs automatiskt in
Läs merCase-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011
Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka
Läs merhjälp av SAS Text Miner
Enterprise Intelligence Customer Intelligence Supplier Intelligence Organizational Intelligence Intelligence Architecture Identifiera stora gömda värden i textbaserad information med hjälp av SAS Text
Läs merKLUSTRING & PRESENTATION
KLUSTRING & PRESENTATION I TRANSPORTSEKTORN Examensarbete Systemarkitekturutbildningen Andreas Westberg Johan Dahlberg VT 2013:KSAI04 Systemarkitekturutbildningen är en kandidatutbildning med fokus på
Läs merBildbaskontoret. Bruksanvisning. Handitek. anpassar tekniken till människan BRUX\...\809082 BILDBASKONTORET
Bildbaskontoret Bruksanvisning Handitek BRUX\...\809082 BILDBASKONTORET anpassar tekniken till människan Innehållsförteckning Introduktion... 3 Datorkrav...3 Om bildbaser... 4 Vad är en bildbas?...4 Varför
Läs merLathund för studenter
Uppdaterad 2005-09-07 Lathund för studenter vid inläggning av uppsatser i Xerxes Xerxes: http://theses.lub.lu.se/undergrad/ INLÄGGNING AV UPPSATS I XERXES 1. Inloggning Gå in i Publicera i Xerxes i menyn
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs merNyhetsbevakning och Information Retrieval. Utvärdering av nyhetsbevakningssystem. Syfte med IR-system. Vilket system är bättre?
Utvärdering av nyhetsbevakningssystem Eriks Sneiders eriks@dsv.su.se 24-1-12 Nyhetsbevakning och Information Retrieval Applikationsnivå Nyhetsbevakning att hitta intressanta artiklar i flödet Tekniknivå
Läs merSnabbguide till Cinahl
Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin
Läs merFöreläsning 9 Exempel. Intervallhalveringsmetoden. Intervallhalveringsmetoden... Intervallhalveringsmetoden...
Föreläsning 9 Intervallhalveringsmetoden Intervallhalveringsmetoden Newton-Raphsons metod Mer om rekursion Tidskomplexitet Procedurabstraktion Representation Bra om ni läst följande avsnitt i AS: Procedures
Läs merStatistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Läs merUppsats i MDI En reflektion över designarbetet i tidigare inlämningsuppgift
Uppsats i MDI En reflektion över designarbetet i tidigare inlämningsuppgift Personlig uppsats i kursen Människa-datorinteraktion Magisterprogrammet MDI/ID 2003 11 03 Mattias Ludvigsson it3luma@ituniv.se
Läs merEn komparativ litteraturstudie av olika termkällor för query expansion
MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2005:80 ISSN 1404-0891 En komparativ litteraturstudie av olika termkällor för query
Läs merSF1624 Algebra och geometri
SF1624 Algebra och geometri Föreläsning 2 David Rydh Institutionen för matematik KTH 28 augusti 2018 Detta gjorde vi igår Punkter Vektorer och skalärer, multiplikation med skalär Linjärkombinationer, spannet
Läs merKan datorn lära sig ordkunskap automatiskt?
Kan datorn lära sig ordkunskap automatiskt? Arbetsseminarium 23/11-2004 Leif Grönqvist GSLT, MSI@VxU & ling@gu Vad? Hur? Varför? min avhandling skall handla om att få fram användbara semantiska vektormodeller
Läs merHI1024 Programmering, grundkurs TEN
HI1024 Programmering, grundkurs TEN2 2014-10-27 KTH STH Haninge 13.15-18.00 Tillåtna hjälpmedel: En A4 handskriven på ena sidan med egna anteckningar Kursboken C PROGRAMMING A Modern Approach K. N. King
Läs merAlgoritmer, datastrukturer och komplexitet
Algoritmer, datastrukturer och komplexitet Övning 7 Anton Grensjö grensjo@csc.kth.se 14 oktober 2015 Anton Grensjö ADK Övning 7 14 oktober 2015 1 / 28 Översikt Kursplanering Ö6: Algoritmkonstruktion F19:
Läs merFöreläsning 9 Exempel
Föreläsning 9 Exempel Intervallhalveringsmetoden DA2001 (Föreläsning 9) Datalogi 1 Hösten 2013 1 / 24 Föreläsning 9 Exempel Intervallhalveringsmetoden Newton-Raphsons metod DA2001 (Föreläsning 9) Datalogi
Läs merI en matchning ligger varje hörn i högst en kant. I en stig ligger varje hörn i högst två kanter.
26.2-9 Antag att rätt lösning är att dela upp V i V 1 och V 2 (V 1 V 2 =, V 1 V 2 = V ). Antal kanter vi måste skära är då det minsta snittet mellan v 1 och v 2, där v 1 är ett godtyckligt hörn i V 1 och
Läs merPassage Retrieval En studie av index
MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2005:36 ISSN 1404-0891 Passage Retrieval En studie av index LARS BJÖRKLUND LINDA BÄCKMAN
Läs merAntag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten.
OS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merRapportgranskning, Rapport 1
Rapportgranskning, Rapport 1 GPS systemet av Mohammad Abd Al karem et i rapporten var överlag bra. Man fick en övergripande bild av hur GPS är uppbyggt och fungerar, de delarna som togs upp kändes väsentliga.
Läs merKvalitativ Analys. Utvärderingsmetoder inom MDI DH2408
Kvalitativ Analys Utvärderingsmetoder inom MDI DH2408 Inlämningsuppgift 2 Era gruppinlämningar ligger här framme, leta reda på er egen!!! Jag har godtyckligt gett er ett gruppnummer, referera till det
Läs merFöreläsning 5: Grafer Del 1
2D1458, Problemlösning och programmering under press Föreläsning 5: Grafer Del 1 Datum: 2006-10-02 Skribent(er): Henrik Sjögren, Patrik Glas Föreläsare: Gunnar Kreitz Den här föreläsningen var den första
Läs merRegressions- och Tidsserieanalys - F8
Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23 Klassisk komponentuppdelning
Läs merBilaga 1: GPS-teknik, en liten ordlista
Bilaga 1: GPS-teknik, en liten ordlista SATELLITSYSTEM GPS Global Positioning System. Amerikanskt satellitbaserat navigationssystem uppbyggt av USA:s försvarsmakt. Systemet är globalt täckande och används
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merhttp://www.youtube.com/watch?v=jpenfwiqdx8
http://www.youtube.com/watch?v=jpenfwiqdx8 1 Sökmotoroptimering SEO En introduktion för webbredaktörer 2 Agenda Var är vi på väg? Hur fungerar sökmotorer? Hur går det till när jag söker? Hur hänger det
Läs merAnalys av nutidens tågindelning
Kandidatuppsats i Statistik Analys av nutidens tågindelning Ett uppdrag framtaget av Trafikverket Molinia Gabrielsson Viktoria Grek Avdelningen för Statistik och maskininlärning Institutionen för datavetenskap
Läs merDagens ämnen. Linjära ekvationssystem: Successiv elimination Vektorer Definitionen Grundläggande räkneoperationer Bas och koordinater Ortsvektorer
Dagens ämnen Linjära ekvationssystem: Successiv elimination Vektorer Definitionen Grundläggande räkneoperationer Bas och koordinater Ortsvektorer Linjära ekvationer Med en linjär ekvation i n variabler,
Läs merMULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla
Läs merLilla PubMed-lathunden
Lilla PubMed-lathunden Om databasen PubMed PubMed är en databas som produceras av National Center for Biotechnology Information (NCBI) vid National Library of Medicine (NLM) i USA. Det är den största databasen
Läs merDANTEK ELEVWEB HJÄLP. Dantek ElevWeb Hjälp. Version 1 Copyright 2016 by Dantek AB. Sidan 1
Dantek ElevWeb Hjälp Version 1 Copyright 2016 by Dantek AB Sidan 1 Innehåll Introduktion till Dantek ElevWeb 3 Att söka i Dantek ElevWeb 4 3 sätt att söka 5 Trunkering 5 Fritextsökning 6 Hjälp via stavningskontroll
Läs mer2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.
2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen
Läs merNätkurs Design & konstruktion av användargränssnitt 1MD113 Sid 1 (5) Lektion 11 Användare, uppgifter och krav del
Nätkurs Design & konstruktion av användargränssnitt 1MD113 Sid 1 (5) Del 3 Uppgiftsanalys Av Stefan Blomkvist Uppgiftsanalysen ska svara på frågor om vilka uppgifter användarna utför och hur dessa genomförs.
Läs merArbeta med Selected Works en lathund
Arbeta med Selected Works en lathund Att redigera din egen Selected Works-sida Ta fram din sida och logga in via My Account längts ner på sidan. Klicka på Edit My Site för att redigera sidan. Gå nu vidare
Läs merFinns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
Läs mer8.1 General factorial experiments
Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter.
Läs merDatalogi, grundkurs 1
Datalogi, grundkurs 1 Tentamen 9 dec 2014 Tillåtna hjälpmedel: Revised 6 Report on the Algorithmic Language Scheme och Tre olika s.k. Cheat Sheets för Scheme Sex olika s.k. Cheat Sheets för Python Tänk
Läs merAppendix A. Dubbelkonsmodellen en datorexekverbar designprincip för hjärnan
Appendix A Dubbelkonsmodellen en datorexekverbar designprincip för hjärnan Min hypotes är att hierarkier av Cortical Feature Maps (CFM:er) utgör grunden för människans kognitiva förmågor. Denna hypotes
Läs merKandidatexjobb vid Industriell Marknadsföring. Process, tidsplan och opponenter samt krav
Kandidatexjobb vid Industriell Marknadsföring Process, tidsplan och opponenter samt krav Dagens agenda Själva processen och vem gör vad när Förväntningar Krångliga passager i själva skrivandet IEI:s exjobbssida
Läs merHur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Läs merAsymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad för att man skall
Läs merevidensbaserad databas för sjukgymnaster
evidensbaserad databas för sjukgymnaster Direktadress: www.pedro.org.au. PEDro Physiotherapy Evidence Database innehåller referenser till randomiserade, kontrollerade försök, systematiska översikter och
Läs mer