en Databas för Tvärvetenskaplig

Relevanta dokument
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

Avtryck från WGLN-projekten i forskningen

b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)

Relationer, samordningar och retorik på Språkbanken. Swe-Clarin workshop 17 april 2015 Nina Tahmasebi

Ett unikt kulturflöde. Den svenska skönlitteraturens väg till Frankrike

KURSPLAN Engelska, hp, 30 högskolepoäng

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Litteracitet i en digital tid Vad är egentligen läsning idag?

2. Allmänna uppgifter 1. Huvudområde/n, om Litteratur Kultur Medier. 2. Ämne, om tillämpligt Engelska, franska, ryska och spanska med

Barn lär av barn. Flerspråkighet i fokus, Stockholms universitet, 4 april 2016 Ellinor Skaremyr

TEACHING AND LECTURING

7. Beslutsförslag: Fastställande av kursplaner för utbildning på forskarnivå

Artikelskrivandets konst, 7.5 hp

Att göra forskningsdata sökbara - från Europaprojekt till lokal implementering --- Sven Strömqvist & Nils Holmberg Lunds universitet

Mobiler och mobilappar som redskap för språkutveckling

översikt 1. informationsförädling är, typ: 2. Squirrelprototypen 3. möjligheter för framtiden [5] ICALL/2

Rönnström, Niclas (2006) Kommunikativ naturalism. HLS Förlag. Kapitel 7.

EN2D11, Engelska: Språkvetenskaplig teori och metod, 15,0 högskolepoäng English: Linguistic Theory and Method, 15.0 higher education credits

Studenters digitalisering av högre utbildning

Språkteknologi vt09. Diskursmodellering. Diskursmodell: exempel. Koherensrelationer. Koreferens. Att bestämma koherensrelationer

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

Kognition och kommunikation KOGP04

Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek

75% seminarium 26 februari 2018, LUX-huset LIC-FORSKARSKOLAN COMMUNICATE SCIENCE IN SCHOOL, CSIS

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Digitala resurser i undervisningen

Kursplan och läromedelsförteckning

BESLUT. Styrelsen för humaniora och teologi Arbetsutskottet

INSIKT nr 4 årgång vetlanda.pingst.se

Ontologier. Cassandra Svensson

Michal Drechsler Karlstad University SMEER Science Mathematics Engineering Education Research

TEORIER OCH SLIDES FRÅN WVD LUND 2015

Att använda den didaktiska modellen organiserande syften för att planera och analysera naturvetenskaplig undervisning

Falcon och QA- system generellt

På vilka sätt kan mönster vara en ingång till att utveckla förmågan att uttrycka och argumentera för generaliseringar algebraiskt?

SLAVISKA MEDELTIDSSTUDIER Masterexamen 120 hp

Vad säger forskningen om högskolepedagogik? Lars Geschwind

EN1B02, Engelska: Fortsättningskurs (B) del I, 15,0 högskolepoäng English: Intermediate Course for General Purposes, 15.0 higher education credits

KURSPLAN. Att studera pedagogiska miljöer med hjälp av sociokulturell teoribildning. Socio-cultural theory and the study of educational practices

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.

En snabbguide för att söka forskningsartiklar i utbildningsvetenskap

Validering av data för energimätning

Bilaga. Sammanställning av antal träffar för varje sökord i respektive databas. Databas Sökord Antal träffar

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

Visual studies at Åbo Akademi University

Introduktion till biblioteket och informationssökning Språk och litteraturer

Reserapport CIDOC konferens Kreta The provenance of knowledge

Fastställande av examensbenämningar och deras engelska översättningar för utbildningsprogram inom humaniora och teologi

Hyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2

Lufoss.org Scholarship Ceremony October 20th, 2016 LUND UNIVERSITY FUND FOR OPEN SOURCE SOFTWARE

Perception och Maskininärning i Interaktiva Autonoma System. Michael Felsberg Institutionen för systemteknik Linköpings universitet

So ka artiklar och annan litteratur

Marie Gustafsson. Böcker. LIBRIS innehåller ca 6 miljoner titlar från svenska universitets- och högskolebibliotek

Rapportskrivning Användarcentrerad Design. Anders Lindgren

Kursplan. FÖ3032 Redovisning och styrning av internationellt verksamma företag. 15 högskolepoäng, Avancerad nivå 1

Huvudområden och specialiseringar på grundnivå och avancerad nivå (svenska och engelska benämningar)

Translation Changes in Swedish EBSCOhost Interface

Från aspekt till övergripande en nätbaserad lista över svenskt akademiskt ordförråd

Deltagarbaserad forskning, 7.5 högskolepoäng

Kurser inom Datavetenskapligt kandidatprogram och Computer Science Master s programme våren 2010

Not everything that counts can be counted, and not everything that can be counted counts. William Bruce Cameron

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Designmönster som dokumentation och utveckling av IKT i undervisningen

Formellt och informellt lärande på nätet

EN1B01, Engelska: Fortsättningskurs, 30,0 högskolepoäng English: Intermediate Course for General Purposes, 30.0 higher education credits

NEKB21 Mikroekonomisk analys, 7,5hp

HUMANISTISKA FAKULTETSNÄMNDEN

Pedagogik AV, Nätbaserat lärande, 7,5 hp

Utbildningsplan för Internationellt masterprogram i informationsteknologi och lärande, S2ITL, 120 högskolepoäng

Verksamhetsutveckling med pedagogiska förtecken

Kickstart Digitalisering. Johanneberg Science Park Anett /Teknikföretagen

Reflections from the perspective of Head of Research Skåne University Hospital. Professor Ingemar Petersson. Stab forskning och utbildning SUS

GRAFISKA RIKTLINJER 1

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Att skriva uppsats. Magnus Nilsson Karlstad universitet

Att få pengar till stora infrastrukturer:

Sfi i tiden. Maria Rydell, lektor i svenska som andraspråk Språkrådets dag 26 april 2019

Genusstudier i Sverige

Informationssökning - att söka och finna vetenskapliga publikationer Linköpings Universitetsbibliotek

Pedagogik för digitaliserad undervisning

ATPB22 Kreativa aktiviteter och pedagogiska strategier

INTERAKTION OCH DESIGN

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Konventionaliserade fraser i en akademisk ordlista

Mis/trusting Open Access JUTTA

Introduktion programmering

På väg insikter under en tågresa TISDAG I RYDBERG,

Genusmedveten och hållbar kompetensförsörjning vid LTU Paula Wennberg, Luleå

Lathund till ASSIA. Ämnesord. Skillnaden mellan fritextsökning och ämnesordssökning. Basic Search, fritextsökning

Ämnesområden. Examensarbete inom datavetenskap (1DV41E) Martin Fredriksson

Undervisningsprogram Uppdaterad DATAVETENSKAP

HUMANISTISKA FAKULTETSNÄMNDEN. Grundnivå/First Cycle

Institutionen för individ och samhälle Kurskod ENB301. Fastställandedatum Utbildningsnivå Grundnivå Reviderad senast

End consumers. Wood energy and Cleantech. Infrastructure district heating. Boilers. Infrastructu re fuel. Fuel production

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

New Media, Instruction and Learning. Ett forskningstema i CUL forskarskolan

Utvärdering. Övergripande (1) Med/utan användare. Övergripande (2) Fredag 1 oktober F1. Ann Lantz - Anna Swartling -

Instruktioner och motivation för grupparbeten

Hur får jag ut kraft och nytta av POWER?

Transkript:

Svensk Prosafiktion o 1800 1900: en Databas för Tvärvetenskaplig Metodutveckling Stina Otterberg stina.otterberg@lir.gu.se Dimitrios Kokkinakis dimitrios.kokkinakis@svenska.gu.se

Översikt Motivation: ökade volymer av digitaliserade litterära textsamlingar (t.ex. Spf); växande behov av datorstöd för analys Inspiration: distant reading" eller "macro analysis" (Moretti, 2005) jmf. close reading Redskap: språkteknologiska metoder samt visual analytics -experiment; t.ex. vad kan namn avslöja om huvudpersonernas liv? kan man lättare följa deras interaktioner? Fokus: namnentiteter, t.ex. personentiteter, genusbestämning, sociala nätverk, profilgenerering, semantiska relationer, normalizering, länkning Mål: ny uppsättning verktyg för litteraturanalys användbara och nyanserade insikter och kunskap för litteraturvetaren

Inspiration [ ] Franco Moretti. 2005. Graphs, Maps, Trees. Abstract Models for Literary Theory. Verso Pbl.

Fokus: Namnentiteter i vid bemärkelse Finkorniga namnkategorier: t.ex. personnamn (för-, efternamn), människosgrupper ( mammor ), mytologiska namn/teonymer ( Frälsaren ) och djur/husdjursnamn animathet (appelativer) Tilldelning av semantiskt /referentiellt genus (heuristiska regler; genustilldelade förnamnslistor; genusbärande morfologisk information (ordändelser; gamle ); förvaltnings-, heders-, akademiska-, hovtitlar, yrkesbeteckningar ( professorska ), nationalitet ( tysken ) m.m. Uppmärknigskonsistens labeling consistency

Namnlänkning Samma namn kan anges på olika sätt, att bara hitta alla namn är otillräckligt för många tillämpningar länkning av olika varianter till sin referent kan vara nödvändig Förenklad form av koreferens(kedjor)

Resultat sociala nätverk, samförekomst av personnamn på meningsnivå i Eros begravning, HB., 1922 arbeten tillsammans med Daniela Oelke

Resultat arbeten tillsammans med Daniela Oelke summary plot (1 kapitel=1 kolumn; färg=frekvens i kapitel): Kerrmans i paradiset, HB.,1927

Resultat Eros' begravning : röda pixlar: Olga Willman-Janselius; gröna pixlar: resten av namnen) arbeten tillsammans med Daniela Oelke

Resultat Kerrmans i paradiset Amourer arbeten tillsammans med Daniela Oelke fingerprinting: 13 noveller av H. Bergman, 1883-1931; varje pixel motsvarar ett ord, men alla ord som varken är personer eller teistiska referenser har uteslutits - fokus läggs på den ordning i vilken personentiteter nämns i texten

Pågående arbete Med utgångspunkt kvantifierbara data som t.ex. namn kan vi exploatera och analysera litterära textsamlingar på nya sätt Inte bara samförekomst, utan hitta semantiska relationer, t.ex. personrelationer (fi (friendof, employerof, childof, ). Mer semantisk- baserade sociala nätverk t.ex. vem pratar med vem sentiment och polaritet på åsikter? Koreferens oeee soch anaforlösning a (i första hand personliga pronomen) Fullständig profilutvinning för alla huvudpersoner

Referenser Borin L., Kokkinakis D. and Olsson L-J. (2007). Naming the past: Named entity and animacy recognition in 19th century Swedish literature. Proc. of the Language Tech. for Cultural Heritage Data (LaTeCH). An ACL Workshop: pp. 1-8. Prague. Borin L. and Kokkinakis D. (2010). Literary Onomastics and Language Technology. In Literary Education and Digital Learning. Methods and Technologies for Humanities Studies. van Peer W., Zyngier S. and Viana V. (eds). Pp. 53-78. IGI Global. Kokkinakis D. and Malm M. (2011). Character Profiling in 19th Century Fiction. Proc. of the Language Technologies for Digital Humanities and Cultural Heritage in conjunction with the Recent Advances in Natural Language Processing. An RANLP Workshop: pp. 70-77. Hissar, Bulgaria. Oelke D., Kokkinakis D. and Malm M. (2012). Advanced Visual Analytics Methods for Literature Analysis. Proc. of the Language Tech. for Cultural Heritage, Social Sciences, and Humanities (LaTeCH). An EACL 2012 workshop. Avignon, France. Kokkinakis D. and Oelke D. (2012). Men, Women and Gods: Distant Reading in Literary Collections - Combining Visual Analytics with Language Technology. Proc. of the Advances in Visual Methods for Linguistics (AVML). University of York, UK.

Culturomics: Quantitative Analysis of Culture Using Millions of Digitized Books. Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman Aiden. Science 331 (2011). <http://www.youtube.com/watch?v=injdllbk0zs>