textanalys på stor skala

Relevanta dokument
INSIKT nr 4 årgång vetlanda.pingst.se

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

Föreläsningsserie: Introduktion till språk- och litteraturvetenskap

Data mining. Data mining Skillnaden mellan observationella och experimentella data

Syfte med undervisningen Genom undervisningen i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att:

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Chapter 1 : Who do you think you are?

Hur man kan tillämpa Data Science och AI i säkerhetsarbetet. Magnus Sahlgren

Engelska åk 5 höstterminen 2013

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen)

Textforskningen och dess metoder idag

Lokal examensbeskrivning

Molnet som skapats för ditt företag.

Språkkonsultprogrammet

FTEA12:4 Vetenskapsteori. Realism och anti-realism

Vetenskaplig metodik

SPRÅKKONSULTPROGRAMMET

Matris för engelska, åk 7-9

30-40 år år år. > 60 år år år. > 15 år

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen)

Utbildningsplan för masterprogrammet Språk och språkvetenskap

Inbjudan. Framtidens rättsinformation

SPRÅKTEKNOLOGIPROGRAMMET

STÖDMATERIAL Kunskaper som understiger vitsordet åtta

Workplan Food. Spring term 2016 Year 7. Name:

Hemskrivning (HEM1) Kinakunskap DS1390, DS

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

Semantik och Pragmatik

Den industriella revolutionen

TRANSAKTIONSTRANSPARENS, INFORMATIONSBALANS OCH KÄLLKRITIK SOM MOTVERKAR KUNSKAPSNIHILISM

Kom fram, Bella! VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR LGRS 11 CENTRALT INNEHÅLL SOM TRÄNAS

Samtliga studieperioder är obligatoriska för dem som studerar journalistik som huvudämne.

Målet med undervisningen är att eleverna ska ges förutsättningar att:

Övningshäfte 1: Logik och matematikens språk

OFFENTLIG INFORMATION. A government of the people, by the people, for the people - ABRAHAM LINCOLN

Sammanfattning av modulen modeller och representationer Hur går jag vidare?

Fastställa mål. Daniel Bosk. goals.tex :33:45Z danbos

Material från

Utbildningsplan för Matematiska vetenskaper, masterprogram (N2MAT), 120 hp

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Genom undervisning i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att:

Better storytelling through better insight. Jonna Ekman, Marketing Manager

Andelen personal som har en utbildning på forskarnivå fortsätter att öka

Verksamhetsberättelse och verksamhetsplan för Statistikerprogrammet,

Svenska dialektkartor på sekunden

Skolplattformens pedagogiska verktyg och startsida en guide

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

Höstmöte Nordiska museet och Tekniska museet november 2015

Resa Allmänt. Allmänt - Grundläggande. Allmänt - Konversation. Fråga om hjälp. Fråga om en person talar engelska

Välkommen till Workshop Forskning och utveckling för den moderna digitala handeln

NATURVETENSKAPLIG SPETS INOM FÖRSÖKSVERKSAMHET MED RIKSREKRYTERANDE GYMNASIAL SPETSUTBILDNING

Välkommen till en kollegial workshop. Tillsammans gör vi en pedagogisk planering

FREDAG FORSKAR. Kom och träffa forskare på INFORMATION OM & ANMÄLAN TILL Science Center. VAL & ANMÄLAN senast 24 september

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

Bedömningsmall med riktlinjer för kvalitetskriterier för bedömning av examensarbete master+civilingenjör

Del 3: Mer om mästerskap

Utbildningsplan för Matematiska vetenskaper, masterprogram (N2MAT), 120 hp

Automatiserad journalgranskning för ökad patientsäkerhet

1. Skollagen 2. Läroplanen Lpo 94 / Lpf Grundskole- / Gymnasieförordningen

Kommunikationsstrategi

JämKAS Plus. Trappsteg 5 6. Jäm Stöd

10 lektioner i ledarskap är i första hand skriven till dig som. är chef och som i hög grad dvs 70-80% av din tid, ägnar dig åt

VERKTYGSLÅDA TILL FÖRESTÄLLNINGEN

En medicinsk söktjänst. Lathund. En lathund framställd av

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek

Avkastning på högre utbildning bland examinerade vid Stockholms lärosäten

KONGLIGA KEMISEKTIONEN KTH. Produktportfölj. Kemisektionensnäringslivsutskott KNUT

Tips från forskaren Semester

2D vs 3D? Nya gränssnitt för processindustrins kontrollrum En pilotstudie

Datum: Torsdag den 28 januari Ledamöter: Studierektor, forskning, adjungerad. Sekreterare. Ordförande. Justeringsperson

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II

Idag. Databaskvalitet(??) Databaskvalitet... Databaskvalitet...

6. Att få mer gjort under en dag - Time Management

Utbildningsplan för masterprogrammet Språk och språkvetenskap (2018)

Textens mening och makt : metodbok i samhällsvetenskaplig text- och diskursa PDF ladda ner

Karin Zingmark +46 (0)

Resa Allmänt. Allmänt - Grundläggande. Allmänt - Konversation. Fråga om hjälp. Fråga om en person talar engelska

Resa Allmänt. Allmänt - Grundläggande. Allmänt - Konversation. Fråga om hjälp. Fråga om en person talar engelska

Broskolans röda tråd i Svenska

Random Indexing för vektorbaserad semantisk analys

Val av form Vår affärsplan ska vara 30x30 i måtten och se ut som vår servett.

KVANTITATIV FORSKNING

MER FÖRÄNDRING NÄSTA 20 ÅR ÄN GENOM HELA VÅR HISTORIA

Programmet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska,

NYA FUNKTIONER I METADATAVERKTYGET RUT

Webbregistrering pa kurs och termin

Kvalitativ metodik. Varför. Vad är det? Vad är det? Varför och när använda? Hur gör man? För- och nackdelar?

HUMANISTISK OCH SAMHÄLLSVETENSKAPLIG SPECIALISERING

SVEK11, Svenska: Språklig inriktning - kandidatkurs, 30 högskolepoäng Swedish Language: Level 3 - B. A. Course, 30 credits Grundnivå / First Cycle

Hur säljer man en onumrerad biljett?

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

Essä introduktion till hur man skriver en akademisk essä

HAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Vetenskaplig metod och statistik

Lärande lek i förskoleklass så möjliggörs ett meningsfullt lärande

Kursens syfte. En introduktion till uppsatsskrivande och forskningsmetodik. Metodkurs. Egen uppsats. Seminariebehandling

Transkript:

textanalys på stor skala jussi karlgren Gavagai och KTH april 2017

Jussi Karlgren distributionell semantik på realistisk skala

Jussi Karlgren distributionell semantik på realistisk skala stilistik och genre i text och konversation

Jussi Karlgren distributionell semantik på realistisk skala stilistik och genre i text och konversation mest på textanalysföretaget Gavagai

Jussi Karlgren distributionell semantik på realistisk skala stilistik och genre i text och konversation mest på textanalysföretaget Gavagai och en hel del som adjungerad professor i språkteknologi på KTH

Jussi Karlgren distributionell semantik på realistisk skala stilistik och genre i text och konversation mest på textanalysföretaget Gavagai och en hel del som adjungerad professor i språkteknologi på KTH examen från dessa salar

Gavagai analyserar stora mängder strömmande text på massa språk

Gavagai analyserar stora mängder strömmande text på massa språk bygger på distributionell semantik

Gavagai analyserar stora mängder strömmande text på massa språk bygger på distributionell semantik grundat 2008

Gavagai analyserar stora mängder strömmande text på massa språk bygger på distributionell semantik grundat 2008 av två lingvister härifrån och tre datavetarkollegor till dem

Distributionell semantik distributionella modeller bygger på (sam)förekomststatistik...

Distributionell semantik distributionella modeller bygger på (sam)förekomststatistik...... av observerbara språkliga företeelser...

Distributionell semantik distributionella modeller bygger på (sam)förekomststatistik...... av observerbara språkliga företeelser...... med hänsyn tagen till kontext.

Distributionell semantik distributionella modeller bygger på (sam)förekomststatistik...... av observerbara språkliga företeelser...... med hänsyn tagen till kontext. (det är många frågor de där begreppen väcker, eller hur?)

termer med liknande distributionella egenskaper har liknande betydelse ''den distributionella hypotesen''

termer med liknande distributionella egenskaper har liknande betydelse ''den distributionella hypotesen'' (fler frågor väcks förstås här, eller hur?)

the weather is great in barcelona the weather is hot in brownsville the weather is gray in stockholm the climate is passable in nice the weather is chilly in helsinki the weather is nippy in moscow the weather is nice in hong kong the weather in syktyvkar is balmy the climate is chilly at the office the tea is hot i drink tea a hot meal will make you feel better enjoy your hot beverages

hur ser då språkliga data ut?

statistisk observation: stor volym data; massa massa särdrag; gles samförekomstmatris

statistisk observation: stor volym data; massa massa särdrag; gles samförekomstmatris men vi vet bättre

lexicon.gavagai.se

geopolitiska kartor och säkerhetstillämpningar

geopolitiska kartor och säkerhetstillämpningar finansiella tillämpninar

geopolitiska kartor och säkerhetstillämpningar finansiella tillämpninar hatspråksvarnare kulturskillnader!

geopolitiska kartor och säkerhetstillämpningar finansiella tillämpninar hatspråksvarnare jag-barometern kulturskillnader!

geopolitiska kartor och säkerhetstillämpningar finansiella tillämpninar hatspråksvarnare jag-barometern kulturskillnader! inga insikter utan analytiker!

''data mining''? datorminne är billigt och hyrbart

''data mining''? datorminne är billigt och hyrbart systemen är uppkopplade

''data mining''? datorminne är billigt och hyrbart systemen är uppkopplade sakernas internet

''data mining''? datorminne är billigt och hyrbart systemen är uppkopplade sakernas internet nya (gamla!) datamängder blir inlästa och uppkopplade

''data mining''? datorminne är billigt och hyrbart systemen är uppkopplade sakernas internet nya (gamla!) datamängder blir inlästa och uppkopplade encyklopediska data blir inlänkade

''data mining''? datorminne är billigt och hyrbart systemen är uppkopplade sakernas internet nya (gamla!) datamängder blir inlästa och uppkopplade encyklopediska data blir inlänkade allt möjligt loggas

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer befolkningsstatistik

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer befolkningsstatistik tidslinjer av massa olika slag

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer befolkningsstatistik tidslinjer av massa olika slag texter

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer befolkningsstatistik tidslinjer av massa olika slag texter språk är den mest rimliga abstraktionsnivåhanteraren om människor ska fundera på data --- vem ska jobba med den språkliga representationen?

kunskap dyker nu upp på alla möjliga abstraktionsnivåer! sensormätvärden såsom temperaturer befolkningsstatistik tidslinjer av massa olika slag texter språk är den mest rimliga abstraktionsnivåhanteraren om människor ska fundera på data --- vem ska jobba med den språkliga representationen? (helt oväldigt påstående)

vad är semantik?

vad är semantik? semantik kopplar kunskapsrepresentationer till varandra

vad är semantik? semantik kopplar kunskapsrepresentationer till varandra en representation, t ex observationer

vad är semantik? semantik kopplar kunskapsrepresentationer till varandra en representation, t ex observationer en annan (användbar) representation

vad är semantik? semantik kopplar kunskapsrepresentationer till varandra en representation, t ex observationer en annan (användbar) representation relationer mellan dem

vad är semantik? semantik kopplar kunskapsrepresentationer till varandra en representation, t ex observationer en annan (användbar) representation relationer mellan dem det här är ungefär det som data mining handlar om

dags för venndiagram!

dags för venndiagram! insikter verktyg metoder

dags för venndiagram! insikter verktyg metoder äsch

humaniora studerar numera (ganska) stora och (snabbt) växande datamängder

humaniora studerar numera (ganska) stora och (snabbt) växande datamängder de verktyg som finns kan skräddarsys för behov, men bara på beställning

humaniora studerar numera (ganska) stora och (snabbt) växande datamängder de verktyg som finns kan skräddarsys för behov, men bara på beställning någon måste göra beställningen

ilsken fråga: var är humanisterna?

att ta med hem:

att ta med hem: insikter kräver analys

att ta med hem: insikter kräver analys analys kräver kunskapsrepresentation

att ta med hem: insikter kräver analys analys kräver kunskapsrepresentation kunskapsrepresentationsbygge kräver hypoteser och kunskap om det som behandlas

att ta med hem: insikter kräver analys analys kräver kunskapsrepresentation kunskapsrepresentationsbygge kräver hypoteser och kunskap om det som behandlas vem ska formulera hypoteserna?

att ta med hem: insikter kräver analys analys kräver kunskapsrepresentation kunskapsrepresentationsbygge kräver hypoteser och kunskap om det som behandlas vem ska formulera hypoteserna? identifiera och förädla hantverkskunnandet! (hos forskare, hos analytiker såväl som hos verktygskonstruktörer; inget av detta är trivialt, inget av detta är magi.)