Den svenska bloggosfären i ett ögonkast Slutrapport

Relevanta dokument
Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

Arbeta med Selected Works en lathund

Visualisering av samverkan

WEBBKLUSTRING SLUTRAPPORT

Utveckla kursämnen och kursämnesbeskrivningar

Anvisningar för ansökan

SKAPA EN LÄNK TILL EN ANNAN ARTIKEL

Samtidig utvärdering av form- & lägekrav

Kontaktperson Datum Beteckning Sida Torsten Sjögren P (8) SP Bygg & Mekanik Torsten.Sjogren@sp.se

Slutrapport. Innovativt utbildnings- och forskningsmaterial användning av 3D visualisering och animering för att bemöta pedagogiska utmaningar

Slutprojekt 2010 Medieinstitutet. Förstudie Hur Icakuriren ska utveckla sin närvaro i sociala medier för att marknadsföra sig på webben

Söka, värdera, referera

Analys av kvalitativ data Kvalitativ innehållsanalys som ett exempel. Introduktion Bakgrund Syfte Metod Resultat Diskussion Slutsats

Källuppgifter i fysik FAFA55

TAOP61/TEN 1 OPTIMERING AV REALISTISKA SAMMANSATTA SYSTEM

1. Abstrakt Introduktion Problemspecificering Vår teknik Designval Abstract Colour Visualization

Hitta en vetenskaplig artikel i CINAHL på mdh.se

IT-körkort för språklärare. Modul 2: Blogg

TDDD92 Artificiell intelligens -- projekt

Utlysning ALF-projektmedel

SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer

(1/5) David Södermark Data Mining

Arbetsmodell KUST Kurser Under ST. Ragnhild Mogren, Pedagogisk utvecklare

Funktioner: Starta och spara Notebook. Använda penna och finger. Använda bilder från Galleriet.

Introduktion. Byggstenar TDBA

Nätkurs Design & konstruktion av användargränssnitt 1MD113 Sid 1 (5) Lektion 11 Användare, uppgifter och krav del

Kaj Gustafsson Utredare, utvecklare & följeforskare Följeforskning i anslutning till IPS-projektet i Hudiksvall

Bilden och berättelsen

IQ RAPPORT 2014:3 ALKOHOL I BLOGGAR. Bilden av alkohol i bloggosfären

TAOP86/TEN 1 KOMBINATORISK OPTIMERING MED

Projekt 2009 Kontroll av HACCP-arbetet i detaljhandelsledet. Miljö- och hälsoskydd

INSTITUTIONEN FÖR SOCIOLOGI OCH ARBETSVETENSKAP

Tranås kommun Medarbetarundersökning 2015

Artiklar via UB:s sö ktja nst

Populärt på internet. 56 Kampanjguide

TAOP61/TEN 1 OPTIMERING AV REALISTISKA SAMMANSATTA SYSTEM. Tentamensinstruktioner. När Du löser uppgifterna

Retrospektiva studier av perfluoralkylsulfonsyror i den svenska miljön Andra och avslutande året av screeningundersökningen.

BLOGGING I SOCIALA MEDIER

TILLVÄXTPROGRAM FYRBODAL HANDLEDNING/DISKUSSIONSUNDERLAG

Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen

Grafer. 1 Grafer. Grunder i matematik och logik (2015) 1.1 Oriktade grafer. Marco Kuhlmann

Arbetsdokument: Skriv ett kommunikationskontrakt

E-biblioteket en tjänst från sjukhusbiblioteken

Inspektion Användarmanuel

Nominering - Årets Leader Med checklista

Tentamen: Programutveckling ht 2015

Shakey s värld med HTNplanering

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar

Alkoholkonsumtionen i Sverige Håkan Leifman & Björn Trolldal

Vetenskapligt skrivande

Vetenskapliga affischer

AI-Tekniker. För domänspecifika problemområden i StarCraft 2. Mattias Tiger Fredrik Präntare

Att skriva akademisk text. referatteknik. Studieverkstaden Campus Helsingborg (E204b) Lunds universitet Ulla Urde

Handläggningsordning för prövning och erkännande av högskolepedagogiska meriter Fastställd av Rektor Dnr L 2014/85

Sammanfattning. Max vikt: 800 kg. Hytten skall vara dämpad. 360 synfält. Det skall vara möjligt att värma och kyla mat.

36 poäng. Lägsta poäng för Godkänd 70 % av totalpoängen vilket motsvarar 25 poäng. Varje fråga är värd 2 poäng inga halva poäng delas ut.

Lathund. Skriva artiklar på

Tentamensinstruktioner. När Du löser uppgifterna

Grafer, allmänt. Med datastrukturen graf menas vanligen: en mängd av noder (vertices) och en mängd av bågar (edges).

Version: Datum: DynaMaster 5 Golf Övergripande manual

FORMALIA EXAMENSARBETE

Marcus Angelin, Vetenskapens Hus, Jakob Gyllenpalm och Per-Olof Wickman, Stockholms universitet

Thomas Mejtoft Teknikutveckling i ett affärsmässigt perspektiv, 15hp

Informationsarkitektur - att planera en webbplats

Vetenskaplig metodik 4,5 högskolepoäng

UML 1(5) Introduktion till Unified Modeling Language. 1 Bakgrund och historik

Åtgärdswebben för miljömål

Sö ka litteratur i ERIC

Kartläggning av dikade skogbevuxna torvmarker

Åtgärdswebben för miljömål

EN GUIDE AV. 10 frågor du som arbetsgivare bör ställa under medarbetarsamtalet

Slutrapport. Spridning av modell Halland till andra delar av Sverige

Tjänstefördelning 2.0. Användarhandledning. (Utkast)

Rapportskrivning. Innehållsförteckning, källhänvisning, referenssystem, sidnumrering

Steg 3. Grupp F

Introduktion till föreningsmedlemmar

Utveckling av ett grafiskt användargränssnitt

Administratörer Det finns tre typer administratörer i Websurvey:

Kataloghantering i Ariba kompletterande information om Partial Items & Parametric Data

INSTITUTIONEN FÖR SOCIOLOGI OCH ARBETSVETENSKAP

Copyright 2008 Pausit AB medföljer programvaran pausit. Pausit version 1.2 Användarmanual

Mål och programområden

Alkoholkonsumtionen i Sverige 2017

TDDC76 - Programmering och Datastrukturer

Tillsättande av Klimatråd för Jönköpings län

Tentamen Datastrukturer (DAT036)

Så här funkar Föreningsliv

TEMA ERBJUDANDET EN DEL AV:

TDP004. Minne och pekare. Eric Elfving Institutionen för datavetenskap

Neurovetenskap 30/08/2013. Kognitiv neurovetenskap. Lober. Olika färg, olika vävnadsstruktur. Hjärnbarken

Packet Aggregation in Linux

Kommunikationsplan Nätverket för strategisk folkhälsoarbete i Gävleborg (NSFG)

En introduktion till Community i Mediakatalogen

Beräkning av vågklimatet utanför Trelleborgs hamn II

Samverkan och samhällspåverkan

Kvalitetsrapport hemtja nst

Alkoholkonsumtionen i Sverige 2018

Mikrobiologins tekniksprång Dr. Erik Nygren SP Food and Bioscience

Professor och forskningschef bodahlbom.se

Slutrapport: Kristoffers och Zulkiflys praktik hos Med rätt att handla

Transkript:

Den svenska bloggosfären i ett ögonkast Slutrapport Olof Görnerup olofg@sics.se 1 Introduktion I följande rapport sammanfattar jag vad som har gjorts i projektet, gör en utvärdering av hur projektet har uppnått sitt syfte, samt diskuterar möjliga framtida riktningar. Jag väljer att utelämna mer tekniska detaljer av projektet här (dessa presenteras i delrapporterna). 2 Vad som har gjorts Under projektets gång har jag formulerat, implementerat och testat en metod för att visualisera den svenska bloggosfären. Bloggosfären representeras av ett nätverk där bloggar utgör noder, och där två noder är sammanlänkade om de har en viss grad av likhet. Denna grad av likhet har kvantifieras som graden av överlapp av förekommande ord [1]. Bloggar som använder många liknande ord antas alltså ha en högre grad av likhet än bloggar med mer begränsade ordöverlapp. Jag har använt bloggdata från perioden mars-juli 2009, vilken har erhållits från bloggsökmotorn Twingly 1. Fig. 1 visar resulterande nätverk med olika tröskelvärden för graden av blogglikhet (jag visar alltså bara bloggar som har likhet över ett visst värde). En klustringsmetod [2] har använts för att automatiskt gruppera bloggar i kategorier. Ett exempel på resultatet av metoden visas i Fig. 2, där kategorier gällande matlagning, öl, vin, politik, handarbete etc hittas. Bloggklustren är hierarkisk ordnade eftersom kluster i sin tur formar kluster av kluster. Jag har även använt en metod [3] för att automatiskt hitta hi- 1 http://www.twingly.com/ 1

erarkisk klusterstruktur. Fig. 3 exemplifierar hur ett kluster om Mat och dryck är organiserat i delkluster. 3 Utvärdering Jag är nöjd med hur projektet har utfallit. Huvudsyftet var att undersöka möjligheten att på ett överskådligt sätt visualisera den svenska bloggosfären, vilket jag tycker har uppnåtts. Erfarenhetsmässigt har projektet även varit mycket givande eftersom det har möjliggjort för mig att applicera metodiker och tekniker i ett helt nytt sammanhang. 4 Möjliga framtida riktningar I det här projektet har jag enbart tagit fram en ögonblicksbild av bloggosfären. Det skulle även vara intressant att titta på mer dynamiska aspekter. Hur förändras och utvecklas bloggosfären över tiden? Det skulle inte bara vara visuellt intressant, utan även möjliggöra studier i bloggdynamik, t ex gällande influens och informations-spridning i bloggosfären. En annan intressant riktning - vilken jag bara har berört kort i en av delrapporterna - är att undersöka möjligheten att applicera teknikerna i det här projektet för att detektera spam. 5 Resultatspridning Vi skriver för närvarande en artikel som kommer skickas till en vetenskaplig tidskrift..se informeras om artikeln blir publicerad. Givetvis anges.se som finansiär. Referenser [1] Amos Tversky. Features of similarity. In Psychological Review, volume 84, pages 327 352, 1977. [2] Aaron Clauset. Finding local community structure in networks. Physical Review E, 72:026132, 2005. [3] A. Clauset, C. Moore, and M. E. J. Newman. Hierarchical structure and the prediction of missing links in networks. Nature, 453:98 101, 2008. 2

(a) (b) (c) (d) Figur 1: Visualisering av den svenska bloggosfo ren, da r bloggar med likhet γ visas. (a) γ = 0.04. (b) γ = 0.045. (c) γ = 0.055. (d) γ = 0.07. 3

Hantverk Mat Drycker Politik Spel och dobbel Scrapbooking Resor Figur 2: Färgkodade automatiskt framtagna kategorier av bloggar (γ = 0.05). Några exempel är markerade med text. 4

www.metrobloggen.se/jsp/public/index.jsp?article=19.8410440 www.metrobloggen.se/jsp/public/index.jsp?article=19.7153366 www.metrobloggen.se/jsp/public/index.jsp?article=19.7208424 veganbidraget.blogspot.com/ blogg.expressen.se/matbloggen strangebakery.blogspot.com/ www.matsaklart.se/ spralligast.blogspot.com/ snaskbyttan.blogspot.com/ smilelagarmat.blogspot.com/ smakligtochgott.blogspot.com/ minfruktsallad.blogspot.com/ mammamat.blogg.se/ klarasgiblogg.blogspot.com/ kakomaten.blogg.se/ hososs.blogg.se/ nysansmat.blogspot.com/ jessikaochjonas.blogg.se/ smakakarin.blogspot.com/ www.smaskens.nu/ pyttes.blogspot.com/ www.barnfamilj.se/ loveforfood.blogg.se/ lindasmat.blogspot.com/ www.matorama.se/ matbak.blogspot.com/ nadjasculiness.wordpress.com/ kryddburken.wordpress.com/ hallonblabar.blogspot.com/ heavenlycupcake.blogspot.com/ mimmismat.wordpress.com/ matlyckan.blogspot.com/ marlenesmat.blogg.se/ www.saltpeppar.se/blog www.pickipicki.se/ fridaskok.wordpress.com/ elenasrecept.blogspot.com/ bullmamma anna.blogspot.com/ norbergsblogg.blogspot.com/ minmatblogg.blogspot.com/ mly.bloggagratis.se/ bagarstugan.blogspot.com/ receptfavoriter.blogg.se/ frkdill.blogspot.com/ www.metrobloggen.se/jsp/public/index.jsp?article=19.9966269 www.metrobloggen.se/jsp/public/index.jsp?article=19.313405 www.familjensundberg.se/blog my.opera.com/lenis martashorna.blogspot.com/ leilosh.blogspot.com/ www.ragazze.se/ fritidsforskare.wordpress.com/ www.vinochgastronomi.se/ bosseoblogg.blogspot.com/ andersandale.blogspot.com/ mollyshalsoblogg.blogspot.com/ humleochmalt.blogspot.com/ www.ofiltrerat.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.6447375 vegofamiljen.blogspot.com/ doublebastardbeerblog.wordpress.com/ rebeccabakar.blogspot.com/ dempabeer.blogspot.com/ schnilleochschmak.blogspot.com/ niggezoltankar.blogspot.com/ gyllenbock.blogspot.com/ hirigalzkar.wordpress.com/ nagotattdricka.blogspot.com/ olistockholm.blogspot.com/ olkallare.blogspot.com/ olkultur.blogspot.com/ rekanblogg.blogspot.com/ skumgardiner.blogspot.com/ stoutenochkapitalet.blogspot.com/ stouter.wordpress.com/ tankarkringol.blogspot.com/ www.alltomwhisky.se/ vintresserad.blogspot.com/ www.bravin.se/ desbonsvins.wordpress.com/ bkwine.blogspot.com/ billigtvin.blogspot.com/ caferotsunda.blogspot.com/ nettareegioia.wordpress.com/ vinprovare.blogspot.com/ frankofilen.blogspot.com/ mina vinare.blogspot.com/ konjaren.blogspot.com/ portugisiskt.blogspot.com/ miseenbouteille.blogspot.com/ mmm vin.blogspot.com/ vinare.blogspot.com/ johan p.blogspot.com/ rhonarna.blogspot.com/ vinnerintepalagring.blogspot.com/ www.chardonnay.se/ www.vinvin.se/ puttesvinspalt.blogspot.com/ vineuse.blogspot.com/ korkdragaren.blogspot.com/ mariellsrecept.blogspot.com/ receptfordummies.bloggagratis.se/ hanneys.blogspot.com/ hemmafru.taffel.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.2272004 www.metrobloggen.se/jsp/public/index.jsp?article=19.7530170 blogg.passagen.se/chrisy ensidamedmat.blogg.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.8037549 Figur 3: Exempel på hierarkisk klassificering visualiserad med ett dendrogram (hierarkiskt träd). Mat och dryck utgör en kategori som i sin tur indelas i kategorier om vin, öl och mat. 5