Den svenska bloggosfären i ett ögonkast Slutrapport Olof Görnerup olofg@sics.se 1 Introduktion I följande rapport sammanfattar jag vad som har gjorts i projektet, gör en utvärdering av hur projektet har uppnått sitt syfte, samt diskuterar möjliga framtida riktningar. Jag väljer att utelämna mer tekniska detaljer av projektet här (dessa presenteras i delrapporterna). 2 Vad som har gjorts Under projektets gång har jag formulerat, implementerat och testat en metod för att visualisera den svenska bloggosfären. Bloggosfären representeras av ett nätverk där bloggar utgör noder, och där två noder är sammanlänkade om de har en viss grad av likhet. Denna grad av likhet har kvantifieras som graden av överlapp av förekommande ord [1]. Bloggar som använder många liknande ord antas alltså ha en högre grad av likhet än bloggar med mer begränsade ordöverlapp. Jag har använt bloggdata från perioden mars-juli 2009, vilken har erhållits från bloggsökmotorn Twingly 1. Fig. 1 visar resulterande nätverk med olika tröskelvärden för graden av blogglikhet (jag visar alltså bara bloggar som har likhet över ett visst värde). En klustringsmetod [2] har använts för att automatiskt gruppera bloggar i kategorier. Ett exempel på resultatet av metoden visas i Fig. 2, där kategorier gällande matlagning, öl, vin, politik, handarbete etc hittas. Bloggklustren är hierarkisk ordnade eftersom kluster i sin tur formar kluster av kluster. Jag har även använt en metod [3] för att automatiskt hitta hi- 1 http://www.twingly.com/ 1
erarkisk klusterstruktur. Fig. 3 exemplifierar hur ett kluster om Mat och dryck är organiserat i delkluster. 3 Utvärdering Jag är nöjd med hur projektet har utfallit. Huvudsyftet var att undersöka möjligheten att på ett överskådligt sätt visualisera den svenska bloggosfären, vilket jag tycker har uppnåtts. Erfarenhetsmässigt har projektet även varit mycket givande eftersom det har möjliggjort för mig att applicera metodiker och tekniker i ett helt nytt sammanhang. 4 Möjliga framtida riktningar I det här projektet har jag enbart tagit fram en ögonblicksbild av bloggosfären. Det skulle även vara intressant att titta på mer dynamiska aspekter. Hur förändras och utvecklas bloggosfären över tiden? Det skulle inte bara vara visuellt intressant, utan även möjliggöra studier i bloggdynamik, t ex gällande influens och informations-spridning i bloggosfären. En annan intressant riktning - vilken jag bara har berört kort i en av delrapporterna - är att undersöka möjligheten att applicera teknikerna i det här projektet för att detektera spam. 5 Resultatspridning Vi skriver för närvarande en artikel som kommer skickas till en vetenskaplig tidskrift..se informeras om artikeln blir publicerad. Givetvis anges.se som finansiär. Referenser [1] Amos Tversky. Features of similarity. In Psychological Review, volume 84, pages 327 352, 1977. [2] Aaron Clauset. Finding local community structure in networks. Physical Review E, 72:026132, 2005. [3] A. Clauset, C. Moore, and M. E. J. Newman. Hierarchical structure and the prediction of missing links in networks. Nature, 453:98 101, 2008. 2
(a) (b) (c) (d) Figur 1: Visualisering av den svenska bloggosfo ren, da r bloggar med likhet γ visas. (a) γ = 0.04. (b) γ = 0.045. (c) γ = 0.055. (d) γ = 0.07. 3
Hantverk Mat Drycker Politik Spel och dobbel Scrapbooking Resor Figur 2: Färgkodade automatiskt framtagna kategorier av bloggar (γ = 0.05). Några exempel är markerade med text. 4
www.metrobloggen.se/jsp/public/index.jsp?article=19.8410440 www.metrobloggen.se/jsp/public/index.jsp?article=19.7153366 www.metrobloggen.se/jsp/public/index.jsp?article=19.7208424 veganbidraget.blogspot.com/ blogg.expressen.se/matbloggen strangebakery.blogspot.com/ www.matsaklart.se/ spralligast.blogspot.com/ snaskbyttan.blogspot.com/ smilelagarmat.blogspot.com/ smakligtochgott.blogspot.com/ minfruktsallad.blogspot.com/ mammamat.blogg.se/ klarasgiblogg.blogspot.com/ kakomaten.blogg.se/ hososs.blogg.se/ nysansmat.blogspot.com/ jessikaochjonas.blogg.se/ smakakarin.blogspot.com/ www.smaskens.nu/ pyttes.blogspot.com/ www.barnfamilj.se/ loveforfood.blogg.se/ lindasmat.blogspot.com/ www.matorama.se/ matbak.blogspot.com/ nadjasculiness.wordpress.com/ kryddburken.wordpress.com/ hallonblabar.blogspot.com/ heavenlycupcake.blogspot.com/ mimmismat.wordpress.com/ matlyckan.blogspot.com/ marlenesmat.blogg.se/ www.saltpeppar.se/blog www.pickipicki.se/ fridaskok.wordpress.com/ elenasrecept.blogspot.com/ bullmamma anna.blogspot.com/ norbergsblogg.blogspot.com/ minmatblogg.blogspot.com/ mly.bloggagratis.se/ bagarstugan.blogspot.com/ receptfavoriter.blogg.se/ frkdill.blogspot.com/ www.metrobloggen.se/jsp/public/index.jsp?article=19.9966269 www.metrobloggen.se/jsp/public/index.jsp?article=19.313405 www.familjensundberg.se/blog my.opera.com/lenis martashorna.blogspot.com/ leilosh.blogspot.com/ www.ragazze.se/ fritidsforskare.wordpress.com/ www.vinochgastronomi.se/ bosseoblogg.blogspot.com/ andersandale.blogspot.com/ mollyshalsoblogg.blogspot.com/ humleochmalt.blogspot.com/ www.ofiltrerat.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.6447375 vegofamiljen.blogspot.com/ doublebastardbeerblog.wordpress.com/ rebeccabakar.blogspot.com/ dempabeer.blogspot.com/ schnilleochschmak.blogspot.com/ niggezoltankar.blogspot.com/ gyllenbock.blogspot.com/ hirigalzkar.wordpress.com/ nagotattdricka.blogspot.com/ olistockholm.blogspot.com/ olkallare.blogspot.com/ olkultur.blogspot.com/ rekanblogg.blogspot.com/ skumgardiner.blogspot.com/ stoutenochkapitalet.blogspot.com/ stouter.wordpress.com/ tankarkringol.blogspot.com/ www.alltomwhisky.se/ vintresserad.blogspot.com/ www.bravin.se/ desbonsvins.wordpress.com/ bkwine.blogspot.com/ billigtvin.blogspot.com/ caferotsunda.blogspot.com/ nettareegioia.wordpress.com/ vinprovare.blogspot.com/ frankofilen.blogspot.com/ mina vinare.blogspot.com/ konjaren.blogspot.com/ portugisiskt.blogspot.com/ miseenbouteille.blogspot.com/ mmm vin.blogspot.com/ vinare.blogspot.com/ johan p.blogspot.com/ rhonarna.blogspot.com/ vinnerintepalagring.blogspot.com/ www.chardonnay.se/ www.vinvin.se/ puttesvinspalt.blogspot.com/ vineuse.blogspot.com/ korkdragaren.blogspot.com/ mariellsrecept.blogspot.com/ receptfordummies.bloggagratis.se/ hanneys.blogspot.com/ hemmafru.taffel.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.2272004 www.metrobloggen.se/jsp/public/index.jsp?article=19.7530170 blogg.passagen.se/chrisy ensidamedmat.blogg.se/ www.metrobloggen.se/jsp/public/index.jsp?article=19.8037549 Figur 3: Exempel på hierarkisk klassificering visualiserad med ett dendrogram (hierarkiskt träd). Mat och dryck utgör en kategori som i sin tur indelas i kategorier om vin, öl och mat. 5