Swepub och högskolestatistiken Martin Söderhäll
Disposition Bakgrund Sammanfattning av Swepub-användningen vid UKÄ Exempel på statistisk analys Swepub kan användas till idag Utmaningar och utvecklingsmöjligheter
Bakgrund UKÄ vill öka kunskapen om högskolans forskningsverksamhet Ett första steg - nytt kapitel i UKÄ:s årsrapport från 2018 Högskolans forskning Swepub ett verktyg för att kvantifiera forskningsoutput från landets lärosäten
Insamling av publikationsdata till Swepub liknar insamlingen för andra statistikprodukter hos UKÄ Totalundersökning Data baserade på lärosätenas egna inrapportering Standard för svensk indelning av forskningsämnen
Sammanfattning av resultatet från användandet av Swepub i årsrapporten Det totala antalet vetenskapliga publikationer från forskare vid svenska lärosätten uppgår enl. Swepub till omkring 58 000 årligen (2014-2016) Lärosätenas vetenskapliga produktion 2014-2016, antal publikationer fördelat på publikationstyp (UKÄ:s indelning). De stora breda universiteten står för huvuddelen av lärosätenas samlade vetenskapliga publikationer (55 procent år 2016)
Möjligheter med Swepub idag Producera deskriptiv statistik om högskolans forskning Publikationer per lärosäte, per forskningsämne Olika publikationstyper, OpenAcces Komplettera nationella indikatorer (se exempelvis: Vetenskaplig produktion analys av det vetenskapliga forskningssystemet)
Exempel på vilken statistik Swepub kan användas till idag 25000,0 Antal publikationer per forskningsämne (fraktionerat) 2014-2016 20000,0 15000,0 10000,0 5000,0 0,0 2014 2015 2016
Publikationer per anst. disp. Publikationer per disputerad personal per forskningsämnesområde (fraktionerat) 2014-2016 10 9 8 7 6 5 4 3 2 1 0 Forskningsämnesområde 2014 2015 2016
Uppsala universitet Lunds universitet Göteborgs universitet Karolinska institutet Kungl. Tekniska högskolan Stockholms universitet Chalmers tekniska högskola Linköpings universitet Umeå universitet Sveriges lantbruksuniversitet Luleå tekniska universitet Linnéuniversitetet Örebro universitet Mittuniversitetet Karlstads universitet Högskolan i Jönköping Mälardalens högskola Södertörns högskola Högskolan Dalarna Malmö universitet Högskolan i Borås Högskolan i Gävle Högskolan Väst Högskolan i Halmstad Högskolan Kristianstad Högskolan i Skövde Blekinge tekniska högskola Försvarshögskolan Gymnastik- och idrottshögskolan Ersta Sköndal Bräcke högskola Sophiahemmet högskola Röda korsets högskola Konstfack Stockholms konstnärliga högskola Kungl. Musikhögskolan Handelshögskolan 30000 Publikationer per lärosäte 2014-2016 25000 20000 15000 10000 5000 2016 2015 2014 0 8 publikationer
Exempel på statistisk analys utifrån variabler tillgängliga i Swepub och i UKÄ:s statistikdatabas.
Swepub för att mäta ojämlikhet i forskningsoutput mellan lärosäten internationell jämförelse Normalised Gini coefficients for university publication outputs (Halffman, W., & Leydesdorff, L. 2010) 2003 2004 2005 2006 2007 2008 Avg 03 08 n World 0.195 0.196 0.196 0.195 0.188 0.187 0.193 500 Australia 0.191 0.187 0.184 0.196 0.198 0.195 0.192 13 Canada 0.175 0.175 0.166 0.171 0.169 0.174 0.172 21 Gini svenska lärosäten i Swepub China 0.106 0.108 0.108 0.098 0.082 0.084 0.098 8 År 2014 2015 2106 n France 0.190 0.187 0.209 0.199 0.166 0.179 0.188 21 Publikationer 0,648 0,653 0,651 36 Germany 0.099 0.119 0.120 0.120 0.118 0.121 0.116 40 Publikationer/disputerad personal 0,265 0,229 0,278 36 Italy 0.141 0.143 0.146 0.147 0.183 0.143 0.150 20 Publikationer topp 10 0,204 0,215 0,22 10 Japan 0.223 0.219 0.229 0.237 0.227 0.236 0.228 31 Publikationer/disputerad personal topp 10 0,118 0,121 0,107 10 Netherlands Källa: Swepub, UKÄ 0.126 0.127 0.129 0.120 0.124 0.119 0.124 12 Sweden 0.122 0.120 0.121 0.121 0.132 0.134 0.125 10 UK 0.187 0.198 0.194 0.185 0.184 0.189 0.190 40 US 0.222 0.214 0.211 0.209 0.212 0.215 0.214 159 Source: Shanghai ranking data at http://www.arwu.org/
Att hantera vid produktion av deskriptiv statistik Inkorrekt inmatade poster (hur ska dessa hanteras) Icke ifyllda poster Dubbletter <- Swepub-rådata från 2015, variabel = Antal upphovspersoner
Hur ska fraktioneringar hanteras? På traditionellt bibliometriskt vis (andelar)? Kan missgynna enskilda lärosäten? Ingen fraktionering i vissa dimensioner? Kombinationer av olika metoder?
På längre sikt vill vi Producera och analysera deskriptiv statistik innehållandes fler variabler (kön, anställningskategori, ålder) Att Swepub utvecklas till en naturlig källa för information om forskningsoutput på olika nivåer (nationellt, lärosäten, forskningsämnen) Bidra till att Swepub blir ett relevant verktyg för policyutvärdering (för forskare, lärosäten samt andra berörda myndigheter och organisationer
Swepub för statistisk analys Vad behövs? Unikt ID som identifierar upphovsperson ID som möjliggör koppling till andra register och databaser (exempelvis Registret för personal vid universitet och högskolor, SweCris, WoS) Möjligt att analysera/utvärdera Effekter av forskningssatsningar på forskningsoutput Effekter av karriärutveckling på forskningsoutput Forskningssamarbeten mellan svenska lärosäten Citeringsanalyser
Ytterligare möjligheter/fördelar med Swepub Databas som täcker in alla publikationstyper Öka kunskapsnivån kring forskningsoutput på olika nivåer (lärosäten, forskningsämnen och forskningsmiljöer) Relatera inputvariabler (finansiering, personal) till forskningsoutput. Metodologiskt relevant i ljuset av det internationella forskningsläget. se exempelvis: Bloom et. al. (2017) och Dosi et. al. (2006). Minskat beroende av kommersiella databaser -> ökad transparens? Öppna data -> Möjlighet att anpassa användningen utifrån lokala förutsättningar (exempelvis genom att koppla på annan data)
Appendix. Significant funds are distributed to universities, and within universities, on the basis of aggregate publication counts, with little attention paid to the impact or quality of that output. In consequence, journal publication productivity has increased significantly in the last decade, but its impact has declined (Butler, 2003) Beroende variabel = lnpublikationer 1. 2. ln dips. Personal 1.09 *** 1.51 *** (0.06) (0.14) Interaktion Kategori NEJ JA N 105 105 R2 0.92 0.94 *** p < 0.001; ** p < 0.01; * p < 0.05.
Litteratur Bloom, N., Jones, C. I., Van Reenen, J., & Webb, M. (2017). Are ideas getting harder to find? (No. w23782). National Bureau of Economic Research. Butler, L. (2003). Explaining Australia s increased share of ISI publications the effects of a funding formula based on publication counts. Research policy, 32(1), 143-155. Dosi, G., Llerena, P., & Labini, M. S. (2006). The relationships between science, technologies and their industrial exploitation: An illustration through the myths and realities of the so-called European Paradox. Research policy, 35(10), 1450-1464. Vetenskaplig produktion analys av det vetenskapliga forskningssystemet [Elektronisk resurs]. (2018). Vetenskapsrådet. Årsrapport 2018 för universitet och högskolor [Elektronisk resurs]. (2018). Universitetskanslersämbetet.