ATT JÄMFÖRA OPINIONER SPRÅKEFFEKTER I KOMPARATIVA STUDIER WWW.LES.GU.SE
Hur nöjda är medborgare världen över med hur demokratin fungerar? Data: Comparative Studies of Electoral Systems (CSES), European Social Survey (ESS) och European Values Survey (EVS).
Varför ska vi undersöka språkskillnader i forskning som rör politik och opinion? Jämförande landstudier kräver mätinstrument som är valida, tillförlitliga och ekvivalenta men hur vet vi att vi har uppnått semantisk ekvivalens? Trots att problematik som rör språk- och översättningsdiskrepanser ofta uppkommer inom den komparativa politiska forskningen, utgör detta ett gap i forskningen. Ska vi ge upp tanken på att kunna göra goda jämförelser av attityder över olika språk eller ska vi röra oss mot mer kreativa lösningar?
Är danskarna verkligen världens lyckligaste folk? Lolle, Henrik and Jørgen Goul Andersen (2015) Measuring Happiness and Overall Life Satisfaction: A Danish Survey Experiment on the Impact of Language and Translation Problems, Journal of Happiness Studies.
Lolle, Henrik and Jørgen Goul Andersen (2015) Measuring Happiness and Overall Life Satisfaction: A Danish Survey Experiment on the Impact of Language and Translation Problems, Journal of Happiness Studies.
Hur ofta talar internetanvändare om lyckotermer som förekommer i stora internationella opinionsundersökningar? Andel yttranden 0.5 1 1.5 2 2.5 0 5 10 15 20 Vecka EN ES FR FI DE DA RU NO SV Det verkar som att engelskans happy används mycket mer frekvent än de skandinaviska språkens lycklig / lykkelig! DA: lykkelig EN: happy FI: onnellinen NO: lykkelig SV: lycklig DE: glücklich ES: feliz FR: heureux RU: счастливы
Utforska mening med hjälp av distributionell semantik Distributionell semantik används för att upptäcka semantiskt liknande termer för ett givet ord. Termer presenteras som vektorer i ett högdimensionellt semantiskt rum ordrum i vilken relativ likhet mellan vektorer indikerar liknande användande av termer. Baseras på big data som geo-kodas och sorteras efter källa (redaktionell media respektive social media). Metoden gör det möjligt att identifiera semantiska likheter och skillnader mellan ord och att utforska nutida tillämpningar av ord över olika språk.
Några exempel på tillgänglig geo-kodad data STATSVETENSKAPLIGA INSTITUTIONEN Land Språk Antal webbdokument Australien Engelska 5 miljoner Kinesiska 1 miljon Brasilien Portugisiska 27 miljoner Spanska 300 000 Egypten Arabiska 2 miljoner Frankrike Franska 51 miljoner Grekland Grekiska 8 miljoner Italien Italienska 20 miljoner Kanada Engelska 3 miljoner Franska 500 000 Kina Kinesiska 2,5 miljoner Nederländerna Holländska 13 miljoner Polen Polska 11 miljoner Ryssland Ryska 51 miljoner Spanien Spanska 38 miljoner Storbritannien Engelska 23 miljoner Sverige Svenska 6,5 miljoner Turkiet Turkiska 7 miljoner Tyskland Tyska 55 miljoner USA Engelska 350 miljoner Spanska 6 miljoner Men mycket mer geo-kodad språkdata finns att tillgå!
Termen demokrati och dess semantiska grannskap Engelska democracy Svenska demokrati Ryska демократия rule of law religious freedom paradigm good governance equality elite human dignity freedom of opinion ideology constitutional democracy freedom of the press political elite democratic governance social justice diplomacy democratic principles freedom of expression strategy Termerna är hämtade från ett levande lexikon (distribuerat av Gavagai) och bygger på algoritmer som lär sig språk kontinuerligt. constitutionalism rule law, state of justice intelligentsia liberal democracy freedom bureaucracy self-determination tolerance location, site individual choice gender equality gimmick, feature
Hur klassificeras termer som tillhör det semantiska grannskapet för termen demokrati? Klassificeringar och översättningar genomförs av anlitade översättare. Källa: Easton, David (1975) A Re-Assessment of the Concept of Political Support, British Journal of Political Science och Norris, Pippa (1999) Critical citizens: Global support for democratic governance, Oxford University Press.
Hur talar internetanvändare om ordet demokrati? I termer av principer, procedurer eller något annat? Bilden visar resultaten från en pilotstudie utförd våren 2016 där termen demokrati och dess semantiska grannskap analyseras över 13 olika språk.
) Hur skiljer sig det semantiska grannskapet åt mellan olika webbaserade källor? Redaktionell media Social media Term: mångkultur Term: demokrati antirasism normkritik inkludering jämställdhet genus feminism jämlikhet maskulinitet tolerans solidarisk yttrandefrihet rättsstat jämlikhet politik öppenhet välfärdsstat demokratin välfärd stat demokratisk massinvandring feminism socialism nationalism rasblandning fascism demokrati kommunism kapitalism invandring marknadsekonomi planekonomi rättsstat diktatur kapitalism nationalism yttrandefrihet socialism mångkultur frihandel Att separera olika källor vid analyser av big data kan synliggöra diskursiva skillnader som förekommer i samhällsdebatten!
STEFAN DAHLBERG, SÖREN HOLMBERG & SOFIA AXELSSON GÖTEBORGS UNIVERSITET MAGNUS SAHLGREN & AMARU CUBA GYLLENSTEN SICS (SWEDISH ICT) GRAEME HIRST UNIVERSITY OF TORONTO JONAS LINDE UNIVERSITETET I BERGEN www.les.gu.se