Svenska dialektkartor på sekunden

Relevanta dokument
Norden. Du kommer att få lära dig mer om:

Terminsplanering i Svenska årskurs 9 Ärentunaskolan

Amanda: Jaha? Kan man ha svenska som modersmål i Finland? Det visste jag inte!

Mål- och bedömningsmatris Engelska, år 3-9

svenska Syfte Kurskod: GRNSVE2 Verksamhetspoäng: KuRSplanER FöR KoMMunal VuxEnutBildninG på GRundläGGandE nivå 75

MEÄNKIELI SVERIGES NATIONELLA MINORITETSSPRÅK OCH SVENSKT TECKENSPRÅK

Upptäck Jordens resurser människor och miljö

Centralt innehåll årskurs 7-9

Pedagogisk planering tidningstexter. Syfte

Kursbeskrivning utbud grundläggande kurser hösten Engelska

Lärarmaterial. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på att: Författare: Beth Bracken och Kay Fraser

HÄLSNINGAR FRÅN HÅLL SVERIGE RENT

Undervisningen ska även bidra till att eleverna får möta och bekanta sig med såväl de nordiska grannspråken som de nationella minoritetsspråken.

Kursplan - Grundläggande svenska

Kvalitet i Släktforskningen, nr 1. eller Konsten att släktforska utan att det blir fel. Av Håkan Skogsjö. Utgiven av

Synlighet och en dröm. Karl Norrbom, 2013

Kursplan i svenska grundläggande kurs GRNSVE2

Större samhörighet i det lokala än i det regionala

Exempel på gymnasiearbete inom humanistiska programmet språk

LPP i Geografi. Varför läser vi. Vad skall vi gå igenom? Vilka är våra mål? Så här ser planen ut. January 25, LPP geografi vt.2018.

Mer för fler Hur ökar vi den digital delaktigheten?

Kursplan i svenska grundläggande kurs Y

Internetbaserad språkundervisning

VI OCH DOM 2010/01/22

Språkbitar. Red Jane Nystedt. Svenska Förlaget

Boken om Sveriges, Nordens och Europas geografi

NYHETER I TEKNIKKLUBBEN LUSTEN Illusioner!

Från enspråkighet till flerspråkighet. Kjell Herberts

Lässtrategier för att förstå och tolka texter från olika medier samt för att urskilja texters budskap,

Jag har ett Scoutprojekt på gång, vill du hänga med?

Lokal pedagogisk planering i Omikron (år 3) läsåret Sverigetema v. 45 v. 6

Svensk invandringspolitik

Vanliga frågor för VoiceXpress

Pedagogisk planering tidningstexter

Verksamhetsplan Borgens förskola Avdelning Draken

SVENSKA SOM ANDRASPRÅK

Lässtrategier för att förstå, tolka och analysera texter från olika medier.

EUROPAS HUVUDSTÄDER KÖPENHAMN

Parallella och rätvinkliga linjer

LPP i Geografi. Varför läser vi. Vad skall vi gå igenom? Vilka är våra mål? Så här ser planen ut. May 26, LPP geografi vt.2016.

Data, hot eller möjlighet i din verksamhet. Diala Jomaa Högskolan Dalarna

New York är en av världens mest kända städer. Här har New York valts som exempel på hur man kan tänka och arbeta geo-grafiskt.

Tisdag den 27 september 2016

ESN lokala kursplan Lgr11 (f.o.m 2012) Ämne: Geografi

Lärarhandledning till tre teman om entreprenörskap för årskurs 7-9

Kursplan i svenska grundläggande kurs X

Nordiska språk. Cecilia Jonsson Smedshagsskolan

Pictogram. för dem som behöver kommunicera med bilder

Meåfors. Meåfors Getgård

Wordpress och Sociala medier av Sanna Ohlander STAFFANSTORP Framtidens kommun

Svenska 1 Centralt innehåll och Kunskapskrav

Sammanfattning det allra, allra viktigaste

Utbildningen i engelska har dessutom som syfte att vidga perspektiven på en växande engelsktalande omvärld med dess mångskiftande kulturer.

Vi lär oss att använda kartor och att använda dem för att förstå geografisk information, jämföra länder och annat.

Digitala verktyg! Spaning Bölets förskola!

Lgr 11 Centralt innehåll och förmågor som tränas:

Svenska. Förmågan: Att skriva. utvecklad. välutvecklad

HANDLING TILL. Från tanke. Metodblad: Påverka på webben

PTS studie: Vilka använder inte internet - och varför?

För prövning i Grundläggande Svenska gäller följande vid första tillfället:

3.18 Svenska som andraspråk

EN LÄRARHANDLEDNING TILL NYA LANDSKAPSSERIEN UPPTÄCK SVERIGE

Lgr 11 - Centralt innehåll och förmågor som tränas:

Miljö, människor och hållbarhetsfrågor

Kort om World Wide Web (webben)

Nog är det tillräckligt!

Vad är repetitionslängd?

RESAN. År 6. År 7. Målet i år 7 är att klara av nedanstående resa:

Smedingeskolan LPP och matris för tema klassiker. LPP och matris för tema klassiker

Omelett! VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR LGRS 11 CENTRALT INNEHÅLL SOM TRÄNAS

Digital strategi för Miljöpartiet

Kundservice upplevs som långsam service

LÄRVUX kurser 2015/2016

Lokal pedagogisk planering för årskurs 4 i ämnet Geografi

E S E N L Ä R A R H A N D L E D N I N G T I L L N YA L A N D S K A P S S E R I E N U P P T Ä C K S V E R I G E

Jag ville sticka ut, våga synas

känner igen ordbilder (skyltar) ser skillnad på ord med olika längd och som börjar på samma bokstav (bi-bil)

VARFÖR LÄR VI OSS DETTA?

Av: Annika Löthagen Holm. Sluka svenska! Arbetshäfte Fröken Spöke

Läsnyckel. Nils Holgersson

Skolverkets förslag till reviderade kursplaner i svenska och svenska som andraspråk (arbetsmaterial 25 september 2019).

EN LÄRARHANDLEDNING TILL LANDSKAPET UPPLAND 1

Lokal pedagogisk planering Läsåret

Matematik. Ämnesprov, läsår 2014/2015. Delprov B. Årskurs. Elevens namn och klass/grupp

Handlingsplan. 2013/2014 Glöden

Handbok Kanagram. Danny Allen Översättare: Stefan Asserhäll

Ebba föddes utan armar

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande:

Lgr 11 - Centralt innehåll och förmågor som tränas:

GEOGRAFENS TESTAMENTE NORDEN

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

Programmeringsolympiaden 2018

Svensk nationell datatjänst, SND BAS Online

Kursplan i svenska som andraspråk grundläggande GRNSVA2

Den lustfyllda resan. Systematisk kvalitetsredovisning 15/16

Sökmotoranpassning. En guide för hur man sökmotoranpassar innehåll på TV4.se

Svenska som andraspråk

Fråga 2. Det finns alltså två delar i det här arbetet: Svara kort på varje delfråga (se nedan). Skriv en 400 ord om vad du lärt dig av detta.

Hinduism/Buddism. torsdag 18 april 13

PENGASAGOR HANDLEDNING

Transkript:

Svenska dialektkartor på sekunden Förslag till ingress: Traditionellt har man utforskat dialekter genom tidsödande fältarbete, men genom att automatiskt analysera text på Internet kan nu vem som helst skapa egna dialektkartor på bara en sekund. Förslag till författarpresentation: Robert Östling forskar om datorlingvistik vid Institutionen för lingvistik på Stockholms universitet. "I Sverige har dialektforskning med största ifver och framgång länge bedrifvits och bedrifves fortfarande." Citatet från Nordisk Familjebok (1913) är lika aktuellt nu, ett drygt sekel och en stavningsreform senare, men en och annan detalj har förstås förändrats. Då var Norden ännu till största delen ett samhälle av bönder som tillbringade större delen av sina liv i hembyn, och kommunicerade med andra från byn eller grannbyarna. En dialektforskare kring förra sekelskiftet som ville utforska, säg, Dalmålens variation, fick helt enkelt masa sig iväg till Dalarna och fråga lokalborna hur de säger det ena eller det andra. Den typen av fältarbete utförs fortfarande, speciellt för språk som är mindre välutforskade än svenskan, men tekniken har öppnat helt nya möjligheter för länstolslingvister att samla in stora mängder språkdata utan att resa land och rike runt. Mycket av vår kommunikation sker i dag i skrift, och är dessutom ofta allmänt tillgänglig via Internet. Det här är en guldgruva inte bara för reklamspridare och spionorganisationer, utan även för språkforskare. Via bloggar, Facebook, diskussionsforum och liknande kan vi få reda på varifrån en person kommer, och dessutom se ett prov på hans eller hennes skriftspråk. Eftersom vi med datorns hjälp kan göra den här insamlingen automatiskt för miljontals människor från det världens alla hörn, har vi nu tillgång till ett underlag som gamla tiders dialektforskare inte hade kunnat drömma om. Materialet som används i den här artikeln omfattar till exempel ungefär 150 000 olika bloggar på svenska, med totalt över en miljard ord text. Kvantitet och kvalitet Det här låter alldeles underbart, I alla fall om det är mängden information man är intresserad av. Tyvärr har automatiseringen också en baksida. Även om vi kan suga upp enorma mängder information från nätet, är det omöjligt att borga för kvaliteten hos den information vi skaffar oss för varje enskild person. Om Lisa i Ystad använder ordet rälig (ett skånskt ord som betyder äcklig) är den rimligaste förklaringen att det är så folk i Skåne säger, men vi skulle också kunna tänka oss att Lisa har tagit med sig ordet från Umeå där hon växte upp, eller att hon citerar sina kusiner från Åland och att ordet hör till finlandssvenskan. Kanske ljuger hon på sin blogg, och har i själva verket bott hela sitt liv i Stockholm. Eller är rälig helt enkelt en felskrivning av rolig? En gammaldags kringresande dialektforskare har naturligtvis inga problem att fråga Lisa var hon är född, huruvida hennes grannar i Ystad också använder rälig, och så vidare. Våra datorprogram har tyvärr inte den möjligheten, och den enorma kvantitet data vi har skaffat oss har till viss del betalats genom att snåla på kvaliteten. Men om man inte kan lita på sin data, vad är den då värd? Trots att osäkerheten är stor om varje enskild

persons ursprung och varje enskilt ords sammanhang, blir bilden en helt annan när man tittar på många personer samtidigt. Kartan [KARTA:raelig] visar användningen av ordet rälig, där färgen på varje kommun anger hur stor andel av bloggarna därifrån som någon gång använder rälig. Trots att det finns enstaka belägg från runt om i Sverige är det tydligt att det är i Skåne som de flesta användare finns. Ännu tydligare blir det i nästa karta [KARTA:raelig_p], där datorn har försökt beräkna andelen användare i varje kommun givet dess geografiska placering, så att angränsande kommuner antas ha ungefär samma andel tills motsatsen är bevisad. Denna metod gör kartan mindre fläckig än den föregående, eftersom slumpeffekter i urvalet av bloggare tonas ner. Eftersom vi vet att rälig är ett regionalt ord för äcklig, kan vi också jämföra hur vanliga dessa två ord är i förhållande till varandra [KARTA:raelig-aecklig_p]. Ett annat exempel där det finns stor variation inom det svenska språkområdet är ordet för föräldrars kusiners barn. I södra Sverige kallas dessa nästkusiner, i mellansverige sysslingar, i större delen av Norrland tremänningar, och i Finland samt en bit in på svenska sidan gränsen för småkusiner. [KARTA:naestkusin-syssling-tremaenning-smaakusin_p]. På kartan kan vi se att även syssling förekommer till viss grad i Finland, men av programmet får vi inte veta om det är i den finlandssvenska betydelsen (alltså föräldrars småkusiners barn, se Södergård och Tjäru i Språkbruk 3/2007) eller i den rikssvenska. Nya möjligheter Vi kan alltså automatisera det som dialektforskare har gjort i alla tider, från tidigare seklers äventyrsresande till de moderna lingvister som använder Internet som källmaterial för dialektstudier (se till exempel Mikael Parkvalls dialektkartor på Lingvistbloggen, Stockholms universitet, eller i Språktidningen 9/2012). Men även om tiden för att skapa en karta har minskat från dagar eller månader till en sekund, så handlar det ändå bara om att upprepa det som redan har gjorts, med ord som är välkända för sin geografiska snedfördelning. Ännu mer spännande blir det när vi använder det här materialet för att hitta snedfördelade ord. Principen för det här är enkel: gå igenom svenskans vokabulär, ord för ord, och kasta bort de ord som verkar förekomma lika ofta i hela språkområdet. Det som finns kvar blir då ord som på något sätt är begränsade i sin utbredning. På så sätt kan vi se att till exempel töla och tjåla är begränsade, och tittar vi på kartan ser vi att de förekommer på två närliggande områden i Värmland (töla) och Dalarna (tjåla). [KARTA:toelatjaala_p] Men vad betyder de? För en modern datorlingvist som kännetecknas av lathet snarare än äventyrslusta finns även här ett effektivt tekniskt hjälpmedel: ordrumsmodeller. Det är matematiska modeller som placerar ord i en mångdimensionell rymd så att ord som används på ett liknande sätt hamnar nära varandra. Med hjälp av en ordrumsmodell kan vi titta på vilka ord som används ungefär som "tjåla", och hittar till exempel: töla, tjöta (även skrivet tjôta, västgötskt ord för att småprata), mysprata, gossipa och snacka. Det verkar alltså klart att både tjåla och töla handlar om någon typ av avslappnad konversation. Processen går även att utföra i omvänd ordning. Om man till exempel vill leta efter lokala ord som betyder småprata, så kan man först leta efter ord som ligger nära exempelvis småprata eller snacka i ordrummet, och sedan undersöka vilka av dessa som har en begränsad geografisk utbredning. Från vaggan till graven Bloggtexterna vi använder för våra undersökningar representerar en ganska kort tidsperiod, och trots att det handlar om över en miljard ord så är det bara en liten del av allt som skrivs på svenska. Det här ger oss en ögonblicksbild av vilka ord som är etablerade på olika hål i det svenska språkområdet just nu, men språket är i ständig förändring och framöver kommer vi även att kunna studera den här förändringen i större detalj än vad som varit möjligt tidigare. Vi kommer kunna se hur mängder av ord

och uttryck myntas, hur de flesta tynar bort i glömska, men också hur några få överlevare får fäste, sprids, och blir en del av allmänspråket i något område. Forskare på olika håll gör redan det här i viss utsträckning, men med tillgång till hela mängden text som överförs via Internet kan det till och med gå att spåra tillbaka varje nytt ord till dess ursprung, om vi nu finner det lämpligt att ge upp hela vårt privatliv för den sakens skull. [Not: Det här arbetet har bedrivits i samarbete med Max Berggren, Jussi Karlgren och Mikael Parkvall] [Not: Du kan själv skapa kartor med författarens verktyg, som finns på Stockholms universitets webbplats: http://www.ling.su.se/kartverktyg]