Dialektgeografiska kartor i Gabmap

Relevanta dokument
INDELNING AV FINLANDSSVENSKA DIALEKTER MED SÄRSKILD HÄNSYN TILL ÅBOLAND

FrontPage Express. Ämne: Datorkunskap (Internet) Handledare: Thomas Granhäll

Sammanfattning på svenska

2.Starta GPSTrack genom att klicka på GPSTrack-programvarans genväg 1.

Vad är ArcGIS.com? På ArcGIS.com hittar du:

Handledning för konstruktion av tabeller och diagram med Excel

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.

SLU Säkerhets instruktioner avseende kryptering av filer

Bibliography. Adank, P. (2003). Vowel normalization: a perceptual-acoustic study of Dutch vowels. University of Nijmegen. Ph.D. thesis.

Word Online Version 1.0 Skolkontoret

Excel-guide. Introduktion

Biometria Violweb. Kom-igång-guide. Januari Sammanfattning Den här anvisningen är till för dig som ska börja använda dig av Biometrias tjänster.

Elmia Mässkatalog för PocketPC

Under Kurser visas dina kurser som kort och om där finns nya uppgifter eller anslag visas antalet i kurskortet.

LIPAS - INSTRUKTIONER

OCAD CS. Stafetter & teknikövningar

Biometria Violweb. Kom-igång-guide. Mars Sammanfattning Den här anvisningen är till för dig som ska börja använda dig av Biometrias tjänster.

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

ArcGIS Maps for Office

Redigering av dokument - SaveToServer

Postbeskrivning. Arbetsställen hela regionen.

Att hämta raps-data via Internet

TDP003 Projekt: Egna datormiljön

Grundläggande EndNote

Lär dig nyttja kartan och GIS! MAPINFO PROFESSIONAL Kurskatalog 2009

Statistiska centralbyrån. Statistikatlasen

X-Route Användarmanual Innehåll

Eva Hellstöm - Christina Strand

Introduktion till användning av linux-servern sledge och några övningsuppgifter

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.

Snabbstartsguide. Anpassa utseende och design Ge ritningen ett enhetligt utseende med teman och matchande färger. Du hittar dem på fliken Design.

Lathund för att hantera kongresshandlingar

Komma igång med Qlikview

Regional variation i finska naturnamn

Postbeskrivning. Sök arbetsställen samtliga uppgifter.

Inledande programmering med C# (1DV402) 27+15=42 1 (22)

Extramaterial till Matematik Y

Excel Online Version 1.0 Skolkontoret

Extramaterial till Matematik Y

Strängar. Elektronikcentrum i Svängsta AB

MATLAB. Python. Det finns flera andra program som liknar MATLAB. Sage, Octave, Maple och...

PC Software Point Creator for AutoCAD

Övning (X)HTML 2. Sidan 1 av

Kort introduktion till bibliometri samt huvuddragen i den norska modellen. Per Ahlgren

DIGITALA RESURSER MANUAL FÖR. Arbeta med video i Windows Live Movie Maker

SE... Guldmann Service och Information Konsol v Brukarmanual - ver. 6.00

NORDISK KARTOGRAFI MED MAPSERVER

Optimering av olika slag används inom så vitt skilda områden som produktionsplanering,

Arbetsområde: Kartan. Världen i din ficka

GIT L0002B INTRODUKTION TILL PROGRAMMERING OCH C# Information inför kursstart

Tematisk kartografi det akademiska perspektivet INSTITUTIONEN FÖR KULTURGEOGRAFI OCH EKONOMISK GEOGRAFI 2017

HANTERING AV MÄTDATA FRÅN SVAN 958

Användarhandledning - Introduktion till användning av Bb/WebCT för lärare och övrig personal

Manual. Verktyg för skolanalys. Astrakan. Motion Chart på enkelt sätt. Artisan Global Media

Excelfiler läggs till i ArcMap på samma sätt som annan data, genom Lägg till Dataknappen.

När man vill definiera en matris i MATLAB kan man skriva på flera olika sätt.

Extramaterial till Matematik Y

Kravspecifikation Fredrik Berntsson Version 1.3

Office 365 Windows 10

Här finns en kort beskrivning av CropSAT

För att kunna använda konsulentuppsättningarna, skall på varje enskild dator göras följande inställningar.

PC Software Point Creator for Revit. Snabbguide

Extramaterial till Matematik Y

Introduktion till programmering D0009E. Föreläsning 1: Programmets väg

Manual Mjukvara Allvis Software (SV )

GIT L0005B. ArcGis. Information inför kursstart

Laboration Fuzzy Logic

AALTO CONTROL -SYSTEMET

Falcon III. AOI system för 2D och 3D inspektion för komponenter på fixtur eller på palett

Säkerhetskopiera mobilen

API:er/Mashup. Föreläsning 4 API:er och Mashups. Johan Leitet johan.leitet@lnu.se twitter.com/leitet facebook.com/leitet. Webbteknik II, 1DV449

Digitalt lärande och programmering i klassrummet

Kom igång med LUPP 6.1

JavaRats. Kravspecifikation. Version 1.1. Gustav Skoglund Marcus Widblom Senast ändrad: 13 / 05 / 08

Manual för Sweco Piano 1. Manual för Piano PIANO BY SWECO AN INVENTORY APP WITH OFFLINE SUPPORT

Creo Customization. Lars Björs

Kursplanering Objektorienterad programmering

Android. Ett alternativ till traditionella Windows-datorer

Swema 05. Bruksanvisning vers 1.01 MB

Kom igång med LUPP 6.0

Konvexa höljet Laboration 6 GruDat, DD1344

TDP002 - Imperativ programmering

Handledning till statistikdatabas Göteborg

Molntjänster som komplement till din plattform. Anna Bergman och John Smaaland

Vis it. jquery jquery används lite överallt i appen på olika sätt. Det främsta användningsområdet är vid selektering och manipulering av HTML element.

WebOrderInstallation <====================>

EU-resan En upptäcktsfärd. Så här spelar du

ONSCREENKEYS 5. Windows XP / Windows Vista / Windows 7 / Windows 8

Avsnitt 1 Multimedia på Internet Introduktion

Introduktion till programmering

Smartair System. TS1000 Version 4.23

PULP SALES ANALYSIS TOOL

Snabbguide. 1. Systemkrav. 2. Installation och aktivering. Installation. Aktivering

RSI Road Status Information A new method for detection of road conditions

Introduktion till Winbas. produkt och prisinläsning

App-klient för smartphones Power BI Arbetsflöde CRM Online Webb-klienten Dokumenthantering Molnet...

RELATIV NÄRHET öppen mjukvara och crowdsourced data

Manual till GBIF-Sweden

Transkript:

Dialektgeografiska kartor i Gabmap Workshop vid Svenska litteratursällskapet i Finland r.f. Helsingfors, den 23 och 25 november 2011 Therese Leinonen

Kursinnehåll introduktion och bakgrund dataformat och datagranskning i Gabmap utbredningskartor tillverkning av baskarta i Google Earth dialektometriska metoder

Bakgrund RuG/L04: gratis programvara för dialektometri och kartografi utvecklad av Peter Kleiweg, universitetet i Groningen har funnits sedan 2001, fritt tillgängligt sedan 2004 i den tidiga unixbaserade versionen av programvaran finns inget grafiskt användargränssnitt = komplicerat att använda för många potentiella användare 2010: CLARIN-NL financierat projekt för att utveckla en webbapplikation av RuG/L04 programvaran Gabmap

Vad behövs för att tillverka dialektkartor? Gabmap är en webbapplikation = behöver inte installeras på datorn utan används online i en webbläsare lösenordsskyddat användarkonto där upp till 20 olika projekt kan lagras olika typer av material kan analyseras i Gabmap: transkriberat dialektmaterial kategoriska variabler (t.ex. morfologiska eller syntaktiska variabler) numeriska data (t.ex. akustiska mätningar) materialet laddas upp i Gabmap och analyseras online två filer måste laddas upp: 1) fil med dialektmaterialet 2) baskarta de färdiga dialektkartorna laddas ner till den egna datorn i form av bildfiler (.eps,.png,.pdf)

Dataformat för dialektmaterialet tab-separerad tabell (rader = orter; kolumner = lingvistiska variabler) textfil kodad i Unicode (UTF-8, UTF-16), fältavgränsare: tabulator vissa formateringsfel hittar Gabmap automatiskt när man laddar upp materialet (t.ex. tabellrader av olika längd) materialet kan sammanställas t.ex. i Microsoft Excel: (Spara som... Unicode Text (*.txt)) Exempel: baka lamm kväll Bergö ba:k lamb kve:ld / kvie:ld Björkö ba:k la:mb kve:ld / kvie:ld Borgå bak(a) la:mb kveld Bromarv bak(a) lamm kve:ld / kvell

Baskarta fil med geografiska koordinater (orter, gränser) kan skapas i Google Earth (http://earth.google.com/) spara som.kml- eller.kmz-fil dialektmaterialet kopplas till de geografiska koordinaterna genom att samma ortnamn används i båda filerna

Datagranskning i Gabmap index: orter, antal belägg per variabel data overview: antal orter, antal variabler, antal tecken i materialfilen etc. character/token list: antal belägg per tecken (kan användas för att hitta fel i materialfilen: t.ex. infrekventa tecken är ofta tryckfel) distributionskartor över enskilda fonetiska tecken

Utbredningskartor utbredningskartorna (distribution maps) i Gabmap visar frekvensen av en specifik variant ju mörkare färg på kartan, desto mer frekvent förekommer varianten på orten i fråga Gabmap är i första hand utvecklat för dialektometrisk analys = funktionerna för utbredningskartor inte fullt utbyggda klassiska utbredningskartor, som visar förekomsten av flera olika varianter på en och samma karta (t.ex. med olika symboler), finns inte direkt inbyggda i Gabmap sådana kartor kan åstadkommas genom att lägga upp ett projekt med en enda språklig variabel och använda funktionen för klusterkartor (cluster maps)

Dialektometri dialektometri = mätning av dialekter mål: beskriva dialektkontinuum och klassificera dialekter i traditionell dialektologi har isoglosser använts för att identifiera dialektgränser och dialektområden inom dialektometrin vill man dels skapa en helhetsbild (dvs. inte beskriva enskilda språkdrag), dels använda mer objektiva metoder datadrivet tillvägagångssätt dialektometrisk analys omfattar ofta två steg: 1) mätning av språkligt avstånd mellan dialekterna 2) statistisk analys av de uppmätta avstånden

Levenshteinavstånd (string edit distance) algoritm för att räkna ut det lingvistiska avståndet mellan dialekter utifrån transkriberade ord räknar ut det minsta antalet operationer (= raderingar, infogningar och substitutioner) som krävs för att transformera en teckensträng till en annan kostnader: 1 per operation, 0.5 om den enda skillnaden är i diakriser Exempel: b e i n b ä i n 0 1 0 0 1 a r g a r g ä r 0 0 0 1 1 2 k v e l l k v ä l l 0 0 1 0.5 0.5 2 avståndet räknas ut för alla ord och alla dialektpar det språkliga avståndet mellan två dialekter är medeltalet av avståndet för alla ord som finns belagda i båda dialekterna länkningarna kan inspekteras Gabmap

Avståndskartor ju mörkare färg, desto mindre språkligt avstånd difference maps: linjer dragna mellan orterna parvis anger det språkliga avståndet reference point maps: språkligt avstånd från en utvald ort (stjärna) till alla andra orter

Dialektkontinuum multidimensionell skalering (MDS) används för att reducera komplexa avståndsmatriser till ett mindre antal dimensioner metod för att visualisera likheter/olikheter i data som ett kontinuum utifrån parvis uppmätta avstånd mellan dialekter tilldelas varje dialekt en position i ett lågdimensionellt rum resultaten från MDS kan överföras till kartor med hjälp av RGB färgmodellen

Multidimensionell skalering MDS visar den språkliga variationen som ett kontinuum

Klusteranalys delar in dataobjekt i grupper/kluster de dialekter som liknar varandra mest hamnar i samma grupp dialektindelning denna metod är inte lika stabil som MDS: små förändringar i materialet som analyseras kan leda till stora skillnader i dialektindelningen kräver validering (t.ex. jämförelse med MDS, jämförelse mellan olika klustermetoder, fuzzy clustering)

Litteratur Heeringa, Wilbert (2004): Measuring dialect pronunciation differences using Levenshtein distance. Doktorsavhandling, University of Groningen. Leinonen, Therese (u.u.): Indelning av finlandssvenska dialekter med särskild hänsyn till Åboland. I: Folkmålsstudier 50. Nerbonne, John (2009). Data-driven dialectology. Language and Linguistics Compass 3(1), 175 198. Nerbonne, John (2010). Mapping aggregate variation. I: A. Lameli, R. Kehrein och S. Rabanus (red.), Language and Space Vol. 2.1. Language Mapping. Berlin: De Gruyter, 476 495. Nerbonne, John och Wilbert Heeringa (2010): Measuring dialect differences. I: J. E. Schmidt och P. Auer (red.), Language and Space Vol. 1. Theories and Methods. Berlin: De Gruyter, 550 567. Nerbonne, John, Rinke Colen, Charlotte Gooskens, Peter Kleiweg och Therese Leinonen (2011): Gabmap A Web Application for Dialectology. Dialectologia, Special Issue II, 65 89. Mera övningar finns tillgängliga online: http://www.gabmap.nl/~app/doc/tutorial/