Bruksanvisning för annotering av teckenspråkstexter i ELAN Johanna Mesch Elísabet Eir Cortes Institutionen för lingvistik Avdelningen för teckenspråk Projektet Korpus för det svenska teckenspråket, Riksbankens Jubileumsfond (In2008-0276-1-IK) Version 4 (2021-12-20)
ELAN för teckenspråkskorpusar... 1 Bakgrund... 1 Kort om annoteringsverktyget ELAN... 2 Installera ELAN... 3 Arbeta med annoteringar... 4 Skapa en ny annoteringsfil... 4 Skapa eller ändra radtyp... 5 Skapa eller ändra rad... 5 Skapa ny annotering... 6 Ändra innehållet i en annotering... 8 Ta bort annotering... 9 Skapa annotering med samma tidsperiod i en annan rad... 9 Ändra tidsperioden för en annotering... 9 Överordnad rad och underordnad rad... 10 Skapa bilder från videosekvenser... 11 Hämta resultat till Word eller Excel... 12 Skriv ut annoteringar direkt ifrån ELAN... 13 Kontrollerad ordlista... 13 Använda ELAN för att analysera teckenspråkstexter... 15 Öppna en befintlig eaf-fil... 15 Mediafönster... 17 Databasfönster... 18 Tidslinje... 19 Markera en viss videosekvens... 19 Göm eller synliggör rader... 20 Byt eller lägg till film... 20 Sök annotering... 22 Sökformler (reguljära uttryck)... 27 Kortkommandon... 32 Slutord... 33 Referenser... 34 Bilaga 1: Kortkommandon för ELAN med Windows... 36 Bilaga 2: Kortkommandon för ELAN med Mac... 38
ELAN för teckenspråkskorpusar Denna bruksanvisning är reviderad från version 1, 2 och 3 (Mesch, 2009, 2010, och 2011). Uppdateringen återspeglar utvecklingen av annoteringsprogrammet ELAN från tidigare versioner till dagens version 6.2 (juli 2021). Likaså har arbetet med våra teckenspråkskorpusar 1 bidragit till utveckling av rutiner för annoteringsarbete och transkriptionskonventioner som passar för våra behov i undervisning och forskning om svenskt teckenspråk (Mesch & Wallin, 2021). Därför uppdateras bruksanvisningen. Bakgrund Annoteringsprogrammet ELAN (EUDICO Linguistic Annotator) är ett utmärkt verktyg för annotering och transkription av teckenspråkstexter 2. ELAN vidareutvecklades för annotering av teckenspråkstexter tack vare ett18-månaders europeiskt samarbetsprojekt, ECHO Case study on sign language, mellan Radboud University Nijmegen, City University of London och Stockholms universitet 2003 2004 (se Crasborn, et al. 2007). Korpusmaterial från tre europeiska teckenspråk är tillgängligt på nätet sedan 2004 och består av fem fabelberättelser på tre teckenspråk (nederländskt teckenspråk NGT, brittiskt teckenspråk BSL och svenskt teckenspråk STS), teckenspråkspoesi, en teckenlista på 300 tecken/ord för varje språk, samt korta intervjuer. Projektet Korpus för det svenska teckenspråket på Avdelningen för teckenspråk vid Institutionen för lingvistik, Stockholms universitet, beviljades medel från Riksbankens Jubileumsfond för tre år (1 januari 2009 31december 2011) för att bygga en korpusdatabas för svenskt teckenspråk, (se Mesch, 2015, 2016, 2021; Mesch et al. 2012). Besök www.ling.su.se/teckenspr%c3%a5ksresurser/teckenspr%c3%a5kskorpusar/svenskteckenspr%c3%a5kskorpus om du vill veta mer om projektet. Material från Svensk teckenspråkskorpus är tillgängligt via två kanaler på nätet: I begränsad form på https://www.ling.su.se/teckenspraksresurser/teckensprakskorpusar och genom den öppna webbportalen STS-korpus, https://teckensprakskorpus.su.se/#/, (Öqvist, Kankkonen, & Mesch, 2020). För texttranskription används olika termer: Annotering, transkription och taggning. Annotering avser uppmärkning av språkliga enheter, d.v.s. alla slags anteckningar för en teckenspråkstext, och innefattar bl.a. glosor, transkription, översättning och kommentarer. Transkription avser teckenspråkstext återgiven i skrift. Taggning avser markering av tecken eller konstituenter med språkvetenskapliga kategoriseringsbegrepp. 1 Korpus för det svenska teckenspråket (RJ, In2008-0276-IK; Mesch et al. 2012), Korpus för taktilt teckenspråk (Mo Gårds Forskningsfond; Mesch 2016) och Korpus för simultantolkat teckenspråk (VR 421-2011-2286; Nilsson 2014). 2 Se Crasborn & Sloetjes (2008). 1
Kort om annoteringsverktyget ELAN Annoteringsverktyget ELAN synkroniserar videosekvenser med anteckningar, s.k. annoteringar av olika slag, t.ex. transkription och översättning. ELAN används som verktyg för olika forskningssyften samt för undervisning. ELAN utvecklas kontinuerligt. Den aktuella versionen för Windows, macos och Linux är 6.2 (juli 2021). Menyerna finns på bl.a. svenska, engelska, spanska, katalanska, franska, tyska, portugisiska och japanska. Verktyget kan hämtas utan kostnad på The Language Archive ELAN-sida, https://archive.mpi.nl/tla/elan/download. Fördelar med ELAN är att man kan arbeta med annotering parallellt med videosekvenser (och ljud) se annoteringar i ett databasfönster se annoteringar i realtid (markerade annoteringar följer tidsperioden hos den valda videosekvensen) se olika annoteringar i ett annoteringsfönster där man har skrivit in något, bland annat glosor, blickriktning, mun, översättning och anteckningar av olika slag skapa rader skicka och ta emot transkriptionsfiler, s.k. eaf-filer göra teckenspråkstext tillgänglig på internet i form av videosekvenser med transkriptioner söka information i annoteringar skapa en tabell över annoteringar Ett annoteringspaket består av videomaterial (t.ex. MP4, MPG) annoteringsfil.eaf inställningsfil.psfx Andra användningsexempel är presentation av video- och annoteringmaterial analys av tecken inom t.ex. fonologi, semantik, syntax och textlingvistik användning av ELAN i undervisning för avläsnings-, analys- och sökningsuppgifter att studenter kan skicka in sina uppgifter i form av eaf-fil att forskare kan utbyta material i form av eaf-fil (med video) 2
Installera ELAN Det är enkelt att installera programmet ELAN. Det finns olika versioner för Windows, macos och Linux. Programmet utvecklas kontinuerligt så ladda ner den senaste versionen genom en länk som finns på www.ling.su.se/teckenspr%c3%a5ksresurser/verktyg eller direkt från The Language Archive, archive.mpi.nl/tla/elan/download. Se till att du väljer rätt OS (Windows, macos eller Linux) 3, och klicka på ELAN 6.2 till höger om OS-symbolen. Ett separat fönster öppnas där du kan välja plats på datorn för att spara filen, ELAN 6-2_win.exe för Windows, ELAN 6-2_mac.exe för Macintosh. Navigera därefter till mappen där du sparade filen, klicka på.exe-filen och följ instruktionen för installering. Här ger vi en kort instruktion om hur använda ELAN, i första hand för Windowsanvändare, men kortkommandon för macos finns med i Bilaga 2. Om du använder ELAN för att skapa en annoteringsfil behöver du en komprimerad film, t.ex..mp4,.mpg, m.m., för att kunna komma igång. Om du däremot använder ELAN för att titta på en färdigannoterad film krävs att filmen har en medföljande annoteringsfil. Så här ser ELAN-fönstret ut. 4 Menyfält Annoteringskontroller Markeringssätt Databasfönster för annoteringar Mediafönster Mediakontroller Tidslinje Radmeny Markeringskontroller Dra i dubbelstrecket för att ändra storleken på mediafönstret Annoteringsfönster 3 Om inte din dator uppfyller kraven som är listade under Description, så klicka på Previous releases lite längre ned och lokalisera en installeringsfil som passar din dator. 4 Bildexempel i detta häfte är hämtade från ECHO-materialet (Bergman & Mesch, 2004) och Svensk teckenspråkskorpus (Mesch et al. 2012). Medföljande annoteringsfiler; se Mesch (2021). 3
Arbeta med annoteringar För att skapa en ny annoteringsfil behöver du en videofil som finns i en mapp på din dator eller i någon enhet, t.ex. ett USB-minne. I annoteringsfilen kan man skapa flera nya rader och börja annotera videomaterialet. ELAN synkroniserar videosekvenserna med de annoteringar som skrivs. Spara eaf-filen efteråt. Skapa en ny annoteringsfil Skapa en ny annoteringsfil genom att klicka på Fil i menyfältet och välja Ny a) Välj en komprimerad film från passande mapp, gärna en film i videoformatet MP4 eller MPG. Klicka >> (eller dubbelklicka på videofilen). Man kan också välja två eller flera videofiler från ett och samma inspelningstillfälle (med samma tidsperiod), då blir det två eller tre parallella mediafönster. Lägg till fjärrfil b) Om du har en annoteringsmall tillgänglig, en etf-fil, så klicka på Mall och välj mall. c) Klicka på OK. När du har valt en videofil, får du ett tomt annoteringsfönster. 4
d) Spara annoteringsfilen som en eaf-fil med ett passande filnamn. Skapa eller ändra radtyp Man kan skapa eller ändra radtyp. Radtyper används för att sortera olika rader i en viss hierarki. a) Skapa ny radtyp genom Typ > Lägg till ny radtyp eller använd CTRL + SHIFT + T. 5 b) Skriv in namn på den nya radtypen, t.ex. Glosa_DH. c) Klicka på Lägg till och Stäng. d) För att göra förändringar i en befintlig radtyp väljer du Typ > Ändra radtyp Skapa eller ändra rad Man kan skapa eller ändra en rad. a) Skapa ny rad med Rad > Lägg till ny rad, eller använd CTRL + T. 6 b) Skriv in radnamn. c) Klicka på Lägg till. d) Fortsätt med flera radnamn tills du är klar. e) Klicka på Stäng. f) För att ändra inställningar för en rad väljer du Rad > Ändra radens attribut. 5 För Mac: SHIFT + COMMAND + T 6 För Mac: COMMAND + T 5
Skapa ny annotering Börja med att förstora annoteringsfönstret genom att klicka på annoteringsfönstret med höger musknapp, klicka på Zoom och utöka till t.ex. 200 %, eller dra dubbelstrecket i gränslinjen ovanför annoteringsfönstret uppåt/neråt. Man kan skapa en ny annotering på två sätt: genom att använda tangentbordet eller musen. Det mest exakta, och dessutom mest ergonomiska sättet, är att sätta in tidsmarkören på ett visst ställe och använda CTRL + eller (högerpil eller vänsterpil) och hålla CTRL nere medan du klickar på pilen ett antal gånger för att hitta en exakt startpunkt för annoteringen. Så går annoteringsarbetet till: a) Innan du börjar, rensa val för markering genom att klicka på S i markeringskontrollerna. Tidskoden Val: (ovanför markeringskontrollerna) blir noll. Du kan också trycka på CTRL + SHIFT + Z för att rensa val och samtidigt avmarkera Markering i knappfältet Markeringssätt, (se Översiktsbild på s.3). Rensa val Eller rensa val och avmarkera Markering med CTRL + SHIFT + Z b) Spela filmen genom att hålla nere CTRL och trycka på Mellanslag. Eller klicka på Playknappen i knappfältet mediakontrollerna. 6
c) Se till att rätt annoteringsrad är aktiverad (radnamnet rött och understruket, raden rosa). För att aktivera en rad, dubbelklicka på radnamnet. d) När du har bestämt dig för att annotera ett tecken, pausa filmen vid det ställe du ska annotera. Använd CTRL + eller 7 och håll CTRL nere medan du klickar på pil flera gånger eller håll pil nere för att hitta en exakt startpunkt för annoteringen. e) Markera startpunkten genom CTRL + K 8, (alternativt klicka direkt i kryssrutan vid Markering, finns mellan databas- och annoteringsfönstret). f) Håll nere CTRL medan du klickar på pil för tidsperioden av annoteringen tills du kommer till en slutpunkt för annoteringen. Den valda tidsperioden är blåfärgad. g) Avmarkera Markering genom CTRL + K, eller klicka direkt i kryssrutan. h) Skapa en annotering genom att använda CTRL + ALT + N så att en tom ruta kommer upp. Det gäller alltså den markerade raden (understrukna raden i vänstra menyn). Du kan växla mellan aktivering av olika rader med CTRL + UPPÅT-/NEDÅTPIL. Skriv in en annotering, t.ex. en glosa, eller välj en glosa från den kontrollerade ordlistan om sådan finns (se s. 13). Aktivera aktuell annoteringsrad Markera startpunkt för annoteringen CTRL + K Håll CTRL nere och klicka på pil framåt till en slutpunkt Därefter CTRL + K för att avmarkera kryssrutan vid Markering i) Viktigt! Bekräfta annoteringen med CTRL + ENTER. 9 7 För Mac COMMAND + eller 8 För Mac COMMAND + K 9 För Mac COMMAND + ENTER 7
Ett snabbare, men mindre exakt, alternativ för att skapa annotering: a) Se till att rätt rad är aktiverad. b) Välj ett lämpligt segment genom att hålla ned vänster musknapp och dra med musen från startpunkten till slutpunkten av det du vill annotera. c) Dubbelklicka i det blåmarkerade segmentet i den aktuella raden, alternativet använd CTRL + ALT + N, och skriv in en anteckning, t.ex. en glosa, i den tomma rutan som kommer upp. CTRL + ALT + N öppnar en annoteringsruta Skriv in en annotering Aktiverad rad d) Bekräfta annoteringen med CTRL + ENTER. CTRL + ENTER för att bekräfta annoteringen Ändra innehållet i en annotering Välj en annotering där du vill ändra innehållet. a) Dubbelklicka på annoteringen i annoteringsfönstret och skriv in en annan glosa. b) Bekräfta annoteringen med CTRL + ENTER. 10 c) I flikarna Text och Rutnät i databasfönstret kan du också ändra innehållet i annoteringen. Även där måste du bekräfta ändringen med CTRL + ENTER. 10 För Mac COMMAND + ENTER 8
Ta bort annotering Du kan ta bort en annotering så här: a) Välj annoteringen som du vill ta bort, genom att klicka på den en gång. Annoteringen blir då blåfärgad. b) Annotering > Radera annotering. Alternativet är att använda CTRL + DELETE. Skapa annotering med samma tidsperiod i en annan rad Du kan skapa en annotering inom samma tidsperiod men på en annan rad. a) Markera en målrad genom att klicka två gånger på raden i radmenyn. b) Markera en annotering i källraden som du vill ha samma tidsperiod för en ny annotering i målraden. c) Klicka på CTRL + ALT + N. Då kommer det upp en tom annoteringsruta i målraden. Ändra tidsperioden för en annotering Du kan ändra tidsperioden för annoteringen. Det kan gälla ändring av start- och/eller sluttiden. a) Markera annoteringen som du vill ändra. b) Kryssa Markering (finns mellan databas- och annoteringsfönstret) eller CTRL + K. c) Tidigarelägg starttiden genom CTRL + J (alternativt CTRL + ). d) Senarelägg starttiden genom CTRL + U (alternativt CTRL + ). e) Tidigarelägg sluttiden genom CTRL + SHIFT + J. f) Senarelägg sluttiden genom CTRL + SHIFT + U. Bocka för Markering Ändra starteller sluttid g) Bekräfta ändringen med CTRL + ENTER. h) Glöm inte att avmarkera Markering eller CTRL + K. 9
Överordnad rad och underordnad rad Du kan skapa en underordnad rad (t.ex. riktning) för en överordnad rad (t.ex. Glosa_DH). a) Typ > Lägg till ny radtyp... b) Skriv artikulator i rutan för typnamn. c) Välj Symbolisk koppling i rutan för Typmall. d) Lägg till. e) Stäng. f) Rad > Lägg till ny rad. g) Skriv Artikulator_DH S1 i rutan för radnamn. h) Välj Glosa_DH S1 som överordnad rad (byt ut Ingen till Glosa_DH S1). i) Välj artikulator som radtyp. j) Lägg till. k) Stäng. Jobba som vanligt med annoteringar. Notera att i den underordnade raden är annoteringsgränserna gulfärgade. OBS! Om man tar bort den överordnade raden så försvinner den underordnade raden. I följande bild syns den underordnade raden som du skapade enligt instruktionerna här ovan. Välj Rutnät Klicka på nedåtpilen t.v. om <välj en rad>, välj Flera rader med symbolisk gruppering Klicka på <välj en rad>, välj Glosa_DH S1 Underordnad rad Artikulator_DH S1 Annoteringar för överoch underordnade rader Den underordnade raden Artikulator_DH S1 Gulmarkerade underordnade annoteringar: da kopplad till glosan ANPASSA ea_ml kopplad till glosan REDAN 10
Glöm inte att spara den annoterade filen genom att välja Fil > Spara som. och välj mapp och filnamn i fönstret som öppnas. Klicka på Spara. Eller använd CTRL + S. 11. Det blir tre filer för ett annoteringsarbete: a) videofil i formatet MP4, MPG, eller liknande b) annoteringsfil.eaf c) inställningsfil.pfsx som skapas automatiskt då man sparar filen I psfx-filen lagras inställningar för hur annoteringsdokumentet såg ut när du jobbade med det, så som vilka rader som var synliga, vilken färg de olika radnamnen hade ute i vänsterkanten, etc. Om ELAN inte hittar någon psfx-fil när du öppnar en annoteringsfil så skapas en ny med nya inställningar där alla rader syns, och då får du ställa in hur du vill ha det innan du sparar dokumentet igen. I pfsx-filerna lagras inte några egentliga annoteringsdata. Skapa bilder från videosekvenser Du kan skapa en bild av det aktuella ELAN-fönstret, där media-, databas- och annoteringsfönstren finns med. Fil > Exportera som > Bild från ELAN-fönster Döp filen och spara den i en mapp. Om du endast vill ha en stillbild från videon, klicka på mediarutan med höger musknapp och välj Spara aktuell ruta som bild. I fönstret som öppnas, välj passande filnamn, filformat och ställe på datorn. Rutan sparas som bild, som kan behandlas som vanlig bildfil, t.ex. infogas i Word för att exemplifiera tecken i en text. Bildsekvensexempel. Bilder kan användas som stöd till teckenspråksexempel i en text. 11 För Mac COMMAND + S 11
Hämta resultat till Word eller Excel Det finns många olika sätt att flytta annoteringar till Word eller Excel. Det enklaste sättet är att spara en textfil med annoteringarna uppdelade på ett ord per rad. a) Fil > Exportera som > Ordlista b) Välj vilka rader som ska finnas med. c) Se till att Standardinställningar är markerat (under Teckenavgränsare). d) Klicka på OK. e) Ett nytt fönster öppnas. Där ger du filen ett passande namn och väljer var i datorn den sparas. Avsluta med Spara. f) Textfilen kan öppnas med valfritt ordbehandlingsprogram (Notepad, Word, m.m.). Flytta resultaten till Word: a) Fil > Exportera som > Traditionell transkriptionstext b) Välj vilka rader som ska finnas med. c) Välj inställningar för radbrytning, numrering av annoteringar, om radnamn och tidkoder ska finnas med, m.m. d) Klicka på OK. e) Välj passande namn och plats för filen i fönstret som öppnas. Avsluta med Spara. f) Öppna filen i Word. Exportera annoteringar till Excel: a) Fil > Exportera som > Tab-avgränsad text. b) Välj rader och tidskoder (t.ex. Starttid och tidformat hh:mm:ss:ms). c) Klicka på OK d) Ett separat fönster öppnas (Exportera rad(er) som tab-avgränsad text). Där väljer du mapp, filnamn i rutan för Filnamn, och (*.tsv) i rutan för Filformat. e) Klicka på Spara. f) Öppna filen i Excel. OBS! Vissa program kan ha svårt att läsa specialtecken så som svenskans /å ä ö/, och då ersätts dessa med konstiga tecken. Gör då om exporteringen men se till att du i det sista fönstret där filen sparas, ändrar inställningarna för Kodning till UTF-16 (från standardinställningen UTF-8). 12
Skriv ut annoteringar direkt ifrån ELAN Det går också att skriva ut annoteringarna direkt ifrån ELAN. Börja då med att anpassa utseendet på utskriften. a) Fil > Förhandsgranska utskriften. b) I fönstret som öppnas kan du välja olika inställningar och se direkt hur de påverkar utseendet på din utskrift. Se till att du efter varje ändring klickar på Utför ändringar för att uppdatera granskningsfönstret. c) Här ställer du in vilka rader som ska skrivas ut, textstorlek och radavstånd, om du vill ha med radnamn och tidkod, om utskriften ska ha sidnummer, m.m. d) Bocka för Radbrytning för att få plats med långa annoteringar. Om du har över- och underordnade rader, välj gärna Varje annoteringspost i rutan för Brytning mellan poster så att varje annoteringspost 12 börjar på ny rad. e) Klicka på Skriv ut. Välj skrivare m.m. i dialogrutan som öppnas. f) Avsluta med Stäng. Kontrollerad ordlista Färdiga mallar (.etf) för annoteringsarbete har ofta en s.k. kontrollerad ordlista, CV 13, för glosor eller andra annoteringskategorier. CV är en lista med ett antal fördefinierade annoteringsvärden som kommer upp som en meny när du lägger in ny annotering. CV kan göra annoteringsarbetet snabbare och mer säkert vad gäller felskrivningar. CV med glosor När du arbetar med en mall som har CV och inte hittar någon lämplig glosa i ordlistan, använd då CTRL + ENTER för att stänga annoteringsrutan utan innehåll (alternativt tryck på ESC-knappen 12 Annoteringspost består av en oberoende överordnad annotering och alla underordnade annoteringar som är kopplade till denna. 13 Från Controlled Vocabulary i den engelska versionen av ELAN. 13
på tangentbordet). Håll därefter nere SHIFT och dubbelklicka på annoteringen, vilket öppnar annoteringsrutan. Skriv in egen annotering, avsluta med CTRL + ENTER. Om CV inte kommer upp automatiskt när du skapar en ny annotering (Annotering > Ny annotering här eller CTRL+ALT+N), så kan det bero på inställningar i din dator. Välj Redigera > Inställningar > Redigeringsinställningar > CV. Om Visa CV-beskrivning i rutan för direktredigering är förbockat, så har du hittat problemet. Avkryssa i så fall alternativet. 14
Använda ELAN för att analysera teckenspråkstexter Öppna en befintlig eaf-fil ELAN kan användas för att titta på en video med en befintlig annoteringsfil. Du behöver två filer: en videofil (t.ex..mp4,.mpg) och en eaf-fil som innehåller anteckningar av olika slag, t.ex. transkription och översättning. Klicka på Fil > Öppna eller om du nyss har arbetat med eaffilen, Öppna senast använda fil. Öppna fjärrfil Bilderna visar val av Öppna, där ett separat fönster öppnas. Här väljer du vilken enhet och mapp du vill söka i. 15
När du har navigerat till rätt mapp, valt en eaf-fil och dubbelklickat på den, (eller klickat på Öppna), så öppnas den tillsammans med videofilen den tillhör. Om det står i meddelanderutan att video inte kan hittas så måste du lokalisera mediafilen för att länka den till eaf-filen. Det underlättar om videofiler och eaf-filer arkiveras i samma eller närliggande mapp. När du har öppnat en eaf-fil visas ett annoterat material som exemplet här nedan. Menyfält Annoteringskontroller Markeringssätt Databasfönster för annoteringar Mediafönster Mediakontroller Tidslinje Radmeny Markeringskontroller Dra i dubbelstrecket för att ändra storleken på mediafönstret Annoteringsfönster 16
Om en eaf-fil innehåller annoteringar för en dialog så kan två videofiler vara synliga samtidigt, som i bilden nedan. Det är bra att känna till följande finesser med ELAN: hastighet, mediafönster, databasfönster, tidslinje, markering, rader, byte av film och sökning av annotering. Mediafönster Filmen kan styras med mediakontrollerna, se översiktsbild s. 3. Genom att dra vertikalt med musen i dubbelstrecket i gränslinjen ovanför annoteringsfönstret kan du ändra storleken på mediafönstret. Du kan frigöra mediafönstret (en bildruta) genom att klicka i det med höger musknapp och välja Se i eget fönster. Dra i hörnet på det separata fönstret till lämplig storlek. Du kan också flytta fönstret till ett lämpligt ställe på skärmen. Återställ mediarutan genom att klicka i den med höger musknapp och välja Återställ till programfönstret, eller klicka på stängningsknappen X i övre högra hörnet. Du kan spara den aktuella bilden från videosekvensen genom att klicka på mediafönstret med höger musknapp och välja Spara aktuell ruta som bild. Ange namn, mapp och passande format i fönstret som öppnas, avsluta med Spara. 17
Databasfönster Databasfönstret innehåller flikarna Rutnät, Text, Underrubriker, Lexikon, Ljudigenkännare, Videoigenkännare, Metadata och Kontroll. Rutnät och Text är särskilt användbara för att se vad som finns i olika rader. Välj Rutnät, klicka i fältet <välj en rad> och välj någon av raderna från radlistan som visas. Tips för annoterare: I databasfönstret kan du ändra innehållet i en annotering. Glöm inte att som alltid bekräfta ändringen med CTRL + ENTER. 14 Här är de vanligaste användningsområdena för flikarna i databasfönstret: Rutnät Text Underrubriker Metadata Kontroll Klicka i fältet <välj en rad> och välj t.ex. Glosa_DH S1 15 från radlistan som visas, så syns alla annoteringar för denna rad och upp. Klicka i fältet <välj en rad> och välj t.ex. Glosa_DH S1 så visas alla annoteringar, t.ex. hela texten upp som en löpande text. Klicka i flera av fälten <välj en rad> och välj olika radnamn för att få fler rader samtidigt. Klicka på Välj källa till metadata, för att se information om videofilen (denna funktion är inte klar än för Svensk teckenspråkskorpus). Här kan man välja långsammare eller snabbare videouppspelning (Hastighet 100 %, 60 %, 200 %). (Dessutom Volym om man har ljudfil). Databasfönster för annoteringar. Klicka på Rutnät och välj t.ex. Glosa_DH S1 14 För Mac COMMAND + ENTER 15 Mesch & Wallin, 2021 18
Databasfönster för annoteringar. Klicka på Text och välj t.ex. Sv översättning S1 Tidslinje Tidslinjen ligger mellan mediafönstret och annoteringsfönstret. Dra det röda strecket, som markerar uppspelningshuvudets plats, framåt eller bakåt med vänster musknapp. Markera en viss videosekvens Klicka på någon annotering som då blir blå (markerad annotering) eller klicka och dra musen över flera annoteringar så blir flera annoteringar markerade. Du kan göra detta antingen genom att klicka på en annotering i annoteringsfönstret eller databasfönstret. Markera annotering Spela upp den markerade annoteringen Klicka på knappen i markeringskontrollerna för att titta på den markerade videosekvensen. Eller använd SHIFT + MELLANSLAG. 19
Göm eller synliggör rader Synliga rader I Radmenyn visas olika rader för annoteringar. Om du vill gömma en rad, klicka på menyn med höger musknapp 16 och välj Göm [radnamnet] eller Visa/göm mera... Välj Göm allt eller enstaka rader. Du kan också byta ordning på raderna genom att markera en rad, dra den med vänster musknapp och släppa den på ny plats i radmenyn. Byt eller lägg till film Om du har flera videofiler med olika kameravinklar från ett och samma inspelningstillfälle (de måste ha samma tidsperiod), kan du byta film för den annoterade filen i mediafönstret. Det kan t.ex. vara en närbild på informantens ansikte eller en helbild på två informanter. a) Redigera > Länkade filer. b) I fönstret som öppnas, markera filen du vill ta bort. c) Klicka på Ta bort. d) Klicka på Lägg till... e) I ytterligare ett fönster som öppnas, markera filen du vill lägga till. f) Klicka på Välj, fönstret stängs. g) I fönstret som finns kvar, klicka på Utför och sedan Stäng. Se nästa sida (s. 21) för stödbilder för denna procedur. 16 För Mac COMMAND + klicka i Radmenyn 20
Redigera > Länkade filer Den tidigare länkade videofilen har tagits bort, ny har lagts till Tips: Man ha flera videofiler som är synkroniserade med varandra. Du kan välja vilka som är synliga genom Visa > Mediaspelare och ta bort markering i kryssrutorna för de videofiler som du vill gömma. 21
Sök annotering ELAN erbjuder olika alternativ för att söka genom annoteringsfiler: Du kan t.ex. söka efter en annotering i den eaf-fil som för tillfället är öppen i ELAN, efter en annotering i flera eaf-filer eller genomföra en mer avancerad sökning i en eller flera eaf-filer. Om du vill söka efter en viss annotering i den eaf-fil som du har framför dig i ELAN, använd Sök > Sök (och ersätt). Skriv in det du vill hitta, t.ex. PRO1, och klicka på Sök. Du får då ett visst antal förekomster av transkriptionen PRO1. Välj rad att söka i, här Glosa_DH S1 Skriv ett sökord, här PRO1 Klicka på Sök Klicka på en av annoteringarna så flyttas du till startpunkten av den valda annoteringen. 22
Man kan också leta efter en viss glosa/annotering i flera eaf-filer genom Sök > Sök i flera eaffiler... Då behöver man ange vilka filer man vill söka igenom, d.v.s. definiera sökdomän. Sök i flera eaf-filer Skriv ett sökord, här OCH och klicka på Definiera sökdomän Klicka på Ny domän för att skapa en ny domän Välj filer eller en mapp för sökdomänen, d.v.s. de filer du vill leta efter ett visst tecken i Dubbelklicka på en eller flera filer, eller en mapp, alternativt klicka på >> Avsluta med OK 23
Fönstret för val av filer stängs och en Spara-ruta öppnas. Ge sökdomänen ett passande namn Avsluta med OK Du kan också välja en befintlig domän Markera ditt val under Välj en existerande domän Avsluta med Ladda Här är resultatet från sökning efter glosan OCH i en sökdomän med fem valda eaf-filer Klicka på en av annoteringarna för att komma till annoteringen i den aktuella eaf-filen med tillhörande film 24
ELANs tredje sökalternativ är strukturerad sökning. Denna typ av sökning tillåter dig bl.a. att avgränsa sökdomänen till vissa rader och att använda sökformler (se s. 27) i sökning genom flera annoteringsfiler på samma gång. Välj Sök > Strukturerad sökning av flera eaf Ett sök-fönster öppnas där du kan välja Substring Search, Single Layer Search eller Multiple Layer Search. 17 Substring Search används för att söka en glosa eller ord i en sökdomän, d.v.s. en eller flera eaffiler, som du definierar själv. Här har sökdomänen redan definierats till 300 eaf filer Skriv in glosan du vill hitta Klicka på Find Single Layer Search erbjuder en något mer avancerad sökning än Substring Search. T.ex. kan man navigera fram och tillbaka i den aktuella sökhistorien och din sökhistoria kan sparas för att tas fram vid senare tillfälle. Vidare kan man bestämma om sökningen ska ta hänsyn till versaler/gemener, huruvida sökformler ska användas, m.m. Sökningen kan även begränsas till en viss rad, radtyp, informatör eller annoterare. En tidigare sparad sökhistoria med 19 sökningar har hämtats med Load query Inställningar för denna sökning: Sök i annoteringar Ta inte hänsyn till versaler/gemener Returnera alla annoteringar som innehåller söksträngen; här kan man välja att använda sökformler Sök i radtypen gloss_dh; här kan man även söka i annoteringar av en viss informant eller från en viss annoterare 17 Det svenska språkpaketet för ELAN är under utveckling. Sökfunktionerna innehåller fortfarande ett flertal engelska termer. 25
Multiple Layer Search är den mest omfattande sökfunktionen i ELAN. Exemplet nedan visar hur denna funktion kan användas för att hitta tecken med dubbel artikulator genom att söka på da, dubbel artikulator. För alla sökfunktioner gäller att om man klickar på en av annoteringarna i sökresultatet så förs man till annoteringen i den aktuella eaf-filen med tillhörande film. 26
Sökformler (reguljära uttryck) Ett mycket användbart verktyg som kan användas i alla sökfunktioner i ELAN, är s.k. reguljära uttryck ( regular expressions på engelska), eller sökformler. Sökformel är en sekvens med bokstäver och specialtecken där vissa tecken, s.k. metatecken, har speciell betydelse. Sökformler gör det möjligt att söka efter textsträngar som matchar mer komplicerade sökmönster, t.ex. om du vill hitta en viss glosa med en viss taggning, i en viss position inom en annotering, och samtidigt ange vilka sökresultat som ska uteslutas. En bra sökformel kan ersätta flera vanliga sökningar med en enda och därmed spara tid. Om vi tittar igen på rutan som öppnas när vi väljer Sök > Sök (och ersätt) (se s.22), så innehåller den ett alternativ som man kan bocka för, reguljära uttryck. Om denna ruta inte är markerad så måste söktermen vara exakt som det du söker efter. Om du skulle vilja hitta PRO1 så måste du söka efter PRO1. När reguljära uttryck är förbockat så kan du skriva PR och få fram alla glosor som innehåller denna bokstavskombination, däribland PRO1, SPRINGA, o.s.v. Dessutom kan sökningen då få hjälp av sökformler och därmed göras mycket specifik. Om du t.ex. vill få fram endast de PRO1 som finns i början av en annotering så kan du använda specialtecknet ^ och skapa sökformeln ^PRO1. Då returnerar sökfunktionen endast PRO1 som inte föregås av något annat. Observera att för att sökformler med versaler ska fungera så måste skiljer på versaler/gemener också vara förbockat. Välj rad att söka i Markera rutan för reguljära uttryck Markera rutan för skiljer på versaler/gemener Skriv ^PRO1 Klicka på Sök Se s. 28 för översikt över metatecken och sökformler. 27
Här följer tabeller med några av de vanligaste metatecknen och sökformlerna som kan användas i ELAN. Metatecken punkt. asterisk * plus + frågetecken? hatt ^ dollartecken $ parenteser ( ) hakparenteser [ ] lodstreck bakstreck \ När alternativen reguljära uttryck och skiljer mellan versaler/gemener är markerade så kan följande söksträngar användas: Enskilda tecken och textsträngar Metatecken. [ ] [^ ] x Alla förekomster av tecknet x. Ett godtyckligt tecken (vilket som helst) Exempel Vanlig sökning: a för att hitta tecknet a antingen ensamt eller som en del av en längre textsträng a.c för att hitta abc, men också acc, aac, axc, o.s.v. Alla kombinationer av a och c med något i mellan [ ] Ett eller flera bestämda tecken [abc] för att hitta något av tecknen a, b eller c [ - ] Bestämda tecken inom ett intervall [^ ] Ett eller flera bestämda tecken som sökningen inte ska matcha [a-c] för att hitta något av tecknen a, b eller c [0-9] för att hitta något av 0, 1, 2, 3, 4, 5, 6, 7, 8 eller 9 [^abc] för att hitta ett tecken som inte är a, b, eller c (^ negerar här, se annan betydelse under Ankring) Observera att de flesta tecken som är speciella i reguljära uttryck är inte speciella inom hakparenteser. T.ex. används [9.*] för att hitta en nia eller en punkt eller en asterisk. Utanför hakparenteserna hade både punkten och asterisken haft en särskild betydelse. Metatecken ^ $ Ankring Exempel ^ Ett tecken i början av en symbolsträng ^GREPP för att hitta alla annoteringar som börjar med GREPP, - utesluter t.ex. BEGREPP $ Ett tecken i slutet av en symbolsträng PRO$ för att hitta alla annoteringar som slutar med PRO, - utesluter t.ex. PRO1 och PROGRAM 28
Bakstrecket betyder någonting tillsammans med det tecken som följer direkt efter det. Om det man söker efter innehåller en symbol som råkar vara ett metatecken, så placerar man ett bakstreck för at att få fram det man önskar. Bakstreck \ Metatecken \ Behandlar efterföljande symbol som ett vanligt tecken Exempel \*24\*för att hitta alla *24* Bakstrecket används för att visa att det verkligen ska vara med asterisker i det du vill söka efter Eftersom teckenspråksannoteringar innehåller specialtecken för att indikera t.ex. sammansättningar, ^, eller sammansmältning, *, så är bakstrecket oumbärligt vid sökning med sökformler. Metatecken som kan användas i sökformler i ELAN och som även förekommer i annoteringskonventioner för STS-texter är: asterisk (*), bindestreck (-), plus (+), punkt (.), hatt (^), och hakparenteser ([ ]). Repetitioner Metatecken * +? {} * Noll eller flera av det föregående tecknet + Ett eller flera av det föregående tecknet? Noll eller en av det föregående tecknet Exempel ab*c för att hitta ac, abc, abbc, abbbc, o.s.v. (Observera att här är det bara b som påverkas, antingen repeteras i det oändliga eller är inte med alls) ab+ för att hitta ab, abb, abbb, abbbb, osv., hur långt som helst (Obs: det är bara b som repeteras. Utesluter t.ex. abab-ab) ba? för att hitta b och ba, men inget annat (Med? efter något anger man ett det är frivilligt, dvs. det kan vara med en gång eller inte alls) Skillnaden mellan asterisken * och plustecknet + är att asterisken även tillåter att den repeterade delen inte är med någon gång alls. ab* matchar samma texter som ab+, men dessutom även a. Alternativ Metatecken Exempel Eller VIT SVART GRÅ för att hitta VIT, SVART, eller GRÅ Parenteser Metatecken ( ) ( ) Föra samman ett större uttryck Exempel (GRÅ LITEN/STOR) KATT för att hitta GRÅ LITEN KATT eller STOR KATT 29
Ovanlistade metatecken kan kombineras vidare till längre sökformler, se följande tabell. I tabellen förekommer snabel-a, @. Det används tillsammans med vissa efterföljande symboler för att markera, tagga, glosor för ett antal olika kategorier. Se även lista med exempel på ordklass- och kategoritaggar på s.31. 18 Exempel på sökformler med kombinerade metatecken Matchar Kommentarer.+ Alla annoteringar Versaler och gemener, siffror och symboler.* [A-ZÅÄÖ]+ Godtyckligt många tecken, vilka som helst Alla bokstäver i versaler A.*A matchar två A med vad som helst mellan sig, t.ex. ALLA, ANNA, APA HOPPA eller bara AA EMFA.* för att hitta både EMFAS och EMFATISK Utesluter siffror och andra tecken som inte tillhör alfabetet. Versaler indikerar glosor i STS-annoteringar @b Alla annoteringar med @b @b är taggen för glosor med bokstavering [A-ZÅÄÖ]+@ Alla bokstavskombinationer i versaler som avslutas med @ @ är själva taggsymbolen @b\^+.+@b Bokstaverade sammansättningar Utesluter enskilda glosor med bokstavering [^@& @x]$ Alla annoteringar utom de som avslutas med @& och @x [^ ] negerar @& markerar avbrott eller nonsens-rörelser @x markerar att det är otydligt om tecknet utförs \^ Sammansättningar Ofta svenska lån, t.ex. YRKE^SKOLA. \ gör att ^ behandlas här som ett vanligt tecken \* Sammansmältningar T.ex. SE\*UT \+ Morfemgräns x[xx]x Två olika glosor T.ex. VARELSE+SITTA@p eller VARELSE(N)+GÅ+ENTITET(J)@p A[PR]A matchar APA och ARA (Man måste välja ett av alternativen inom [ ] ) (@b @g) Alla annoteringar med @b och @g Glosor taggade för bokstavering och gester.+(@b @g).+[^@]$ xxx x[xx]x Alla glosor med @b och alla glosor med @g Alla glosor utom de som avslutas med @ Tre olika glosor Glosor med bokstavering och glosor med gester Obs: Jämför denna sökformel med nästa ovanför Exempel på hur sökformel kan användas för att filtrera bort det man inte vill hitta SKA L[AO]R matchar SKA, SKALAR och SKALOR (Alternativet efter lodstrecket har två varianter) Glöm inte att hakparenteser kan användas om alla alternativ består av ett (1) tecken, så istället för a e i o u är det enklare att skriva [aeiou]. 18 Mesch & Wallin (2021). 30
Följande tabeller innehåller ett urval av taggar hämtade från en längre lista över de taggkategorier och ordklasstaggar som används i svensk teckenspråkskorpus. Exempel på tagg-kategorier Tagg @b @g @z @en @p @& @hd @rd @uppr Förklaring Bokstaverat tecken eller bokstaveringar Gestliknande tecken Osäker tolkning (ej glosat tecken eller osäkert glosat tecken) Egennamn, ortnamn Avbildande/produktiva tecken (polysyntetiska tecken) Avbrott eller nonsensrörelser Artikulatorn från tidigare tecken hålls kvar i position Tecken i reduplicerad form Tecken som upprepas Notera att hakparenteser, [ ], används för ordklasstaggar, se tabellen nedan. När du vill skriva sökformler för att få fram glosor markerade med en viss ordklass, så måste bakstreck, \, användas för att hakparenteserna ska ingå i sökningen. Exempel på ordklasstaggar Tagg Förklaring I sökformel [AB] Adverb \[AB\] [NN] Substantiv \[NN\] [VB] Verb \[VB\] [PEK] Pekning \[PEK\] [PN] Pronomen \[PN\] 31
Kortkommandon Mest använda kortkommandon för ELAN med Windows (se flera kommandon i Bilaga 1). Det finns fler kortkommandon i ELAN, Visa > Kortkommando. Spela/pausa media Gå till nästa/tidigare bildruta Gå till nästa/tidigare pixel Gå till början av media Aktivera nästa rad Spela markerad annotering Rensa val Rensa val och markering Markering Ny annotering Ta bort annoteringsvärde Radera annotering Ångra CTRL + MELLANSLAG CTRL + eller CTRL + SHIFT + eller CTRL + B CTRL + NEDÅTPIL SHIFT + MELLANSLAG ALT + SHIFT + C CTRL + SHIFT + Z CTRL + K CTRL + ALT + N CTRL + DELETE CTRL + ALT + D CTRL + Z Mest använda kommandon för ELAN med Mac (se flera kommandon i Bilaga 2). Spela/pausa media Gå till nästa/tidigare bildruta Gå till nästa/tidigare pixel Gå till början av media Aktivera nästa rad Spela markering Rensa val Rensa val och markering Markering Ny annotering Ta bort annoteringsvärde Radera annotering Ångra CTRL + MELLANSLAG COMMAND + eller COMMAND + SHIFT + eller COMMAND + B COMMAND + NEDÅTPIL SHIFT + MELLANSLAG SHIFT + ALT + C CTRL + SHIFT + Z COMMAND + K COMMAND + ALT + N ALT + DELETE ALT + D COMMAND + Z 32
Slutord Detta dokument, Bruksanvisning för annotering av teckenspråkstexter i ELAN, version 4, är en grundläggande instruktion för hur man arbetar med teckenspråkstexter i ELAN. Dokumentet kommer att uppdateras kontinuerligt och nya versioner kommer att finnas tillgängliga under följande länk: www.ling.su.se/teckenspråksresurser/verktyg/elan-och-annotation På samma sida finns Annoteringskonventioner för teckenspråkstexter, även den under kontinuerligt arbete, tillsammans med en färdig mall för transkribering av teckenspråkstexter i svenskt teckenspråk, med språkliga typer och rader. En avancerad engelsk manual för ELAN finns tillgänglig på nätet, se archive.mpi.nl/tla/elan/documentation. 33
Referenser Bergman, B. & Mesch, J. (2004). ECHO data set for Swedish Sign Language (SSL). Department of Linguistics, Stockholm University. Crasborn, O., Mesch, J., Waters, D., Nonhebel, A., der Kooij, E., Woll, B. & Bergman, B. (2007). Sharing sign language data online. Experiences from the ECHO project. International Journal of Corpus Linguistics 12:4. Crasborn, O., & Sloetjes, H. (2008). Enhanced ELAN functionality for sign language corpora. In Proceedings of the 3rd Workshop on the Representation and Processing of Sign Languages: Construction and Exploitation of Sign Language Corpora. ELAN (Version 6.2) [Computer software]. (2021). Nijmegen: Max Planck Institute for Psycholinguistics, The Language Archive. Retrieved from https://archive.mpi.nl/tla/elan Mesch, J. (2003). Att använda ELAN. Bruksanvisning för annotering av teckenspråkstexter. Institutionen för lingvistik, Stockholms universitet. Mesch, J. (2009). Att använda ELAN. Bruksanvisning för annotering av teckenspråkstexter. Version 2. Institutionen för lingvistik, Stockholms universitet. Mesch, J. (2011). Att använda ELAN. Bruksanvisning för annotering av teckenspråkstexter. Version 3. Institutionen för lingvistik, Stockholms universitet. Mesch, J. (2015). Svensk teckenspråkskorpus - dess tillkomst och uppbyggnad (Forskning om teckenspråk XXIV). Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet, 1-25. Mesch, J. (2016). Datamängd. Korpus för taktilt teckenspråk. Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. Mesch, J. (2021). Annoterade filer för svensk teckenspråkskorpus. Version 8. Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. 300 eaf-filer. Mesch, J., L. Wallin, A-L. Nilsson & B. Bergman. (2012). Datamängd. Projektet Korpus för det svenska teckenspråket 2009-2011 (version 1). Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. (www.ling.su.se/teckensprakskorpus) Mesch, J. & Wallin, L. (2021). Annoteringskonventioner för teckenspråkstexter. Version 8 (maj 2021). Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. 56 s. Nilsson, A-L. (2014). Datamängd. Projektet Teckenspråkets rumsliga dimension vid simultantolkning. Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. STS-korpus (2021). Avdelningen för teckenspråk, Institutionen för lingvistik, Stockholms universitet. https://teckensprakskorpus.su.se/#/ Öqvist, Z., Riemer Kankkonen, N., & Mesch, J. (2020). STS-korpus: A sign language web corpus tool for teaching and public use. In E. Efthimiou, S.-E. Fotinea, T. Hanke, J. A. Hochgesang, J. Kristoffersen, & J. Mesch (Eds.), Proceedings of the {LREC2020} 9th Workshop on the Representation and Processing of Sign Languages: Sign Language Resources in the Service of the Language Community, Technological Challenges and Application Perspectives. (pp. 177-180). European Language Resources Association (ELRA). 34
Resurser på Internet Annoteringsprogrammet ELAN kan hämtas från nätet, liksom en manual på engelska http://www.lat-mpi.eu/tools/elan/ ECHO-projektet https://archive.mpi.nl/tla/islandora/object/tla%3a1839_00_0000_0000_0001_494e_3?f%5b0%5d=cmd. Language%3A%22Swedish%5C%20Sign%5C%20Language%22 Svensk teckenspråkskorpus https://teckensprakskorpus.su.se/#/ 35
Bilaga 1: Kortkommandon för ELAN med Windows 36
37
Bilaga 2: Kortkommandon för ELAN med Mac 38
39