Transkription och direktglossning av dialektinspelningar i SveDiaSyn



Relevanta dokument
Förslag till riktlinjer för översättning och transkription av det spontana materialet i den publika databasen. Översättning

Utskrift av dialektinspelning från Björnlunda socken, Södermanland

Acapela TTS. Inställningar och korrigering av uttal. Emma och Erik

Introduktion till transkription i CHAT med länkning av audiofiler

Kurslitteratur Taltranskription: Introduktion

Undervisningsmål Svenska Årskurs 1-5. Läsa

Marie Andersson, IKT-centrum E-post: (Bb Learn 9.1.8) Wikis i Blackboard

Allemansdata Dags fö r örd

LäsFlyt Metodhandledning

Digital Display VDS / Bus2

Du ska även kunna förklara och själv använda följande begrepp: dialekt, skorrande, mål, påverkat, påminner, betona, centrum, obegriplig

IntoWords webb elevdata.se

WordRead Plus för Mac

RAPPORT: ATT UPPLEVA EN UTSTÄLLNING HELT I LJUD. FÖR UTSTÄLLNINGEN VÄRDEFULLT. BAKGRUND..s 2 METOD...s 2 RESULTAT...s 3 9 ANALYS AV WORKSHOP...

LÄROPLAN FÖR GRUNDSKOLAN, FÖRSKOLEKLASSEN OCH FRITIDSHEMMET 2011 SVENSKA Ämne: Svenska åk 4-6

Pedagogisk planering Åk 2 Skriva brev

LÄSLANDET - BOKSTÄVER OCH ORD

(Termen grammatiskt läsande och skrivande kommer från det antika Grekland - grammatisk kunskap: förmågan att hantera bokstäverna)

Omvandla din dator till en flerspråkig maskin

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: minuter beroende på variant Material: TI-82/83/84 samt tärningar

Lathund Spåra ändringar

Din väg till svenskan

DATALOGISK. Observationer Reviderad Oderup 9267, Hörby, Tel ,

ViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument

ClaroRead Plus Mac Manual. Artikel.nr

E-POST3 Ett lättanvänt e-postprogram med stöd för talsyntes

Att använda Stava Rex i Word 2007

Handledning för utskriftspersonal. Att skriva ut dialogförhör

Kort introduktion till SchoolSoft för vårdnadshavare

Övning 1: Vad är självkänsla?

Klicka på en sökrad för att få fram hänvisningar, fullständig information och möjlighet att skicka meddelande via e-post eller sms.

Seriehantering. [En enkel guide för hur du som serieadministratör använder SVEMO TA.]

Virkade raggsockor By: Pratamedrut

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Senaste revideringen av kapitlet gjordes , efter att ett fel upptäckts.

Lathund för överföring av rapporter och ljudfiler

VASS HBI Användarmanual

FÖR DATORER. Historiskt arkiv. Användarguide. För Österbottens Tidning

Neuropedagogik Björn Adler, Hanna Adler och Studentlitteratur Bilaga 1:1 Arbete med schema för bokstäver Kognitiv träning i läsning

Nå Framgång på Instagram En guide till små och medelstora företag

Här kan du välja befintligt upplägg eller skapa ett nytt. Klicka på edit uppe till höger för att redigera och/eller skapat nytt.

Lägga till olika dokument i en fil

Nordiska språk i svenskundervisningen

Studio Ett den 12 december: Svensk film med svensk textning

MEDBORGARPANEL Nummer 1 - Juli 2013 Tillgänglighet i vården

SVA 3.18 SVENSKA SOM ANDRASPRÅK. Syfte

UTVÄRDERING AV KOMPETENSHÖJNING I UTTALSPROJEKTET

För att använda sifferkrypto använder man en rektangel om 5 gånger 6 bokstäver.

Bruksanvisning Sportanläggning

En snabb titt på XML LEKTION 6

Barns brukarmedverkan i den sociala barnavården - de professionellas roll för barns delaktighet

Handledning Sfi i Hjo «Vi lär oss svenska tillsammans»

Microsoft Publisher. Laborationskompendium för digital behandling av publikationer. Detta exemplar tillhör:

HJÄLPFIL: LÄRARAPPLIKATIONEN

Vad händer med de svenska dialekterna? 19/ Margareta Svahn

SVENSKA 3.17 SVENSKA

Instruktion för att slutföra registreringen

Positiv Ridning Systemet Arbetar min häst korrekt? Av Henrik Johansen

Rolladministration i PaletteArena 5.3

Pensioner! - En studie om!

CSN-rapportering, gymnasiet

Innehåll. Förord 8 Inledning 10 Läsning 16 Läs- och skrivförberedelse 18 Före bokstäver och siffror 21. In i läsarnas klubb 44

Föräldraenkät gällande verksamheten på fritidsklubben Vängåvan vt-14

Resurscentrum för kommunikation Dako SymWriter. Minimanual

OM UNGDOMSARBETSLÖSHETEN

Lathund för att arbeta med pdf

Tentaupplägg denna gång

Elmia Mässkatalog för PocketPC

Matriks Doc 3 Skapa brevmall. Navision / Microsoft Dynamics NAV. Hur du skapar en brevmall i Word för Matriks Doc som kan användas via kundkortet.

Manual Nedladdningsbara klienten NLK

VGR mediebank. Logga in med ditt AD konto. Accepterar bilder, filmer, dokument och vektorformat

Tornedalsfinska - Meänkieli - Kan språkteknologiska verktyg för finska anpassas till meänkieli?

MONTERING ANVISNINGAR

Komma igång med Eventor

Så här skrivs faktablad om MSB-finansierade forskningsprojekt

Lär dig sökmöjligheterna i Disgen 8

OM KRITERIER av Emelie Johnson Vegh och Eva Bertilsson, publicerad i Canis 2004

GUIDE FÖR RECENSIONSVERKTYGET

Semester och arbetstidsförkortning

Tillsyn enligt personuppgiftslagen (1998:204) av Göteborgs universitet (Svensk nationell datatjänst)

KOMMUNALT AKTIVITETSMEDLEMSBIDRAG

LITEN LATHUND TILL ALUMNDATABASEN

Familj och arbetsliv på 2000-talet. Till dig som är med för första gången

Manual för E-tjänsten Statsstödsrapportering

Undersökning om pensioner och traditionell pensionsförsäkring. Kontakt AMF: Ulrika Sundbom Kontakt Novus: Anna Ragnarsson Datum:

Dela, samarbeta, byt. Bruksanvisning för administratörer

1. Att lyssna 1. Titta på den som talar. 2. Tänk på vad som sagts. 3. Vänta på min tur att prata. 4. Säg det jag vill säga. 1.

ORDNA DINA BILDER. Var finns bilderna Var bör de finnas

Vattenfall Vindkraft Högabjär. MarkCheck September 2010

Svenska fonetiska tecken med Word och Unicode

Så här fungerar registreringen i Malmö stads Odlingsslottskö

I vilket förhållande står du till din anhörige som har problem med alkohol/droger? make/maka son/dotter förälder syskon arbetskamrat annat.

Matris för engelska, åk 7-9

Handledning för uppsatsadministratörer

Avundsjuka och Besvikelse. Besvikelse Jag kanske blandar ihop besvikelse med sorg ibland, men jag tror att båda har en närhet av varandra i våra liv.

IT-körkort för språklärare. Modul 6: Video, del 2

Krypteringsprogrammet Kryptogamen

Välkommen till kommunens Lärportal. - Användarhanledning till dig som vårdnadshavare

Att lära sig läsa. Tips för en mjukstart på läsresan FRONT COVER

Resultat Varberg. 64 respondenter

Transkript:

Transkription och direktglossning av dialektinspelningar i SveDiaSyn I SveDiaSyn finns det två tillvägagångssätt då inspelningar ska överföras till skriftspråk: transkription och direktglossning. En transkription innebär att man gör en ljudnära överföring till skriftspråk och direktglossning innebär att man inte tar hänsyn till uttal, utan gör en direkt överföring till svensk skriftstandard (med vissa viktiga undantag). transkription: Å sen samtidit såm dän låckar till säj fågel så # hämtar dän ju fågel då ## direktglossning: Och sedan samtidigt som den lockar till sig fågel så hämtar den ju fågel då Vi kommer att transkribera dialekter som ligger förhållandevis långt från rikssvenska, medan andra dialekter kommer att direktglossas. Transkriberade dialekter glossas i ett senare skede. De särdrag som utmärker dialekterna kommer att specificeras i en kort kommentar för varje dialekt därför är det önskvärt att varje transkribent noterar dialektala egenheter som kan nämnas i denna kommentar. Se vidare nedan. En del filer är rätt långa bearbeta då bara de första 30 minuterna av ljudfilen. Många ljudfiler börjar med upplästa ordlistor; börja i så fall inte glossa/transkribera förrän det spontana talet kommer igång. Uppge var din text börjar i CHAT-filens början (alltså efter 40 min. 32 sek, till exempel). Om en ljudfil visar sig vara oväntat svårbearbetad så ska det noteras i sådana fall stämmer ju inte våra arbetstidsberäkningar. Detsamma gäller om en fil är oväntat enkel att jobba med. Transkriberade filer ska märkas med <tr> i filnamnet. Ett exempel: sprogeom3tr.cha. Glossade filer ska inte märkas på detta sätt (se vidare nedan). Innan du börjar transkribera kan det vara bra att lysssna igenom ljudfilen, så att du vet ungefär vad du har att vänta och så att du under transkriptionen inte plötsligt upptäcker att du sitter och lyssnar till en spännande berättelse och glömmer att transkribera... TRANSKRIPTIONSANVISNINGAR Transkriptionen kan beskrivas som en ljudenlig stavning som ligger nära en fonematisk transkription. Det finns dock vissa uppenbara begränsningar eftersom vissa ljuddistinktioner inte markeras, som exempelvis främre och bakre /r/. Vi har bedömt att läsbarheten och tillgängligheten av transkriptionen är det primära, på bekostnad av intressanta ljuddistinktioner som inte kan markeras. Principer för transkriptionen: försök komma så nära uttalet som möjligt i transkriptionen. Det bör alltså finnas en så direkt koppling som möjligt mellan bokstav och ljud. de allofoner som inte framgår av transkriptionen kan finnas med som kommentarer och tips på vad man särskilt kan lyssna efter, t.ex. variant av sje-ljud, tjocka /l/ eller förekomsten av både främre och bakre /r/ som i t.ex. västgötamål. dialektala ord: när du stöter på ett dialektalt ord finns det två strategier för att hantera det. Om du vet vad ordet betyder, och om det har en direkt etymologisk motsvarighet i rikssvenska så ska du använda det rikssvenska ordet och ange det dialektala inom hakparentes: fähus [föjs] 1

Om du däremot inte vet vad ordet betyder, och/eller om en direkt motsvarighet saknas så ska du skriva det dialektala ordet och markera det som dialektalt: föjs@d Du kan också, med denna senare metod, infoga ett frågetecken eller en möjlig översättning inom hakparentes: KONSONANTER föjs@d [fähus?] R-ljud stavas alltid <r> oavsett kvalitet. L-ljud stavas alltid <l> oavsett kvalitet. J-ljud stavas alltid <j>. Ex. <juren, jorde, ejentlien>. G-ljud stavas alltid <g>; undvik därför oftast finalt <g> i t. ex. <rikti, vikti, kånsti>. Sje-ljudet (som i station, kanske, choklad, sjö) stavas alltid <sj>. Ex. <stasjon, kansje, sjoklad>. Supradentaler (som i slutljudet i fors, bord, kort, sorl) markeras inte särskilt, utan skrivs enligt vanlig skriftstandard: <rt>, <rs>, <rl>, <rd>. Ex. <bårt, fårs>. Tje-ljudet (som i kök, kjol, tjattra) stavas alltid <tj>. Ex. <tjök, tjol, tjattra>. Konsonantreduktioner är vanliga i talspråk. Två exempel på vanliga konsonantreduktioner: Ex. 1. <ja # de ble ju inte så mycke nä man inte hade bil å barna va små > Ex. 2. <å få fö si å gå ut å så> Några bokstäver och bokstavskombinationer har komplexa relationer till fonemen. För transkriptionerna gäller följande: Grafemet <c> stavas alltid <s>. Ex. <presis, syklåp> (undantag: nedanstående <ch>, samt de fall då <c> ska återges med <k>: cupfinal, första förekomsten i cancer etc.). Digrafen <ch>, som i och, stavas alltid <ck>. Grafemet <x> stavas alltid <ks>. Ex. <eksakt, seks>. VOKALER Tecknet <e> ska reserveras för dialekter med verkligt slutet [e], använd annars <ä>; var konsekvent (så långt det är möjligt). Ex. 1. <reven freste> för räven fräste. Ex. 2. <dä ä inte mä mä dä> för det är inte mer med det. Tecknet <o> betyder alltid sluten vokal (som i ost, mod, bok); öppnare vokal skrivs <å> (<båll, bårta>) Diftonger: de mest iöronfallande diftongerna (tex skånska /u/, /o/ och /a/, eventuellt även /i/, /y/ och /e/) markeras med två vokaltecken. Ex. från Fårö: <dåm har trei åolika värsjåoner åm samma bit> 2

DIREKTGLOSSNINGSANVISNINGAR Vid direktglossning gör man en nedteckning av inspelningarna som inte är ljudnära. Alltså stavas ord så som de stavas i rikssvensk standard. Det finns två mycket viktiga punkter att tänka på: ordföljden i inspelningen ska återges exakt. antalet ord i inspelningen ska återges exakt. Man ska alltså göra en ord-för-ordnedteckning av dialektinspelningen, utan att lägga till eller ta bort ord. Båda dessa principer kan leda till att glossningen inte motsvarar standardsvenska detta är en nödvändighet för att eventuella syntaktiska särdrag i de respektive dialekterna ska vara synliga i glossningen. I norrländska dialekter förekommer till exempel vissa sammansättningar (se ex. 2 nedan) som man ska återge på samma sätt i glossningen. Notera också negationens placering i bisatsen i ex. 2. Ex. 1. Ex. 2. transkription: <Nä ä i fel litä ed> glossning: <Nej det är väl lite det> transkription: <Men e jer läiga bra ad änt e kåmm väkkerveire firi missomar.> glossning:<men det är lika bra att inte det kommer vackervädret före midsommar> I vissa fall kan det vara svårt att finna motsvarigheter till dialektala konstruktioner notera i så fall dessa svårigheter och gå vidare i glossningen. Markera pauser också vid glossning det gör ev. senare transkription lättare. KODER Vid transkription är det brukligt att ange pauser, ohörbart tal och så vidare med kodtecken. Det finns förutbestämda kodtecken i Chat/Clan (nedladddningsbara manualer finns på http://www.cnts.ua.ac.be/childes/), men de vanligaste och viktigaste är förtecknade nedan. Pauser i meningar markeras med <#>, <##> eller <###> (kort paus, lång paus och extralång paus). Ex. <å sen på vinten få man ju ta in dåm då # fö då gå dåm ju i ide ## åck ### eh ## ejentlien säjs de att man ska lägga dåm i tjylskåpet öve vinten> Ohörbart tal markeras med <xx> (ett ord) eller med <xxx> (flera ord). Oavslutade meningar eller omstarter markeras med <[/-]> Ex.1. <såm ja säje [/-] å likdant mä kläder å allting> Ex.2. < min fåssa han jobba ju me [/-] de e # ejentlien så e de> Påståenden, frågor och utrop/imperativer markeras med punkt, frågetecken och utropstecken. Varje replik i Chat-format ska avslutas med ett skiljetecken. Tvekljud skrivs som <eh, hm, em> osv. Försök begränsa variationen. Ex. 1.<för de # eh ## de finns ju inte undelag> Ex. 2.< å # eh # sen ä de väl # ja, såna dä småjåbb man kan ta, vikariat å så där. ja ## eh # ska kansje jåbba såm # em # fritisledare> 3

Upprepningar markeras i transkriptionen. Ex. <så de, men de va ju en, en # arbetsam tid # på de, de viset, att de va mycke handarbete> Stakningar markeras i transkriptionen. Ex. < inte en männsja såm vå vågade bygga där sen> Skratt markeras inte. Dialektala ord: vid dialektala ord så som glyttarna, ange att det är en dialektal form med kodtecknet <@d>. Skriv alltså <glyttarna@d>. I kommentaren kan sådana ord förklaras. Alternativt kan man ge en förklaring inom hakparentes (om man är säker på vad ordet betyder) se ovan. I en del dialekter är emellertid andelen dialektala ord mycket hög då ska inte denna metod användas. Intervjuarens tal bör också transkriberas. Ignorera så många störningar som möjligt t.ex. bakgrundsljud i pauser, intervjuarens feedback-signaler, onödiga frågor eller kommentarer från intervjuaren. Kommentarer och förklaringar kan sättas inom hakparenteser. Använd bara kommentarer och förklaringar om texten annars är obegriplig. Extra kodtecken Följande kodtecken kan också användas när det är nödvändigt: upprepning: bästa gissning: talet självdör: avbrott: <ord/fras/mening>[/] <ord/fras/mening>[?] <ord/fras/mening>+ <ord/fras/mening>+/. Använd dessa tecken restriktivt. CHAT-FILEN Hur sätter man bullets? Arbeta i Sonic Mode, markera en bit ljud och klicka sedan på den lilla symbolen s som finns längst till vänster på ljudgrafiken sätt först markören på den plats i texten där du vill sätta en bullet, alltså vid yttrandets slut. Namn på filer och deltagare? Använd namnen som finns i ljudfilen; OW1, OM2 och så vidare. Deltagarnas riktiga namn får inte skrivas ut! Skriv NN när den som ska intervjuas presenterar sig. Intervjuaren/-na kan kallas INT (och eventuellt INT2). Namnge CHAT-filerna efter ljudfilerna. Exempel: ljudfil: ste_om_1sp.wav namn på CHAT-fil: stenbergaom1.cha Ortnamnet ska alltså skrivas i sin helhet i CHAT-filens namn. 4

Headers? Använd följande mall för headers: @Begin @Languages: @Participants: @ID: @Coder: @Location: @Comment: @Warning: sv OM1 äldre_man1 Adult, INT intervjuare Investigator sv male Henrik Rosenkvist Stenberga ljudfilen finns i SweDias material, i Stenbergamappen (ste_om_1sp.wav) transkription, INT ej transkriberad utan glossad Man ska alltså ange vem som gjort transkriptionen/glossningen, ljudfilens namn och orten där inspelningen gjorts. Efter @Warning ska man ange om filen innehåller en transkription eller en glossning. Samtidigt tal? Det är inte nödvändigt att markera samtidigt tal. Skriv replikerna var för sig, även om de överlappar i tiden. Bulletmarkeringarna ska dock överlappa (så att man kan koppla hela yttandet till respektive del av ljudfilen). Om delar av det överlappande talet inte kan uppfattas så använd markeringen för ohörbart tal (<xxx>). Yttrande/makrosyntagm? En del repliker i materialet är väldigt långa. Bryt då upp dem, så att ett och samma yttrande delas upp i makrosyntagmer. Exempel: *INT: när man bestämmer sig för att renovera ett sådant hus liksom kan du beskriva ordningen vad är det man gör för någonting till att börja med? jaaa för å få byggnadsvårdspengar från länsstyrelsen så måste man ju ta kåntakt mä ## kulturenheten åck Per-Olof Renkvist såm ä länsantikvarie då. å å diskutera fram va såm ska jöras å få en plan på det hela ## åm dä ä nånting värt att bevara över huve taget. men just här i byn ä ju länsstyrelsens inställning att detta ä ju ett storåbjekt såm ska satsas på till hunnra pråsent. så dä kåmmer ju å bli hus efter hus här nu ### såm tas itu mä. så däää ## ett tre såm du säjer där åppe ## dä dää ## ska ja väl ha hand om nästa år ## så ja anställer en snickare då så vi ska jöra i årning dä tisammans. OM1 talar här ganska länge, men tack vare att hans långa yttrande bryts upp blir det lättare att göra en syntaktisk analys; det blir också enklare att hitta i materialet eftersom vi kan sätta fler bulletar. 5

<e >eller <ä>? Det kan vara svårt att välja mellan <e> och <ä> när man transkriberar. Ordet med kan ju transkriberas som <me, mä, med, mäd>. Detta är emellertid inte en viktig sak för just detta projekt välj den variant som du tycker ligger närmast i början av transkriptionen och använd den sedan i hela transkriptionen. En svensk CHAT-manual finns på: http://www.sol.lu.se/humlab/education/uploads/clantrans.pdf RAPPORTERING/INLÄMNING AV FILER Skicka färdiga Chat-filer till: Henrik.Rosenkvist@nordlund.lu.se Sammanställ dina arbetade timmar när du tycker att det passar, och skicka därefter sammanställningen, som bör innehålla en specifikation av vad du har gjort, till Lars-Olof (Lars-Olof.Delsing@nordlund.lu.se), så kommer pengarna så småningom. Räkna med att det tar lite tid. 6