Kort beskrivning och jämförelse av transkriptionssystem från Lund, Telia, Linköping och Göteborg

Relevanta dokument
$P: hup interj $J: [1 a: 0. $P: [1 ö:m ocm ]1 // ocm flyg ti <1 paris np <1 NAME >1

okej >58 / <59 >59 [20 a0 men+

@ Activity type, level 1: Activity type, level 2: Arg. Activity type, level 3: Aa: Recorded activity title:

MODIFIERAD STANDARDORTOGRAFI (MSO6)

The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide

TÖI ROLLSPEL F 006 Sidan 1 av 6 Försäkringstolkning

DAVID. BITTAN Jaha. Ja så kan man ju också lösa're, men va säger tjejerna då? CASPAR

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

Killen i baren - okodad

Transkription och direktglossning av dialektinspelningar i SveDiaSyn

Lektion 2, måndagen den 1 februari, Svenska för internationella studenter, kurs 1

FL1: Anneli Ackemo FL2: Sofia Karlsson DH: Johan Lund ADV: Jens Arnhof

01 S: se saken ä den att eh (0,3) pt (0,4) nä man ä ung 02 å frisk (0,2) dä ä ett friskt jöre i skogen,

1 december B Kära dagbok!

(NEEDS ORIENTED) TOOLBOX FOR EUROPEANS

FL1: Anneli Ackemo FL2: Sofia Karlsson DH: Rune Stokke ADV: Lisa Länta

Öh, alltså, kan man prata som folk gör mest när man använder pratapparat, eller?

2

MOLLY (vaknar upp från en mardröm och ropar): Mamma! Mamma! Mamma! PEPPER Håll klaffen! DUFFY Åh, ska man aldrig lyckas få nån blund i ögonen på det

Killen i baren. 2.R: Okej, så du är inte här riktigt för att du själv vill det. (Komplex reflektion; Empati+)

Provverktyg för elever instruktioner [SE]

OWN COMMUNICATION MANAGEMENT. Kodningsmanual v1.0. Jens Allwood, Elisabeth Ahlsen, Joakim Nivre, Staan Larsson. October 10, 1997

Intervjusvar Bilaga 2

Utskrift av inspelat samtal hos Arbetsförmedlingen

VANESSA. Den orädda. Joachim Masannek

Talstyrd aktivitetsregistrering/ hänvisning vid frånvaro Användarmanual

Resa Allmänt. Allmänt - Grundläggande. Allmänt - Konversation. Fråga om hjälp. Fråga om en person talar engelska

Resa Allmänt. Allmänt - Grundläggande. Allmänt - Konversation. Fråga om hjälp. Fråga om en person talar engelska

Kap 1 hej. Hej jag heter William Peterson. Jag är 10 år gammal och jag är cool. Jag bor i Alafors och jag har 5 syskon. Jag går på MK- skolan.

Objektorienterad Programmering (TDDC77)

Discovering!!!!! Swedish ÅÄÖ. EPISODE 6 Norrlänningar and numbers Misi.se

I Skapa Hej.java och skriv programmet. I Kompilera med javac Hej.java. I Rätta fel och repetera tills du lyckas kompilera ditt program

Lektion 2, tisdag 4 februari, Svenska för internationella studenter, kurs 1

En omväg till ditt hjärta

Drogad. AHHH! skrek Tim. Vad har hänt! skrek jag. Det är någon som har kört av vägen och krockat med ett träd! Men ring 112! Ge mig min mobil da!

Hälsa och välbefinnande hos barn och ungdomar som har en förälder med progredierande neurologisk sjukdom

Den fabulösa Kurts dagbok ( _ ) 一 一 一 一 一 O-_- 一 一

Svenska från början. 1 Studieförbundet Vuxenskolan

Den försvunna diamanten

FL1: Sofia Karlsson FL2: Anneli Ackemo DH: Robert Edelbro ADV: Jonas Westerlund

Var det så, Ella? Bar du hela världen på dina unga axlar? Inte bara din egen tsunami utan också våran. ( )

Transkriberat material;

NORDEN I BIO 2008/09 Film: Goðir gestir (Island 2006) Svensk text

============================================================================

Tankar om elevtankar

Bedömda elevexempel i årskurs 7 9 och i gymnasieskolan

eller vad är makt när vi pratar om äldreomsorg?

DH: Urban Edelbro FL: Sofia Karlsson FL2: Anneli Ackemo ADV: Lennart Wiklund

Trepoängsproblem. Kängurutävlingen 2012 Junior

dom hem och hämtade en stor badbalja och stoppade mig i den. - vad ska vi kalla den? undrade ett barn. - Då sa ett anat barn kanske Padis. - Ja!

Lilla Krabat. Stopp! Stampa, stampa, stampa, stampa. Stopp! Klappa, klappa, klappa, klappa. Stopp. Svänga, svänga, svänga, svänga.

(Vid tekniska problem, kontakta Mapaz Support, )

Kapitel 1 I planet. Jag har varit flygrädd hela mitt liv. Men min mormor blev sjuk,

KURS A Motsvarande i CEFR A1-/A1 (Gemensam europeisk referensram för språk)

Kanban. Marcus Hammarberg. torsdag den 15 september 2011 (v.)

Fundera tillsammans. Victor är 5 år och Åsa är 8 år. Hur gammal kommer Victor att vara när Åsa är dubbelt så gammal som hon är nu?

FL1: Anneli Ackemo FL2: Sofia Karlsson DH: Tony Granlund ADV: Lars Grönberg

Lärarrummet för lättläst lattlast.se/larare

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.

Rulltrappan Text: Vase&Fuglsang Översättning: Lennart Jensen

FL1: Anneli Ackemo FL2: Sofia Karlsson KJ: Kristoffer Josefsson DH: Johan Lund ADV: Jens Arnhof

Högt i tak. Original: Höjt till loftet, Vase & Fuglsang, Cirkusrevyen 2012 Översättning: Lennart Jensen, december Uppdaterad januari 2014.

Inkvarteringsstatistik. Göteborg & Co. Februari 2012

En dag gick Party och Linn till en rolig lekplats. Där gungar Linn och Party jättehögt. Först flyger Linn upp till ett moln. Sen blir Party rädd och

Svenska från början 3

Lektion 5. Svenska för internationella studenter, kurs 1

1 Översikt Vad är kontokoder? Konto/Mapp uppbyggnad Tillgång till Kontokoder Område Kontokoder...5

EN SKETCH FRÅN STEFAN TUNEDAL

I sjunde himlen Text: Vase & Fuglsang Översättning: Lennart Jensen

I do for money sattes upp i regi av Åsa Olsson på Dramalabbet under Teater Scenario 2008.

REDIGERA PLYMEDIA-TEXTER med Subtitle Workshop 2.5.1

F2 Datarepresentation talbaser, dataformat och teckenkodning EDAA05 Datorer i system! Roger Henriksson!

Webbgenvägar. Krishna Tateneni Yves Arrouye Översättare: Stefan Asserhäll

Annie märker en dag att de spökar i källaren på skolan. En dag var Lena sjuk och då bakade Sanna och Annie en monstergodis till monstret och försökte

FYLL I DE ORD SOM SAKNAS I TEXTEN

Klockan. Till Läraren. Kristina Lutteman Per-Anders Nilsson. Specialpedagogiska skolmyndigheten

Objektorienterad Programmering (TDDC77)

Hör och härma. Röda boken lite lättare. Uttalsträning för nybörjare i svenska som andraspråk. Unni Brandeby

Innehållsförteckning. Kapitel 1

KURS A Motsvarande i CEFR A1-/A1 (Gemensam europeisk referensram för språk)

Man löser inte problem genom att undvika dem. Man måste prata. Även om det är jobbigt måste man prata. -Gör det ont? -Nej. Kan vi inte åka hem?

MED SÅNG UTAN SÅNG 01 VI SKA BARA JOBBA LITE TILL VUXNA: Vi ska bara jobba lite till! 01 JOBBA LITE TILL VUXNA: 02 MEGATÅGET MIKROTRON

FL1: jag påstår att det döda djuret är en järv. Vad säger du om det Johan?

E: Har du jobbat som det hela tiden som du har varit här på företaget?

Bedömda elevexempel i årskurs 4 6

Lärarhandledning Vi berättar och beskriver

Lektion 6, måndagen 15 februari, Svenska för internationella studenter, kurs 1

Prov svensk grammatik

passa på göra något när man har en bra chans uttrycka sin åsikt säga eller skriva vad man tycker om en viss fråga

Kamratbedömning. Fokusera på följande:

Det finns ett monster i våran källare han tog fram sina vassa klor och...

IT-lösningar. Guide, Kalenderkoppling för Outlookanvändare. Kalenderkoppling. Synkronisera Outlookkalender och Marvin i Telia Centrex 1 (7)

Varför??? För om han säger ja så kan vi snoka runt och se om vi hittar några bevis på att de kommer tillbaka,idiot!!!

TW Jag tror du har missuppfattat ganska mycket.

Hej och välkommen till en kort presentation av SchemaKoll. I den här presentationen kommer du att bli guidad genom proceduren att logga in med en

NEONOVA. Handledning Brukarundersökning med Pict-O-Stat Pilotprojekt SKL

Agnes, Moa och momsen

BARNHEMMET. En liten berättelse om en tid då man sålde barn som arbetskraft ROLLER FÖRESTÅNDARINNAN SYSTER SARA. Barnen STINA GRETA IDA LOTTA

2013 PUBLIC EXAMINATION. Swedish. Continuers Level. Section 1: Listening and Responding. Transcript

F2 Datarepresentation talbaser, dataformat och teckenkodning

Transkript:

Kort beskrivning och jämförelse av transkriptionssystem från Lund, Telia, Linköping och Göteborg Jens Allwood Åsa Abelin Leif Grönqvist Institutionen för Lingvistik Göteborgs Universitet 1. Inledning Denna rapport har följande struktur: (i) Kort beskrivning av de fyra transkriptionssystemen med illustrationer (ii) Sammanfattande tabell över skillnader och likheter (iii) Rapport om konvertering av transkriptioner gjorda med ett system till transkriptioner gjorda med ett annat system 2. De fyra transkriptionssystemen De fyra transkriptionssystemen överlappar delvis med avseende på vad i talet som registreras. Det finns också skillnader med avseende på om en viss företeelse (t ex paus) transkriberas direkt (med särskild markering), anges som kommentar eller anges med hjälp av kodning (Telias lejbling). Dessutom finns mer utseendemässiga skillnader, t ex om avbrott markeras + eller -. Nedan följer en kortfattad beskrivning av varje transkriptionssystem. Vi har med frågetecken markerat sådant som vi är osäkra på. 2.1 Lund En detaljerad tidskodning finns, som markerar slutet på varje ord och varje paus. Ordbörjan (och pausbörjan) anges indirekt av föregående slut. Vanlig ortografi, förutom a (ja), mm. Olika talare är åtskilda i transkriptionen, i kolumner. I det transkriberade talet finns tre olika betoningsgrader (extrastark, stark, svag) markerade. 1

Direkt i transkriptionen ligger också olika talarljud, av typen SMACK, SKRATT (med versaler, liksom PAUS och EH). Anger versal kommentarer? (Kommentarer på svenska). Det finns en särskild kolumn för extrakodningar. I den aktuella transkriptionen är de enda extrakodningarna frågetecken, som med hjälp av hakparenteser spänner över hela yttranden och anger frågeintonation. Ett exempel på transkription enligt Lunds format finns i avsnitt (4.1). 2.2 Linköping Enbart transkription fanns tillgänglig. Vi hade ej tillgång till instruktion eller lyssningsbara band. Ingen tidskodning finns. Inga betoningsgrader finns. Ingen särskild kommentarrad finns. Inga ljud av typen SMACK, SKRATT finns. Kommentarer för "events" anges i transkriptionsraden inom dubbla parenteser. Det verkar finnas parenteser runt ord också, men lite oklart varför, flera högerparenteser saknas. Olika talare är åtskilda i transkriptionen, i olika rader. Namnet åtföljt av kolon. Pauser verkar var markerade i transkriptionsraden, såsom punkt (.) eller sekundangivelse, t ex (5s), inom parenteser. Tvekljud skrivs "ä", "ähh", "öh", "öhh", "öhm", "öhmm", "eh", "ehh", "eeh", "ah" osv Stor bokstav på namn (ej konsekvent) Vanlig ortografi för det mesta, men även mer uttalsnära transkription t ex jarå, förns, å (och. att?), ä (är), de (det), re (de), jäklit (jäkligt), åpp (opp), ja (jag), förskräckli (förskräcklig) Ingen indexering. Förlänging verkar vara markerat med dubbelteckning:vv- 2

Avbrott är markerat med bindestreck: Sparbanksh-, vv-, nä-. Ohörbara ord markeras (xx). Ohörbar del av ord verkar markeras (xx). t ex "för(xx)". På ett (?) ställe verkar överlapp vara markerat, med angivande av * * runt de ord som överlappar. På andra ställen finns * * bara runt ett ord. Oklart vad små ringar runt ord kan betyda. I tre yttranden i rad (två talare) eller i ett yttrande. Exempel på transkription enligt Linköpings format stgötatrafiken 1998-03-16 kl. 17.00-17.45 yngre kille Telefonist: trafikupplysningen Kund: ja hejsan Telefonist: hej Kund: öhh nästa buss femhundrasjutti ifrån Vikingsta till Västerlösa Telefonist: nu ä klockan sexton å femtifem å då har du nästa som går här från Vikingsta sjutton-tjugo (1.5s) Kund: okey Telefonist: mm Kund: tack Telefonist: tack hej Kund: hej äldre dam Telefonist: trafikupplysningen Kund: ja ja undrar n- nån buss som ä i Boxholm (.) dä ä så att skulle bara köpa ett öhh mändadskort (.) å är ä närmsta buss nu som är i Boxholm Telefonist: mm då ska vi se här då Kund: ja skulle va på torget Telefonist: ja just de Kund: så du kan säga från Åsnäs eller från stationen Telefonist: ja precis (.) men nu ä klockan sexton å femtinie (.) och då ska vi se här (1s.) a du hade en som ä där nere nu sjutton-noll-noll de hinner du väll inte till antar ja Kund: nej jag ska ner på torget nu Telefonist: ja Kund: å då ä de fem minuter nä de hinner ja inte Telefonist: nej så nästa är i Boxholm klockan sjutton å fyrtiofem Kund: sju Telefonist: den går ifrån Boxholms station sjutton å fyrtiofem mot Mjölby Kund: jaha Telefonist: mm Kund: de ä bra Telefonist: mm Kund: mm (.) de säger vi Telefonist: tack hej Kund: tack och hej ung flicka 3

Telefonist: trafikupplysningen Kund: hej ja undrar nästa buss från Malmslätt in till stan går Telefonist: då ska vi se här då buss tvåhundratretton går var i Malmslätt vill du gå Kund: Tjärnakors Telefonist: Tjärnakors (.) nu är klockan sjutton-noll-fyra å då har du en som går sjutton och sexton till ifrån Tjärnakors mot Linköping Kund: okey tack så mycket Telefonist: hej Kund: hej kvinna Telefonist: trafikupplysningen Kund: jaha hejsan ja Telefonist: hej Kund: undrar vad de finns för förbindelser mellan Björsätra och Åtvidaberg (.) kvällstid Telefonist: mm Kund: kunde inte hitta de i våran (.) turlista här Telefonist: då ska vi se mellan Björnsäter å Åtvidaberg är det buss nummer femhundratrettioåtta som går Kund: femhundratrettioåtta heter den Telefonist: mm och vilken kväll pratar vi om Kund: ja i i morn kväll till exempelvis Telefonist: mm Kund: om det finns nått från Björnsäter till Åtvidaberg Telefonist: ja (.) äh du har en buss femhundratrettioåtta som går från bjärsä björnsäter sexton å tjugo Kund: ja de va väll lite tidigt kanske Telefonist: sjutton å tie Kund: sjutton å tie Telefonist: å sen har du en tur som är anropsstyrd de ä sån här som du får ringa å beställa senast klockan (.) öhh sexton den dagen du ska åka då Kund: ja Telefonist: mm å då gör du de på tretti- (.) noll-tretton då Kund: noll-tretton Telefonist: trettisju elva förtiofem Kund: trettiosju elva förtiofem Telefonist: å då går den turen i så fall ifrån Björnsäter arton å fyrtiofem Kund: den går arton å fyrtiofem Telefonist: sen har du en som går tjugoett å trettiofem också Kund: och tjugoett å trettiofem Telefonist: å de ä också en sån däe som Kund: som man Telefonist: som gick å beställa Kund: jaja Telefonist: mm Kund: haa (.) öhh från Åtvidaberg till Björnsäter Kund2: men de vet ja redan ((person i bakgrunden)) Kund: jaha ja ja det han hon visst prata med Telefonist: jaha Kund: okey men då får jag tacka så mycket för hjälpen Telefonist: tack de ä bra Kund: tack hej ----- klippt ----- 4

2.3 Telia Tidskodning finns och anger slutet för varje ord, disfluenskodning eller miscellaneous. Början för orden är samma som slutet för ordet innan. Vanlig ortografi används. Inga betoningsgrader anges. Olika talare är åtskilda i transkriptionen, i kolumner. Markeringar finns för meningsbörjan och meningsslut. Kommentarer finns i kolumnerna för disfluenser och "miscellaneous". Ofyllda och fyllda pauser (eh) anges inte i transkriptionskolumnen utan i disfluenskolumnen. Exempel på transkription enligt TELIAs format 68.691035 1: 70.786676 S 71.091554 ja 71.101717 u< 71.106798 exh< 71.243993 creak 72.219603 >exh 72.229766 >u 72.234847 om 72.366961 ^ det 72.529563 går 72.981799 nånting 73.576311 efter 74.023466 klockan 74.795824 sjutton 74.927938 E 80.169956 S 80.175037 S 80.327477 f< 80.759387 >f 80.779712 Mm 80.947395 ^ det 81.094753 kan 81.150648 vi 81.374225 ta 81.892518 E 81.917924 E 85.131663 S 85.350159 LLO 5

86.407070 Lundgren 86.417232 exh< 86.534102 >exh 87.265810 Leif 87.347111 E 90.821692 S 92.256785 Ja 92.424468 just 92.510850 det 92.592151 då 92.775078 behöver 92.937679 jag 93.278127 hotell 93.420403 då 93.959021 från 93.964103 exh< 94.761867 >exh 94.868574 från 94.980363 ^ och 95.066745 ^ med 95.188696 ^ den 96.268848 femte 96.543238 E 96.601448 S 97.038655 I 98.369957 Göteborg 98.837436 E 99.467517 S 99.975647 Få 100.219550 se 100.631135 då 100.875038 till 101.037639 och 101.184997 med 101.352680 den 101.738859 nionde 101.891298 blir 101.962436 det 101.982761 ju 102.013249 inte 102.252070 ska 102.460404 hem 102.755119 den 103.090485 nionde 103.283575 måste 103.324225 va 103.335108 ^ 103.837436 natten 104.284591 åttonde 104.381136 till 104.741908 nionde 104.914672 då 104.920475 ^ 105.412640 E 111.691879 S 112.103464 LLO 113.114643 Det 113.124806 l:[e] 6

113.638018 blir 114.415457 bra 114.795282 E 116.956107 S 118.023496 Europa 118.084471 är 118.704386 okey 118.925421 E 120.089118 S 121.595937 Sen 121.871387 skulle 121.957401 ^ jag 122.117461 vilja 122.325793 ha 122.650995 hjälp 123.067659 med 123.075285 u< 124.045808 >u 124.175385 f< 124.180461 LLO 124.271930 eh 124.371014 eh 124.376096 >f 125.186559 taxi 125.415224 ja 125.532094 ska 125.684532 åka 2.4 Göteborg Transkriptionerna görs med hjälp av Transcription standard version 2, (inkluderande Standard Comments) och Modifierad standardortografi (MSO5) där metoden finns beskriven i detalj. Disambiguering till skriftspråksnivå görs genom siffror i slutet på orden. Exempelvis betyder ja0 i transkriptionen ja och ja1 jag. Ingen tidskodning av ord, men däremot av längre innehållsligt avgränsbara avsnitt. Olika talare åtskilda i transkriptionen. Kontrastbetoning anges (med versaler). Pauser av tre olika längder anges. Optionellt anges pauser i sekunder. Standardiserade kommentarer i kommentarrad. Dessa kommentarer kan avse ljud såsom skratt, processer som påverkar talet, t ex whispering eller de kan gälla gester eller samtidiga händelser såsom dörrsmällar. 7

"Tvekljud" anges som e1, m1, u1, ä1, ö1, mfl. Överlapp markeras. Överlapp och avbrott kan även markeras inuti ord. En hel del specialtecken används, exempelvis: Rader som innehåller kommentarer inleds med @ och kommenterad del (markerad med < och > ) i yttrandet kan lokaliseras med hjälp av ett index. # markerar tidskodning, ny sektion och [ och ] överlapp. Här följer ett exempel på en transkription enligt Göteborgs format en relativt livlig diskussion: @ Recorded activity ID: V469901 @ Recorded activity date: 910530 @ Recorded activity title: Do the ends justify the means in business? @ Short name: SweEndM @ Tape(s): V4699, AV4699 @ Participant: A = Johanna @ Participant: B = Maja @ Participant: C = Nina @ Participant: D = Karin @ Participant: M = Mats Andersson @ Transcription name: V4699011 @ Transcription System: MSO5 @ Duration: 00:00:00 @ Transcriber(s): Mats Andersson @ Transcription date(s): 000000 @ Transcribed segments: All @ Checker(s): Anders Olsson @ Checking date(s): 940808 @ Time coding: No @ Section: Introduction @ Section: Definition of 'the end justifies the means' @ Section: Joint-stock companies @ Section: The world of business @ Section: The Exchange @ Section: Macdonalds and the care of old folks @ Section: Win-back material @ Section: Sponsor @ Section: Business men @ Section: Food habits @ Section: Back to the subject @ Section: Conclusion @ Comment: Transcription standardisation by Emöke Lipcsey Andersson. @ Comment: MSO1 standardisation and comment standardisation(v0.9) by Anders Olsson @ Comment: Updated to MSO2.1 by Sylvana Sofkova(950428). @ Comment: Updated to MSO3 by Sylvana Sofkova(951005). @ Comment: Length - 18 minutes @ Comment: Involved 4 girls,linguistics A-level @ Comment: Deviations from comments v0.9: no verb/noun distinction regarding the labelling of sounds (verb form is used) @ Comment: Video included by Anders Olsson 940815 @ Comment: Numerous (not translated) comments in swedish 8

@ Comment: Comment enumeration need not be consecutive @ Comment: Overlap enumeration need not be consecutive @ Comment: 'X:' is used for 'unknown speaker'. Introduction @ < skipped: 2m 20s (measured from beginning of tape) of introduction > The Exchange $A: <1 de0 gö1 dom1 i frankrike också (...) mjölk <2 // >2 ä* (...) >1 // ä:1 men [25 allså om0 man ]25 nu ska se0 på va1 de0 här me0 börs ja1 menar ska optioner tillåtas eller va1 då @ <1 quiet >1 @ <2 chuckle >2 $C: [25 å0 en0 sån: ]25 $C: ska $A: optioner å0 sån skit å0 såna här <1 insideaffärer >1 å0 sånt där [26 som dom1 ]26 <2 tjabbar >2 om0 varenda jävla da0 som man <3 ändå inte >3 ä0 de0 minsta <4 >4 // engagerad i vet inte alls @ <1 borrowed english: inside >1 @ <2 unorthodox >2 @ <3 chuckle >3 @ <4 event: stampar med foten i golvet >4 $B: [26 mm ]26 $B: <1 a0 men (...) de1 vill >1 @ <1 event: med kakor i munnen >1 $X: [27 optioner ]27 $A: [27 a0 ja1 vet ]27 $D: fast [125 ja1 ja1 ]125 $A: [125 de0 e0 inget ]125 å1 diskutera0 gör de0 [28 (nå+ de0 e0 nån) variant ]28 av aks+ av aktier ja1 vet faktist inte alls $D: [28 får ja:1 säja en0 sak ]28 $D: <1 <2 får ja1 säja en0 sak >2 >1 @ <1 gesture: raised hand >1 @ <2 quiet >2 $A: jaa $B: ja0 karin < > @ <1 event: häller upp mer kaffe >1 Macdonalds and the care of old folks $D: aa0 de0 e:0 så0 här nämligen att <1 e1 ja1 tycke1 inte så0 mycke om0 macdonalds fö ja1 tycke1 dom1 har en0 tvivelakti PROFIL >1 (elle) ja1 tycke1 att dom1 sysslar med tvivelaktia saker @ <1 event: looking down on her shoe picking at it >1 $C: mm $D: å0 nu så0 ha1 dom1 börjat bygga nånting som heter ä1 // <1 <2 ronald macdonald house >2 >1 @ <1 language english >1 @ <2 event: looking down on her shoe picking at it >2 $C: < ja0 va1 e0 de0 fö konstit ja1 [126 (...) ]126 > @ < event: mycket uppbragt > $D: [126 jo ]126 de0 e0 så0 här [127 att ]127 $C: [127 jo ]127 men e0 inte de0 sån här $D: jo men dom1 ska bygga så1 [29 här ]29 där <8 föräldrarna kan få0 bo om0 deras barn ligger på sjukhus <2 >2 fö att de0 e0 så0 dyrt om0 >8 // till exempel i <3 usa >3 e0 de0 i alla fall <4 så0 att <5 >5 // <9 ursäkta0 (...) skor >9 >4 <6 de0 så0 de0 e0 så0 >6 e1 DYRT om0 föräldrarna också ska bo på sjukhuset <7 dom1 får ju betala0 allting själv så0 då då [128 tycke1 ja1 ]128 >7 @ <2 event: tittar ned och grejar med ena0 skon >2 @ <3 acronym >3 9

@ <4 quiet >4 @ <5 event: looking down on her other shoe picking at it >5 @ <6 chuckle >6 @ <7 quiet >7 @ <8 event: looking down on her shoe picking at it >8 @ <9 event: looking down on her other shoe picking at it >9 ----- klippt ----- 10

3. Sammanfattande tabell över skillnader och likhetermellan de fyra transkriptionssystemen Tabell 1. Jämförelse av de transkriptions/kodningskategorier som förekommer i de fyra transkriptionssystemen. Gbg Lund Telia Linköp. Ordnivå x x x x Meningsbörjan/slut x Ortografi MSO Standard Standar d Oftast standard Indexering x Tvekljud enhetligt x x x 1 Förlängning x x 2 x Avbrott x x 3 x Ohörbara segment x x Tidskodning av ord x x Tidskodn. av avsnitt x Betoning - kontrast x Betoning - grader (3) x Överlapp x x 4 x 5? Paus av ospec. längd x 6 Paus av olika längd x x x Kommentarmöjligh. x x x x Skratt, smack etc. x x x 7 Gester x Events x x Frågeintonation x Tillhörande video x Ljudkvalitet Medel Hög Hög? Synkroniserad text och ljud x x 1 Räknas som "lejbling": fylld paus. 2 Räknas som "lejbling". 3 Räknas som "lejbling". 4 Ges indirekt av tidskodningen. 5 Ges indirekt av tidskodningen. 6 Räknas som "lejbling" 7 Räknas som "lejbling" 11

4. Konvertering av de fyra transkriptionssystemen till varandra Tabell 1 utgör en utgångspunkt för en diskussion av konvertering mellan de fyra transkriptionssystemen. Allmänt sett kan man säga att mer informationsrika transkriptionssystem alltid med informationsförlust kan konverteras till mindre informationsrika system. Om man inte vill förlora informationen, kan den behållas med hjälp av en kommentarfunktion (en sådan finns i alla fyra systemen). Vi illustrerar nedan hur vi använt denna funktion för att bevara den information om segmentduration som finns i Lunds och Telias system om vi vill konvertera till Göteborgssystement. Konvertering i motsatt riktning från ett mindre informationsrikt system till ett mer informationsrikt är också möjlig och leder helt enkelt till magra versioner av det rikare systemet..de fyra olika formaten kan delas upp i två huvudtyper: tidsbaserade och yttrandebaserade. I de tidsbaserade (Lund och Telia) kodas för varje ord, paus, mm exakt start- och sluttid. De olika talarnas bidrag skrivs sedan i var sin kolumn där tiden löper lodrätt. Tiden som läses av i vänsterkolumnen anger ordets sluttid och början antas vara samma som slutet för ordet innan. I yttrandebaserad transkription (Göteborg och Linköping) kodas inte tid utan talarnas bidrag skrivs i form av yttranden där orden följer en talarinitial. Konvertering mellan Lund-Telia respektive Göteborg-Linköping är inga större bekymmer efter som de är av samma typ. Vissa kodningar går inte att översätta men förutom det handlar det om att byta ut vissa detaljer i notationen. Konvertering från yttrandebaserade till tidsbaserade är däremot helt omöjligt eftersom informationen om när varje ord börjar och slutar saknas i det yttrandebaserade transkriptionerna. Från tidsbaserad till yttrandebaserad transkription kan vara användbart; speciellt om man kan ta vara på de detaljerade tidskodningarna. Denna konvertering kan verka trivial men att automatiskt få fram turer och yttrande utifrån endast detaljerad tidskodning är ganska komplext, som exemplet nedan visar. 4. 1 Konvertering från Lunds till Göteborgs standard - ett exempel I Lunds transkription kan man se precis när varje ord eller paus slutar och börjar. Första kolumnen anger sluttid för det som står till höger. Därefter följer talarna i var sin kolumn, följt av en kolumn med extrakodningar. I talarkolumnerna har orden kodats för 12

prosodi. Exemplet är, trots sin längd på papper, knappt en minut långt. Filen är anpassad för analysprogrammet Waves. 0.73 PAUS 0.95 hap 1.43 PAUS 1.56 PAUS 1.57 ja 2.18 EH 3.8 PAUS 4.11 `flyg 4.27 till 4.75 Pa''ris 5.22 PAUS 5.54 mm 6.22 PAUS 6.24 SMACK 6.37 PAUS 6.46 PAUS 6.69 EH 7 ska 7.06 PAUS 7.18 en 7.75 re''turbil,jett 8.65 PAUS < 8.71 vad 8.85 `sa 9.02 du?> 9.19 PAUS 9.3 ska 9.33 du 9.39 ha 9.46 en 9.66 `tur 9.77 och 10.04 re'tur 10.25 PAUS 10.48 ja 10.98 PAUS 11.39 EH 13.85 PAUS < 14.05 vilken 14.44 `'månad 14.55 ska 14.58 du 14.81 `åka 14.89 i?> 17.93 PAUS 18.38 ja 18.73 `typ 19.18 den 19.72 EH 20.44 PAUS 20.97 `tredje 21.49 `fjärde 21.95 a''pril 22.25 PAUS PAUS 13

22.35 någon 22.6 `gång 22.64 mm 22.82 PAUS 23 `där 24.22 PAUS 24.38 så 24.72 `billigt 24.91 som 25.04 PAUS 25.29 ja 25.33 `möjligt 25.54 `'just 25.68 `det 25.93 jo 26.31 PAUS 26.41 det 26.45 har 26.52 jag 26.77 aldrig 27.01 `'hört 27.19 `förr 27.69 PAUS 27.79 det 27.87 SKRATT 28.1 nej 28.48 `'billigaste 28.62 vi 28.94 `har 29.03 PAUS 29.52 `är 29.64 PAUS 29.77 Air 30.22 `'France 30.4 PAUS 31.67 `ettusen'åttahundra''tio 32.1 PAUS PAUS 32.36 a 32.4 plus 33.34 `flygplats,skatter 33.48 så 33.59 du 34.02 `hamnar 34.37 på 34.89 PAUS 34.96 a 35.04 du 35.2 kan 35.29 få 35.68 e''xakt 35.75 PAUS 35.96 `'vänta 36.14 ska 36.21 du 36.41 `se 36.55 `här 36.67 vi 36.79 `gör 14

36.98 så 37.2 `'här 37.84 PAUS 38.47 EH 40.97 PAUS 41.22 det 41.44 är 41.64 `'en 42.12 `skatt 42.24 PAUS 42.6 i 42.84 EH 44.2 PAUS 44.37 både 44.88 `'Danmark 45.08 och 45.15 i 45.76 `Frankrike 45.88 så 45.98 du 46.18 ska 46.36 få 46.77 e''xakt 47.72 PAUS 47.78 sedan 48 måste 48.03 du 48.13 `ha 48.24 sådant 48.29 `här 49 internatio'nellt 49.62 stu''dentkort 49.88 `också < 50.04 `'har 50.11 du 50.26 `det?> 50.49 PAUS 51.53 nej 53.55 PAUS 53.61 du 53.77 `vet 53.85 vad 53.9 det 53.97 `är 54.06 för 54.28 `något 54.36 jag 54.71 `'syftar 54.87 `på 55.21 PAUS 55.48 a ----- klippt ----- 15

4. 2 Konvertering till Göteborgs MSO-format Göteborgs standard är utformad mer för att titta på semantik, yttranden och talakter. Därför kodas inte prosodi, tider och överlapp lika noggrant. Emellertid tillåter standarden att dessa detaljer läggs in i form av kommentarer. Det svåra med konverteringen är att avgöra vad som är ett yttrande enligt MSO-standarden. Konverteringsprogrammet går igenom Lund-transkriptionen i kronologisk ordning och använder följande axiom: Yttrandestart: Om talare A talar utan att ha ett pågående yttrande påbörjas ett nytt yttrande för A Yttrandeslut: Om (talare A är tyst och har ett pågående yttrande) samtidigt som (någon talare B talar eller A inte har turen) så tar A's yttrande slut Turbyte: Om ingen av de som talar har turen ges den till en talare som talat längst tid. Vem som har turen syns inte direkt i en MSO-transkription men det är mycket användbart för att få fram yttranden på ett bra sätt. Utifrån axiomen följer exempelvis: Ett yttrande som står efter ett annat börjar samtidigt eller senare än det andra Förutom vid överlapp så slutar ett yttrande vid samma tid som yttrandet efter börjar Feedback som inte är turtagande blir ett eget (helt överlappat) yttrande men turhållarens yttrande fortsätter Observera att turhavaren inte markeras i transkriptionen trots att begreppet används i axiomen ovan. En relativt läsbar version i Göteborgsformat efter konvertering ser ut så här: @ Duration: 00:02:38.76 @ Participant: A = A @ Participant: B = B $A: hap // $B: [1 ja ]1 $A: [1 e1 ]1 /// flyg till Paris // $B: mm // <1 / >1 / @ <1 click >1 $A: [2 e1 ]2 $B: [2 ska ]2 / en returbiljett // $A: vad sa du / 16

$B: ska du ha en tur och retur / $A: ja // e1 /// $B: vilken månad ska du åka i /// $A: ja typ den e1 // tredje fjärde april / [3 någon gång ]3 $B: [3 mm ]3 / $A: där /// så billigt som [4 möjligt ]4 [5 ]5 [6 <1 /// >1 nej ]6 @ <1 laughter >1 $B: [4 ja just det jo ]4 $B: [5 det har jag aldrig hört förr ]5 $B: [6 det billigaste ]6 vi har / är / Air France / ettusenåttahundratio // [7 plus ]7 flygplatsskatter så du hamnar på // a du kan få exakt / vänta ska du se här vi gör så här // e1 /// det är en skatt / i e1 /// både Danmark och i Frankrike så du ska få exakt // sedan måste du ha sådant här internationellt studentkort också har du det / $A: [7 a ]7 $A: nej /// $B: du vet vad det är för något jag syftar på // $A: a /// Pauserna kodas här med / (0.01-0.30s), // (0.31-1.00s) eller /// (1.01s-). Kodningar för "click" och "laughter" har lagts till automatiskt av konverteringsprogrammet. Hakparenteser markerar överlapp. Ett problem med att ange överlapp i MSO-format är när flera överlapp finns i samma ord då positionen i ordet inte finns markerat i Lund-transkriptionen. I dessa fall skapas en tom överlappsmarkering eftersom flera överlappsmarkeringar runt samma ord skulle innebära att den överlappande talaren överlappar med sig själv. Om man istället väljer ett mer detaljerat ut-format från konverteraren och visar start- och sluttid för varje yttrande, pauslängder och betoningskodningar blir det inte lika läsbart: @ Duration: 00:02:38.76 @ Participant: A = A @ Participant: B = B $A: <1>1 hap //0.48 <2>2 @ <1 Time: 00:00:00.73 >1 @ <2 Time: 00:00:01.43 >2 $B: [1 <1>1 ja <2>2 ]1 @ <1 Time: 00:00:01.43 >1 @ <2 Time: 00:00:01.57 >2 $A: [1 <1>1 e1 ]1 //1.62 <2 flyg>2 till <3 Paris>3 //0.47 <4>4 @ <1 Time: 00:00:01.56 >1 @ <2 Betoning: fly=stark >2 @ <3 Betoning: ri=extrastark >3 @ <4 Time: 00:00:05.22 >4 $B: <1>1 mm //0.68 <2 //0.02 >2 //0.13 <3>3 @ <1 Time: 00:00:05.22 >1 @ <2 click >2 @ <3 Time: 00:00:06.37 >3 $A: [2 <1>1 e1 <2>2 ]2 @ <1 Time: 00:00:06.37 >1 @ <2 Time: 00:00:06.69 >2 $B: [2 <1>1 ska ]2 //0.06 en <2 returbiljett>2 //0.90 <4>4 17

@ <1 Time: 00:00:06.46 >1 @ <2 Betoning: tu=extrastark >2,<2 Betoning: je=svag >2 @ <4 Time: 00:00:08.65 >4 $A: <1>1 <3 vad <2 sa>2 >3 du //0.17 <3>3 @ <1 Time: 00:00:08.65 >1 @ <2 Betoning: sa=stark >2 @ <3 Time: 00:00:09.19 >3 $B: <1>1 ska du ha en <2 tur>2 och <3 retur>3 //0.21 <4>4 @ <1 Time: 00:00:09.19 >1 @ <2 Betoning: tu=stark >2 @ <3 Betoning: tu=stark >3 @ <4 Time: 00:00:10.25 >4 $A: <1>1 ja //0.50 e1 //2.46 <2>2 @ <1 Time: 00:00:10.25 >1 @ <2 Time: 00:00:13.85 >2 $B: <2>2 <1 vilken <3 månad>3 ska du <4 åka>4 >1 i //3.04 <5>5 @ <2 Time: 00:00:13.85 >2 @ <3 Betoning: må=extrastark >3 @ <4 Betoning: å=stark >4 @ <1 QInt >1 @ <5 Time: 00:00:17.93 >5 $A: <1>1 ja <2 typ>2 den e1 //0.72 <3 tredje>3 <4 fjärde>4 <5 april>5 //0.30 [3 någon <6 gång>6 <7>7 ]3 @ <1 Time: 00:00:17.93 >1 @ <2 Betoning: ty=stark >2 @ <3 Betoning: tre=stark >3 @ <4 Betoning: fjä=stark >4 @ <5 Betoning: pri=extrastark >5 @ <6 Betoning: gå=stark >6 @ <7 Time: 00:00:22.60 >7 $B: [3 <1>1 mm ]3 //0.18 <2>2 @ <1 Time: 00:00:22.25 >1 @ <2 Time: 00:00:22.82 >2 $A: <2>2 <1 där>1 //1.22 så <3 billigt>3 som [4 <4 möjligt>4 ]4 [5 ]5 [6 <5 //2.54 >5 nej <6>6 ]6 @ <2 Time: 00:00:22.82 >2 @ <3 Betoning: bi=stark >3 @ <4 Betoning: mö=stark >4 @ <5 laughter >5 @ <6 Time: 00:00:28.10 >6 $B: [4 <1>1 ja <2 just>2 <3 det>3 jo <4>4 ]4 @ <1 Time: 00:00:25.04 >1 @ <2 Betoning: ju=extrastark >2 @ <3 Betoning: de=stark >3 @ <4 Time: 00:00:25.93 >4 $B: [5 <1>1 det har jag aldrig <2 hört>2 <3 förr>3 <4>4 ]5 @ <1 Time: 00:00:26.31 >1 @ <2 Betoning: hö=extrastark >2 @ <3 Betoning: fö=stark >3 @ <4 Time: 00:00:27.19 >4 $B: [6 <1>1 det <2 billigaste>2 ]6 vi <3 har>3 //0.09 <4 är>4 //0.12 Air <5 France>5 //0.18 <6 ettusenåttahundratio>6 //0.43 [7 plus ]7 <7 flygplatsskatter>7 så du <8 hamnar>8 på //0.52 a du kan få <9 exakt>9 //0.07 <10 vänta>10 ska du <11 se>11 <12 här>12 vi <13 gör>13 så <14 här>14 //0.64 e1 //2.50 det är <15 en>15 <16 skatt>16 //0.12 i e1 //1.36 både <17 Danmark>17 och i <18 Frankrike>18 så du ska få <19 exakt>19 //0.95 sedan måste du <20 ha>20 sådant <21 här>21 <22 internationellt>22 <23 studentkort>23 <24 också>24 <26 har>26 <25 du <27 det>27 //0.23 <28>28 18

@ <1 Time: 00:00:27.69 >1 @ <2 Betoning: bi=extrastark >2 @ <3 Betoning: ha=stark >3 @ <4 Betoning: ä=stark >4 @ <5 Betoning: Fra=extrastark >5 @ <6 Betoning: e(1)=stark >6,<6 Betoning: å=stark >6,<6 Betoning: ti=extrastark >6 @ <7 Betoning: fly=stark >7,<7 Betoning: ska=svag >7 @ <8 Betoning: ha=stark >8 @ <9 Betoning: xa=extrastark >9 @ <10 Betoning: vä=extrastark >10 @ <11 Betoning: se=stark >11 @ <12 Betoning: hä=stark >12 @ <13 Betoning: gö=stark >13 @ <14 Betoning: hä=extrastark >14 @ <15 Betoning: e=extrastark >15 @ <16 Betoning: ska=stark >16 @ <17 Betoning: Da=extrastark >17 @ <18 Betoning: Fra=stark >18 @ <19 Betoning: xa=extrastark >19 @ <20 Betoning: ha=stark >20 @ <21 Betoning: hä=stark >21 @ <22 Betoning: ne=stark >22 @ <23 Betoning: de=extrastark >23 @ <24 Betoning: o=stark >24 @ <26 Betoning: ha=extrastark >26 @ <27 Betoning: de=stark >27 @ <25 QInt >25 @ <28 Time: 00:00:50.49 >28 $A: [7 <1>1 a <2>2 ]7 @ <1 Time: 00:00:32.10 >1 @ <2 Time: 00:00:32.36 >2 $A: <1>1 >25 nej //2.02 <2>2 @ <1 Time: 00:00:50.49 >1 @ <2 Time: 00:00:53.55 >2 $B: <1>1 du <2 vet>2 vad det <3 är>3 för <4 något>4 jag <5 syftar>5 <6 på>6 //0.34 <7>7 @ <1 Time: 00:00:53.55 >1 @ <2 Betoning: ve=stark >2 @ <3 Betoning: ä=stark >3 @ <4 Betoning: nå=stark >4 @ <5 Betoning: sy=extrastark >5 @ <6 Betoning: på=stark >6 @ <7 Time: 00:00:55.21 >7 $A: <1>1 a //1.30 <2>2 @ <1 Time: 00:00:55.21 >1 @ <2 Time: 00:00:56.78 >2 Tidskodningar på yttrande- eller ordnivå samt prosodikodningar passar bättre i dolda kodningsfiler än i Göteborgs transkriptionsfiler. 4. 3 Telias transkriptionsformat På Telia används Waves så deras format liknar Lunds. Däremot transkriberar ofta en talare i taget och för att sätta ihop dessa filer 19

till dialoger krävs att man har minst en referenstidpunkt för att tidsangivelserna skall bli kompatibla. Om detta väl har gjorts kan konvertering till MSO göras på samma sätt som för Lunds format. De kodningar som inte stämmer överens med MSO kan på samma sätt som med Lunds transkriptioner läggas in i form av kommentarer. 4. 4 Konvertering från Linköping till Göteborg Konvertering från Linköping till Göteborg är möjlig och leder till en mager version av Göteborgsformatet. 4. 5 Konvertering från Göteborg till Lund, Telia och Linköping Eftersom Göteborgsstandarden, förutom med avseende på duration och betoning, innehåller mer information än de övriga systemen, måste den extra informationen läggas in som kommentarer i Lunds, Telias och Linköpings standard. Beträffande information om duration och betoning, saknas denna information i Göteborg och måste därför på något sätt uppskattas (kan göras grovt genom att titta på ordlängd) i konvertering av Göteborgstranskriptioner till Lunds och Telias system. 5. Slutord De fyra transkriptionssystemen grupperar sig huvudskligen i två typer: de tidsbaserade som görs för att fånga durationsinformation (Telia och Lund) de yttrandebaserade som görs för att ge en mer sammanhängande bild av talspråksinteraktionen (Göteborg och Linköping). Inom de två typerna innehåller Telias transkriptioner mera kodad information än Lunds och Göteborgs format tycks ha mer systematisk information än Linköpings. Det verkar sannolikt att båda typerna av transkription kommer att behövas. Eventuellt kunde man inom varje grupp ena sig om en standard. 20