HÖRFÖRSTÅELSE: EFFEKTER AV TALSYNTES OCH MÄNSKLIGT TAL

Relevanta dokument
ASSESSMENT AND REMEDIATION FOR CHILDREN WITH SPECIAL EDUCATIONAL NEEDS:

Studenters erfarenheter av våld en studie om sambandet mellan erfarenheter av våld under uppväxten och i den vuxna relationen

Träning av arbetsminnet: kognitiva förutsättningar, utmaningar för implementering och effekter av träning

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

Vad säger forskningen om programmering som kunskapsinnehåll? Karin Stolpe, föreståndare NATDID liu.se/natdid

Abstract. Pettersson, Karin, 2005: Kön och auktoritet i expertintervjuer. TeFa nr 43. Uppsala universitet. Uppsala.

Könsfördelningen inom kataraktkirurgin. Mats Lundström

Skill-mix innovation in the Netherlands. dr. Marieke Kroezen Erasmus University Medical Centre, the Netherlands

Session: Historieundervisning i högskolan

Språkstörning-en uppföljningsstudie. Ulla Ek Leg psykolog Professor Specialpedagogiska institutionen- SU

Utbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå

Prövning i grundläggande engelska: GRNENG 2

Ökat personligt engagemang En studie om coachande förhållningssätt

Auditivt arbetsminne - en kritisk faktor för hörförståelse och språkhantering

Att följa, stimulera och bedöma språkutveckling en uppgift för barnhälsovården i Sverige. Ett förslag till allmän hälsokontroll av 4-åringar

Läsförståelse definitioner och svårigheter. Åsa Elwér, Institutionen för beteendevetenskap och lärande (IBL)

Rapportskrivning Användarcentrerad Design. Anders Lindgren

Svenska som additivt språk. Skolverket Berit Lundgren FD, Umeå universitet Lilian Nygren Junkin FD, Göteborgs universitet

En arbetsplats för både kropp och knopp Kontorsmiljöns betydelse för prestation och hälsa

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap

Vilka typer av matematiska resonemang (ut)värderas i skolmatematiken?

Programmering på vetenskaplig grund? Några forskningsresultat. Karin Stolpe, föreståndare NATDID liu.se/natdid

Why WE care? Anders Lundberg Fire Protection Engineer The Unit for Fire Protection & Flammables Swedish Civil Contingencies Agency

FORSKNINGSKOMMUNIKATION OCH PUBLICERINGS- MÖNSTER INOM UTBILDNINGSVETENSKAP

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Kursplan. AB1029 Introduktion till Professionell kommunikation - mer än bara samtal. 7,5 högskolepoäng, Grundnivå 1

Gatus. ett multietniskt ungdomsspråk i Uppsala. Birgitta Emanuelsson

Kursplan. FÖ1038 Ledarskap och organisationsbeteende. 7,5 högskolepoäng, Grundnivå 1. Leadership and Organisational Behaviour

KIT 104 Kognitiva processer

Delaktighet på distans för personer med kommunikativa och kognitiva svårigheter

Delaktighet på distans för personer med kommunikativa och kognitiva svårigheter

Health café. Self help groups. Learning café. Focus on support to people with chronic diseases and their families

Kursplan. JP1040 Japanska III: Språkfärdighet. 15 högskolepoäng, Grundnivå 1. Japanese III: Language Proficiency

Fysisk aktivitet och hjärnan

GDQ Associates lanseringsmingel. 21 mars 2017 i Stockholm

Vardagsteknik i hem och samhälle. en möjlighet eller hinder för personer med kognitiva nedsättningar?

E-boksstudie vid Högskolebiblioteket i Jönköping: resultat och konsekvenser för förvärvet

Ordinarie tenta i Psykiska funktioner och deras biologiska bas: Del 3 (kognition), Psykologprogrammet, Tl, den 13 maj 2016 (PS3100:0372)

Maria Fransson. Handledare: Daniel Jönsson, Odont. Dr

What Is Hyper-Threading and How Does It Improve Performance

Swedish framework for qualification

Användning av Erasmus+ deltagarrapporter för uppföljning

Att vara delaktig på distans

Cancersmärta ett folkhälsoproblem?

Det finns en stor mängd appar till surfplattor som kan användas för att

Läsning och textförståelse hos grundskoleelever med neuropsykiatriska funktionsnedsättningar. Jakob Åsberg Johnels. Göteborgs universitet

Kursplan. MT1051 3D CAD Grundläggande. 7,5 högskolepoäng, Grundnivå 1. 3D-CAD Basic Course

Prövning i grundläggande Engelska

Kursplan. EN1088 Engelsk språkdidaktik. 7,5 högskolepoäng, Grundnivå 1. English Language Learning and Teaching

FaR-nätverk VC. 9 oktober

Hållbar utveckling i kurser lå 16-17

PEC: European Science Teacher: Scientific Knowledge, Linguistic Skills and Digital Media

Med ljudet som omvärld

I Ingvars anda med sikte på läsförståelse. Natur och Kulturs Läskonferens 2013 Stockholm Pekka Niemi, Åbo universitet

Kursplan. KI1028 Kinesiska för affärslivet: Vardaglig kommunikation. 15 högskolepoäng, Grundnivå 1. Chinese for Business: Daily Communication

Tillgänglighet och appar -forskning möter praktiken

Wikipedia! om astronomi och fysik. Dainis Dravins Institutionen för astronomi och teoretisk fysik, Lund

Provlektion Just Stuff B Textbook Just Stuff B Workbook

The annual evaluation of the Individual Study Plan for PhD students at the Department of Biochemistry and Biophysics

ATT BIDRA TILL JÄMLIKHET I HÄLSA - DELAKTIGHET SOM TEORI, METOD OCH PRAKTIK

Att utforska matematiken tillsammans strategier för inkluderande klassrumssamtal

Kognitionsvetenskap C, HT-04 Mental Rotation

Kursplan. AB1030 Att arbeta i projekt. 7,5 högskolepoäng, Grundnivå 1. Working in projects

Hur löser vi fjärrkommunikation för personer med kommunikativa och kognitiva svårigheter?

Agenda för presentation

Handfunktion ur ett 20- årsperspektiv, vad har vi lärt? Ann-Christin Eliasson, arbetsterapeut

TEACHING AND LECTURING

IKSU-kort Ordinarie avtal

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

Delaktighet på distans för personer med kommunikativa och kognitiva svårigheter

Evidensgrader för slutsatser

Michal Drechsler Karlstad University SMEER Science Mathematics Engineering Education Research

Universitetsstudenter med dyslexi: Läsförmåga och studiestrategier.

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")

Grammatiska metaforer i engelskan och hur de översätts till svenska. Lene Nordrum Engelska institutionen Göteborgs universitet

Omtenta i Psykiska funktioner och deras biologiska bas: Del 3 (kognition), 7,5 bp Psykologprogrammet, T1, den 6 februari 2016 (PS3I00:0372)

PDP som redskap för karriärutveckling i utbildning. Ola Tostrup

CUSTOMER READERSHIP HARRODS MAGAZINE CUSTOMER OVERVIEW. 63% of Harrods Magazine readers are mostly interested in reading about beauty

Barn med utvecklingsneurologiska avvikelser/ ESSENCE och adaptiv funktion

Learning study elevers lärande i fokus

Second handbook of research on mathematics teaching and learning (NCTM)

Att läsa utan att förstå - läsförståelseproblem i tidig skolålder. Åsa Elwér

Olika lässvårigheter kräver olika pedagogiska insatser

UTBILDNINGSPLAN Magisterprogram i pedagogiskt arbete 60 högskolepoäng. Master Program in Educational Work 60 credits 1

Språket, individen och samhället VT08

Assessing GIS effects on professionals collaboration processes in an emergency response task

Vetenskap och evidens

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

Livsgnista som en del av det goda åldrandet: fokus på svensk- och finskspråkiga äldre

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator

: 2( 34# 4 : 4 34# : 4 5# : 4 5# : (

Kristina Säfsten. Kristina Säfsten JTH

SPECIALPEDAGOGIK. Ämnets syfte

Primum, non nocere ÉVA TAMÁS

Kursplan. PR1017 Portugisiska: Muntlig språkfärdighet II. 7,5 högskolepoäng, Grundnivå 1. Portuguese: Oral Proficiency II

Skrivträning som fördjupar den naturvetenskapliga förståelsen Pelger, Susanne

Projektarbeten i astronomi Wikipedia och andra media

Designmönster för sociala användningssituationer

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Stressade studenter och extraarbete

Transkript:

HÖRFÖRSTÅELSE: EFFEKTER AV TALSYNTES OCH MÄNSKLIGT TAL Morgan Lantz Kandidatuppsats i Psykologi, 15 hp Vt 2018 Handledare: Bert Jonsson

Jag vill inledningsvis rikta ett varmt tack, till de som har deltagit i undersökningen som har möjliggjort att uppsatsen kunde genomföras. Jag vill även tacka min handledare Bert Jonsson för hans hjälp och stöd under processen med uppsatsen. Umeå Maj 2018 Morgan Lantz

1 Abstrakt Förmågan att lyssna till en uppläst text, har visat sig vara en komplex uppgift som kräver kognitiva resurser. Några av de kognitiva resurser som krävs för att förstå en uppläst text, är bland annat att en individ har uppmärksamheten riktad mot texten samt att de har ett väl utvecklat ordförråd. För att undersöka om det föreligger någon skillnad i hörförståelse mellan att lyssna på en uppläst text via talsyntes eller mänskligt röst genomfördes en inomgruppsstudie där totalt 13 personer ingick. Av de som ingick var det fyra kvinnor och nio män, mellan 27 och 69 år. Analyserna visade att det inte förekom någon skillnad avseende hörförståelsen för gruppen som helhet samt att inga könsskillnader förelåg. Däremot visade studien att det förekom en relativt stark negativ korrelation mellan ålder och antal rätta svar för texter som var upplästa av talsyntes. Studien indikerar att hörförståelse inte påverkas negativt om en text läses upp av talsyntes jämfört med en mänsklig röst. Men däremot så indikerar studien att äldre personers hörförståelse påverkas i högre grad när de skall lyssna till en text från en talsyntes. Nyckelord: kognition, resurser, hörförståelse, talsyntes, mänsklig röst Abstract The ability for listening to a text is a complex task that requires cognitive resources. Some of these cognitive resources both attention and well-developed vocabulary. To address whether listening comprehension is affected differently by listening to a text from a synthetic speech and human voice a within-subject designed study was conducted which included 13 participants. Of those 13 participants, four were females, and nine were males ranging between 27 to 69 years of age. The analyses showed that there were no difference in listening comprehension with respect to the whole group and no gender differences. However, there was a relatively strong negative correlation between age and number of correct responses for texts read by a synthetic voice. This study indicates that listening comprehension is not negatively affected when a text is read by synthetic voice compared to a human voice. The study does indicate that older individuals listening comprehension to a more considerable extent are affected when they listen to a synthetic voice compared to a human voice Keywords: cognition, resources, listening comprehension, synthetic speech, human voice

2 Hörförståelse: Effekter av talsyntes och mänskligt tal Numera är det möjligt att få litteratur inläst av en människa för att sedan användas som stöd för synskadade och för individer med läs och skrivsvårigheter. Men under de senaste åren har tekniken för uppläsning av text via talsynteser utvecklats. Men den nya tekniken har en del begränsningar. Begränsningar som genererat frågan om huruvida talsyntes kan ersätta text inläst av en människa. En central aspekt är om hörförståelsen påverkas negativt när text läses upp med talsyntes jämfört med en text som lästs in av en människa. Det övergripande syftet med denna studie är därför att undersöka om det finns någon skillnad när det gäller hörförståelsen av en uppläst text av en människa jämfört med en text som uppläses av en talsyntes. Potentialen att kunna använda talsyntes vid uppläsning av text är stor. Men några kritiska faktorer som påverkar en persons förmåga att förstå en text som uppläses via en talsyntes har identifierats. Den röst som talsyntesen använder sig av och den hastighet som texten blir uppläst tillsammans med textens komplexitet har identifierats som kritiska avseende förmågan att uppfatta en text från en talsyntes (Papadopoulos, Koutsoklenis, Katemidou, & Okalidou, 2009). När en person lyssnar till en uppläst text, skall personen både uppfatta vad de hör samt att integrera den nya informationen till den befintliga kunskapen som personen har sedan tidigare. Processen att lyssna på en text, integrerad den med tidigare delar av texten och med egna förkunskaper ställer stora krav på den kognitiva förmågan. Tidigare forskning har visat att texter upplästa via en talsyntes i jämförelse med text uppläst av en människa kräver mer av individens kognitiva resurser, särskilt avseende hörförståelse. Studier som beskrivs nedan. I en studie som genomfördes av Curtin och Ayaz (2017) där åtta deltagare fick lyssna på ett antal meningar under tiden de utsattes för en kognitiv belastning i termer av att samtidigt köra bil. Den studien visade att det fanns skillnader mellan förståelse av naturlig text och en text från en talsyntes. Curtin och Ayaz (2017) argumenterade att deltagare som fick lyssna till en talsyntes innebar detta att de fick använda mer kognitiva resurser, vilket tog sig i uttryck i förlängd responstid jämfört med när de fick lyssna till en text uppläst av en människa. Studien visade också att och att den ökade kognitiva belastningen medförde en ökad aktivitet i det prefrontala området i hjärnan. I en studie genomförd av Craig och Schröder (2017), visar de att en person som får lyssna till en talsyntes kan svårigheten för en sådan uppgift leda till en ökad kognitiv belastning hos individen som lyssnar till en sådan text. Koul (2003) argumenterade att personer förstår en text som blir uppläst av en människa både snabbare och mer korrekt jämfört när en text kommer från en talsyntes. Ett antal parametrar antas orsaka denna skillnad. (i) den miljön personen befinner sig och hur erfaren en person är att kunna lyssna till en uppläst text påverkar förståelsen. För en mer erfaren individ minskar skillnaden avseende hörförståelse mellan text uppläst av människa och text uppläst av talsyntes. (ii) kvalitén på en talsyntes påverkar hur väl en person kan uppfatta innehållet från den text som individen lyssnar till. (iii) textens komplexitet. En ökad grad av komplexitet medför högre kognitiva krav vilket i sin tur innebär att det tar längre tid att sammanfatta den text som personen har lyssnat på (Koul, 2003). Vidare argumenterade Koul (2003) att det finns ytterligare evidens för antagandet om kognitiv belastning. För att förstå enstaka meningar, tar en sådan process längre tid när text läses upp av en talsyntes jämfört med en text som blir uppläst av en människa. Detta tyder på att det kräver mer kognitiva resurser för att kunna tolka en mening från en talsyntes. I linje med Curtin och Ayaz (2017) påpekades Koul (2003) att faktorer som hur komplex texten är och hur

snabbt talsyntesen läser upp texten påverkar hur väl en person kan förstå en text från en talsyntes (Koul, 2003). Enligt Winters och Pisoni (2004), innebär störande bakgrundsljud som till exempelvis vitt brus och ljud från talande människor att förmågan att uppfatta enstaka ord från en talsyntes påverkas negativt. I en studie av Winters och Pisoni (2004) fördes andra argument fram som stärker tesen om att syntetiskt tal ökar den kognitiva belastningen. De visade att förmågan till att avgöra om ett ord är ett ord tar längre tid när en person lyssnar till en talsyntes jämfört med när en person lyssnar till en naturlig uppläst text. Det finns även skillnader mellan dessa båda former av upplästa texter när det gäller att bedöma ett visst ord korrekt. Denna bedömning går snabbare när en person lyssnar till en naturlig uppläst text jämfört med en text från en talsyntes. Detta visar att det tar längre tid att korrekt förstå ett ord från en talsyntes och detta kräver i sin tur mer kognitiva resurser hos en individ. Winters och Pisoni (2004), visade också att en person kan träna upp sin förmåga att lyssna till en talsyntes och förstå ord mer korrekt. Men trots en sådan förbättring kvarstår skillnaden mellan förståelsen för enstaka ord från talsyntes jämfört med naturligt språk. Till sist visade Winters och Pisoni (2004), även att bristfällig prosodi gör att en talsyntes låter mindre naturlig och detta medför i sin tur att det tar längre tid att uppfatta enstaka ord och förstå längre textstycken jämfört med en text från en mänsklig person. När det gäller att lyssna till texter från talsynteser har Delogu, Conte, och Sementina (1998) beskrivit, i linje med ovanstående att förståelsen längre texter upplästa via talsyntes kräver mer av de mentala processerna jämfört med att lyssna till en text från en mänsklig röst. Mentala processer som inkluderar minnesförmåga och uppmärksamhet. Sammantaget bidrar det till bilden att det krävs mer kognitiva resurser för att lyssna till en talsyntes. Vilket i sin tur kan ta sig i uttryck i ökad trötthet. Vidare beskriver Delogu et al. (1998) att externa faktorer som till exempel egenskaperna hos texten när det gäller hur lång en text är, textens innehåll samt hur komplex en text påverkar en persons förmåga att bearbeta en uppläst text från en talsyntes. Även akustiska egenskaper hos en talsyntes som till exempelvis hastigheten från talsyntesen påverkar en individs förmåga att processa en uppläst text. Att både lyssna och förstå en uppläst text är en komplex uppgift som kräver kognitiva resurser i termer av uppmärksamhet men också ett gott ordförråd. I en studie som genomfördes av Kim och Phillips (2014) påvisades det att om stora mängder av uppläst text ska uppfattas och processas så kräver det att personen fokuserar på den upplästa texten och samtidigt avskärmar sig från yttre störande ljud. Kim och Phillips (2014) studie visade även att när en person lyssnar till en text behöver denne kunna uppfatta textens idé och kopplingar till andra delar i texten för att få en god förståelse av den upplästa texten. Vidare beskriver Kim och Phillips (2014) att förmågan att resonera ökar möjligheten att både förstå en uppläst text och integrera den nya informationen med individens befintliga kunskap. I en uppföljande studie visade Kim (2015), att förståelsen av en uppläst text kräver flera kognitiva processer allt ifrån att ha ett bra ordförråd, en god kunskap om syntaxen för texten till att förstå en annan persons perspektiv, kunna utvärdera och reflektera över en uppläst text samt att integrera denna nya kunskap till individens befintliga kunskap. I en ytterligare en uppföljande studie argumenterar Kim (2017) att förmågan till att lyssna och förstå en text beror på grundläggande kognitiva funktioner som till exempel arbetsminnet och möjligheten att kunna fokusera på den text som en individ lyssnar till. Dessa grundläggande kognitiva funktioner påverkar i sin tur högre kognitiva processer involverade i att bearbeta den upplästa texten. Några av de dessa processer inbegriper att kunna förstå de underliggande idéerna och dra de slutsatser som författaren av texten faktiskt har tänkt sig för den upplästa texten. 3

4 I studien av Kim (2017) presenteras också en modell som benämns som situationsmodellen. Denna modell är ett ramverk som kan användas för att förstå hur den ursprungliga texten skall tolkas på ett korrekt sätt. Enligt Kim (2017) ingår tre steg i modellen. I steg 1 skall en individ tolka de enskilda orden och fraserna från en text och hålla dessa ord i arbetsminnet. Steg 2 innebär att kunna förstå innebörden av orden och steg 3 innebär att denna innebörd ska integreras med tidigare kunskap för att på såt sätt generera en djupare förståelse av den upplästa texten. När det gäller de kognitiva processer som påverkar en persons förmåga att uppfatta en uppläst text, visar Gyselinck, Jamet, och Dubois (2008) att arbetsminne påverkar individens förmåga att både kunna navigera i en uppläst text samt att kunna integrera den nya kunskapen från texten till befintlig kunskap som personen har sedan tidigare. Även den kunskap som personen har sedan tidigare för ett visst ämne, påverkar förmågan att kunna förstå en uppläst text. Denna bakgrundsinformation som Othman och Vanathas (2017) beskriver är sådan kunskap som en person har sedan tidigare i sitt liv och underlätta att inkludera ny information från en text till den befintliga kunskapen som personen har sedan tidigare. Vidare beskriver Othman och Vanathas (2017) att när en person har svårt att förstå enskilda ord från en uppläst text, medför detta att de får svårighet att kunna förstå en uppläst text. Utifrån ovanstående så kräver texter som blir uppläst från en talsyntes mer kognitiva resurser jämfört med en text från en naturlig uppläst text. Därför förväntas hörförståelsen påverkas i högre grad när text läses upp med syntetiskt tal jämfört med mänskligt tal. Deltagare Metod Till denna uppsats var det totalt 13 personer som deltog i studien och deras ålder var mellan 27 till 69 år. Det var nio män och fyra kvinnor som ingick i studien för denna uppsats. När det gäller medelåldern för de personer som svarade på undersökningen var den 44.5 år och standardavvikelsen var 14.2 år. Design I studien användes en inomgruppsdesign där deltagarna för uppsatsen fick texter inlästa både från en mänsklig röst och från en talsyntes. För att undvika problem med effekter av ordningsföljd så utbalanserades ordningen på texterna genom att hälften av deltagarna fick texter från en mänsklig röst först och texterna från talsyntesen därefter. För andra hälften av deltagarna distribuerades texterna i motsatt ordning. Material För denna uppsats har texter och tillhörande flervalsfrågor från gamla högskoleprov, från våren 2013 och våren 2014 använts. Texter från högskoleprovet hämtades ned från högskoleverkets hemsida (www.högskoleprovet.nu/gamla-prov). Procedur Av de texter som hämtades ned valdes ett antal texter med tillhörande flervalsfrågor ut som sedan blev inlästa. Texterna blev inlästa dels av en student på Umeå universitet (mänsklig röst) och de syntetiska ljudfiler sparades med en kvinnlig talsyntes som heter Klara (syntetisk röst). När texterna var inlästa både av en mänsklig röst och av talsyntes skickades texterna ut till de som deltog i undersökningen via deras e-postadresser. I utskicket fanns även ett

5 dokument bifogat som beskrev hur undersökningen skulle gå till samt ett dokument som innehöll frågor för bakgrundsfakta som ålder och kön. De inlästa texterna som fanns både från den mänskliga rösten och talsyntesen, hade samma uppläsningshastighet för samtliga deltagare i denna undersökning. En talsyntes är enligt Koul(2003) ett system där text matas in till en dator eller en surfplatta med hjälp av ett tangentbord eller pekskärm. Denna text omvandlas sedan med hjälp av matematiska algoritmer till konstgjort tal som kan bli uppläst av den aktuella enheten. Statistisk analys Den statistiska analysen för uppsatsen genomfördes i Excel. En parad tvåsidig t-test jämförde antal rätta svar för på hörförståelseuppgifterna för mänsklig och syntetisk röst avseende gruppen som helhet och mellan kvinnor och män. För att undersöka sambandet mellan ålder och antal rätt på hörförståelseuppgifterna genomfördes även en Pearson korrelationsanalys mellan antal rätt på hörförståelseuppgifterna och ålder avseende texterna upplästa via talsyntes och mänsklig röst. Etiska hänsyn för uppsatsen Till varje person som deltog i denna undersökning skickades ett e-brev till personen där syftet med undersökningen beskrevs samt att ett de medgav sin godkännande att delta i undersökningen. För att kunna försäkra att deltagarna förblev anonyma så kodades svaren från deltagarna av en extern person. Resultat Tabell 1 Medelvärden och standardavvikelser för hörförståelseuppgifterna Mänskligt tal Syntetiskt tal M Sd M Sd Kvinnor (N = 4) 6 3.56 6.5 12.33 Män (N = 9) 5.44 2.13 4.89 2.52 Samtliga deltagare (N = 13) 5.62 2.5 5.38 2.81 Tabell 1 visar medelvärden och standardavvikelser sammantaget och uppdelat på kön. Tabellen indikerar att det inte förelåg någon skillnad i medelvärden. En analys av könsskillnader bekräftade att det inte förelåg någon skillnad mellan kvinnor och män när det gäller antal rätta svar för mänskligt tal, t(11) = -0.36, p = 73 eller syntetiskt tal t(11) = 0.94, p =.36. Utifrån de icke signifikanta skillnaderna så uteslöts kön ur huvudanalysen. Analysen av skillnad mellan att lyssna på text uppläst via talsyntes eller text uppläst via en mänsklig röst visade att det inte förelåg någon skillnad mellan grupperna t(12) = 0.40, p =.70. För att undersöka om ålder var av någon betydelse så genomfördes två korrelationsanalyser mellan ålder och antal rätt för texter uppläsa med syntetiskt tal och mänskligt tal. Korrelation mellan ålder och syntetiskt tal var signifikant negativt, r(13) = -.63, p <.05). Vilket innebär att yngre deltagare presterade bättre än äldre deltagare. Däremot var korrelationen mellan ålder och mänskligt tal ej statistiskt signifikant, r(13) = -.48, p >.05.

6 Diskussion Syftet för uppsatsen har varit att jämföra om det förekommer någon skillnad i hörförståelse mellan en text som blir uppläst av en människa och en text som blir uppläst från en talsyntes. För att kunna jämföra upplästa texter från en människa och en talsyntes, genomfördes en studie där totalt 13 personer deltog i undersökningen. Av de totalt 13 deltagarna var nio män och fyra kvinnor, mellan 27 och 69 år. De fick lyssna på ett antal texter från gamla högskoleprov för att sedan besvara ett antal flervalsfrågor som hörde till varje text. Texterna skickades ut till deras e-postadresser. De fick även svara på frågor om ålder och kön, frågor vilka skickades ut i ett separat dokument. Efter en initial analys som konstaterade att inga könsskillnader förelåg jämfördes antal rätta svar mellan mänskligt tal samt talsyntes. En analys som inte kunde påvisa någon skillnad mellan att läsa och förstå mänskligt och syntetiskt tal När det gäller analysen av sambandet mellan ålder och antal rätta svar påvisades en signifikant negativ korrelation mellan ålder och antal rätta svar för talsyntes. Korrelationen mellan ålder och mänskligt tal var också negativ korrelaterad men utan att uppnå en statistisk signifikans. Sammanfattningsvis visade resultaten att det inte förelåg någon skillnad i hörförståelse mellan talsyntes och mänsklig röst för gruppen som helhet och inte heller avseende kön. Detta indikerar att det är lika enkelt att förstå en text uppläst av en människa som från en talsyntes. Eftersom tidigare studier har visat att förståelsen av enstaka ord kan påverkas av att lyssna på en syntetisk röst så är en möjlig förklaring till resultatet i denna studie att deltagarna får stöd av berättelsens kontext. Avseende kontextuellt stöd har Papadopoulos och Koustriava (2015) beskrivit att det sammanhang som en berättelse ger underlättar både förståelse och bearbetning av den upplästa texten. En kontextualisering vilket sannolikt gynnar den som lyssnar oavsett om de blir upplästa via mänskligt eller syntetisk tal. Analyserna av sambanden mellan ålder och uppläst text visade att det var en signifikant negativt korrelation mellan ålder och antal rätt för talsyntes. Orsaken till det resultatet kan vara mångfacetterat. Enligt Sinatra, Sims, Bailey och Najle (2013) behöver äldre personer använda mer av sitt arbetsminne när de skall förstå och tolka en talsyntes eftersom de enbart uppfattar akustiska egenskaper som intonation från en talsyntes. Medan yngre personer i högre grad uppfattar både detaljer och innehåll från en talsyntes. Vidare argumenterade Sinatra et al. (2013) att äldre har svårare bibehålla uppmärksamhet och det i sin tur påverkar förståelsen av talsyntesen eftersom de prosodiska särdragen i syntetiskt upplästa texter är mer uppmärksamhetskrävande. Ytterligare en tänkbar förklaring till den negativa korrelationen mellan ålder och antal rätta svar för en talsyntes är utbildningsnivå. För äldre personer tenderar studier att ligga längre tillbaka i tid medan för yngre deltagare så är studierna närmare i tid. Det vill säga, yngre personer har med större sannolikhet senare varit utsatt för uppgifter som tangerar de som ingick i denna studie. Yngre personer är möjligen också mer aktiva i digitala miljöer eller plattformar där en talsyntes förekommer. Ytterligare en förklaring till att äldre personer behöver använda sig mer av deras kognitiva resurser, kan bero på den struktur som den upplästa texten bygger på. Även i vilken utsträckning en individ är bekant med ett specifikt ämne påverkar. Är individen obekant med ämnet kräver det mer av de kognitiva resurserna för att tolka och förstå en uppläst text. I linje med de resonemangen har studier visat att om enskilda ords är obekanta så medför det en ökad svårighet att både förstå och tolka en uppläst text.

7 Metoddiskussion När de gäller den metod som har använts för denna uppsats förekommer det några faktorer som kan ha påverkat slutresultatet för uppsatsen. Exempelvis gick det inte att kontrollera när på dygnet som deltagarna genomförde uppgifterna eller faktor som till exempel störande bakgrundsljud påverkade. Det går inte heller att säkerhetsställa att deltagarna bara lyssnade på varje text en gång eller hur lång tid varje deltagare ägnade åt uppgiften. En styrka med uppsatsen var däremot att de upplästa texterna både för talsyntes och mänsklig röst hade samma hastighet. Vidare hade större stickprov kunna påverka resultaten. Även texternas svårighetsnivå för de upplästa texterna, som till exempelvis en mer komplex eller lättare text kan ha påverka slutresultatet för undersökningen. Även kan längden på en text samt hur stor erfarenhet av talsyntes hos deltagarna kunnat påverka slutresultatet. Under uppsatsarbetet har möjliga områden för fortsatt forskning utkristalliserats. Exempelvis att undersöka hur strukturen för en text påverkar en persons förmåga att uppfatta en uppläst text? Även hur mer strukturella faktorer påverkar, exempelvis hur olika typsnitt påverkar förståelsen när texten blir uppläst av en talsyntes. Andra frågor är om typ av utbildning påverkar förmågan att förstå en uppläst text. Ytterligare områden för framtida studier är att undersöka hur mycket prosodin för en talsyntes påverkar förmågan att förstå och tolka en uppläst text och om förmågan att dra slutsatser påverkas i högre grad av en syntetiskt uppläst text.

8 Referenser Craig, S. D., & Schroeder, N. L. (2017). Reconsidering the voice effect when learning from a virtual human. Computers & Education, 114, 193-205. Curtin, A., & Ayaz, H. (2017, July). Cognitive Considerations in Auditory User Interfaces: Neuroergonomic Evaluation of Synthetic Speech Comprehension. In International Conference on Engineering Psychology and Cognitive Ergonomics (pp. 106-116). Springer, Cham. Delogu, C., Conte, S., & Sementina, C. (1998). Cognitive factors in the evaluation of synthetic speech. Speech Communication, 24(2), 153-168. Gyselinck, V., Jamet, E., & Dubois, V. (2008). The role of working memory components in multimedia comprehension. Applied Cognitive Psychology, 22(3), 353-374. Kim, Y. S. (2015). Language and cognitive predictors of text comprehension: Evidence from multivariate analysis. Child Development, 86(1), 128-144. Kim, Y. S. G. (2017). Why the simple view of reading is not simplistic: Unpacking component skills of reading using a direct and indirect effect model of reading (DIER). Scientific Studies of Reading, 21(4), 310-333. Kim, Y. S., & Phillips, B. (2014). Cognitive correlates of listening comprehension. Reading Research Quarterly, 49(3), 269-281. Koul, R. (2003). Synthetic speech perception in individuals with and without disabilities. Augmentative and Alternative Communication, 19(1), 49-58. Othman, J., & Vanathas, C. (2017). Topic familiarity and its influence on listening comprehension. The English Teacher, 14. Papadopoulos, K., & Koustriava, E. (2015). Comprehension of Synthetic and Natural Speech: Differences among Sighted and Visually Impaired Young Adults. Enabling Access for Persons with Visual Impairment, 147. Papadopoulos, K., Koutsoklenis, A., Katemidou, E., & Okalidou, A. (2009). Perception of synthetic and natural speech by adults with visual impairments. Journal of Visual Impairment & Blindness, 103(7), 403. Sinatra, A. M., Sims, V. K., Bailey, S. K., & Najle, M. B. (2013, September). Differences in the performance of older and younger adults in a natural vs. synthetic speech dichotic listening task. In Proceedings of the Human Factors and Ergonomics Society Annual Meeting (Vol. 57, No. 1, pp. 1565-1569). Sage CA: Los Angeles, CA: SAGE Publications. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, (26), 95-138.