Arne Jönsson 2012-07-23 WEBBLÄTTLÄST SLUTRAPPORT 1. Inledning Inom projektet WebbLättLäst har vi utvecklat teknik för att automatiskt rangordna svenska webbsidor efter hur läsbara de är. Detta gör att man kan välja den text som är enklast att läsa, utifrån olika automatiska läsbarhetsmått, givet sökfrågor som ställs till en sökmotor. Projektet ingår som ett led i vår FoU-satsning på att förbättra tillgängligheten till information på Internet för individer med någon form av lässvårigheter, exempelvis dyslektiker, synskadade och utlandsfödda, men även för barn och äldre kan tjänsten WebbLättLäst vara användbar. Tjänsten och alla rapporter finns tillgängliga via projektets webbsidor: http://www.ida.liu.se/projects/webblattlast/ 2. Mål och syfte Syftet med projektet är att göra textuell information på internet lättare tillgänglig för personer som har problem att läsa och förstå svenska. Genom att utveckla en tjänst som automatiskt rangordnar svenska webbsidor efter hur läsbara de är kan man välja den text som är enklast att läsa givet olika sökfrågor. Målet är att göra det möjligt att rangordna texter utifrån olika läsbarhetsmått, inte att utveckla en rangordning för alla texttyper och lässvårigheter. Vilka läsbarhetsmått som bäst mäter hur lättläst en text är fortfarande inte helt utrett och projektets lösning kommer därför att använda ett antal läsbarhetsmått. De tekniker som utvecklas kommer också att enkelt kunna anpassas till olika läsbarhetsmått, användargrupper och texttyper. 3. Projektbeskrivning Projektet tillämpar ett användarcentrerat arbetssätt, för att i största möjliga mån tillgodose användarnas behov och mål. Specifikt innebär det att genom skissning, prototypning och användarstudier specificera vilka syften tjänsten bör fylla för olika personer i olika sammanhang. Därtill utreds hur tjänsten ska utformas med avseende på önskvärda brukskvaliteter och sammansättning av funktioner och innehåll, samt användarupplevelse och sammansättning av tjänstens beteenden och form. För att uppnå detta har personer ur de tilltänkta målgrupperna intervjuats, och dessa intervjuer har sedan analyserats för att skapa så kallade personor. En persona är en fiktiv karaktär som representerar en viss typ av beteenden som observerats hos användarna. Om ett antal användare har uppvisat liknande beteende kan dessa representeras i en persona, som får ett eget namn och bakgrundshistoria. Denna fiktiva användare ökar projektgruppens empati för de verkliga användarna och sammanfattar på ett lättförståeligt sätt de olika beteenden som målgruppen uppvisar. Till varje persona skrivs scenarier som beskriver hur personan använder produkten eller tjänsten. Till WebbLättLästs personor finns flera scenarier, eftersom det inte är bestämt vilken typ av tjänst som ska utvecklas. Att ha flera olika scenarier kan underlätta det valet, då fördelar och nackdelar med olika alternativ framträder tydligare. ------------------------------------------------------------------------------------------------------------------------------------------------------------ Santa Anna IT Research Institute AB email: info@santaanna.se c/o Linköpings universitet tel: 013 28 89 89 Besöksadress: Teknikringen 7 Org.nr 556567-9155 581 83 LINKÖPING
Baserat på personor och scenarier har tjänsten WebbLättLäst utvecklats och därefter iterativt förbättrats utifrån resultat från olika användarundersökningar. Tjänsten hanterar för närvarande läsbarhetsmåtten LIX (läsbarhetsindex), OVIX (ordvariationsindex) och NR (nominakvot). Vi har också, som ett sidoresultat, utvecklat en tjänst som räknar ut en texts läsbarhet. Ett stort problem, som vi också arbetat med inom projektet, är att rensa bort ovidkommande information, framförallt reklam, som inte har med huvudtexten att göra men som kommer att påverka läsbarhetsmåtten. 4. Leverabler Själva tjänsten, Webblättläst finns tillgänglig via http://www.ida.liu.se/projects/webblattlast/webblattlast/ Tjänsten att räkna ut en texts läsbarhet finns tillgänglig via http://www.ida.liu.se/projects/webblattlast/webblattlast/checktext/ Båda tjänsterna är enkla att modifiera med nya läsbarhetsmått. Personor och scenarier framtagna i projektet är avrapporterade i Maja Schylströms rapport En kartläggning av de primära målgrupperna i projektet Webblättläst, http://www.ida.liu.se/projects/webblattlast/rapporter/anvandarstudie.pdf För att underlätta framtida arbete med det användarcentrerade arbetssättet har vi utvecklat mallar för koncept- och personaanlys: Konceptformulär, http://www.ida.liu.se/projects/webblattlast/rapporter/koncept_formular.pdf Personaformulär, http://www.ida.liu.se/projects/webblattlast/rapporter/persona_formular.pdf En utvärdering har gjorts av några olika designkoncept beskrivna i rapporten Gränsnittsprototyp för Webblättläst http://www.ida.liu.se/projects/webblattlast/rapporter/prototyp1.pdf Vi har också samarbetat med Katarina Mühlenbock Heiman och Johan Sjöholm för att utveckla bättre läsbarhetsmått. Rapporteras i Probability as readability - A new machine learning approach to readability assessment for written Swedish, magisteruppsats skriven av Johan Sjöholm, http://www.ida.liu.se/projects/webblattlast/rapporter/lasbarhet.pdf 5. Resultat Projektet har som planerat resulterat i en webbtjänst för rangordning av webbsidor. Följande figur visar hur webblättlästtjänsten ser ut och fungerar. Användaren har här valt att få sidorna rangordnade via läsbarhetsmåttet LIX och att få se värdena för både LIX och OVIX vilka ses efter varje sökresultat (alla sökresultat visas inte i figuren). 2
Det går också att spara sina inställningar så att man nästa gång får länkarna rangordnade efter samma rangordningsmått och får samma mått presenterade. Tjänsten att räkna ut läsbarheten för en text har en enkel ruta i vilken man klistrar in den text man vill räkna ut olika läsbarhetsmått för. I figuren nedan syns den första texten som var resultatet av sökningen i webblättläst. Skillnaden i läsbarhetsmått beror på att den text som använts i beräkningen i webblättläst kommer från en sida som innehåller länkinformation, kontaktinformation och annan ovidkommande information, som inte helt sorterats bort. 3
Designen av tjänsten webblättläst har utformats utifrån de personor och scenarier som utvecklats inom projektet. Dessa personor är baserade på fjorton intervjuer, 20-30 minuter långa. De förväntade målgrupperna är personer läs- och skrivsvårigheter, personer som inte har svenska som modersmål, samt barn i grundskolan och deras lärare. Personorna är också baserade på andra källor som rapporter och publicerade intervjustudier. 6. Utvärdering och analys 6.1 Utvärdering av resultat Tjänsterna fungerar bra då texterna som analyseras är någorlunda långa och webbsidorna i övrigt inte innehåller för mycket ovidkommande information. Projektets syfte är uppnått såtillvida att vi har en väl fungerande tjänst att rangordna webbsidor efter läsbarhet. Vi har dock haft svårt att under projekttiden få tillräckligt många personer ur målgruppen dyslektiker att använda tjänsten och har därför ännu inte kunnat göra en formell utvärdering av nyttan att använda tjänsten. 6.2 Förslag på förbättringar Flera av de sidor som hittas av sökmotorn innehåller väsentligen samma information, vilket ofta gör informationssökningen ineffektiv. En första förbättring vore att utveckla teknik som gör det möjligt att klustra (gruppera) webbsidor efter hur lika deras innehåll är och också utveckla designkoncept för att på bästa sätt kunna använda en sådan tjänst. Detta gör att såväl vanliga 4
användare, som användare med lässvårigheter, inte behöver läsa igenom flera webbsidor med samma innehåll för att få svar på sin fråga, om svaret inte finns i de första sökträffarna. En annan förbättring är att ytterligare förbättra rensningen av ovidkommande information vilket gör att läsbarhetsmåtten blir mer korrekta och därmed rangordningen. Att lägga till fler läsbarhetsmått, och undersöka hur rangordningen påverkas av olika kombinationer av läsbarhetsmått. 7. Framtida arbeten I vårt fortsatta arbete med att utveckla stöd för att minska det digitala utanförskapet genom tjänster som underlättar tillgång till information på Internet för grupper med speciella behov, ser vi huvudsakligen tre inriktningar för tjänsten WebbLättLäst: 1. Klustra webbsidor med liknande innehåll. En ansökan med denna utveckling har skickats in till Internetstiftelsen men tyvärr avslagits. 2. Förbättra rensningen av ovidkommande information på sidorna. 3. Utföra studier med användare ur målgruppen och olika läsbarhetsmått. I vår kommunikationsplan är ambitionen att tillgängliggöra tjänsten via Santa Annas hemsida, men också arbeta för att den tillsammans med relaterade lösningar som utvecklas med stöd från bl.a. PTS kan göras bekvämt tillgänglig för berörda målgrupper t.ex. via myndigheters webbplatser. Man kan också tänka sig att tjänsten används som ett stöd vid produktion av webbinformation som riktar sig till målgrupper med olika typer av läshandikapp. 5