Kan automatiska läsbarhets- och idédensitetsmått användas för att avgöra vilken text läsare föredrar vid informationssökning?
|
|
- Lisbeth Arvidsson
- för 6 år sedan
- Visningar:
Transkript
1 LIU-IDA/KOGVET-G13/036SE Kandidatuppsats i kognitionsvetenskap Kan automatiska läsbarhets- och idédensitetsmått användas för att avgöra vilken text läsare föredrar vid informationssökning? Handledare: Författare: Karl Hörnell Arne Jönsson Examinator: Mattias Arvola 18 september 2013
2 Sammanfattning Idag är det mycket vanligt att man använder internet för att söka reda på och ta till sig information, detta är ofta en mycket snabb och enkel metod. För personer med språkliga problem är det dock inte alltid lika enkelt, dagens sökmotorer tar inte hänsyn till hur lättläst en text är (Google har börjat experimentera lite med detta på engelska). En metod för att hjälpa personer med sådana behov är att sortera sökträar efter hur läsbara de är enligt olika läsbarhetsmått som beräknas automatiskt av en dator. Risken är då att en sådan omfördelning av resultaten premierar träar som innehåller mindre information eller är irrelevanta givet sökningen. Syftet med studien är att undersöka samband mellan läsbarhet innehåll och relevans för att i förlängningen kunna utforma algoritmer som kan användas för att hitta texter med lagom läsbarhet och informationstäthet åt personer med eller utan lässvårigheter. 21 texter hämtades från sökmotorn Google via sju olika sökningar. Försökspersoner har därefter fått läsa texterna och svara på frågor kring hur de upplevde dem. Alla automatiska läsbarhets och idédensitetsmått ser ut att ge viss indikation på hur en text upplevs av försökspersonerna och därigenom påverka vilka texter som föredras, även antalet ord i en text ser ut att vara en viktig indikator här. 1
3 Innehåll 1 Introduktion Syfte Läsbarhet Automatiska läsbarhetsmått Kritik Frågeställning Metod Texturval Läsbarhetsmått Försökspersoners textskattning Analys Resultat & resultatdiskussion Alla texter Grupperat efter sökning Grupperat efter antalet ord Diskussion Validitet, reliabilitet & generaliserbarhet Slutsats Framtida forskning A Appendix bakgrundsenkät 28 2
4 B Appendix enkät intresse för sökterm 29 C Appendix enkät för textvariabler 30 D Appendix enkät för ordnande av texter 31 3
5 1 Introduktion Vid informationssökning på internet med en vanlig sökmotor presenteras träarna efter vilken hjälp den enskilda träen är för användaren. Vilka variabler som tas hänsyn till varierar mellan olika motorer, men huvudsakligen används söktermen tillsammans med någon form av web-graph-algoritm såsom Google PageRank för att beräkna ett generellt svar på sökningen [Robertson, 1993]. För personer med lässvårigheter kan detta vara ett problem då sökningen inte tar hänsyn till att olika träar eller texter kan vara olika svåra att läsa och ta till sig. 1.1 Syfte Denna uppsats undersöker variabler som kan tänkas användas vid informationssökning för att ta större hänsyn till hur lätt en text är att ta till sig, dvs. träens läsbarhet och eller idédensitet. Detta i syfte att göra det lättare för personer med olika typer av lässvårigheter att hitta texter som lämpar sig för dem och deras behov. 1.2 Läsbarhet Dale & Chall (1949) beskriver läsbarhet som följer (översatt): Läsbarhet är summan av alla element i en given text som påverkar med vilken framgång en grupp läsare kan förstå en text, nna den intressant samt läsa den i optimal hastighet. Huruvida en text upplevs som lätt att läsa eller inte beror dels på textens karaktär och egenheter men även på personen som ska läsa den. Om man är ovan 4
6 att läsa eller har läshandikapp såsom dyslexi behöver man längre tid och bättre koncentration för att läsa en text; deras läsförmåga är lägre. En lägre läsförmåga innebär dessutom att en texts tillkortakommanden förstärks, ibland till den grad att personen slutar läsa [Språkrådet, 2004]. Vad som påverkar huruvida en person kan läsa och förstå en given text utan att tappa yt kan delas in i två områden, läsarfaktorer och textfaktorer. Läsarfaktorer är de som läsaren har med sig i sina erfarenheter och förmågor. Textfaktorer är textens inneboende egenskaper, t.ex. om en speciell jargong används eller om meningarna i regel är korta respektive långa. Hur läsaren uppfattar en text beror på dennes förmåga att snabbt och enkelt kunna tolka ordens betydelse korrekt. Läsarens medhavda kunskap inom området som texten behandlar bidrar till detta. Läsarens kunskap och erfarenhet inom det specika språket i form av ord och syntax som ofta används och dennes intresse eller motivation för att läsa den specika texten spelar också in [Oakland & Lane, 2004, Newbold et al. 2010]. De enklaste sätten att beräkna en texts läsbarhet baseras på så kallade läsbarhetsmått. Dessa läsbarhetsmått använder sig av olika framträdande drag i texten, exempelvis ordlängd eller meningslängd. Vilka ord som används påverkar också hur lättläst en text upplevs vara då vanligt förekommande ord förstås och tolkas både lättare och snabbare än ord som inte är lika frekventa i språket [Newbold et al. 2010]. Antalet logiska propositioner per mening har också visat sig påverka texters läsbarhet då läsarens kognitiva belastning blir större [Kintsch & Keenan, 1973]. Antalet propositioner per mening kallas idédensitet. Man skulle alltså kunna bedöma en texts inneboende läsbarhet genom att titta på aspekter i texten, eller bedöma läsbarheten av en text för en viss målgrupp genom att undersöka hur denna grupp upplever en text. Den förstnämnda metoden 5
7 är enkel att automatisera. Desto svårare är att koppla de värden man räknar ut automatiskt med sådana läsbarhetsmått till en verklig upplevd läsbarhet hos läsare. 1.3 Automatiska läsbarhetsmått Automatiska läsbarhetsmått används för att mäta och kvantiera de aspekter i en text som påverkar läsupplevelsen. De kan användas av författare som ett hjälpmedel för att skriva lättillgängliga texter eller användas av en läsare som vill hitta enklare texter. Det nns många olika mått som behandlar olika karaktärsdrag i texten, vilka som används varierar beroende på vad man vill ha fram men även mellan olika språk då förutsättningarna skiljer sig språken emellan. Gemensamt för de esta läsbarhetsmått är att de returnerar ett numeriskt värde som kan användas för att jämföra olika texter med varandra, lägre värde betyder att texten är mer lättläst. Ett problem med läsbarhetsmått är dock att olika mått returnerar värden inom helt olika skalor vilket gör dem svåra att jämföra med varandra. Jag kommer att titta närmare på fyra mått för svenska. Nämligen läsbarhetsindex (LIX), ordvariationsindex (OVIX), nominalkvot (NR) och lexikal densitet (LD). Ett ofta använt mått är LIX, ett syntaktiskt mått som mäter antalet långa ord och långa meningar i en text i förhållande till antalet ord totalt. LIX utgår alltså ifrån att långa ord och långa meningar är svårare att läsa än korta sådana. LIX beräknas enligt formeln: LIX = O M + L 100 O meningar och L är antalet ord med er än 6 bokstäver. där O är antalet ord, M är antalet OVIX är ett mått som mäter ordvariation dvs. antalet unika ord i förhållande till antalet ord i en text. Med OVIX utgår man ifrån att ord som sällan förekom- 6
8 mer i en text är svårare att läsa och förstå än ord som förekommer ofta. OVIX kan också i vissa fall användas som ett idédensitetsmått där ett lågt värde kan antyda att texten är väldigt tunn och ett högt värde antyder att den är idétät [Af Geijerstam, 2006]. OVIX beräknas enligt formeln nedan där O är antalet ord i texten och U är antalet unika ord. OV IX = log e (O) log e (2 log e (U)/ log e (O)) NR är ett idédensitetsmått som alltså ämnar mäta hur många propositioner eller idéer som förmedlas per textenhet. NR gör detta genom att beräkna antalet substantiv, prepositioner och particip i förhållande till pronomen, verb och adverb. Se formel nedan: NR = substantiv + prepositioner + particip pronomen + verb + adverb LD är ett annat idédensitetsmått som man kan säga utgår ifrån att de informationsbärande orden i en text är de semantiska; substantiv, adjektiv, verb och adverb. Man delar dessa på antalet ord i texten för att få fram textens lexikala densitet. Se formel nedan där O är antalet ord i texten: LD = substantiv + adjektiv + verb + adverb O Harrison & Bakker (1998) har undersökt läsbarhetsmått i engelska tillsammans med LD och kommer i sin studie fram till att den upplevda läsbarheten stämmer bättre överens med LD än med övriga läsbarhetsmått vad gäller engelska. Med hjälp av idédensitetsmått kan man även skilja mellan olika textgenrer såsom 7
9 tekniska texter eller skönlitterära texter, detta då tekniska texter ofta har högre innehållstäthet, det går även att skilja på talat och skrivet språk där skrivet oftast har högre täthet [Covington, 2008]. Utöver de mått jag tagit upp nns även familjäritetsmått vilka mäter antalet förekomster av ett ord i en stor samling texter, en så kallad korpus, i förhållande till det totala antalet ord i korpusen. Därigenom får man ett mått på hur sannolikt det är att läsaren har stött på ordet tidigare, hur familjärt ordet är för läsaren. Detta sätt att mäta familjäritet kallas korpusfrekvens Kritik Tanakasha-Ishii & Terada (2011) undersöker korrelationen mellan familjäritet och korpusfrekvens, de påvisar att familjära ord inte alltid måste vara frekventa, korrelationen mellan familjäritet och frekvens blev starkare desto er ord korpusen innehöll. De kunde dessutom se att korrelationen mellan familjäritet och korpusfrekvens blev starkast när korpusen främst innehöll talat språk. Detta talar emot familjäritetsmått som en eektiv metod för att mäta en texts läsbarhet. En text blir inte mer läsbar bara för att ett läsbarhetsmått antyder det. En text vars målgrupp är väl insatt i ett område tas emot bättre om standardterminologi används snarare än förenklingar [Huckin, 1983]. Läsbarhetsmått kan också ha en kritisk lägsta-punkt under vilken en text blir mer svårläst för en läsare. Man kan ofta med fördel skriva samman meningar som har med varandra att göra för att göra en text mer lättläst [Harrison & Bakker, 1998, Selzer, 1983]. Detta visar alltså att ett höjt LIX-värde kan ge mer lättlästa texter under vissa omständigheter. Vad som kanske främst saknas när det kommer till automatiska läsbarhetsmått är förmågan att koppla ett uträknat värde till något som hjälper läsaren. Huckin (1983) 8
10 menar att automatiska läsbarhetsmått används för mycket av vissa författare, till den grad att de bryr sig mer om denna abstrakta sira än vad de själva tror passar deras målgrupp. Han menar ytterligare att vi med dessa läsbarhetsmått förbiser den kognitionspsykologiska och läsarcentrerade bilden av läsbarhet. Min förhoppning är att man med hjälp av dessa automatiska läsbarhetsmått ska kunna utforma en algoritm som kan hjälpa personer med eller utan lässvårigheter att hitta texter som passar vad de letar efter. 1.4 Frågeställning Kan automatiska läsbarhets- och idédensitetsmått användas för att avgöra vilken text läsare föredrar vid informationssökning? 2 Metod I studien undersöks vilka texter läsare föredrar för att svara på en sökfråga, detta undersöks både med hjälp av användarens egna skattningar av olika karaktärsdrag i texten samt automatiskt beräknade mått. Alla variabler rör relevans relaterat till sökningen, idédensitet, läsbarhet eller ren textlängd. Texter hämtas ut genom sökningar på Google, försökspersoner får därefter läsa texterna och svara på frågor om dessa. I analysen jämförs sedan människornas uppskattning med välkända läsbarhetsmått genom regressionsanalys. Detta svarar på vilka variabler som kan tänkas vara viktiga. 9
11 2.1 Texturval Texter hämtas ut från tre olika sökningar med söktjänsten Google, söktermerna är tänkta att generera texter med olika läsbarhet och är hämtade och översatta av mig från en studie av Newbold et al. (2010) där de jämförde texters läsbarhet utifrån olika sökningar via Google. Sökningarna såg ut som följer med sökningen jag använde i min studie till vänster och sökningen som Newbold et al. (2010) använde till höger. börskrasch (stock market crash) råd psykisk sjukdom (mental health care advice) fakta ales stenar (stonehenge facts) Träar utan sammanhängande text samt text som överskred 1500 ord togs bort, detta för att minimera påverkan från textlängd. Totalt hämtades sju texter per sökning och rangordnades efter i vilken ordning de presenterats på Google. Navigationslänkar, reklam och bilder togs bort från texterna manuellt. 2.2 Läsbarhetsmått För alla texter beräknades läsbarhet och idédensitet med LIX, OVIX, NR och LD. Före beräkning av NR och LD skedde ordklasstaggning med hjälp av verktyget Granska Tagger [Carlberger & Kann, 1999]. 2.3 Försökspersoners textskattning Alla försökspersoner ck läsa texter från två av de tre tillgängliga sökningarna. Innan testets början ck försökspersonerna svara på en bakgrundsenkät 10
12 med frågor om deras läsförmåga etc., enkäten kan ses i appendix A. Alla 30 försökspersoner var födda i Sverige med svenska som modersmål, ingen hade något språkhandikapp och alla trodde att de skulle klara testet bra eller mycket bra. Efter bakgrundsenkäten presenterades försökspersonerna med söktermen som använts för att hitta texterna som skulle komma, de ck då svara på hur intressanta de trodde texterna från denna sökning skulle vara, enkäten för detta kan ses i appendix B. Därefter presenterades en text i taget från den givna sökningen, i en ordning så att ingen försöksperson ck samma följd av texter. Efter varje läst text ck försökspersonen svara på en kort enkät om hur de upplevde texten, denna enkät kan ses i appendix C. De frågor som ställdes om texten rör textens relevans relaterat till sökningen, huruvida texten var lätt att läsa, gick snabbt att läsa och huruvida den upplevdes som innehållsrik. När de sju texterna från en sökning lästs igenom ck försökspersonerna i uppgift att ordna texterna efter vilken text de helst skulle läsa för att svara på sökfrågan. Denna uppgift presenterades liksom de andra på papper och kan ses i appendix D. De textvariabler som behandlades efter varje text; relevans, lättlästhet, snabblästhet och innehållsrikedom (appendix C) är de som senare används för att predicera försökspersonernas föredragna ordning (appendix D) tillsammans med de automatiskt beräknade variablerna, de olika läsbarhetsmåtten samt antal_ord. 2.4 Analys För att kunna analysera samband mellan olika variabler delades texterna in i olika grupper. En gruppering skapades beroende på textlängd bestående av grupperna ord, ord samt 1000 eller er ord. Detta för att undersöka 11
13 textlängdens inverkan på resultatet. En gruppering gjordes efter vilken sökning texten kommit ifrån, en utifrån vilken rangordning texten haft på Google där den första icke-exkluderade räknas som 1, i denna gruppering jämförs vilken ordning försökspersoner velat läsa texterna jämfört med Googles rankning. En gruppering gjordes också innehållande alla texter. Med hänsyn till de människoskattade textvariablerna relevans, innehållsrikedom, lättlästhet och snabblästhet samt de automatiskt skattade beräknade LIX, OVIX, NR och LD tillsammans med antalet ord genomfördes regressionsanalys för de olika grupperna i syfte att predicera den människoskattade ordningen. Utöver detta jämförs också korrelationer mellan variablerna. 12
14 3 Resultat & resultatdiskussion Här presenteras och diskuteras resultaten från studien. 3.1 Alla texter För att få en överblick över alla nedhämtade texter och den data som samlats kring dem kan vi i tabell 1 se medelvärde och standardavvikelse för de olika textvariablerna. I tabell 2 kan vi se vilka predikatorer som starkast påverkar ordning utifrån Tabell 1: Beskrivande statistik för alla texter. LIX OVIX NR LD antal_ord relevans lättläst snabbläst innehållsrikt Medelvärde 42,000 71,095 1,377 0, ,714 4,731 5,302 5,302 4,576 Std-avvikelse 6,804 10,663 0,598 0, ,816 1,676 1,479 1,428 1,632 N * 420* 420* 420* Min 31,00 46,00,66, Max 51,00 86,00 3,05, * 30 försökspersoner läste 14 texter var = 420 olika skattningar. en linjär regressionsmodell beräknad med stepwise. Denna predicerar försökspersonernas skattade ordning men kan endast förklara 51,1% av variansen. Den låga förklaringsgraden kan eventuellt bero på att de olika sökningarna skilde sig så mycket ifrån varandra att försökspersonerna skattade ordning utefter olika kriterier för varje sökning. Det kan också bero på att de mått och variabler som samlats inte är tillräckliga för att förklara vilka texter försökspersonerna föredrog. Vi kan i tabell 2 se att försökspersonernas uppfattning av relevans, innehållsrikedom och snabblästhet ser ut att ha en stor påverkan över i vilken ordning de vill läsa texterna. Vi kan också se att innehållsmåtten NR och LD är de enda automatiska läsbarhetsmått med signikans. Antalet ord i texten visar sig i modellen vara en bättre predikator än något av de automatiska läsbarhetsmåtten. Detta kan tänkas peka 13
15 Tabell 2: Regressionsmodell som predicerar föredragen ordning givet textvariabler. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 12,630 1,240 10,183,000 relevans -,423,058 -,354-7,356,000 antal_ord -,002,000 -,284-6,082,000 innehållsrikt -,313,063 -,255-4,980,000 snabbläst -,272,057 -,194-4,799,000 NR -,317,119 -,0,95-2,664,008 LD -4,708 2,156 -,076-2,184,030 på ett dåligt urval av texter där textkvalitén varierar kraftigt med antalet ord, eller på att läsbarhetsmåtten lämpar sig dåligt för text-typerna alternativt lämpar sig dåligt för urvalsgruppen svenska studenter utan lässvårigheter. Det ser ut som om försökspersonerna föredrar texter som de upplever som innehållsrika, detta stämmer även överens med läsbarhetsmåtten i regressionsmodellen. Om vi konsulterar korrelationerna i tabell 3 kan vi också se att försökspersonerna upplever innehållsrika texter som relevanta och att innehållsrikt ofta verkar innebära många ord. Utöver det kan vi också se att variablerna snabbläst och lättläst eventuellt mäter samma sak då de har en väldigt stark korrelation till varandra. Tabell 3: Korrelationer och signikans för alla texter. LIX OVIX NR LD ordn. relevans lättläst snabbläst innehållsrikt antal_ord LIX,022,672***,030 -,049,020 -,132** -,204***,104*,068 OVIX,022,007 -,594*** -,026,080,013 -,003,033,057 NR,672***,007 -,083 -,052 -,027,037 -,001,063 -,150** LD,030 -,594*** -,083 -,056,019 -,006 -,005,032 -,092 ordning -,049 -,026 -,052 -,056 -,635*** -,153** -,041 -,620*** -,419*** relevans,020,080 -,027,019 -,635***,176***,033,687***,355*** lättläst -,132**,013,037 -,006 -,153***,176***,798***,009 -,322*** snabbläst -,204*** -,003 -,001 -,005 -,041,033,798*** -,115* -,476*** innehållsrikt,104*,033,063,032 -,620***,687***,009 -,115*,481*** antal_ord,068,057 -,150* -,092 -,419***,355*** -,322***,481***,262*** * P<0,05; ** P<0,01; *** P<0,001 14
16 3.2 Grupperat efter sökning Det är intressant att titta på och jämföra de olika sökningarna med varandra då detta kan svara på huruvida resultatet skiljer sig åt mellan olika sökningar och därigenom kan svara på om det går att hitta en generell lösning på hur man bäst ordnar texter eller om man måste ta hänsyn till vilken typ av sökning som genomförs. Texterna som genererats av de olika sökningarna varierar i karaktär. Sökningen börskrasch består till stor del av bloggar som behandlar samtida börshändelser, men det nns även några kortare texter om Wall Street-kraschen Sökningen fakta ales stenar består av texter som beskriver den medeltida fornlämningen Ales stenar, att ordet fakta nns med i sökningen ser ut att göra texterna mer formella. Sökningen råd psykisk sjukdom ger texter som riktar sig till personer med psykisk sjukdom eller anhöriga till personer med psykisk sjukdom. De är därför lite enklare skrivna än de andra texterna. Texterna i de olika sökningarna ser alltså vid en första anblick ut att följa samma mönster som i Covingtons experiment [Covington, 2008]. För att få en överblick över skillnaden mellan sökningarna kan vi titta på tabell 4, tabell 5 och tabell 6 som visar deskriptiv statistik för de respektive sökningarna. De två sökningar som var tänkta att vara komplexa (börskrasch & fakta ales stenar ) uppvisar högre LIX-, innehållsrikedom samt OVIX-värde än sökningen råd psykisk sjukdom. Något oväntat har sökningen börskrasch lägst NR, vilket skulle kunna förklaras av att era texter ur den sökningen kommer från bloggar som kan antas ha mer talspråklig framtoning. Sökningen börskrasch bedöms av försökspersonerna som den mest svårlästa, innehållsrika och relevanta. Sökningen råd psykisk sjukdom 15
17 anses å andra sidan vara den mest lättlästa, minst innehållsrika och minst relevanta av de tre sökningarna. Tabell 4: Beskrivande statistik för sökningen börskrasch. LIX OVIX NR LD antal_ord relevans lättläst snabbläst innehållsrikt Medelvärde 42,143 75,571 1,131 0, ,707 4,779 4,843 4,550 Std-avvikelse 6,623 6,434 0,419 0, ,486 1,614 1,565 1,385 Min 31,00 64,00,66, Max 50,00 86,00 2,00, N Tabell 5: Beskrivande statistik för sökningen fakta ales stenar. LIX OVIX NR LD antal_ord relevans lättläst snabbläst innehållsrikt Medelvärde 43,286 77,571 1,636 0, ,050 5,550 4,486 4,814 Std-avvikelse 5,489 3,750 0,405 0, ,602 1,436 1,437 1,741 Min 33,00 73,00 1,11, Max 51,00 82,00 2,32, N Tabell 6: Beskrivande statistik för sökningen råd psykisk sjukdom. LIX OVIX NR LD antal_ord relevans lättläst snabbläst innehållsrikt Medelvärde 40,571 60,143 1,363 0, ,436 5,579 5,579 4,364 Std-avvikelse 7,863 10,198 0,780 0, ,871 1,230 1,145 1,727 Min 31,00 46,00,67, Max 50,00 80,00 3,05, N
18 I tabell 7 som visar regressionsmodellen för sökningen börskrasch kan vi se relevans, OVIX och NR som predikatorer för ordning. antal_ord nns inte med i denna modell vilket kanske kan förklaras med att texterna är relativt jämnlånga. Modellen för sökningen börskrasch kan endast förklara 34,2% av variansen. Den låga förklaringsgraden är problematisk och kan eventuellt delvis förklaras med att antalet texter och försök är för få för att ge tillräcklig data eller att variationen är så pass stor att inga starka mönster kan påvisas. Det kan dock tolkas som att OVIX och NR i brist på skillnad i textlängd till viss del kan förklara den föredragna ordningen. Relevans är den starkaste predikatorn även för sökningen råd Tabell 7: Regressionsmodell som predicerar föredragen ordning givet textvariabler i sökningen börskrasch. B-Koecient, Std.-error. Beta-koecient t Sig. Konstant 13,557 1,713 7,915,000 relevans -,439,099 -,325-4,447,000 OVIX -,086,025 -,275-3,372,001 NR -,892,389 -,186-2,295,023 psykisk sjukdom vilket vi kan se i tabell 8. Här kan vi även se att antal_ord och innehållsrikedom nns med. Sökningen är också den med störst skillnad i textlängd mellan de olika texterna. I tabell 9 som visar regressionsmodellen för sökningen Tabell 8: Regressionsmodell som predicerar föredragen ordning givet textvariabler i sökningen råd psykisk sjukdom. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 7,744,287 26,960,000 relevans -,434,078 -,405-5,597,000 antal_ord -,002,000 -,358-5,636,000 innehållsrikt -,216,092 -,186-2,359,020 fakta ales stenar kan vi se samma predikatorer som för råd psykisk sjukdom dvs, innehållsrikt, antal_ord samt relevans, fast i en ny ordning och med snabblästhet 17
19 som sista variabel. Regressionsmodellerna för de olika sökningarna fakta ales ste- Tabell 9: Regressionsmodell som predicerar föredragen ordning givet textvariabler i sökningen fakta ales stenar. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 10,670,688 15,500,000 innehållsrikt -,469,098 -,405-4,794,000 antal_ord -,002,000 -,309-4,130,000 relevans -,378,105 -,301-3,594,000 snabbläst -,285,093 -,204-3,082,002 nar och råd psykisk sjukdom kan förklara ca 65% av variansen för vardera sökning. Den skillnaden vi kan se i förklaringsgrad mellan sökningarna fakta ales stenar och råd psykisk sjukdom på ena sidan med 65% av variansen förklarad och sökningen börskrasch med 34% kan eventuellt förklaras av att sökningen innehåller texter med något lägre skillnad i textlängd eller av någon annan del i textens karaktär eller hur den upplevdes av försökspersonerna. I tabell 10 kan vi se en regressionsmodell för sökningarna med starkast förklaringsgrad (råd psykisk sjukdom och fakta ales stenar). I denna modell kan vi se att OVIX tagits med som predikator och Tabell 10: Regressionsmodell som predicerar föredragen ordning givet textvariabler i sökningarna fakta ales stenar och råd psykisk sjukdom. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 8,068,607 13,295,000 innehållsrikt -348,,067 -,303-5,173,000 relevans -,388,064 -,341-6,054,000 antal_ord -,002,000 -,301-6,215,000 snabbläst -,168,062 -,109-2,718,007 OVIX,16,006,094 2,582,010 att ett högt OVIX-värde antyder att försökspersonerna inte vill läsa texten. Den sammanslagna modell har en förklaringsgrad av 63,4% vilket är väldigt nära de individuella sökningarnas förklaringsgrad på 65% och märkbart högre än modellen 18
20 med alla sökningar inkluderade (51,1%). 3.3 Grupperat efter antalet ord I detta kapitel är texterna grupperade i tre grupper, texter med ord, ord och 1000 eller er ord. I tabellerna 11, 12 och 13 kan vi se beskrivande statistik för de olika grupperna. Av 21 texter innehöll 12 stycken ord, 5 stycken i ord och 4 texter innehöll 1000 ord eller er. Vi kan se att försökspersonerna ser ut att föredra de längre texterna som de ser som innehållsrika. Tabell 11: Beskrivande statistik för texter innehållande ord LIX OVIX NR LD antal_ord ordning relevans lättläst snabbläst innehållsrikt Medelvärde 41,4 72,2 1,41 0, ,5 4,542 4,458 5,767 5,917 4,088 Std-avvikelse 7,40 10,0 0,53 0,04 109,69 1,87 1,676 1,166 1, N Min 31,00 46,00,66, Max 51,00 82,00 2,32, Tabell 12: Beskrivande statistik för texter innehållande ord LIX OVIX NR LD antal_ord ordning relevans lättläst snabbläst innehållsrikt Medelvärde 43,0 65,4 1,35 0,52 804,4 3,99 4,51 4,46 4,4 4,73 Std-avvikelse 6,42 9,69 0,86 0, ,762 1,962 1,661 1,749 1, N Min 31,00 51,00,76, Max 48,00 77,00 3,05, Tabell 13: Beskrivande statistik för texter innehållande ord LIX OVIX NR LD antal_ord ordning relevans lättläst snabbläst innehållsrikt Medelvärde 42,5 75,0 1,31 0, ,75 2,375 5,825 4,963 4,588 5,85 Std-avvikelse 5,06 11,05 0,31 0, ,615 1,529 1,199 1,409 1, N Min 35,00 57,00,78, Max 49,00 86,00 1,58,
21 I tabell 14 kan vi se vilka predikatorer som tagits med för texterna innehållande ord. Intressant är att LD har tagits med som en predikator då det antyder att den skulle kunna användas för att föreslå texter inom detta textlängdsintervall. Regressionsmodellen för gruppen ord kan förklara 47,9% av variansen. Tabell 14: Regressionsmodell som predicerar föredragen ordning givet textvariabler i texter innehållande ord. B-Koecient, Std.-error. Beta-koecient t Sig. Konstant 11,063 1,175 9,416,000 relevans -,310,078 -,278-3,958,000 antal_ord -,005,001 -,277-4,508,001 innehållsrikt -,265,080 -,233-3,290,001 LD -5,182 2,204 -,112-2,351,020 I tabell 15 kan vi se predikatorerna för ordning bland texter innehållande 500 till 1000 ord, här ser vi att LIX-värdet har tagits med. Dessutom verkar antal_ord i denna grupp ha motsatt eekt i förhållande till andra grupper. Detta kan antyda att texterna i denna grupp som innehöll många ord har upplevts att vara krångligare skrivna och innehålla mindre information. I tabell 12 på sidan 19 kan vi också se att texterna i denna grupp sett utifrån medelvärde har höga LIXvärden och låga OVIX-värden vilket kanske är en kombination om upplevs som dålig av försökspersonerna. Texterna verkar alltså innehålla långa meningar med långa ord, med mycket ordrepetition (låg ordvariation). Regressionsmodellen för gruppen ord kan förklara 54,6% av variansen. 20
22 Tabell 15: Regressionsmodell som predicerar föredragen ordning givet textvariabler i texter innehållande ord. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 1,189 1,547,769,444 relevans -,470,101 -,398-4,655,000 antal_ord,004,001,304 4,501,000 LIX,081,025,266 3,317,001 innehållsrikt -,307,118 -,210-2,602,011 I tabell 16 kan vi se regressionsmodellen för texter innehållande er än 1000 ord. Här kan vi se att ingen av de automatiska läsbarhetsmåtten tagits med istället nns endast lättlästhet och relevans med som predikatorer. Att lättlästhet nns med som predikator kan kanske förklaras med att det rör sig om långa texter och vi kan anta att det blir viktigare för läsaren att den är välskriven ju längre texten är. Regressionsmodellen för gruppen 1000 eller er ord kan förklara 37,9% av variansen. Tabell 16: Regressionsmodell som predicerar föredragen ordning givet textvariabler i texter innehållande 1000 eller er ord. B-Koecient, Std.-avvikelse. Beta-koecient t Sig. Konstant 6,991,742 9,420,000 lättläst -,559,100 -,515-5,597,000 relevans -,316,117 -,248-2,697,009 21
23 4 Diskussion Med utgångspunkt i frågeställningen Hur korrelerar olika läsbarhets- och idédensitetsmått med varandra samt relevans och hur kan man använda detta för att hitta lättlästa texter. kan vi i tabell 3 på sidan 14 se två signikanta korrelationer mellan läsbarhets- och idédensitetsmått. En positiv korrelation mellan läsbarhetsmåttet LIX och idédensitetsmåttet NR samt en negativ korrelation mellan läsbarhetsmåttet OVIX och idédensitetsmåttet LD. Inget av de automatiska måtten korrelerar signikant med försökspersonernas skattade relevans. Alla läsbarhetsmått nns med i någon regressionsmodell vilket antyder att de alla har någon form av koppling till vilka texter försökspersonerna vill läsa. Det är mycket möjligt att olika mått passar bättre för olika typer av texter och att man vid en sökning därför måste ta hänsyn till vilken typ av text man söker efter. Antalet ord i en text ser ut att vara en mycket bra indikator på hur relevant och innehållsrik den upplevs av försökspersonerna i studien. Att långa texter verkar upplevas som relevanta av försökspersonerna kan bero på att det rör sig om just studenter som är vana att ta in mycket information och gör det med enkelhet. Vi kan anta att detta förhållande inte blir lika stark hos personer med lässvårigheter då långa texter kan upplevas alldeles för tunglästa. Antalet ord verkar också vara starkt korrelerat till hur försökspersonerna skattade textens innehållsrikedom vilket skulle kunna göra variabeln överödig, kanske hade innehållsdensitet varit ett bättre ord. Det är också just densitet som de automatiska idédensitetsmåtten mäter. 22
24 4.1 Validitet, reliabilitet & generaliserbarhet Studien bortser ifrån många delar som normalt förekommer vid en sökning efter information på internet. Sökträarna presenteras i studien var för sig som fullständiga texter där allt annat på sidan såsom länkar och bilder har tvättats bort. Detta ger lägre ekologisk validitet vilket innebär att främst försökspersonernas relevansskattning kan se annorlunda ut i denna studie mot hur den skulle se ut vid en verklig sökning. Det ökar dock reliabiliteten för de skattade textvariablerna då det neutraliserar den störande påverkan som bilder och annat borttvättat skulle kunna ha på försökspersonernas textskattning. Försökspersonerna har inte utformat sökfrågan själva och har sannolikt ingen intention att söka på just det som presenteras, detta gör att deras uppgift att bedöma textens relevans kopplat till sökfrågan blir något abstrakt. De måste alltså själva gissa sig fram till varför någon sökt på den givna sökfrågan och försöka bedöma svarens relevans utifrån detta, något som sänker validiteten för denna fråga. Enkäterna är skapade för denna studie och det är inte säkert att alla frågor mäter precis det som önskas. Snabbläst och lättläst korrelerar t.ex. väldigt kraftigt med varandra samt med antalet ord i texten vilken kan antyda att nyanser i texten går förlorad till förmån för en bedömning av textlängd. Resultatet är sannolikt inte generaliserbart till andra urvalsgrupper än studenter. Det är också svårt att uttalas sig om huruvida en riktig informationssökning skulle generera samma resultat. De samband vi kan se mellan de automatiska läsbarhetsmåtten kommer dock sannolikt att vara relativt lika om man söker på andra texter, men det krävs er texter och sökningar för att uttalas sig säkert om detta. 23
25 5 Slutsats I studien ser antalet ord i texten ut att vara det bästa sättet för att predicera föredragen textordning där försökspersonerna ser ut att föredra långa texter. Förhållandet omvänds dock på vissa texter, detta verkar röra texter som har högt LIX-värde och eller lågt OVIX-värde. Upplevd innehållsrikedom verkar vara den skattade variabel som försökspersonerna främst utgick ifrån tillsammans med relevans när de valde textordning. LIX är det enda automatiska måttet som korrelerar signikant med innehållsrikedom, LIX i sin tur korrelerar med idédensitetsmåttet NR. Läsbarhetsmåttet OVIX korrelerar med idédensitetsmåtten LD. Alla mått har tagits med i någon regressionsmodell, det antyder att alla säger någon om hur en text upplevs av försökspersonerna. Det ser ut att vara möjligt att förbättra sökning efter texter med hjälp av de automatiska läsbarhets- och idédensitetsmått som testats, kanske i kombination av det enklare måttet textlängd (antal ord). Det är sannolikt också relevant att ta hänsyn till vad syftet med informationssökningen är. 5.1 Framtida forskning Studier med er texter och er sökningar skulle ge bättre förståelse och möjlighet att se nyanser i olika texttyper och längder vilket skulle kunna göra en eventuell modell för omordnande av texter vid sökning bättre. Studier med andra urvalsgrupper skulle bidra med mer kunskap om skillnader mellan olika urval, exempelvis personer med olika typer av läs- eller språksvårigheter.en vidareutveckling och kvalitetssäkring av metod och enkäter skulle stärka både detta resultat och andra som kan tänkas bygga vidare på det. Det kan vara intressant att gå närma sig 24
26 förfarandet vid en äkta sökning genom att t.ex. låta hemsidor presenteras som de är tänkta, dvs utan att tvätta dem eller genom att presentera en länklista med excerpt (som på Google) och låta försökspersonerna välja i vilken ordning de vill läsa texterna både före de läst texterna, utifrån länklistan, och efter, utifrån vad de ansåg om texten de läste. Det kan även vara intressant att undersöka andra automatiska mått samt försöka isolera olika variablers eekt på huruvida texten föredras, t.ex. textlängd som i denna studie ser ut att vara en väldigt eektiv indikator på detta. 25
27 Referenser [Af Geijerstam, 2006] Af Geijerstam, Å. (2006). Att skriva naturorienterade ämnen i skolan. Acta Universitatis: Studia Linguistica Upsalensia pp. [Carlberger & Kann, 1999] Carlberger, J., & Kann, V. (1999). Implementing an ecient part-of-speech tagger. Software: Practice and Experience 29.(9), [Covington, 2008] Covington, Michael A. (2008). Idea Density. A potentially informative characteristic of retrieved documents IEEE Southeastcon [Dale & Chall, 1949] Dale, E., & Chall, J.S. (1949). The concept of readability. Elementary English [Harrison & Bakker, 1998] Harrison, S., & Bakker, P. (1998). Two new readability predictors for the professional writer: pilot trials. Journal of Research in Reading [Huckin, 1983] Huckin, T.N. (1983) A cognitive approach to readability. In Paul V. Anderson, R John Brockman & C. R. Miller (Eds) New Essays in Technical and Scientic Communication: research, theory, practice [Kintsch & Keenan, 1973] Kintsch, Walter A., & Keenan, J. (1973). Reading rate and retention as a function of the number of propositions in the baste structure of sentences. Cognitive Psychology [Newbold et al. 2010] Newbold, N., McLaughlin, H., & Gillam, L. (2010). Rank by readability: Document weighting for information retrieval. Lecture Notes in Computer Science( Including Subseries Lecture Notes in Articial Intelligence and Lecture Notes in Bioinformatics, 6107.,
28 [Oakland & Lane, 2004] Oakland, T., & Lane, H.B. (2004). Language, Reading and Readability Formulas: Implications for Developing and Adapting Tests. International Journal of Testing, 4.(3), [Robertson, 1993] Robertson. S.E. (1993). The Probability Ranking Principle in IR. Journal of Documentation [Selzer, 1983] Selzer, J. (1983). What constitutes a 'readable' technical style? In P. V. Anderson, R. J. Brockmann & C. R. Miller (Eds). New Essays in Technical and Scientic Communication: research, theory, practice [Språkrådet, 2004] Språkrådet. Hemsida. [online]( ) Tillgänglig: [ ] [Wikipedia, 2012] Wikipedia. Hemsida. [online]( ) Tillgänglig: [ ] 27
29 A Appendix bakgrundsenkät FP: Sökning 1: Sökning 2: Fyll i nedan! Man Kvinna Ålder Utbildning/yrke Termin Jag läser mycket akademiska texter, skönlitteratur, bloggar, nyheter etc. Håller inte alls med Håller helt med Jag förstår svenska mycket bra Håller inte alls med Håller helt med Jag tycker att det är roligt att läsa Håller inte alls med Håller helt med Jag brukar förstå vad jag läser Håller inte alls med Håller helt med Jag läser långsamt Håller inte alls med Håller helt med Jag har lätt för att läsa Håller inte alls med Håller helt med Jag tycker det är ansträngande att läsa Håller inte alls med Håller helt med
30 B Appendix enkät intresse för sökterm FP: TextID: Jag tror att sökningen kan ge resultat jag finner intressanta Håller inte alls med Håller helt med
31 C Appendix enkät för textvariabler Jag upplever att texten innehåller relevant information relaterat till sökningen Håller inte alls med Håller helt med Jag tycker att texten är lätt att läsa Håller inte alls med Håller helt med Jag upplever att texten går snabbt att läsa Håller inte alls med Håller helt med Jag upplever texten som innehållsrik Håller inte alls med Håller helt med
32 D Appendix enkät för ordnande av texter Ange i vilken ordning du skulle vilja läsa texterna för att svara på sökfrågan (Skriv ett nummer 1-7 på varje text) Övriga kommentarer: Tack för din medverkan! 31
33 Linköping University Electronic Press Upphovsrätt Detta dokument hålls tillgängligt på Internet eller dess framtida ersättare från publiceringsdatum under förutsättning att inga extraordinära omständigheter uppstår. Tillgång till dokumentet innebär tillstånd för var och en att läsa, ladda ner, skriva ut enstaka kopior för enskilt bruk och att använda det oförändrat för ickekommersiell forskning och för undervisning. Överföring av upphovsrätten vid en senare tidpunkt kan inte upphäva detta tillstånd. All annan användning av dokumentet kräver upphovsmannens medgivande. För att garantera äktheten, säkerheten och tillgängligheten finns lösningar av teknisk och administrativ art. Upphovsmannens ideella rätt innefattar rätt att bli nämnd som upphovsman i den omfattning som god sed kräver vid användning av dokumentet på ovan beskrivna sätt samt skydd mot att dokumentet ändras eller presenteras i sådan form eller i sådant sammanhang som är kränkande för upphovsmannens litterära eller konstnärliga anseende eller egenart. För ytterligare information om Linköping University Electronic Press se förlagets hemsida Copyright The publishers will keep this document online on the Internet or its possible replacement from the date of publication barring exceptional circumstances. The online availability of the document implies permanent permission for anyone to read, to download, or to print out single copies for his/hers own use and to use it unchanged for non-commercial research and educational purpose. Subsequent transfers of copyright cannot revoke this permission. All other uses of the document are conditional upon the consent of the copyright owner. The publisher has taken technical and administrative measures to assure authenticity, security and accessibility. According to intellectual property law the author has the right to be mentioned when his/her work is accessed as described above and to be protected against infringement. For additional information about the Linköping University Electronic Press and its procedures for publication and for assurance of document integrity, please refer to its www home page: Karl Hörnell. 32
Automatiserad panoramasekvensdetektering på Narratives platform
LiU-ITN-TEK-A--14/018--SE Automatiserad panoramasekvensdetektering på Narratives platform Alexander Johansson 2014-06-11 Department of Science and Technology Linköping University SE-601 74 Norrköping,
Automatization of test rig for microwave ovens
LiU-ITN-TEK-A--13/026--SE Automatization of test rig for microwave ovens Jesper Cronborn 2013-06-10 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
ChiliChallenge. Utveckling av en användbar webbapplika on. ChiliChallenge Development of a web applica on with good usability
ChiliChallenge Utveckling av en användbar webbapplika on ChiliChallenge Development of a web applica on with good usability Grupp 4: Carolina Broberg, Oscar Ek, Linus Gålén, Anders Kratz, Andreas Niki
Institutionen för datavetenskap Department of Computer and Information Science
Institutionen för datavetenskap Department of Computer and Information Science Examensarbete Utveckling av en webbaserad donationstjänst för företag som involverar medarbetarna i processen. av Martina
Master Thesis. Study on a second-order bandpass Σ -modulator for flexible AD-conversion Hanna Svensson. LiTH - ISY - EX -- 08/4064 -- SE
Master Thesis Study on a second-order bandpass Σ -modulator for flexible AD-conversion Hanna Svensson LiTH - ISY - EX -- 08/4064 -- SE Study on a second-order bandpass Σ -modulator for flexible AD-conversion
Ritning av industribyggnad med dokumentation av elcentraler
LiU-ITN-TEK-G--12/038--SE Ritning av industribyggnad med dokumentation av elcentraler Sebastian Johansson Daniel Nyberg 2012-06-12 Department of Science and Technology Linköping University SE-601 74 Norrköping,
Dokumentation av elritningar i en byggnad
LiU-ITN-TEK-G--12/068--SE Dokumentation av elritningar i en byggnad Precious Kam'boma Ceasar Ramzi 2012-12-17 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
Utveckling av webbsida för lokala prisjämförelser med användbarhetsmetoder
C-uppsats LITH-ITN-EX--05/032--SE Utveckling av webbsida för lokala prisjämförelser med användbarhetsmetoder Jon Hällholm 2005-10-27 Department of Science and Technology Linköpings Universitet SE-601 74
Det här är inte en porslinssvan - Ett grafiskt kampanjkoncept för second hand-butiker med välgörenhetssyfte
LiU-ITN-TEK-G--16/055--SE Det här är inte en porslinssvan - Ett grafiskt kampanjkoncept för second hand-butiker med välgörenhetssyfte Veronica S Eksmo Karin Götestrand 2016-06-10 Department of Science
Laddningsomkopplare för två batterier
LiU-ITN-TEK-G--10/054--SE Laddningsomkopplare för två batterier Findus Lagerbäck 2010-06-04 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen för teknik
Dokumentation av elinstallationer i en byggnad
LiU-ITN-TEK-G--11/066--SE Dokumentation av elinstallationer i en byggnad Albert Binakaj Armin Smajic 2011-08-25 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
Strategiska överväganden vid tillbyggnation - Ekonomiska och hållfasthetsmässiga konsekvenser utifrån snölastreglering
LIU-ITN-TEK-G-13/021-SE Strategiska överväganden vid tillbyggnation - Ekonomiska och hållfasthetsmässiga konsekvenser utifrån snölastreglering Max Jigander 2013-06-05 Department of Science and Technology
Inkoppling av manöverdon för servicekörning av kran 481
LiU-ITN-TEK-G--11/073--SE Inkoppling av manöverdon för servicekörning av kran 481 Simon Johansson Christian Winberg 2011-08-25 Department of Science and Technology Linköping University SE-601 74 Norrköping,
Analys av anslutningsresor till Arlanda
LiU-ITN-TEK-A--11/058--SE Analys av anslutningsresor till Arlanda Sara Johansson 2011-09-16 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen för teknik
Arbetsprov för nyanställda inom el- och automationsteknik
LiU-ITN-TEK-G--13/003-SE Arbetsprov för nyanställda inom el- och automationsteknik Danial Qamar Patrik Rosenkrantz 2013-03-11 Department of Science and Technology Linköping University SE-601 74 Norrköping,
Självkalibrering av varvtalsregulator
LiU-ITN-TEK-A--13/057--SE Självkalibrering av varvtalsregulator Rickard Dahm 2013-10-28 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen för teknik och
!"# " $"% & ' ( )* + 2' ( 3 -+ -.4
!"# " $"% !"# " $"% & ' ( )* +-+./0+12 + 2' ( 3 -+ -.4 Avdelning Institution Division Department Datum Date 2005-03-21 Institutionen för datavetenskap 581 83 LINKÖPING Språk Language Svenska/Swedish
WEBBLÄTTLÄST SLUTRAPPORT
Arne Jönsson 2012-07-23 WEBBLÄTTLÄST SLUTRAPPORT 1. Inledning Inom projektet WebbLättLäst har vi utvecklat teknik för att automatiskt rangordna svenska webbsidor efter hur läsbara de är. Detta gör att
Riktlinjer för kontrollutrustning
LiU-ITN-TEK-G--13/004-SE Riktlinjer för kontrollutrustning Menhel Aghel Dawood Dragan Obradovic 2013-03-11 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
3D visualisering av Silverdal
LiU-ITN-TEK-G--09/034--SE 3D visualisering av Silverdal Jenny Stål 2009-06-10 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen för teknik och naturvetenskap
Uppdatera produktkalkyler och verifiera elektriska komponenter i styrskåp till luftavfuktare
LiU-ITN-TEK-G--11/047--SE Uppdatera produktkalkyler och verifiera elektriska komponenter i styrskåp till luftavfuktare Johan Brorson Jessica Gatenberg 2011-06-09 Department of Science and Technology Linköping
Arbete med behörighetsadministration och åtkomstkontroll i större företag
Arbete med behörighetsadministration och åtkomstkontroll i större företag Kandidatuppsats, 10 poäng, skriven av Mikael Hansson och Oscar Lindberg 2005-07-04 ISRN LIU-IDA-C--05/11--SE Arbete med behörighetsadministration
Nätverksutbildning för bibliotekarier samt museioch arkivpersonal
Linköping Electronic Articles in Computer and Information Science Vol. 2(1997): Nr 10 Nätverksutbildning för bibliotekarier samt museioch arkivpersonal Katri Wikström Tampere universitet Tampere, Finland
Hur försäkrar vi oss om att vår IT-användning utvecklar kvaliteten i våra utbildningar?
Linköping Electronic Articles in Computer and Information Science Vol. 2(1997): Nr 10 Hur försäkrar vi oss om att vår IT-användning utvecklar kvaliteten i våra utbildningar? Edgar Almén Linköpings universitet
Kliniskt datainsamlingssystem med beslutsstöd - Användarutredning och gränssnitt för Sahlgrenskas akutintag
Examensarbete LITH-ITN-MT-EX--05/043--SE Kliniskt datainsamlingssystem med beslutsstöd - Användarutredning och gränssnitt för Sahlgrenskas akutintag Lina Larsson 2005-05-27 Department of Science and Technology
Elsäkerhetsanalys samt dokumentation av elinstallationer
LiU-ITN-TEK-G--13/059--SE Elsäkerhetsanalys samt dokumentation av elinstallationer Emanuel Kopkin 2013-06-20 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
EDUCATE - ett europeiskt hypertextbaserat utbildningspaket
Linköping Electronic Articles in Computer and Information Science Vol. 2(1997): Nr 10 EDUCATE - ett europeiskt hypertextbaserat utbildningspaket Nancy Fjällbrant Gunilla Thomasson Chalmers tekniska högskolans
FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång
FriendlyReader Språkteknologi för sammanfattningar och ökad läsbarhet Mål:! Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information
Lättläst lätt att läsa eller lätt att skriva? Camilla Forsberg
Lättläst lätt att läsa eller lätt att skriva? Camilla Forsberg Examinerad språkkonsult i svenska språket Universitetsadjunkt i svenska Doktorand i pedagogik 1) Vad innebär det att en text är lättläst?
WEBBKLUSTRING SLUTRAPPORT
Arne Jönsson 2014-01-09 WEBBKLUSTRING SLUTRAPPORT 1. Inledning Inom projektet har vi utvecklat teknik som gör det möjligt att identifiera webbsidors innehåll och därefter klustra (gruppera) dem så att
Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp
Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Informationskompetens och Användarutbildning
Informationskompetens och Användarutbildning NVBF 1996 Proceedings från Nordiska Vetenskapliga Biblioteksföreningars Förbunds konferens: Linköping, Sverige, 19-20 november 1996 Edited by Liselotte Thornell,
Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen
LINKÖPINGS UNIVERSITET Institutionen för Datavetenskap Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen Namn E-mail Evelina Rennes evere305@student.liu.se INNEHÅLL INNEHÅLL
Finns nationell policy för informationskompetens - i Sverige?
Linköping Electronic Articles in Computer and Information Science Vol. 2(1997): Nr 10 Finns nationell policy för informationskompetens - i Sverige? Jan Hagerlid BIBSAM Stockholm, Sverige Inledning till
Kort om Coxheads Academic Word List. Emma Sköldberg, maj 2011
Kort om Coxheads Academic Word List Emma Sköldberg, maj 2011 Två viktiga artiklar Coxhead, A. 2000: A New Academic Word List (TESOL Quarterly 34:2, 2000, 213-238). Coxhead, A. 2002: The Academic Word List:
Att välja statistisk metod
Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...
Institutionen för beteendevetenskap Tel: 0733-633 266 013-27 45 57/28 21 03. Tentamen i kvantitativ metod Psykologi 2 HPSB05
Linköpings Universitet Jour; Ulf Andersson Institutionen för beteendevetenskap Tel: 0733-633 266 013-27 45 57/28 21 03 Tentamen i kvantitativ metod Psykologi 2 HPSB05 Torsdagen den 3/5 2007, kl. 14.00-18.00
MedTech20 - ett nytt instrument för att mäta patientnyttan av medicintekniska produkter Ingela Björholt, PhD
MedTech20 - ett nytt instrument för att mäta patientnyttan av medicintekniska produkter Ingela Björholt, PhD Kartläggning och validering av produktegenskaper Kartläggning generella nyttor (egenskaper)
Institutionen för datavetenskap Department of Computer and Information Science
Institutionen för datavetenskap Department of Computer and Information Science Examensarbete NatureBouncer med XNA and Farseer Physics av Michael Morawiec LIU-IDA/LITH-EX-G--13/028--SE 2013-06-13 Linköpings
Skrivträning som fördjupar den naturvetenskapliga förståelsen Pelger, Susanne
Skrivträning som fördjupar den naturvetenskapliga förståelsen Pelger, Susanne Published in: Presentationer från konferensen den 3 maj 2012 Publicerad: 2012-01-01 Link to publication Citation for published
Användarhandbok. Trio Visit Web. Trio Enterprise 4.1
Användarhandbok Trio Visit Web Trio Enterprise 4.1 COPYRIGHT NOTICE: No part of this document may be reproduced, distributed, stored in a retrieval system or translated into any language, including but
Betalningsvilja för Göta kanal. Av Jan Lindvall
Betalningsvilja för Göta kanal Av Jan Lindvall The publishers will keep this document on-line on the Internet (or its possible replacement network in the future) for a period of 25 years from the date
Utveckling av ett beslutstödsverktyg för utvärdering av VägAssistansfordonsplaceringar
LIU-ITN-TEK-A--15/043--SE Utveckling av ett beslutstödsverktyg för utvärdering av VägAssistansfordonsplaceringar Erica Andersson Emelie Håkansson 2015-06-12 Department of Science and Technology Linköping
Sofie Johansson Kokkinakis
CLT Institutet för ISA - Svenska som Andraspråk IKT i lärarutbildningen Anknytning mellan IKT i forskning och undervisning Datorbaserad textanalys och ordförrådsbedömning. Sofie Johansson Kokkinakis sofie@svenska.gu.se
INTERNATIONAL SPINAL CORD INJURY DATA SETS - QUALITY OF LIFE BASIC DATA SET Swedish version
INTERNATIONAL SPINAL CORD INJURY DATA SETS - QUALITY OF LIFE BASIC DATA SET Swedish version 1.0 2017-12-06 The translation of the Swedish version of the International Spinal Cord Injury Data Set Quality
LINKÖPINGS UNIVERSITET. SimSum. En studie om automatisk sammanfattning och omskrivning av texter
LINKÖPINGS UNIVERSITET SimSum En studie om automatisk sammanfattning och omskrivning av texter Anton Jeppsson Samuel Johnson Erik Karlsson Christofer Malmberg Victor Sjölin Åsa Svensson 2012-08-13 Sammanfattning
Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp
Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp UNIVERSITY OF Richard Johansson November 11, 2015 dagens presentation sökverktyget Korp Språkbankens korpusar: vilka nns och hur
LINKÖPINS UNIVERSITET. SimSum. En studie om automatisk sammanfattning och omskrivning av texter. Sammanfattning
LINKÖPINS UNIVERSITET SimSum En studie om automatisk sammanfattning och omskrivning av texter Sammanfattning Anton Jeppsson Samuel Johnson Erik Karlsson Christofer Malmberg Victor Sjölin Åsa Svensson 2012-05-31
Lathund Autogiro NovaSecur
Lathund Autogiro NovaSecur Rev. 2011-05-06 Version 2.85-2011 Neither the whole nor any part of the information contained in, or the product described in this manual, may be adapted or reproduced in any
Användarhandledning Version 1.2
Användarhandledning Version 1.2 Innehåll Bakgrund... 2 Börja programmera i Xtat... 3 Allmänna tips... 3 Grunderna... 3 Kommentarer i språket... 4 Variabler... 4 Matematik... 5 Arrayer... 5 på skärmen...
svenska Syfte Kurskod: GRNSVE2 Verksamhetspoäng: KuRSplanER FöR KoMMunal VuxEnutBildninG på GRundläGGandE nivå 75
Svenska Kurskod: GRNSVE2 Verksamhetspoäng: 1000 Språk är människans främsta redskap för reflektion, kommunikation och kunskapsutveckling. Genom språket kan människan uttrycka sin personlighet, uttrycka
http://www.sm.luth.se/~andreas/info/howtosearch/index.html
& ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom
Visualisering av nytt fritidshus på Kvegerö fritidsområde
LiU-ITN-TEK-G--09/037--SE Visualisering av nytt fritidshus på Kvegerö fritidsområde Angelica Åslund 2009-06-10 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
Googles sidrankning - linjär algebra värt en förmögenhet
Googles sidrankning - linjär algebra värt en förmögenhet Outline 1 Sökmotorer 2 Grafteori Linjär algebra 3 Målet Utifrån användarens sökord lista de mest relevanta webbsidorna. Dessutom i en ordning som
Permutationer av omskrivningsregler -Egenskaper hos omskrivningsregler till lättläst svenska
Kandidatuppsats LIU-IDA/KOGVET-G--13/003--SE Permutationer av omskrivningsregler -Egenskaper hos omskrivningsregler till lättläst svenska Författare : Johannes Ahlström Handledare : Arne Jönsson Examinator
Implementation och design av en hybrid mobilapplikation med native känsla, åt rekryteringsföretaget Skill
LiU-ITN-TEK-A--13/063--SE Implementation och design av en hybrid mobilapplikation med native känsla, åt rekryteringsföretaget Skill Jens Lund Per Velander 2013-11-06 Department of Science and Technology
Business research methods, Bryman & Bell 2007
Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data
Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits
Humanistiska fakultetsnämnden Utbildningsplan för översättarprogrammet, 120 högskolepoäng Professional Translation Programme, 120 higher education credits Avancerad nivå/second Cycle 1. Beslut om fastställande
Regressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng
Humanistiska fakultetsnämnden ÖU2100, Översättarutbildning 1 Magisterutbildning, 60 högskolepoäng Professional Translation 1, 60 higher education credits Avancerad nivå Second Cycle 1. Fastställande Kursplanen
Språkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Lässtrategier för att förstå och tolka texter från olika medier samt för att urskilja texters budskap,
SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? I boken uppmärksammas vi på hur vi kan få bättre koll på nätet. Vi får lära oss var allt kommer ifrån och vad vi ha rätt att göra. Vi får även lära oss att man
Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.
Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann
Kursplan - Grundläggande svenska
2012-11-08 Kursplan - Grundläggande svenska Grundläggande svenska innehåller tre delkurser: Del 1, Grundläggande läs och skrivfärdigheter (400 poäng) GRNSVEu Del 2, delkurs 1 (300 poäng) GRNSVEv Del 2,
Språkmöte främjar hjärnan. Emanuel Bylund Centrum för tvåspråkighetsforskning Stockholm universitet
Språkmöte främjar hjärnan Emanuel Bylund Centrum för tvåspråkighetsforskning Stockholm universitet I vilken utsträckning formas hjärnans förmåga av erfarenheter? Taxiförare i London är hela tiden sysselsatta
Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.
Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas
Kognitionsvetenskap C, HT-04 Mental Rotation
Umeå Universitet 041025 Kognitionsvetenskap C, HT-04 Mental Rotation Grupp 3: Christina Grahn, dit01cgn@cs.umu.se Dan Kindeborg, di01dkg@cs.umu.se David Linder, c01dlr@cs.umu.se Frida Bergman, dit01fbn@cs.umu.se
Statistik över publikationer med öppen tillgång
Statistik över publikationer med öppen tillgång vilken statistik vill vi ha? Camilla Lindelöw Creative Commons Erkännande 4.0 Internationell Licens Refereegranskade artiklar med DOI publicerade under 2011-2017.
SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer
SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer Per Ahlgren, avd. för e-resurser, Stockholms universitetsbibliotek 1 Inledning I föreliggande rapport redogörs för
Introduktion till frågespråket SQL (v0.91)
DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
För prövning i Grundläggande Svenska gäller följande vid första tillfället:
prövning grundläggande svenska Malmö stad Komvux Malmö Södervärn PRÖVNING Prövningsanvisning Kurs: Svenska Kurskod: GRNSVE2 Verksamhetspoäng: 1000 För prövning i Grundläggande Svenska gäller följande vid
Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek
Informationssökning - att söka och finna vetenskapliga artiklar! Mikael.Rosell@liu.se 013-282248 Linköpings Universitetsbibliotek 2 FEM saker ni SKA ta med er härifrån! Välja ut och använda relevanta databaser
Jag tycker jag är -2. Beskrivning av instrumentet och dess användningsområde. Översikt. Vilka grupper är instrumentet gjort för?
Beskrivning av instrumentet och dess användningsområde Jag tycker jag är-2 är ett självskattningsinstrument som syftar till att bedöma barns och ungas självkänsla [1,2]. Formuläret är anpassat för att
Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online
Pass 3: Metadata Funktioner hos metadata Den här presentationen kommer att ta upp olika funktioner som metadata kan ha. Jag kommer också visa att det finns olika typer av metadata beroende på vilken funktion
Föreläsning 6: Analys och tolkning från insamling till insikt
Föreläsning 6: Analys och tolkning från insamling till insikt FSR: 1, 5, 6, 7 Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera
Second handbook of research on mathematics teaching and learning (NCTM)
Second handbook of research on mathematics teaching and learning (NCTM) The effects of classroom mathematics teaching on students learning. (Hiebert & Grouws, 2007) Inledande observationer Undervisningens
FTEA21:3 Spr akfilosofi F orel asning I Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning I Martin Jönsson Att lära Varför Frege varken tror att ett ords mening är dess referens eller något mentalt. Freges egen teori om mening Tre semantiska principer Kompositionalitetsprincipen,
Rådgivningsstöd för ökad effektivitet och kundupplevelse
LiU-ITN-TEK-A--18/008--SE Rådgivningsstöd för ökad effektivitet och kundupplevelse Cecilia Lagerwall 2018-05-03 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
Skapandet av en databas, produktkatalog och hemsida
LiU-ITN-TEK-G--08/053--SE Skapandet av en databas, produktkatalog och hemsida Robert Nyström 2008-12-12 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden Institutionen
Övergripande planering
Övergripande planering Ämne: Svenska Årskurs: 7 Ansvarig lärare: Marie Nilsson Torbjörn Wahlén Resurs: Reviderad: Bilaga 1. Kursplan för ämnet Bilaga 2. Kunskapskrav Bilaga 3. Planering för året Bilaga
Vidareutveckling av arbetsprov för pumpstyrning
LiU-ITN-TEK-G--13/005-SE Vidareutveckling av arbetsprov för pumpstyrning Johan Franzen Simon Schweidenbach 2013-03-11 Department of Science and Technology Linköping University SE-601 74 Norrköping, Sweden
Arbeta med Selected Works en lathund
Arbeta med Selected Works en lathund Att redigera din egen Selected Works-sida Ta fram din sida och logga in via My Account längts ner på sidan. Klicka på Edit My Site för att redigera sidan. Gå nu vidare
Optimering av webbsidor
1ME323 Webbteknik 3 Lektion 7 Optimering av webbsidor Rune Körnefors Medieteknik 1 2019 Rune Körnefors rune.kornefors@lnu.se Agenda Optimering SEO (Search Engine Optimization) Sökmotor: index, sökrobot
Centralt innehåll årskurs 7-9
SVENSKA Språk är människans främsta redskap för att tänka, kommunicera och lära. Genom språket utvecklar människor sin identitet, uttrycker känslor och tankar och förstår hur andra känner och tänker. Att
Dataförmedlad kommunikation och sociala medier, 7,5 hp
Kursplan Utbildning på forskarnivå Dataförmedlad kommunikation och sociala medier, 7,5 hp Computer Mediated Communication and Social Media, 7,5 credits Kurskod 20IK020 Forskarutbildningsämne Informatik
Linjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Open access Höstmöte - Framtidens forskning inom arbets- och miljömedicin
Open access Publiceringslandskapet i förändring Höstmöte - Framtidens forskning inom arbets- och miljömedicin 2018-11-15 Christer Lagvik Uppsala Universitetsbibliotek Vetenskaplig publicering och ny teknik
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
ISO general purpose metric screw threads Selected sizes for screws, bolts and nuts
SVENSK STANDARD SS-ISO 262 Fastställd 2003-08-01 Utgåva 1 Metriska ISO-gängor för allmän användning Utvalda storlekar för skruvar och muttrar ISO general purpose metric screw threads Selected sizes for
MASTER. Mining and selecting texts for easy reading. Katarina Mühlenbock
Mining and selecting texts for easy reading Katarina Mühlenbock DART, Drottning Silvias barn- och ungdomssjukhus, SU Institutionen för svenska språket, GU Mining and selecting texts for easy reading (Användaranpassad
732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23
732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23 Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv
LINKOPINGS UNIVERSITET, KOGNITIONSVETENSKAP 1. Analys av primacy- och recencyeffekter för falska minnen
LINKOPINGS UNIVERSITET, KOGNITIONSVETENSKAP 1 Analys av primacy- och recencyeffekter för falska minnen 3-30-2010 Sammanfattning Vår frågeställning är hur viktiga är de första och sista orden som presenteras
Utrymningshissar och utrymningsplatser utifrån de utrymmandes perspektiv. kristin andrée
Utrymningshissar och utrymningsplatser utifrån de utrymmandes perspektiv kristin andrée institutionen för bygg- och miljöteknologi LundS UNIVERSITET Utrymningshissar och utrymningsplatser utifrån de utrymmandes