Utvärdering. Användbarhetstest: Vad ska ni göra? Användbarhetstestning kontra heuristisk utvärdering. Användbarhetstestning



Relevanta dokument
Användbarhetstestning

Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuristisk utvärdering. Varför testa?

Upplägg. Fö: Användbarhetsutvärdering. Heuristisk utvärdering HEURISTISK UTVÄRDERING. 10 heuristiker (Nielsen)

Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuristisk utvärdering. Varför testa?

Fö: Användbarhetsutvärdering

Användbarhetstestning. Användbarhetstestning. Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuris7sk utvärdering

Upplägg. Fö: Användbarhetsutvärdering. Heuristisk utvärdering. 10 heuristiker (Nielsen) Hur många utvärderare?

Användbarhetstestning. Samla in, analysera och presentera användbarhetsmått

Användbarhetstestning. Johan Blomkvist

Användbarhetstestning. Samla in, analysera och presentera användbarhetsmått

Utvärdering. Innehåll. Samla in, analysera och presentera användbarhetsmått. Heuristisk utvärdering Användbarhetstestning A/B-testning

Usability testing. Johan Åberg

Olika syften. TDDD60 användbarhetstest. När passar vilken typ? Med eller utan användare

Användbarhetsutvärdering. TDDD80 Mobila och sociala applikationer

TDDD80 Mobila och sociala applika1oner. Användbarhetsutvärdering

Fö 4: Utvärdering. Gästföreläsning. Muddy-cards resultat. Varför och vad? Varför? Vad? Mot vad? (Krav) Hur? IMPACT

Idag. Prototyper och användbarhetsutvärdering. Vad prototyper prototypar. Olika sorters prototyper. Del 2 Prototyper Utvärdering Analytisk Empirisk

Principer för interaktionsdesign

Användbarhets- utvärdering. Mattias Arvola

Utvärdering. Övergripande (1) Med/utan användare. Övergripande (2) Fredag 1 oktober F1. Ann Lantz - Anna Swartling -

TestForum Robert Magnusson, Nordic Medtest, Karlstad Lars Palm, Temagon AB / Future Position X, Gävle

Datainsamling Hur gör man, och varför?

Användbarhet och Webbutveckling för mobila enheter. Användbarhetstester

Utvärdering av gränssnitt särskilt befintliga. Hur utvecklar man användbara system? Användbarhet handlar om kvalitet

Hur kvalitetssäkra komplexa IT-lösningar och vad är egentligen test?

Frågetekniker. Föreläsning 3, Utvärderingstekniker MDI, Lena Palmquist 1. Än en gång: JEdit (Py Kollberg) Loggning. Tolkande dataanalys

Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?

Utvärdering. Övergripande (1) Övergripande (2) Med/utan användare. Heuristisk utvärdering. Expertutvärdering. Måndagen den 29 september 8-10 F1

Datainsamling. Daniel Bosk. data.tex :33:45Z danbos

Utvärdering. Användbarhet. + beställarperspektivet! Innehåll. Varför?

Prototyping. Planera och genomföra webbproduktionsprojekt. Innehåll. Fördelarna med Pappersprototyper. Lofi-prototyp. Prototyping

Utvärdering. Att göra spel bättre

Granskning av gränssnitt. Mattias Arvola

Feedbackrapport 729A45 Användbarhetstestning. Oscar Carlsson

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 7 i Rogers et al.: Interaction design

Metoder för datainsamling

Idag. Språk. Metaforer. Metaforer 10/3/16. TNM040 Kommunikation och användargränssnitt HT2016, FÖ7. Deadline projektgrupper idag

PSYKOLOGISK UNDERSÖKNING H 70:

Nevenka Silfverhielm

Föreläsning 10: Introduktion till utvärdering. Rogers et al. Kapitel 12

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 7 i Rogers et al.: Interaction design

Stöd för att skapa intuitiva användargränssnitt

Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?

Sveriges innovationsmyndighet

1. (3p) Inom MDI-området framhåller man att människor lär sig via metaforer. Hur menar man att detta går till?

Interaktionsdesign som profession. Föreläsning Del 2

Institutionen för datavetenskap Department of Computer and Information Science

Kursen presenterar olika perspektiv inom beteendevetenskap med fokus på metod. Praktisk övning i datainsamlingstekniker ges.

ANVÄNDARTESTNING VID LULEÅ UB Ola Andersson Luleå universitetsbibliotek

Prototypning och heuristisk utvärdering

En workshop om workshops

Ny användbarhet Att med hjälp av mentala modeller göra strategier och organisationer "användbara" Olle Torgny

Intro utvärdering

Redigeringsteknik och postproduktion

Fö 2: Designprocessen. Projektet. Design är... Forts. projektet

Inklusiv Design Design för Alla

Föreläsning 12 Inspektionsmetoder. Rogers et al. Kapitel 15

Elevers utvärdering av Evolutionstrappan. Skola: Solängsskolan, Gävle Lärare: Gunilla Djuvfelt Antal elever: sex st. Metod.

Utvärdering. 6 november 2002 Kap 10-11, , 13.5

3/30/12. Föreläsning 2: Datainsamling - Observation, enkät, intervju. Stjärnmodellen. Översikt. Analys. Prototyper Krav. Design

Sluta gissa börja testa workshop alla pratar ux, 28 nov 2013

Fälttest - Pilot. MariAnne Karlsson Chalmers tekniska högskola

COACHING OCH KONSTRUKTIV FEEDBACK

Föreläsning 13: Användbarhet och komplexa system

Kvalitativ metodik. Varför. Vad är det? Vad är det? Varför och när använda? Hur gör man? För- och nackdelar?

Snabbkurs i. Tjänstedesign

Utveckling av ett lärsystem en fallstudie av prototyparbete för ett lärsystem riktat till barn

Evaluation Summary - CT3380 Grundläggande webbdesign HT05 Dan Levin

Allvarlighetsgrad Sannolikhet Summa. kvinna man kvinna man kvinna man

Mental utveckling. - Träning - Utbildning - Samtal

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 2 och 3 i Stone et al.: User Interface design and evaluation

Prototyper och användartest

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Kvalitativ intervju en introduktion

-Vi specialister skall försöka låta dig tala till punkt, ställa frågor istället för att ge svar.

Utvärdering av Beamex CMX Calibration Software: med fokus på användbarhet

Att förstå användaren. Annakarin Nyberg

Användarcentrerad design Prototyper & användartest

Föreläsning 6: Analys och tolkning från insamling till insikt

Instrumenteffekt inom användbarhetstestning

En studie avseende anva ndartest med en studentuppsats hemsideprototyp

Evaluation Summary - CDT104 Grundläggande Webbdesign HT07 Dan Levin

Tänka-högt metoden versus Enkätundersökning

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 2 och 3 i Stone et al.: User Interface design and evaluation

UTVÄRDERING - VAD, HUR OCH VARFÖR? MALIN FORSSELL TOVE STENMAN

Studie av gränssnittsprototyp i projektet Webbklustring - Nyttoupplevelsen

Övning: 4- Hörn Tidsåtgång: ca min.

ISRN: LIU-IDA/KOGVET-G--12/013--SE. Handledare: Johan Åberg Examinator: Fredrik Stjernberg

Bilaga 3 a Exempel på utformning av enkät (tre delkurser)

Utvärdering. Exempel från lok. Utvärderingsmetoder. Metoder för att utvärdera användning av IT-system. Anders Jansson

Agenda. Inledning, teoretiska metoder Hierarkisk uppgiftsanalys, HTA Cognitive walkthrough CW Heuristisk evaluering

Användarbarhetsproblem i ett lärospel för barn i årskurs 4

Det handlar om teknik också!

Resultat av kursvärdering

Operatörer och användargränssnitt vid processtyrning

PROJEKTARBETE. Webbutbildning för administratörer i publiceringsverktyget Episerver

Användbarhet. Datorbaserade verktyg används till att. Aspekter på användbarhet. uppfylla behov eller lösa problem! Användbarhet.

Utvärdering av prototyper för AR-rundvandringar

F12: Användarna i fokus


Transkript:

Användbarhetstest: Vad ska ni göra? Utvärdering Mattias Arvola Institutionen för datavetenskap Användbarhetstest med pappersprototyp 4 eller 6 användare som testar 3 eller 5 uppgifter Balansera ordningen på uppgifterna. I den mån det går. Obligatoriskt att använda problembaserat mått: Kvalitativt: vilka är problemen och hur allvarliga är dem? Kvantitativt: hur många problem i varje uppgift och hur många stöter på dem? Rekommenderat att mäta uppgiftsframgång och SUS Rekommenderat att ha med konfidensintervallet Omdesign för de allvarligaste problemen för bonuspoäng 2 Användare utför realistiska uppgifter i prototypen/ systemet Observationer, tänka högt kompletteras med intervjuer Användbarhetstestning /#6,0'7%( #8*96*7-3(!"#$%&#'( Användbarhetstestning kontra heuristisk utvärdering :'*;090$.( $#'734( /#6,0'7%( #8*96*7-3( )*+#,( +,-$-$.+#'( :'*;090$.( $#'734( /#6,0'7%( #8*96*7-3( /010( +,-$-$.+#'( :'*;090$.( $#'734( /#6,0'7%( #8*96*7-3( 2-,"034( '.'$#5( 3 4 >2::?@.6;;3A::.:;.",-./0123.3" #!!" +!" *!" )!" (!" '!" &!" %!" $!" #!"!" B51A56C7@=.3;3.;3525<" D.E@2;0;/"E31A@6.@25<" 456789:;.5:2<=.3" Frågeställningar i en formativ utvärdering Vilka är de viktigaste användbarhetsproblemen? Vilka aspekter av produkten funkar bra för användarna? Är det något som frustrerar dem? Vilka är de vanligaste felen som användare gör? Blir produkten bättre för varje iteration? 5 6

Frågeställningar i en summativ utvärdering Har användbarhetsmålen uppnåtts? Nya produkten effektivare än nuvarande? Jämförelse med konkurrerande produkter? Användare försöker lösa en given uppgift genom att interagera med prototypen Dator känner till programlogiken och styr gränssnittet. Simulerar datorns respons utan kommentarer Roller vid testning Testledare styr testsessionen, ger instruktioner till användaren och efterfrågar åsikter och tankar. Observatör antecknar under tystnad 7 8 Formulering av uppgifter En lagom mängd uppgifter formuleras Ska representera det som användaren förväntas använda systemet till Hela testet bör inte ta mer än max en timme, inklusive enkäter, intervjuer etc Ges till användaren en i taget på separata papper Måste ligga på rätt detaljnivå Får inte ge för mycket ledtrådar Ska beskriva vad användaren ska göra, inte hur 9 10 Att tänka på Etiska frågor Praktiska förberedelser Icebreaking Träning om det behövs Försvara aldrig designen inför användaren Gör alltid en pilotstudie med ett par personer 11 12

Kriterier för att välja deltagare Självrapporterad expertis T.ex. nybörjare, medel, expert, Användningsfrekvens Antal besök per månad Mängd erfarenhet Dagar, månader, år Aktiviteter Använt speciell funktion Balansera för eventuell inlärning mellan uppgifter!" #""$%&'( #""$%&') #""$%&'* #""$%&'+!"# $# $% $& $'!"% $& $# $' $%!"& $% $' $# $&!"' $' $& $% $# 13 14 Konfidensintervall Konfidensintervall Antag att detta är din tidsdata för en studie med 5 användare. Vad betyder det? 15 16 95% konfidensintervall Visa felstaplar Jag är 95% säker på att medelvärdet för alla våra användare blir medelvärdet vi mätt upp ± konfidensvärdet 17 18

Hur visa felstaplar? Användbarhetsmått Prestandamått Uppgiftsframgång, tid, fel Problembaserade mått Antal problem, typ av problem Beteende- och psykologiska mått Verbalt beteende, ansiktsuttryck Självrapporterade mått Förväntningsmått, SUS 19 20 Hur/när ska måtten användas? Beror främst på användbarhetsmålen, men ofta gäller: I en tidig fas är uppgiftsframgång viktigast Uppgiftsframgång kräver att allvarliga problem är undanröjda (problembaserade mått) Upplevelsen viktig vill användaren använda systemet? Fångas in via beteendemått och självrapporterade mått (korrelation dem emellan?) Tid har ofta ett tröskelvärde (men vilket?) Blir därmed binärt (under eller över tröskelvärdet?) Prestandamått Uppgiftsframgång Binärt eller nivåindelat Tid Hur lång tid tar det för en uppgift Fel Vilka eller hur många fel görs per uppgift Effektivitet Tex antal knapptryckningar Lärbarhet Hur ändras prestanda över tid 21 22 Uppgiftsframgång - binärt Uppgiftsframgång - exempel Hitta priset för soffan Älmhult i standardutförande. OK? Undersök olika sätt att pensionspara. OK? Kräver väldefinierade uppgifter med tydliga slutvillkor 23 24

Uppgiftsframgång - exempel Problembaserade mått vad är ett problem? Allt som förhindrar måluppfyllelse Allt som för någon på fel spår Allt som skapar förvirring Allt som skapar ett fel Att inte se något som skulle uppmärksammats Att anta att något är rätt när det inte är det Att anta att en uppgift är klar när den inte är det Att utföra fel funktion Att missförstå något innehåll Att inte förstå navigeringen 25 26 Allvarlighetsgrad Resultat - exempel!,'-"'.""/0102'03' "245/06 7,8$9'-"'.""/0102'03' "245/06 :%;08'",102<98'",' 981=8>92.""/010/?08 ()*+,--.,/-0*1234*/,5 6252-+,--.,/-0*1234*/,5 @;42'",102<98'",' 981=8>92.""/010/?08 6252-+,--.,/-0*1234*/,5 78*+,--.,/-0*1234*/,5 27 28 Resultat - exempel Resultat - exempel 29 30

Resultat - exempel Resultat - exempel 31 32 Bruskällor Antal deltagare Deltagare Uppgifter Metod Artefakt Omgivning Moderatorer 33 34 Beteende och psykologiska mått Verbalt beteende Ansiktsuttryck Eye-tracking Pupillrespons Hjärtfrekvens 35 36

Självrapporterade mått SUS-skalan Förväntningsmått CSUQ-skalan QUIS-skalan SUS system usability scale Består av 10 frågor Kan byta ut website mot system mot produkt 37 38 39 40 SUS - sammanräkning SUS resulterar i ett helhetsvärde. Värden för individuella frågor säger inget. Beräkning: Varje frågas värde varierar mellan 0 och 4 Fråga 1, 3, 5, 7, och 9 bidrar med positionen minus 1 Fråga 2, 4, 6, 8 och 10 bidrar med 5 minus positionen Multiplicera summan för alla 10 frågor med 2.5 för helhetsvärdet. SUS värden varierar mellan 0 och 100 41 42

43 Varför just SUS? 44 Varför just SUS? Frequency Distribution of SUS Scores for 129 Conditions from 50 Studies Bangor, A., Kortum, P. T., & Miller, J. T. (2008). An empirical evaluation of the System Usability Scale. International Journal of Human-Computer Interaction, 24, 574 594. 50 45 40 35 Frequency 30 25 20 15 10 5 0 <=40 41-50 51-60 61-70 71-80 81-90 91-100 Average SUS Scores 45 46 Förväntningsmått Fråga fp om förväntad svårighetsgrad, innan de utför uppgiften Fråga efteråt hur lätt/svårt det verkligen var, omedelbart efter varje uppgift Använd 7-punkts skala i båda fallen Väldigt lätt till Väldigt svårt 47 48

För varje uppgift, beräkna två medelvärden Medel för förväntningsvärdet Medel för upplevelsevärdet Visualisera datat som en scatterplot med två axlar Förväntningsvärde Upplevelsevärde De fyra kvadranterna är intressanta 49 50 Användbarhetstest: Vad ska ni göra? Användbarhetstest med pappersprototyp 4 eller 6 användare som testar 3 eller 5 uppgifter Balansera ordningen på uppgifterna. I den mån det går. Obligatoriskt att använda problembaserat mått: Kvalitativt: vilka är problemen och hur allvarliga är dem? Kvantitativt: hur många problem i varje uppgift och hur många stöter på dem? Rekommenderat att mäta uppgiftsframgång och SUS Rekommenderat att ha med konfidensintervallet Omdesign för de allvarligaste problemen för bonuspoäng www.liu.se 51