Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuristisk utvärdering. Varför testa?

Relevanta dokument
Användbarhetstestning

Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuristisk utvärdering. Varför testa?

Upplägg. Fö: Användbarhetsutvärdering. Heuristisk utvärdering HEURISTISK UTVÄRDERING. 10 heuristiker (Nielsen)

Upplägg. Fö: Användbarhetsutvärdering. Heuristisk utvärdering. 10 heuristiker (Nielsen) Hur många utvärderare?

Fö: Användbarhetsutvärdering

Utvärdering. Användbarhetstest: Vad ska ni göra? Användbarhetstestning kontra heuristisk utvärdering. Användbarhetstestning

Användbarhetstestning. Användbarhetstestning. Användbarhetstestning. Användbarhetstestning. Användbarhetstestning vs heuris7sk utvärdering

Användbarhetstestning. Samla in, analysera och presentera användbarhetsmått

Användbarhetstestning. Samla in, analysera och presentera användbarhetsmått

Användbarhetstestning. Johan Blomkvist

Utvärdering. Innehåll. Samla in, analysera och presentera användbarhetsmått. Heuristisk utvärdering Användbarhetstestning A/B-testning

Usability testing. Johan Åberg

Olika syften. TDDD60 användbarhetstest. När passar vilken typ? Med eller utan användare

Användbarhetsutvärdering. TDDD80 Mobila och sociala applikationer

TDDD80 Mobila och sociala applika1oner. Användbarhetsutvärdering

Fö 4: Utvärdering. Gästföreläsning. Muddy-cards resultat. Varför och vad? Varför? Vad? Mot vad? (Krav) Hur? IMPACT

Idag. Prototyper och användbarhetsutvärdering. Vad prototyper prototypar. Olika sorters prototyper. Del 2 Prototyper Utvärdering Analytisk Empirisk

Utvärdering. Övergripande (1) Med/utan användare. Övergripande (2) Fredag 1 oktober F1. Ann Lantz - Anna Swartling -

Användbarhets- utvärdering. Mattias Arvola

Utvärdering. Användbarhet. + beställarperspektivet! Innehåll. Varför?

TestForum Robert Magnusson, Nordic Medtest, Karlstad Lars Palm, Temagon AB / Future Position X, Gävle

Utvärdering. Övergripande (1) Övergripande (2) Med/utan användare. Heuristisk utvärdering. Expertutvärdering. Måndagen den 29 september 8-10 F1

Frågetekniker. Föreläsning 3, Utvärderingstekniker MDI, Lena Palmquist 1. Än en gång: JEdit (Py Kollberg) Loggning. Tolkande dataanalys

Utvärdering av gränssnitt särskilt befintliga. Hur utvecklar man användbara system? Användbarhet handlar om kvalitet

Principer för interaktionsdesign

Inklusiv Design Design för Alla

ANVÄNDARTESTNING VID LULEÅ UB Ola Andersson Luleå universitetsbibliotek

Prototyping. Planera och genomföra webbproduktionsprojekt. Innehåll. Fördelarna med Pappersprototyper. Lofi-prototyp. Prototyping

Hur kvalitetssäkra komplexa IT-lösningar och vad är egentligen test?

Användbarhet och Webbutveckling för mobila enheter. Användbarhetstester

Metod1. Intervjuer och observationer. Ex post facto, laboratorie -, fältexperiment samt fältstudier. forskningsetik

Datainsamling Hur gör man, och varför?

Agenda. Inledning, teoretiska metoder Hierarkisk uppgiftsanalys, HTA Cognitive walkthrough CW Heuristisk evaluering

Idag. Språk. Metaforer. Metaforer 10/3/16. TNM040 Kommunikation och användargränssnitt HT2016, FÖ7. Deadline projektgrupper idag

Stöd för att skapa intuitiva användargränssnitt

Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?

Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?

Redigeringsteknik och postproduktion

Nevenka Silfverhielm

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 7 i Rogers et al.: Interaction design

Föreläsning 10: Introduktion till utvärdering. Rogers et al. Kapitel 12

3/30/12. Föreläsning 2: Datainsamling - Observation, enkät, intervju. Stjärnmodellen. Översikt. Analys. Prototyper Krav. Design

Utvärderingsmetoder: Empiriska metoder. IT-universitetet febr MariAnne Karlsson

Intro utvärdering

Utvärdering av Beamex CMX Calibration Software: med fokus på användbarhet

Prototyper och användartest

Fö 2: Designprocessen. Projektet. Design är... Forts. projektet

ISRN: LIU-IDA/KOGVET-G--12/013--SE. Handledare: Johan Åberg Examinator: Fredrik Stjernberg

Beteendevetenskaplig metod. Metodansats. För och nackdelar med de olika metoderna. Fyra huvudkrav på forskningen Forskningsetiska principer

Berättelser Scenarios Presentationer Skisser Formella modeller Mjukvaruprototyper Kartong modeller etc.

Dr. Gustav Taxén MDI-Gruppen, CSC / VIC-Sthlm gustavt@kth.se

Metoder för datainsamling

Föreläsning 12 Inspektionsmetoder. Rogers et al. Kapitel 15

Feedbackrapport 729A45 Användbarhetstestning. Oscar Carlsson

Teoretiska och empiriska ansatser

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 2 och 3 i Stone et al.: User Interface design and evaluation

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 7 i Rogers et al.: Interaction design

Att förstå användaren. Annakarin Nyberg

Utveckling av ett lärsystem en fallstudie av prototyparbete för ett lärsystem riktat till barn

Granskning av gränssnitt. Mattias Arvola

PSYKOLOGISK UNDERSÖKNING H 70:

Utvärdering. 6 november 2002 Kap 10-11, , 13.5

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 2 och 3 i Stone et al.: User Interface design and evaluation

Utvärdering. Exempel från lok. Utvärderingsmetoder. Metoder för att utvärdera användning av IT-system. Anders Jansson

Föreläsning 11, Planera utvärdering. Att planera utvärdering. Vetenskapliga experiment. Kapitel i kursboken

Sveriges innovationsmyndighet

Utvärdering. Att göra spel bättre

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Föreläsning 2: Datainsamling - Observation, enkät, intervju. Att läsa: Kapitel 2 och 3 i Stone et al.: User Interface design and evaluation

Föreläsning 13: Användbarhet och komplexa system

Test och utvärdering - introduktion. Systemering med användarfokus Malin Pongolini

OBS! Vi har nya rutiner.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Föreläsning 3 Användare, uppgift och omgivning. Kapitel 3-4 i Stone et al.

1. Hur många timmar per vecka har du i genomsnitt lagt ner på kursen (inklusive schemalagd tid)?

Kvantitativa metoder och datainsamling

Prototypning och heuristisk utvärdering

Datainsamling. Daniel Bosk. data.tex :33:45Z danbos

Innehåll. Användarstudier. Användarstudier enligt Microsoft. Varför? Aktivt lyssnande. Intervjuteknik. Intervju Observation Personor Scenarier Krav

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Att intervjua och observera

Användarvänlighet? Användbarhet. Användbarhet! De vise männen. Användbarhet enl. ISO Bakom varje framgångsrik man

Användarcentrerad design Prototyper & användartest

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

KVANTITATIV FORSKNING

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Föreläsning 3: Mer om utvärdering, Inspektionsmetoder kan man utvärdera utan användare?

IPT-k Integrerad Psykologisk Terapi Kognitiv träning

Att välja statistisk metod

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

Evaluation Summary - CT3380 Grundläggande webbdesign HT05 Dan Levin

GRÄNSSNITTSDESIGN. Ämnets syfte. Kurser i ämnet

LOGISTIKSYSTEM FÖR SNABBA HJULET AB UTVECKLINGSPROCESS BASERAD PÅ DR. DEBORAH J. MAYHEW S THE USABILITY ENGINEERING LIFECYCLE

Examinationsuppgift 2014

Bilaga 2. Rapport av resultatet för Användbarhetsutvärderingen av E-handelstjänsten Proceedo

Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap K så måste alltså: Lite kunskaps- och vetenskapsteori

Interaktionsdesign som profession. Föreläsning Del 2

Arbetslivserfarenhet. Utbildning AKTUELLA ROLLER KOMPETENSER SPRÅK BRANSCHER. KONSULTPROFIL/KONSULENTPROFIL Andreas Blackne

Kvalitativ metodik. Varför. Vad är det? Vad är det? Varför och när använda? Hur gör man? För- och nackdelar?

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Transkript:

Användbarhetstestning Användbarhetstestning Samla in, analysera och presentera användbarhetsmått Användare utför realistiska uppgifter i prototypen/systemet Observationer, tänka högt kompletteras med intervjuer Foto från test med pappersprototyp Varför testa? Användbarhetstestning vs heuristisk utvärdering Usability testing Usability testing Usability testing Heuristic evaluation Heuristic evaluation Heuristic evaluation Heuristic evaluation Sketches Paper prototypes HiFi prototypes Working system Användbarhetstestning vs heuristisk utvärdering Frågeställningar Effektivitet 100 90 80 70 60 50 40 30 20 10 0 Användbarhetstestning Heuristisk utvärdering Formativ studie Vilka är de viktigaste användbarhetsproblemen? Vilka aspekter av produkten funkar bra för användarna? Är det något som frustrerar dem? Vilka är de vanligaste felen som användare gör? Blir produkten bättre för varje iteration? Summativ studie Har användbarhetsmålen uppnåtts? Tillfredsställelse Ändamålsenlighet Nya produkten effektivare än nuvarande? Jämförelse med konkurrerande produkter? 1

Användare försöker lösa en given uppgift genom att interagera med prototypen Dator känner till programlogiken och styr gränssnittet. Simulerar datorns respons utan kommentarer Roller vid testning Testledare styr testsessionen, ger instruktioner till användaren och efterfrågar åsikter och tankar. Observatör antecknar under tystnad Formulering av uppgifter En lagom mängd uppgifter formuleras Ska representera det som användaren förväntas använda systemet till Hela testet bör inte ta mer än max en timme, inklusive enkäter, intervjuer etc Ges till användaren en i taget på separata papper Måste ligga på rätt detaljnivå Får inte ge för mycket ledtrådar Ska beskriva vad användaren ska göra, inte hur Att tänka på Etiska frågor Praktiska förberedelser Icebreaking Träning om det behövs Försvara aldrig designen inför användaren Gör alltid en pilotstudie med 2-3 personer Kriterier för att välja deltagare Självrapporterad expertis Tex nybörjare, medel, expert, Användningsfrekvens Antal besök per månad Mängd erfarenhet Dagar, månader, år Aktiviteter Använt speciell funktion Antal användare Målsättningen med testet Tolerans av felmarginal Antal lyckade Antal fp Nedre 95% konfidensintervall 4 5 36% 98% 8 10 48% 95% 16 20 58% 95% 24 30 62% 91% 40 50 67% 89% 80 100 71% 86% Övre 95% konfidensintervall 2

Terminologi 1 Terminologi 2 Within-subjects Between-subject Balansera för ev inlärning mellan uppg Fp Uppg 1 Uppg 2 Uppg3 Uppg 4 Fp1 U1 U2 U3 U4 Fp2 U3 U1 U4 U2 Fp3 U2 U4 U1 U3 Fp4 U4 U3 U2 U1 Oberoende variabel det man manipulerar eller kontrollerar, t ex Karaktäristik hos fp (ålder, kön, relevant erfarenhet) Olika lösningar eller prototyper som testas Uppgifter Beroende variabel det man mäter, t ex Task success Tid SUS score Datatyper Datatyper Nominal (kategorisk) T ex Man, kvinna; Design A, Design B Ordinal T ex Rangordning av 4 designer, från Mest vacker till Minst vacker Intervall Tex 7-punksskala av instämmande: Denna design är vacker. Instämmer helt Instämmer inte alls Ratio T ex Tid, Task success % Är dessa skalor Lika? Den övre är ordinal. Beräkna bara svarsfrekvens. Den undre kan betraktas som intervall. Du kan beräkna medelvärde. Konfidensintervall Konfidensintervall Antag att detta är din tidsdata för en studie med 5 användare Vad betyder det? 3

Visa felstaplar Hur visa felstaplar? Prestandamått Användbarhetsmått Uppgiftsframgång, tid, fel Problembaserade mått Antal problem, typ av problem Beteende- och psykologiska mått Verbalt beteende, ansiktsuttryck Självrapporterade mått Förväntningsmått, SUS Hur/när ska måtten användas? Beror främst på användbarhetsmålen Men, ofta gäller: I en tidig fas är uppgiftsframgång viktigast Uppgiftsframgång kräver att allvarliga problem är undanröjda (problembaserade mått) Upplevelsen viktig vill användaren använda systemet? Fångas in via beteendemått och självrapporterade mått (korrelation dem emellan?) Tid har ofta ett tröskelvärde (men vilket?) Blir därmed binärt (under eller över tröskelvärdet?) Prestandamått Uppgiftsframgång - binärt Uppgiftsframgång Binärt eller nivåindelat Tid Hur lång tid tar det för en uppgift Fel Vilka eller hur många fel görs per uppgift Effektivitet Tex antal knapptryckningar Lärbarhet Hur ändras prestanda över tid Kräver väldefinierade uppgifter med tydliga slutvillkor Hitta priset för soffan Älmhult i standardutförande. OK? Undersök olika sätt att pensionspara. OK? 4

Uppdragsframgång - konfidensintervall Uppgiftsframgång - exempel Uppgiftsframgång - exempel Problembaserade mått vad är ett problem? Allt som förhindrar måluppfyllelse Allt som för någon på fel spår Allt som skapar förvirring Allt som skapar ett fel Att inte se något som skulle uppmärksammats Att anta att något är rätt när det inte är det Att anta att en uppgift är klar när den inte är det Att utföra fel funktion Att missförstå något innehåll Att inte förstå navigeringen Problembaserade mått - detaljer Allvarlighetsgrad När börjar och slutar ett problem? Granularitet? Flera observatörer? Liten påverkan på användarupplevelsen Få fp upplever ett problem Låg allvarlighetsgrad Många fp upplever ett problem Medel allvarlighetsgrad Stor påverkan på användarupplevelsen Medel allvarlighetsgrad Hög allvarlighetsgrad 5

Resultat - exempel Resultat exempel Resultat - exempel Resultat - exempel Resultat - exempel Konsekvens i problemidentifiering 6

Bruskällor Antal deltagare Deltagare Uppgifter Metod Artefakt Omgivning Moderatorer Beteende och psykologiska mått Eye-tracking Verbalt beteende Ansiktsuttryck Eye-tracking Pupillrespons Hjärtfrekvens 7

Eye-tracking video 1 Eye-tracking video 2 Eye-tracking-analys 1 Eye-tracking-analys 2 Top banner Get it Done Online Tools Main Body News/ Features 8

Självrapporterade mått Förväntningsmått Förväntningsmått SUS-skalan CSUQ-skalan QUIS-skalan Fråga fp om förväntad svårighetsgrad, innan de utför uppgiften Fråga efteråt hur lätt/svårt det verkligen var, omedelbart efter varje uppgift Använd 7-punkts skala i båda fallen Väldigt lätt till Väldigt svårt För varje uppgift, beräkna två medelvärden Medel för förväntningsvärdet Medel för upplevelsevärdet Visualisera datat som en scatterplot med två axlar Förväntningsvärde Upplevelsevärde De fyra kvadranterna är intressanta SUS system usability scale Utvecklat vid DEC Består av 10 frågor Kan byta ut website mot system mot produkt 9

SUS - sammanräkning SUS resulterar i ett helhetsvärde. Värden för individuella frågor säger inget. Beräkning: Varje frågas värde varierar mellan 0 och 4 Fråga 1, 3, 5, 7, och 9 bidrar med positionen minus 1 Fråga 2, 4, 6, 8 och 10 bidrar med 5 minus positionen Multiplicera summan för alla 10 frågor med 2.5 för helhetsvärdet. SUS värden varierar mellan 0 och 100 Beräkningsexempel Varför just SUS? 10

Frequency Varför just SUS? Frequency Distribution of SUS Scores for 129 Conditions from 50 Studies 50 45 40 35 30 25 20 15 10 5 0 <=40 41-50 51-60 61-70 71-80 81-90 91-100 Average SUS Scores 11