Att minska läkemedelsförväxlingar med hjälp av ändrad design av förpackningar



Relevanta dokument
Hippokrates. Förslag till principer för säkrare läkemedelsförpackningar med exempel. Nätverket för patientsäkerhet

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Hur man tolkar statistiska resultat

Uppgift 1. Produktmomentkorrelationskoefficienten

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Hypotestestning och repetition

F3 Introduktion Stickprov

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

, s a. , s b. personer från Alingsås och n b

Föreläsning G60 Statistiska metoder

OBS! Vi har nya rutiner.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Bilaga 6 till rapport 1 (5)

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning G60 Statistiska metoder

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Jämförelse av två populationer

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Rapport från Läkemedelsverket

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Lektionsanteckningar 11-12: Normalfördelningen

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

TENTAMEN. SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307. Forskningsmetodik 10 poäng (ECTS) Måndag den 13 oktober, 2008

import totalt, mkr index 85,23 100,00 107,36 103,76

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

FACIT (korrekta svar i röd fetstil)

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Kapitel 10 Hypotesprövning

Parade och oparade test

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Laboration 4: Hypotesprövning och styrkefunktion

Tentamen Metod C vid Uppsala universitet, , kl

OBS! Vi har nya rutiner.

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Statistisk signifikans och effektstorlek. Ett bildspel av Horst LöfgrenL 2009

FÖRELÄSNING 8:

Visualisering av samverkan

OBS! Vi har nya rutiner.

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Gamla tentor (forts) ( x. x ) ) 2 x1

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

a) Facit till räkneseminarium 3

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Statistik 1 för biologer, logopeder och psykologer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Checklista för systematiska litteraturstudier*

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

2. Test av hypotes rörande medianen i en population.

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Studietyper, inferens och konfidensintervall

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Stockholms Universitet Statistiska institutionen Termeh Shafie

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Kognitionsvetenskap C, HT-04 Mental Rotation

7.5 Experiment with a single factor having more than two levels

Korrelation och autokorrelation

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Checklista för systematiska litteraturstudier 3

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

1 Att minska läkemedelsförväxlingar med hjälp av ändrad design av förpackningar ehälsoinstitutet 2012-06-01

Rapport 2 ehälsoinstitutet 2012-06-01 Att minska läkemedelsförväxlingar med hjälp av ändrad design av förpackningar 1 Bakgrund Nätverket för patientsäkerhet (2011) har uppmärksammat det faktum att läkemedelsförväxlingar medför ett stort antal vårdskador varje år, både i Sverige och i andra länder. Problemet är mångfacetterat och situationen kan förbättras genom organisatoriska åtgärder såsom goda arbetsrutiner, ändamålsenlig placering av läkemedel i förråden, egen färgmarkering på sjukhus samt genom tekniska lösningar såsom automatiserad läkemedelsdosering och scanning av streckkoder. Nätverket för patientsäkerhet (2011) har dock dragit slutsatsen att en enhetlig och bättre utformning av läkemedelsförpackningar och etiketter är en nödvändig åtgärd för att snabbare och effektivare minska risken för läkemedelsförväxlingar. Nätverket har även i samverkan med Läkemedelsverket tagit fram ett antal faktorer som kan minska risken för förväxlingar: Det generiska namnet samt styrka/enhet anges med störst och tydligast text på förpackningen. Bakom styrkan finns skuggning i avvikande färg i regel finns dock ingen standardisering av färgerna. Särskild markering för läkemedel som ska spädas införs. Typsnittet måste vara lättläst och texten tillräckligt stor. Tall Man lettering kan användas i generiska namn som liknar varandra, med andra ord skrivs avvikande bokstäver med versaler. I figur 1 visas ett förslag på standardiserad läkemedelsförpackning. Figur 1: Ett förslag på standardiserad förpackning.

3 Den aktuella studien fokuserar på de effekter som kan uppnås genom att variera läkemedelsförpackningens design. 2 Syfte och mål Syftet med projektet är att undersöka om en bättre utformning av förpackningar kan underlätta korrekt och snabbt iordningsställande och administrering av läkemedel i sjukhusmiljöer. Målet är att klargöra betydelsen av de faktorer som presenteras i föregående avsnitt. 3 Metod och genomförande Arbetet ska bedrivas i projektform lett av ehälsoinstitutet i samverkan med Nätverket för patientsäkerhet och Läkemedelsverket. Projektet görs vetenskapligt och presenteras dels i en rapport till läkemedelverket och dels i vetenskapliga artiklar och fora. 3.1 Population och urval Målpopulationen i denna undersökning är sjuksköterskor som ansvarar för iordningsställande och administrering av läkemedel. Urvalet innefattade 13 sjuksköterskor från Länssjukhuset i Kalmar som på grund av sin kompetens och arbetsuppgifter bedöms vara speciellt intressanta för undersökningen (bedömningsurval) och som har möjlighet att delta i undersökningen (bekvämlighetsurval); med andra ord är det fråga om ett ickesannolikhetsurval vilket medför att resultatet inte direkt kan generaliseras till hela populationen. Det är viktigt att påpeka att det primära syftet med pilotstudien är att belysa potentialen med bättre utformning av förpackningar samt att generera underlag för en mer omfattande studie då förväxlingsrisken kan testas både laborativt och även i den verkliga arbetsmiljön. 3.2 Försöksupplägg Den tekniska utrustningen bestod av PC och en 19 bildskärm. Programvara som används är Techsmith Morae, ett testprogram som ger stöd för att samla in data, övervaka testet i realtid samt att analysera insamlade data och presentera materialet. Utrustningen var placerad i ett enskilt rum där försökspersonen satt vid ett skrivbord och använde datorns tangentbord samt mus. Försöksledarna fanns i rummet för att presentera testförfarandet och att övervaka testet samt för att notera resultatet. De personer som deltog i testet informerades om att interaktionen med datorn spelades in och analyserades kvantitativt. 3.3 Genomförande av testet Försökspersonerna testade olika digitala utformningar av etiketter med olika läkemedelsnamn samt styrka, samtliga etiketter hade den standardiserade utformningen som anges i figur 1. De generiska namnen var på engelska och versaliseringen gjordes enligt rekommendationer från FDA and ISMP List if Look-Alike Drug Names with Recommended Tall Man Letters,2011.

Det bör också påpekas att de läkemedelsnamn och styrkor som användes i skärmbilderna inte var baserade på existerande produkter utan valdes slumpmässigt. Testet skedde genom ett inomgruppsexperiment där varje person testade varje värde på den oberoende variabeln: teckenstorlek, versalisering (Tall Man lettering) och/eller skuggning i avvikande färg bakom styrkan. De beroende variablerna som bestämdes i experimentet var felfrekvens och responstid. Som fel räknades val av fel läkemedel och/eller styrka. Den genomsnittliga responstiden beräknades som den totala tiden för testet dividerad med antalet svar. Användartestet inleddes med en introduktion och övningssession då en av försöksledarna demonstrerade arrangemanget varefter försökspersonerna fick genomföra en kortare serie av enkla tester (test 1 och 2). I det faktiska experimentet (test 3-6) fick försökspersonen först ta emot en utskrift av ett läkemedelsnamn och/eller styrka, därefter visades på skärmen en selektion av nio olika alternativ (kodade med bokstäverna A I) där de oberoende faktorerna varierades slumpmässigt. Två eller tre av alternativen i varje skärmbild var korrekta, resten felaktiga. Försökspersonens uppgift var att inom en angiven tid, 60 210 sekunder per test, välja det alternativ som bäst motsvarar utskriften genom att uttala dess kod, därefter fick testpersonen en ny uppgift. I tabell 1 nedan visas ett schema för testet: Tabell 1: Testschema för användartestet Testnummer Oberoende variabel Nivåer Antalet skärmbilder Total testtid 1 Inledning Geometriska former med olika färger Cirkel, rektangel och triangel Blå, grön, röd och orange 10 bilder 4 Ingen tidsbegränsning 2 Inledning Särskild markering för spädning 3 Skuggning bakom styrkan Med eller utan markering Cefotaxime 1g Cefotaxime 1g 4 Teckenstorlek 7, 12 och 17 punkter Cefotaxime 1g Cefotaxime 1g Cefotaxime 1g 5 Versalisering Cefotaxime CEFOTAXIME CefOTAXime 10 bilder Ingen tidsbegränsning 10 bilder 60 sekunder 30 bilder 180 sekunder 30 bilder 210 sekunder 6 Versalisering OCH skuggning av styrka Som ovan i test 3 och 5 30 bilder 210 sekunder

5 Efter användartestet gjordes en kort intervju med försökspersonen angående om man upplevde att de testade faktorerna underlättar identifikationen av rätt läkemedelsförpackning. Resultatet från användartestet analyserades och utvärderades statistiskt. Intervjusvaren användes som komplement för att få djupare förståelse av testpersonernas upplevelse av olika förpackningsdesign. Fokus i analysen var att kartlägga vilka faktorer som är betydelsefulla och i vilken riktning de påverkar de beroende variablerna. Analysen avsåg även att generera underlag och hypoteser för en mer omfattande studie då förväxlingsrisken kan testas med hjälp av en större och slumpmässigt urval från populationen. I en sådan studie bör testerna genomföras både i ett laboratorium och även i den verkliga arbetsmiljön. 4 Resultat och analys 4.1 Testpersonerna Testpersonerna var 13 sjuksköterskor från olika avdelningar på Länssjukhuset i Kalmar, varav 11 var kvinnor och två var män. I tabell 2 och 3 nedan anges fördelningen i testpersonernas ålder och antalet yrkesverksamma år. Medelvärdet för ålder var 44,3 ±10,4 år. Tabell 2: Testpersonernas ålder Ålder/år Antal 20-29 2 30-39 3 40-49 2 50-59 6 Tabell 3: Testpersonernas yrkeserfarenhet Yrkesverksamma år Antal 1-9 5 10-19 1 20-29 4 30-39 3 Medelvärdet för yrkeserfarenhet var 18,6 ±11,5 år. Ingen av testpersonerna kände till versalisering enligt Tall Man Lettering sedan tidigare. Försöksledare gav inte heller någon förhandsinformation om vilka oberoende variabler som testades, dvs. färgskuggning, teckenstorlek och versalisering. När testserien var genomfört redogjorde försöksledaren kortfattat för dessa variabler, däribland för hur versaliseringen används enligt FDA:s rekommendationer.

4.2 Responstiderna I tabell 4 sammanfattas testupplägget och medelvärdena för responstiderna i test 3 6. De genomsnittliga responstiderna beräknades som den totala tiden för testet dividerad med antalet samtliga svar respektive antalet korrekta svar, som visas i tabellen. Testnummer Tabell 4: Responstiderna för test 3 6, medelvärden Antalet Totala tiden/s Medelvärdet av skärmbilder responstiden/s 6 Medelvärdet av responstiden/s korrekta svar samtliga svar 3 10 60 6,47±0,75 7,03±1,60 4 30 180 8,00±1,49 8,78±1,56 5 30 210 8,30±1,39 8,78±1,38 6 30 210 9,42±1,82 10,70±1,94 I tabell 5 sammanfattas minimum- och maximumvärdena för responstiderna i test 3 6. Tabell 5: Responstiderna för test 3 6, minimi och maximivärdena Testnummer Minimum/s samtliga svar Maximum/s samtliga svar Minimum/s korrekta svar Maximum/s korrekta svar 3 6,00 8,57 6,00 12,00 4 6,21 11,25 6,67 12,00 5 7,00 11,67 7,00 11,67 6 7,00 13,13 8,40 16,15 I figur 2 och 3 visas fördelningen av responstiderna per test, observera att tiderna visas i storleksordningen så att numreringen på x-axel inte refererar till samma testperson i olika tester. Figur 2: Responstidernas fördelning i test 3 6, den totala tiden för respektive test dividerat med antalet samtliga svar.

7 Figur 3: Responstidernas fördelning i test 3 6, den totala tiden för respektive test dividerat med antalet korrekta svar. Den generella variationen i responstiderna kan antas återspegla komplexiteten i uppgiften, dvs. det är lättare att identifiera styrkor (test 3) än läkemedelsnamn (test 4 och 5), medan en kombination av både namn och styrka ger ökad svårighetsgrad (test 6). Variationen i responstiderna mellan testpersonerna ökar när testerna blir mer komplexa. 4.3 Test 3 felfrekvens I test 3 ingick 10 skärmbilder där varje bild innehöll två rätta svar, ett med och ett utan färgskuggning. Den totala tiden för testet var 60 sekunder. Det totala antalet observationer som gjordes i detta test var 121. I tabell 6 visas fördelningen av antalet rätta resp. felaktiga svar. Procenttalet anger fördelningen inom varje kategori (per rad). Tabell 6: Fördelningen i test 3 Rätt svar Fel svar Summa Med 62 97% 2 3% 64 Utan 54 95% 3 5% 57 Summa 116 5 121 Tabellen visar att testpersonerna har valt etiketter med färgskuggning något oftare än utan skuggning (sista kolumnen i tabellen). Nollhypotes 31: Färgskuggningen påverkar inte valet av etikett, dvs. vi förväntar oss att den totala frekvensen för varje kategori (sista kolumnen) är 121/2 = 60,5

Eftersom vi har två kategorier (med och utan) använder vi chi-två test av anpassning (goodness of fit). Antalet frihetsgrader är df =2-1=1 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 0,30 (med Yates korrektion) och det kritiska värdet är 3,841. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen, dvs. färgskuggningen påverkar inte valet av etikett. Tabell 6 visar att den procentuella frekvensen av rätta svar är störst för etiketter med färgskuggningen, 97% jämfört med 95% för etiketter utan skuggning. Nollhypotes 32: Färgskuggningen påverkar inte frekvensen av rätta svar. Här används chi-två test för oberoende. Antalet frihetsgrader är df = 1*1=1 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 0,0164 (med Yates korrektion) och det kritiska värdet är 3,841. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen, dvs. det finns ingen statistiskt signifikant skillnad mellan etiketter med och utan färgskuggningen. 8 4.4 Test 4 felfrekvens I test 4 ingick 30 skärmbilder där varje bild innehöll tre rätta svar, ett i varje kategori dvs. teckenstorlek. Den totala tiden för testet var 180 sekunder. Det totala antalet observationer som gjordes i detta test var 297. I tabell 7 visas fördelningen av antalet rätta resp. felaktiga svar, procenttalet anger fördelningen inom varje kategori (per rad). Tabell 7: Fördelningen i test 4 Rätt svar Fel svar Summa 7 punkter 65 87% 10 13% 75 12 punkter 91 94% 6 6% 97 17 punkter 114 91% 11 9% 125 Summa 270 27 297 Tabellen visar att testpersonerna oftare har valt etiketter med större teckenstorlek (sista kolumnen i tabellen). Nollhypotes 41: Teckenstorleken påverkar inte valet av etikett, dvs. vi förväntar oss att den totala frekvensen för varje storlek är 297/3 = 99 Eftersom variabeln (teckenstorlek) har tre kategorier använder vi chi-två test av anpassning (goodness of fit). Antalet frihetsgrader är df =3-1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 12,69 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är större än det kritiska värdet kan vi förkasta nollhypotesen, dvs. teckenstorleken påverkar valet av etikett. I detta fall kan vi även dra en preliminär slutsats att man hellre väljer en större text.

9 Tabell 7 visar att den procentuella frekvensen av rätta svar är lägst för den minsta teckenstorleken (7 punkter), men andelen rätta svar ökar inte när storleken ökar från 12 till 17 punkter. Nollhypotes 42: Teckenstorleken påverkar inte frekvensen av rätta svar. Här används vi chi-två test för oberoende. Antalet frihetsgrader är df = 2*1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 2,64 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen. Således, även om den procentuella frekvensen av rätta svar är större för de större teckenstorlekarna (12 resp.17 punkter) är inte skillnaden signifikant i detta fall. Det bör också påpekas att tecken som är större än 12 punkter inte ger någon ökad frekvens av rätta svar. Effektstorleken kan uppskattas med Cramers = [2,64/(297 * 1)] ½ 0,1 Detta innebär att effektstorleken är liten, vilket i sin tur medför att för att uppnå högre styrka krävs större antal observationer. I detta fall (df=2, =5%) behövs ca 900-1000 observationer för att nå styrka 0,80. 4.5 Test 5 felfrekvens I test 5 ingick 30 skärmbilder där varje bild innehöll tre rätta svar, ett i varje kategori N, U och T, där N: Första bokstaven i namnet är versal resten gemener U: Samtliga bokstäver i namnet är versaler T: Versalisering enligt FDA och ISMP rekommendationer Den totala tiden för testet var 210 sekunder och det totala antalet observationer som gjordes i detta test var 337. I tabell 8 visas fördelningen av antalet rätta resp. felaktiga svar, procenttalet anger fördelningen inom varje kategori (per rad). Tabell 8: Fördelningen i test 5 Rätt svar Fel svar Summa N 135 97% 4 3% 139 U 117 92% 10 8% 127 T 66 93% 5 7% 71 Summa 318 19 337 Tabellen visar att testpersonerna oftast har valt etiketter som tillhör kategori N (sista kolumnen i tabellen).

10 Nollhypotes 51: Versaliseringen påverkar inte valet av etikett, dvs. vi förväntar oss att den totala frekvensen för varje storlek är 297/3 = 112 Vi har tre kategorier (N, U och T) och använder chi-två test av anpassning (goodness of fit). Antalet frihetsgrader är df =3-1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 23,52 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är större än det kritiska värdet kan vi förkasta nollhypotesen, dvs. versaliseringen påverkar valet av etikett. I detta fall skulle man kunna tolka resultatet så att testpersonerna valde sådan kategori som de är mest vana att läsa, vilket i detta fall är N. I intervjuer efter testet framgick att ingen av testpersonerna hade tidigare sett Tall man lettering användas i läkemedelsetiketter och att detta sätt att versalisera namn kändes invecklat i början. Tabell 8 visar att den procentuella frekvensen av rätta svar är störst för N, sedan T och sist U. Nollhypotes 52: Versaliseringen påverkar inte frekvensen av rätta svar. Här används vi chi-två test för oberoende. Antalet frihetsgrader är df = 2*1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 3,45 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen. Således, även om den procentuella frekvensen av rätta svar varierar är inte skillnaden signifikant i detta fall. Det som är intressant i detta fall att namn som är skrivna med versaler hade högsta felfrekvens. Effektstorleken kan uppskattas med Cramers = [3,45/(337 * 1)] ½ 0,1 Detta innebär att även i detta fall är effektstorleken liten, vilket i sin tur medför att för att uppnå högre styrka krävs större antal observationer. I detta fall (df=2, =5%) behövs ca 900-1000 observationer för att nå styrka 0,80. 4.6 Test 6 felfrekvens I test 5 ingick 30 skärmbilder där varje bild innehöll två rätta svar, ett alltid i kategori T och det andra antingen i N eller U. Ett av dessa svar hade färgskuggning bakom styrka det andra var utan skuggning. Kombinationen mellan versalisering och skuggning var slumpmässigt fördelad. Vid analysen antar vi att versalisering av läkemedelsnamnet och färgskuggning av styrka inte påverkar varandra vid identifiering av rätt etikett. Den totala tiden för testet var 210 sekunder. Det totala antalet observationer som gjordes i detta test var 300.

Medelvärdet av responstiden var 9,42 sekunder och om vi endast tar hänsyn till korrekta svar 10,70 sekunder. Som vi har resonerat i avsnitt 4.2 blir testet mer komplext när man måste ta hänsyn till två variabler, vilket kan förväntas ge längre responstid. 4.6.1 Versalisering I tabell 9 visas fördelningen av antalet rätta resp. felaktiga svar, där man endast tar hänsyn till läkemedelsnamn. Procenttalet anger fördelningen inom varje kategori (per rad). Tabell 9: Fördelningen i test 6, versalisering Rätt svar Fel svar Summa N 84 86% 14 14% 98 U 78 82% 17 18% 95 T 101 94% 6 6% 107 Summa 263 37 300 Eftersom kategorierna var fördelade enligt N(25%), U(25%) och T(50%) skulle vi har förväntat fördelningen N(75), U(75) och T(150). Nollhypotes 61a: Versaliseringen påverkar inte valet av etikett. Eftersom vi har tre kategorier (N, U och T) använder vi chi-två test av anpassning (goodness of fit). Antalet frihetsgrader är df =3-1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 24,71 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är större än det kritiska värdet kan vi förkasta nollhypotesen, dvs. versaliseringen påverkar valet av etikett. I detta fall skulle man kunna ha samma förklaring som i test 5, dvs. att testpersonerna valde sådana kategorier som de är mest vana att läsa, vilket i detta fall är N och U. Tabell 9 visar att den procentuella frekvensen av rätta svar är störst för T, sedan N och sist U. Nollhypotes 62a: Versaliseringen påverkar inte frekvensen av rätta svar. Här används chi-två test för oberoende. Antalet frihetsgrader är df = 2*1=2 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 7,538 och det kritiska värdet är 5,992. Eftersom det beräknade värdet är större än det kritiska värdet kan vi förkasta nollhypotesen: Tall Man lettering ger lägsta felfrekvens. Effektstorleken kan uppskattas med Cramers = [7,538/(300 * 1)] ½ 0,16 Detta innebär att även i detta fall är effektstorleken liten, vilket i sin tur medför att för att uppnå högre styrka krävs större antal observationer. I detta fall (df=2, =5%) behövs ca 900-1000 observationer för att nå styrka 0,80. Det som är viktigt är att testet gav ett signifikant resultat även om både effektstorleken och styrkan har låga värden. 11

12 4.6.2 Färgskuggning I tabell 10 visas fördelningen av antalet rätta resp. felaktiga svar, där man endast tar hänsyn till läkemedelsstyrka. Procenttalet anger fördelningen inom varje kategori (per rad). Tabell 10: Fördelningen i test 6, färgskuggning Rätt svar Fel svar Summa Med 163 99% 2 1% 165 Utan 129 96% 6 4% 135 Summa 292 8 300 Nollhypotes 61b: Färgskuggningen påverkar inte valet av etikett, dvs. vi förväntar oss att den totala frekvensen för varje kategori är 300/2 = 150 Eftersom vi har två kategorier (med och utan) använder vi chi-två test av anpassning (goodness of fit). Antalet frihetsgrader är df =2-1=1 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 3,00 och det kritiska värdet är 3,841. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen, dvs. färgskuggningen påverkar inte valet av etikett. Således, även om den procentuella frekvensen av rätta svar är större för färgskuggningen är inte skillnaden signifikant i detta fall. Det som är intressant är att frekvensen av rätta svar är högre när det gäller läkemedels styrka jämfört med läkemedelsnamn, tabell 9. Tabell 10 visar att den procentuella frekvensen av rätta svar är störst för etiketter med färgskuggningen. Nollhypotes 62b: Färgskuggningen påverkar inte frekvensen av rätta svar. Här används vi chi-två test för oberoende. Antalet frihetsgrader är df = 1*1=1 och vi använder signifikansnivå = 5%. Det beräknade värdet för 2 = 1,8732 (med Yates korrektion) och det kritiska värdet är 3,841. Eftersom det beräknade värdet är mindre än det kritiska värdet kan vi inte förkasta nollhypotesen, dvs. färgskuggningen påverkar inte frekvensen av rätta svar.

13 5 Diskussion Även om vi inte bör generalisera resultatet från pilotstudien alltför mycket eftersom urvalet inte är slumpmässigt, finns det några viktiga slutsatser som kan framhållas: 1) I test 6, där man skulle ta hänsyn till två variabler, visas en signifikant minskning i felfrekvensen när det gäller läkemedelsnamn som anges med Tall Man lettering. Detta bör betraktas som ett viktigt resultat eftersom både effektstorleken och styrkan har låga värden och det är således svårare att uppnå signifikanta resultat. 2) I test 5 och 6 fick vi också signifikanta resultat som visade att man helst väljer sådan teckenstil som man är mest van att läsa. Även i intervjuerna efter testet poängterade testpersonerna denna synpunkt. Punkt 1 och 2 bör indikera att den fulla effekten av Tall Man lettering kan upptäckas först efter att man har spridit information om detta sätt att skriva läkemedelsnamn. Denna hypotes skulle kunna testas genom en liknande undersökning som denna pilotstudie men där man jämför en testgrupp som har fått sådan information och en referensgrupp som inte känner till Tall Man systemet. En annan viktig aspekt som man bör undersöka vidare är om de rekommendationer som ges av FDA och ISMP när det gäller hur namnen versaliseras är optimala i svenska förhållanden. Eftersom systemet bygger på hur orden ljudas kan det behövas modifiering från engelska till svenska för att ge större effekt. 3) I både test 5 och 6 hade namnen som var skrivna med versaler högsta felfrekvens. Detta är intressant eftersom i tidigare studier (Gerrett et.al, 2010) har versaler haft lägsta felfrekvens, i samma nivå som Tall Man lettering. I Gerretts undersökning testades enskilda ord på skärmen, medan i denna pilotundersökning fick testpersoner se nio etiketter i skärmbilden. Etiketterna ger troligen en större komplexitet till testet vilket i sin tur kan likna den faktiska valprocessen som görs i läkemedelsförrådet. I de testmoment där man inte har fått signifikanta resultat, såsom teckenstorlek och färgskuggning, kan detta bero på att effektstorleken är så liten att endast större undersökningar kan visa eventuell signifikans. Det som framgår från pilotstudien är dock att man helst väljer större teckenstorlek, och en lägre gräns för teckenstorlek bör vara ett ändamålsenligt krav. På samma sätt, även om skillnaden är liten mellan felfrekvenserna med och utan färgskuggning, bör det vara fördelaktigt att accentuera styrkan. 5.1 Fortsatta studier I fortsatta studier skulle det vara högst intressant att undersöka hur förhandsinformation kan påverka effekten av Tall Man lettering, likaså studera om det engelska systemet behöver modifieras för att anpassas i svenska förhållanden. Det som pilotstudien också indikerar är att effektstorleken är låg vilket förutsätter större studier för att kunna komma upp till högre statistiska styrkan, med andra ord ca 1000 mätvärden för att uppnå styrka 0,8.

14 6 Referenser FDA and ISMP Lists of Look-Alike Drug Names with Recommended Tall Man Letters. 2011. Gerrett, D., Gale, A.G., Darker, I.T., Filik, R. & Purdy, K.J. 2010. The Use of tall man Lettering to minimize Selection Errors of medicine Names in Computer Prescribing and Dispensing Systems. Report, National Health Service NHS, Loughborough University Enterprises Ltd. Lindroos, P. & Eldh, A. C. 2008, Parenterala läkemedel med liknande namn och förpackning Studie visar på stor risk för förväxling. Läkartidningen nr 28 29, Vol 105, ss. 2012-2017. Nätverket för patientsäkerhet; Remisshandling 2011-05-19, Ökad patientsäkerhet genom läkemedelsförpackningar.