Kvantitativa metoder och datainsamling Kurs i forskningsmetodik med fokus på patientsäkerhet 2015-09-23, Peter Garvin FoU-enheten för närsjukvården
Kvantitativ och kvalitativ metodik Diskborsten, enkronan och tegelmuren minimundus.se, capdesign.idg.com, dreamstime.com 2
Kvantitativ och kvalitativ metodik Olika typer av frågeställningar Skillnader i mål, den ena kan inte ersätta den andra Kvantitativ metodik Quantus efter latin för hur många? Att med hjälp av matematiska (statistiska) sammanställningar och beräkningar beskriva förekomst och samband Förklara utifrån det vi mäter Tolkning är begränsad att innefatta de data som samlats in Kvalitativ metodik Qualis efter latin för av vilken sort? Att med hjälp av omsorgsfulla observationer och mycket information tolka en situation, upplevelse eller uppfattning Förstå utifrån det som kan observeras Tolkning bygger på en mer komplex syn på det man vill studera 3
Kvantitativ forskningsmetodik Två områden Båda utgår från att samlar in information utifrån en given frågeställning Deskriptiv (beskrivande) Hur många finns det? Hur stor är variationen inom eller mellan grupper? Enkel i teori, beroende på att vi kan lita på de data som samlats in Analyserande (hypotesprövande) Finns det något samband mellan våra insamlade variabler? Utgår från likheter och skillnader vad gäller fördelning i olika grupper Sannolikheter vägs mot varandra Avancerad i teori, beroende på att vi kan göra rimliga antaganden om fördelning utifrån sannolikhet En mängd olika studiedesigner Observation vs experiment 4
Behovet av en modell Att samla in information utifrån en given frågeställning Vad är det för data jag behöver för att kunna besvara min frågeställning? Påverkansfaktorer Modifierande faktorer Utfall Rökning Infektion Fysisk aktivitet Undernäring Socialt stöd Sjukdom/ tillstånd Ålder Andra sjukdomar Närhet till sjukvård Hur får jag tag i dessa data? 5
Tre olika typer av variabler Nominal variabel (kategorisk) Nominal efter latin för namn Kategorisering utan inbördes rangordning ex. kvinna/man ex. Sjukdom ja/nej Ordinal variabel Ordinal efter latin för ordning, position i en serie. Kategorisering som har en given rangordning ex. Ingen förhöjning, lätt förhöjd, måttligt förhöjd, mycket förhöjd ex. På en skala från 1 till 10 Kontinuerlig variabel Kontinuerlig efter latin för sammanhängande, obruten. Som kan anta vilket värde som helst (inom ett givet intervall). ex. uppmätta laboratorievärden ex. BMI 6
Nominal skala. Exempel yrkeskategori Finns det endast ett svarsalternativ som passar? Möjliga överlapp mellan olika kategorier leder till svårtolkad situation. Ingen kategori som passar? Undvik att beroende av hur respondenten har tänkt kring svarsalternativen Vilken är ditt nuvarande yrke: (sätt kryss i en ruta) 1. Läkare 2. Sjuksköterska 3. Arbetsterapeut 4. Psykolog 5. Chef Vad är din huvudsakliga sysselsättning: (sätt kryss i en ruta) 1. Arbetar heltid 2. Arbetar deltid 3. Arbetssökande 4. Under utbildning 5. Föräldraledig 6. Sjukskriven 7. Pensionär 7
Nominal skala. Exempel förändring över tid Speglar alternativen vad du är ute efter? Historisk situation av relevans för kategoriseringen? Är du rökare: (sätt kryss i en ruta) 1. Ja 2. Nej Rökvanor: (sätt kryss i den ruta som beskriver dina rökvanor bäst) 1. Är rökare 2. Har nyligen slutat röka (inom det senaste året) 3. Rökte tidigare men har slutat (för mer än ett år sedan) 4. Har aldrig rökt (mer än några enstaka tillfällen) 8
Nominal skala. Exempel olika definitioner Hur vanligt är det med depression? Sjukdom/tillstånd. Har eller har inte. Ex. enkätstudie i Östergötland, svarsfrekvens 62% % 60 50 40 30 20 10 0 Proportion med depression utifrån olika definitioner i samma material 8 Klinisk diagnos 16 Depression utifrån enkät CES-D 20 Klinisk diagnos eller symptom andel bland skattade Vilken definition är mest relevant? Kan vara olika i olika situationer Beroende av forskningsfråga 9
Nominal skala. Exempel olika definitioner Hur vanligt är det med depression? Ex. enkätstudie i Östergötland, svarsfrekvens 62% % 60 50 40 30 20 10 0 Klinisk diagnos Proportion med depression utifrån olika definitioner i samma material Depression Klinisk utifrån enkät diagnos eller CES-D symptom 60 50 40 30 20 10 0 andel bland skattade sann andel om alla som uteblev har depression sann andel om ingen som uteblev har depression Glöm inte bort att göra en bortfallsanalys Kan vara förödande om man vill generalisera deskriptiv statistik ( Hur vanligt är det med depression i Östergötland? ) 10
Ordinal skala. Exempel självskattad hälsa Möjliga svarsalternativ spelar roll för hur man svarar Samma svarsalternativ får olika betydelser. I allmänhet, skulle du vilja säga att din hälsa är: (sätt kryss i en ruta) 1. Utmärkt 2. Mycket god 3. God 4. Någorlunda 5. Dålig I allmänhet, skulle du vilja säga att din hälsa är: (sätt kryss i en ruta) 1. Mycket god 2. God 3. Någorlunda 4. Sviktande 5. Dålig 11
Ordinal skala. Exempel glidande skala Finns det tydliga gränser mellan olika svarsalternativ? Konstruerad skala där graderingen blir en tolkningsfråga. Tolkningsbart? Känner du dig trygg i din behandlingssituation: (sätt kryss i en ruta) 1. Ja, fullständigt trygg 2. Ja, mycket trygg 3. Ja, tillräckligt trygg 4. Någorlunda 5. Nej, inte trygg 12
Kontinuerlig skala. Exempel spridning Är alla uppmätta värden rimliga? antal 30 Nivåer av C-reaktivt protein 25 20 15 10 grupp 1 grupp 2 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 konc. CRP mg/l Fysiologiskt perspektiv: Är värdet möjligt? Statistiskt perspektiv: Medvetenhet om att några få värden kan få avgörande betydelse för tolkningen. Mätperspektiv: Finns det något takvärde i mätningen ( Alla värden över 20 mg/l får värdet 20 )? 13
Kontinuerlig skala. Exempel precision Betyder tre decimaler att mätvärdet är mer exakt? antal 30 Nivåer av C-reaktivt protein 25 20 15 10 grupp 1 grupp 2 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 konc. CRP mg/l 20,389 mg/l vs 20,38 mg/l vs 20,3 mg/l vs 20 mg/l vs >10 mg/l Fysiologiskt perspektiv: Stabilitet över tid? Mätperspektiv: Variation och osäkerhet i mätinstrument? 14
Från kontinuerligt till nominal går bra.. Exempel BMI 2 2 2 Kontinuerlig: 18.7 kg/m 24.3 kg/m 28.9 kg/m 36.8 kg/m Ordinal: Undervikt Normalvikt Övervikt Fetma Nominal: Inte fetma Inte fetma Inte fetma Fetma Exempel feber Kontinuerlig: 36.7 grader 38.1 grader 39.1 grader 40 grader Ordinal: ingen feber lätt feber måttlig feber hög feber Nominal: Nej Ja Ja Ja 2 Om det är möjligt att samla in data som kontinuerliga variabler är det att föredra Kategoriseringar på ordinal eller nominal nivå kan göras senare 15
..men åt andra hållet är det värre Manöver som ger sken av en exakthet som aldrig mättes Exempel, omvandling av en ordinal till kontinuerlig variabel Skattad fysisk motion i enkäter blir till exakt värde med decimaler angett i kcal eller minuter per dag. Skattat kostintag blir till exakt värde med decimaler angett i kcal eller mikrogram. Exempel, omvandling av en nominal till kontinuerlig variabel Rapporterad yrkeskategori överförs till exakt månadsinkomst (baserad på medelvärden) Exempel, omvandling av en nominal till ordinal variabel Rapporterad yrkeskategori överförs till socioekonomisk ranking (baserat på månadsinkomst eller utbildningsnivå) 16
Bortfall ett eget men viktigt kapitel Är vi bra på att mäta? Relevansen av mätvärdet i förhållande till det vi vill undersöka: Vilken tidpunkt är relevant? Är variabeln stabil eller fluktuerar den över olika dagar? Intensitet eller duration? Mest intressant att patienten har hög feber vid mättillfället eller att patienten har haft feber i fem dagar? Medelvärde, högsta-lägsta? Vad är i fokus, förhöjning eller variation? Historisk eller nuvarande situation? Betydelse att man någonsin har haft, att man nyligen har haft eller att man har just nu? 17
Datainsamling i relation till frågeställning Hur mycket data ska vi samla in? Utgå från frågeställning och bakomliggande modell Ta endast med data som är relevant utifrån det man vill veta, fokusera på att dessa variabler blir så bra som möjligt. Balans: Data som kunde vara bättre insamlat för att kunna svara på frågeställningen, men som är lättillgängliga vs: Variabler som har hög precision men är svåra att ta fram 18
Datainsamling i relation till frågeställning Dragkampen mellan Mulla Nasruddin och den lätt neurotiske perfektionisten Må ingen av dem vinna 19