Datakvalitet. Hva duger data til? Jonas Ranstam
|
|
- Monica Lindberg
- för 8 år sedan
- Visningar:
Transkript
1 Hva duger data til? Jonas Ranstam Registercentrum Syd, Skånes Universitetssjukhus och Inst. f. kliniska vetenskaper, Lunds Universitet, Klinikgatan 22, Lund, Sverige 15 Jan 2015
2 Big data
3 Big data
4 Big data
5 Big data There are a lot of small data problems that occur in big data. They don t disappear because you ve got lots of the stuff. They get worse. David Spiegelhalter
6 Big data Statistics have never been cooler; it s never been more useful. It just seems to me te be a wonderful time to be a statistician. Brian Tarran
7 Detta föredrag Disposition Studiedesign, datainsamling och statistisk analys hänger samman. Här kommer fokus att ligga på data, främst datakvalitet. Vad är datakvalitet? Vad har bristande datakvalitet för konsekvenser? Hur kontrollerar jag datakvaliteten i mitt register? Diskussion
8 Vad är datakvalitet? Absolut definition Relevanta, fullständiga, korrekta och konsistenta data.
9 Vad är datakvalitet? Relativ definition Tillräckligt bra för att uppfylla användarens behov.
10 Vad är datakvalitet? Relativ definition Tillräckligt bra för att uppfylla användarens behov. Vad är tillräckligt bra?
11 Vad är datakvalitet? Relativ definition Tillräckligt bra för att uppfylla användarens behov. Vad är tillräckligt bra? Det beror på vad data ska användas till.
12 Bortfall Vad är konsekvensen av bortfall?
13 Två exempel: Vissa höftprotesreoperationer oregistrerade
14 Exempel 1. Skattning av 2-årig reoperationsrisk.
15 Exempel 1. Skattning av 2-årig reoperationsrisk Förutsättning: totalt i höftregistret under primäroperationer 819 reoperationer 819 Skattad reoperationsrisk: = (95%Ki: ) Antag att en oberoende underrsökning visar att 5% av genomförda reoperationer inte registreras.
16 Exempel 1. Skattning av 2-årig reoperationsrisk Skattad reoperationsrisk = (95%Ki: ) Bortfallskorrektion 5% bortfall ger en korrektionsfaktor på Korrigerad skattad reoperationsrisk = (95%Ki: ) dvs
17 Exempel 1. Skattning av 2-årig reoperationsrisk
18 Exempel 2. Rangordning av reoperationsrisker
19 Exempel 2. Rangordning av reoperationsrisker Beräkningar Monte-Carlo simulering för att bedöma möjliga konsekvenser (för rangordningen) av att 43 reoperationer genomförts men inte registrerats.
20 Exempel 2. Rangordning av reoperationsrisker
21 Exempel 2. Rangordning av reoperationsrisker
22 Exempel 2. Rangordning av reoperationsrisker
23 Registreringsfel Vad är konsekvensen av registreringsfel?
24 Registreringsfel Misclassification bias Systematiskt felaktiga forskningsfynd som uppstår vid bristande sensitivitet/specificitet i fastställning av exponering och/eller effekt. Felklassificeringen kan vara Non-differential Differential
25 Registreringsfel Non-differential misclassification bias Felklassificeringen är densamma i olika grupper. Exponering kan, t.ex. vara lika felklassificerad bland fall som kontroller. För binära variabler leder sådana fel till att skillnader underskattas.
26 Registreringsfel i binär variabel
27 Registreringsfel i binär variabel
28 Registreringsfel i binär variabel Differential misclassification bias I en fall-kontrollstudie kan den rapporterade exponeringen t.ex. skilja sig mellan fall och kontroller (t.ex. recall bias). Fenomenet kan både innebära att skillnader över- och underskattas.
29 Registreringsfel i binär variabel
30 Registreringsfel i binär variabel
31 Registreringsfel i kontinuerlig variabel Regression dilution bias Slumpmässiga mät-(och/eller registrerings-) fel i en kontinuerlig variabel manifesterar sig olika beroende på om felen finns i exponerings- eller utfallsvariabeln.
32 Registreringsfel i kontinuerlig variabel Fel i en utfallsvariabel Slumpmässiga mät- (eller registrerings-) fel i en kontinuerlig utfallsvariabel (t.ex. systoliskt blodtryck) ökar osäkerheten i parameterskattningar (bredare konfidensintervall). Ökad stickprovsstorlek kan kompensera förlusten av statistisk precision.
33 Registreringsfel i kontinuerlig variabel Fel i en exponeringsvariabel Slumpmässiga mät- (eller registrerings-) fel i en kontinuerlig exponeringsvariabel innebär underskattade parametrar (effektmått). Ökad stickprovsstorlek ger visserligen ökad precision, men minskar inte bias.
34 Registreringsfel Korrektionsmetoder För kategoriska variabler estimated misclassification probabilities markov models För kontinuerliga exponeringsvariabler regression calibration multiple imputation moment reconstruction simulation extrapolation
35 Misclassification and missing
36 Misclassification and imputation
37 Validering Hur kontrollerar jag datakvaliteten i mitt register?
38 Validering Tillvägagångssätt Kontroll av variablers fördelning (orimliga värden) Utvärdering av intern konsistens Adjudicering, eftergranskning, o.d. Jämförelser med källdata
39 Validering Validering Validering av alla data, som i en klinisk läkemedelsprövning, är ofta praktiskt omöjliga i ett register. Stickprovsundersökningar kan vara ett gott alternativ.
40 Stickprov och population
41 Stickprov och population
42 Stickprov och population Grunder I en valideringsundersökning av ett helt register kan man teoretiskt sett, om man bortser från konsekvenser av praktiska misstag, beräkna andelen korrekta värden för en viss variabel, π, direkt. I en urvalsvalidering får man istället skatta π, och skattningar, ˆπ i, är osäkera. Individuella variationer ger nämligen olika skattningar i olika urval. ˆπ i = π + ɛ i (1)
43 Obundet slumpmässigt urval Under vissa förutsättningar, som att varje element i populationen haft samma sannolikhet att ingå i urvalet, kan osäkerheten dock beräknas. E( ˆπ i ) = π (2) σ 2ˆπ i = ˆπ i(1 ˆπ i ) n i (3) z N(0, 1) (4) P( ˆπ i z α/2 σ ˆπi < π < ˆπ i + z α/2 σ ˆπi ) = 1 α (5)
44 Obundet slumpmässigt urval Om α = 0.05 är således urvalsfelet, ɛ i, med 95% sannolikhet mindre än 1.96 ˆπi (1 ˆπ i ) Osäkerheten beror alltså på ˆπ i, den skattade datakvaliteten n i, antal observationer n i
45 Obundet slumpmässigt urval Stickprovsstorlek Lämplig urvalsstorlek beror på hur stor osäkerhet man kan acceptera och vilken datakvalitet man skattar. Mindre urval ger alltid större osäkerhet.
46 Stickprovsstorlek Tabell: 1. Urvalsstorlek för att med ett obundet slumpmässigt urval skatta prevalensen felregistrerade data. Halvt 95% konfidensintervall Prevalens 0,01 0,05 0,10 0,15 0,20 0,25 0, , , , , , , , , , ,
47 Komplikation 1. Ett register är en finit population Finitpopulation Ett stort urval (> 5%) från en finit population leder till överskattning av variansen och osäkerheten. En finitpopulationskorrektion, fpc, av variansen behövs då. fpc = N ni N 1 (6) Där n i är antalet observationer i urvalet och N antalet element i populationen. Med korrektion kan medelfelet av π i skrivas: ˆπ i (1 ˆπ i ) N ni σ ˆπi = (7) n i N 1
48 Komplikation 2. Begränsning av deltagande sjukhus Tvåstegsurval I praktiken innebär valideringsarbete ofta resor till olika kliniker för att på plats kunna jämföra registerade data med källdokument, t.ex. journalhandlingar. För att underlätta arbetet och begränsa reskostnader kan det vara fördelaktigt att begränsa antalet deltagande sjukhus. Man kan då t.ex. först göra ett (obundet slumpmässigt) urval av kliniker och därefter, inom varje klinik, ett andra (obundet slumpmässigt) urval av patienter. Även ett sådant tvåstegsförfarande påverkar emellertid variansskattningen.
49 Designeffekt Denna designeffekt på variansskattningen, def, kan skrivas: def = 1 + ρ(m 1) (8) Där m är medelantalet patienter per klinik och ρ klinikernas intraklasskorrelation (ICC). ρ = σ 2 b σ 2 b + σ2 w (9) Här är σ 2 b variansen mellan och σ2 w inom klinikerna.
50 Designeffekt Designeffekten kan användas för att beräkna hur mycket större ett tvåstegsurval måste vara för att ge samma statistiska precision som ett ettstegsurval. För beräkningen krävs, m, som beror på studiens design och intraklasskorrelationskoefficienten, ρ, som beror på hur klinikerna varierar i datakvalitet.
51 Hur hög är ICC?
52 Exempel 3. Obundet slumpmässigt urval av patienter från 97 sjukhus Andel felregistrerade = 5% Osäkerhet = ±5% Antal observationer =?
53 Hur många registreringar måste kontrolleras? Tabell: 1. Urvalsstorlek för att med ett obundet slumpmässigt skatta prevalensen felregistrerade data. Konfidensintervall, halv bredd Prevalens 0,01 0,05 0,10 0,15 0,20 0,25 0, , , , , , , , , , ,
54 Exempel 3. Obundet slumpmässigt urval av patienter från 97 sjukhus Andel felregistrerade = 5% Osäkerhet = ±5% Antal observationer = 73 Ganska många sjukhus måste uppsökas.
55 Exempel 4. Samma undersökning med tvåstegsurval Obundet slumpmässigt urval = 73 Medelantal patienter per sjukhus = 50 Intraklasskorrelation = 0,10 Designeffekt =?
56 Hur stor är designeffekten Tabell: 2. Designeffekt vid tvåstegsurval Observationer Intraklasskorrelationskoefficient per 1:a urval 0 0,1 0,2 0,3 0,4 0,5 10 1,0 1,9 2,8 3,7 4,6 5,5 20 1,0 2,9 4,8 6,7 8,6 10,5 30 1,0 3,9 6,8 9,7 12,6 15,5 40 1,0 4,9 8,8 12,7 16,6 20,5 50 1,0 5,9 10,8 15,7 20,6 25,5 75 1,0 8,4 15,8 23,2 30,6 38, ,0 10,9 20,8 30,7 40,6 50, ,0 20,9 40,8 60,7 80,6 100, ,0 30,9 60,8 90,7 120,6 150, ,0 40,9 80,8 120,7 160,6 200, ,0 50,9 100,8 150,7 200,6 250,5
57 Exempel 4. Samma undersökning med tvåstegsurval Obundet slumpmässigt urval = 73 Medelantal patienter per sjukhus = 50 Intraklasskorrelation = 0,10 Designeffekt = 5,9 Totalt antal patienter: 5, , Antal sjukhus: 431/50 9.
58
59 Beräkning med program R, epicalc och n.for.survey Kommando n.for.survey(p=0.05, delta=0.05, deff=5.9) Sample size for survey. Assumptions: Proportion = 0.05 Confidence limit = 95% Delta = 0.05 from the estimate. Design effect = 5.9 Sample size = 431
60 Sammanfattning
61 Slut Tack för uppmärksamheten!
62 Diskussion Frågor att diskutera i mån av tid.
63 Diskussionspunkt 1 Förutsättningar Ett register samlar information om biverkningar av olika läkemedel mot högt blodtryck. Tyvärr stämmer inte alltid den registrerade informationen. Vilka konsekvenser får detta: om läkemedel felregistreras? om komplikationer felregistreras? om vissa komplikationer särskilt felregistreras för ett visst läkemedel? Tips: differential och non-differential misclassification.
64 Diskussionspunkt 2 Förutsättningar Samma registret samlar också information om uppnått blodtryck för de olika blodtryckssänkande läkemedlena. Tyvärr även denna registrering bristfällig. Vad blir konsekvenserna: om läkemedel ibland slumpmässigt felregistreras? om fel blodtryck ibland slumpmässigt registreras? om noggrannheten i blodtrycksregistreringen beror på läkemedlet? Tips: regression dilution bias.
65 Diskussionspunkt 3 Förutsättningar För att undersöka ett registers datakvalitet startas en validitetesstudie. Registrerade data jämförs med journaluppgifter i ett tvåstegsurval. Först väljs kliniker ut och sedan patienter inom varje klinik. Vilka påstående är sanna? Designeffekten anger hur mycket större ett tvåstegsurval måste vara för att ge samma precision som ett obundet slumpmässigt urval. När bara en patient väljs per klinik finns finns ingen designeffekt. När intraklasskorrelationen är 0 finns ingen designeffekt.
66 Diskussionspunkt 4 Vilka påstående är sanna? Varför? Ett kvalitetsregister är alltid ett stickprov. Ett systematiskt bortfall är ett större problem än ett slumpmässigt bortfall. Felregistrerade data ger alltid utspädningseffekter på analysresultat.
67 Diskussionspunkt 5 Vilka påståenden är sanna och varför? Adjudicering är en form av validering. Vissa former av validering kan göras maskinellt. Validerade data ska aldrig rättas.
68 Exemplen på misclassification bias hämtades från
STATISTISK POWER OCH STICKPROVSDIMENSIONERING
STATISTISK POWER OCH STICKPROVSDIMENSIONERING Teori UPPLÄGG Gemensam diskussion Individuella frågor Efter detta pass hoppas jag att: ni ska veta vad man ska tänka på vilka verktyg som finns vilket stöd
Läs merHur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Läs merVad beror skillnaden på? Systematiska och slumpmässiga fel
Vad beror skillnaden på? Systematiska och slumpmässiga fel Typer av fel och rätt Verklig skillnad Stort slumpfel! En studie genomförs Vi observerar en skillnad! Vi observerar ingen skillnad Slumpfel Systematiska
Läs merMULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla
Läs merMissing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21
Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.
Läs merMULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?
MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.
Läs merStudietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
Läs merUrvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )
F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4) Urval Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta inte möjlig För dyrt Tar
Läs merUrval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval
Urval F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4) Ursprung: Linda Wänström Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta
Läs merHypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merAnvändarmöte. Jönköping
Användarmöte Jönköping 2016-04-19 Jönköpings kommun 133 000 invånare, totalt i länet nästan 348 000 invånare Länssjukhuset Ryhov Traumagrupp på Ryhov Trauma i siffror 2014 Antal traumalarm totalt 374 Stort
Läs merPreliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merBild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Läs merExtra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp
Extra övningssamling i undersökningsmetodik HT10 till kursen Regressionsanalys och undersökningsmetodik, 15 hp Författad av Karin Dahmström 1. Utgå från en population bestående av 5 personer med följande
Läs merTillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter
Läs merFöreläsning 4. Kapitel 5, sid Stickprovsteori
Föreläsning 4 Kapitel 5, sid 127-152 Stickprovsteori 2 Agenda Stickprovsteori Väntevärdesriktiga skattningar Samplingfördelningar Stora talens lag, Centrala gränsvärdessatsen 3 Statistisk inferens Population:
Läs merErica Schytt. Barnmorska Föreståndare för Centrum för klinisk forskning Dalarna Docent Karolinska Institutet Professor Høgskulen på Vestlandet
Erica Schytt Barnmorska Föreståndare för Centrum för klinisk forskning Dalarna Docent Karolinska Institutet Professor Høgskulen på Vestlandet Tänk er en enkätstudie I den bästa av världar. Alla i hela
Läs mer34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
Läs merEPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)
EPIDEMIOLOGI Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell) Läran om utbredningen av och orsakerna till hälsorelaterade tillstånd eller förhållanden i specifika populationer och tillämpningen
Läs merValidering av kvalitetsregister på INCA Version 1.0
Version 1.0 Information från AKI: Arbetsgruppen för kvalitetsregister och INCA Versionshantering Version/Datum Författare Beskrivning av förändring Godkänt av AKI 1.0/2014-04-24 Mats Lambe - 2014-05-13
Läs merAnalys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Läs merPreliminär rapport om populationsutveckling och storlek av brunbjörn i Sverige, 2004
Preliminär rapport om populationsutveckling och storlek av brunbjörn i Sverige, 24 En rapport till Naturvårdsverket från Skandinaviska Björnprojektet 31 maj 24 Jonas Kindberg Jon Swenson Sven Brunberg
Läs merEpidemiologi (II) Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund
Epidemiologi (II) Läkarprogrammet Termin 5, VT 2015 Lars Rylander Avdelningen för arbets och miljömedicin, Lund Epost: Lars.Rylander@med.lu.se Tel: 046 222 1631 Exempel: Sjukdomsmått 1990 2000 2010 Antal
Läs merTentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle
Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng
Läs merDataanalys kopplat till undersökningar
Dataanalys kopplat till undersökningar Seminarium om undersökningsmetoder för förorenade områden, Malmö 6-7 maj Jenny Norrman, SGI, Chalmers FRIST På säker grund för hållbar utveckling Innehåll Inledning
Läs merUpprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
Läs merFöreläsning 6 (kap 6.1, 6.3, ): Punktskattningar
Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)
Läs merMedicinsk statistik I
Medicinsk statistik I Läkarprogrammet T5 VT 2013 Susanna Lövdahl, Msc, Doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Medicinsk statistik VT-2013 Tre stycken
Läs merSF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Läs merAnalytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Läs merFöreläsning 4. 732G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin
Föreläsning 4 732G19 Utredningskunskap I Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin Dagens föreläsning Systematiskt urval Väntevärdesriktiga skattningar Jämförelse med OSU Stratifierat
Läs merProblem med analyser av EQ-5D data. Philippe Wagner Tomasz Czuba Jonas Ranstam
Problem med analyser av EQ-5D data Philippe Wagner Tomasz Czuba Jonas Ranstam Tänkte prata om Vad är EQ-5D? Hur analyseras EQ-5D data? Kort repetition av t-testet T-testet och EQ-5D data Kort repetition
Läs merSF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
Läs merVALIDERINGSHANDBOK. Handboken har tagits fram på uppdrag av beslutsgruppen för Nationella Kvalitetsregister.
VALIDERINGSHANDBOK Uppgifter och resultat från kvalitetsregister används i allt högre grad i vårdens kvalitetsarbete, i ledning och styrning, och inom forskningen. Därför har det blivit allt viktigare
Läs merVarför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov
Summer Science Camp, Tjärnö, 8 August 2012 Varför statistik? Serik Sagitov http://www.math.chalmers.se/ serik/ Avdelningen för matematisk statistik Matematiska Vetenskaper Chalmers Tekniska Högskola och
Läs merTill ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merUrval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald
F11 Repetition Undersökningar Olika slag av undersökningar Syftet Beskrivande Förklarande/utredande Framåtblickande Undersökningsplanering Vem ska undersökas? Målpopulation Rampopulation Vad ska undersökas?
Läs merBjörnstammens storlek i Sverige 2008 länsvisa uppskattningar och trender Rapport 2009 2 från det Skandinaviska björnprojektet
Björnstammens storlek i Sverige 2008 länsvisa uppskattningar och trender Rapport 2009 2 från det Skandinaviska björnprojektet Jonas Kindberg, Jon E. Swenson och Göran Ericsson Introduktion Björnen tillhör
Läs merKalibreringsrapport. Utländska doktorander
Kalibreringsrapport Utlänska oktoraner Inlening I en urvalsunersökning är allti skattningarna beäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppkommer
Läs merBIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29)
LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) Aktuella avsnitt i boken: Kap 61 65 Lektionens mål: Du ska
Läs merTeknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.
1 (18) Statistikenheten 20110808 Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011. Inledning Under våren/försommaren 2011 har Arbetsförmedlingens Statistikenhet,
Läs merStatistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Läs merBjörnstammens storlek i Västerbotten 2014
Björnstammens storlek i Västerbotten 2014 Rapport 2015-6 från det Skandinaviska björnprojektet Jonas Kindberg och Jon E. Swenson www.bearproject.info English summary: The bear scat survey in Västerbotten
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs merRegisterstudier vad kan man behöva tänka på?
Registerstudier vad kan man behöva tänka på? Forskningskonferensen Kvalitetsregister 2018-05-23 Gunilla Andrew-Nielsen Kliniska prövningar och licenser Läkemedelsverket När behövs tillstånd för klinisk
Läs merFöreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Läs merStatistik Lars Valter
Lars Valter LARC (Linköping Academic Research Centre) Enheten för hälsoanalys, Centrum för hälso- och vårdutveckling Statistics, the most important science in the whole world: for upon it depends the applications
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merTvå innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Läs merStudiedesign och effektmått
Studiedesign och effektmått Kohortstudier och randomiserade studier Disposition Mått på association Studiedesign Randomiserade kliniska/kontrollerade prövningar Kohortstudier Mått på sjukdomsförekomst
Läs merF11 Två stickprov. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 26/2 2013 1/11
1/11 F11 Två stickprov Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 26/2 2013 2/11 Dagens föreläsning Konfidensintervall när man har ihopparade stickprov Att väga samman skattningar
Läs merFÅ FRAM INDATA. När inga data finns!? Beslutsfattarens dilemma är att det är svårt att spå! Särskilt om framtiden!
FÅ FRAM INDATA När inga data finns!? Beslutsfattarens dilemma är att det är svårt att spå! Särskilt om framtiden! (Falstaff Fakir) Svårigheter att få fram bra information - en liten konversation Ge mig
Läs merIntroduktion till statistik för statsvetare
och enkäter "Det finns inget så praktiskt som en bra teori" September 2011 och enkäter Inledning Inledning Om vi vill mäta en egenskap hos en population individer (individer kan vara personer, företag
Läs merF9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Läs merFöreläsning 1: Introduktion. Vad är statistik?
Föreläsning 1: Introduktion Vad är statistik? 1 Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att
Läs merEXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Läs merStatistikens grunder. Mattias Nilsson Benfatto, Ph.D
Statistikens grunder Mattias Nilsson Benfatto, Ph.D Vad är statistik? Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information.
Läs merSF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski
SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016
Läs merBortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB
Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB Konsekvenser av Bortfall Introduktion Illustration av hur bortfall påverkar resultaten i en statistisk
Läs merVi har en ursprungspopulation/-fördelning med medelvärde µ.
P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har
Läs mer, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Läs merF9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Läs merFöreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer
Läs merLaboration 3: Urval och skattningar
S0004M Statistik 1 Undersökningsmetodik. Laboration 3: Urval och skattningar Denna laboration handlar om slumpmässiga urval. Dessa urval ska användas för att uppskatta egenskaper hos en population. Statistiska
Läs merTentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Läs merKurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Läs merChecklista för systematiska litteraturstudier*
Bilaga 1 Checklista för systematiska litteraturstudier* A. Syftet med studien? B. Litteraturval I vilka databaser har sökningen genomförts? Vilka sökord har använts? Har författaren gjort en heltäckande
Läs merTENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL
TENTAMEN I SF950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 010 KL 14.00 19.00 Examinator : Gunnar Englund, tel. 790 7416, epost: gunnare@math.kth.se Tillåtna hjälpmedel: Formel-
Läs merSF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)
SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012
Läs merKvantitativa metoder och datainsamling
Kvantitativa metoder och datainsamling Kurs i forskningsmetodik med fokus på patientsäkerhet 2015-09-23, Peter Garvin FoU-enheten för närsjukvården Kvantitativ och kvalitativ metodik Diskborsten, enkronan
Läs merF10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval
F10 Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval Anta att man vill göra ett urval som täcker ett stort geografiskt område vill använda besöksintervju som insamlingsmetod
Läs merF19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Läs merInStat Exempel 4 Korrelation och Regression
InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 6 Johan Lindström 13 september 2017 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 1/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 5 Statistiska metoder 1 Dagens föreläsning o Konfidensintervall För andelar För medelvärden Vid jämförelser o Den statistiska felmarginalen o Stickprovsstorlek 2 Introduktion När man beräknar
Läs merTidigare exempel. Några beteckningar. Stratifierat urval
Tidigare exempel F4 Urvalsmetoder: (kap 9.5) Ursprung: Linda Wänström Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler
Läs merKonfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta
Konfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta Bakgrund Populations-baserad cancerpatientöverlevnad skattas med hjälp av data från det svenska cancer
Läs merUrvalsmetoder: Stratifierat urval (kap 9.5)
F4 Urvalsmetoder: Stratifierat urval (kap 9.5) Tidigare exempel Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler
Läs merChecklista för systematiska litteraturstudier 3
Bilaga 1 Checklista för systematiska litteraturstudier 3 A. Syftet med studien? B. Litteraturval I vilka databaser har sökningen genomförts? Vilka sökord har använts? Har författaren gjort en heltäckande
Läs merGrunderna i epidemiologi Felkällor.
Grunderna i epidemiologi Felkällor karin.engstrom@ki.se Karin Engström, Kvant. metoder FHV T1 december 2011 1 Problemformulering /målsättning Undersökningsplan Urvalsram Mätinstrument Urval Mätning Databehandling
Läs merDatorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:
Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 11 Johan Lindström 13 november 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 1/25 Repetition Stickprov & Skattning Maximum likelihood
Läs merTentamen Metod C vid Uppsala universitet, , kl
Tentamen Metod C vid Uppsala universitet, 170503, kl. 08.00-12.00 Anvisningar Av rättningspraktiska skäl skall var och en av de tre huvudfrågorna besvaras på separata pappersark. Börja alltså på ett nytt
Läs merStatistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Läs merMedicinsk statistik III Läkarprogrammet, Termin 5 VT 2016
Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016 Jonas Björk E-post: jonas.bjork@med.lu.se Medicinsk statistik III Innehåll och läsanvisningar Statistik för binära utfall Kapitel 12 Dimensionering
Läs merYtterligare urvalsmetoder och skattningsmetoder
F6 Ytterligare urvalsmetoder och skattningsmetoder Flerstegsurval Anta att man vill göra ett urval som täcker ett stort geografiskt område vill använda besöksintervju som insamlingsmetod Praktiskt omöjligt
Läs merPROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Läs merUrvalsökningar. Precisionen i en skattning är normalt proportionell mot 1/ n där n är urvalsstorleken
Urvalsökningar Precisionen i en skattning är normalt proportionell mot 1/ n där n är urvalsstorleken En urvalsökning från 21000 till 29500 individer borde då resultera i förbättring med ca 15% Eller? 1
Läs merBetrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Läs merHyror i bostadslägenheter (HiB)
Statistiska centralbyrån SCBDOK 3.2 1 (17) Hyror i bostadslägenheter (HiB) 2014 BO0406 Innehåll 0 Allmänna uppgifter... 2 0.1 Ämnesområde... 2 0.2 Statistikområde... 2 0.3 SOS-klassificering... 2 0.4 Statistikansvarig...
Läs merViktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.
Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Frida Eek
Läs merTentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK
Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), 161102 STATISTIK Maxpoäng är 17 p. G 10 p; VG 14,5 p; Ge fullständiga svar men skriv ändå kortfattat och tydligt! Ange dina svar direkt i tentamen!
Läs mer