Matematisk statistik för medicinare - testversion. Johan Olsén
|
|
- Ellinor Blomqvist
- för 8 år sedan
- Visningar:
Transkript
1 Matematisk statistik för medicinare - testversion Johan Olsén (johan.olsen.uu@gmail.com) 6 november 2014
2 Innehåll 1 Introduktion Läsguide Lathund 6 I Beskrivningar 9 3 Begrepp Kvalitativa och kvantitativa variabler Mätskalor Deskriptiv statistik Centralmått Medelvärde Median Typvärde Spridningsmått Standardavvikelse Varians Kvartilavstånd Sannolikhet och odds Bivariat deskriptiv statistik Kovarians Korrelationskoefficient Relativ Risk och Odds ratio Frekvenstabell (contingency table) Grafisk presentation av data Kategorivariabler Cirkeldiagram Stapeldiagram Kontinuerliga variabler Histogram Spridningsdiagram (scatter plot) Box-plot (låddiagram) Inferensstatistik Planera ditt stickprov Statistiska fördelningar Beteckningar och begrepp Normalfördelning Stickprovsmedelvärdet Stickprovsvarians Skattningarnas precision
3 6.7 Konfidensintervall Hypotesprövning och p-värde Osäkerhet och power Ensidigt eller tvåsidigt test? Parat eller oparat test? Prediktion Klassificering Klassifikationstabeller Mått på klassificeringsförmågan Linjär regression Enkel regression Multipel regression II Studieplanering 39 8 Studieplanering Bias Confounding factors Validitet och reliabilitet Studiedesign Fall-kontrollstudie (case control study) Kohortstudie Tvärsnittsstudie (cross sectional study) Randomiserad kontrollerad studie Quasi-experimentell studie Urvalsmetoder Stickprovsstorlek III Avancerade beskrivningar 47 9 Statistiska fördelningar och tester Normalfördelning Z-transformation Samplingfördelning Konfidensintervall Z-test t-fördelningen Konfidensintervall t-test χ 2 -fördelningen Pearson s Chi Square Test Statistisk power Icke-parametriska test Mann Whitney U-test Wilcoxon signed rank test Kruskal Wallis test Variansanalys (ANOVA=Analysis Of Variance) Envägs-anova
4 12 Regression Enkel regression Multipel regression F-värde Förklarad varians R Kurvlinearitet Dummy-variabler Interaktioner Selektionsmetoder Logistisk regression Statistik med R Kom igång med R Basal matematik Förvaring av data Vektorer Factors Listor Matriser Data frames Vilken typ skall man välja? Importera data Vektoroperationer Frekvenstabell Grafisk presentation Scatter plot Histogram Stapeldiagram Cirkeldiagram Box plot Inferensstatistik Normalfördelningen t-fördelningen χ 2 -fördelningen Odds ratio Regression ANOVA Icke-parametriska test Mann Whitney U-test Kruskal Wallis test Wilcoxon signed rank test Metodväljaren Konfidensintervall
5 Kapitel 1 Introduktion Det finns ett stort antal olika matematiska parametrar för att presentera ett datamaterial eller ett resultat. Ett första steg är att lära sig alla beteckningar för att översiktligt kunna förstå det författaren vill förmedla. Man skall dock vara medveten om att det krävs mer än så ifall målet är att kunna fatta avgörande beslut baserade på den tolkning man gjort av vetenskapliga rapporter. Den kritiska granskningen av en studie består av många olika komponenter. Hit hör t.ex. att betänka tidskriftens renommé och fundera över vilka intressen de som finansierat studien har. Den typen av överväganden lämnar jag till andra att redogöra för och övergår nu till att helt fokusera på den del av granskningen som kräver kunskaper i matematisk statistik. För att kunna tolka en parameter måste man alltid fundera mycket bredare än att bara betänka parameterns värde. I ett sammanhang kan ett värde vara ett häpnadsväckande genombrott medan samma värde i ett annat sammanhang helt saknar betydelse. Ibland kan tolkningen av en parameter vara helt meningslös om inte värden på vissa andra parametrar är angivna. Det finns en sak som jag med säkerhet kan påstå: den som inte förstår detta kommer garanterat att bli lurad av många tveksamma forskningsresultat genom sin karriär. Forskare vill såklart presentera banbrytande resultat och många kommer medvetet eller omedvetet att utnyttja de kunskapsluckor som finns hos läsarna (och kanske även hos författaren själv). Observera att det inte handlar om felaktiga beräkningar eller påhittade resultat! Det är oftast helt korrekta siffror där det enda som saknas är rätt sammanhang för att rättfärdiga de rubriker som rapporten sedan fått. Nu ska jag göra ett försök att gå igenom de matematiska begrepp man kan mötas av i olika rapporter. Jag ska förklara hur de betecknas, vad de egentligen beskriver och hur de skall tolkas i olika sammanhang. Dessutom vill jag ge er de grundläggande verktyg som krävs för att ni själva skall kunna utföra en analys och presentera resultatet på ett lämpligt sätt. Observera att samtliga exempel består av fiktiva data som inte har någon koppling till verkliga studier. Syftet med dessa exempel är uteslutande att presentera matematiska metoder och olika tolkningar. De kliniska resultaten är därför inte verklighetsbaserade. 1.1 Läsguide Denna bok består väsentligen av tre nivåer: Lathund. Bokens inledande del är en lathund som består av en tabell med vanliga begrepp och beteckningar. Denna rekommenderas inte som primär inlärningskälla. Tanken är att man under läsning av en vetenskaplig artikel skall kunna titta i lathunden för att få en grov uppfattning om vad en term eller beteckning betyder. Här finns också referenser till de avsnitt där begreppen förklaras mer ingående. Beskrivningar. I denna del finns grundliga beskrivningar av viktiga begrepp inom matematisk statistik. Tanken är att dessa kunskaper skall vara tillräckliga för att ni ska kunna tolka majoriteten av de statistiska resonemang som förekommer i medicinska rapporter. Fokus ligger på tolkning av resultat och uträkningarna är därför oftast utelämnade. Förhoppningen är att ni med denna del skall förstå resultaten och kunna göra en kritisk granskning för att avslöja rubriker som blivit alldeles för stora i förhållande till de faktiska resultaten. 4
6 Avancerade beskrivningar. Denna del är betydligt mer djupgående. Den riktas främst till dig som skall utföra en egen analys och därmed behöver förstå den matematiska bakgrunden. I denna del finns även uträkningarna till majoriteten av de exempel som presenteras i den föregående delen (där fokus låg på att tolka resultatet). I appendix finns även en metodväljare som hjälper dig att välja rätt metod/test för just din studies frågeställning, härifrån hänvisas sedan till lämpligt avsnitt i avancerade beskrivningar. Utöver detta ingår även ett kapitel om statistik med R. Detta är en gratis statistisk mjukvara som hjälper dig att göra beräkningarna på datorn. För alla exempel som löses manuellt finns även en referens till avsnittet om R där jag visar hur man enkelt kan göra beräkningen och tolka resultatet i R. Jag förutsätter inga förkunskaper och kapitlet inleds med en beskrivning om hur man kommer igång mer R. Om målet bara är att kunna förstå andras forskning så är inte denna del nödvändig, men självklart kan den särskilt intresserade läsaren förhoppningsvis få många aha-upplevelser här. 5
7 Kapitel 2 Lathund I denna del finns kortfattade förklaringar till vanliga statistiska begrepp. Samtliga kommer att förklaras ingående i kommande kapitel, jag rekommenderar därför inte denna del för läsning där man faktiskt vill lära sig begreppens innebörd. Dock kan den vara användbar som repetition eller vid läsning av vetenskapliga artiklar där man vill bilda sig en snabb uppfattning om vad det man nyss läste egentligen betyder. Begreppen är sorterade i bokstavsordning på engelska (eftersom de flesta artiklar är skrivna på detta spårk). Engelskt namn Svenskt namn Beteckning Beskrivning Läs mer Confidence interval Konfidensinterval CI Man har fått ett resultat i ett stickprov. Konfidenintervallet beskriver det intervall inom vilket hela populationens motsvarande värde förväntas ligga. Vanligtvis är konfidensgraden 95 %, vilket innebär att populationens värde ligger inom konfidensintervallet med 95 %-ig sannolikhet. 6.7 Correlation coefficient Korrelationskoefficient r, ρ Beskriver sambandet mellan 2 parametrar i ett stickprov. Varierar mellan -1 och 1. Om korrelationskoefficienten är 0 så finns inget samband. 1 är ett perfekt positivt samband och -1 är ett perfekt negativt samband (om en parameter ökar så minskar den andra) Mean (population) Populationsmedelvärde µ Medelvärde hos en hel opulation Mean (sample) Stickprovsmedelvärde m, x Medelvärde i ett stickprov Median Median Det mellersta värdet ifall alla värden rangordnas Mode Typvärde Det värde som förekommer flest gånger
8 distribu- Normal tion Normalfördelning Fördelningsmönster som många variabler följer (åtminstone approximativt). Detta innebär att majoriteten av alla individer befinner sig nära medelvärdet och att ett värde blir mindre sannolikt desto längre ifrån medelvärdet man befinner sig. Värden som är lägre än medelvärdet är dessutom lika sannolika som värden lika långt över medelvärdet. I en normalfördelad population så befinner sig ungefär 68 % av individerna inom ±1 SD (standardavvikelse), 95 % inom ±2 SD och 99,7 % inom ±3 SD 6.3.1, 9.1 Odds odds O 4.3 Odds ratio Oddskvot OR Oddset för något i en grupp relativt oddset i en annan grupp. Population size Populationsstolek N En population beskriver alla individer i en viss grupp. Individer behöver inte nödvändigtvis vara människor. En population kan t.ex. vara alla svenskar över 50 år eller alla tabletter som producerades av ett specifikt läkemedel under ett år. Ofta undersöker man ett stickprov (bara några av individerna), men syftet är att dra slutsatser om hela populationen Power Power Beskriver styrkan hos ett statisktiskt test. Hur stor är sannolikheten att testet skulle klara av att bevisa en viss skillnad mellan olika grupper? Probability Sannolikhet p inträffar , 9.4 P-value P-värde p Sannolikheten att en skillnad mellan grupper i ett stickprov endast beror på slumpen. Förutsatt att ingen skillnad finns i hela populationen, hur stor är sannolikheten att då få minst den skillnaden som vårt stickprov visat. Ett litet p-värde tyder på att det finns en verklig skillnad mellan grupperna, MEN det säger ingenting om skillnadens storlek eller kliniska relevans
9 Relative risk Relativ risk RR Sannolikheten för något i en grupp relativt sannolikheten i en annan grupp Sample size Stickprovsstorlek n Antal individer i ett stickprov. 6 Standard deviation (population) Standard deviation (sample) Standardavvikelse σ Ett mått på spridningen i en population Standardavvikelse s Ett mått på spridningen i ett stickprov t test t-test Vanligt statistiskt test för att avgöra om det finns en signifikant skillnad mellan 2 grupper Variance varians σ 2, s 2 Ett spridningsmått som motsvarar standardavvikelsen i kvadrat , 6.5 Tabell 2.1 8
10 Del I Beskrivningar 9
11 Kapitel 3 Begrepp 3.1 Kvalitativa och kvantitativa variabler Variabler som antar numeriska värden, dvs kan beskrivas med siffror, kallas kvantitativa, vilket exempelvis kan vara ålder och längd. Övriga, icke-numeriska, variabler såsom kön och favoritfärg, kallas för kvalitativa. I analyser brukar dessa dock kodas till numeriska värden. Exempel på detta är att kvinnor kan representeras av en etta och män med en nolla. Det sistnämnda är även exempel på en dikotom variabel, vilket är ett specialfall där variabeln endast kan anta två värden. Kvantitativa variabler kan även klassindelas och då framstå som kvalitativa. Man kan t.ex. indela olika åldrar i grupperna barn, tonåringar, unga vuxna, medelålders och äldre. En annan indelning är den mellan diskreta och kontinuerliga variabler. En diskret variablel kan anta ett ändligt antal olika värden, detta omfattar i princip alla kvalitativa variabler men även många kvantitativa, såsom antalet poäng på ett prov eller önskat antal barn. En kontinuerlig variabel kan i teorin anta alla möjliga tal inom ett intervall. En människas längd kan t.ex. ses som en kontinuerlig variabel, bara mätningens noggrannhet sätter gränsen för hur många olika värden man kan få. Låt säga att vi har en (helt otrolig) mätsticka som kan mäta längden med hundra decimalers precision, då skulle vi ha ett nästintill oändligt antal möjliga längder. Antalet önskade barn måste däremot anges i heltal och kan aldrig vara 2,555423, vilket är skillnaden som gör denna till en diskret variabel. I praktiken är dock gränsen mellan diskreta och kontinuerliga variabler lite flytande. Om en diskret variabel kan anta ett stort antal olika värden så behandlas den ofta med analysmetoder som lämpar sig för kontinuerliga variabler. Om man t.ex. ombeds att ange sin ålder i hela år så blir detta i teorin en diskret variabel men eftersom antalet möjliga åldrar spänner över ett relativt stort intervall så behandlas den i praktiken som en kontinuerlig variabel. I detta material kommer jag att behandla variabler som kan anta en sekvens om minst 10 värden inom ett intervall som kontinuerliga Mätskalor En god grund för statistisk analys av data är att känna till de olika mätskalor som finns: Nominalskala: Detta är beskrivande variabler som kan delas in i olika grupper utan rangordning. Det kan vara t.ex. kön, hemstad eller färg. Att grupperna saknar rangordning innebär att man inte kan säga att något värde är mer eller mindre än ett annat. Det är precis lika mycket bil oavsett om den är blå eller grön! För en variabel på nominalskala kan man endast beräkna ett typvärde: den vanligaste färgen på bilar på mammas gata är chockrosa". Ordinalskala: Detta är data som kan rangordnas men där skillnader eller avstånd saknar betydelse. T.ex. kan man i en enkät fråga efter en persons högsta utbildningsnivå och koda svaren med en siffra (1=förskola, 2=grundskola, 3=gymnasiet, 4= högskola/universitet). Då kan man säga att en fyra innebär mer utbildning än en tvåa, men man kan inte dra slutsatsen att en fyra innebär dubbelt så mycket utbildning som en tvåa. Man kan heller inte säga att skillnaden mellan tre och fyra är lika stor som skillnaden mellan ett och två. Man kan frestas att göra beräkningar såsom medelvärde på dessa parametrar men här skall man vara mycket försiktig! Att i en enkätstudie få medelvärdet 2,5 på ovanstående fråga och dra slutsatsen att medelpersonen klarat ungefär halva grundskolan är ett minst sagt förargelseväckande 10
12 beteende (i alla fall i matematikerkretsar). För en variabel på ordinalskala kan man förutom typvärde normalt endast beräkna en median. Om medianen blir 3 kan man dra slutsatsen att åtminstone hälften av alla personer i studien har utbildningsnivån gymnasium eller högre. Om man ändå vill försöka skapa ett medelvärde är det viktigt att man noggrant funderar över betydelsen av det värde man fått fram innan man drar några slutsatser. Ett exempel där man faktiskt beräknar medelvärden för variabler på en ordinalskala är snittbetygen från gymnasiet. Intervallskala: Detta är data som kan rangordnas och där avstånd har en tolkningsbar betydelse. Ett bra exempel är temperaturen i grader Celsius. 20 grader är 10 varmare än 10 och 25 är ytterligare 5 grader varmare. Avstånden har betydelse! Man skall dock fortfarande vara försiktig med multiplikation och division. Att säga att 20 grader är dubbelt så varmt som 10 är inte korrekt då nollpunkten endast är en konstruerad referens. För variabler på en intervallskala kan man beräkna typvärde, median och medelvärde: medeltemperaturen i juni var 5 grader Celsius". Kvotskala: Dessa data uppfyller kraven för intervallskala samt att det finns en absolut nollpunkt. Längden 0 cm innebär t.ex. att längden är obefintlig (jmf med temperaturen där man inte kan säga att 0 grader Celsius innebär att det inte existerar någon värme/kyla). Det betyder att du utan att skämmas inför sin examinator kan påstå att en 100 m lång kulvert är dubbelt så lång som den som uppmättes till 50 m på valfritt landsortssjukhus under din senaste utplacering. Variabler på nominal- och ordinalskala brukar tillsammans benämnas som diskreta medan de på intervalloch kvotskala kallas för kontinuerliga. 11
13 Kapitel 4 Deskriptiv statistik Deskriptiv statistik är, som namnet antyder, beskrivande satistik. När du har insamlade data så skall du, med hjälp av några olika mått, kunna beskriva för en medmänniska så att denne får en god sammanfattande uppfattning om innehållet utan att behöva läsa all data. Att förstå deskriptiv statistik och känna till vad de olika måtten innebär är mycket viktigt för förståelsen av vetenskapliga rapporter. 4.1 Centralmått Medelvärde Det aritmetriska medelvärdet är ett mycket vanligt centralmått som de flesta känner igen. Här kan det vara bra att introducera några vedertagna notationer: Antalet mätningar i en studie bruka betecknas som lilla n (antalet individer i hela populationen betecknas med stora N). Notera att individer inte nödvändigtvis refererar till människor. Det kan handla om vilken enhet som helst. t.ex. kan varje penna i ett pennskrin ses som en individ i detta sammanhang. Ett streck ovanför en variabel brukar betyda att det är ett medelvärde. Om vi gjort n mätningar där utfallen beteckans som x 1, x 2,..., x n så kommer x att motsvara medelvärdet av dessa mätningar. Man kan även använda den grekiska bokstaven µ (uttalas my) för att beteckna medelvärdet. Medelvärdet beräknas som summan av observationerna dividerat med antalet observationer, vilken matematiskt kan skrivas som: x = 1 n n i=1 x i Exempel Man har frågat 6 personer om deras skostorlek och fått svaren: {x 1, x 2, x 3, x 4, x 5, x 6 } = {36, 39, 37, 42, 42, 38}. x = ( ) = 6 = Median Medianen är den mellersta observationen ifall dessa rangordnas, vilket motsvaras av obervation (n+1)/2. Exempel Om vi rangordnar observationerna i exemplet med skostorlekar ovan så får vi {x 1, x 3, x 6, x 2, x 4, x 5 } = {36, 37, 38, 39, 42, 42}. Medianen är nu observation (n + 1)/2 = (6 + 1)/2 = 3, 5. Då detta inte är ett heltal så blir medianen medelnärdet av observation 3 och 4, i detta fall ( )/2 = 38, Typvärde Det värde som förekommer flest gånger. I exempet ovan förekommer skostorleken 42 vid 2 observationer, vilket gör 42 till studiens typvärde. (4.1) 12
14 4.2 Spridningsmått Standardavvikelse Standardavvikelsen kan grovt ses som snittet av varje invidivs avvikelse från medel. Observera dock att detta påstående inte är riktigt sant utan bara skall ses som ett sätt att i grova drag få en förståelse för vad begreppet innebär. Standardavvikelsen betecknas med den grekiska bokstaven σ (uttalas sigma) och beräknas enligt: σ x = 1 n (x i x) n 2 (4.2) i=1 Exempel Man har frågat 10 personer om deras längd som svarat: {180, 163, 161, 177, 157, 170, 167, 186, 178, 171}. Vi börjar med att beräkna medelvärdet och därefter standardavvikelsen: x = 1 ( ) = 171 (4.3) 10 1 σ x = 10 (( )2 + ( ) ( ) 2 ) 1 = 10 (92 + ( 8) 2 + ( 10) ( 14) 2 + ( 1) 2 + ( 4) ) 1 = ( ) = = 76, 8 = 8, 76 För exemplet ovan med de 10 personernas längder blir standardavvikelsen 76.8 = 8, 76. (4.4) Varians Variansen är ett mått som är mycket likt standardavvikelsen. Den beskriver helt enkelt standardavvikelsen i kvadrat. Om man tar bort roten ur från formeln för standardavvikelsen får man istället variansen. var(x) = 1 n (x i x) 2 (4.5) n i=1 Detta innebär att variansen i exemplet ovan 76,8. Det är viktigt att veta förhållandet mellan dessa mått! σ x = var(x) var(x) = σ 2 x (4.6) Vilken skall användas? Variansen är ofta ett matematiskt smidigare mått och används därför mer i beräkningar. När man skall presentera ett spridningsmått för en datamängd så brukar standardavvikelsen vara att föredra eftersom den är lättare att intuitivt tolka. Om man däremot läser en artikel där författaren valt att presentera variansen så är det bara att själv beräkna roten ur denna för att få standardavvikelsen! Kvartilavstånd När man talar om kvartiler så innebär det att data rangordnas och delas in i 4 lika stora grupper. Om man t.ex. har 20 observationer så kommer de 5 minsta värderna tillhöra grupp 1, nästa 5 grupp 2 osv. Kvartilerna är gränserna mellan dessa grupper. Första kvartilen, Q1, är den gräns under vilken 25 % av observationerna befinner sig. Andra kvartilen, Q2 = medianen, är den gräns under vilken hälften av observationerna befinner sig. Tjedje kvartilen, Q3, är den gräns under vilken 75 % av observationerna befinner sig. Kvartilavståndet är avståndet mellan första och tredje kvartilen, dvs ett intervall som innefattar hälften av observationerna. Detta kallas på engelska för IQR (inter quartile range) och används t.ex. för detektion av extremvärden. IQR = Q3 Q1 13 (4.7)
15 4.3 Sannolikhet och odds Sannolikhet och odds är besläktade begrepp som ofta förekommer i literaturen. Jag antar att de flesta läsarna redan har en relativt god uppfattning om vad sannolikhet innebär men att odds är svårare att definiera även om det är ett känt begrepp. Sannolikhet betecknas ofta p (för probability) och beskriver antalet utfall (x) med en specifik händelse, dividerat med det totala antalet utfall, n. Sannolikheten är alltid mellan 0 och 1. P (x) = x x + (n x) = x n Exempel rökande personer testas för ett visst hälsoproblem och 60 utfaller som positiva. Sannolikheten (risken) att en rökare är drabbad är då: P = 60/100 = 0, 6, dvs 60 %. (4.8) Odds anger antalet utfall med en specifik händelse dividerat med antalet utfall utan den specifika händelsen. O = x n x Exempel Vid samma exempel som ovan blir oddset: O = x/(n x) = 60/(100 60) = 60/40 = 1, 5 För att en rökare skall vara drabbad av det aktuella hälsoproblemet är alltså sannolikheten 0,6 och oddset 1,5. Författaren kan välja att presentera det som låter bäst. Man kan alltid räkna fram och tillbaka mellan sannolikhet och odds genom: P = (4.9) O O + 1 = 1, 5 = 0.6 (4.10) 2, 5 O = P 1 P = = 1.5 Vi återkommer till dessa när vi i avsnitt pratar om relativ risk och odds ratio. 4.4 Bivariat deskriptiv statistik (4.11) Hittills har vi haft en parameter vars egenskaper vi velat beskriva. Nu vill vi istället beskriva samband mellan två parametrar. Vilken metod vi använder för detta är beroende på vilken typ av variabler vi har, se avsnitt om olika mätskalor. Bägge variablerna är kontinuerliga. Här kan man presentera variablerna i ett spridningsdiagram, se avsnitt Man kan även beräkna kovarians och korrelationskoefficient. För en lite mer avancerad beskrivning kan man utföra en regressionsanalys, vilket jag återkommer till i avsnitt 7. Två diskreta variablers samband kan presenteras i en frekvenstabell, se avsnitt I specialfallet där ena variabeln är dikotom (har 2 möjliga utfall) kan odds ratio och relativ risk beräknas. Då en variabel är diskret och den andra kontinuerlig så beskrivs sambandet främst grafiskt, t.ex. med en box plot. Man kan även presentera de ovan beskrivna deskriptiva måtten (medelvärde, standardavvikelse mm) för varje grupp Kovarians Kovariansen är ett mått på hur 2 variabler samvarierar. Den beräknas som: Cov(X, Y ) = 1 n n (x i x) (y i ȳ) (4.12) i=1 Kovariansen är dock sällan ett värde som presenteras eftersom det är svårt att tolka. Värdet är beroende av de bägge variablernas enheter. 14
16 4.4.2 Korrelationskoefficient Korrelationskoefficienten betecknas ofta r (eller med den grekiska bokstaven ρ (uttalas rå)). Detta är ett betydligt vanligare sätt att presentera samvarians (korrelation) mellan 2 variabler. Det är egentligen en normering av kovariansen så att man alltid får ett värde mellan -1 och 1. Detta uppnås genom att man dividerar kovariansen med produkten av variablernas standardavvikelser: r X,Y = Cov(X, Y ) σ x σ y Hur skall värdet på korrelationskoefficienten tolkas? r = 0: Ingen korrelation mellan variablerna, de är helt oberoende av varandra. (4.13) r = 1: Det finns en perfekt positiv korrelation mellan x och y. Det betyder att alla punkter ligger på en linje och att ökande x också ger ökande y. r = 1: Perfekt negativ korrelation. Punkterna ligger på linje men om x ökar så minskar y. Korrelationskoefficienten kan även anta alla andra värden mellan -1 och 1. Desto närmare 1 (eller -1), desto starkare är sambandet mellan variablerna. Nära 0 är samvariationen liten. Varning: Korrelationskoefficienten säger bara hur stark korrelationen mellan 2 variabler är i det aktuella stickprovet. Den säger ingenting om hur starkt förhållandet mellan variablerna är i hela befolkningen. Exempel In tabell 4.1 finns data ifrån tre olika studier. Person Längd Vikt medel Person Längd IQ medel Dag Regn Glassar medel Tabell 4.1: Den första tabellen beskriver 10 personers längd och vikt. Den andra tabellen samma personers längd och IQ. Den tredje tabellen beskriver antalet regntimmar och sålda glassar i den lokala kiosken under 10 sommardagar. (a) (b) (c) Figur 4.1: Plottar av ovanstående data 15
17 Börja med att titta på plottarna och försök att gissa vad korrelationskoefficienterna kommer bli. I den första kan man ana en tendens att långa personer väger mer än korta. I den andra syns inget tydligt samband. I den tredje verkar alla punkter ligga på en linje där antalet sålda glassar minskar då regnet ökar. Vi börjar med att beräkna kovariansen för exemplet med längd och vikt: Cov(längd,vikt) = 1 ( )(77 67) + ( )(58 67) ( )(65 67) 10 = 1 ( ( 8) ( 9) ) 10 = ( ) = = 44, 1 (4.14) Standardavvikelsen för personernas längd har vi faktiskt redan beräknat i avsnitt med resultatet: σ längd = 8, 76. Motsvarande beräkning för vikten ger: σ vikt = Nu har vi allt som behövs för att beräkna korrelationskoefficienten! r(längd,vikt) = Cov(längd,vikt) 44, 1 = σ längd σ vikt 8, 76 7, 72 = 44, 1 = 0, 65 (4.15) 67, 6 Som utlovat så blev korrelationskoefficienten mellan -1 och 1! r = 0, 65 kan tolkas som ett relativt starkt positivt samband. När längden ökar så ökar även vikten, i alla fall i detta stickprov. Här vill jag passa på att exemplifiera varför korrelationskoefficienten är att föredra framför kovariansen när man presenterar data. Låt säga att personerna istället hade frågats om sin längd uttryckt i meter, då hade kovariansen istället blivit 0,44. MEN, korrelationskoefficienten hade fortfarande varit 0,65. För de övriga 2 exemplen lämnar jag beräkningarna som egen övning, för er som hellre bara vill ha svaren så kommer de här: r(längd,iq) = 0.08, dvs ett mycket svagt samband (som förmodligen blir ännu svagare om fler invidiver inkluderas). r(regn,glass) = 1, vilket innebär ett perfekt negativt samband. Desto mer det regnar desto mindre glass säljs Relativ Risk och Odds ratio I exempel och beräknades sannolikheten och oddset för att rökare skall vara drabbade av ett specifikt hälsoproblem. Men det säger ingenting om huruvida detta är relaterat till rökningen eller inte. Det kanske är exakt lika många icke-rökare som är drabbade, eller ännu fler! Relativ risk och odds ratio är 2 begrepp som är mått på skillnaden i sannolikhet respektive odds mellan 2 grupper, t.ex. rökare och icke-rökare. Relativ risk är kvoten mellan sannolikheterna hos de bägge grupperna. RR = P grupp1 P grupp2 (4.16) Exempel De 100 rökarna från tidigare exempel utgör nu grupp 1. Man har även testat 100 ickerökare för samma tillstånd, där blev utfallet att 20 var drabbade, dvs. sannolikheten för icke-rökarna är 0,2. RR = P rökare /P icke rökare = 0, 6/0, 2 = 3 Odds ratio: Är kvoten mellan oddsen i de bägge grupperna. OR = O grupp1 O grupp2 (4.17) Exempel Oddset för rökarna är som tidigare uträknat 1,5. För icke-rökarna är oddset O = 20/80 = Detta ger OR = O rökare /O icke rökare = 1.5/0.25 = 6 Oddset för att drabbas är alltså 6 gånger högre för rökarna. Den relativa risken 3 i exemplet kan tolkas som att risken att drabbas är 3 gånger högre för rökare jämfört med icke-rökare. Att motsvarande odds ratio är 6 saknar en lika intuitiv tolkning. Här kan man dock tänka sig att författaren väljer att presentera odds ratio eftersom 6 låter mer effektfullt än 3. 16
18 Varning! För att göra en ordentlig tolkning av RR (eller OR) måste man veta hur stor risken är från början. I exemplet ovan tror jag att alla kan vara eniga om att rökning verkar vara en stor riskfaktor. Men tänk er att man gjort en enorm studie om hur olika livsmedel påverkar hälsan. Man har undersökt en miljon människor som ätit kokosnötter och en miljon som inte gjort det. Där fann man att 3 personer bland kokosnötsätarna drabbats av en sjukdom som endast drabbat 1 av de andra. Sannolikheten att drabbas är alltså minimal men den relativa risken för kokosnötsätana är 3, precis som i exemplet med rökare. Tänk er kvällstidningsrubriken: "EXTRA! Stor studie visar att kokosnötter ger 3-faldigt ökad risk för syndrom Z!!". Visserligen sant, men kanske en lite uppblåst nyhet? Den alternativa rubriken "3 på miljonen drabbas av syndrom Z vid intag av kokosnötter" ogillades av chefsredaktören som vill sälja lösnummer... Här har vi nu sett 2 exempel med samma relativa risk men helt olika nyhetsvärde. Tänk på detta när ni läser om relativ risk eller odds ratio! Då sannolikheten är liten i bägge grupperna, vilket är vanligt i epidemiologiska studier, så blir RR och OR approximativt lika, för exemplet med kokosnötterna gäller: OR = = RR (4.18) I detta fall kan alltså även odds ratio tolkas som att risken att drabbas är 3 gånger högre för kokosnötsätare jämfört med andra Frekvenstabell (contingency table) Nu har vi en situation där vi frågat individer efter två diskreta variabler. T.ex. kön (man/kvinna) och vilken typ av förlossning de skulle föredra när deras barn föds (hemma, på sjukhus, planerat kejsarsnitt). Svaren kan presenteras i en frekvenstabell, vilket exemplifieras i tabell 4.2. Hemma Sjukhus Planerat kejsarsnitt Totalt Män Kvinnor Totalt Tabell 4.2: Frekvenstabell Nu kan man inspektera tabellen och skaffa sig en känsla. Jämför raderna, ser det ut att vara någon skillnad mellan mäns och kvinnors uppfattning? Om man föredrar en grafisk presentation så är stapeldiagram ett bra alternativ, se avsnitt Man kan även göra matematiska beräkningar som ger svar på huruvida det finns signifikanta skillnader, detta beskrivs närnare i avsnitt
19 Kapitel 5 Grafisk presentation av data I detta kapitel presenteras några olika grafiska framställningar av data. Det finns fler, man jag har gjort ett urval som jag tycker räcker bra som grund. Återigen blir typen av data avgörande för vilken framställning vi väljer. Repetera kapitel 3 om begrepp och mätskalor ifall detta känns oklart. 5.1 Kategorivariabler Dessa presenteras bra i form av cirkeldiagram och stapeldiagram Cirkeldiagram Ger en lättolkad översikt av förhållandet mellan olika kategorier. Tänk bara på att berätta hur många individer som totalt ingick i studien! Om studien är väldigt liten betyder det inte särskilt mycket ifall t.ex. varannan person angett ett visst svar, men detta framgår inte av cirkeldiagrammet. Figur 5.1: Cirkeldiagram. 52 Personer frågades om vilken bilfärg de föredrar Stapeldiagram Valet mellan cirkeldiagram och stapeldiagram är oftast en smaksak. Om man skulle vilja dela på data utifrån en annan kategorivariabel så kan stapeldiagrammet vara att föredra. 18
20 Figur 5.2: Stapeldiagram. 26 kvinnor och 26 män frågades om vilken bilfärg de föredrar. 5.2 Kontinuerliga variabler Nedan kommer jag att beskriva 3 sätt att grafiskt presentera kontinuerliga variabler. Histogram ger en bra bild av en variabels fördelning medan spridningsdiagram och box-plots är särskilt bra när man vill visa förhållanden mellan variabler Histogram Tänk att man vill mäta en kontinuerlig variabel, t.ex. ålder. Man frågar 100 individer och får svar som sträcker sig från 2 år till 100 år. I ett histogram delas svaren in i intervall, t.ex. åldersgrupper där varje grupp omfattar 10 år. Sedan beräknas frekvensen i varje grupp och dessa framställs sedan som staplar i ett diagram. Antalet staplar kan varieras som man själv vill. Figur 5.3: Histogram över 100 personers ålder Spridningsdiagram (scatter plot) Spridningsdiagram är bra för att få en översiktlig bild av spridningen i data. Särskilt bra är det om man mäter två kontinuerliga variabler hos samma individ och vill få en bild av eventuella samband. Låt säga att vi har mätt två kontinuerliga variabler y 1 och y 2 hos 100 personer. Först visar vi variablerna i varsitt spridningsdiagram, se figur 5.4. I dessa diagram representerar x-axeln bara ett index, t.ex. genom att deltagarna numreras från Värdet på y-axeln är variabelns uppmätta värde. 19
21 (a) Scatterplot av variabel y 1 (b) Scatterplot av variabel y 2 Figur 5.4 Detta ger oss en översiktlig bild, men är inte alltid så informativt. Nu plottar vi dem tillsammans. Varje patients värden plottas som en punkt med y 1 på x-axeln och y 2 på y-axeln. Figur 5.5 Nu ser vi att det finns ett tydligt positivt samband mellan variablerna! Box-plot (låddiagram) En box-plot är ett mycket bra val om man vill presentera en kontinuerlig variabel, särskilt om man jämföra den mellan olika grupper. Tänk er t.ex. att man har gett ett läkemedel på tre olika administrationssätt. Man mäter mängden av substansen i blodet och presenterar det i följande box-plot: 20
22 Figur 5.6: Jämförelse av substans z efter 3 olika administrationssätt (a,b,c) Hur skall man tolka lådornas utseende? Det feta strecket inne i varje låda symboliserar medianen. Lådans övre och undre kant motsavarar övre och nedre kvartilen (Q3 och Q1). Dvs. 25 % av observationerna ligger ovanför lådan, 25 % ligger nedom lådan och 50 % ligger inom lådan. Lådans längd kan betecknas IQR för interquartile range, se avsnitt De vertikala strecken utanför lådan (ibland kallade morrhår) löper fram till det minimala respektive maximala värdet, dock längst till 1,5 * IQR utanför lådan (detta är standard, men det kan ibland se annorlunda ut). Alla värden som ligger längre ifrån lådan än 1,5 * IQR betraktas som extremvärden ( outliers ), dessa markeras med en liten stjärna, ring eller annan symbol. 21
23 Kapitel 6 Inferensstatistik När man analyserar data nöjer man sig ofta inte med att dra slutsatser om sitt stickprov, målet brukar vara att säga något om hela populationen. Inferensstatistik är den gren inom statistiken där man använder ett stickprov för att dra slutsatser om en annan grupp. Tänk er att man vill göra en marknadsundersökning om svenska folkets motionsvanor genom att kartlägga hur många timmar vi dagligen ägnar åt fysisk aktivitet. Antalet individer i populationen brukar betecknas med stora N. I populationen kommer det också att finnas ett medelvärde (betecknas my, µ) och en varians (betecknas sigma i kvadrat, σ 2 ). Dessa värden är hittills okända och vår studie syftar till att säga något om dem. För att få ett 100 % säkert svar finns det bara en sak att göra, fråga alla svenskar! Men det är såklart praktiskt omöjligt och ekonomiskt ohållbart att fråga hela populationen. Det man då gör är att man frågar ett slumpmässigt utvalt stickprov och därefter försöker göra goda antaganden om hela folkets motionsvanor. I stickprovet betecknas antalet med lilla n, medelvärdet med x och variansen med s 2. Figur 6.1 ger en schematisk bild av population och stickprov. Figur Planera ditt stickprov Ej skrivet. 6.2 Statistiska fördelningar En stor del av statistiken bygger på kunskaper om statistiska fördelningar. Oavsett vilken man variabel mäter så kommer svaren att fördela sig på något sätt. Upprepade tärningskast kommer ge en fördelning där alla sex möjliga utfall förekommer likvärdigt många gånger. Frågar vi människor om längd så kommer de flesta svara runt cm medan några är betydligt kortare och andra är mycket längre. Om vi bara orkar rulla tärningen några enstaka gånger eller bara frågar några få personer på den nästintill tomma nattbussen så kan utfallen såklart bli lite hur som helst. Men uttrycket det utjämnar sig i längden stämmer väldigt bra när det handlar om statistik. Rullar vi tärningen ett stort antal gånger eller frågar 22
24 ett stort antal slumpmässigt utvalda personer om längd så kan vi vara ganska säkra på att vi skulle få en liknande fördelning om vi gjorde om samma försök. 6.3 Beteckningar och begrepp µ: Den grekiska bokstaven my betecknar populationens medelvärde. Det är ofta detta vi vill dra slutsatser om inom inferensstatistiken. σ: Den grekiska bokstaven sigma betecknar populationens standardavvikelse. Denna är oftast okänd. x: Ett streck över variabeln brukar beteckna medelvärde. Detta är stickprovets medelvärde. s betecknar stickprovets standardavvikelse. Det är mycket viktigt att hålla isär dessa begrepp. Vi använder stickprovets värden för att med inferensstatistik uppskatta populationens motsvarande värden Normalfördelning Jag kommer ge en grundlig presentation av normalfördelningen i avsnitt 9.1, men inser att den måste introduceras redan här. Många variabler i naturen följer denna specifika fördelning. I korthet innebär det att de flesta individerna i poulationen befinner sig nära medelvärdet och desto längre ifrån detta man kommer, desto färre blir antalet individer. Fördelningen är dessutom symmetrisk kring medelvärdet, vilket innebär att antalet individer som befinner sig på ett visst avstånd under medelvärdet är lika som antalet individer på samma avstånd över medelvärdet. Många av de analyser som används i följande avsnitt förutsätter att den aktuella variabeln är normalfördelad, eller åtminstone approximativt normalfördelad. Om det antagandet inte kan göras måste man ibland hitta andra sätt att analysera sina resultat. Andra fördelningar som också är viktiga för inferensstatistiken är t.ex. t-fördelningen och χ 2 -fördelningen, dessa kommer också att presenteras senare. 6.4 Stickprovsmedelvärdet Stickprovets medelvärde brukar betecknas x eller m och beräknas på samma sätt som populationens medelvärde. x = 1 n n i=1 x i Detta är också vår bästa skattning av populationens medelvärde, µ. 6.5 Stickprovsvarians I avsnitt 4.2 gick vi igenom vad varians innebär och ekvationen 4.5 beskriver hur man beräknar populationsvariansen. Nu kommer dock något som säkert kan uppfattas som lite knepigt, nämligen stickprovsvariansen. Med detta menar man att man tagit ett stickprov och vill beräkna spridningen hos detta i syfte att dra slutsatser om hela populationen. Man kan säga att stickprovsvariansen, s 2, är en skattning av populationens varians, σ 2. Det är den bästa gissningen vi kan göra! (6.1) s 2 = 1 n 1 n (x i x) 2 i=1 (6.2) Om ni jämför med formeln för populationsvariansen (ekvation 4.5) så är mycket sig likt, men man dividerar med antalet observationer minus ett istället för bara antalet observationer. Detta kan vara svårt 23
25 att intuitivt förstå men det har visat sig att detta ger en bättre uppskattning av populationsvariansen. Jag tror att vi nöjer oss med den förklaringen eftersom ambitionen med detta material inte är att göra läsarna till matematiker. Så, har ni förstått skillnaden nu? Populationsvariansen beräknas om man har data från hela den population man är intresserad av att dra slutsatser om, stickprovsvariansen beräknas om den skall verka som skattning av en större populations varians. Stickprovsstandardavvikelse Denna är precis som i populationsfallet kvadratroten ur motsvarande varians. s = s 2 (6.3) 6.6 Skattningarnas precision Nu har vi beräknat stickprovets medelvärde och varians ( x och s 2 ) och även slagit fast att dessa är våra bästa skattningar av populationens motsvarande värden (µ och σ 2 ). Då är det dags att börja använda statistik för att bedöma hur pass säkra våra skattningar är. Tänk er exemplet där vi vill undersöka svenska folkets motionsvanor. Vi vet att N är 9 miljoner (avrundat) och att vi gjort ett stickprov omfattande n individer där x och s 2 har beräknats. Hur bra skattning av µ är egentligen x? Vi börjar med att lägga matematiken åt sidan och försöker att skaffa oss en intuitiv uppfattning. Vad skulle göra dig mer eller mindre säker på gissningen att µ x? Stickprovsstorleken n. Desto större andel av befolkningen som ingått i stickprovet, desto säkrare kan vi vara på skattningen. Självklart får vi ett mer tillförlitligt medelvärde om vi frågat en miljon människor än om vi pratat med 4 personer på stan. Stickprovsvariansen s 2. Låt säga att vi frågar 100 personer och alla svarar exakt lika, då är stickprovsvariansen 0. Då kan vi känna oss mer trygga med vårt medelvärde än om vi har en enorm variation inom vårt stickprov. Om vi har fått svar som skiljer mycket från varandra så skapar det en viss oro eftersom vi kan ha haft otur och råkat inkludera några extremsportare som därmed ger en skev bild av folkets motionsvanor. Nu vill vi sätta siffror på detta för att med några få värden kunna beskriva för läsare hur vår skattning ser ut och hur säker den kan anses vara. 6.7 Konfidensintervall Ett konfidensintervall anger inom vilka gränser populationens värde kan anses ligga. Eftersom vi aldrig helt säkert kan veta något om populationen (utan att verkligen fråga alla individer) så hör alltid en konfidensgrad till varje konfidensintervall, denna är vanligen 95 %. Med konfidensintervallet påstår man alltså att med 95-procentig sannolikhet så har vi rätt när vi säger att populationens medelvärde ligger mellan a och b. För att skapa ett konfidensintervall krävs en kontinuerlig variabel (se avsnitt 3.1.1). Varning: Tänk noga på betydelsen. Ett konfidensintervall betyder inte att hela populationens medelvärde verkligen ligger mellan a och b. Säkerheten i konfidensintervallet är oftast 95 %. En gång på tjugo ligger det verkliga värdet alltså utanför konfidensintervallet. Det är ganska ofta! Om analyserar många parametrar så kommer några konfidensintervall rent statistiskt bli felaktiga. Tänk därför på att alltid ha en klinisk motivering innan man analyserar något, om man bara väljer variabler på måfå kan det sluta med att man drar många konstiga slutsatser. Detta är analogt med att man inte skall beställa omotiverat många blodprover eftersom 5 % per definition kommer hamna utanför referensintervallet. Varning 2: Ett konfidensintervall är en rent matematisk konstruktion som inte alls tar hänsyn till stickprovets kvalitet. Om det finns bias när urvalet gjordes, t.ex. om man vill dra slutsatser kring svenska folkets medel-iq och tar hela stickprovet på universitetet. Då får man snarare ett konfidensintervall för alla universitetsstudenters IQ. 24
26 Exempel Vi har mätt IQ hos 100 slumpmässigt utvalda svenskar och fått stickprovsmedelvärdet x=102. Ur detta vill vi skapa ett konfidensintervall för hela folkets medel-iq. Svaret (CI95: 99,9-104,1) kan tolkas som att svenska folkets genomsnitts-iq med 95 % sannolikhet ligger mellan 99,9 och 104,1. I kapitel 9 finns en utförlig förklaring och exempel visar uträkningen av detta fall. En annan tillämpning av konfidensintervall är att man vill undersöka skillnaden i medelvärdet av en variabel mellan 2 grupper. Exempel Låt säga att bland de 100 personer som utförde IQ-testet i föregående exempel så kunde 65 kategoriseras som unga och 35 som gamla. Medelvärdena för respektive grupp blev x 1 = 103, 2 för de gamla och x 2 = 101, 4 för de unga. Hur stor kan skillnaden mellan gruppernas medelvärden tänkas vara i hela befolkningen? Vi vill ange detta i form av ett 95-procentigt konfidensintervall och resultatet blir µ 1 µ 2 ( 3.4, +7). Vi har alltså fått ett konfidensintervall som löper från -3,4 (dvs unga har lite högre IQ) till +7 (dvs galma har högre IQ). Eftersom intervallet inkluderar noll så kan vi inte dra några slutsatser om att den ena gruppen skulle vara smartare än den andra. Vi kan bara konstatera att gamla presterade lite bättre i just detta test. Uträkningen av detta ses i exempel på sidan Hypotesprövning och p-värde Hypotesprövning är på många sätt besläktat med konfidensintervall och dessa utgör tillsammans grunden för inferensstatistiken. För att utföra en hypotesprövning krävs en nollhypotes, en mothypotes och en beslutsgräns. Nollhypotes, H 0 : µ = 0 (eller lika med något annat) Mothypotes, H 1 : H 0 är falsk. Beslutsgräns α = 0, 05 (vanligen). Vad innebär detta? Jo, vi har en hypotes om att t.ex. ett medelvärde eller en medelvärdesskillnad är noll. Vi kan aldrig veta exakt vad ett populationsmedelvärde är (utan att fråga alla), vi kommer därför aldrig kunna dra en slutsats om att ett medelvärde ÄR noll. Däremot kan vi efter ett stickprov av slumpmässigt utvalda individer säga att det är osannolikt att populationens medelvärde är noll. Läs de sista raderna igen, detta är viktigt! Även om vi frågat 100 personer och alla svarar att de skulle vilja ha 2 barn så kan vi INTE dra slutsatsen att medelvärdet av folkets barnaönskan är exakt 2. Däremot kan vi säga att det är väldigt osannolikt att medelvärdet skulle vara 7. Så funkar det även vid hypotesprövning! Vi gör ett stickprov och utifrån det avgör vi hur rimligt det är att vår nollhypotes skulle kunna vara sann. I beräkningen så vänder vi lite på resonemanget. Vi utgår ifrån att nollhypotesen är sann och frågar oss hur rimligt det skulle vara att då få vårt stickprov. Om det är orimligt så väljer vi att förkasta nollhypotesen och hävda att den inte stämmer. Om nollhypotesen säger att µ = 0 och vi i vårt stickprov får medelvärdet x = 1, 5, hur sannolikt är det egentligen att få ett värde som skiljer så mycket ifrån noll (eller mer) om nollhypotesen är sann? Detta kan beräknas för hand eller med hjälp av datorer som ger oss ett p-värde. Detta kan tolkas som sannolikheten att, av slumpen, få ett värde som avviker så mycket (eller mer) OM nollhypotesen är sann. Nu kommer vi till beslutsgränsen α, vanligen 0,05, dvs 5 %. Den betecknar risken vi tar att förkasta en nollhypotes som egentligen är sann (= typ-1-fel ). Säg att vi har en nollhypotes om att svenskar i snitt vill ha 4 barn. Vi gör ett stickprov om 100 personer och får snittet 2,1. Kan vi förkasta nollhypotesen eller inte? Vi utgår ifrån att den är sann och ställer oss frågan hur sannolikt det då är att 100 slumpmässigt utvalda personer skulle ge snittet 2,1. Datorn ger oss p=0,005. Det betyder att 5 gånger på 1000 så skulle vi faktiskt få ett så extremt resultat även om befolkningens verkliga snitt är 4. OM vi förkastar nollhypotesen och rapporterar att svenskar i genomsnitt INTE vill ha 4 barn så tar vi alltså en liten risk. Om den risken är mindre än beslutsgränsen (p < α) så är vi beredda att ta den. Man kan säga att nollhypotesen alltid spegar det odramatiska tillståndet att ingen skillnad föreligger. Målet är inte att bevisa detta, för det går inte. Målet är att om möjligt motbevisa det. Att förkasta en nollhypotes är alltså att sticka ut hakan och säga att vi funnit något som avviker. P-värdet symboliserar då risken att man drar en 25
27 spännande slutsats trots att den inte alls är sann. Om denna risk är större än α så säger man att man inte lyckats motbevisa nollhypotesen. Detta betyder absolut inte att man bevisat att nollhypotesen är sann! Osäkerhet och power När man skall utföra statistiska test finns alltid en osäkerhet och en viss risk att man drar felaktiga slutsatser, den goda forskaren är dock medveten om dessa risker och anger dem tydligt i sin rapport. Sann nollhypotes Felaktig nollhypotes Bibehållen nolhypotes Korrekt Typ-2-fel Förkastad nolhypotes Typ-1-fel Korrekt Tabell 6.1 I tabell 6.1 introduceras ett par nya begrepp. Om vi efter testet behåller en sann nollhypotes eller förkastar en felaktig så kan vi (med facit på hand) säga att testet gav ett korrekt resultat. Fallet där man råkar förkasta en egentligen sann nollhypotes kallar vi för typ-1-fel och detta har i viss mån redan berörts i det föregående avsnittet. Den risk för detta som vi är beredda att ta är α. Om risken att slumpen gett den uppmätta avvikelsen (=p-värdet) är mindre än α så förkastar vi nollhypotesen. Den motsatta situationen där nollhypotesen faktiskt är felaktig men vi inte lyckas åstadkomma nog signifikans för att anse den vara motbevisad kallas typ-2-fel. Självklart kan vi ha en reell avvikelse, men där slump och individuell variation ger att stickprovet ser tämligen normalt ut. Begreppet power, 1 β, betecknar testets styrka att påvisa avvikelser. Med andra ord: OM det finns en avvikelse, hur stor är då sannolikheten att testet hittar den? α är alltså risken för typ-1-fel och β är risken för typ-2-fel. Det finns ett mycket nära samband mellan α, β och n, något som jag kommer beskriva mycket närmare i avsnitt 9.4. Men några av de viktigaste egenskaperna är: Om man minskar risken för typ-1-fel (t.ex. genom att sänka α från 0,05 till 0,01) så ökar man risken för typ-2-fel. Man måste alltså välja vilket av felen man helst undviker i det aktuella fallet. Om man ökar stickprovsstorleken minskar man både α och β, men ökar det administrativa arbetet och kostnaderna. Därför kan man på förhand, genom att bestämma vilka risker (α, β) man är beredd att ta, beräkna hur stor stickprovsstorlek man behöver. Detta är mycket användbart! Detaljerna kring detta kommer i avsnitt 9.4. Innan vi övergår till exempel så vill jag belysa två viktiga frågor som man ofta måste ställa sig vid hypotesprövning. Ensidigt eller tvåsidigt? Parat eller oparat? Ensidigt eller tvåsidigt test? I de flesta statistiska testen måste man bestämma sig för om det skall vara ensidigt eller tvåsidigt. Valet styrs av hur mothypotesen formuleras. Som standard lyder hypoteserna: H 0 : x = 0 H 1 : x 0 Där x t.ex. kan vara ett medelvärde eller en skillnad mellan gruppers medelvärden. Här skall ett tvåsidigt test utföras! Men låt säga att vi istället skriver: H 0 : x = 0 H 1 : x > 0 Notera att mothypotesen nu säger större än istället för skilt från. Skillnaden är att vi i detta fall har en tydlig uppfattning om hur skillnaden ser ut OM det finns en skillnad. Möjligheten att x < 0 har kliniskt bedömts som osannolik och därför utför vi ett ensidigt test. 26
28 Exempel Vi har gjort IQ-test och vill jämföra norrlänningar och skåningar. Vår nollhypotes är att det inte finns någon skillnad på populationsnivå. Men OM det faktiskt skulle finnas en skillnad så kan vi inte säkert säga vilken av grupperna som skulle vara den signifikant smartare. Då gör vi ett tvåsidigt test. Nollhypotesen kan förkastas åt bägge hållen. Exempel Vi har gjort en undersökning om vilka som åker mest till Danmark av norrlänningar och skåningar. Nollhypotesen är att bägge grupperna åker lika ofta. Vår bedömning är dock att OM det finns en skillnad så är det skåningarna som åker oftare. Att norrlänningar i snitt skulle åka mer till Danmark än skåningar är ett osannolikt utfall som vi inte ens vill testa för. Då gör vi ett ensidigt test Parat eller oparat test? Om man vill jämföra resultaten i två utfallsgrupper så måste man avgöra ifall testet skall vara parat eller oparat. Om det är oberoende observationer så skall testet vara oparat. Vid beroende, parade observationer (t.ex. före och efter), så skall ett parat test utföras. Exempel vi vill jämföra om det finns en skillnad i hur mycket män och kvinnor rökar. Alla personers svar är oberoende av varandra, därför utför vi ett oparat test. Exempel Vi vill undersöka effekten av läkemedel på människors vikt. Vi väger därför alla personer två gånger, varav en gång innan läkemedelsintag och en gång efter. Nu har alla individer två resultat och vi vill bestämma om läkemedlet har en signifikant effekt på populationsnivå. Mätresultaten utgörs alltså av par. Då utförs ett parat test. Exempel på hypotesprövning Exempel Vi har kunskaper om att längden hos friska individer är normalfördelad med ett medelvärde på 175 cm och standardavvikelse 10 cm (OBS! Fiktiva siffror). En man på kliniken mäter 215 cm och vi frågar oss om det kan tyda på en tillväxtrubbning. H 0 : Det tillhör normal individuell variation att bli så lång. H 1 : Personen är längre än normalt pga en tillväxtrubbning. Ensidigt test! Beslutsgränen bestäms som 0,01. Vi vill inte använda 0,05 eftersom det inte är acceptabelt att felaktigt diagnostisera var tjugonde patient som tillväxtrubbad. Utfallet av hypotesprövningen blir p = 0, 00003, vilket är mindre än α = 0, 01. Vi kan därför förkasta nollhypotesen och hävda att mannen har en tillväxtrubbning. Men notera att tre personer av hundratusen faktiskt blir så långa helt utan rubbning. Så helt säkra på att han är sjuk kan vi inte vara. Se exempel på sidan om du är nyfiken på beräkningen! Exempel Forskaren Svante Pipette är övertygad om att befolkningens medellängd är kortare än 178 cm, han slår vad med en kollega och de formulerar förutsättningarna för ett test: H 0 : Medellängden är 178 cm H 1 : Medelängden är kortare (ensidigt test). Beslutsnivå α = 0, 05 För att bevisa sin tes frågar han 14 slumpmässigt utvalda personer. Efter gedigna analyser fås p-värdet 0,033. Hur tolkar ni detta? Jo, eftersom p < α så anser vi att sannolikheten att slumpen gett detta resultat vid en sann nollhypotes är så liten att vi väljer att förkasta nollhypotesen. Slutsatsen blir att populationens medellängd är signifikant lägre än 178 cm. Svante jublar och blir bjuden på lunch. Se hela uträkningen i exempel på sidan 62. En lösning med R finns också tillgänglig på sidan 103. Den vanligaste medicinska tillämpningen av hypotesprövning rör dock inte enskilda individer. Oftast vill man testa ifall det finns en signifikant skillnad mellan medelvärdet i olika grupper. Har rökare i snitt ett annat resultat på blodprov X än icke-rökare? Mår individer som fått läkemedel i snitt bättre än de som fått placebo? Ni fattar, detta användas ofta! 27
29 Exempel Vetenskapskvinnan Kajsa Kvark har en teori om att kärnkraftolyckor påverkar barns tillväxthormoner (på förhand har hon dock ingen säker uppfattning om huruvida det skulle ge ökad eller minskad tillväxt). Nollhypotes, H 0 : µ population µ olycka = 0. Mothypotes, H 1 : µ population µ olycka. Tvåsidigt test! Beslutsgräns α = 0, 05. Man har långt efter en olycka gjort mätningar på 50, numera vuxna individer, som i barndomen exponerades. Medellängden i denna grupp blev x = 169 cm. Man vet att hela befolkningens medelvärde är 175 cm och standardavvikelsen är 10. Utfallet för analysen blir p = 0, Eftersom detta understiger vår beslutsgräns kan vi slå fast att denna grupps längd med stor sannolikhet skiljer sig från populationens (om det beror på kärnkraftolyckan eller på något annat kan inte statistiken besvara, det får forskaren fundera vidare på). Uträkningen finner den vetgirige läsaren i exempel på sidan 57. Exempel Läkaren Rebecka Röök vill undersöka huruvida rökares värden skiljer från icke-rökares vad gäller en specifik inflammationsmarkör. H 0 : Ingen skillnad mellan gruppernas medelvärden µ 1 = µ 2 H 1 : µ 1 µ 2 (tvåsidigt test) Beslutsgräns α = 0.05 Hon tar ett blodprov på 70 patienter, varav 40 är rökare. Bland rökarna finner hon ett medelvärdet 714 på inflammationsmarkören, medan icke-rökarnas prover i genomsnitt resulterar i 685. Det är dock en ganska stor individuell variation mellan individerna. Hon utför ett statistiskt test och får p=0.33. Hur tolkar ni detta? 1. p > 0.05, nollhypotesen kan inte förkastas. 2. Skillnaden mellan gruppernas medelvärden är ändå ganska stor, runt 5 %. 3. Den stora individuella variationen gör dock att testets power blir lägre vilket resulterar i ett ickesignifikant resultat. 4. Man kan säga att hon funnit en intressant indikation på att rökare har högre värden, men det behövs ett större stickprov innan hon kan dra några slutsatser om att detta skulle gälla generellt. 5. Att nollhypotesen inte kan förkastas betyder absolut INTE att hon har bevisat att gruppernas medelvärde är lika. Vi vet fortfarande inte om nollhypotesen är sann, bara att den inte kan förkastas! Uträkningen av detta problem finner ni i exempel på sidan 63 och även med R i exempel på sidan 104. Exempel Allmänläkaren Bengt Bar föredrar att ta blodtryck stående istället för liggande. Han är dock lite fundersam och undrar om han skulle utföra ett systematiskt fel ifall han ändrade rutin. Han mäter därför blodtrycket både liggande och stående för 10 patienter och noterar det systoliska blodtrycket vid varje mätning. H 0 : Det finns ingen skillnad mellan liggande och sittande systoliskt blodtryck. µ 1 µ 2 = 0 H 1 : Det finns en skillnad, µ 1 µ 2 0 (tvåsidigt test). Beslutsgräns α = 0.05 Han utför nu ett parat test och får p-värdet Hur tolkar vi detta? 1. p-värdet är aningen för stort för att vi skall kunna förkasta nollhypotesen. 2. Men ett p-värde som är så pass lågt i en studie med bara 10 personer än ändå lite anmärkningsvärt. Vi har ett test med låg power som ändå är nästan ger ett signifikant resultat. 28
30 3. Det är troligt att det faktisk finns en skillnad men att den inte kunde bevisas i denna studie. Uträkningen av detta problem finner ni i exempel på sidan 64 och även isom R-lösning i exempel på sidan 104. Hittills har alla exemplen berört kontinuerliga variabler och huruvida medelvärdet av dessa är lika i olika grupper. Men man kan även utföra hypotesprövningar för kategorivariabler och frekvenser av grupptillhörigheter. Exempel En landstingsmedarbetare söker svar på vilka administrationssätt patienterna egentligen föredrar när det handlar om läkemedel. Tablett? Drickbar lösning? Injektion? Stolpiller? Ska man verkligen köpa in lika många av varje (för de läkemedel som finns i dessa former) eller har patienterna tydliga preferenser? Man formulerar sina hypoteser och frågar därefter 100 slumpmässigt utvalda patienter. H 0 : Alla former är lika populära. H 1 : Det finns skillnader, alla är inte lika populära. Beslutsgräns α = 0.05 Svaren utfaller som: Stolpiller Injektion Tablett Oral lösning Tabell 6.2: Preferenser för läkemedelsadministration Beräkningarna som följer ger p=0,31. Vi kan alltså inte förkasta nollhypotesen. Vi kan inte säga att alla administrationssätt är lika populära men vi har heller inte lyckats motbevisa det. Uträkningen av detta problem finns i exempel på sidan Exempel Låt säga att vi vill jobba vidare med föregående exempel och frågar oss om det finns någon attitydsskillnad mellan män och kvinnor vad gäller läkemedelsadministration. Om svaren fördelas mellan könen fås en tvådimensionell frekvenstabell: Stolpiller Injektion Tablett Oral lösning Totalt Kvinnor Män Totalt Tabell 6.3 Våra hypoteser lyder: H 0 : Det finns ingen skillnad mellan könens attityder. H 1 : Det finns en skillnad. Beslutsgräns α = 0.05 Efterföljande beräkningar ger p=0,03. Hur skall detta tolkas? Eftersom p-värdet understiger beslutsgränsen så förkastar vi nollhypotesen. Sannolikheten att de skillnader som uppmätts endast beror på slumpen är så låg att vi tror att det faktiskt finns en skillnad. Hur skillnaden ser ut kan vi dock inte säga någonting om utifrån detta test. Dock kan man säkert få en god uppfattning bara genom att titta i frekvenstabellen. 29
31 P-värdets svagheter Nu till några exempel som belyser p-värdets svagheter: Exempel Ett företag har tagit fram ett medel, som enligt egen utsago är revolutionerande då det höjer människors kognitiva förmåga. Eftersom det är ett kapitalstarkt bolag har man finansierat en enorm dubbelblind studie där en miljon människor fått BrainBoosterPlus och en miljon har fått placebo. Testet består av 1000 uppgifter som vardera kan ge en poäng. Vid så stora studier kan man säga att effekten av individuella variationer blir liten. Medelvärdet i de bägge grupperna blev x BrainBoosterP lus = 756 och x placebo = 755 med p = Företaget prestenterar under storslagna omständigheter sitt resultat: Det är högsignifikant bevisat att BrainBoosterPlus förbättrar människor kognitiva prestationer!. Har de ljugit? Nej! Det är faktisk med stor sannoliket så att preparatet höjer prestationsförmågan. Men under festligheterna råkade företagets VD glömma att meddela hur mycket prestationsförmågan höjs. Notera att medelvärdet endast skiljer med en enda poäng mellan grupperna! Skulle du betala tusentals kronor och riskera ännu icke upptäckta biverkningar för något som förväntas höja ditt resultat från 755 till 756? Troligen inte. Så, titta alltid på skillnaderna mellan medelvärderna innan ni bemödar er med att dra några slutsatser utifrån p-värdet. Är inte medelvärdesskillnaden kliniskt relevant så är inte heller skillnaden mellan grupperna det, oavsett p-värde. Men jag kan lova att många artikelförfattare valt att lägga tyngd på p-värden trots att de uppmätta skillnaderna i praktiken är helt försumbara. Exempel Säg att man bara testat 100 personer och fått m BrainBoosterP lus = 856 och m placebo = 755 med p = Då hade vi haft en kliniskt relevant medelvärdesskillnad (m BrainBoosterP lus m placebo = 101) och dessutom kunnat konstatera att p-värdet är litet. Detta vore ett fantastiskt resultat för företaget (och mänskligheten?). Det finns förvisso en liten risk (0, 007 = 0, 7%) att resultatet är en slump, men det finns också en stor möjlighet att preparatet gör en betydande skillnad! Så, samma p-värde men väldigt mycket mer intressant. Exempel Om man istället bara testat 10 personer och fått m BrainBoosterP lus = 856 och m placebo = 711 med p = 0, 27. Då hade vi först noterat en intressant medelvärdesskillnad men sedan sett att p = 0, 27, dvs sannolikheten att slumpen gett denna skillnad är stor. Notera dock att detta IN- TE betyder att prepratet är verkningslöst. Skillnaden kan fortfarande bero på preparatet, men studien är för liten för att man skall kunna dra en sådan slutsats. Detta resultat skulle kunna kommenteras med vi har funnit en intressant skillnad, men vi behöver göra fler studier eftersom den inte är statistiskt säkerställd. Vad vill jag säga med dessa tre exempel? Jo, att p-värden alltid måste betraktas i kombination med andra parametrar. P-värdet är beroende av hur många individer som avviker och hur mycket de avviker. Ett litet värde kan alltså bero på: 1. En liten avvikelse hos ett stort antal individer, det sker knappast av en slump men behöver inte heller vara det minsta kliniskt relevant. 2. En stor avvikelse hos några få. Är studien verkligen korrekt utförd? Detta leder till ett par varningar: Varning: P-värdet ger oss sannolikheten för att en uppmätt avvikelse helt varit slumpens verk. Det säger egentligen ingenting om hur stor skillnaden är. Läs de senaste meningarna igen! Ett litet p-värde ger oss rätten att dra slutsatsen att det finns en skillnad, men säger ensamt ingenting om skillnadens storlek eller kliniska relevans. Varning: Ett stort p-värde betyder inte nödvändigtvis att det inte finns något skillnad. Det betyder bara att vi inte lyckats bevisa det, vilken i sin tur kan bero på att vi gjorde ett för litet stickprov. 6.9 Prediktion I infernsstatistiken så drog vi slutsatser om populationen utifrån ett stickprov. När vi talar om prediktion så gör vi nästan tvärtom. Genom att vi vet hur det ser ut i en population (eller ett stickprov) så försöker vi dra slutsatser om en enskild individ. Ofta handlar det om att vi vet något om individer och med hjälp av kunskaper om populationen vill dra slutsatser om en annan parameter. 30
32 Exempel Du har ett barn där du vet kön samt bägge föräldrarnas längd. Utifrån detta vill du ge en uppskattning hur lång hen kommer bli i vuxen ålder Klassificering Klassificering är vanligt inom medicin. Det kan handla om att man mäter en kontinuerlig parameter men skall fatta ett dikotomt beslut. Exempel Du mäter värdet av en substans i blodet och målet är att fatta ett beslut (sjuk eller inte sjuk). Det finns alltså ett gränsvärde över vilket du väljer om att ställa diagnosen. Exempel Du frågar patienter om hur mycket alkohol de dricker. Även här kan du göra en dikotom klassificering: riskbruk eller inte riskbruk. En hundraprocentig klassificering skulle innebära att alla som klassificeras som sjuka är sjuka och de som klassificeras som friska är friska. Dvs du kan ta ett blodprov och sedan ge ett säkert besked. Så är det sällan är verkligheten! Individer är olika och det påverkar vår möjlighet att kategorisera. Människor som genom blodprovet klassificerats som sjuka kommer ibland, efter annan mer påkostad utredning, visa sig vara friska och tvärtom Klassifikationstabeller I forskning där man försöker hitta nya tester och diagnoskriterier mäter man ofta den parameter man är intresserad av samt utför en annan, säker, undersökning. För att fortsätta på exemplet med ett blodprov så skulle detta innebära att man dels mätt den intressanta substansen i blodet, men även gjort en annan undersökning (t.ex. röntgen) så att man med stor säkerhet har ett facit på om individen är frisk eller sjuk. Man kan därefter sätta ett gränsvärde på blodpropvet, över vilket individen skall klassificeras som sjuk. Individers klassifikation (enligt blodprovet) och observerade tillstånd (röntgenundersökningen) jämförs i en tabell. Exempel på detta ses i tablell 6.4. Verifierat Klassificerat Sjuk Frisk Totalt Sjuk Frisk Totalt Tabell 6.4: Klassifikationstabell Hur skall denna tabell tolkas? 100 personer ingick i studien 40 personer klassificerades som sjuka, av dessa visade sig 28 faktisk vara det medan 12 egentligen var friska. 60 personer klassificerades som friska. Av dem var 46 korrekt klassificerade medan 14 faktiskt var sjuka vid den säkrare röntgenundersökningen Mått på klassificeringsförmågan Ur klassifikationstabellen vill vi beräkna ett antal mått som berättar för oss om hur bra vårt test lyckats klassificera individerna. Vi ritar återigen upp tabellen, men med ett något mer generellt innehåll: 31
33 Verifierat Klassificerat Sjuk Frisk Totalt Sjuk a b a+b Frisk c d c+d Totalt a+c b+d a+b+c+d Tabell 6.5: Klassifikationstabell Vi kan börja med att konstatera att a och d är korrekta klassificeringar, medan b och c är felaktiga. Detta ger: Andel korrekta klassificeringar = a+d a+b+c+d Två mycket vanliga begrepp inom medicinsk forskning är sensitivitet och specificitet. a a+c Sensitivitet = Detta beskriver hur stor andel av de som verkligen är sjuka som testet lyckats klassificera korrekt. Dvs, hur bra är testet på att hitta dem som faktiskt är sjuka? d b+d Specificitet = Detta innebär den andel av dem som faktiskt är friska som också klassificeras som friska. Det beskriver hur hur bra testet är på att INTE märka ut friska personer som sjuka. Utöver dessa kan man även beräkna positivt och negativt prediktivt värde: a a+b PPV = Detta beskriver hur stor andel av dem som vi klassificerar som sjuka som faktiskt är det. d c+d NPV = Beskriver hur stor andel av de som testet klassificerar som friska som faktiskt är det. Hur blir det då för vårt exempel i avsnitt ? Sensitivitet: 28/42=0,67 och specificitet: 46/58=0,79. Beräkning av övriga mått lämnar jag som egen övning. Varning: Nu har det blivit dags att återigen föra fram en klassisk fallgrop i ljuset. Man kan aldrig göra en tolkning av sensitiviteten utan att veta specificiteten, eller tvärtom! Dessa är ett par och skall också presenteras som ett par (detsamma gäller PPV och NPV). För kom ihåg att klassificeringen delvis är beroende av att vi själva bestämt ett gränsvärde över vilket man skall klassificeras som sjuk. Tänk er att gränsvärdet i exemplet med blodprovet var att man skall hitta > 1000 bakterier för att bedömas som sjuk och att detta gav klassifikationstabellen 6.4. Låt säga att vi istället skulle ha sagt att det räcker med att hitta 10 bakterier för att klassificeras som sjuk, då skulle exakt samma prover istället kunna ge tabell 6.6 där sensitiviteten är 100 % men specificiteten bara är 3 %. Verifierat Klassificerat Sjuk Frisk Totalt Sjuk Frisk Totalt Tabell 6.6: Klassifikationstabell Om denna forskare då bara angav specificiteten så skulle rubriken kunna bli: Nytt blodprov kan med 100 % sensitivitet upptäcka cancer. Det är förvisso sant, men ärligt talat så kommer nästan alla friska människor också få en cancer-diagnos om detta test användes, men det vet vi ju inte ifall specificiteten aldrig anges! På samma sätt kan man sätta ett alldeles för högt gränsvärde och få en god specificitet, men då på bekostnad av sensitiviteten. 32
34 Receiver Operating Characteristics (ROC) Vill man kunna ge ett enda värde på hur bra ett test är på att diskriminera mellan 2 grupper (t.ex. sjuk och frisk) så kan man använda ROC. Som jag beskrev i ovanstånde varning så kommer sensitivitet och specificitet att variera när man ändrar gränsvärdet. Låt säga att man gör en tabell där man skriver ner sensitiviteten och specificiteten för många olika gränsvärden. Dessa kan sedan plottas med (1-specificiteten) på x-axeln och sensitiviteten på y-axeln. Figur 6.2 är ett exempel på detta.. Figur 6.2: ROC-kurva. I bilden har man vänt på x-axelns skala istället för att plotta 1-specificiteten Genom att beräkna arean under denna kurva (AUC = Area Under Curve) får man en bra bild av testets kapacitet att klassificera: AU C = 0.5: Ingen klassificeringsförmåga alla. Lika bra som att singla slant. 0, 5 < AUC < 0.7: Dåligt. 0, 7 < AUC < 0.8: Acceptabelt. 0, 8 < AUC < 0.9: Bra. AUC > 0.9: Utmärkt. Varning: Tänk på att även detta värde bör presenteras med ett konfidensintervall. Testet är kanske utfört på bara några få personer och har råkat gissa rätt på dessa. Då blir alla klassifikationsmått höga men ett eventuellt konfidensintervall stort. 33
35 Kapitel 7 Linjär regression 7.1 Enkel regression Som vi lärde oss i avsittet om korrelationskoefficeient så innebär ett perfekt samband (r=1 eller -1) att alla punkterna ligger på en linje ifall man skulle göra ett spridningsdiagram. Om korrelationen däremot inte är perfekt så är det omöjligt att dra en rät linje som passerar alla punkter. Då kan man använda linjär regression, vilket innebär att bästa möjliga linje anpassas till mätpunkterna. Exempel personer har angivit längd och vikt enligt tabell 7.1. Längd Vikt Medel Tabell 7.1 Vi gör ett spridningsdiagram av detta, se figur 7.1a. Ser det ut att finnas ett samband? Ja! Går det att dra en rät linje genom alla punkter? Nej! Om vi skulle beräkna korrelationskoefficienten så skulle den bli 0,67. Nu kan vi låta datorn anpassa en regressionslinje, se figur 7.1b. Detta linje är framräknad som den som minimerar summan av punkternas avstånd till linjen (eller rättare sagt summan av deras kvadrerade avstånd). Nu tittar vi på en datorutskrift över linjens egenskaper. 34
36 (a) (b) Figur 7.1 Figur 7.2 Detta kan vid en första anblick se krångligt ut, men jag skall gå igenom valda delar och hjälpa er att fokusera på det som är viktigt. Allra först måste vi repetera räta linjens ekvation: y = a + bx a är interceptet, dvs värdetpå y där linjen skär x-axeln (x=0). b kallas för regressionskoefficienten och beskriver lutningen på linjen. Om x ökar med en enhet så ökar y med b enheter. Så till utskriften. Där kan ni se att interceptet är -30,9 och regressionskoefficienten 0,57. Linjens ekvation lyder alltså: vikt = 30, 9 + 0, 57 längd (7.2) I utskriften finns ett värde till som är värt att kommentera i nuläget. Längst till höger i raden för längden står: *. Det är p-värdet för antagandet att vikten är oberoende av längden. Vad skulle regressionskoefficienten bli om vi har 2 helt okorrelerade variabler? Noll! Regressionslinjen skulle bli vågrät, 35 (7.1)
37 vilket innebär att lutningskoefficienten b skulle vara 0. Vi har nu nollhypotesen att vikt och längd (i hela populationen) är okorrelerade, dvs om vi anpassade en linje till hela folkets värden skulle koefficienten b bli noll. Vi har gjort ett stickprov på 10 personer och då fått b = 0, 57. P-värdet för att detta skett av en slump om det sanna värdet är 0 visar sig vara 0,03. På beslutsnivån 5 % kan vi alltså förkasta och slå fast att det med stor sannolikhet finns ett samband mellan längd och vikt. Hur kan detta användas mer än i syfte att vi slagit fast att det finns ett signifikant samband? Jo, vi kan använda linjen för att predicera andra människors längd. Låt att säga att det hade varit en jättedyr och jobbig undersökning och väga patienter. Dessutom får vi tänka oss att det utifrån skulle vara omöjligt att uppskatta vikt (dvs att man inte skulle kunna titta på personen och få en grov uppskattning). Vår allra bästa gissning kring någons vikt skulle då vara att chansa på medelvikten i befolkningen. Nu har dock en forskare gjord en studie enligt ovanstånde exempel och längd råkar vara mycket lätt att mäta. Vi vet att patienten mäter 155 cm. Då kan vi använda vår regression: vikt = 30, 9 + 0, 57 längd = 30, 9 + 0, = 57, 5 (7.3) Detta blir såklart inte alltid rätt, men det är en betydligt bättre gissning än att chansa på befolkningens medelvärde! 7.2 Multipel regression Multipel regression innebär att vi har flera oberoende variabler (även kallade prediktorer) och vill undersöka hur dessa tillsammans påverkar en parameter. Exempel Vi har 3 parametrar hos människor: antal motionstimmar varje vecka, antal cigaretter dagligen samt en egen uppskattad livskvalitet (1-10). Vi vill veta hur detta påverkade deras livslängd (datta var en långtidsstudie där alla deltagare nu är avlidna, vi har alltså facit på hur länge just de levde). Hur skall vi hantera detta? Man skulle kunna göra 3 separata enkla regressionsmodeller och få svaren: 1. Såhär är sambandet mellan rökning och livslängd. 2. Såhär är sambandet mellan motion och livslängd. 3. Såhär är sambandet mellan uppfattad livskvalitet och livslängd. Men detta blir inte riktigt bra! Vi förlorar massor av möjlig intressant information på detta sätt. Vi förlorar helt informationen om tänkbara samband mellan prediktorerna. Tänk t.ex. Människor kanske upplever en högre livskvalitet som följd av motion. Den förlängda livslängden är kanske helt och hållet en effekt av motionen och har egentligen ingenting med den upplevda livskvaliteten att göra? Det vi egentligen vill svara på är: Påverkar upplevd livskvalitet livslängden förutsatt att man motionerar och röker lika mycket? Man kan kalla detta för en isolerad effekt av den upplevda livskvaliteten. Att bara utifrån det enkla regressionen dra slutsatsen att upplevd livskvalitet ger längre liv vore som att säga att man lever längre av att gå till kyrkan (helt utan att betänka att människor som ofta går dit har en annan livsstil). Det kan även vara så att motion förlänger livet, men inte om man röker mer än ett paket om dagen (för en storrökare har motionen i så fall ingen effekt på livslängden). Ett sådant samband skulle enkel regression aldrig kunna utvisa. Lösningen är att inkludera alla parametrar i en och samma regressionsanalys. Resultatet blir något i stil med: y = b 0 + b 1 x b n x n (7.4) 36
38 För en modell med n prediktorer. Det är inte längre lika lätt att visuellt visa koefficienterna b i som en lutning i en plot. Nu skall varje koefficient tolkas som effekten av en parameter när alla de andra hålls konstanta. Koefficienten b i framför parametern X motion skall alltså spelgla hur motion påverkar livslängden oberoende av hur mycket man röker och hur man själv upplever sin livskvalitet. Det är den unika effekten av motion. Detta skulle även kunna benämnas som effekten av motion när man korrigerat för skillnader i rökning och upplevd livskvalitet. I vår studie ingick 10 personer och utfallen var: x 1 = Rökning x 2 = Motion Livskvalitet = x 3 Livslängd = y Medel Tabell 7.2 Vi låter datorn utföra en multipel regression och tittar på utfallet: Figur 7.3 Vad kan vi utläsa? Den uppskattade koefficienten för rökning är -0,41. Det kan tolkas som för varje daglig cigarett så minskar livslängden med 0,41 år, förutsatt att motion och upplevd livskvalitet hålls konstant. Bland människor som motionerar lika mycket och upplever lika god livskvalitet så sänks livslängden så här mycket av rökning. p-värdet är 0,06. Det betyder att om det verkliga värdet för hela populationen skulle vara noll (dvs rökning påverkar inte livslängden för människor med samma motion och upplevd livskvalitet) så skulle slumpen kunna ge detta resultat med sannolikheten 6 %. 37
39 Koefficenten för motion är +3,0. Dvs för varje motionstimme i veckan så förlängs livet med 3 år för människor som röker lika mycket och upplever samma livskvalitet. Inte heller denna är signifikant skilt från 0, men nära! Den upplevda livskvaliteten tenderar i denna undersökning att förkorta livet, men detta är inte alls statistiskt säkerställt (p=0.49). Anledningen till att varken rökningen eller motionen bler riktigt signifikanta är troligen studiens storlek, bara 10 personer. Om ytterligare några personer inkluderats och visat liknande mönster hade p-värdena minskat. Hur man undersöker eventuella interaktioner mellan parametrar och hur man bestämmer bästa möjliga modell lämnar jag till det avancerade avsnittet om multipel regression,
40 Del II Studieplanering 39
41 Kapitel 8 Studieplanering Det är viktigt att planera sin studie noggrannt utifrån vilka frågeställningar och förväntningar man har. Det finns många olika upplägg och metoder att välja sina urval. Innan jag presenteras dessa närmare så vill jag introducera två vanliga begrepp som berör systematiska fel utförda av forskaren, nämligen bias och confounding factors. Jag kommer även att beskriva validitet och reliabilitet som är viktiga kvalitetsmått vid kvantitativ forskning. 8.1 Bias Bias är ett systematiskt metodfel vid insamling eller tolkning av data. En vanlig form är selektionsbias vilket innebär att man gör ett stickprov som representerar populationen tillräckligt bra. Vill man göra en undersökning om svenska folkets läkemedelsvanor kan det kanske ses som praktiskt att göra studien i vårdcentralens väntrum. Men detta ger ett typiskt selektionsbias eftersom personer som besöker vårdcentralen tenderar att använda fler läkemedel än befolkningen i allmänhet. För att undvika selektionsbias måste urvalet vara en perfekt spegling av befolkningens sammansättning, vilket är mycket svårt att uppnå. Målet är att minimera bias. En annan typ av bias kan uppstå vid matematiska analyser om man t.ex. använder metoder som systematiskt överskattar de verkliga värdena. Genom att använda guierna som finns i denna bok så minimerar du förhoppningsvis risken för betydande bias. Bias handlar sällan om medvetet fusk utan är snarare något som uppstår vid slarv, bekvämlighet, knappa resurser eller okunskap. 8.2 Confounding factors Confounding factors kan på svenska kallas för snedvridande faktorer men vanligtvis används det engelska ordet confounders. Detta är en parameter som utelämnas ur analysen och därmed ger upphov till felaktiga slutsatser. Figur 8.1: Rökning som potentiell confounder I figur 8.1 ser vi att låg socioekonomisk status (SES) är förknippat med ökad rökning vilket i sin tur leder till cancer. Om vi missa sambandet mellan låg SES och rökning så finns en stor risk att vi skulle dra slutsatsen att låg SES är en riskfaktor för cancer. Utifrån modellen är det förvisso sant att människor med låg SES drabbas av cancer i högre utsträckning, men detta är en indirekt effekt av deras ökade 40
42 rökning. I forskningen vill vi hitta direkta riskfaktorer och det vore felaktigt att säga att låg SES är en direkt riskfaktor för att utveckla cancer. I sin forskning måste man vara noggrann med att fundera över eventuella confounders innan man presenterar sina resultat. Ett sätt att korrigera för eventuella confounders är att göra ett stratifierat urval. Vi delar först upp befolkningen i rökare och icke-rökare, därefter plockar vi ut x rökare och x icke-rökare ur gruppen med låg SES samt y rökare och y icke-rökare ur gruppen med hög SES. I vårt stickprov ingår nu likamånga rökare ur gruppen med hög SES som ur gru med låg SES (ett helt slumpmässigt urval skulle ge oss fler rökare i gruppen med låg SES eftersom de röker mer). Om vi utifrån vårt stratifierade urval gör samma analys om samband mellan låg SES och cancer så har detta kanske helt försvunnit nu, vilket tyder på att låg SES inte var en direkt riskfaktor. Om vi fortfarande skulle se ett samband så kan vi säga att vi funnit ett samband mellan låg SES och cancer och att vi har korrigerat för rökning. Det innebär att vi har tagit hänsyn till gruppernas olika rökvanor och kan konstatera att det ändå finns ett samband (antingen är låg SES en äkta/direkt riskfaktor eller så finns det ytterligare confounders som vi har missat). Ett annat sätt är att utföra en multivariabel analys (t.ex. en multivariabel logistisk regression, se avsnitt 12.2). Då kan man se effekten av varje parameter under förutsättning att alla andra parametrar hålls konstanta. De parametrar som i en sådan modell fortfarande uppvisar ett signifikant samband med utfallet sägs vara korrigerade för skillnader i alla andra inkluderade parametrar. Att man har korrigerat för andra parametrar kan alltså ses som att man bara jämför individer som är likvärdiga vad gäller alla dessa parametrar. Exempel Man vill undersöka huruvida hög alkoholkonsumtion är relaterat till en viss sjukdom. Vid undersökningen måste man fundera över vilka confounders som kan finnas. Figur 8.2 Bild 8.2 visar hur individer har en alkoholkonsumtion och en sjukdomsstatus (ja/nej). Däremellan finns en svart låda med parametrar som skulle kunna vara confounders på ett eller annat sätt. Om man gör en multivariabel analys som inkluderar alla dessa parametrar och alkoholkomsumtionen visar sig vara relaterat till sjukdmen så kan vi dra säga att sambandet finns och att vi har korrigerat för alla parametrar som finns i lådan. Principiellt är detta jämförbart med att vi bara hade valt individer som är likvärdiga vad gäller samtliga parametrar i svarta lådan och sedan analyserat om alkohol är relaterat till sjukdomen. 8.3 Validitet och reliabilitet Validitet handlar om vad vi mäter och reliabilitet om hur vi mäter. För att få ett bra resultat på en studie krävs att vi faktisk mäter det vi är intresserade av. Om vi vill mäta folks vikt så är denna fråga tämligen okomlicerad, alla vet hur vikten mäts. Man om vi istället vill mäta en persons livskvalitet så blir det genast svårare. Om vi ställer frågan om hur ofta personen upplever sig må bra, har vi verkligen mätt rätt sak då? Eller har vi egentligen mätt något helt annat? Detta är innebörden av validitet. I 41
43 en studie med hög validitet kan man vara säker på att man verkligen mäter det man är intresserad av. Det är viktigt att tänka på vad metoden egentligen mäter och att man ställer tydliga enkätfrågor som deltagarna tolkar på rätt sätt. Även om vi mäter rätt parameter så är det inte säkert att vi mäter den på ett bra sätt. I en studie med hög reliabilitet kan man lite på att mätningarna är korrekt utförda. Detta betyder i praktiken att man skulle få exakt samma värde om mätningen upprepades flera gånger. Ett dåligt instrument eller en godtycklig mätmetod ger alltså en låg reliabilitet. I kvantitativ forskning eftersträvas både hög validitet och reliabilitet. Om svagheter förekommer bör dessa kommenteras som potentiella felkällor. 8.4 Studiedesign När studieupplägget skall designas finns två huvudtyper av studier: observationsstudier och experimentella studier. En observationsstudie innebär att forskaren står bredvid och observerar naturens gång utan att ingripa. Tanken är att man observerar och analyserar det man ser. I en experimentell studie påverkar forskaren på något sätt individerna och analyserar sedan utfallen. Nu följer en beskrivning av olika typer av observationsstudier och experimentella studier. Observationsstudier: Fall-kontrollstudier Kohortstudier (prospektiva eller retrospektiva) Tvärsnittsstudier Experimentella studier: Randomiserad kontrollerad studie. Quasi-experimentell studie Fall-kontrollstudie (case control study) I en fall-kontrollstudie utgår man ifrån utfallen och undersöker sedan tidigare exponeringar. Man väljer exempelvis ut 100 personer med en specifik sjukdom (fallgruppen) samt 100 friska personer (kontrollgruppen). Därefter går man bakåt i tiden och undersöker vad personerna blivit exponerade för under livet, t.ex. rökning och övergrepp. Eftersom forskaren är medveten om alla individers utfall (frisk/sjuk) redan då studien påbörjas så är fall-kontrollstudier per definition retrospektiva observationsstudier. Figur 8.3: Fall-kontrollstudie 42
44 Fördelar med fall-kontrollstudier Att utföra en fall-kontrollstudie är relativt enkelt och billigt. Dessutom är det mindre tidskrävande än många andra metoder. De fokuserar på utfallet och är därför att föredra om man vill analysera ett specifikt utfall (t.ex. en sjukdom), med detta menas frågeställningar av typen vilka faktorer ökar/minskar risken för utfall x? (jämför med retrospektiva kohortstudier som snarare svarar på frågor av typen vilka tillstånd är relaterade till exponering av faktor x? ). Fall-kontrollstudier är särskilt bra om: Man vill snabbt utreda orsaken till utbrott av en epidemi. Man vill undersöka riskfaktorer för en ovanlig sjukdom. Om sjukdomen är ovanlig så skulle det behövas en enormt stor kohortstudie för att inkludera tillräckligt många som utvecklar sjukdomen (det går väldigt många friska på varje sjuk individ). Vid en fall-kontrollstudie kan man inkludera alla de sjukdomsfall som finns tillgängligt. Nackdelar med fall-kontrollstudier När man gör en fall-kontrollstudie kan det vara svårt att välja ut de individer som skall inkluderas. För fallgruppen ( de sjuka ) krävs att man tydligt har definierat villkoren för att en individ skall räknas till gruppen. Att välja kontrollgruppen är en annan potentiell fallgrop som kräver noggrannt övervägande. Den skall helst vara bra matchad med fallgruppen vilket innebär att de i många avseenden skall dela egenskaper. Om man t.ex. vill undersöka ett sjukdomsutbrott bör man välja en kontrollgrupp där personerna vistas i samma miljöer och har samma ålderssammansättning som de drabbade. Genom att slarva med gruppernas kompositioner så utsätts studien för risker för bias, dvs faktorer som påverkar studien och ger skeva resultat. En annan potentiell källa till bias är att individerna måste minnas tidigare exponering (eller att information om detta på något sätt finns dokumenterat) och personer med exponering för negativa faktorer tenderar att underestimera denna. Detta medför att fall-kontrollstudier sällan leder till säkra bevis. Dock kan fördelarna ändå motivera denna studiedesign och ibland kan resultaten och bidra till att man senare utför en säkrare (men mer kostsam) longitudinell studie. Statistiska analyser Från en fall-kontrollstudie kan man beräka ett odds ratio för olika riskfaktorer. Detta kan tolkas som oddset för att individer i fallgruppen varit exponerade för en faktor relativt oddset att individer i kontrollgruppen varit det. Detta kan visas med en tabell. Grupptillhörighet (utfall) Exponering Fall (sjuk) Kontroll (frisk) Totalt Ja A B A+B Nej C D C+D Totalt A+C B+D A+B+C+D Tabell 8.1 Oddset för att de fallgruppen varit exponerade = A C Oddset för att de i kontrollgruppen varit exponerade = B D Odds ratio är kvoten mellan oddset för individerna i fallgruppen och oddset för individerna i kontrollgruppen. OR = A/C B/D = A D B C (8.1) Tolkning av odds ratio: OR=1: Det finns inget samband mellan exponering och utfall. OR>1: Det finns ett positivt samband där exponering tenderar till positiva utfall (sjukdom). Exponering är en riskfaktor. 43
45 OR<1: Det finns ett negativt samband. Exponeringen kan ses som en skyddande faktor. En odds ratio från en fall-kontrollstudie bör dock alltid anges tillsammans med ett konfidensintervall. Om konfidensintervallet inkluderar 1 så kan man inte dra några statistiskt säkerställda slutsatser. Ett exempel på en sådan uträkning finns i bokens avancerade del, exempel Beroende på hur många parametrar man undersöker och vilken typ av variabler dessa är (kontinuerliga/kategori), så kan andra analyser göras. Om man bara undersöker en parameter och denna är kontinuerlig (t.ex. antal rökta cigaretter) så kan man utföra ett t-test för att se om det finns en signifikant skillnad mellan grupperna (friska/sjuka). Om man har undersökt flera parametrar så logistisk regression en utmärkt analysmetod, se avsnitt Kohortstudie En kohort är en grupp individer som delar som delar en viss egenskap. I medicinska studier är det vanligt med ålderskohorter, vilket innebär att man följer en grupp människor som tillhör en specifik åldersgrupp. En kohort kan också ses som en grupp individer som studeras under en längre tid. Figur 8.4: Prospektiv kohortstudie I en prospektiv kohortstudie är en longitudinell studiedesign där man börjar följa en kohort med friska individer, man gör upprepade mätningar och noterar exponering för olika faktorer. Man fortsätter att följa gruppen och ser till sist vilka hälsotillstånd personerna drabbas av. En kohortstudie kan även vara retrospektiv vilket innebär att man blickar tillbaka och identifierar individer som exponerats för olika föremål. Därefter går man frammåt i tiden och ser vilka hälsotillstånd som drabbade individerna. Notera att man utgår ifrån olika exponeringar och därefter ser om individerna blev sjuk (till skillnad från fall-kontrollstudien där man utgår ifrån utfallet och sedan undersöker vad individen exponerats för). I en kohortstudie kommer exponeringen före utfallet vilket ger en större möjlighet att dra slutsatser. När man följer en kohort ges goda möjligheter att dra slutsatser om incidens och prevalens av olika hälsotillstånd. Dessutom kan an beräkna relativ risk (RR) och odds ratio (OR) för olika riskfaktorer för specifika sjukdomar. Man kan även utföra t.ex. regressionsanalyser för materialet. Analyser utförda på data från en prospektiv kohortstudie har stort värde eftersom problemen med bias blir mindre jämfört med en fall-kontrollstudie. Forskaren behöver inte välja fallgrupper och kontrollgrupper, det räcker att följa sin kohort och låta naturen avgöra vilka som blir sjuka och vilka som förblir friska. Nackdelen är såklart att det kräver stora resurser och lång tid att följa en grupp människor genom livet. Retrospektiva kontrollstudier är särskilt bra när man vill analysera vad exponering för ovanliga föremål medför. Man kan då välja alla individer som exponerats för en viss faktor och kalla dessa för en kohort. Därefter undersöker man vad dessa människor senare drabbades av. Detta är en relativt snabb och billig studiedesign. 44
46 8.4.3 Tvärsnittsstudie (cross sectional study) Vid en tvärsnittsstudie tittar man på befolkningen (eller ett urval ur denna) vid en enda tidpunkt. Man kan se det som att man stannar tiden och undersöker individernas tillstånd just nu. Vilka faktorer exponeras de för och vilka hälsotillstånd är de drabbade av? Fördelen med detta är att man tämligen Figur 8.5: Tvärsnittsstudie enkelt kan fånga många individers tillstånd. Eftersom datainsamlingen sker vid endast ett tillfälle så blir bortfallet litet och möjligheten att ge svar om många parametrar ökar (vid en longitudinell studie är bortfallen under studiens gång ett stort problem och dessa blir fler om deltagarna måste svara på många frågor vid varje tillfälle). Man kan även beräkna prevalens, odds ratio och relativ risk samt utföra regressionsanalyser. Nackdelarna med en tvärsnittsstudie inkluderar svårigheter att dra slutsatser om orsakssamband. Eftersom all data samlas in samtidigt är det omöjligt att veta om exponeringen för en faktor tillkommit innan eller efter utvecklingen av en sjukdom, man kan därför inte säga särskilt mycket om att exponeringen orsakat sjukdomen. En annan svaghet på samma tema är att vi bara fångar hur det ser ut just nu, om samma studie upprepas om några månader kan resultatet bli ett helt annat. Dessutom kan bias uppstå då exponeringsfaktorer som är korrelerade med svår sjukdom/död försvinner ur analysen eftersom individerna endast lever en kort tid med denna faktor och därför sällan fångas av tvärsnittsstudien Randomiserad kontrollerad studie Detta är en experimentell studiedesign där individer först inkluderas i studien baserat på utvalda inklusionskriterier. De kommer därefter slumpmässigt att tilldelas en grupptillhörighet (vanligen behandling eller placebo). Man mäter någon parameter vid studiens start ( baseline ) och samma parameter när studien avslutas. Därefter sker statistiska analyser för att undersöka om behandlingen givit någon effekt. Det är viktigt att tilldelningen av grupp (behandling/kontroll) sker slumpmässigt för att undvika bias. På detta sätt blir eventuella skillnader mellan grupperna endast beroende av slumpen och vi slipper problem med confounders beroende på felaktiga avvägningar från forskaren. En schematisk bild av processen presenteras i figur 8.6. Fördelar med randomiserade kontrollerade studier: Få källor till bias eftersom grupptilldelningen sker helt slumpmässigt. Tillförlitliga resultat. Nackdelar: Etiska problem att endast vissa får behandlingen. Resultaten är inte säkert generaliserbara till individer som inte uppfyller studiens inklusionskriterier. 45
Statistik för läkare och läkarstudenter
Statistik för läkare och läkarstudenter Första upplagan Johan Olsén 3 november 2015 Förord Författandet av detta material började som en ambition att skapa ett hjälpmedel för läkarstudenter som vill lära
Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,
Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Deskriptiv statistik Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Deskriptiv statistik Tabeller Figurer Sammanfattande mått Vilken
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK TERM Analytisk statistik Bias Confounder (förväxlingsfaktor)) Deskriptiv statistik Epidemiologi Fall-kontrollstudie (case-control study)
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.
2 Dataanalys och beskrivande statistik
2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Att välja statistisk metod
Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...
EXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten
Agenda Statistik Termin 11, Läkarprogrammet, VT14 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande
Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?
Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Slump och slumptal Analys Boxplot Konfidensintervall Experiment och test Kamratgranskning Kursmeddelanden Analys Om laborationer: alla labbar
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Föreläsning G70 Statistik A
Föreläsning 1 732G70 Statistik A 1 Population och stickprov Population = den samling enheter (exempelvis individer) som vi vill dra slutsatser om. Populationen definieras på logisk väg med utgångspunkt
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Parade och oparade test
Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Föreläsning 1. 732G60 Statistiska metoder
Föreläsning 1 Statistiska metoder 1 Kursens uppbyggnad o 10 föreläsningar Teori blandas med exempel Läggs ut några dagar innan på kurshemsidan o 5 räknestugor Tillfälle för individuella frågor Viktigt
Beskrivande statistik Kapitel 19. (totalt 12 sidor)
Beskrivande statistik Kapitel 19. (totalt 12 sidor) För att åskådliggöra insamlat material från en undersökning används mått, tabeller och diagram vid sammanställningen. Det är därför viktigt med en grundläggande
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik
Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten
I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
Hur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29)
LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) Aktuella avsnitt i boken: Kap 61 65 Lektionens mål: Du ska
Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.
Lägesmått Det kan ibland räcka med ett lägesmått för att beskriva datamaterial Lägesmåttet kan vara bra att använda då olika datamaterial skall jämföras Vilket lägesmått som skall användas: Typvärde Median
Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten
Agenda Statistik Termin 10, Läkarprogrammet, VT15 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Statistiska undersökningar
Arbetsgång vid statistiska undersökningar Problemformulering, målsättning Statistiska undersökningar Arbetsgången mm Definition av målpopulation Framställning av urvalsram Urval Utformning av mätinstrument
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Hypotestestning och repetition
Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att
Statistik Termin 10, Läkarprogrammet, HT16
I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Statistik Termin 10, Läkarprogrammet, HT16 Martin Cernvall martin.cernvall@pubcare.uu.se Måndag 29/8 -
Uppgift 1. Produktmomentkorrelationskoefficienten
Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill
FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik
Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende
Gamla tentor (forts) ( x. x ) ) 2 x1
016-10-10 Gamla tentor - 016 1 1 (forts) ( x ) x1 x ) ( 1 x 1 016-10-10. En liten klinisk ministudie genomförs för att undersöka huruvida kostomläggning och ett träningsprogram lyckas sänka blodsockernivån
34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
TMS136. Föreläsning 11
TMS136 Föreläsning 11 Andra intervallskattningar Vi har sett att vi givet ett stickprov och under vissa antaganden kan göra intervallskattningar för väntevärden Man kan även gör intervallskattningar för
Kvantitativ forskning C2. Viktiga begrepp och univariat analys
+ Kvantitativ forskning C2 Viktiga begrepp och univariat analys + Delkursen mål n Ni har grundläggande kunskaper över statistiska analyser (univariat, bivariat) n Ni kan använda olika programvaror för
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
732G01/732G40 Grundläggande statistik (7.5hp)
732G01/732G40 Grundläggande statistik (7.5hp) 2 Grundläggande statistik, 7.5 hp Mål: Kursens mål är att den studerande ska tillägna sig en översikt över centrala begrepp och betraktelsesätt inom statistik.
Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens
Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
Statistikens grunder. Mattias Nilsson Benfatto, Ph.D
Statistikens grunder Mattias Nilsson Benfatto, Ph.D Vad är statistik? Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information.
TMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik
Statistik Lars Walter Fil.lic. Statistik Linköping universitet Stockholms universitet Karolinska sjukhuset Sveriges Lantbruksuniversitet Linköpings universitet Folkhälsocentrum, LiÖ FoU-enheten, LiÖ Statistik
Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)
Kursens upplägg v40 - inledande föreläsningar och börja skriva PM 19/12 - deadline PM till examinatorn 15/1- PM examinationer, grupp 1 18/1 - Forskningsetik, riktlinjer uppsatsarbetet 10/3 - deadline uppsats
1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)
1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna
Repetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Analytisk statistik. Tony Pansell, optiker Universitetslektor
Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 22 mars 2018 TEN1, 9 hp Tillåtna hjälpmedel: Miniräknare
STATISTISK POWER OCH STICKPROVSDIMENSIONERING
STATISTISK POWER OCH STICKPROVSDIMENSIONERING Teori UPPLÄGG Gemensam diskussion Individuella frågor Efter detta pass hoppas jag att: ni ska veta vad man ska tänka på vilka verktyg som finns vilket stöd
Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor
Beskrivande statistik Tony Pansell, Leg optiker Docent, Universitetslektor Beskrivande statistik Grunden för all analys är ordning och reda! Beskrivande statistik hjälper oss att överskådligt sammanfatta
Mata in data i Excel och bearbeta i SPSS
Mata in data i Excel och bearbeta i SPSS I filen enkät.pdf finns svar från fyra män taget från en stor undersökning som gjordes i början av 70- talet. Ni skall mata in dessa uppgifter på att sätt som är
FACIT (korrekta svar i röd fetstil)
v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta
Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ
Inledning till statistikteorin Skattningar och konfidensintervall för μ och σ Punktskattningar Stickprov från en population - - - Vi vill undersöka bollhavet men får bara göra det genom att ta en boll
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram
Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1
Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig steg 1 5 Steg 4 Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 Hypotesprövning
Medicinsk statistik I
Medicinsk statistik I Läkarprogrammet T5 VT 2013 Susanna Lövdahl, Msc, Doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Medicinsk statistik VT-2013 Tre stycken
FÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
13.1 Matematisk statistik
13.1 Matematisk statistik 13.1.1 Grundläggande begrepp I den här föreläsningen kommer vi att definiera och exemplifiera ett antal begrepp som sedan kommer att följa oss genom hela kursen. Det är därför
Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.
Biostatistik: Begrepp & verktyg Kvantitativa Metoder II: teori och tillämpning Lovisa.Syden@ki.se BIOSTATISTIK att hantera slumpmässiga variationer! BIO datat handlar om levande saker STATISTIK beskriva
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Föreläsning 5. Kapitel 6, sid Inferens om en population
Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Hur man tolkar statistiska resultat
Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Varför använder vi oss av statistiska tester?
Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
2.1 Minitab-introduktion
2.1 Minitab-introduktion Betrakta följande mätvärden (observationer): 9.07 11.83 9.56 7.85 10.44 12.69 9.39 10.36 11.90 10.15 9.35 10.11 11.31 8.88 10.94 10.37 11.52 8.26 11.91 11.61 10.72 9.84 11.89 7.46
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test? Mikael Eriksson Specialistläkare CIVA Karolinska Universitetssjukhuset, Solna Grund för hypotestestning 1. Definiera noll- och alternativhypotes,
Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet
Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Formell analys Informell data analys Design and mätning Problem Formell analys Informell data analys Hur
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
EXAMINATION KVANTITATIV METOD
ÖREBRO UNIVERSITET Hälsoakademin Idrott B, Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-09 (090209) Examinationen består av 8 frågor, några med tillhörande följdfrågor. Frågorna 4-7 är knutna till
TMS136. Föreläsning 7
TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna
Föreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala
Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1
Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
TMS136. Föreläsning 13
TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra
SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)
SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
8 Inferens om väntevärdet (och variansen) av en fördelning
8 Inferens om väntevärdet (och variansen) av en fördelning 8. Skattning av µ och Students T-fördelning Om σ är känd, kan man använda statistikan X µ σ/ n för att hitta konfidensintervall för µ. Om σ inte
ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)
1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda
Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.
Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Frida Eek
BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 (2015-04-29) OCH INFÖR ÖVNING 8 (2015-05-04)
LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB ÖVNING 7 (25-4-29) OCH INFÖR ÖVNING 8 (25-5-4) Aktuella avsnitt i boken: 6.6 6.8. Lektionens mål: Du ska kunna sätta