Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor

Storlek: px
Starta visningen från sidan:

Download "Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor"

Transkript

1 Survival analysis (Dag 1) Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Henrik Källberg, 2012

2 Survival analysis (Dag 1) Mål - Kunna grundläggande begrepp och koncept inom överlevnadsanalys - Förstå skillnad mellan händelse och censurering - Utföra enklare beräkningar - Förstå vad överlevnadsfunktionen beskriver - Kunna skatta överlevnadssannolikhet genom parametrisk metod med hjälp av exponentialfördelningen - Kunna jämföra olika överlevnadskurvor mha. Logrank-test

3 Survivalanalysis (studietyper) Kohortstudier Oexponerade Exponerade Oexp. fall Exp. fall Randomiserade studier, Kliniska prövningar Randomisering Behandling Alla individer Placebo Studietid

4 Survival analysis (exempel)

5 Survival Analysis Tid till händelse kan vara tid till sjukdom från studiestart, Tid till händelse (Time to event) Tid (t) Studie start Studie slut

6 Survival analysis - Censurering Censurering innebär att man har ofullständig information om vad som hänt en individ. Censurering är icke informativ om orsaken inte har med händelsen (sjukdom) som man studerar Höger censurering: En individ följs upp över en tid utan att någon händelse inträffar under uppföljningstiden Höger censurering kan bero på: - Att individen avlider på grund av en annan orsak än den som studeras. - Studien avslutas innan en händelse uppstår (tex. Sjukdom). Uppföljningstiden är för kort. - En individ hoppar av studien innan studien avslutas (loss to follow up)

7 Survival analysis - Censurering Vänstersidig censurering: Innebär att en händelse inträffat men man vet inte när. Vänstersidig censurering är ovanligare och är ofta relaterat till att man har en ställtid där individen inte vet när händelsen inträffade. Tex. - Insjuknande innan symptomdebut tex. Cancer, HIV Sjudomsdebut Uppfölj. tid Ställtid Start studie Symptom Viktigt att tänka på eventuell ställtid i samband med studiedesignen

8 Survival Analysis Uppgift Vilka individer är censurerade? Time to event Time (t) Study start Study end

9 Survival analysis (Livslängdstabeller) Ålder vid start vid Dekaden Sannolikhet för död under dekad ???? ???? Antal levande vid dekadens början

10 Survival analysis Day 1 Överlevnadsfunktionen, S(t) : Beskriver sannolikheten att inte drabbas av en händelse före en given tidpunkt (t). S(t)

11 Survival analysis Utfallsvariabeln är tid till händelse (time to event) Denna utfallsvariabel är oftast inte normalfördelad Fördelningsfunktionen för tid till händelse (time to event) betecknas f(t)

12 Survival analysis Day 1 Överlevnadsfunktionen, S(t) : Beskriver sannolikheten att inte drabbas av en händelse före en given tidpunkt (t). Fråga: Vad är sannolikheten att inte drabbas av en händelse före tidpunkt = 80?

13 Survival analysis (Överkurs) Sambandet mellan fördelningsfunktionen för tiden f(t) och överlevnadsfunktionen är ser ut på följande sätt: S( t) f ( t) dt 1 F( t) eller f ( t) S'( t) t

14 Survival analysis (Kaplan Meier) Hur beräknar man sannolikheten för överlevnad med hjälp av överlevnadsfunktionen S(t)? Kaplan-Meier - För att överleva t antal tidpunkter måste man överleva t-1 tidpunkter och den sista tidpunkten i intervallet. - Betecknas: S(t)=S(t-1)*P(överleva tidpunkten t) STATA: Definiera variabler: stset survt, failure(event==1), sts list (för skattningar), sts graph (för plot av kurva) sts grap,by(group) (plot uppdelat på grupper)

15 Survival analysis (Kaplan Meier) Kaplan Meier - Icke parametrisk metod (vi antar inte att överlevnadsfunktionen har en speciell form) Antaganden: - Observationerna är oberoende av varandra - Censureringen är oberoende av händelserna vi studerar t.ex. att sjukdomen som vi studerar inte är kopplad till att censurering uppkommer - Att vi vet den exakta tiden till en händelse

16 Survival analysis (Kaplan Meier) Tidpunkt (t) minuter Antal friska vid t. a t Sjuka under interv. d t Antal förlorade individer c t Antal indiv. under risk n t =a t -c t Risk sjuk vid t r t =d t /n t Frisk vid t s t =1-r t Kumulat. Överlev. I s(t)=s(t-1) s(t) /21 21/21 1*21/ /21 1-1/21= /20 1-0/20 = 1 1*0.95= * /20 = = 17 1/17 = /16 = = = = *0.95 = * = * = 0.705

17 Survival analysis (Kaplan Meier) 1 s(t) 0,8 0,6 0,4 0, t

18 Survival analysis (Kaplan Meier) Konfidensintervall för överlevnadsfunktionen S(t) Standard Error (SE) skattas med hjälp av följande formel: SE S t = S(t) d t a t (a t d t ) 95% Konfidensintervall vid tidpunkten Där d t är antal event vid tidpunkt t och a t är antalet friska individer vid t Denna formel kallas Greenwoods formel

19 Survival analysis (Kaplan Meier) Uppgift! Beräkna 95 procentigt Konfidensintervall Tidpunkt (t) minuter Antal friska vid t. a t Sjuka under interv. d t Antal förlorade individer c t Antal indiv. under risk n t =a t -c t Risk sjuk vid t r t =d t /n t Frisk vid t s t =1-r t Kumulat. Överlev. I s(t)=s(t-1) s t /20 = = *0.95 = SE S t = S(t) d t a t (a t d t )

20 Survival analysis Ibland har man inte exakta tidpunkter Vi har bara information för vissa tidsintervall!! Data är grupperat Tidsintervall

21 Survival analysis ( life table ) Det är ingen större skillnad mellan beräkningarna för överlevnadsfunktionen för en Life-table jämfört med Kaplan Meier Skillnaden består i huvudsak av att man antar att de censurerade personerna bidrar med information under halva tidsperioden där de försvinner. Antalet individer under risk för en särskild period är antalet individer i början av perioden minus halva antalet individer som faller bort (loss to follow up) Låt oss titta på exempel

22 Survival analysis ( life table uppgift!!) Intervall (månader sedan start) i Antal levande i början av i. a i Döda under interv. d i Antal förlorade individer c i Antal indiv. under risk n i =a i -c i /2 Risk att dö under i r i =d i /n i P överleva i s i =1-r i /100 = /2 = 88 4/88 = = = Kumulat. Överlev. I s(i)=s(i-1) s i = ??????????? /58 = = =

23 Survival analysis ( life table ) Intervall (månader sedan start) i Antal levande i början av i. a i Döda under interv. d i Antal förlorade individer c i Antal indiv. under risk n i =a i -c i /2 Risk att dö under i r i =d i /n i P överleva i s i =1-r i /100 = /2 = 88 4/88 = = = Kumulat. Överlev. I s(i)=s(i-1) s i = /2 = 70 7/70= /58 = = = = =

24 Survival analysis (Parametrisk Skattning) Parametrisk skattning av S(t) Om vi kan anta en fördelning för tiden T~Exponential: S t = exp λt Man måste skatta λ för att kunna skatta S(t) Hastigheten λ skattas med λ = d t Vi antar att λ är konstant över tid.

25 Survival analysis (Parametrisk Skattning Uppgift) Antal individer (a) Tid (t) Tid*a Antal Händelser Summa Uppgift! λ = d t = S t = e t S t = 52 =?

26 Survival analysis (Jämföra kurvor) Olika grupper t.ex. - Behandlade och obehandlade, - Exponerade och oexponerade Logrank test - Chi-Två - Wilcoxon-Gehan

27 Survival analysis (Jämföra kurvor) ex.

28 Survival analysis (Jämföra kurvor) Två olika Kurvor, olika behandlingar Logrank Test Icke Parametriskt test H 0 : S A (t) = S B (t) (Överlevnadsfunktionen är likadan i båda grupperna) H 1 : S A (t) S B (t) (Överlevnadsfunktionerna är olika) Bakomliggande ide: Beräkna förväntat antal händelser och jämföra med observerat antal händelser.

29 Survival analysis (Jämföra kurvor) Konstruera följande tabell för alla!!! tidpunkter där händelse(r) inträffar: Grupp Antal friska vid t. a t Antal händelser d t Förväntat antal händelser (A) A t,a d t,a E t,a =d t *(A t,a /A t ) (B) A t,b d t,b E t,b =d t *(A t,b /A t ) Totalt A t d t E t = d t Variansen för d t,a = d t,b, V t,k = d t A t,a A t,b (A t d t ) A 2 (A t 1)

30 Survival analysis (Jämföra kurvor) Grupp A Behandling Grupp B Obehandlade Tid Antal friska vid t. a t Antal händelser d t Förväntat antal händelser Antal friska vid t. a t Antal händelser d t Förväntat antal händelser 1 A 1,A d 1A E 1A =d t *(A 1A /A t ) A 1,B d 1B E 1B =d t *(A 1B /A t ) 2 A 2,A d 2,A E 2,A =d t *(A 2A /A t ) A 2,B d 2,B E 2,B =d t *(A 2B /A t ) 3 A 3,A d 3,A E 3,A =d t *(A 3A /A t ) A 3,B d 3,B E 3,B =d t *(A 3B /A t ) k A k,a D k,a E K,A =d t *(A KA /A t ) A k,b D k,b E K,B =d t *(A KB /A t ) Totalt D +,A E +,A D +,B E +,B Ideen bakom är att jämföra observerat antal händelser mot förväntat antal om det inte var någon skillnad d t =d ta +d tb och A t =A ta + A tb

31 Survival analysis (Jämföra kurvor) Teststatistika är χ 2 fördelad och beräknas genom: U L = k (d t,k E t,k ), V L = k V t,k, χ 2 = U2 V L med 1 frihetsgrad (antal grupper-1), vilket innebär att P(χ )=0.05 (signifikansnivån) Det finns en snabbversion som utgår från: χ 2 (D +A E +A ) 2 E +A + (D +B E +B ) 2 E +B STATA: sts test group, sts test group,wilcoxon

32 Survival analysis (Jämföra kurvor) Ex. Här är data från en fiktiv studie som jämför två olika behandlingar

33 Survival analysis (Jämföra kurvor) ex. Exempel beräkning förväntat antal döda i behandlingsgrupp 2

34 Survival analysis (Jämföra kurvor) ex. I föregående slide visades hur man beräknar förväntat antal döda för behandling 2. Nästa steg är att göra samma sak för behandling 1. Beräkna Chi-två värde: χ 2 (D +1 E +1 ) 2 E +1 + (D +2 E +2 ) 2 E +2 = (4 7.08) (6 2.92)2 =4.59 (1 fg) 2.92

35 Survival analysis (Jämföra kurvor) Logrank testet är känsligt för sena skillnader mellan överlevnadskurvorna. Om man vet att tidiga skillnader är av särskilt intresse så kan man med hjälp av Wilcoxon-Gehan test vikta för tidiga skillnader med hjälp av antal personer under risk vid t. U L = k A t,k (d t,k E t,k ), V L = k A 2 t,k V t,k Val av test bör göras innan man ser data (annars väljer man det som passar data bäst inte apriori teori)

36 Survival analysis (Jämföra kurvor) Fler grupper! Logrank-testet går att generalisera till fler än två grupper. Viktigt att tänka på antal frihetsgrader (antal grupper-1).

37 Survival analysis (Jämföra kurvor) Uppgift Grupp Obs. Antal händelser (D) Totalt Ledtråd: χ 2 (D +A E +A ) 2 E +A + (D +B E +B ) 2 E +B +???? Förväntade antal händelser (E) χ 2 -tabell:

38 Survival Analysis (Logrank test) Styrkor Inga modellantaganden => kan användas på de flesta data Kan användas på kategoridata. Svagheter Kan inte användas för att modellera tiden. Ingen möjlighet att testa hur variabler påverkar modellen Konfidensintervall är modelloberoende. Variablers effekt kan bara undersökas genom att stratifiera (dela upp data) Omöjligt att använda kontinuerliga variabler

39 Survival analysis (Dag 2) Upplägg Dag 2 Hazard-funktionen Proportional Hazard model (Cox-model) Olika variabler Statistiska test

40 Survival analysis (Dag 2) Mål - Veta hur Hazardfunktionen är relaterad till överlevnadsfunktionen (S(t)) - Veta hur Cox-regressionsmodellen ser ut - Förstå Proportional Hazard assumption - Beräkna Hazard Ratio för olika variabler - Avgöra om en variabel är signifikant i en Coxmodell

41 Survival analysis (Hazardfunktionen) Fördelning tid till händelse, f(t): Överlevnadsfunktionen S(t): t S ( t) f ( t) dt 1 F( t) Hazardfunktionen h(t): f ( t) d h( t) log( S( t)) S( t) dt

42 Survival analysis (Hazardfunktionen) Hazardfunktionen h(t) beskriver antal händelser per tidsenhet ( hastighet för att händelse(r) inträffar) Den kumulativa Hazardfunktionen (lättare att plotta eftersom Hazardfunktionen återger den momentana risken. ges av: -log(s(t))=h 0 (T) Hazardfunktionen beskriver sannolikhet att sjukdom (händelse) inträffar strax efter tiden t givet att sjukdom inte inträffat före t. Vi håller oss till det enkla exemplet med att Hazardfunktionen är konstant (exponentiell fördelning). Det finns dock andra fördelningar där hazardfunktionen ökar eller minskar över tid (t.ex. Weibullfördelningen)

43 Survival analysis (Hazardfunktionen) Kom ihåg: f ( t) S'( t) f ( t) d Och: h( t) log( S( t)) S( t) dt f(t)= e - t =S (t) Kvoten blir då: h( t) f ( t) S( t) e e t t S(t)=e - t h(t)=

44 Survival analysis (Hazardfunktionen) Föregående exempel utgår från att tiden till händelse är exponentialfördelad (Dag1) T ~ exp (λ) P(T=t) = λe -λt där λ är en konstant hastighet. Låt oss anta att alla individer har konstant risk för att drabbas av sjukdom och att det som skiljer är en specifik variabel (t.ex. rökning, kön, ålder)

45 Survival analysis (Cox regression) Man behöver inte välja en speciell sannolikhetsfördelning för överlevnadstiden och är därför säker. Semi-parametrisk (Kaplan-Meier är icke-parametrisk; exponential och Weibull är parametriska) Man kan använda diskreta och kontinuerliga variabler. Lätt att använda tidsberoende variabler (variabler som ändras över tid)

46 Survival analysis (Cox regression) Vi utvecklar Hazardfunktionen så att den ser ut på följande sätt: h t, x = h 0 t exp(β x) Obs! (exp(β x) = e β*x ) e = talet 2.72 Nu består vår Hazardfunktion (h(t,x)) av två delar: h 0 t och exp β x där h 0 t är baseline Hazard och exp β x är en konstant som påverkar Hazardfunktionen (kan bero på en variabel) jmf. Med h( t) f ( t) S( t) e e t t Överlevnadsfunktionen ser ut på följande sätt: S t, x = e (H 0 t exp β x ) = [S 0 (t)] exp(β x)

47 Survival analysis (Cox regression) Nu kan vi beräkna Hazard Ratio (HR) HR tolkas ofta som en relativ risk (RR) trots att vi inte vet absolut risk. HR skattar i detta fall en incidens kvot Hazard för person i (eg en rökare) Hazard ratio HR i, j h h 1xi1... k xik i ( t) 0 ( t) e 1( xi1 x j1)... 1( xik x jk ) e 1x j1... k x jk j ( t) 0 ( t) e 0 ( t) h0 ( t Hazard för person j (eg en icke rökare) Obs!! )

48 Survival analysis (Cox regression) Antaganden Proportional Hazard Assumption - Hazardfunktionerna för respektive grupp är proportionella gentemot varandra. Det som skiljer dom åt är exp(β*x). Detta innebär att HR ( RR ) inte beror av tiden - Risken är multiplikativ h t, x = h 0 t exp(β x)

49 Survival analysis (Cox regression) Data-exmpel (Dikotom variabel) Individ Rökare (1=ja,0=nej) Tid till event Event (1=ja, 0=nej)

50 Survival analysis (Cox regression) Kategorisk variabel (Dikotom) HR lung cancer / smoking h h i j ( t) ( t) ( t) e 0 ( t) e 0 smoking smoking (1) (0) e smoking (1 0) HR lung cancer / smoking e smoking Detta är Hazard ratio för rökning, lägg märke till att rökning är i detta fall oberoende av tid.

51 Survival analysis (Cox regression) ex.

52 Survival analysis (Cox regression) Data-exempel (Flera grupper, tex. Ålderskategorier, storlek), Ordinaldata Individ Ålder Ålder1 ( 30 år,<40) Ålder2 ( 40 år, <50) Ålder3 ( 50 år) Tid till event

53 Survival analysis (Cox regression) Flera grupper, Ordinal data HR lung cancer / Ålderskategori, ålder2 vs.ålder 0 h h i j ( t) ( t) ( t) e 0 ( t) e 0 Ålder1(0) Ålder1(0) Ålder 2 Ålder 2 (1) (0) Ålder 3 Ålder 3 (0) (0) e ålder 2 (1) HR lung cancer / ålder2 vs.ålder 0 e ålder 2(1) Detta är Hazard ratio för ålder 2 (30-40 år) jmf med <30 år STATA: stcox group alder stcox group alder, nohr (Om du vill ha beta-koefficienter och ej HR)

54 Survival analysis (Cox regression) Uppgift Kategorisk variabel (Dikotom) I en studie beträffande risk för lungcancer och rökning erhölls följande resultat β = 1.6, SE(β)=0.5 Skatta den relativa risken och ett 95%-igt konfidensintervall för att drabbas av lungcancer om man röker Svar: RR=HR=e 1.6*1(rökare=1) = 4.95, Undre gräns 95%-igt RR= e *0.5 =1.85 Övre gräns 95%-igt RR=e *0.5 =13.2

55 Survival analysis (Cox regression) Kontinuerlig variabel (tex. Ålder, Koncentration av ämne, temperatur) Individ Ålder Tid till event

56 Survival analysis (Cox regression) Kontinuerlig Variabel HR lung cancer /10 years increase in age h h i j ( t) ( t) ( t) e 0 ( t) e 0 age age (70) (60) e age (70 60) HR lung cancer /10 years increase in age e age (10) Detta är Hazard ratio för tio år åldersökning

57 Survival analysis (Cox regression) Uppgift Kontinuerlig Variabel I en studie beträffande ålder och risk för lungcancer erhölls följande resultat β = 0.05, SE(β)=0.05 Skatta den relativa risken och ett 95%-igt konfidensintervall för att drabbas av lungcancer från 55 års ålder till 60 års ålder Svar: RR=HR=e 0.05*(60-55) = 1.28 Undre gräns 95%-igt RR= e 0.05*(60-55)-1.96*5*0.05 =0.77 Övre gräns 95%-igt RR= e 0.05*(60-55)-1.96*5*0.05 = 2.10

58 Survival analysis (Cox regression) Uppgift I denna artikel om Cadmium och risk för CVD så har man kategoriserat en kontinuerlig variabel

59 Survival analysis (Cox regression) För att avgöra om en variabel (tex. Rökning, Asbest eller behandling) medför en signifikant ökad eller minskad RR (eg. Hazard ratio (HR)) så måste den testas. En vanlig metod för att testa signifikans kallas Wald test Andra vanliga test är Likelihood ratio och Score test

60 Survival analysis (Cox regression) Walds test ges av följande formel: Där ˆ 0 Z SE ( ˆ) ˆ h t, x = h 0 t exp(β x) är en regressionskoefficient från Cox-modellen Och SE(β) är standard error för β Z är det standardiserade normalvärdet från normalfördelningen (Använd normalfördelningstabell)

61 Survival analysis (Cox regression) ˆ Walds test testar om är skiljt från 0. (om är 0 så innebär det att exp(β=0) är 1 vilket ger en HR (RR) som är 1 (mao. Det är ingen ökad eller minskad risk för sjukdom för den variabeln) ˆ H 0 : β = 0 H 1 : β 0

62 Survival analysis (Cox regression) Uppgift Beräkna z-värde med hjälp av Walds test med hjälp av följande uppgifter (Regressionskoefficient för rökning från lungcancer): β = 1.6, SE(β)=0.5 Signifikansnivå=0.05 z(gräns)=1.96 Avgör om koefficienten är skild från 0.

63 Survival analysis (Cox regression) Uppgift Z Exempel Normalfördelningstabell observera att endast några sannolikheter ges i tabellen I detta fall blir z=1.6/0.5 = 3.2 vilket ger ett p- värde på = Slutsats: denna koefficient är mycket signifikant, det finns en association mellan rökning och risk för lungcancer

64 Survival analysis (Cox regression) Uppgift Utför Walds test för den kontinuerliga variabeln ålder i tidigare exempel β = 0.05, SE(β)=0.05 Signifikansnivå=0.05 z(gräns)=1.96 Avgör om koefficienten är skild från 0. Hur förhåller sig Walds test till HR och dess 95%-iga konfidensintervall?

65 Survival analysis (Cox regression) Uppgift Beräkna Z-värde med hjälp av Walds test för behandling och ålder. Tolka resultat.

66 Survival analysis (Dag 3) Upplägg Dag 3 Fortsättning Cox-modellen Flera variabler Confounding Interaktion Test av proportional Hazard assumption Ytterliggare modeller

67 Survival analysis (Dag 3) Mål - Veta hur man infogar fler variabler i en cox modell - Förstå hur man kontrollerar för Confounding - Interaktion mellan variabler - Undersöka, testa proportional hazard assumption - Veta om att det finns ytterligare modeller

68 Survival analysis (Kort repetition) Hazardfunktionen h t, x = h 0 t exp(β x) Obs! (exp(β x) = e β*x ) e = talet 2.72 * h 0 t är baseline Hazard och exp β x är en konstant som påverkar Hazardfunktionen (kan bero på en variabel)

69 Survival analysis (Kort repetition) Hazard ratio (HR, RR ) Obs!! t) h ( ) 0( 0 t Hazard för person i (eg en rökare) Hazard ratio HR i, j h h 1xi1... k xik i ( t) 0( t) e 1( xi1 x j1)... 1( xik x jk ) e 1x j1... k x jk j ( t) 0( t) e Hazard för person j (eg en icke rökare)

70 Survival analysis (Kort repetition) Walds test (för att avgöra om variabel är signifikant i modell) : Z ˆ 0 SE ( ˆ)

71 Survival analysis (Flera variabler) Från Dag 2: HR lungcancer/10 years increase in age h h i j ( t) ( t) ( t) e 0 ( t) e 0 smoking smoking (0) (0) age age (70) (60) e age (70 60) HR lungcancer/10 years increase in age e age (10) Nu har vi utökat modellen så att både rökning och ålder finns med.

72 Survival analysis (Flera variabler, confounding) Confounding är ett stort problem i observationsbaserade studier (läs ej randomiserade studier) Confounding är när ett samband mellan två variabler kan förklaras av en tredje variabel. Kaffe och risk för lungcancer: Rökning Kaffe Lungcancer

73 Survival analysis (Flera variabler, confounding) Ej rökning rökning Rökning + Edu. Etnic. Emfys. Alc. Phys.

74 Survival analysis (Flera variabler, confounding) här är ett exempel på en Cox-modellen för HR i föregående tabell. h t, x = h 0 t exp(+β Age_study x Age_study + β BMI1 x BMI1 + β BMI1 x BMI1 + β BMI2 x BMI2 +β BMI4 x BMI4 +β BMI5 x BMI5 + β Smoke x smoke )

75 Survival analysis (Flera variabler, confounding) Uppgift! Skriv upp en cox-modell som avser att undersöka risk för CVD om man röker (fyra kategorier av rökningsklassificering: aldrig (referensgrupp), Låg (L), Mellan (M) och hög (H)). Modellen skall justeras för ålder vid inklusion i studien. Tänk också på hur variablerna skulle vara kodade.

76 Survival analysis (interaktion) Interaktion - Interaktion i statistisk mening innebär att effekten av en variabel beror på en eller flera andra variabler. - En Cox-modell med interaktionsterm har följande utseende: h t, x = h 0 t exp(β BMI x BMI + β Smoke x smoke + β Smoke BMI x smoke x BMI ) - Interaktion enligt ovan nämns ofta som multiplikativ - Interaktion kan också vara additativ

77 Survival analysis (interaktion)

78 Survival analysis (interaktion) Hur avgör man om det finns interaktionseffekter? - Walds test för interaktionskoefficienten! H 0 : β Smoke*BMI = 0 H 1 : β Smoke*BMI 0 Additativ interaktion är en annan historia

79 Survival analysis (interaktion) Uppgift Avgör om interaktionskoefficienten är signifikant skild från 0 β GenHLA =1.7, SE=0.2 β Smoke = 0.6, SE=0.15 β Smoke GenHLA =0.8, SE=0.2 Beräkna HR om man har den genetiska riskfaktorn (GenHLA) och är rökare. HR=exp(1.7* *1+ 0.8*1) = exp(3.1) = 22.2

80 Survival analysis (proprotional hazard assumption) Ett viktigt antagande vi gör när vi använder cox-regression är att våra oberoende variabler ej varierar med tiden. Till exempel: Vi antar att riskökningen om man är rökare är konstant över tid. Om rökning ej skulle vara konstant över tid så skulle det i extrema fall innebära att rökning är farligt fram till en viss tidpunkt. Efter denna tidpunkten så är rökning skyddande mot sjukdom.

81 Survival analysis (proprotional hazard assumption) Plotta överlevnadskurvorna för respektive grupp (exponerade, oexponerade) Residualer - Martingaler - Schoenfeld Stratifiering, Bra att dela upp analysen för variabeln som medför bekymmer t.ex. dela upp analysen för icke rökare respektive rökare

82 Survival analysis (proprotional hazard assumption) Plotta överlevnadsfunktionen för de olika exponeringsgrupperna. Korsar kurvorna varandra = problem (ej proprotionell hazard över tid)

83 Survival analysis (proprotional hazard assumption) Vanligt att plotta log(hazardfunktion) mot log(tid) för att undersöka om de olika grupperna är parallella Jmf med linjär regression.

84 Survival analysis (proprotional hazard assumption) Metod 2: Residualer Residualer används för att skatta hur bra en modell (Cox regressionsmodell) passar observerade data För Cox-modeller finns ingen direkt motsvarighet till linjär regression (residual=observerat-skattat värde) Två olika typer av residualer - Martingaler - Schoenfeld

85 Survival analysis (proprotional hazard assumption) Martingaler beräknas genom att ta utfallet för en person (0=censurerad, 1=händelse) minus (-) den kumulativa hazardfunktionen baserat på cox-modellen) t.ex. - Exempel 1: En person är censurerad vid 2 månader, Den beräknade kumulativa hazarden är 20 % (0.2). Martingalresidualen blir då: = Exempel 2: En annan person blir sjuk vid 13 månader (en händelse), Den beräknade kumulativa hazarden är 50 % (0.5). Martingalresidualen blir då: = 0.5 Osv. för alla individer STATA: stcox group var1 var2, mgale(mgaleres)

86 Survival analysis (proprotional hazard assumption) Martingaler måste transformeras (göras om) till deviance residualer Deviance-residualer skall ha ett medelvärde runt 0 och en standardavvikelse runt 1 om modellen stämmer Här är värdet på residualen plottat (y-axel) vs. Värdet på en kovariat (x-axel)

87 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Bra för att undersöka olika variabler. Här får varje individ ett residualvärde för varje variabel (jmf. Med martingalresidualer) Schoenfelds residualer definieras som skillnaden mellan en persons observerade och förväntade värde för en viss variabel

88 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Exempel (förväntad sannolikhet=skattad sannolikhet från coxmodell, vid en specifik tidpunkt): Kvinna 55-år rökare (förväntad sannolikhet =0.1) Man 45-år icke rökare (förväntad sannolikhet=0.05) Kvinna 67-år rökare (förväntad sannolikhet=0.2) Man 58-år rökare (förväntad sannolikhet=0.30) Man 70-år icke rökare (förväntad sannolikhet=0.20) I detta fall så råkar den 55-åriga kvinnan ut för sjukdom. Förväntad ålder: 0.1* * * * *70=60 Residual=observerat värde skattat värde=55-60=-5

89 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Schoenfelds residualer är i princip oberoende av tid. Detta medför att om residualerna inte är slumpmässigt fördelade runt 0 så är det ett tecken på att proportional hazard assumption inte håller. STATA: stcox group var1 var2, schoenfeld(schoen*) scaledsch(scaled*) Plot: stphtest, rank plot(group)

90 Survival analysis Uppgift (proprotional hazard assumption) Vad är tolkning av denna residualplot?

91 Survival analysis (proprotional hazard assumption) Övriga modeller Om tiden är viktig i analysen t.ex. att risken varierar över tid. Parametriska metoder där tiden modelleras Accelerated time failure models (AFT) Högre precision, kräver att man specificerar rätt föredelning

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL) Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3

Läs mer

Överlevnadsanalys. Överlevnadsanalys med tidsberoende kovariater. Tid till en händelse: observationer i kalendertid och som tid från start.

Överlevnadsanalys. Överlevnadsanalys med tidsberoende kovariater. Tid till en händelse: observationer i kalendertid och som tid från start. Överlevnadsanalys Överlevnadsanalys med tidsberoende kovariater Peter Höglund USiL 10 februari 2010 Kaplan-Meier Logrank test Cox-regression Tidsberoende kovariater (Tidsuppdaterade kovariater tas inte

Läs mer

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data Överlevnadsanalys 732G34 Statistisk analys av komplexa data 1 Tvärsnittsstudie Prospektiv Kohortstudie Observationsstudie Tvärsnittsstudie Retrospektiv Experimentell studie (alltid prospektiv) Klinisk

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test? ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test? Mikael Eriksson Specialistläkare CIVA Karolinska Universitetssjukhuset, Solna Grund för hypotestestning 1. Definiera noll- och alternativhypotes,

Läs mer

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell) EPIDEMIOLOGI Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell) Läran om utbredningen av och orsakerna till hälsorelaterade tillstånd eller förhållanden i specifika populationer och tillämpningen

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Tre av tio har avgått

Tre av tio har avgått Statistiska institutionen Tre av tio har avgått En överlevnadsstudie av tiden till avgång för kommunfullmäktigeledamöter i Stockholms län. Three in ten has resigned A survival analysis of time to resignation

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

1. INLEDNING Problemformulering Syfte Avgränsningar 4 2. TIDIGARE STUDIER 5 3. METOD Överlevnadsanalys 6 3.

1. INLEDNING Problemformulering Syfte Avgränsningar 4 2. TIDIGARE STUDIER 5 3. METOD Överlevnadsanalys 6 3. Sammanfattning Denna uppsats använder sig av SCB:s registerdata som omfattar samtliga par som gifte sig för första gången under 1998, dessa par studeras under cirka elva år fram till den 31 december 2008.

Läs mer

Sammanfattning. Förord

Sammanfattning. Förord Sammanfattning Varför regerar vissa ledare längre än andra? Uppsatsen använder ett datamaterial över ledares tid vid makten i 167 länder från början av 1800-talet till 1987 för att försöka besvara denna

Läs mer

Studietyper, inferens och konfidensintervall

Studietyper, inferens och konfidensintervall Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Analys av proportioner

Analys av proportioner Analys av proportioner Innehåll Proportion konfidensintervall Jämförelse av två proportioner Två oberoende stickprov Relativ risk Parvisa observationer Jämförelse av tre eller flera proportioner x² (chi-två)

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

FAKTORER SOM PÅVERKAR RISKEN ATT AVLIDA EFTER EN STROKE

FAKTORER SOM PÅVERKAR RISKEN ATT AVLIDA EFTER EN STROKE FAKTORER SOM PÅVERKAR RISKEN ATT AVLIDA EFTER EN STROKE En överlevnadsanalys med fokus på interaktion mellan kön och socioekonomiska faktorer Fredrik Nilsson, Mikael Marklund Hjelm Kandidatuppsats 15 hp

Läs mer

Hur skriver man statistikavsnittet i en ansökan?

Hur skriver man statistikavsnittet i en ansökan? Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK TERM Analytisk statistik Bias Confounder (förväxlingsfaktor)) Deskriptiv statistik Epidemiologi Fall-kontrollstudie (case-control study)

Läs mer

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Formell analys Informell data analys Design and mätning Problem Formell analys Informell data analys Hur

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Studiedesign: Observationsstudier

Studiedesign: Observationsstudier Studiedesign: Observationsstudier Kvantitativa metoder II: Teori och tillämpning Folkhälsovetenskap 4, termin 6 Hanna Hultin hanna.hultin@ki.se Disposition Introduktion Kohortstudie Fall-kontrollstudie

Läs mer

Analys av miljööverträdelser i Sverige. Miljösanktionsavgiftens påverkan på återfall. Analysis of environmental violations in Sweden

Analys av miljööverträdelser i Sverige. Miljösanktionsavgiftens påverkan på återfall. Analysis of environmental violations in Sweden Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2015:8 Analys av miljööverträdelser i Sverige Miljösanktionsavgiftens påverkan på återfall Analysis of environmental

Läs mer

Studiedesign och effektmått

Studiedesign och effektmått Studiedesign och effektmått Kohortstudier och randomiserade studier Disposition Mått på association Studiedesign Randomiserade kliniska/kontrollerade prövningar Kohortstudier Mått på sjukdomsförekomst

Läs mer

Examensarbete 2008:7

Examensarbete 2008:7 Matematisk statistik Stockholms universitet Överlevnadsanalys baserad på upprepade oregelbundna mätningar Applicering av statistiska metoder för jämförelse av två behandlingsmetoder mot depression Tsegalem

Läs mer

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten Agenda Statistik Termin 11, Läkarprogrammet, VT14 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer. KOD: Kurskod: PC1244 Kursnamn: Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2014-09-26 Tillåtna hjälpmedel: Miniräknare Tentan består av

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

SAMMA SJUKVÅRD I HELA

SAMMA SJUKVÅRD I HELA SAMMA SJUKVÅRD I HELA RIKET? EN JÄMFÖRELSE AV ÖVERLEVNAD VID BEHANDLING AV ALLVARLIGA SJUKDOMAR. SARAH WOLF Examensarbete för Kandidatexamen 2017:K16 Naturvetenskaplig fakultet Matematikcentrum Matematisk

Läs mer

Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk

Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk Idag: AstraZeneca i Lund I morgon: Statistik-konsulterna Innehåll Risker på individ- och populationsnivå Preliminaria Logrank test/cox

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012 Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012 1. Risk Ratio & Odds Ratio Risk- och odds ratio beräknar sambandet mellan två dikotoma variabler. Inom forskning

Läs mer

FACIT (korrekta svar i röd fetstil)

FACIT (korrekta svar i röd fetstil) v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta

Läs mer

TMS136. Föreläsning 4

TMS136. Föreläsning 4 TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Vad beror skillnaden på? Systematiska och slumpmässiga fel

Vad beror skillnaden på? Systematiska och slumpmässiga fel Vad beror skillnaden på? Systematiska och slumpmässiga fel Typer av fel och rätt Verklig skillnad Stort slumpfel! En studie genomförs Vi observerar en skillnad! Vi observerar ingen skillnad Slumpfel Systematiska

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

En undersökning av sambandet mellan kronisk inflammation och lungcancer

En undersökning av sambandet mellan kronisk inflammation och lungcancer Kandidatuppsats för Statistik- och Dataanalys programmet En undersökning av sambandet mellan kronisk inflammation och lungcancer Emma Daréus & Hektor Suhr 2013-11-11 Linköpings Universitet Abstract Cancer

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna

Läs mer

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013 Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2013-08-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och

Läs mer

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Parade och oparade test

Parade och oparade test Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2012-01-13 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer

Läs mer

1 Föreläsning V; Kontinuerlig förd.

1 Föreläsning V; Kontinuerlig förd. Föreläsning V; Kontinuerlig förd. Ufallsrummet har hittills varit dsikret, den stokastisk variabeln har endast kunnat anta ett antal värden. Ex.vis Poissonfördeln. är antal observationer inom ett tidsintervall

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10 Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10 Läsanvisningarna baseras på boken Björk J. Praktisk statistik för medicin och hälsa, Liber Förlag (2011), som är gemensam kursbok för statistikavsnitten

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk) Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid 1 (9) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 a) Nämn en kontinuerlig och en diskret fördelning. Exempelvis normalfördelningen respektive

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller S0004M Statistik 1 Undersökningsmetodik. Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller Till denna laboration ska det angivna datamaterialet användas och bearbetas med den statistiska

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110319)

EXAMINATION KVANTITATIV METOD vt-11 (110319) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

0 om x < 0, F X (x) = c x. 1 om x 2.

0 om x < 0, F X (x) = c x. 1 om x 2. Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-06-02 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mikael Stenlund Examinator:

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Kvantitativa metoder och datainsamling

Kvantitativa metoder och datainsamling Kvantitativa metoder och datainsamling Kurs i forskningsmetodik med fokus på patientsäkerhet 2015-09-23, Peter Garvin FoU-enheten för närsjukvården Kvantitativ och kvalitativ metodik Diskborsten, enkronan

Läs mer

Epidemiologi 2. Ragnar Westerling

Epidemiologi 2. Ragnar Westerling Epidemiologi 2 Ragnar Westerling Analytiska studier Syftar till att undersöka vilken/vilka faktorer som ökar risken för sjukdom Två huvudtyper av studier: Kohortstudie Fall-kontrollstudie Kohortstudie

Läs mer

Föreläsning 12: Repetition

Föreläsning 12: Repetition Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer