Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor
|
|
- Ann-Sofie Lindström
- för 9 år sedan
- Visningar:
Transkript
1 Survival analysis (Dag 1) Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Henrik Källberg, 2012
2 Survival analysis (Dag 1) Mål - Kunna grundläggande begrepp och koncept inom överlevnadsanalys - Förstå skillnad mellan händelse och censurering - Utföra enklare beräkningar - Förstå vad överlevnadsfunktionen beskriver - Kunna skatta överlevnadssannolikhet genom parametrisk metod med hjälp av exponentialfördelningen - Kunna jämföra olika överlevnadskurvor mha. Logrank-test
3 Survivalanalysis (studietyper) Kohortstudier Oexponerade Exponerade Oexp. fall Exp. fall Randomiserade studier, Kliniska prövningar Randomisering Behandling Alla individer Placebo Studietid
4 Survival analysis (exempel)
5 Survival Analysis Tid till händelse kan vara tid till sjukdom från studiestart, Tid till händelse (Time to event) Tid (t) Studie start Studie slut
6 Survival analysis - Censurering Censurering innebär att man har ofullständig information om vad som hänt en individ. Censurering är icke informativ om orsaken inte har med händelsen (sjukdom) som man studerar Höger censurering: En individ följs upp över en tid utan att någon händelse inträffar under uppföljningstiden Höger censurering kan bero på: - Att individen avlider på grund av en annan orsak än den som studeras. - Studien avslutas innan en händelse uppstår (tex. Sjukdom). Uppföljningstiden är för kort. - En individ hoppar av studien innan studien avslutas (loss to follow up)
7 Survival analysis - Censurering Vänstersidig censurering: Innebär att en händelse inträffat men man vet inte när. Vänstersidig censurering är ovanligare och är ofta relaterat till att man har en ställtid där individen inte vet när händelsen inträffade. Tex. - Insjuknande innan symptomdebut tex. Cancer, HIV Sjudomsdebut Uppfölj. tid Ställtid Start studie Symptom Viktigt att tänka på eventuell ställtid i samband med studiedesignen
8 Survival Analysis Uppgift Vilka individer är censurerade? Time to event Time (t) Study start Study end
9 Survival analysis (Livslängdstabeller) Ålder vid start vid Dekaden Sannolikhet för död under dekad ???? ???? Antal levande vid dekadens början
10 Survival analysis Day 1 Överlevnadsfunktionen, S(t) : Beskriver sannolikheten att inte drabbas av en händelse före en given tidpunkt (t). S(t)
11 Survival analysis Utfallsvariabeln är tid till händelse (time to event) Denna utfallsvariabel är oftast inte normalfördelad Fördelningsfunktionen för tid till händelse (time to event) betecknas f(t)
12 Survival analysis Day 1 Överlevnadsfunktionen, S(t) : Beskriver sannolikheten att inte drabbas av en händelse före en given tidpunkt (t). Fråga: Vad är sannolikheten att inte drabbas av en händelse före tidpunkt = 80?
13 Survival analysis (Överkurs) Sambandet mellan fördelningsfunktionen för tiden f(t) och överlevnadsfunktionen är ser ut på följande sätt: S( t) f ( t) dt 1 F( t) eller f ( t) S'( t) t
14 Survival analysis (Kaplan Meier) Hur beräknar man sannolikheten för överlevnad med hjälp av överlevnadsfunktionen S(t)? Kaplan-Meier - För att överleva t antal tidpunkter måste man överleva t-1 tidpunkter och den sista tidpunkten i intervallet. - Betecknas: S(t)=S(t-1)*P(överleva tidpunkten t) STATA: Definiera variabler: stset survt, failure(event==1), sts list (för skattningar), sts graph (för plot av kurva) sts grap,by(group) (plot uppdelat på grupper)
15 Survival analysis (Kaplan Meier) Kaplan Meier - Icke parametrisk metod (vi antar inte att överlevnadsfunktionen har en speciell form) Antaganden: - Observationerna är oberoende av varandra - Censureringen är oberoende av händelserna vi studerar t.ex. att sjukdomen som vi studerar inte är kopplad till att censurering uppkommer - Att vi vet den exakta tiden till en händelse
16 Survival analysis (Kaplan Meier) Tidpunkt (t) minuter Antal friska vid t. a t Sjuka under interv. d t Antal förlorade individer c t Antal indiv. under risk n t =a t -c t Risk sjuk vid t r t =d t /n t Frisk vid t s t =1-r t Kumulat. Överlev. I s(t)=s(t-1) s(t) /21 21/21 1*21/ /21 1-1/21= /20 1-0/20 = 1 1*0.95= * /20 = = 17 1/17 = /16 = = = = *0.95 = * = * = 0.705
17 Survival analysis (Kaplan Meier) 1 s(t) 0,8 0,6 0,4 0, t
18 Survival analysis (Kaplan Meier) Konfidensintervall för överlevnadsfunktionen S(t) Standard Error (SE) skattas med hjälp av följande formel: SE S t = S(t) d t a t (a t d t ) 95% Konfidensintervall vid tidpunkten Där d t är antal event vid tidpunkt t och a t är antalet friska individer vid t Denna formel kallas Greenwoods formel
19 Survival analysis (Kaplan Meier) Uppgift! Beräkna 95 procentigt Konfidensintervall Tidpunkt (t) minuter Antal friska vid t. a t Sjuka under interv. d t Antal förlorade individer c t Antal indiv. under risk n t =a t -c t Risk sjuk vid t r t =d t /n t Frisk vid t s t =1-r t Kumulat. Överlev. I s(t)=s(t-1) s t /20 = = *0.95 = SE S t = S(t) d t a t (a t d t )
20 Survival analysis Ibland har man inte exakta tidpunkter Vi har bara information för vissa tidsintervall!! Data är grupperat Tidsintervall
21 Survival analysis ( life table ) Det är ingen större skillnad mellan beräkningarna för överlevnadsfunktionen för en Life-table jämfört med Kaplan Meier Skillnaden består i huvudsak av att man antar att de censurerade personerna bidrar med information under halva tidsperioden där de försvinner. Antalet individer under risk för en särskild period är antalet individer i början av perioden minus halva antalet individer som faller bort (loss to follow up) Låt oss titta på exempel
22 Survival analysis ( life table uppgift!!) Intervall (månader sedan start) i Antal levande i början av i. a i Döda under interv. d i Antal förlorade individer c i Antal indiv. under risk n i =a i -c i /2 Risk att dö under i r i =d i /n i P överleva i s i =1-r i /100 = /2 = 88 4/88 = = = Kumulat. Överlev. I s(i)=s(i-1) s i = ??????????? /58 = = =
23 Survival analysis ( life table ) Intervall (månader sedan start) i Antal levande i början av i. a i Döda under interv. d i Antal förlorade individer c i Antal indiv. under risk n i =a i -c i /2 Risk att dö under i r i =d i /n i P överleva i s i =1-r i /100 = /2 = 88 4/88 = = = Kumulat. Överlev. I s(i)=s(i-1) s i = /2 = 70 7/70= /58 = = = = =
24 Survival analysis (Parametrisk Skattning) Parametrisk skattning av S(t) Om vi kan anta en fördelning för tiden T~Exponential: S t = exp λt Man måste skatta λ för att kunna skatta S(t) Hastigheten λ skattas med λ = d t Vi antar att λ är konstant över tid.
25 Survival analysis (Parametrisk Skattning Uppgift) Antal individer (a) Tid (t) Tid*a Antal Händelser Summa Uppgift! λ = d t = S t = e t S t = 52 =?
26 Survival analysis (Jämföra kurvor) Olika grupper t.ex. - Behandlade och obehandlade, - Exponerade och oexponerade Logrank test - Chi-Två - Wilcoxon-Gehan
27 Survival analysis (Jämföra kurvor) ex.
28 Survival analysis (Jämföra kurvor) Två olika Kurvor, olika behandlingar Logrank Test Icke Parametriskt test H 0 : S A (t) = S B (t) (Överlevnadsfunktionen är likadan i båda grupperna) H 1 : S A (t) S B (t) (Överlevnadsfunktionerna är olika) Bakomliggande ide: Beräkna förväntat antal händelser och jämföra med observerat antal händelser.
29 Survival analysis (Jämföra kurvor) Konstruera följande tabell för alla!!! tidpunkter där händelse(r) inträffar: Grupp Antal friska vid t. a t Antal händelser d t Förväntat antal händelser (A) A t,a d t,a E t,a =d t *(A t,a /A t ) (B) A t,b d t,b E t,b =d t *(A t,b /A t ) Totalt A t d t E t = d t Variansen för d t,a = d t,b, V t,k = d t A t,a A t,b (A t d t ) A 2 (A t 1)
30 Survival analysis (Jämföra kurvor) Grupp A Behandling Grupp B Obehandlade Tid Antal friska vid t. a t Antal händelser d t Förväntat antal händelser Antal friska vid t. a t Antal händelser d t Förväntat antal händelser 1 A 1,A d 1A E 1A =d t *(A 1A /A t ) A 1,B d 1B E 1B =d t *(A 1B /A t ) 2 A 2,A d 2,A E 2,A =d t *(A 2A /A t ) A 2,B d 2,B E 2,B =d t *(A 2B /A t ) 3 A 3,A d 3,A E 3,A =d t *(A 3A /A t ) A 3,B d 3,B E 3,B =d t *(A 3B /A t ) k A k,a D k,a E K,A =d t *(A KA /A t ) A k,b D k,b E K,B =d t *(A KB /A t ) Totalt D +,A E +,A D +,B E +,B Ideen bakom är att jämföra observerat antal händelser mot förväntat antal om det inte var någon skillnad d t =d ta +d tb och A t =A ta + A tb
31 Survival analysis (Jämföra kurvor) Teststatistika är χ 2 fördelad och beräknas genom: U L = k (d t,k E t,k ), V L = k V t,k, χ 2 = U2 V L med 1 frihetsgrad (antal grupper-1), vilket innebär att P(χ )=0.05 (signifikansnivån) Det finns en snabbversion som utgår från: χ 2 (D +A E +A ) 2 E +A + (D +B E +B ) 2 E +B STATA: sts test group, sts test group,wilcoxon
32 Survival analysis (Jämföra kurvor) Ex. Här är data från en fiktiv studie som jämför två olika behandlingar
33 Survival analysis (Jämföra kurvor) ex. Exempel beräkning förväntat antal döda i behandlingsgrupp 2
34 Survival analysis (Jämföra kurvor) ex. I föregående slide visades hur man beräknar förväntat antal döda för behandling 2. Nästa steg är att göra samma sak för behandling 1. Beräkna Chi-två värde: χ 2 (D +1 E +1 ) 2 E +1 + (D +2 E +2 ) 2 E +2 = (4 7.08) (6 2.92)2 =4.59 (1 fg) 2.92
35 Survival analysis (Jämföra kurvor) Logrank testet är känsligt för sena skillnader mellan överlevnadskurvorna. Om man vet att tidiga skillnader är av särskilt intresse så kan man med hjälp av Wilcoxon-Gehan test vikta för tidiga skillnader med hjälp av antal personer under risk vid t. U L = k A t,k (d t,k E t,k ), V L = k A 2 t,k V t,k Val av test bör göras innan man ser data (annars väljer man det som passar data bäst inte apriori teori)
36 Survival analysis (Jämföra kurvor) Fler grupper! Logrank-testet går att generalisera till fler än två grupper. Viktigt att tänka på antal frihetsgrader (antal grupper-1).
37 Survival analysis (Jämföra kurvor) Uppgift Grupp Obs. Antal händelser (D) Totalt Ledtråd: χ 2 (D +A E +A ) 2 E +A + (D +B E +B ) 2 E +B +???? Förväntade antal händelser (E) χ 2 -tabell:
38 Survival Analysis (Logrank test) Styrkor Inga modellantaganden => kan användas på de flesta data Kan användas på kategoridata. Svagheter Kan inte användas för att modellera tiden. Ingen möjlighet att testa hur variabler påverkar modellen Konfidensintervall är modelloberoende. Variablers effekt kan bara undersökas genom att stratifiera (dela upp data) Omöjligt att använda kontinuerliga variabler
39 Survival analysis (Dag 2) Upplägg Dag 2 Hazard-funktionen Proportional Hazard model (Cox-model) Olika variabler Statistiska test
40 Survival analysis (Dag 2) Mål - Veta hur Hazardfunktionen är relaterad till överlevnadsfunktionen (S(t)) - Veta hur Cox-regressionsmodellen ser ut - Förstå Proportional Hazard assumption - Beräkna Hazard Ratio för olika variabler - Avgöra om en variabel är signifikant i en Coxmodell
41 Survival analysis (Hazardfunktionen) Fördelning tid till händelse, f(t): Överlevnadsfunktionen S(t): t S ( t) f ( t) dt 1 F( t) Hazardfunktionen h(t): f ( t) d h( t) log( S( t)) S( t) dt
42 Survival analysis (Hazardfunktionen) Hazardfunktionen h(t) beskriver antal händelser per tidsenhet ( hastighet för att händelse(r) inträffar) Den kumulativa Hazardfunktionen (lättare att plotta eftersom Hazardfunktionen återger den momentana risken. ges av: -log(s(t))=h 0 (T) Hazardfunktionen beskriver sannolikhet att sjukdom (händelse) inträffar strax efter tiden t givet att sjukdom inte inträffat före t. Vi håller oss till det enkla exemplet med att Hazardfunktionen är konstant (exponentiell fördelning). Det finns dock andra fördelningar där hazardfunktionen ökar eller minskar över tid (t.ex. Weibullfördelningen)
43 Survival analysis (Hazardfunktionen) Kom ihåg: f ( t) S'( t) f ( t) d Och: h( t) log( S( t)) S( t) dt f(t)= e - t =S (t) Kvoten blir då: h( t) f ( t) S( t) e e t t S(t)=e - t h(t)=
44 Survival analysis (Hazardfunktionen) Föregående exempel utgår från att tiden till händelse är exponentialfördelad (Dag1) T ~ exp (λ) P(T=t) = λe -λt där λ är en konstant hastighet. Låt oss anta att alla individer har konstant risk för att drabbas av sjukdom och att det som skiljer är en specifik variabel (t.ex. rökning, kön, ålder)
45 Survival analysis (Cox regression) Man behöver inte välja en speciell sannolikhetsfördelning för överlevnadstiden och är därför säker. Semi-parametrisk (Kaplan-Meier är icke-parametrisk; exponential och Weibull är parametriska) Man kan använda diskreta och kontinuerliga variabler. Lätt att använda tidsberoende variabler (variabler som ändras över tid)
46 Survival analysis (Cox regression) Vi utvecklar Hazardfunktionen så att den ser ut på följande sätt: h t, x = h 0 t exp(β x) Obs! (exp(β x) = e β*x ) e = talet 2.72 Nu består vår Hazardfunktion (h(t,x)) av två delar: h 0 t och exp β x där h 0 t är baseline Hazard och exp β x är en konstant som påverkar Hazardfunktionen (kan bero på en variabel) jmf. Med h( t) f ( t) S( t) e e t t Överlevnadsfunktionen ser ut på följande sätt: S t, x = e (H 0 t exp β x ) = [S 0 (t)] exp(β x)
47 Survival analysis (Cox regression) Nu kan vi beräkna Hazard Ratio (HR) HR tolkas ofta som en relativ risk (RR) trots att vi inte vet absolut risk. HR skattar i detta fall en incidens kvot Hazard för person i (eg en rökare) Hazard ratio HR i, j h h 1xi1... k xik i ( t) 0 ( t) e 1( xi1 x j1)... 1( xik x jk ) e 1x j1... k x jk j ( t) 0 ( t) e 0 ( t) h0 ( t Hazard för person j (eg en icke rökare) Obs!! )
48 Survival analysis (Cox regression) Antaganden Proportional Hazard Assumption - Hazardfunktionerna för respektive grupp är proportionella gentemot varandra. Det som skiljer dom åt är exp(β*x). Detta innebär att HR ( RR ) inte beror av tiden - Risken är multiplikativ h t, x = h 0 t exp(β x)
49 Survival analysis (Cox regression) Data-exmpel (Dikotom variabel) Individ Rökare (1=ja,0=nej) Tid till event Event (1=ja, 0=nej)
50 Survival analysis (Cox regression) Kategorisk variabel (Dikotom) HR lung cancer / smoking h h i j ( t) ( t) ( t) e 0 ( t) e 0 smoking smoking (1) (0) e smoking (1 0) HR lung cancer / smoking e smoking Detta är Hazard ratio för rökning, lägg märke till att rökning är i detta fall oberoende av tid.
51 Survival analysis (Cox regression) ex.
52 Survival analysis (Cox regression) Data-exempel (Flera grupper, tex. Ålderskategorier, storlek), Ordinaldata Individ Ålder Ålder1 ( 30 år,<40) Ålder2 ( 40 år, <50) Ålder3 ( 50 år) Tid till event
53 Survival analysis (Cox regression) Flera grupper, Ordinal data HR lung cancer / Ålderskategori, ålder2 vs.ålder 0 h h i j ( t) ( t) ( t) e 0 ( t) e 0 Ålder1(0) Ålder1(0) Ålder 2 Ålder 2 (1) (0) Ålder 3 Ålder 3 (0) (0) e ålder 2 (1) HR lung cancer / ålder2 vs.ålder 0 e ålder 2(1) Detta är Hazard ratio för ålder 2 (30-40 år) jmf med <30 år STATA: stcox group alder stcox group alder, nohr (Om du vill ha beta-koefficienter och ej HR)
54 Survival analysis (Cox regression) Uppgift Kategorisk variabel (Dikotom) I en studie beträffande risk för lungcancer och rökning erhölls följande resultat β = 1.6, SE(β)=0.5 Skatta den relativa risken och ett 95%-igt konfidensintervall för att drabbas av lungcancer om man röker Svar: RR=HR=e 1.6*1(rökare=1) = 4.95, Undre gräns 95%-igt RR= e *0.5 =1.85 Övre gräns 95%-igt RR=e *0.5 =13.2
55 Survival analysis (Cox regression) Kontinuerlig variabel (tex. Ålder, Koncentration av ämne, temperatur) Individ Ålder Tid till event
56 Survival analysis (Cox regression) Kontinuerlig Variabel HR lung cancer /10 years increase in age h h i j ( t) ( t) ( t) e 0 ( t) e 0 age age (70) (60) e age (70 60) HR lung cancer /10 years increase in age e age (10) Detta är Hazard ratio för tio år åldersökning
57 Survival analysis (Cox regression) Uppgift Kontinuerlig Variabel I en studie beträffande ålder och risk för lungcancer erhölls följande resultat β = 0.05, SE(β)=0.05 Skatta den relativa risken och ett 95%-igt konfidensintervall för att drabbas av lungcancer från 55 års ålder till 60 års ålder Svar: RR=HR=e 0.05*(60-55) = 1.28 Undre gräns 95%-igt RR= e 0.05*(60-55)-1.96*5*0.05 =0.77 Övre gräns 95%-igt RR= e 0.05*(60-55)-1.96*5*0.05 = 2.10
58 Survival analysis (Cox regression) Uppgift I denna artikel om Cadmium och risk för CVD så har man kategoriserat en kontinuerlig variabel
59 Survival analysis (Cox regression) För att avgöra om en variabel (tex. Rökning, Asbest eller behandling) medför en signifikant ökad eller minskad RR (eg. Hazard ratio (HR)) så måste den testas. En vanlig metod för att testa signifikans kallas Wald test Andra vanliga test är Likelihood ratio och Score test
60 Survival analysis (Cox regression) Walds test ges av följande formel: Där ˆ 0 Z SE ( ˆ) ˆ h t, x = h 0 t exp(β x) är en regressionskoefficient från Cox-modellen Och SE(β) är standard error för β Z är det standardiserade normalvärdet från normalfördelningen (Använd normalfördelningstabell)
61 Survival analysis (Cox regression) ˆ Walds test testar om är skiljt från 0. (om är 0 så innebär det att exp(β=0) är 1 vilket ger en HR (RR) som är 1 (mao. Det är ingen ökad eller minskad risk för sjukdom för den variabeln) ˆ H 0 : β = 0 H 1 : β 0
62 Survival analysis (Cox regression) Uppgift Beräkna z-värde med hjälp av Walds test med hjälp av följande uppgifter (Regressionskoefficient för rökning från lungcancer): β = 1.6, SE(β)=0.5 Signifikansnivå=0.05 z(gräns)=1.96 Avgör om koefficienten är skild från 0.
63 Survival analysis (Cox regression) Uppgift Z Exempel Normalfördelningstabell observera att endast några sannolikheter ges i tabellen I detta fall blir z=1.6/0.5 = 3.2 vilket ger ett p- värde på = Slutsats: denna koefficient är mycket signifikant, det finns en association mellan rökning och risk för lungcancer
64 Survival analysis (Cox regression) Uppgift Utför Walds test för den kontinuerliga variabeln ålder i tidigare exempel β = 0.05, SE(β)=0.05 Signifikansnivå=0.05 z(gräns)=1.96 Avgör om koefficienten är skild från 0. Hur förhåller sig Walds test till HR och dess 95%-iga konfidensintervall?
65 Survival analysis (Cox regression) Uppgift Beräkna Z-värde med hjälp av Walds test för behandling och ålder. Tolka resultat.
66 Survival analysis (Dag 3) Upplägg Dag 3 Fortsättning Cox-modellen Flera variabler Confounding Interaktion Test av proportional Hazard assumption Ytterliggare modeller
67 Survival analysis (Dag 3) Mål - Veta hur man infogar fler variabler i en cox modell - Förstå hur man kontrollerar för Confounding - Interaktion mellan variabler - Undersöka, testa proportional hazard assumption - Veta om att det finns ytterligare modeller
68 Survival analysis (Kort repetition) Hazardfunktionen h t, x = h 0 t exp(β x) Obs! (exp(β x) = e β*x ) e = talet 2.72 * h 0 t är baseline Hazard och exp β x är en konstant som påverkar Hazardfunktionen (kan bero på en variabel)
69 Survival analysis (Kort repetition) Hazard ratio (HR, RR ) Obs!! t) h ( ) 0( 0 t Hazard för person i (eg en rökare) Hazard ratio HR i, j h h 1xi1... k xik i ( t) 0( t) e 1( xi1 x j1)... 1( xik x jk ) e 1x j1... k x jk j ( t) 0( t) e Hazard för person j (eg en icke rökare)
70 Survival analysis (Kort repetition) Walds test (för att avgöra om variabel är signifikant i modell) : Z ˆ 0 SE ( ˆ)
71 Survival analysis (Flera variabler) Från Dag 2: HR lungcancer/10 years increase in age h h i j ( t) ( t) ( t) e 0 ( t) e 0 smoking smoking (0) (0) age age (70) (60) e age (70 60) HR lungcancer/10 years increase in age e age (10) Nu har vi utökat modellen så att både rökning och ålder finns med.
72 Survival analysis (Flera variabler, confounding) Confounding är ett stort problem i observationsbaserade studier (läs ej randomiserade studier) Confounding är när ett samband mellan två variabler kan förklaras av en tredje variabel. Kaffe och risk för lungcancer: Rökning Kaffe Lungcancer
73 Survival analysis (Flera variabler, confounding) Ej rökning rökning Rökning + Edu. Etnic. Emfys. Alc. Phys.
74 Survival analysis (Flera variabler, confounding) här är ett exempel på en Cox-modellen för HR i föregående tabell. h t, x = h 0 t exp(+β Age_study x Age_study + β BMI1 x BMI1 + β BMI1 x BMI1 + β BMI2 x BMI2 +β BMI4 x BMI4 +β BMI5 x BMI5 + β Smoke x smoke )
75 Survival analysis (Flera variabler, confounding) Uppgift! Skriv upp en cox-modell som avser att undersöka risk för CVD om man röker (fyra kategorier av rökningsklassificering: aldrig (referensgrupp), Låg (L), Mellan (M) och hög (H)). Modellen skall justeras för ålder vid inklusion i studien. Tänk också på hur variablerna skulle vara kodade.
76 Survival analysis (interaktion) Interaktion - Interaktion i statistisk mening innebär att effekten av en variabel beror på en eller flera andra variabler. - En Cox-modell med interaktionsterm har följande utseende: h t, x = h 0 t exp(β BMI x BMI + β Smoke x smoke + β Smoke BMI x smoke x BMI ) - Interaktion enligt ovan nämns ofta som multiplikativ - Interaktion kan också vara additativ
77 Survival analysis (interaktion)
78 Survival analysis (interaktion) Hur avgör man om det finns interaktionseffekter? - Walds test för interaktionskoefficienten! H 0 : β Smoke*BMI = 0 H 1 : β Smoke*BMI 0 Additativ interaktion är en annan historia
79 Survival analysis (interaktion) Uppgift Avgör om interaktionskoefficienten är signifikant skild från 0 β GenHLA =1.7, SE=0.2 β Smoke = 0.6, SE=0.15 β Smoke GenHLA =0.8, SE=0.2 Beräkna HR om man har den genetiska riskfaktorn (GenHLA) och är rökare. HR=exp(1.7* *1+ 0.8*1) = exp(3.1) = 22.2
80 Survival analysis (proprotional hazard assumption) Ett viktigt antagande vi gör när vi använder cox-regression är att våra oberoende variabler ej varierar med tiden. Till exempel: Vi antar att riskökningen om man är rökare är konstant över tid. Om rökning ej skulle vara konstant över tid så skulle det i extrema fall innebära att rökning är farligt fram till en viss tidpunkt. Efter denna tidpunkten så är rökning skyddande mot sjukdom.
81 Survival analysis (proprotional hazard assumption) Plotta överlevnadskurvorna för respektive grupp (exponerade, oexponerade) Residualer - Martingaler - Schoenfeld Stratifiering, Bra att dela upp analysen för variabeln som medför bekymmer t.ex. dela upp analysen för icke rökare respektive rökare
82 Survival analysis (proprotional hazard assumption) Plotta överlevnadsfunktionen för de olika exponeringsgrupperna. Korsar kurvorna varandra = problem (ej proprotionell hazard över tid)
83 Survival analysis (proprotional hazard assumption) Vanligt att plotta log(hazardfunktion) mot log(tid) för att undersöka om de olika grupperna är parallella Jmf med linjär regression.
84 Survival analysis (proprotional hazard assumption) Metod 2: Residualer Residualer används för att skatta hur bra en modell (Cox regressionsmodell) passar observerade data För Cox-modeller finns ingen direkt motsvarighet till linjär regression (residual=observerat-skattat värde) Två olika typer av residualer - Martingaler - Schoenfeld
85 Survival analysis (proprotional hazard assumption) Martingaler beräknas genom att ta utfallet för en person (0=censurerad, 1=händelse) minus (-) den kumulativa hazardfunktionen baserat på cox-modellen) t.ex. - Exempel 1: En person är censurerad vid 2 månader, Den beräknade kumulativa hazarden är 20 % (0.2). Martingalresidualen blir då: = Exempel 2: En annan person blir sjuk vid 13 månader (en händelse), Den beräknade kumulativa hazarden är 50 % (0.5). Martingalresidualen blir då: = 0.5 Osv. för alla individer STATA: stcox group var1 var2, mgale(mgaleres)
86 Survival analysis (proprotional hazard assumption) Martingaler måste transformeras (göras om) till deviance residualer Deviance-residualer skall ha ett medelvärde runt 0 och en standardavvikelse runt 1 om modellen stämmer Här är värdet på residualen plottat (y-axel) vs. Värdet på en kovariat (x-axel)
87 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Bra för att undersöka olika variabler. Här får varje individ ett residualvärde för varje variabel (jmf. Med martingalresidualer) Schoenfelds residualer definieras som skillnaden mellan en persons observerade och förväntade värde för en viss variabel
88 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Exempel (förväntad sannolikhet=skattad sannolikhet från coxmodell, vid en specifik tidpunkt): Kvinna 55-år rökare (förväntad sannolikhet =0.1) Man 45-år icke rökare (förväntad sannolikhet=0.05) Kvinna 67-år rökare (förväntad sannolikhet=0.2) Man 58-år rökare (förväntad sannolikhet=0.30) Man 70-år icke rökare (förväntad sannolikhet=0.20) I detta fall så råkar den 55-åriga kvinnan ut för sjukdom. Förväntad ålder: 0.1* * * * *70=60 Residual=observerat värde skattat värde=55-60=-5
89 Survival analysis (proprotional hazard assumption) Schoenfelds residualer Schoenfelds residualer är i princip oberoende av tid. Detta medför att om residualerna inte är slumpmässigt fördelade runt 0 så är det ett tecken på att proportional hazard assumption inte håller. STATA: stcox group var1 var2, schoenfeld(schoen*) scaledsch(scaled*) Plot: stphtest, rank plot(group)
90 Survival analysis Uppgift (proprotional hazard assumption) Vad är tolkning av denna residualplot?
91 Survival analysis (proprotional hazard assumption) Övriga modeller Om tiden är viktig i analysen t.ex. att risken varierar över tid. Parametriska metoder där tiden modelleras Accelerated time failure models (AFT) Högre precision, kräver att man specificerar rätt föredelning
Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)
Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3
Överlevnadsanalys. Överlevnadsanalys med tidsberoende kovariater. Tid till en händelse: observationer i kalendertid och som tid från start.
Överlevnadsanalys Överlevnadsanalys med tidsberoende kovariater Peter Höglund USiL 10 februari 2010 Kaplan-Meier Logrank test Cox-regression Tidsberoende kovariater (Tidsuppdaterade kovariater tas inte
Överlevnadsanalys. 732G34 Statistisk analys av komplexa data
Överlevnadsanalys 732G34 Statistisk analys av komplexa data 1 Tvärsnittsstudie Prospektiv Kohortstudie Observationsstudie Tvärsnittsstudie Retrospektiv Experimentell studie (alltid prospektiv) Klinisk
Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test? Mikael Eriksson Specialistläkare CIVA Karolinska Universitetssjukhuset, Solna Grund för hypotestestning 1. Definiera noll- och alternativhypotes,
EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)
EPIDEMIOLOGI Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell) Läran om utbredningen av och orsakerna till hälsorelaterade tillstånd eller förhållanden i specifika populationer och tillämpningen
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Tre av tio har avgått
Statistiska institutionen Tre av tio har avgått En överlevnadsstudie av tiden till avgång för kommunfullmäktigeledamöter i Stockholms län. Three in ten has resigned A survival analysis of time to resignation
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
1. INLEDNING Problemformulering Syfte Avgränsningar 4 2. TIDIGARE STUDIER 5 3. METOD Överlevnadsanalys 6 3.
Sammanfattning Denna uppsats använder sig av SCB:s registerdata som omfattar samtliga par som gifte sig för första gången under 1998, dessa par studeras under cirka elva år fram till den 31 december 2008.
Sammanfattning. Förord
Sammanfattning Varför regerar vissa ledare längre än andra? Uppsatsen använder ett datamaterial över ledares tid vid makten i 167 länder från början av 1800-talet till 1987 för att försöka besvara denna
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Analys av proportioner
Analys av proportioner Innehåll Proportion konfidensintervall Jämförelse av två proportioner Två oberoende stickprov Relativ risk Parvisa observationer Jämförelse av tre eller flera proportioner x² (chi-två)
F19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
FAKTORER SOM PÅVERKAR RISKEN ATT AVLIDA EFTER EN STROKE
FAKTORER SOM PÅVERKAR RISKEN ATT AVLIDA EFTER EN STROKE En överlevnadsanalys med fokus på interaktion mellan kön och socioekonomiska faktorer Fredrik Nilsson, Mikael Marklund Hjelm Kandidatuppsats 15 hp
Hur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK TERM Analytisk statistik Bias Confounder (förväxlingsfaktor)) Deskriptiv statistik Epidemiologi Fall-kontrollstudie (case-control study)
PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Statistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet
Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Formell analys Informell data analys Design and mätning Problem Formell analys Informell data analys Hur
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Studiedesign: Observationsstudier
Studiedesign: Observationsstudier Kvantitativa metoder II: Teori och tillämpning Folkhälsovetenskap 4, termin 6 Hanna Hultin hanna.hultin@ki.se Disposition Introduktion Kohortstudie Fall-kontrollstudie
Analys av miljööverträdelser i Sverige. Miljösanktionsavgiftens påverkan på återfall. Analysis of environmental violations in Sweden
Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2015:8 Analys av miljööverträdelser i Sverige Miljösanktionsavgiftens påverkan på återfall Analysis of environmental
Studiedesign och effektmått
Studiedesign och effektmått Kohortstudier och randomiserade studier Disposition Mått på association Studiedesign Randomiserade kliniska/kontrollerade prövningar Kohortstudier Mått på sjukdomsförekomst
Examensarbete 2008:7
Matematisk statistik Stockholms universitet Överlevnadsanalys baserad på upprepade oregelbundna mätningar Applicering av statistiska metoder för jämförelse av två behandlingsmetoder mot depression Tsegalem
Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten
Agenda Statistik Termin 11, Läkarprogrammet, VT14 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande
Multipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.
KOD: Kurskod: PC1244 Kursnamn: Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2014-09-26 Tillåtna hjälpmedel: Miniräknare Tentan består av
Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
SAMMA SJUKVÅRD I HELA
SAMMA SJUKVÅRD I HELA RIKET? EN JÄMFÖRELSE AV ÖVERLEVNAD VID BEHANDLING AV ALLVARLIGA SJUKDOMAR. SARAH WOLF Examensarbete för Kandidatexamen 2017:K16 Naturvetenskaplig fakultet Matematikcentrum Matematisk
Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk
Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk Idag: AstraZeneca i Lund I morgon: Statistik-konsulterna Innehåll Risker på individ- och populationsnivå Preliminaria Logrank test/cox
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012
Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012 1. Risk Ratio & Odds Ratio Risk- och odds ratio beräknar sambandet mellan två dikotoma variabler. Inom forskning
FACIT (korrekta svar i röd fetstil)
v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta
TMS136. Föreläsning 4
TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,
Statistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Vad beror skillnaden på? Systematiska och slumpmässiga fel
Vad beror skillnaden på? Systematiska och slumpmässiga fel Typer av fel och rätt Verklig skillnad Stort slumpfel! En studie genomförs Vi observerar en skillnad! Vi observerar ingen skillnad Slumpfel Systematiska
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
En undersökning av sambandet mellan kronisk inflammation och lungcancer
Kandidatuppsats för Statistik- och Dataanalys programmet En undersökning av sambandet mellan kronisk inflammation och lungcancer Emma Daréus & Hektor Suhr 2013-11-11 Linköpings Universitet Abstract Cancer
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Regressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
OBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna
Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013
Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process
En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:
1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt
Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2013-08-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och
Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas
Repetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Parade och oparade test
Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett
D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.
1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2012-01-13 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove
LABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
1 Föreläsning V; Kontinuerlig förd.
Föreläsning V; Kontinuerlig förd. Ufallsrummet har hittills varit dsikret, den stokastisk variabeln har endast kunnat anta ett antal värden. Ex.vis Poissonfördeln. är antal observationer inom ett tidsintervall
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10
Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10 Läsanvisningarna baseras på boken Björk J. Praktisk statistik för medicin och hälsa, Liber Förlag (2011), som är gemensam kursbok för statistikavsnitten
LABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys
Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
InStat Exempel 4 Korrelation och Regression
InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och
Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp
Sid 1 (9) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 a) Nämn en kontinuerlig och en diskret fördelning. Exempelvis normalfördelningen respektive
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller
S0004M Statistik 1 Undersökningsmetodik. Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller Till denna laboration ska det angivna datamaterialet användas och bearbetas med den statistiska
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
Till ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Några extra övningsuppgifter i Statistisk teori
Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,
1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?
Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten
Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
0 om x < 0, F X (x) = c x. 1 om x 2.
Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-06-02 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mikael Stenlund Examinator:
Examinationsuppgifter del 2
UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).
Matematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Kvantitativa metoder och datainsamling
Kvantitativa metoder och datainsamling Kurs i forskningsmetodik med fokus på patientsäkerhet 2015-09-23, Peter Garvin FoU-enheten för närsjukvården Kvantitativ och kvalitativ metodik Diskborsten, enkronan
Epidemiologi 2. Ragnar Westerling
Epidemiologi 2 Ragnar Westerling Analytiska studier Syftar till att undersöka vilken/vilka faktorer som ökar risken för sjukdom Två huvudtyper av studier: Kohortstudie Fall-kontrollstudie Kohortstudie
Föreläsning 12: Repetition
Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad