Interferens i kända och okända nätverk
|
|
- Jörgen Bengtsson
- för 7 år sedan
- Visningar:
Transkript
1 Interferens i kända och okända nätverk Samuel Hellman och Erik Lindberg Student Vt 2015 Examensarbete, 15 hp Statistikerprogrammet, 180 hp
2 Sammanfattning I experimentella studier och observationsstudier så antar vi ofta att behandlingen en försöksperson får inte påverkar utfallet för någon annan försöksperson. Detta samspel mellan försökspersoner kallas interferens. I den här uppsatsen undersöktes interferens med hjälp av simulering, och de konsekvenser det kan få att inte ta hänsyn till det. För att göra detta skapades ett antal grupper där varje individ tilldelades ett antal kontakter inom gruppen, vilket vi kallar ett socialt nätverk. I dessa nätverk delades behandlingar ut slumpmässigt. Utifrån fördefinierade effekter för direkt och indirekt exponering av en behandling analyserades hur olika metoders skattningar av behandlingarnas effekt presterar, samt för- och nackdelar med varje metod. Genom att göra detta har vi visat hur felaktiga skattningar kan bli, om man inte tar hänsyn till interferens. Abstract Title: Interference in known and unknown networks In experimental-, and observational studies we often assume that the treatment of one participant has no effect on the outcome of the treatment for another participant. This effect is called interference. In this essay we have studied interference by using computer simulations, and the potential consequences of dismissing the existence of interference. To do this we have created groups of individuals, where every individual will be assigned a number of contacts within the group, also called a social network. Then treatments was assigned randomly in those networks. Based on predefined effects of direct and indirect exposure to a treatment we have analyzed how different methods perform when estimating those effects. We have also evaluated the pros and cons of the different methods. By doing this we have shown how wrong the estimations of causal inference can get when ignoring the effects of interference. Populärvetenskaplig sammanfattning I medicinska försök och även andra studier antas oftast att försökspersoner inte har någon påverkan på varandra. I flera fall stämmer inte detta. Vi har i den här uppsatsen visat varför det kan vara viktigt att ta hänsyn till den påverkan försökspersoner har på varandra i medicinska försök, också kallat interferens. Om man struntar i interferens kan slutsatserna som dras från försöket bli missvisande, till exempel kan läkemedlet i ett medicinskt försök se ut att fungera när det i själva verket är verkningslöst. Undersökningen gjordes genom datorsimuleringar som upprepades 1000 gånger för att undvika missvisande resultat som endast beror på slumpen. Simuleringen gjordes genom att skapa grupper av personer med inbördes relationer inom gruppen, som vi kallar sociala nätverk. I de sociala nätverken har ett antal personer tilldelats en behandling. Sedan undersöktes de sociala nätverken som skapats med olika statistiska metoder. Vissa metoder tar hänsyn till interferens, andra gör det inte. Analysen resulterade i ett flertal situationer där felaktiga slutsatser drogs när antaganden om avsaknad av interferens gjorts. 1
3 Innehållsförteckning 1. Inledning Modell Rubins modell Modell med interferens för kända nätverk Modell med interferens för okända nätverk Simulering Simulering av direkt och indirekt effekt i kända nätverk Simulering av direkt och indirekt effekt för okända nätverk Resultat Resultat av simulering av direkt och indirekt effekt i kända nätverk Resultat av simulering av direkt och indirekt effekt för okända nätverk Diskussion Modell med interferens för kända nätverk jämfört med Rubins modell Modell med interferens för okända nätverk jämfört med Rubins modell Jämförelse av modeller med interferens för kända och okända nätverk Slutsats Referenser Bilagor
4 1. Inledning Kausal inferens innebär att man undersöker förändringen i ett utfall som sker då en individ får någon form av behandling (Morgan och Winship, 2007). Behandlingen kan innefatta vaccin mot en smittsam sjukdom, någon form av utbildning, olika rehabiliteringsformer efter en skada, eller något annat. Som en följd av dessa behandlingar kan utfallet vara antalet personer som insjuknar, resultat på ett prov, hur väl rehabiliterad en skada blir, eller något annat. Ofta i studier görs ett antagande om att den kontakt som försökspersoner har med varandra inte har någon påverkan på resultatet (Rubin 1980). Detta antagande kan vara uppfyllt men det är också troligt att så inte är fallet, alltså att den interaktion som försökspersoner har med varandra har en påverkan på resultatet. Den påverkan benämns som interferens och kan vara ett stort problem i vissa studier, exempelvis Sampaio m.fl. (2012) och Rahmqvist m.fl. (2014). Interferens kan orsaka att vi inte ser effekten av en behandling trots att behandlingen har en effekt. Interferensproblemet kan finnas i både observationsstudier och experimentella studier. Ett exempel där interferens kan existera är vaccinering mot en smittsam sjukdom. Då görs ofta ett antagande om att en vaccinerad individ inte påverkar risken att bli sjuk hos en annan individ som är ovaccinerad. Det kan dock finnas en påverkan om individerna har kontakt med varandra. Risken att bli sjuk för den icke vaccinerade bör vara mindre ifall att individen endast har kontakt med andra som har fått vaccin i jämförelse mot om individen har kontakt med endast individer som inte är vaccinerade. Några exempel från faktiska studier av interferensproblemet följer. En attitydsstudie där föräldrarna till elever i förskolan kunde prova på ett föräldraprogram som kallas Triple P vilket står för Positive Parenting Program. Triple P ska förbättra barnens beteende och attityder. Där observerades ett möjligt samband mellan beteendet hos barn och hur ändringar i beteendet påverkar andra barn som de leker med (Sampaio m.fl. 2012; Lundin och Karlsson 2014; Rahmqvist m.fl. 2014). Sobel (2006) beskrev hur införandet av rådgivning och så kallade housing vouchers inom bostadsområden i USA kunde hjälpa familjer att flytta till bättre områden. Detta för att förbättra faktorer som till exempel barnens skolbetyg. Sobel (2006) yrkade då för att när familjer som fått behandling planerar att flytta kommer även deras kontakter från samma område övertalas att flytta till bättre områden. Hong och Raudenbush (2006) gjorde en studie om effekten av att behöva gå om förskolan med avseende på läs- och mattekunskaper. Där studerade de även skillnaderna i effekten av att inte behöva gå om för skolor med högre andel kvarhållna elever jämfört med skolor som har lägre andel kvarhållna elever. Interferensen i det här fallet kommer från att varje elevs provresultat påverkas av hur stort antal kvarhållna elever de delar klass med. Crépon m.fl (2012) studerade effekten av en arbetsmarknadsinsats på unga högutbildade arbetssökande i Frankrike. De fann då att arbetsmarknadsinsatsen ökade chansen att få jobb för de deltagande, men sänkte chansen att få jobb för de som inte fick delta. Exemplen ovan visar att interferens kan finnas inom många områden. Syftet med vår uppsats är att belysa interferensproblemet med hjälp av simulering och lyfta fram varför det är viktigt att ha det i åtanke vid genomförandet av studier. 3
5 Det har gjorts några typer av modeller för att studera interferens. Uppsatsen kommer fokusera på två av dessa. En av modellerna använder grupper av individer med inbördes kontakter inom gruppen, kallat sociala nätverk, för skattning av kausala effekter och är skapad av Aronow och Samii (2013). Modellen bygger på att man känner till nätverket och alla relationer mellan individerna inom nätverket. Med hjälp av detta kan direkta och indirekta effekter av en behandling skattas. Den andra modellen för skattning av direkta och indirekta effekter av en behandling är skapad av Hudgens och Halloran (2008). Modellen bygger på att man har tillgång till ett antal sociala nätverk. Relationerna inom nätverken behöver inte vara kända men det får inte finnas någon relation mellan de olika nätverken. Sedan skattas de direkta och indirekta effekterna av en behandling genom att jämföra nätverken med varandra. I kapitel 2 beskrivs de modeller som vanligtvis använts för kausal inferens, det vill säga när avsaknad av interferens har antagits, samt modellerna av Aronow och Samii (2013) och Hudgens och Halloran (2008) för skattning av direkta och indirekta effekter av behandlingar. Kapitel 3 beskriver de olika simuleringar vi har baserat vårt arbete på. Resultaten av simuleringar av de olika modelltyperna presenteras i kapitel 4 och diskuteras i kapitel Modell I kapitlet presenteras de olika modellerna för kausal inferens. En modell där ett antagande om ingen interferens tas samt två modeller som tar hänsyn till interferens. 2.1 Rubins modell Kausal inferens innebär att man studerar förändringen av ett utfall när en individ utsätts för en behandling. Till exempel hur sannolikheten att bli sjuk förändras då en individ vaccineras. Den vanligaste användningen av detta är baserat på den så kallade Rubins modell. Vi använder oss av en version av modellen skapad av Holland (1986). Modellen baseras på en population där enskilda individer indexeras med j. Antalet individer som deltar i försöket betecknas med M. Dessa individer tilldelas sedan slumpvis en behandling Z. I fallet med en behandlingstyp innebär det att de antingen exponeras för en behandling (Z j = 1) eller tillhör kontrollgruppen (Z j = 0). Att tillhöra kontrollgruppen innebär att personen inte får en aktiv behandling, vilket kan innebära att inte få behandling, få placebobehandling eller liknande. Då kallas antalet personer i behandling-, och kontrollgruppen för m Z=1, respektive m Z=0. Varje individ har då två potentiella utfall, ett utfall när den får en behandling Y Zj =1, och ett utfall när den inte får en behandling Y Zj =0 (Tabell 1). Tabell 1. Potentiella utfall för en individ j enligt Rubins modell Behandlingstyp Grupp Utfall Behandling Z j = 1 Y Zj =1 Kontroll Z j = 0 Y Zj =0 4
6 Det utfallet kan vara en numerisk variabel, till exempel antalet vita blodkroppar, men den kan också vara kategoriskt, till exempel om individen blir sjuk eller frisk. Den kausala effekten för en person enligt Rubins modell CE j R (Holland 1986) betecknas då som skillnaden i utfall en person får av att exponeras av en behandling mot att inte exponeras av samma behandling CE j R = Y Zj =1 Y Zj =0 Identifieringen R används för att skilja skattningen från andra kausala effekter som används senare i uppsatsen. Dock så är det omöjligt för oss att observera båda utfallen, då en individ inte kan få en behandling och tillhöra kontrollgruppen samtidigt. Därav studeras istället den genomsnittliga kausala effekten CE R av en behandling CE R = Y Z=1 Y Z=0 Differensen ger då effekten som behandlingen har på populationen. Dessa värden Y Z=1 och Y Z=0 skattas genom att beräkna det genomsnittliga utfallet för alla individers observerade utfall y i i respektive grupp M Ŷ Z=1 = 1 y m j I(Z j = 1) Z=1 där I(Z j = 1) är en indikatorvariabel som sätts till 1 om individ j tillhör behandlingsgruppen, annars 0. Ŷ Z=0 beräknas på samma sätt men med indikatorvariabeln I(Z j = 0). Med hjälp av skattningarna av de genomsnittliga utfallen för behandlings- och kontrollgruppen kan en skattning av den genomsnittliga kausala effekten av en behandling tas fram j=1 CE R = Y Z=1 Y Z=0 (1) Den här modellen är baserad på ett antagande att en individs behandling inte har någon effekt på en annan individs utfall. Alltså ett antagande att det inte finns någon interferens. Detta antagande kallas ibland också för Stable Unit Treatment Value Assumption (SUTVA) (Rubin 1980). Genom väl planerade randomiserade försök kan man se till att antagandet är till stor del uppfyllt i många studier, exempelvis genom att planera studien så att risken att deltagarna har kontakt med varandra är minimal. Dock är det inte alltid möjligt, till exempel i studien av Karlsson och Lundin (2014) där den effekt som barn har på varandra är svår att undvika. Ofta kan det dock vara nog så intressant att arbeta med en modell som inte kräver ett sådant antagande, eftersom vissa modeller som tar hänsyn till interferens även kan användas när det inte finns någon interferens. 5
7 2.2 Modell med interferens för kända nätverk Aronow och Samii (2013) har skapat en modell för skattning av direkta och indirekta effekter av en behandling. Modellen är baserad på ett nätverk av individer där alla relationer inom nätverket är känt (Figur 1). Relationerna inom nätverket tas fram på ett lämpligt sätt, till exempel via en förstudie, frågor om relationer vid datainsamling, eller uppgifter från ett register. I nätverket delas behandlingar ut slumpmässigt till en andel av populationen. När behandlingen är utdelad så studeras utfallet för individerna i nätverket med avseende på direkta och indirekta effekter. Detta görs genom att studera fördefinierade exponeringsklasser. Figur 1. Nätverk med 10 personer där punkterna symboliserar försökspersoner och linjerna deras relationer Exponeringsklasser För att modellera med interaktion skapas en ny gruppindelning som tar hänsyn till indirekt exponering av en behandling. Därför skapas grupptillhörigheten d zj l där z j står för individens behandlingstyp och l är en indikator som sätts till 1 om någon av individens kontakter har blivit behandlad, annars 0. Varje unik kombination av d zj l kan då kopplas till en exponeringsklass k, så att k = 1, 2,, K. Beroende på hur man i försöksplaneringen antar att den indirekta exponeringen påverkar resultatet skapas ett lämpligt antal exponeringsklasser. Ett exempel på en sådan exponeringsklassindelning finns i Tabell 2. Baserat på den indelningen kan nätverket i Figur 1 tilldelas exponeringsklasserna i Figur 2. Tabell 2. Potentiella utfall enligt exponeringsklasser Behandlingstyp Grupp Exponeringsklass(k) Utfall Behandling d 11 d 10 1, direkt + indirekt 2, direkt Yk=1 Yk=2 Kontroll d 01 3, indirekt Yk=3 d 00 4, ingen exponering Yk=4 Figur 2. Nätverket från Figur 1 där individer slumpmässigt tilldelats behandling och sedan tilldelats exponeringsklass enl. Tabell 2 6
8 Det genomsnittliga utfallet för en exponeringsklass k skattas sedan med en inverse probability weighting (IPW) skattning (Horvitz och Thompson 1952). Estimatorn viktar utfallet för en individ i exponeringsklassen mot sannolikheten för individen att hamna i den exponeringsklassen, kallad π j (k). Skattningen blir då M y j μ (k) = 1 M I(Individ j tillhör exponeringsklass k) (2) π j (k) j=1 Noterbart är att eftersom sannolikheten π j (k) ligger i täljaren och 0 π j (k) 1 kan skattningen vara odefinierad när sannolikheten för någon individ är lika med 0. Skattningen ger möjligheten att undersöka skillnaden i utfall mellan exponeringsklassen k och en annan exponeringsklass k, där k k τ (k, k ) = μ (k) μ (k ) Andra specialfall av exponeringsklasser Definitionen av exponeringsklasser i 2.2 (Tabell 2) passar bra i vissa lägen men det finns även andra sätt att definiera exponeringsklasser. Vilket fall som är att föredra beror helt på hur man i planeringen av studien tror att indirekt exponering påverkar individerna i studien. Sådana specialfall går att se i Tabell 3 och Tabell 4, där exponeringsklasserna beror på andelen behandlade kontakter snarare än antalet. Tabell 3. Klassindelning baserat på andel behandlade kontakter Behandlingstyp Klass (k) Utfall Behandlad och % behandlade kontakter 1 Yk=1 Behandlad och 0-50% behandlade kontakter 2 Yk=2 Obehandlad och % behandlade kontakter 3 Yk=3 Obehandlad och 0-50% behandlade kontakter 4 Yk=4 Tabell 4. Klassindelning baserat på andel behandlade kontakter Behandlingstyp Klass (k) Utfall Behandlad och % behandlade kontakter 1 Yk=1 Behandlad och 34-66% behandlade kontakter 2 Yk=2 Behandlad och 0-33% behandlade kontakter 3 Yk=3 Obehandlad och % behandlade kontakter 4 Yk=4 Obehandlad och 34-66% behandlade kontakter 5 Yk=5 Obehandlad och 0-33% behandlade kontakter 6 Yk=6 7
9 2.3 Modell med interferens för okända nätverk Modellen av Aronow och Samii (2013) antar att alla relationer i ett nätverk är kända. I många fall så är inte den informationen tillgänglig utan någon form av förstudie. Därför finns även andra alternativ för att studera indirekta effekter av exponering av en behandling. En sådan modell gavs av Hudgens och Halloran (2008) när de studerade indirekta effekter av ett koleravaccin. Modellen bygger på att det finns N stycken grupper med individer. Då är antalet individer i varje grupp n i för i = 1,2,3,, N. Det antas då finnas relationer mellan individerna i varje grupp, men inte mellan individer i två olika grupper. Sedan används ett antal behandlingsprogram. Dessa beskriver hur stor andel av individerna i grupp i som ska tilldelas en behandling. I fallet med två behandlingsprogram betecknas dessa ψ och ϕ, men det går potentiellt att använda hur många behandlingsprogram som helst. Utdelningen av behandlingar sker i två steg. Först tilldelas alla grupper ett behandlingsprogram slumpmässigt, och sedan delas behandlingarna ut i grupperna slumpmässigt baserat på vilket behandlingsprogram gruppen tilldelades. Den behandling som en enskild individ j tilldelas betecknas Z ij. Om det då finns en tillgänglig behandling så blir en individs behandlingstyp Z ij = 1 om den tilldelas en behandling, och 0 om den inte tilldelas behandling. En vektor av de behandlingar som individerna i grupp i tilldelas blir då Z i, till exempel i fallet med tre individer där en behandling delas ut till två individer så Z i = {0,1,1}, {1,0,1}, eller {1,1,0}. En vektor av behandlingar som exkluderar individ j betecknas Z i(j). När individ två i exemplet ovan exkluderas blir Z i(2) = {0,1}, {1,1} eller {1,0}. Alla möjliga kombinationer av behandlingsutdelning för alla individer i en grupp i betecknas T n i. Då betecknas utfallet för individ j i grupp i när personen får behandling z och vi tar hänsyn till utdelningen av behandling i resten av gruppen z i(j) som Y ij (z i(j), z ij = z), z = 0, 1 En individs genomsnittliga potentiella utfall när dess grupp får behandlingsprogrammet ψ och resten av gruppen har fått behandlingstilldelningen ω blir då Y ij (z; ψ) = Y ij (z i(j) = ω ω T n j 1, z ij = z) P ψ (z i(j) = ω, z ij = z), z = 0,1 (3) Notera att ekvationen kan användas på samma sätt för behandlingsprogram ϕ. Samma gäller för kommande ekvationer. För att få fram de genomsnittliga potentiella utfallen för grupp i tas sedan genomsnittet av Y ij (z; ψ) (3) för alla individer i grupp i n i Y i(z; ψ) = 1 Y ij (z; ψ), z = 0,1 n i j=1 8
10 De genomsnittliga potentiella utfallen för en grupp i kan skattas med Y i(z; ψ) = n i j=1 Y ij(z i ) I(Z ij = z) n i, z = 0,1 (4) I( Z ij = z) j=1 där I(Z ij = z) är en indikatorvariabel som sätts till 1 om individ j får behandling z, annars 0. Det är även relevant att studera vad de genomsnittliga potentiella utfallen för alla grupper som har fått samma behandlingsprogram är. Då blir de skattade genomsnittliga potentiella utfallen för alla grupper som fått behandlingsprogram ψ Y (z; ψ) = N i=1 (Y i(z; ψ) I(Grupp tillhör program ψ)) N I( Grupp tillhör program ψ) i=1 (5) De skattade standardavvikelser för (5) som ges av Hudgens och Halloran (2008) kräver att ett antagande är uppfyllt. Antagandet är att utfallet för en individ som får behandling inte ändras oavsett vilka andra individer i samma grupp som behandlas, kallat stratifierad interferens. Det är skattningarna av dessa potentiella genomsnittliga utfall som används för skattning av olika typer av kausal effekt. Den direkta kausala effekten av en behandling betecknas CE ij D och beskriver den effekt som en behandling z har på individ j i grupp i. CE ij D definieras som CE ij D (z i(j) ) = Y ij (z i(j), z ij = 0) Y ij (z i(j), z ij = 1) det vill säga skillnaden i potentiella utfall för individ j, givet att behandlingstilldelningen för övriga individer är oförändrat. Den genomsnittliga direkta kausala effekten för en individ j i grupp i CE ij D (ψ) definieras sedan som skillnaden i genomsnittligt utfall Y ij (z; ψ) (3) för individ j i grupp i när den inte tilldelas en behandling jämfört med när samma individ får en behandling, det vill säga CE ij D (ψ) = Y ij (0; ψ) Y ij (1; ψ) och den genomsnittliga direkta kausala effekten för grupp i CE id (ψ) definieras som genomsnittet av CE ij D (ψ) över alla individer i grupp i n i CE id (ψ) = 1 D CE ij (ψ) n i j=1 9
11 Den genomsnittliga direkta kausala effekten för hela populationen som fått behandlingar enligt behandlingsprogram ψ, alltså CE D (ψ), är då genomsnittet av direkt kausal effekt för alla grupper som fått behandlingsprogram ψ, alltså CE id (ψ), det vill säga CE D (ψ) = 1 N CE id (ψ) N i=1 Det är omöjligt att observera en individ både när den tilldelats en behandling och när den tillhör kontrollgruppen. Därför måste den direkta kausala effekten skattas vilket görs baserat på skattningen av gruppernas genomsnittliga utfall Y i(z; ψ) (4). Här skattas gruppernas genomsnittliga direkta kausala effekt som CE id (ψ) = Y i(0; ψ) Y i(1; ψ) En skattning av populationens genomsnittliga direkta kausala effekt när den fått behandlingsprogram ψ kan också tas fram från skillnaden av skattningarna av populationens genomsnittsutfall under behandlingsprogram ψ, alltså Y (z; ψ) (5) CE D (ψ) = Y (0; ψ) Y (1; ψ) (6) Notera även att de direkta kausala effekterna för behandlingsprogram ϕ, det vill säga CE ij D (φ), CE id (φ) och CE D (φ) kan definieras på samma sätt och skattas med CE (φ) och id CE D (φ). Om interferens finns inom grupperna så kan man förvänta sig att utfallet kommer skilja sig beroende på vilket behandlingsprogram gruppen får, alltså skillnaden mellan behandlingstilldelningen Z ij och Z ij där Z ij Z ij. Det studeras genom indirekt kausal effekt av en behandling. Om antagandet om avsaknad av interferens skulle vara sann, så kommer den indirekta effekten att vara 0. Den är baserad på skillnaden i utfall för en individ som inte tilldelats en behandling för två olika behandlingsprogram. Indirekt effekt definieras då som CE I ij (z i(j), z i(j) ) = Y ij (z i(j), z ij = 0) Y ij (z i(j), z ij = 0) Den genomsnittliga indirekta kausala effekten för en individ j i grupp i definieras sedan som skillnaden i utfallet en individ får beroende på vilket av två behandlingsprogram individen tilldelas CE ij I (φ, ψ) = Y ij (0; φ) Y ij (0; ψ) och den genomsnittliga indirekta kausala effekten för grupp i definieras som genomsnittet av indirekt kausal effekt för alla individer i grupp i n i CE ii (φ, ψ) = 1 CE ij I (φ, ψ) n i j=1 10
12 Populationens indirekta kausala effekt blir sedan genomsnittet av den indirekta kausala effekten för alla grupper i populationen CE I (φ, ψ) = 1 N CE ij I (φ, ψ) N i=1 Inte heller här kan den kausala effekten observeras då en grupp inte kan tilldelas två olika behandlingsprogram samtidigt. En skattning av den genomsnittliga indirekta kausala effekten för hela populationen tas då fram med hjälp av populationens genomsnittsutfall för de olika behandlingsprogrammen Y (z; ψ) och Y (z; φ) (5) CE I (φ, ψ) = Y (0; φ) Y (0; ψ) (7) I Figur 3 visas ett expempel med 8 nätverk där 4 får behandlingsprogram ψ och 4 får φ. Det går här att se hur de kausala effekterna hänger ihop. Figur 3. Olika kausala effekter från kapitel 2.3 Dock är det viktigt att notera att direkt kausal effekt inte är samma sak som utfallet för de klasser i 2.2 som utsätts för direkt exponering. Samma sak gäller för indirekt kausal effekt och utfallet för klasser i 2.2 som utsätts för indirekt exponering av en behandling. Alltså kan inte skattningarna från de två modellerna jämföras direkt mot varandra. 11
13 3. Simulering Simulering är ett användbart verktyg när det är önskvärt att eliminera problem som finns i verkligt data, till exempel okända underliggande variabler, bortfall med mera. Det ger även möjlighet att enkelt replikera sina försök för att eliminera missvisande resultat som beror på slumpen. I simulering skapas data utifrån förutbestämda parametrar genom slumpgenererade tal. Syftet med uppsatsen är att belysa problemet med interferens och simulering är ett verktyg för att under kontrollerade former kunna göra detta. För att skapa de sociala nätverk som användes i analysen användes programmet R. Interaktionsmatriser skapades där information om individer och deras inbördes kontakter finns. Figur 4 är ett nätverk med fem individer. Om två individer inom nätverket har kontakt med varandra markeras det med 1 i interaktionsmatrisen, annars 0. Figur 4. Interaktionsmatris med tillhörande nätverksgraf. Nätverken som användes i simuleringarna bestod av 100 eller 1000 individer. Dessa individer tilldelades slumpmässigt 1, 1 eller 2, 1 till 3, 1 till 4, 1 till 5 kontakter beroende på nätverkstyp (Tabell 5) där alla antal kontakter har lika stor chans att bli valda. Exempelvis i nätverk av typ D så har alla individer 25 % chans att få 1, 2, 3 eller 4 kontakter. Tabell 5. Benämning av olika nätverksuppbyggnader, beroende på antal kontakter per individ. Antal kontakter per individ Nätverkstyp 1 A 1-2 B 1-3 C 1-4 D 1-5 E 12
14 3.1 Simulering av direkt och indirekt effekt i kända nätverk För analysen av interferens enligt modellen av Aronow och Samii (2013) skapades nätverk av typen A-E. I de nätverken delades sedan behandlingar ut slumpmässigt till 25, 50 eller 75% av populationen, och individerna tilldelades sina exponeringsklasstillhörigheter baserad på deras behandling samt deras kontakters behandling enligt Tabell 2 eller Tabell 3 beroende på simulering. I Figur 5 kan ett urval av sådana nätverk med olika egenskaper ses. Figur 5. Bilderna ovan exemplifierar några av de nätverk som byggts. Kolumnerna är av nätverkstyp A, B, respektive C (Tabell 5). Raderna representerar andelen behandlingar som delas ut, 25, 50, respektive 75% Då sannolikheten för varje individ att hamna i varje klass π j (k) är svår att beräkna, så skattades den istället. Detta utfördes genom att replikera behandlingstilldelningen 1000 gånger. I varje replikat noterades exponeringsklassen för individerna. Sedan beräknades i hur stor andel av de 1000 replikaten varje individ hamnade i respektive klass. Den andelen användes sedan som en skattning av π j (k). Varje individs potentiella utfall för varje exponeringsklass definierades i förväg, alltså fick alla individer ett av sina fyra fördefinierade värden beroende på deras tilldelade exponeringsklass. Individernas utfall sparades i varje replikat för att kunna ta fram en IPW estimator samt en Rubin estimator. Sedan togs genomsnittet av skattningarna i replikaten för att beräkna estimatorernas väntevärden. Skattningarnas standardavvikelse beräknas även för att få fram estimatorernas medelfel enligt 1000 SD(CE R (CE a=1 ) = ar mean(ce R )) (8) för CE R och på motsvarande sätt för μ (1), μ (2), μ (3) och μ (4) från (2) 13
15 3.1.1 Simulering 1 Simuleringen bestod av tolv delsimuleringar och de använde sig av exponeringsklasserna i Tabell individer användes för att bygga upp nätverken som var av typ B eller D, det vill säga nätverk med 1 till 2 respektive 1 till 4 kontakter per individ (Tabell 5). Andelen behandlingar var 25 eller 50%. Exponeringsklassernas potentiella utfall kom från normalfördelningar. I de fyra första delsimuleringarna definierade vi väntevärdet för de verkliga effekterna som -10 för direkt och indirekt exponering, 10 för direkt exponering men utan indirekt exponering, -10 utan direkt exponering med indirekt exponering och 0 utan direkt eller indirekt exponering. Varje individ tilldelas värden för vardera exponeringsklass, alltså fyra potentiella värden per individ. Dessa värden tas fram slumpmässigt med väntevärden enligt ovan och standardavvikelsen 2. I delsimulering 5 till 8 definierades väntevärdet för de verkliga effekterna till -15 för direkt och indirekt exponering, 15 för direkt exponering men utan indirekt exponering, - 20 utan direkt exponering med indirekt exponering och 20 utan direkt eller indirekt exponering. Värden delades slumpmässigt ut för varje individ med en standardavvikelse på 2. I delsimulering 9 till 12, definierades väntevärdet för de verkliga effekterna till -15 för direkt och indirekt exponering, 10 för direkt exponering men utan indirekt exponering, - 20 utan direkt exponering med indirekt exponering och 10 utan direkt eller indirekt exponering. Värden delades slumpmässigt ut för varje individ med en standardavvikelse på Simulering 2 Simulering 2 bestod av 30 delsimuleringar, varav 15 med 100 individer och 15 med 1000 individer i nätverket. De utgick från exponeringsklasserna i Tabell 2. I Tabell 6 finns en beskrivning för hur effekterna definierades. Exponeringsklass 1 hade väntevärde 40 och standardavvikelse 4, exponeringsklass 2 hade väntevärde 36 och standardavvikelse 3,6, exponeringsklass 3 hade väntevärde 24 och standardavvikelse 2,4 och exponeringsklass 4 hade väntevärde 20 och standardavvikelse 2. Nätverken var av typ A-E (Tabell 5) och andelen behandlade individer varierades mellan 25, 50 eller 75% av individerna. Tabell 6. Sanna effekter för de 4 olika klasserna i simulering 2 och 3. Exponeringsklass k=1 k=2 k=3 k=4 Väntevärde Standardavvikelse 4 3,6 2, Simulering 3 I simulering 3 var de sanna effekterna för exponeringsklasserna likadana som i simulering 2. Exponeringsklasserna var definierade enligt Tabell 3. Nätverken och behandlingarna samt storleken på populationen definierades på samma sätt som i simulering 2. 14
16 3.2 Simulering av direkt och indirekt effekt för okända nätverk För analys av interferens enligt Hudgens och Halloran (2008) skapades nya nätverk. Eftersom nätverken var simulerade var deras egenskaper kända, dock gjordes all analys som om nätverkens egenskaper var okända. 20 nätverk av typ E (Tabell 5) med 1000 individer i varje nätverk skapades. Behandlingsutdelningen skedde i två steg, först tilldelades nätverken slumpmässigt ett av två behandlingsprogram, ψ eller ϕ, där andelen behandlade individer i ψ är större än i ϕ. Behandlingar delades sedan ut slumpmässigt inom nätverket baserat på vilket behandlingsprogram det tillhörde. Sedan skattades direkta kausala effekter CE D (ψ) och CE D (φ) (6), och indirekt kausal effekt CE I (φ, ψ) (7). Direkt kausal effekt där interferens antas inte påverka resultatet enligt Rubins modell skattades också enligt CE R (1). Behandlingstilldelningen replikerades 1000 gånger och skattningarna extraherades i varje replikat. På så sätt kunde ett genomsnitt av vardera skattning tas fram som ett mått på estimatorernas väntevärden. Vidare beräknades estimatorernas standardavvikelse som ett mått på deras medelfel enligt (8) för CE R, CE D och CE I. Utfallet för simuleringen var i det här fallet huruvida en individ blir sjuk eller inte. Varje individ tilldelades en sannolikhet att bli sjuk beroende på om de tilldelats en behandling eller inte. För individer som inte tilldelades en behandling minskade sannolikheten att bli sjuk med en faktor för varje behandlad kontakt den hade. Antal behandlade kontakter P(Individ j sjuk z = 0) = P(Sjuk Obehandlad) (1 Faktor) Ett värde mellan 1 och slumpades sedan fram för varje individ där varje värde hade lika stor chans att bli valt. Ifall det värdet var lägre än sannolikheten för att en individ blir sjuk multiplicerat med så klassades individen som sjuk Simulering 4 Simulering 4 bestod av 8 delsimuleringar. Andelen behandlingar inom behandlingsprogrammen i delsimulering 1 till 3 var ψ = 80% och φ = 20%. Sannolikheten att bli sjuk om man fick behandling var 0,2 samt 0,5 om man inte fick behandling och ingen av ens kontakter fick behandling. Den första delsimuleringen minskade sannolikheten för en obehandlad individ att bli sjuk med en faktor på 0,1 för varje behandlad kontakt en individ hade. Den andra minskade sannolikheten med en faktor på 0,2 och den tredje med en faktor på 0,05. Delsimulering 4 till 8 använde sig av andra behandlingsprogram än de tidigare delsimuleringarna. Andelen behandlingar inom behandlingsprogrammen var ψ = 50 % och ϕ = 20 %. I delsimulering 4-6 var faktorerna som minskar sannolikheten att bli sjuk för obehandlade individer samma som i delsimulering 1-3. Delsimulering 7 och 8 var extremfall. I delsimulering 7 minskades sannolikheten att bli sjuk med en faktor 0 för varje behandlad kontakt en obehandlad individ hade. Det innebär att indirekt exponering av en behandling inte hade någon påverkan på en individs utfall. 15
17 I delsimulering 8 minskades sannolikheten att bli sjuk med en faktor på 0,5 för varje behandlad kontakt en obehandlad individ hade. 4. Resultat Utifrån modellerna i kapitel två kommer resultatet från simuleringarna i kapitel tre visas här. 4.1 Resultat av simulering av direkt och indirekt effekt i kända nätverk I Tabell 7 finns resultatet från simulering 1. Rubins modell skattade den kausala effekten lågt med en relativt hög standardavvikelse i alla delsimuleringar. I flera av fallen där behandlingstilldelningen var hög blev IPW skattningarna av exponeringsklass 2 och 4 odefinierade (markerat med ). Dock skattar de nära de verkliga effekterna som definierats i simuleringen. Standardavvikelserna varierar mycket beroende på nätverkstyp och andel behandlade. Tabell 7. Resultat från simulering 1. Delsim M Nätverk Behand μ (1) SD (μ (1)) μ (2) SD (μ (2)) μ (3) SD (μ (3)) μ (4) SD (μ (4)) CE R SD (CE R ) B 25 % -9,62 2,44 10,01 3,03-9,63 1,2 0,37 0,31 4,51 2, D 25 % -9,62 1,54 10,01 4,34-9,63 0,8 0,37 0,51 2,72 2, B 50 % -9,62 0,76 10,01 5,56-9,63 0,78 0,37 1,13 1,76 1, D 50 % -9,62 0,5-9,63 0,49 0,56 0, B 25 % -14,95 3,63 15,1 4,54-20,02 2,27 19,85 3,02 1,21 4, D 25 % -14,95 2,29 15,1 6,65-20,02 1,6 19,85 4,91 2,69 3, B 50 % -14,95 1,23-20,02 1,6 3,24 3, D 50 % -14,95 0,71-20,02 0,94 4,41 1, B 25 % -15,03 3,69 9,93 3,15-20,19 2,4 10,01 1,65 3,24 3, D 25 % -15,03 2,42 9,93 4,59-20,19 1,56 10,01 2,54 3,99 3, B 50 % -15,03 1,18 9,93 5,48-20,19 1,61 10,01 5,26 4,28 2, D 50 % -15,03 0,61-20,19 0,75 4,9 1,37 I Tabell 8 finns en del av resultatet från simulering 2. Hela resultatet från simuleringen återfinns i Tabell 13 i bilaga. Vi ser här att det blev odefinierade skattningar för exponeringsklass 2 och 4 då det var 50% behandlade och simuleringen var av typ D eller E. Skattningarna för exponeringsklasserna 2 och 4 blev även odefinierade om behandlingstilldelningen är 75%, förutom när nätverkstypen var E. Skattningarna från Rubins modell är nästan alltid samma och standardavvikelserna är generellt låga. Samma mönster fanns även i de fall då nätverken bestod av 1000 individer, dock blev fler skattningar odefinierade (Tabell 13). 16
18 Tabell 8. Del av resultat från simulering 2. Uttag ur Tabell 13. Delsim M Nätverk Behand μ (1) SD (μ (1)) μ (2) SD (μ (2)) μ (3) SD (μ (3)) μ (4) SD (μ (4)) CE R SD (CE R ) A 25 % 39,75 12,59 35, ,85 3,63 19, ,89 0, B 25 % 39,75 9,18 35,78 10,82 23,85 2,82 19,88 3,02 15,9 1, C 25 % 39,75 7,7 35,78 13,06 23,85 2,32 19,88 3,75 15,8 1, D 25 % 39,75 6,47 35,78 16,69 23,85 1,94 19,88 4,89 15,88 0, E 25 % 39,75 5,63 35,78 20,83 23,85 1,86 19,88 6,5 15,87 1, A 50 % 39,75 4,76 35,78 11,68 23,85 3,01 19,88 6,49 15,94 0, B 50 % 39,75 3,47 35,78 21,63 23,85 2,17 19,88 11,61 15,92 0, C 50 % 39,75 2,38 35,78 33,5 23,85 1,32 19,88 17,93 15,89 0, D 50 % 39,75 1,92 23,85 1,02 15,88 0, E 50 % 39,75 1,44 23,85 0,9 15,9 0, A 75 % 39,75 2,03 23, ,9 0, B 75 % 39,75 1,19 23,85 1,33 15,86 0, C 75 % 39,75 0,84 23,85 0,98 15,91 0, D 75 % 39,75 0,5 23,85 0,69 15,92 0, E 75 % 39,75 0,7 23,85 0,85 15,92 0,72 En del av denna simulering 3 finns i Tabell 9. Hela resultatet av simuleringen återfinns i Tabell 14 i bilaga. I denna simulering blev inte skattningarna av effekterna för varje exponeringsklass odefinierade lika ofta som i simulering 2. Den enda odefinierade skattningen var i exponeringsklass 1 i det fallet där 25% hade fått en behandling och simuleringen var av typ E. Det går dock att se stora variationer i standardavvikelser för vissa skattningar, exempelvis SD k=1 i delsimulering 1 till 4. Samma mönster fanns i de delsimuleringar då nätverken bestod av 1000 individer (Tabell 14). Tabell 9. Del av resultat från simulering 3. Uttag ur Tabell 14. Delsim M Nätverk Behand μ (1) SD (μ (1)) μ (2) SD (μ (2)) μ (3) SD (μ (3)) μ (4) SD (μ (4)) CE R SD (CE R ) A 25 % 39,75 30,85 35,78 3,62 23,85 8,24 19,88 1,07 15,86 0, B 25 % 39,75 31,24 35,78 2,98 23,85 9,61 19,88 0,9 15,89 0, C 25 % 39,75 35,79 35,78 2,71 23,85 11,05 19,88 0,86 15,92 0, D 25 % 39,75 40,74 35,78 2,26 23,85 11,61 19,88 0,7 15,81 0, E 25 % 35,78 2,11 23,85 14,17 19,88 0,64 15,85 0, A 50 % 39,75 9,29 35,78 4,63 23,85 5,2 19,88 2,64 15,82 0, B 50 % 39,75 8,72 35,78 4,58 23,85 5,28 19,88 2,59 15,83 0, C 50 % 39,75 8,33 35,78 4,49 23,85 4,82 19,88 2,63 15,85 0, D 50 % 39,75 8,08 35,78 5,08 23,85 4,8 19,88 2,88 15,84 0, E 50 % 39,75 7,39 35,78 5,04 23,85 4,51 19,88 3,04 15,86 0, A 75 % 39,75 3,08 35,78 6,8 23,85 3,83 19,88 8,46 15,85 0, B 75 % 39,75 2,83 35,78 7,82 23,85 3,68 19,88 9,19 15,85 0, C 75 % 39,75 2,87 35,78 9,44 23,85 3,31 19,88 11,68 15,87 0, D 75 % 39,75 2,26 35,78 11,88 23,85 2,49 19,88 13,72 15,86 0, E 75 % 39,75 2,04 35,78 12,98 23,85 2,25 19,88 16,17 15,87 0,78 17
19 4.2 Resultat av simulering av direkt och indirekt effekt för okända nätverk Resultatet från simulering 4 finns i Tabell 10. I delsimulering 1 när effekten från interferensen var 0,1 per behandlad kontakt ser vi att skattningarna av de direkta kausala effekterna CE D (6), alltså skillnaderna mellan de behandlade och obehandlade i de olika behandlingsprogrammen, blev 0,1094 för ψ samt 0,2437 för ϕ. Skattningen av den indirekta kausala effekten CE I (7), alltså skillnaden mellan de obehandlade i de olika behandlingsprogrammen, blev 0,1344. Man kan även se att skattningen enligt Rubins modell CE R(1), där vi ej tar hänsyn till interferens, hamnade någonstans mellan skattningarna ovan på 0,1765. Då effekten från interferensen minskades till 0,05 per behandlad kontakt för en obehandlad individ, delsimulering 3, minskade även skattningen av den indirekta kausala effekten till 0,0779 och skattningen enligt Rubins modell ökade till 0,2320. I delsimulering 2 ökades effekten till 0,2 och då ökades även skattningen av den indirekta kausala effekten till 0,2040 och skattningen enligt Rubins modell minskade till 0,0912. Samma mönster finns i resultatet från delsimulering 4 till 6. Den indirekta kausala effekten då indirekt exponering inte hade någon effekt på utfallet skattades till ungefär 0 (dock ej exakt 0). Den skattade direkta kausala effekten blev då 0,3000 för ψ, 0,3001 för ϕ, och Rubins modell skattade den kausala effekten till 0,3001. I det andra extremfallet var effekten från interferensen 0,5. Här blev den skattade indirekta kausala effekten stor 0,1649 och Rubins modell skattade skillnaden mellan behandlade och obehandlade individer till -0,0104. Tabell 10. Resultat från simulering 4. Delsim ψ Φ Faktor CE D (ψ) SD (CE D (ψ)) CE D (φ) SD (CE D (φ)) CE I (ψ, φ) SD (CE I (ψ, φ)) CE R SD (CE R ) ,1 0,1094 0,0113 0,2437 0,0107 0,1344 0,0118 0,1765 0, ,2-0,0109 0,0100 0,1933 0,0104 0,2040 0,0104 0,0912 0, ,05 0,1929 0,0118 0,2711 0,0104 0,0779 0,0119 0,2320 0, ,1 0,1694 0,0090 0,2430 0,0105 0,0738 0,0088 0,2062 0, ,2 0,0738 0,0084 0,1934 0,0110 0,1192 0,0083 0,1336 0, ,05 0,2298 0,0094 0,2708 0,0105 0,0408 0,0093 0,2503 0, ,3000 0,0096 0,3001 0,0104 0,0000 0,0092 0,3001 0, ,5-0,0928 0,0071 0,0719 0,0105 0,1649 0,0065-0,0104 0,0063 För att se om den indirekta kausala effekten är signifikant skild från 0 gjordes 95- procentiga konfidensintervall för CE I (ψ, φ) i varje replikat enligt 95 procentigt konfidensintervall för CE I (ψ, φ): CE I (ψ, φ) ± 1.96 SD (CE I (ψ, φ)) (9) 18
20 Då standardavvikelserna för estimatorerna i varje replikat inte kan skattas utan att det är stratifierad interferens (Hudgens och Halloran 2008) användes effektskattningarnas standardavvikelser från simuleringen, alltså SD (CE I (ψ, φ)) (Tabell 10) för att beräkna konfidensintervallen. Dessa intervall är för normalfördelade skattningar. Histogrammen över de olika skattningarna, se Figur 6, ser approximativt normalfördelade ut och intervallen beräknades då med hjälp av (9). Andelen konfidensintervall som inte innehöll 0 finns i Tabell 11. Figur 6. Histogram för skattningarna av indirekt kausal effekt i simulering 4 Tabell 11. Andelen konfidensintervall för skattningarna av indirekt kausal effekt i simulering 4 som inte innehåller 0 Delsim % av KFI utan ,2 7 4, Diskussion Här diskuteras resultatet i kapitel 4 och modellerna jämförs med varandra 5.1 Modell med interferens för kända nätverk jämfört med Rubins modell. Syftet med uppsatsen är att visa varför det kan vara viktigt att ta hänsyn till interferens i studier. Detta går att se extra tydligt i delsimulering 1 från simulering 1 där indirekt effekt hade ett negativt utfall för både behandlade och obehandlade individer. Kontrollgruppen hade utfallet 0 och behandling gav ett positivt utfall. Då hittade modellering med interaktion de positiva eller negativa utfallen för de möjliga klasserna. Rubins modell "missade" den indirekta effekten (Tabell 12). På grund av det minskades det observerade 19
21 genomsnittliga utfallet för behandlingsgruppen, och den effekt som behandlingen gav blev kanske inte hittad. I detta fall skattades den genomsnittliga kausala effekten, alltså skillnaden mellan behandlings- och kontrollgruppens utfall, till 4,52. Alltså mindre än hälften av den effekt direkt exponering egentligen hade på utfallet. Beroende på vad den indirekta behandlingen har för påverkan på utfallet så kan det sabotera vilket beslut som tas baserat på den skattade kausala effekten. Tabell 12. Delsimulering 1 från simulering 1 IPW Rubin Klass Skattning SD Grupp Skattning SD k=1-9,62 2,44 k=2 10,01 3,03 Behandling k=3-9,63 1,2 k=4 0,37 0,31 Kontroll Däremot så har även modellen som tar hänsyn till interaktion i kända nätverk sina svagheter. Skattningen av exponeringsklassernas utfall (2) är odefinierad när sannolikheten för någon individ är lika med 0. Detta inträffar i ett par fall: Individer utan några kontakter kan inte utsättas för indirekt exponering av en behandling. Därför blir π j (1) = π j (3) = 0. Alltså kan inga nätverk baserade på modellen av Aronow och Samii (2013) innehålla individer utan kontakter inom nätverket, då det orsakar att IPW skattningarna blir odefinierade. Individer med många kontakter utsätts nästan alltid för indirekt exponering om andel behandling som ges ut är hög. Skattningarna blir då odefinierade eftersom bara en kontakt måste ha blivit behandlad för att utsättas för en indirekt effekt enligt Tabell 2. Då kommer π j (1) och π j (3) skattas som stora tal och π j (2), π j (4) kommer vara små, nära eller lika med 0 Båda metoderna vi har diskuterat hittills har sina för- och nackdelar. Rubins modell är stabil, och med det menar vi att skattningarna av den kausala effekten med Rubins modell alltid är definierad så länge det finns både behandlade och obehandlade individer, alltså att m Z=1, m Z=0 > 0. IPW skattningarna får i flera fall hög standardavvikelse, och det finns även en risk att de ger odefinierade skattningar. Detta på grund av sannolikheter som blir nära eller lika med 0. Aronow och Samiis (2013) modell antar också att nätverket och alla relationer inom nätverket är kända. Detta är inte omöjligt att ta reda på vid utförandet av en studie, men det kan kräva en stor del extra arbete. Vi skapade även ett eget specialfall av modellen av Aronow och Samii (2013) baserad på andel behandlade kontakter (Tabell 3). Den gav korrekta skattningar av klassernas genomsnittliga utfall, men skattningarna får en relativt hög standardavvikelse. Dock inför den typen av klassificering även ett problem. Om till exempel exponeringsklasser baserat på om 0-33, 33-66, eller % av individernas kontakter fått en behandling skulle införas (Tabell 4), då kan individer med en kontakt bara ha 0 eller 100 % behandlade kontakter. Individen kan alltså aldrig hamna i klassen med 33-66% behandlade kontakter. Den lider alltså av samma problem som andra tilldelningar av exponeringsklasser har. Om nätverket inte har möjlighet att tilldela alla individer i alla klasser så kommer modellen inte ge giltiga skattningar för alla klassers genomsnittliga utfall. Hur man väljer att skapa 20
22 sina exponeringsklasser bör baseras på hur man tror indirekt effekt påverkar deltagarna i försöket. Sammanfattningsvis ger alltså Rubins modell ofta skattningar med väldigt låg standardavvikelse, men de fångar inte den effekt som indirekt behandling har på utfallet. Detta är inte önskvärt då vi vet att i ett flertal fall så finns det en indirekt effekt. Därför kan det vara viktigt att använda en metod som har möjligheten att hitta dessa. 5.2 Modell med interferens för okända nätverk jämfört med Rubins modell Även skattningen av indirekta kausala effekter för okända nätverk visar varför det kan vara viktigt att ta hänsyn till interferens. Detta går att se i delsimulering 7 och 8 från simulering 4 där indirekt exponering kraftigt minskade sannolikheten att bli sjuk (Tabell 10). Skattningen enligt Rubins modell "missade" den indirekta effekten. Då orsakade det låga antalet sjuka obehandlade individer att skattningen enligt Rubins modell inte påvisade någon skillnad mellan behandlings-, och kontrollgruppen, alltså att behandlingen inte verkar ha någon effekt. Det går även att se på de skattade indirekta kausala effekterna. Som det nämndes i 2.3 så säger antagandet om avsaknad av interferens att om ingen interferens finns så ska den indirekta kausala effekten vara 0. I resultatet från simulering 4 så ser vi den enda skattningen som var väldigt nära 0 var för försöket där vi simulerat att indirekt exponering inte påverkar sannolikheten att bli sjuk. För att säkert kunna säga att resterande skattningar var signifikant skilda från 0 beräknades deras 95-procentiga konfidensintervall i varje replikat (Tabell 11). De intervallen är skilda från 0 i nästan 100% av alla simuleringar förutom i simuleringen där vi medvetet tagit bort effekten av indirekt exponering, delsimulering 7. Det innebär att i alla situationer där en indirekt effekt av en behandling har funnits så har vi kunnat hitta en indirekt kausal effekt som är signifikant större än noll. 5.3 Jämförelse av modeller med interferens för kända och okända nätverk Den stora fördelen med skattningen av direkta och indirekta kausala effekter för okända nätverk är att den inte behöver veta nätverkets uppbyggnad innan. Detta kan spara mycket tid och resurser i planeringen av en studie. Den kan inte ge odefinierade skattningar vilket vi riskerar vid användning av exponeringsklasserna från Aronow och Samii (2013). Dessutom behöver vi inte göra något antagande om hur indirekt exponering påverkar utfallet, vilket vi måste göra när vi väljer vilka exponeringsklasser som ska användas inför en studie. Det enda problemet med att använda den här metoden är att vi måste ha tillgång till flera grupper av personer, samt att vi behöver anta att inga individer från en grupp har kontakt med individerna i en annan grupp. Alltså kanske exponeringsklasserna från Aronow och Samii (2013) är att föredra när vi bara har tillgång till ett mindre nätverk. Då har vi inte möjligheten att använda metoden av Hudgens och Halloran (2008), samt att det inte är så svårt att ta reda på relationerna inom nätverket. Båda metoderna är att föredra jämfört med att anta att det inte finns någon interferens, då de metoder som tar hänsyn till interferens också kan upptäcka situationer när interferensen inte har någon stor effekt på resultatet. 21
23 5.4 Slutsats Syftet med uppsatsen är att belysa problemet med interferens. Vi har nu visat ett flertal fall där vi inte får korrekta resultat om vi inte tar hänsyn till interferens. Modellerna från 2.2 och 2.3 går även att använda när det inte finns någon interferens. Alltså är de att föredra så länge de är möjliga att utföra. Dock så kräver de mer resurser då vi antingen måste känna till relationerna i nätverken eller ha tillgång till flera nätverk. Detta till trots anser vi att dessa modeller är bättre om man har minsta lilla misstanke om att interferens kan finnas i det område man vill studera. 22
24 6. Referenser Aronow P, Samii C, (2013), 'Estimating Average Causal Effects Under Interference Between Units', Crépon B, Duflo E, Gurgand M, Rathelot R, Zamora P, (2012), Do Labor Market Policies have Displacement Effects? Evidence from a Clustered Randomized Experiment, The Quarterly Journal of Economics, Oxford University Press, 128, Holland P, (1986), 'Statistics and Causal Inference', Journal of the American Statistical Association, 81, Hong G, Raudenbush SW, (2006), Evaluating Kindergarden Retention Policy, Journal of the American Statistical Association, 101, Horvitz D, Thompson D, (1952), A Generalization of Sampling Without Replacement from a Finite Universe, Journal of the American Statistical Association, 47, Hudgens M, Halloran E, (2008), 'Toward Causal Inference With Interference', Journal of the American Statistical Association, 103, Lundin M, Karlsson M, (2014), Estimation of Causal Effects in Observational Studies with Interference Between Units, Statistical Methods And Applications, 23, Morgan SL, Winship C, (2007), Counterfactuals and causal inference : methods and principles for social research, Cambridge University Press, Cambridge. Rahmqvist J, Wells MB, Sarkadi A, (2014), Conscious Parenting: a Qualitative Study on Swedish Parents Motives to Participate in a Parenting Program, Journal of child and family studies, 23, Rubin DB, (1980), Discussion of Randomization Analysis of Experimental Data in the Fisher Randomization Test, by D.Basu, Journal of the American Statistical Association, 75, Sampaio F, Feldman I, Sarkadi A, (2012), A Cost-Effectiveness Analysis of the Triple P Program in Uppsala Municipality, Sweden. European Journal of Public Health, 22, Sobel M, (2006), 'What Do Randomized Studies of Housing Mobility Demonstrate?', Journal of the American Statistical Association, 476,
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två
SKATTNING AV KAUSALA EFFEKTER MED MATCHAT FALL-KONTROLLDATA
SKATTNING AV KAUSALA EFFEKTER MED MATCHAT FALL-KONTROLLDATA Evelina Abramsson, Kajsa Grind VT 2017 Examensarbete, 15 hp Statistik C2, 15 hp Umeå Universitet Skattning av kausala effekter med matchat fall-kontroll
Mendelsk randomisering
Mendelsk randomisering 1 Föredraget en bild: Mendelsk randomisering = instrumentalvariabelanalys med gener som instrument 2 Översikt Kausalitet Instrumentalvariabler Mendelsk randomisering 3 Vad är kausalitet?
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Propensity Scores. Bodil Svennblad UCR 16 september 2014
Propensity Scores Bodil Svennblad UCR 16 september 2014 Jämföra två behandlingar Randomiserad studie A B Inte alltid etiskt försvarbart Dyrt Restriktioner på studiepopulationen (generaliserbart?) Real
Introduktion till kausala effekter
Introduktion till kausala effekter Ronnie Pingel Institutionen f or folkh also- och v ardvetenskap och Statistiska institutionen 2016-09-03 Utgångspunkten Introduktion Vanligt mål i empirisk forskning
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17
1/17 F8 Skattningar Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 14/2 2013 Inledande exempel: kullager Antag att diametern på kullager av en viss typ är normalfördelad N(µ,
Kausalitet 2012-03-26. Kausalitet. Vad är kausal inferens? Seminariets agenda. P(Y a=1 =1) P(Y a=0 =1) Kausal effekt för en individ i:
Seminariets agenda Vad är kausal inferens? nna Ekman rbets- och miljömedicin Kausalitet Statistiska samband kontra kausalitet Konfounding DG ett grafiskt stöd Inverse propability weights Kausalitet ounterfactual
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Skattning av kausala effekter vid effektmodifiering genom matchning på funktioner av prognostic scores
Skattning av kausala effekter vid effektmodifiering genom matchning på funktioner av prognostic scores Elin Moritz Student VT 2011 Examensarbete, 15 hp Statistik C, 30 hp Handledare: Ingeborg Waernbaum
SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
Hur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Föreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare
MIKROEKONOMETRI Data på individ/hushålls/företags/organisationsnivå Tvärsnittsdata och/eller longitudinella data o paneldata Idag större datamänger än tidigare Tekniska framsteg erbjuder möjligheter till
Föreläsning 4. Kapitel 5, sid Stickprovsteori
Föreläsning 4 Kapitel 5, sid 127-152 Stickprovsteori 2 Agenda Stickprovsteori Väntevärdesriktiga skattningar Samplingfördelningar Stora talens lag, Centrala gränsvärdessatsen 3 Statistisk inferens Population:
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...
Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för
LKT325/LMA521: Faktorförsök
Föreläsning 2 Innehåll Referensfördelning Referensintervall Skatta variansen 1 Flera mätningar i varje grupp. 2 Antag att vissa eekter inte existerar 3 Normalfördelningspapper Referensfördelning Hittills
F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov
Summer Science Camp, Tjärnö, 8 August 2012 Varför statistik? Serik Sagitov http://www.math.chalmers.se/ serik/ Avdelningen för matematisk statistik Matematiska Vetenskaper Chalmers Tekniska Högskola och
Statistik för teknologer, 5 poäng Skrivtid:
UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer,
Tentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
ÖVNINGSUPPGIFTER KAPITEL 10
ÖVNINGSUPPGIFTER KAPITEL 10 För vissa uppgifter behöver du en tabell över den standardiserade normalfördelningen. Se här. SAMPLING 1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
EXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
LMA201/LMA521: Faktorförsök
Föreläsning 1 Innehåll Försöksplanering Faktorförsök med två nivåer Skattning av eekterna. Diagram för huvudeekter Diagram för samspelseekter Paretodiagram Den här veckan kommer tillägnas faktorförsök.
Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014
Föreläsning 1. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik 1MS026 vt 2014 Varför tillämpad statistik? Användningsområden i medicin, naturvetenskap
Metoder för att mäta effekter av arbetsmarknadspolitiska program WORKING PAPER 2012:2
Metoder för att mäta effekter av arbetsmarknadspolitiska program WORKING PAPER 22:2 AV: MARIE GARTELL, CHRISTER GERDES OCH PETRA NILSSON. Sammanfattning De arbetsmarknadspolitiska programmen är en viktig
F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)
Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Metod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen
Uwe Menzel, 2017 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Syfte: o statistiska test om parametrar för en fördelning o förkasta eller acceptera hypotesen hypotes: = 20 (väntevärdet är 20)
Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning. Johannes Forkman, Saeid Amiri and Dietrich von Rosen
Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning Johannes Forkman, Saeid Amiri and Dietrich von Rosen Swedish University of Agricultural Sciences (SLU) Department of
Maria Fransson. Handledare: Daniel Jönsson, Odont. Dr
Klassificering av allvarlig kronisk parodontit: En jämförelse av fem olika klassificeringar utifrån prevalensen av allvarlig kronisk parodontit i en population från Kalmar län Maria Fransson Handledare:
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Mer om konfidensintervall + repetition
1/14 Mer om konfidensintervall + repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 23/2 2011 2/14 Dagens föreläsning Skattningar som slumpvariabler Väntevärde Varians
SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)
SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Tentamen för kursen. Linjära statistiska modeller. 22 februari
STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Analytisk statistik. Tony Pansell, optiker Universitetslektor
Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp
Statistiska Institutionen Gebrenegus Ghilagaber (docent)
Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas
Lösningsförslag till Matematisk statistik LKT325 Tentamen
Lösningsförslag till Matematisk statistik LKT325 Tentamen 20190115 Kursansvarig: Reimond Emanuelsson Betygsgränser: för betyg 3 krävs minst 20 poäng, för betyg 4 krävs minst 30 poäng, för betyg 5 krävs
Statistisk försöksplanering
Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 25 Oktober 2017 Tid: 09:00-13 Hjälpmedel: Miniräknare
Bilaga 6 till rapport 1 (5)
till rapport 1 (5) Bilddiagnostik vid misstänkt prostatacancer, rapport UTV2012/49 (2014). Värdet av att undvika en prostatabiopsitagning beskrivning av studien SBU har i samarbete med Centrum för utvärdering
This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum
Examiner Linus Carlsson 016-01-07 3 hours In English Exam (TEN) Probability theory and statistical inference MAA137 Aids: Collection of Formulas, Concepts and Tables Pocket calculator This exam consists
Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Studiedesign och effektmått
Studiedesign och effektmått Kohortstudier och randomiserade studier Disposition Mått på association Studiedesign Randomiserade kliniska/kontrollerade prövningar Kohortstudier Mått på sjukdomsförekomst
Diskussionsproblem för Statistik för ingenjörer
Diskussionsproblem för Statistik för ingenjörer Måns Thulin thulin@math.uu.se Senast uppdaterad 20 februari 2013 Diskussionsproblem till Lektion 3 1. En projektledare i ett byggföretaget ska undersöka
8.1 General factorial experiments
Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter.
Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 2/13/2011. Disposition. Experiment. Bakgrund. Observationsstudier
Studiedesign eller, hur vet vi egentligen det vi vet? MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? Disposition Bakgrund Experiment Observationsstudier Studiedesign Experiment Observationsstudier
7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00
Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 5Hp 41I12B KINAF13, KINAR13, KINLO13,KMASK13 7,5 högskolepoäng Tentamensdatum: 30 oktober
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
ÖVNINGSUPPGIFTER KAPITEL 8
ÖVNINGSUPPGIFTER KAPITEL 8 SAMPEL KONTRA POPULATION 1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg
LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg Simulering i MINITAB Det finns goda möjligheter att utföra olika typer av simuleringar i Minitab. Gemensamt för dessa är att man börjar
SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski
SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016
STATISTISK POWER OCH STICKPROVSDIMENSIONERING
STATISTISK POWER OCH STICKPROVSDIMENSIONERING Teori UPPLÄGG Gemensam diskussion Individuella frågor Efter detta pass hoppas jag att: ni ska veta vad man ska tänka på vilka verktyg som finns vilket stöd
7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.
Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 4I2B KINAF4, KINAR4, KINLO4, KMASK4 7,5 högskolepoäng Tentamensdatum: 28 oktober 206 Tid:
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK
VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK TERM Analytisk statistik Bias Confounder (förväxlingsfaktor)) Deskriptiv statistik Epidemiologi Fall-kontrollstudie (case-control study)
Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 5/7/2010. Disposition. Studiedesign två huvudtyper
Gustaf Edgren Post doc, institutionen för medicinsk epidemiologi och biostatistik Läkarstudent, termin 11 gustaf.edgren@ki.se Hur vet vi egentligen vad vi vet? Vad beror skillnaden på? 60 min 20 min 60
4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler
Föreläsning 2 4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler Stokastiskavariabler Stokastisk variabel (eng: random variable) En variabel vars värde
BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29)
LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) Aktuella avsnitt i boken: Kap 61 65 Lektionens mål: Du ska
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Föreläsning 5. Kapitel 6, sid Inferens om en population
Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning
PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar
Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)
Demonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
TMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin
Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,
Inlämningsuppgift-VT lösningar
Inlämningsuppgift-VT lösningar A 1. En van Oddset-spelare har under lång tid studerat hur många mål ett visst lag gör i ishockeymatcher och vet att sannolikheterna beskrivs av följande tabell: Mål 0 1
F9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.
Betrakta motstånden märkta 3.9 kohm med tolerans 1%. Anta att vi innan mätningarna gjordes misstänkte att motståndens förväntade värde µ är mindre än det utlovade 3.9 kohm. Med observationernas hjälp vill
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Thomas Önskog 28/
Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta
Statistisk försöksplanering
Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 2 November Tid: 09:00-13 Hjälpmedel: Miniräknare
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
7.3.3 Nonparametric Mann-Whitney test
7.3.3 Nonparametric Mann-Whitney test Vi har sett hur man kan testa om två populationer har samma väntevärde (H 0 : μ 1 = μ 2 ) med t-test (two-sample). Vad gör man om data inte är normalfördelat? Om vi
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
7.5 Experiment with a single factor having more than two levels
Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Lärare 4. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum
1 Lärare 4 Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum Lärare 2 Att utföra undersökningar Sneda statistiska underlag
10. Konfidensintervall vid två oberoende stickprov
TNG006 F0-05-06 Konfidensintervall för linjärkombinationer 0. Konfidensintervall vid två oberoende stikprov Antag att X, X,..., X m är ett stikprov på N(µ, σ ) oh att Y, Y,..., Y n är ett stikprov på N(µ,