Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Storlek: px
Starta visningen från sidan:

Download "Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012"

Transkript

1 Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, Risk Ratio & Odds Ratio Risk- och odds ratio beräknar sambandet mellan två dikotoma variabler. Inom forskning handlar det ofta om att man vill testa om en grupp som exponerats för någonting, t.ex. svåra barndomsförhållanden, har en högre risk/odds för ett visst utfall, t.ex. missbruk, jämfört med en icke-exponerad grupp. I det aktuella datasetet finns en variabel som anger ifall respondenten är kvinna (female = 1) eller man (female = 0) och en annan variabel som anger ifall personen dött (death = 1) eller inte (death = 0) under uppföljningsperioden. För att beräkna risk- och odds ratio: Analyze Descriptive Statistics Crosstabs. Kör in variabeln som skall betraktas som oberoende (om någon) i rutan Row(s) och den andra variabeln (utfallsvariabeln) i rutan Column(s). Programmet ger inte automatiskt odds- eller riskkvoter, så vi klickar på Statistics och väljer Risk samt Cochran s and Mantel- Haenszel statistics. Klicka på Continue och sedan på OK. 1.1Output 1. Risk att inte ha dött om man är man = 192 / 233 = 0,824 (= 82,4 %) 2. Risk att ha dött om man är man = 41 / 233 = 0,176 (= 17,6 %) 3. Risk att inte ha dött om man är kvinna = 433 / 464 = 0,933 (= 93,3 %) 4. Risk att ha dött om man är kvinna= 31 / 464 = 0,067 (= 6,7 %) 1. Odds att inte ha dött om man är man = 192 / 41 = 4, Odds att ha dött om man är man = 41 / 192 = 0, Odds att inte ha dött om man är kvinna = 433 / 31 = 13, Odds att ha dött om man är kvinna= 31 / 433 = 0,072

2 2 Risken att inte ha dött om man är man dividerat med risken att inte ha dött om man är kvinna = 0,824 / 0,933 = 0,883. Konfidensintervallet (0,824-0,942) innehåller inte värdet 1. Vi kan alltså med tillräckligt hög säkerhet säga att risken för att inte leva (= sannolikheten för att överleva) är lägre bland män jämfört med kvinnor i den aktuella populationen. Risken ha dött om man är man dividerat med risken ha dött om man är kvinna = 0,176 / 0,067 = 2,634 (om man inte avrundar på vägen). Konfidensintervallet (1,698-4,086) innehåller inte värdet 1. Vi kan alltså med tillräckligt hög säkerhet säga att risken för att dö är högre bland män jämfört med kvinnor i den aktuella populationen. Odds att inte ha dött om man är man dividerat med odds att inte ha dött om man är kvinna = 4,683 / 13,968 = 0,335. Samma kvot får vi om vi dividerar kvinnornas odds för att ha dött (0,072) dividerat med männens odds för att ha dött (0,214). Konfidensintervallet för oddskvoten går från 0,204 till 0,551. Detta intervall inkluderar inte värdet 1. Detta innebär att vi kan utesluta att oddskvoten i populationen är lika med 1 med 95% säkerhet. Vi skulle alltså påstå att i den aktuella populationen är oddsen för att överleva lägre bland män jämfört med kvinnor. Här ser vi, återigen, att vår oddskvot skiljet sig signifikant från värdet 1 (p < 0,001) 2. Logistisk Regression (Binär) Vid logistisk regression prediceras värdena (eller egentligen: logaritmen för oddsen för det ena utfallet) på en dikotom variabel utifrån en eller flera prediktorer. Prediktorerna kan vara kontinuerliga, dikotoma eller kategorivariabler (görs om till dummy-variabler). För att utföra en logistisk regression: Analyze Regression Binary Logistic. Kör in den dikotoma beroende variabeln i rutan Dependent och prediktorerna i rutan Covariates. Klicka på OK. Nedan ses exempel på output där det prediceras ifall folk har dött under

3 3 uppföljningsperioden (death = 1) utifrån ålder, kön, systoliskt (sbp0) och diastoliskt blodtryck (dbp0) samt om de äter antihypertensiva läkemedel (antihyp0, 1 för ja och 0 för nej) vid periodens början. 2.1 Output Analysen börjar med en s.k. nollmodell som inte tar hänsyn till prediktorerna. Eftersom 72 av personerna dött och 625 inte dött så predicerar den att oddsen att ha dött är lika med 72 / 625 = 0,115 för varje person. Tar man den naturliga logaritmen av 0,115 får vi vårt intercept på -2,161. Vi ser att interceptet skiljer sig signifikant från noll (p <.001), vilket innebär att vi med hög säkerhet kan påstå att oddsen för att överleva (under en likvärdig uppföljningsperiod) är högre än oddsen för att dö i den aktuella populationen. Här ser vi modellens grad av anpassning till data (= dess förmåga att predicera hur folk ligger till på den beroende variabeln) efter att prediktorerna inkluderats i modellen. Ett lågt värde på -2 Log Likelihood indikerar god anpassning mellan modell och data. Cox & Snell samt Nagelkerke är pseudo-mått på hur mycket av variationen i den beroende variabeln som kan förklaras av den aktuella modellen. Cox & Snell har den otrevliga egenskapen att den inte kan bli 1 (vilket Nagelkerke kompenserar för). Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 411,934 a,071,146 a. Estimation terminated at iteration number 6 because parameter estimates changed by less than,001. Här ser vi att modellens -2LL sjunkit med 51,255 från nollmodellen. Eftersom vi lagt till fem prediktorer så tappar vi 5 frihetsgrader. Eftersom -2LL och skillnaden mellan två -2LL-värden har en chi2-fördelning kan vi testa om vår modell är signifikant bättre på att predicera odds för död jämfört med nollmodellen, med hänsyn tagen till tappet av frihetsgrader. Eftersom ett chi2- värde på 51,255 är jättesignifikant med fem frihetsgrader (p <.001) kan vi med stor säkerhet säga att modellen med prediktorer är bättre på att predicera odds för död jämfört med nollmodellen. Detta kan också tas som indikation på att åtminstone en av de fem prediktorerna har en effekt på odds för död i den population som stickprovet representerar.

4 4 Här ser vi att den formel som ger bäst prediktioner av Ln(Odds för död) är: -3, ,025 * Ålder 1,202 * Kvinna + 0,009 * Systoliskt BT 0,029 * Diastoliskt BT + 1,337 * Antihypertensiva. Kontrollerat för effekten av de andra prediktorerna är det endast Kön och användningen av Antihypertensiva som med tillräckligt hög säkerhet kan antas påverka odds för död i populationen som stickprovet representerar. Om vi kontrollerar för effekten av de andra prediktorerna så är Ln(Odds för död) 1,202 lägre bland kvinnor jämfört med män. Tar vi e -1,202 så får vi 0,301, vilket innebär att odds för död bland kvinnor endast är 30,1 % av vad odds för död är bland män. Kontrollerat för effekten av de andra prediktorerna är odds för död bland dem som använder antihypertensiva medel 3,808 gånger högre jämfört med dem som inte använder sådana medel. Kontrollerat för effekten av de andra prediktorerna är en ökning i diastoliskt blodtryck med ett steg associerad med en sänkning i odds för död med 2,9 %, men effekten är endast marginellt signifikant (p =.077) 2.2 Hierarkisk analys samt interaktion Ofta lägger man till prediktorer i en modell i ett andra eller tredje steg, för att på så sätt se om dessa prediktorer bidrar till att förbättra modellen prediktiva förmåga efter att man kontrollerat för effekten av vissa standardprediktorer. I det aktuella fallet lägger vi till ålder i steg 1, kön i steg 2 och interaktionen ålder kön i steg 3. För att köra analysen: Analyze Regression Binary Logistic. Kör in death i rutan Dependent och age i rutan Covariates. För att lägga till prediktorer på lägre hierarkisk nivå: Klicka på Next ovanför rutan Covariates. Kör nu in female i rutan Covariates och klicka på Next. För att speca en interaktion: Markera de två prediktorerna i listan till vänster (klicka på dem medan du håller ner Ctrltangenten ) och klicka sedan på knappen >a*b>. Nu har vi specat våra interaktioner med tre hierarkiska nivåer klicka på OK för att köra analysen.

5 5 Block 1: Method = Enter Tabell 1 visar att inkluderandet av ålder som prediktor gör modellen signifikant (p =.046) bättre på att predicera odds för död jämfört med nollmodellen. Modellens - 2LL sjunker med 3.993, till (tabell 2) och enligt Nagelkerke förklarar ålder 1.2 % av variansen i odds för död. Den understa tabellen visar att för varje års ökning i ålder ökar Ln(odds för död) med 0,046, vilket innebär att för varje års ökning i ålder ökar odds för död med 4.7 %, vilket är en signifikant effekt (p =.043). Interceptet säger oss att om ålder = 0 år så är odds för död endast 0,004. Block 2: Method = Enter Vi behåller ålder som en prediktor men inkluderar även kön. Vi ser att modellens -2LL sjunker med (från till ) och att detta är en signifikant förbättring (p <.001). Ålder och kön förklarar tillsammans 6.7 % av variansen i odds för död. I den undre tabellen ser vi att om vi konstanthåller kön så leder en ökning i ålder med ett år till en ökning i odds för död med 5 %, vilket är en signifikant effekt (p =.033). Om vi konstanthåller ålder så är odds för död bland kvinnor endast 32.9% av vad den är bland män, vilket är en signifikant skillnad ( p <.001).

6 6 Block 3: Method = Enter När ålder och kön redan är med som prediktorer i modellen, leder inkluderandet av deras interaktion till en sänkning av modellens -2LL med 2.625, vilket inte är någon signifikant förbättring (p =.105). I den nedre tabellen ser vi att om female = 0 (alltså bland manliga försökspersoner) är en ökning i ålder med ett år associerad med en ökning i odds för död med 1.4 %. Vi kan räkna fram att bland kvinnliga försökspersoner är effekten av ålder på ln(odds för död) = = 0.088, vilket innebär att bland kvinnor är en ökning i ålder med ett associerad med en ökning i odds för död med e = 1.092, alltså 9.2%. Att interaktionen inte är signifikant säger oss att denna skillnad i effekten av ålder på odds för död mellan kvinnor och män inte är signifikant. 2.3 Diagnostik Under Options-knappen kan man be programmet plocka fram lite extra godis. T. ex. skulle vi kanske vilja veta om modellens prediktiva förmåga ser OK ut över hela skalan. Då kan man be programmet att köra ett s.k. Hosmer and Lemeshow Test. Detta test delar in personerna i tio grupper (från lägst till högst) utifrån estimerad sannolikhet för att de skall ha värdet 1 (snarare än 0) på den beroende variabeln. I varje grupp beräknas, utifrån gruppmedelemmarnas individuella sannolikhet för värdet 1, antalet personer som förväntas ha värdet 1 respektive 0 på den beroende variabeln. Dessa förväntade frekvenser jämförs sedan med faktiskt antal personer med värdet 1 respektive 0. Om modellen funkar på ett bra sätt skall skillnaderna mellan dessa förväntade och faktiskt observerade frekvenser vara små över hela

7 7 skalan. Utifrån skillnaderna mellan förväntade och observerade frekvenser beräknas ett chi2- värde, som helst skall vara lågt och icke-signifikant eftersom detta indikerar en väl fungerande modell. I det aktuella fallet har odds för död estimerats utifrån ålder, kön, systoliskt och diastoliskt blodtryck samt om man äter antihypertensiva läkemedel. I gruppen med lägst odds för död har vi 70 personer, av dessa förväntas ha dött och vara vid livet medan det faktiska antalet är 1 respektive 69. Vi ser över hela skala att skillnaderna mellan förväntade och faktiska frekvenser inte är så stora, vilket resulterar i ett ickesignifikant chi2-värde (7.552, p =.478). Under Save-knappen kan man be programmet att spara olika värden för de enskilda personerna som sedan kan användas för att diagnostisera om data lämpar sig för en logistisk regression. I det aktuella fallet ber jag programmet att spara standardiserade residualer (= differensen mellan personens värde på den beroende variabeln (0 eller 1) och enligt modellen predicerad sannolikhet för att personen skall ha värdet 1) samt DfBeta(s) (= hur individens värden påverkar de framräknade koefficienterna. Ett sätt att titta på residualerna är att plotta dem mot personernas identifikationsnummer. Nedan till vänster ser vi att residualerna tenderar att vara större på den positiva sidan (= personer som har dött) än på den negativa (= personer som lever). Detta skulle kanske kunna tas som en indikation på att vår modell har bättre specificitet än sensitivitet. På samma sätt kan vi plotta DfBeta(s) mot id-nummer och se efter så att inga värden sticker iväg. Nedan till höger visas DfBeta för koefficienten för effekten av systoliskt blodtryck. Det ser bra ut de flesta värden grupperar sig kring noll och avvikelserna i positiv och negativ riktning ser ut på ett liknande sätt. 3. Survival Analys med Cox Regression I analyserna ovan med logistisk regression tog vi inte hänsyn hur lång tid det tog för dem som dog att dö, vilket givetvis är en brist i analysen. Med survival analys, t.ex. Cox regression, kan vi ta hänsyn till denna information och estimera hur olika faktorer påverkar risken att dö per tidsenhet ( hazard).

8 8 3.1 Fixa till tiden Det är nog rätt vanligt att man i sitt dataset har olika kolumner som anger datum för de olika mätningarna och händelserna. I det aktuella fallet har vi t.ex. en kolumn (date0) som anger datum för uppföljningsperiodens början (olika för olika personer) samt en kolumn (date_event) som anger datum man dött (för de som dött) alternativt datum för sista mätningen (för de som ej dött). För att räkna fram tiden mellan dessa två datum: Transform Compute Variable. I rutan Target Variable anger du den nya variabelns namn (t.ex. levtid ) och i rutan Numeric Expression kör man in variabeln date_event genom att klicka i listan till vänster, man skriver ett minustecken, och så kör man in variabeln date0. Den nya variabeln skulle nu vara i sekunder, för att få det i dagar kan vi dividera skillnaden mellan de två datumen med 60*60*24 (= antalet sekunder per dag). Klicka på OK och den nya variabeln levtid dyker upp längst ut till höger i datasetet. 3.2 En första körning Vi börjar med en analys av hur patienternas ålder vid början av uppföljningsperioden påverkar hazard för att de skall dö. För att köra en Cox regression med tids-oberoende prediktorer: Analyze Survival Cox Regression. Kör in variabeln som anger tid från baseline till död alternativt periodens slut i rutan Time och den dikotoma variabeln som anger om man upplevt händelsen av intresse (i vårt fall död) i rutan Status, klicka på Define Event och ange vilket värde som anger att man upplevt händelsen (i vårt fall 1). Klicka på Continue. Tillbaka i huvudrutan kör vi in vår oberoende variabel (= prediktor) i rutan Covariates:. Nu är vi redo att köra, klicka på OK. Här ser vi att 72 patienter dött under uppföljningsperioden. 625 personer har inte konstaterats döda, antingen för att de överlevt hela perioden eller för att de försvunnit ur studien. Patienter blir även censurerade om de dör av fel anledning, t.ex. om man skall analysera dödlighet i cancer och en patient dör i en bilolycka (inte aktuellt i detta fall där det handlar om ospecifik dödlighet).

9 9 Den s.k. nollmodellen, där hazard för utfall (i vårt fall död) endast antas påverkas av tid, har en -2LL på När vi inkluderar även ålder som prediktor sjunker -2LL med (från till ) och detta är en signifikant förbättring av modellens förmåga att predicera hazard för död (p =.042, lågt -2LL indikerar bra prediktiv förmåga). Här ser vi att ln(hazard för död) ökar med för varje års ökning i ålder, vilket innebär att för varje års ökning i ålder ökar hazard för död med 4.5% (eftersom e = 1.045). Wald = (B/SE) 2 = (0.044/0.021) 2 = Med stora stickprov har Wald en chi2-fördelning. Vi ser att vårt Waldvärde är signifikant (p =.038) vilket säger oss att effekten av ålder på hazard är signifikant (vi kan anta att det finns en sådan effekt i populationen som stickprovet representerar). Det verkar vara en relativt allmän uppfattning av sänkningen i -2LL är ett bättre signifikansmått än Wald, men oftast indikerar de nog samma sak. 3.3 En andra körning (med hierarki, kategoriprediktor samt interaktion) I den här analysen stoppar vi in prediktorer i tre steg (1) I vilken utsträckning patienten bedöms efterfölja sin behandling (skala 1-5); (2) Vilken av fyra olika behandlingar patienten erhåller (A-D, kategoriprediktor); (3) Interaktionen mellan Efterlevnad och Behandling. Kör in Efterlevnad i rutan Covariates: Klicka på Next ovanför rutan Kör in Behandling Klicka på Next Markera både Efterlevnad och Behandling i rutan till vänster (klicka på den ena och sedan på den andra medan du håller ner Ctrl-tangenten) Klicka på >a*b>. För att speca en kategori-prediktor: Klicka på Categorial Kör in kategori-prediktorn (i vårt fall Behandling) i rutan Categorial Covariates:. Vi ser att behandling D blir vår referenskategori (Last) och effekten av de andra behandlingarna kommer att jämföras med effekten av behandling D. Klicka på Continue. Vi är redo att köra klicka på OK.

10 10 Block 1: Method = Enter Jämfört med nollmodellen sjunker -2LL med när vi tar med Efterlevnad som en prediktor av hazard för död, men denna förbättring är inte signifikant (p =.283). En ökning i Efterlevnad med ett är associerad med en sänkning i hazard för död med 0.109, men även Wald visar att effekten inte är signifikant. Block 2: Method = Enter Inkluderandet av behandling leder till ensignifikant förbättring i modellens förmåga att predicera hazard för död (-2LL sjunker med , p <.001). I den undre tabellen ser vi att kontrollerat för effekten av Efterlevnad har vi en signifikant huvudeffekt av Behandling (Wald = , p <.001). Vi ser att kontrollerat för effekten av Efterlevnad och jämfört med behandling D (vår referenskategori) är hazard för död gånger så hög bland dem som får behandling B (p =.001) och = 86.3% lägre bland dem som får behandling C (p <.001). Hazard för död är 16.8% lägre bland dem som får behandling A jämfört med behandling D, men denna skillnad är inte signifikant (p =.597). Block 3: Method = Enter Nedan ser vi att inkluderandet av interaktionen mellan Behandling och Efterlevnad ytterligare förbättrar modellens förmåga att predicera hazard för död (-2LL sjunker med , p <.001). Vi kan alltså anta att effekten av Efterlevnad på hazard för död ser olika ut för de olika behandlingarna. Detta ser vi även i den undre tabellen (Wald för interaktionen = , p =.008). Den undre tabellen säger oss att i referenskategorin (= behandling D) är en ökning i Efterlevnad med ett associerad med en sänkning i hazard för död med 6%, men att denna effekt inte är signifikant (p =.709). Jämfört med behandling D (referenskategorin) estimeras effekten av Efterlevnad vara signifikant mer negativ bland dem som får behandling A (p =.015) och signifikant mer positiv bland dem som får behandling C (p =.027). Effekten av Efterlevnad på hazard för död estimeras inte vara annorlunda bland dem som får behandling B jämfört med dem som får behandling D (p =.027).

11 11 Eftersom analysen ovan visade en signifikant interaktion mellan Behandling och Efterlevnad vad gäller effekten på hazard för död är det en bra idé att kika på effekten av Efterlevnad separat för de olika behandlingarna. Vi splittar alltså filen utifrån Behandling och analyserar sedan den enkla effekten av Efterlevnad på hazard för död. Här ser vi att för behandling A är en ökning i efterlevnad med ett associerad med en sänkning i hazard för död med = 64.2%. Bra så. För behandling C är dock en ökning i efterlevnad med ett associerad med en drygt sjufaldig ÖKNING i hazard för död (verkar inte vara någon vidare behandling). För behandling B och D har efterlevnad inget signifikant samband med hazard för död (p =.332 respektive.713). 3.4 Tids-beroende prediktor Ibland mäter man folks värden på en eller flera prediktorer vid flera tillfällen. Då kan man utnyttja denna information genom att se om den senaste mätningen av prediktorn (snarare än mätningen vid baseline) har något samband med hazard för händelse fram till nästa mätning. Detta gör vi genom att köra en Cox regression med en (vi kan endast ha en åt gången) tidsberoende prediktor. I det aktuella fallet har jag beräknat antalet dagar från baseline till första uppföljningen (time1) samt från baseline till den andra uppföljningen (time2). Dessa avstånd varierar från individ till individ. Här skall vi kika på effekten av systoliskt blodtryck (mätt tre gånger per person) på hazard för död.

12 12 För att köra analysen: Analyze Survival Cox Regression w/ Time-Dep Cov. I den första rutan skall vi speca vår tids-beroende prediktor. Vi ser att längst upp i den vänstra rutan har det dykt upp en ny variabel som anger tiden (från baseline). Vi kan köra in denna variabel (liksom de andra variablerna) i rutan Expression for T_COV: genom att markera variabeln och klicka på pilen mellan rutorna. I det aktuella fallet skriver vi så här i rutan Expression for T_COV: : (T_ < time1) * sbp0 + (T_ >= time1 & T_ < time2) * sbp1 + (T_ >= time2) * sbp2 Uttrycken inom parentes är logiska argument som antar värdet 1 (= sant) eller 0 (= falskt). Så om vi befinner oss i tid mellan baseline och uppföljning 1 så antar argumentet följande värde: 1 * sbp0 + 0 * sbp1 + 0 * sbp2 Och detta blir ju det samma som det systoliska blodtrycket vid baseline. På samma sätt antar argumentet samma värde som sbp1 (=systoliskt blodtryck vid den första uppföljningen) om tidpunkten är mellan den första och den andra uppföljningen och samma värde som sbp2 om vi befinner oss efter den andra uppföljningen. På detta sätt får vi ett mer finjusterat mått på patienternas blodtryck och med stor sannolikhet högre power i vår analys av effekten av blodtryck på hazard för död. När vi specat vår tids-beroende prediktor klickar vi på Model. Vi kommer till en identisk Cox Regression-ruta som tidigare. Längst upp i rutan till vänster står vår ny-specade tids-beroende prediktor (kallas för T_COV_). Vi kan använda denna som en prediktor av hazard för händelse på samma sätt som övriga prediktorer. I det aktuella fallet har jag kört en hierarkisk analys där jag lägger in systoliskt blodtryck (= T_COV_) efter ålder och så lägger jag till interaktionen i steg tre. Här ser vi att kontrollerat för effekten av ålder har systoliskt BT en nästan signifikant (p =.053) association med hazard för död. För varje ökning i BT med ett ökar hazard för död med 1.1%. Vi ser att interaktionen inte heller är långt ifrån att vara signifikant (p =.100). Bland nyfödda (??) är en ökning i BT med ett associerad med en ökning i hazard för död med 31.2%. Denna association blir dock svagare och svagare ju äldre patienterna är.

13 Diagnostik Cox fullständiga namn är ju Cox proportional hazard model vilket innebär att kvoten mellan olika gruppers hazard antas vara den samma över hela tidsspannet (vissa menar dock att man inte behöver vara alltför neurotisk över detta antagande). Ett sätt att diagnostisera detta är att under Plots i Cox-rutan be programmet skapa ett s.k. Log minus log -diagram. Kör man in sin grupperingsvariabel i rutan Separate Lines for: så får man en linje för varje grupp (funkar endast med kategoriprediktorer). I det aktuella fallet visas separata linjer för de fyra olika behandlingsgrupperna. Vad vi vill att dessa linjer skall vara hyfsat parallella, avståndet mellan dem skall alltså vara ungefär lika stort över hela tidsspannet och de bör absolut inte korsa varandra. I det aktuella fallet ser det väldigt bra ut (kanske för att data är konstruerade). För kontinuerliga prediktorer kan man be programmet plocka fram s.k. partiella residualer (görs under Save -knappen, här kan man även be om DfBeta(s)). Till skillnad från linjär regression får vi ett residualmått per prediktor. I det aktuella fallet inkluderas endast ålder som en prediktor av hazard för död. Vi plottar (Graphs Legacy Dialogs Scatter/Dot Simple Scatter; kör in överlevnadstid på X-axeln och residualerna på Y-axeln). Vi vill att residualerna skall vara slumpmässigt fördelade omkring noll över hela tidsspannet det ser OK ut i det aktuella fallet.

14 14 Ytterligare ett sätt för att testa om hazard är proportionell över hela tidsspannet är att inkludera en term för interaktion mellan den aktuella prediktorn och tid: Analyze Survival Cox Regression w/ Time-Dep Cov. Kör in Time i rutan Expression for T_COV:, inget mer. Klicka på OK. I det aktuella fallet har jag en modell där hazard för död prediceras utifrån behandling (A-D, kategoriprediktor) samt interaktionen mellan behandling och T_COV_ (= tid). I tabellen ovan ser vi att interaktionen inte är signifikant (p =.213) vilket indikerar att effekten av behandling på hazard för död inte ändras över tid gott så eftersom detta visar på en proportionell effekt. På samma sätt kan man testa hypoteser om att effekten av en prediktor på hazard för händelse varierar över tid, men då kanske man önskar sig att interaktionen blir signifikant. Precis som vid linjär och logistisk regression kan det vara bra att kika även på DfBetas för att se så att framräknade koefficienter inte påverkats otillbörligt mycket av värden från några få personer. Vi kan be programmet att spara de olika individernas DfBeta under Saveknappen. Här har jag plottat DfBeta för effekten av ålder på hazard för död mot id-nummer. Vi ser att värdena grupperar sig runt noll och att inget värde sticker iväg, samt att vi har ungefär lika många moderata avvikare åt det positiva och det negativa hållet gott så.

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL) Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio

Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio med SPSS Kimmo Sorjonen 1. Faktoranalys Innan man utför en faktoranalys kan det vara bra att testa om det finns några outliers i data. Detta kan

Läs mer

Intro till SPSS Kimmo Sorjonen (0811)

Intro till SPSS Kimmo Sorjonen (0811) 1 Intro till SPSS Kimmo Sorjonen (0811) 1. Att mata in data i SPSS 1. Klicka på ikonen för SPSS. 2. Välj alternativet Type in data och klicka på OK. 3. Databladet har två flikar: Data view och Variable

Läs mer

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/12 2008. Av: Markus Ederwall, 21488

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/12 2008. Av: Markus Ederwall, 21488 Idiotens guide till Håkan Lyckeborgs SPSS-föreläsning 4/12 2008 Av: Markus Ederwall, 21488 1. Starta SPSS! 2. Hitta din datamängd på Kurs 601\downloads\datamängd A på studentwebben 3. När du hittat datamängden

Läs mer

Variansanalys med SPSS Kimmo Sorjonen (2012-01-19)

Variansanalys med SPSS Kimmo Sorjonen (2012-01-19) 1 Variansanalys med SPSS Kimmo Sorjonen (2012-01-19) 1. Envägs ANOVA för oberoende mätningar 1.1 Variabler Data simulerar det som använts i följande undersökning (se Appendix A): Petty, R. E., & Cacioppo,

Läs mer

Mata in data i Excel och bearbeta i SPSS

Mata in data i Excel och bearbeta i SPSS Mata in data i Excel och bearbeta i SPSS I filen enkät.pdf finns svar från fyra män taget från en stor undersökning som gjordes i början av 70- talet. Ni skall mata in dessa uppgifter på att sätt som är

Läs mer

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data Överlevnadsanalys 732G34 Statistisk analys av komplexa data 1 Tvärsnittsstudie Prospektiv Kohortstudie Observationsstudie Tvärsnittsstudie Retrospektiv Experimentell studie (alltid prospektiv) Klinisk

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen 1. One-Sample T-Test 1.1 När? Denna analys kan utföras om man vill ta reda på om en populations medelvärde på en viss variabel kan antas

Läs mer

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24)

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1 Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1. Variabler och tänkt modell Data simulerar de som använts i följande studie (se Appendix A): Hull, J. G., & Mendolia, M. (1991). Modeling

Läs mer

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Laboration 5 Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Deluppgift 1: Enkel linjär regression Övning Under denna uppgift ska enkel

Läs mer

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT-2009 Laboration P3-P4 Statistiska test MH:231 Grupp A: Tisdag 17/11-09, 8.15-10.00 och Måndag 23/11-09, 8.15-10.00 Grupp B: Tisdag

Läs mer

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet 1 Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet Uppdaterad: 120412 För att bli godkänd skall man utföra alla sex uppgifter som beskrivs nedan. OBS:

Läs mer

Kort manual till SPSS 10.0 för Mac/PC

Kort manual till SPSS 10.0 för Mac/PC Institutionen för beteendevetenskap Linköpings universitet Kort manual till SPSS 10.0 för Mac/PC 1. Att skapa en ny variabel Inmatning av data sker i det spread sheet som kallas Data View (flik längst

Läs mer

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur

Läs mer

JMG. En introduktion till logistisk regressionsanalys. Arbetsrapport nr 62. Johannes Bjerling Jonas Ohlsson

JMG. En introduktion till logistisk regressionsanalys. Arbetsrapport nr 62. Johannes Bjerling Jonas Ohlsson Arbetsrapport nr 62 En introduktion till logistisk regressionsanalys Johannes Bjerling Jonas Ohlsson JMG Institutionen för journalistik, medier och kommunikation Arbetsrapport nr. 62 En introduktion till

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Marknadsinformationsmetodik Inlämningsuppgift

Marknadsinformationsmetodik Inlämningsuppgift Marknadsinformationsmetodik Inlämningsuppgift Uppgiften löses med hjälp av SPSS. Klistra in tabeller och diagram från SPSS i ett Worddokument och kommentera där. Använd ett försättsblad till den slutgiltiga

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

a) Facit till räkneseminarium 3

a) Facit till räkneseminarium 3 3.1 Fig 1. Sammanlagt 30 individer rekryteras till studien. Individerna randomiseras till en av de fyra studiearmarna (1: 500 mg artemisinin i kombination med piperakin, 2: 100 mg AMP1050 i kombination

Läs mer

DATORÖVNING 3: MER OM STATISTISK INFERENS.

DATORÖVNING 3: MER OM STATISTISK INFERENS. DATORÖVNING 3: MER OM STATISTISK INFERENS. START Logga in och starta Minitab. STATISTISK INFERENS MED DATORNS HJÄLP Vi fortsätter att arbeta med datamaterialet från datorävning 2: HUS.xls. Som vi sett

Läs mer

Uppgift 1. Produktmomentkorrelationskoefficienten

Uppgift 1. Produktmomentkorrelationskoefficienten Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill

Läs mer

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet Formell analys Informell data analys Design and mätning Problem Formell analys Informell data analys Hur

Läs mer

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet 1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 130114 För att bli godkänd på inlämningsuppgiften krävs att man

Läs mer

Uppgift 1. Deskripitiv statistik. Lön

Uppgift 1. Deskripitiv statistik. Lön Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot

Läs mer

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet SPSS (PASW) 18 for Windows - a guided tour VT 2010 2 Introduktion till SPSS (PSAW) Denna övning kommer steg för steg att lära oss de grundläggande

Läs mer

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum: Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum: 120203 Ovanstående nummer är ditt identifikationsnummer! Skriv in detta nummer på varje blad i tentan

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Multipel regression och Partiella korrelationer

Multipel regression och Partiella korrelationer Multipel regression och Partiella korrelationer Joakim Westerlund Kom ihåg bakomliggande variabelproblemet: Temperatur Jackförsäljning Oljeförbrukning Bakomliggande variabelproblemet kan, som tidigare

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Regressionsanalys Enkel regressionsanalys Regressionslinjen

Regressionsanalys Enkel regressionsanalys Regressionslinjen -9-6 Regreionanaly - om en mak åt en hungrande Kimmo Sorjonen Sektionen för Pykologi Karolinka Intitutet. Enkel reg.analy.. Data.. Reg.linjen.. Beta (β).. Signifikan.. Reg. om Var..6. Korr. & Förklarad

Läs mer

Datorövning 1 Enkel linjär regressionsanalys

Datorövning 1 Enkel linjär regressionsanalys Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två

Läs mer

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ Åke Aronsson och Studentlittertur Att komma igång med SPSS 1 Kapitel 7: Att komma igång med SPSS Syftet med detta avsnitt är att ge en introduktion till SPSS 9.0 för Windows 95/98/NT. I det här avsnittet

Läs mer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,

Läs mer

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk) Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0

Läs mer

Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor

Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Survival analysis (Dag 1) Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Henrik Källberg, 2012 Survival

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Laboration: Att inhägna ett rektangulärt område

Laboration: Att inhägna ett rektangulärt område Laboration: Att inhägna ett rektangulärt område Du har tillgång till ett hoprullat staket som är 30 m långt. Med detta vill du inhägna ett område och använda allt staket. Du vill göra inhägnaden rektangelformad.

Läs mer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1 STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och

Läs mer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT007 Laboration Simulering Grupp A: 007-11-1, 8.15-.00 Grupp B: 007-11-1, 13.15-15.00 Introduktion Syftet

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

En introduktion till och första övning i @Risk5 for Excel

En introduktion till och första övning i @Risk5 for Excel LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg / Lars Wahlgren VT2012 En introduktion till och första övning i @Risk5 for Excel Vi har redan under kursen stiftat bekantskap med Minitab

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet 1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om

Läs mer

Obligatorisk uppgift, del 1

Obligatorisk uppgift, del 1 Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten

Läs mer

Datorlaboration 2 Konfidensintervall & hypotesprövning

Datorlaboration 2 Konfidensintervall & hypotesprövning Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska

Läs mer

HELT NY VERSION. Uppgradera till version 13. Statistica förvandlar data till information

HELT NY VERSION. Uppgradera till version 13. Statistica förvandlar data till information STATISTIC A1 3 HELT NY VERSION Uppgradera till version 13 Statistica förvandlar data till information UPPGRADERINGSKAMPA1N6J TOM 31 DECEMBER 20 Uppgradera till nya Statistica 13! Statistica utvecklas ständigt

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet 1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 120113 För att bli godkänd på inlämningsuppgiften krävs att man

Läs mer

Upphandling av måltidsverksamhet inom äldreomsorgen

Upphandling av måltidsverksamhet inom äldreomsorgen Uppsala universitet HT 2015 Statistiska institutionen Examensarbete 15 hp Upphandling av måltidsverksamhet inom äldreomsorgen En logistisk regressionsanalys Författare: Henrik Olsson Handledare: Anna Bornefalk-Hermansson

Läs mer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell. Laboration 2. Statistiska test Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg/Jep Agrell Laboration 2 Statistiska test HT 2008 2 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

Blodtrycksfall, pulstryck och lindriga kognitiva symptom

Blodtrycksfall, pulstryck och lindriga kognitiva symptom Lunds Universitet STA103:2 Statistiska institutionen ht 2006 Handledare: Björn Holmquist Blodtrycksfall, pulstryck och lindriga kognitiva symptom En polytom logistisk regressionsanalys Jenny Rönn Tack

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial? MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.

Läs mer

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade) 5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

ANOVA Faktoriell (tvåvägs)

ANOVA Faktoriell (tvåvägs) ANOVA Faktoriell (tvåvägs) Faktoriell ANOVA (tvåvägs) Två oberoende variabel ( tvåvägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser.

Läs mer

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14 KA RKUNSKAP Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc Vad vet samhällsvetarna om sin kår? STAA31 HT14 Handledare: Peter Gustafsson Ekonomihögskolan, Statistiska institutionen Innehållsförteckning

Läs mer

Resursfördelningsmodellen

Resursfördelningsmodellen PCA/MIH Johan Löfgren Rapport 25-6-26 (6) Resursfördelningsmodellen Växjös skolor våren 25 Inledning Underlag för analyserna utgörs av ett register som innehåller elever som gått ut årskurs nio 2 24. Registret

Läs mer

Introduktion till SPSS

Introduktion till SPSS Introduktion till SPSS.. Innehåll 1 Introduktion till SPSS 1 1.1 Data Editor 1 1.2 Viewer 1 2 Variabler och Mätskalor 2 2.1 Kvantitativa variabler (Numeriska variabler) 2 2.2 Kategoriska variabler (Kvalitativa

Läs mer

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum: Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum: 110319 Ovanstående nummer är ditt identifikationsnummer! Skriv in detta nummer på varje blad i tentan

Läs mer

FACIT!!! (bara facit,

FACIT!!! (bara facit, STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt

Läs mer

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare! SPSS En guidad tur Mål: På den här introduktionen kommer du att lära dig de elementäraste funktionerna i SPSS, dels genom att mata in eget datamaterial och dels genom en analys av en studentundersökning

Läs mer

Svensk Dialysdatabas. Blodtryck och blodtrycksbehandling PD. Klinikdata hösten 2005 Översikt åren 2002 2005

Svensk Dialysdatabas. Blodtryck och blodtrycksbehandling PD. Klinikdata hösten 2005 Översikt åren 2002 2005 Svensk Dialysdatabas Blodtryck och blodtrycksbehandling PD Klinikdata hösten 5 Översikt åren 2 5 Innehållsförteckning Läsanvisningar och kommentarer...3 Figur 1. Systoliskt BT 5...4 Figur 2. Andel med

Läs mer

Tillvägaghångssätt för skattning av körkortsmodell

Tillvägaghångssätt för skattning av körkortsmodell Siamak Baradaran sia@kth.se Tillvägaghångssätt för skattning av körkortsmodell 1 Syfte med modellen Syftet med denna forskning har varit att utveckla en beskrivande modell som kan hjälpa oss att förstå

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Bygga linjära modeller! Didrik Vanhoenacker 2007

Bygga linjära modeller! Didrik Vanhoenacker 2007 Bygga linjära modeller! Didrik Vanhoenacker 2007 1 Bygga enkla modeller Tänk att vi ska försöka förstå vad som styr hur många blommor korsblommiga växter har. T ex hos Lomme och Penningört. Hittills har

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Grupp/Center-statistik. Terminologi/ordlista...2 Urval...3 Analystyper...4

Grupp/Center-statistik. Terminologi/ordlista...2 Urval...3 Analystyper...4 Terminologi/ordlista...2...3 Analystyper...4 1 Terminologi/ordlista Gruppering Patientinformationsvariabel Besöksvariabel Patientstatus En/flervalsvariabel Numerisk variabel Fritextvariabel Standardbesök

Läs mer

Richard Öhrvall, http://richardohrvall.com/ 1

Richard Öhrvall, http://richardohrvall.com/ 1 Läsa in data (1/4) Välj File>Open>Data Läsa in data (2/4) Leta reda på rätt fil, Markera den, välj Open http://richardohrvall.com/ 1 Läsa in data (3/4) Nu ska data vara inläst. Variable View Variabelvärden

Läs mer

FACIT (korrekta svar i röd fetstil)

FACIT (korrekta svar i röd fetstil) v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta

Läs mer

Det finns några grundinställningar och förutsättningar som man bör tänka på innan man börjar använda pluginet och spela online.

Det finns några grundinställningar och förutsättningar som man bör tänka på innan man börjar använda pluginet och spela online. Använda pluginet Inställningar Det finns några grundinställningar och förutsättningar som man bör tänka på innan man börjar använda pluginet och spela online. Angående bilens setuper så finns ingen möjlighet

Läs mer

Datorövning 5 Exponentiella modeller och elasticitetssamband

Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. anpassa och tolka analysen av en exponentiell

Läs mer

TAMS28 DATORÖVNING 1-2015 VT1

TAMS28 DATORÖVNING 1-2015 VT1 TAMS28 DATORÖVNING 1-2015 VT1 Datorövningen behandlar simulering av observationer från diskreta och kontinuerliga fördelningar med hjälp av dator, illustration av skattningars osäkerhet, analys vid parvisa

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:.. TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 8

ÖVNINGSUPPGIFTER KAPITEL 8 ÖVNINGSUPPGIFTER KAPITEL 8 SAMPEL KONTRA POPULATION 1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Examensarbete 2008:7

Examensarbete 2008:7 Matematisk statistik Stockholms universitet Överlevnadsanalys baserad på upprepade oregelbundna mätningar Applicering av statistiska metoder för jämförelse av två behandlingsmetoder mot depression Tsegalem

Läs mer

FK2005 Datorövning 3

FK2005 Datorövning 3 FK2005 Datorövning 3 Den här övningen vänder sig endast till lärarstudenter (FK2005). Målet är att lära sig hur man gör en minsta kvadrat anpassning med hjälp av OpenOffice Calc. Laboration 2 kräver att

Läs mer

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2014 Avd. Matematisk statistik GB 2014-03-17 DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV. Till den här datorlaborationen

Läs mer

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska) Datorövning 2 Statistik med Excel (Office 2007, svenska) Denna datorövning fokuserar på att upptäcka samband mellan två variabler. Det görs genom att rita spridningsdiagram och beräkna korrelationskoefficienter

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 4 Syfte: 1. Lära sig beräkna konfidensintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik

Läs mer