Regressionsanalys med SPSS Kimmo Sorjonen (2010)
|
|
- Elias Svensson
- för 7 år sedan
- Visningar:
Transkript
1 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet; (2) ålder; (3) studier, anger hur många timmar i veckan man ägnar sig åt sina studier; (4) sova, anger hur många timmar i veckan man sover; (5) tv, anger hur många timmar i veckan man tittar på TV; (6) motionera, anger hur många timmar i veckan man motionerar. I en linjär multipel regression bör utfallsvariabeln (i det här fallet life.sat) ha ett linjärt samband med prediktorerna (alternativt inget samband). För att kolla detta: Graphs Legacy Dialogs Scatter/Dot. Klicka på Matrix Scatter och sedan på Define. Kör in alla variabler i rutan Matrix Variables och klicka på OK. I det aktuella fallet erhölls följande matris (endast raden för life.sat visas): På variablerna Ålder (längst till vänster) och TV-tittande (fyra från vänster) finns varsin positiv outlier. Annars ser inte sambanden oroväckande icke-linjära ut. Vi kör. life.sat studier TV life.sat 1.2. En första körning (Enter-metoden) För att köra vanlig linjär regression i SPSS: Klicka på Analyze Regression Linear. Kör in kriterievariabeln i rutan Dependent och prediktorerna i rutan Independent(s). För att kontrollera för kollinearitet: Klicka på Statistics Kryssa för Collinearity diagnostics (ger Tolerance och VIF ). Klicka på Continue. Klicka på OK för att köra analysen. I det här exemplet har life satisfaction predicerats utifrån de fem övriga variablerna. Modellen förklarar 14,1 % av variansen i life satisfaction. Korrigerat för antalet prediktorer (fem stycken) och N (64) förklarar modellen 6,7 % av variansen i life satisfaction.
2 2 Om man kontrollerar för de andra prediktorerna så har endast antalet pluggade timmar i veckan en signifikant (och positiv) effekt på life satisfaction. Detta bör dock tolkas med försiktighet eftersom F-kvoten ovan inte var signifikant. Den aktuella modellen kan inte förklara signifikant mer än noll procent av variansen i life satisfaction, F(5, 58) = 1.91, p =.11. Alla prediktorer skulle kunna ha en koefficient på noll i populationen. Inga problem med kollinearitet (alla toleranser är höga och alla VIF är låga) Stepwise Hittills har vi kört med Enter som selektionsmetod, vilket innebär att alla valda prediktorer tas med i modellen. Genom att välja Stepwise som selektionsmetod så kan vi låta programmet välja ut de prediktorer som bidrar med en signifikant förbättring av modellen. För att välja Stepwise: Välj i menyn under Method (se figuren intill): Och så exempel på output (se även nästa sida): I steg 1 tas studier med som prediktor av life satisfaction. Efter detta kan ingen av de fyra andra prediktorerna bidra till att signifikant förbättra modellen (alltså tas de inte med). Modellen med studier som prediktor förklarar 6,8% av variansen i life satisfaction (5,3% om man justerar för antalet prediktorer och N).
3 3 Modellen med studier som prediktor förklarar signifikant mer än noll procent av variansen i life satisfaction, F(1, 62) = 4.51, p =.04. En timmes ökning i veckan i pluggande är associerad med en ökning i life satisfaction med 0,017 poäng (på en skala från 1 till 7). En ökning i pluggande med en standardavvikelse är associerad med en ökning i life satisfaction med 0,260 standardavvikelser Diagnostik Nu har vi alltså en modell där life satisfaction kan prediceras utifrån hur mycket man pluggar. Innan vi skickar in det hela till Science bör vi dock kontrollera att vissa diagnostiska kriterier är uppfyllda. Vi kör en regressionsmodell (enter-metoden) där life satisfaction prediceras utifrån studier. För diagnostik : Save Kryssa för Predicted Values, Unstandardized, Residuals, Standardized, och Influence Statistics, Standardized DfBeta(s). (Observera att dessa variabler beräknas för varje körning och sparas som variabler längst ut till höger i databladet). Klicka på Continue och sedan på OK. Vi får fyra nya variabler: (1) PRE_1, predicerad life satisfaction baserad på hur mycket man pluggar (= 4, ,017 studier); (2) ZRE_1, standardiserad residual ((observerad life satisfaction minus predicerad life satisfaction) / SD för residualen); (3) SDBO_1, standardiserat värde för hur mycket var och en av personerna påverkar det framräknade interceptet, ex drar personen på första raden ner värdet på interceptet med 0,17057 medelfel medan personen på andra raden lyfter interceptet med 0,00905 medelfel; (4) SDB1_1, standardiserat värde för hur mycket var och en av personerna påverkar den framräknade koefficienten för effekten av studier. Dessa nya variabler bör uppvisa vissa egenskaper för att vi skall känna oss trygga med att regressionsanalysen inte kommit fram till ett felaktigt resultat: (1) Residualerna bör i genomsnitt vara ungefär noll för alla nivåer av de predicerade värdena (detta kan undersökas genom att titta på en scatterplot med predicerade värden på x-axeln och med residualer på y- axeln); (2) Ingen person bör ha en otillbörligt stark effekt på framräknat intercept eller
4 4 regressionskoefficient (detta kan undersökas genom att titta på histogram över de standardiserade DfBeta-värdena). I det aktuella fallet ser det ut som nedan: Det finns inget samband mellan predicerade värden och residualer och för varje nivå av predicerade värden verkar den genomsnittliga residualen vara ungefär noll (det finns både positiva och negativa residualer). Gott så. DfBeta (standardiserat) för interceptet verkar vara ungefär jämt fördelat på båda sidor av noll och ingen person har ett värde som avviker särskilt mycket från de andras värden. Gott så. DfBeta (standardiserat) för koefficienten för effekten av studier ser väl rätt så OK ut. Tre personer har värden som kanske ligger lite långt åt det negativa hållet. Vi hittade en positiv effekt av studier på life satisfaction och utan dessa tre hade effekten varit mer positiv. Dessa tre bidrar alltså till att dämpa, snarare än till att förstärka, resultatet. Gott så (med tanke på att vi ändå fann en effekt) Standardisering Analyze Descriptive Statistics Descriptives Kör in variabeln som du vill standardisera i rutan Variable(s) Kryssa för Save standardized values as variables Klicka på OK. Den nya variabeln med standardiserade värden dyker upp längst ut till höger i databladet Kurvlinjära prediktorer Tänk dig att vi, av någon anledning, tror att sambandet mellan TV-tittande och life satisfaction bäst beskrivs med en kurva. Då kan vi kvadrera TV-variabeln och ta med den som en prediktor i analysen. Bl.a. för att undvika kollinearitet med den ursprungliga TV-variabeln standardiseras denna först (se ovan).
5 5 För att få fram den kvadrerade variabeln: Transform Compute variable. Ge den nya variabeln ett namn (i rutan Target Variable, se figuren intill). Kör in variabeln som skall kvadreras i rutan Numeric Expression, klicka på dubbelasterisk (= upphöjt till) och skriv till en tvåa. Klicka på OK. Den nya kvadrerade variabeln dyker upp längs ut till höger i databladet. Den kvadrerade variabeln kan nu användas som en prediktor i linjär regressionsanalys. Nedan ett exempel på utskrift: 1.7. Men TV-tittande har ett signifikant kurvlinjärt samband med life satisfaction. Eftersom koefficienten för den kvadrerade termen är positiv (+ 0,143) så vet vi att sambandet är U-format. Inverterat U- formade samband ( ) ger en negativ koefficient för den kvadrerade termen. Figuren till höger visar fördelningen av DfBeta (standardiserat) för koefficienten för den kvadrerade termen. Data från en enda person gör så att koefficienten blir drygt 2,5 medelfel större (mer positiv) än vad den annars skulle ha blivit. Det är inte tillfredsställande att framräknade koefficienter i så hög utsträckning påverkas av en enda person. Om analysen görs om utan den här personen (Select Cases if SDB2_2 < 2) så får vi istället resultatet nedan. Nu får vi fram att det finns ett nästan signifikant och negativt linjärt samband mellan TV-tittande och life satisfaction (p =.058) men inget signifikant kurvlinjärt samband (p =.842).
6 Interaktioner Säg att vi, av någon anledning, tror att effekten av pluggande på life satisfaction är olika för personer med olika åldrar, alltså att pluggande och ålder interagerar i sin effekt på life satisfaction. För att testa detta kan vi multiplicera de två variablerna med varandra och ta med den nya produktvariabeln som en prediktor i analysen. Detta leder dock återigen till risk för kollinearitet, och detta kan vi, återigen, undvika genom att standardisera de två variablerna innan multiplikationen. Nedan ett exempel på output från regressionsanalysen. Vi ser att, kontrollerat för de andra prediktorerna, har pluggande ett signifikant (p =.005) och positivt samband med life satisfaction. Vi ser även att interaktionstermen är signifikant (p =.027). Att den är positiv (+ 0,380) innebär att effekten av pluggande på life satisfaction ökar (blir mer positiv) med åldern och att effekten av ålder på life satisfaction ökar (blir mer positiv) ju mer man pluggar. Effekten av pluggande (standardiserat) på life satisfaction ges av formeln 0, ,380 Zålder. För personer med Zålder = -1 (motsvarar en ålder på 18,9 år) beräknas effekten av pluggande (standardiserat) på life satisfaction till 0, ,380-1 = -0,079, vilket innebär att en ökning i pluggande med en standardavvikelse associeras med en sänkning i life satisfaction med 0,079 poäng. För personer med Zålder = 0 (24,1 år) associeras en SD ökning i pluggande med en ökning i life satisfaction med 0,301 poäng och för dem med Zålder = 1 (29,3 år) med en ökning på 1,061 poäng. En titt på sambandet mellan predicerade värden och residualer samt på DfBetas gav inte upphov till någon (större) oro gällande resultatet från interaktions-analysen ovan. 2. Logistisk regression (binär) Vid logistisk regression prediceras värdena (eller egentligen: logaritmen för oddsen för det ena utfallet) på en dikotom variabel utifrån en eller flera prediktorer. Prediktorerna kan vara kontinuerliga, dikotoma eller kategorivariabler (görs om till dummy-variabler). För att utföra en logistisk regression: Analyze Regression Binary Logistic. Kör in den dikotoma beroende variabeln i rutan Dependent och prediktorerna i rutan Covariates. Klicka på OK. Nedan ses exempel på output där det prediceras ifall folk har barn (=1 på variabeln Barn2 ) eller inte (=0) utifrån ålder och om man har körkort (=1) eller inte (=0).
7 7 De som har barn kodas som 1 och resten som 0. Detta är viktigt för tolkningen av resultaten. Den s.k. nollmodellen (inga prediktorer) predicerar att ingen har barn och detta är rätt i 90,8% av fallen. Vår modell (med prediktorer) är signifikant bättre på att predicera om folk har barn än vad nollmodellen är. Åtminstone en av prediktorerna kan antas ha en koefficient som skiljer sig från noll i populationen. Här ser vi att om man använder 0,5 som en brytpunkt så kategoriserar vår modell (med prediktorer) folk till rätt grupp i 92,3% av fallen (att jämföra med nollmodellens 90,8%). Här ser vi att ålder har en signifikant (p =.005) och ökande effekt på oddsen att ha barn (om man kontrollerar för körkortsinnehav). För en ökning i ålder med ett år ökar den naturliga logaritmen av oddsen att ha barn med 0,459. Detta motsvarar en odds-ökning på e 0,459 = 1,583 (för ett års ökning i ålder ökar alltså oddsen för att ha barn med 58,3%). Effekten av körkortsinnehav (kontrollerat för ålder) är nästan signifikant (p =.074). För körkortinnehavare är oddsen att ha barn endast 5,7% av motsvarande odds för dem utan körkort.
8 8 Övningsuppgifter: Predicera graden av life satisfaction utifrån: (a) Hur mycket man pluggar (f23) (standardisera först) (b) Hur mycket man tittar på TV (f25) (standardisera först) (c) Produkten av pluggande (standardiserad) och TV-tittande (standardiserad) Spara predicerade värden (ostandardiserade), residualer (standardiserade) och DfBetas (standardiserade). F1: Hur stor andel av variansen i life satisfaction förklarar vår modell? F2: Är vår modell signifikant (predicerar den mer än noll procent av variansen i life satisfaction)? F3: Är någon av de enskilda prediktorerna signifikant? F4: Finns det skäl att misstänka problem med kollinearitet? F5: Hur tolkas den signifikanta interaktionen? F6: Ser de diagnostiska kriterierna OK ut? Predicera odds för att respondenterna bor norr om Storkyrkan (f3bor = 1) utifrån: (a) Ålder (f2) (b) Antalet barn man har (f7) (c) Restid till KI (f11) F7: Hur stor andel av respondenterna blir korrekt kategoriserade i nollmodellen? F8: Hur stor andel av respondenterna blir korrekt kategoriserade av modellen med våra prediktorer? F9: Är den här skillnaden signifikant? F10: Är någon av de enskilda prediktorerna signifikant?
9 9 Facit F1: R 2 =.168 F2: Ja, F(3, 61) = 4.12, p =.01. F3: Ja, Zstudier, b(61) = 0.22, p =.03, ju mer man pluggar desto högre grad av life satisfaction. Även interaktionstermen är signifikant, b(61) = -0.14, p =.03. F4: Nej, toleransen är så hög som den kan bli. F5: När graden av TV-tittande ökar med en SD så ökar effekten av Zstudier på life satisfaction med 0,256 och vice versa. Alltså: Ju mer man ägnar sig åt den ena aktiviteten, desto starkare samband har den andra aktiviteten med graden av life satisfaction. F6: En person har ett avvikande högt värde på DfBeta för Ztv (se figuren till höger). Om analysen görs om utan den här personen så slutar interaktionen att vara signifikant, b(60) = 0.18, p =.12, men nu ser vi istället ett signifikant negativt samband mellan TV-tittande och life satisfaction, b(60) = -0.27, p =.02. F7: 57,8% F8: 70,3% F9: Ja, χ 2 (3) = 18.42, p <.001. F10: Ja, restid, B(1) = , p =.002. För varje minuts ökning i restid till KI så minskar oddsen för att man bor norr om storkyrkan med 7,5%.
Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Läs merRisk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012
Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012 1. Risk Ratio & Odds Ratio Risk- och odds ratio beräknar sambandet mellan två dikotoma variabler. Inom forskning
Läs merT-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen
T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen 1. One-Sample T-Test 1.1 När? Denna analys kan utföras om man vill ta reda på om en populations medelvärde på en viss variabel kan antas
Läs merInstuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Läs merIntro till SPSS Kimmo Sorjonen (0811)
1 Intro till SPSS Kimmo Sorjonen (0811) 1. Att mata in data i SPSS 1. Klicka på ikonen för SPSS. 2. Välj alternativet Type in data och klicka på OK. 3. Databladet har två flikar: Data view och Variable
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
Läs merUnder denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.
Laboration 5 Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Deluppgift 1: Enkel linjär regression Övning Under denna uppgift ska enkel
Läs merInnehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)
Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merMultilevel Modeling med SPSS Kimmo Sorjonen ( )
1 Multilevel Modeling med SPSS Kimmo Sorjonen (2012-01-21) 1. Tvärsnittsdata, Två nivåer 1.i Variabler Data simulerar de som använts i följande studie (se Appendix A och Appendix B): Andersen, R., & van
Läs merFaktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio
Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio med SPSS Kimmo Sorjonen 1. Faktoranalys Innan man utför en faktoranalys kan det vara bra att testa om det finns några outliers i data. Detta kan
Läs merInStat Exempel 4 Korrelation och Regression
InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och
Läs merMarknadsinformationsmetodik Inlämningsuppgift
Marknadsinformationsmetodik Inlämningsuppgift Uppgiften löses med hjälp av SPSS. Klistra in tabeller och diagram från SPSS i ett Worddokument och kommentera där. Använd ett försättsblad till den slutgiltiga
Läs merRegressionsanalys Enkel regressionsanalys Regressionslinjen
--9 Regreionanaly - en fråga om balan Kimmo Sorjonen Sektionen för Pykologi Karolinka Intitutet. Enkel reg.analy.. Data.. Reg.linjen.. Beta (β).. Signifikan.. Reg. om Var..6. Korr. & Förklarad var..7.
Läs merMata in data i Excel och bearbeta i SPSS
Mata in data i Excel och bearbeta i SPSS I filen enkät.pdf finns svar från fyra män taget från en stor undersökning som gjordes i början av 70- talet. Ni skall mata in dessa uppgifter på att sätt som är
Läs merSänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Läs merKort manual till SPSS 10.0 för Mac/PC
Institutionen för beteendevetenskap Linköpings universitet Kort manual till SPSS 10.0 för Mac/PC 1. Att skapa en ny variabel Inmatning av data sker i det spread sheet som kallas Data View (flik längst
Läs merMarknadsinformationsmetodik Inlämningsuppgift
Marknadsinformationsmetodik Inlämningsuppgift Uppgiften löses med hjälp av SPSS. Klistra in tabeller och diagram från SPSS i ett Worddokument och kommentera där. Använd ett försättsblad till den slutgiltiga
Läs merIdiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/12 2008. Av: Markus Ederwall, 21488
Idiotens guide till Håkan Lyckeborgs SPSS-föreläsning 4/12 2008 Av: Markus Ederwall, 21488 1. Starta SPSS! 2. Hitta din datamängd på Kurs 601\downloads\datamängd A på studentwebben 3. När du hittat datamängden
Läs merRegressionsanalys Enkel regressionsanalys Regressionslinjen
-9-6 Regreionanaly - om en mak åt en hungrande Kimmo Sorjonen Sektionen för Pykologi Karolinka Intitutet. Enkel reg.analy.. Data.. Reg.linjen.. Beta (β).. Signifikan.. Reg. om Var..6. Korr. & Förklarad
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs merInstruktioner till Inlämningsuppgift 1 och Datorövning 1
STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merMultipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1
Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merPoissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Läs merVariansanalys med SPSS Kimmo Sorjonen (2012-01-19)
1 Variansanalys med SPSS Kimmo Sorjonen (2012-01-19) 1. Envägs ANOVA för oberoende mätningar 1.1 Variabler Data simulerar det som använts i följande undersökning (se Appendix A): Petty, R. E., & Cacioppo,
Läs merMatematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Läs merKapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 120113 För att bli godkänd på inlämningsuppgiften krävs att man
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merSpridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Läs merSamhällsvetenskaplig metod, 7,5 hp
Samhällsvetenskaplig metod, 7,5 hp Provmoment: Individuell skriftlig tentamen kvantitativ metod, 2,0 hp Ladokkod: 11OA63 Tentamen ges för: OPUS kull H13 termin 6 TentamensKod: Tentamensdatum: Fredag 24
Läs merDatorövning 1 Enkel linjär regressionsanalys
Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merUppgift 1. Deskripitiv statistik. Lön
Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merKapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 130114 För att bli godkänd på inlämningsuppgiften krävs att man
Läs merTENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Läs mer2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Läs merRegressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Läs merInstruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.
STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-12 MC Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4 Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merLaboration 2 multipel linjär regression
Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs merLaboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merKapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Läs merMatematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16
Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11 Laboration Statistiska test 2011-11-15/16 2 Syftet med laborationen är att: Ni skall bekanta er med lite av de funktioner som finns
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merIdentifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:
Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum: 120203 Ovanstående nummer är ditt identifikationsnummer! Skriv in detta nummer på varje blad i tentan
Läs merimport totalt, mkr index 85,23 100,00 107,36 103,76
1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen
Läs merFöreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)
1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda
Läs merMatematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT-2009 Laboration P3-P4 Statistiska test MH:231 Grupp A: Tisdag 17/11-09, 8.15-10.00 och Måndag 23/11-09, 8.15-10.00 Grupp B: Tisdag
Läs merTVM-Matematik Adam Jonsson
TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet
Läs merTill ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Läs merFöreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merKapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population
Läs merInstruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet
1 Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet Uppdaterad: 120412 För att bli godkänd skall man utföra alla sex uppgifter som beskrivs nedan. OBS:
Läs merFöreläsning 4. Kap 5,1-5,3
Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet
Läs merMetod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Läs merMatematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour
Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet SPSS (PASW) 18 for Windows - a guided tour VT 2010 2 Introduktion till SPSS (PSAW) Denna övning kommer steg för steg att lära oss de grundläggande
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merFråga nr a b c d 2 D
Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merFACIT!!! (bara facit,
STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt
Läs merBeskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5
1 Beskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5 Chalmers bok Johanssons bok Ladymans bok Chalmers: Vad är vetenskap egentligen? Innehåll Boken beskriver, och problematiserar,
Läs merTillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merSkolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Läs mer732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Läs merLösningar till SPSS-övning: Analytisk statistik
UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt
Läs merMatematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering
Matematikcentrum (7) Matematisk Statistik Lunds Universitet Per-Erik Isberg Laboration Simulering HT 006 Introduktion Syftet med laborationen är dels att vi skall bekanta oss med lite av de olika funktioner
Läs merMatematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering
Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT007 Laboration Simulering Grupp A: 007-11-1, 8.15-.00 Grupp B: 007-11-1, 13.15-15.00 Introduktion Syftet
Läs merFinansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen
Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merRichard Öhrvall, http://richardohrvall.com/ 1
Läsa in data (1/4) Välj File>Open>Data Läsa in data (2/4) Leta reda på rätt fil, Markera den, välj Open http://richardohrvall.com/ 1 Läsa in data (3/4) Nu ska data vara inläst. Variable View Variabelvärden
Läs merRegression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
Läs merMultipel regression och Partiella korrelationer
Multipel regression och Partiella korrelationer Joakim Westerlund Kom ihåg bakomliggande variabelproblemet: Temperatur Jackförsäljning Oljeförbrukning Bakomliggande variabelproblemet kan, som tidigare
Läs merStatistiska samband: regression och korrelation
Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel
Läs merATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER
ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor
Läs merStatistik 2 2010, 3.-9.5.2010. Stansens PC-klass ASA-huset. Schema: mån ti ons to fre 9.15-12.00 9.15-12.00 10.15-13.00 10.15-12.00 10.15-12.
Statistik 2 2010, 3.-9.5.2010 Stansens PC-klass ASA-huset. Schema: mån ti ons to fre 9.15-12.00 9.15-12.00 10.15-13.00 10.15-12.00 10.15-12.00 13.15-15.00 13.15-15.00 13.15-16.00 13.15-16.00 Under kursens
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merEnkel linjär regression. Enkel linjär regression. Enkel linjär regression
Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare
Läs merEn kort instruktion för arbete i SPSS
En kort instruktion för arbete i SPSS Anpassad till kursen Statistik och kvantitativa undersökningar HT14 Lars Bohlin 1 Innehåll Att lägga in data i SPSS... 3 Att skapa nya variabler... 4 Koda en ny variabel
Läs merÖVNINGSUPPGIFTER KAPITEL 9
ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar
Läs merTentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Läs merI. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
Läs mer732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland
Läs merLogistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Läs merÖVNINGSUPPGIFTER KAPITEL 6
ÖVNINGSUPPGIFTER KAPITEL 6 ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet
Läs merDifferentiell psykologi
Differentiell psykologi Tisdag 25 september 2012 Frågestund Repetition Agenda Skillnader i definitioner mellan underlagen Statistik Instuderings- och tentamensfrågor Regressionsdiagnostik Fråga om Reliabilitet
Läs merLABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet
Läs mer