Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Storlek: px
Starta visningen från sidan:

Download "Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER"

Transkript

1 Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett nytt träningsprogram och finner att träningsprogrammet ökat insulinkänsligheten hos deltagarna. Men är effekten lika stor bland kvinnor som bland män? Bland normalviktiga som bland överviktiga? Eller säg att vi mäter effekten av en ny reklamkampanj och finner att den ökat försäljningen. Men har den ökat försäljningen i alla kundgrupper? Eller har kampanjen funkat särskilt bra bland unga? Bland gamla? Då vi mäter skillnaden i en effekt mellan två delgrupper så kallas detta för en interaktionseffekt. Exempel: Vi mäter avkastningen på utbildning och finner att varje extra skolår ökar lönen med 100 euro i genomsnitt. Men är avkastningen lika stor bland kvinnor som bland män? Anta att männen har en genomsnittlig avkastning på 120 euro och kvinnorna en avkastning på 80 euro. Skillnaden i avkastning mellan könen (40 euro = ) kallas för en interaktionseffekt. I nästa avsnitt (15.1) ska vi se på hur vi kan formulera regressioner som mäter interaktionseffekter. I avsnitt 15.2 diskuterar vi standardiserade skalor och i avsnitt 15.3 diskuterar vi icke-linjära effekter och fixa effekter.

2 15.1 INTERAKTIONSEFFEKTER Exempel: Är traditionella kurser i klassrum bättre än nätkurser? 200 studerande anmäler intresse att gå en kurs. Dessa delas in i två grupper; 100 får gå den traditionella varianten och 100 får gå nätversionen. I slutet skriver alla samma prov. Regressionen nedan visar att de som gick nätkursen i snitt skrev lika bra på provet som de som gick den traditionella varianten: prov = nätkurs Vi kör nu samma regression som ovan, men skilt för män och kvinnor: Männen: Kvinnorna: prov = nätkurs prov = nätkurs Om vi enbart tittar på männen ser vi att de som gick nätkursen i snitt skrev 10 poäng sämre än de som gick den traditionella varianten. Bland kvinnorna är effekten den omvända; de som gick nätkursen skrev i snitt 10 poäng bättre än de som gick den traditionella varianten. Effekten av att gå nätkursen är alltså 20 poäng högre bland kvinnorna än bland männen; detta är en interaktionseffekt. I det här exemplet beskrev vi männens och kvinnornas regressioner skilt. Men vi kan också kombinera dessa två regressioner i en: prov = kvinna 10 nätkurs + 20(kvinna nätkurs) där (kvinna nätkurs) är produkten av variablerna kvinna och nätkurs. Den här variabeln antar värdet 1 för personer som både är kvinnor och som gick nätkursen, och värdet 0 för alla andra. Vi kallar en sådan produkt för en interaktionsterm. Regressionen ovan beskriver exakt samma sak som de två enskilda regressionerna (männens och kvinnornas). För att se detta kan vi skriva om regressionen ovan så att den bara gäller männen. Vi sätter då kvinna = 0 med resultatet: prov = kvinna =0 10 nätkurs + 20(kvinna =0 = nätkurs nätkurs)

3 Notera att det som blev kvar är just männens regression. Och på motsvarande sätt får vi kvinnornas regression genom att sätta kvinna = 1: prov = kvinna =1 10 nätkurs + 20(kvinna =1 = nätkurs + 20 nätkurs = nätkurs nätkurs) Interaktionstermen tillåter oss alltså att mäta om en effekt skiljer mellan olika grupper. Men låt oss ännu fundera på vad de olika koefficienterna betyder: prov = kvinna 10nätkurs + 20(kvinna nätkurs) I fet stil har vi det som är männens regression; vi får den genom att ignorera de termer som innehåller variabeln kvinna. Interceptet (75) visar alltså genomsnittligt provresultat bland män som gick den traditionella varianten. Koefficienten för nätkurs (-10) visar att männen som gick nätkursen snittade 10 poäng sämre än de män som gick den traditionella varianten. prov = kvinna 10 nätv + 20(kvinna nätkurs) I fet stil visas hur kvinnornas regression skiljer sig från männens. Koefficienten för kvinna (-10) visar att kvinnornas intercept ligger 10 poäng lägre än männens. Koefficienten för interaktionstermen (+20) visar att effekten av att gå nätkursen är 20 poäng högre bland kvinnorna än bland männen. Figuren på nästa sida illustrerar männens och kvinnornas regressioner skilt:

4 Poäng på provet Effekten av att ta nätkursen - skilt för män och kvinnor Traditionell Nätkurs Männens regression Kvinnornas regression När vi estimerar den här regressionen med hjälp av ett statistiskt programpaket så börjar vi med att skapa variabeln kvinna*nätkurs, nedan kallad kvinna_nätkurs: id kvinna nätkurs kvinna_nätkurs poäng På nästa sida ser du resultatet från en körning med dessa tre oberoende variabler (kvinna, skolår, kvinna_skolår):

5 Effekten av att gå nätkursen är ~20 poäng högre bland kvinnorna än bland männen, och denna skillnad är signifikant på 1- procentsnivån (t-värdet = 4,47; p-värdet = 0,000 < 0,01). Det går också bra att inkludera andra kontrollvariabler i den här regressionen. Nedan visas resultatet då vi också kontrollerat för ålder: prov = kvinna 11 nätkurs + 20(kvinna nätkurs) + 0,8 ålder Resultatet ändrade dock inte nämnvärt; effekten av att gå nätkursen är fortfarande 20 poäng högre bland kvinnorna än bland männen. [Exemplet ovan bygger på fejkade data.] Exempel: Regressionerna nedan visar hur lönen varierar med antalet skolår bland thailändska män och kvinnor. Data består av 213 män och 190 kvinnor. Lönen mäts i thailändska baht. Männen: Kvinnorna: lön = skolår lön = skolår Vi ser att avkastningen på varje ytterligare skolår är 2955 baht högre bland männen än bland kvinnorna ( = 2955). Vi vill testa om den här skillnaden mellan könen är signifikant. Vi kombinerar därför dessa två regressioner i en: lön = skolår 31938man (skolår man) där man är en dummy som antar värdet 1 för männen och värdet 0 för kvinnorna; (skolår*man) är interaktionstermen. Den här regressionen visar exakt samma sak som de två enskilda. Vi får

6 kvinnornas regression genom att ignorera de termer som innehåller variabeln man: lön = skolår 31938man (skolår man) I fet stil visas hur männens regression skiljer sig från kvinnornas: lön = skolår 31938man (skolår man) Männens intercept ligger alltså baht lägre än kvinnornas; avkastningen på ett skolår är 2955 baht högre bland männen än bland kvinnorna. I det här exemplet är männens intercept : En man som inte alls gått i skolan predikteras alltså ha en negativ lön. Hur kan det komma sig? Det här beror delvis på att alla män i data har minst 8 skolår. Prediktionerna för personer med långt färre skolår kan då bli rätt skakiga. Men en ännu viktigare förklaring är att en linjär modell passar data rätt dåligt i det här fallet, vilket figuren nedan visar. Lönen ökar inte linjärt med antalet skolår, utan snarare exponentiellt. I det här fallet passar det data bättre att använda ett logaritmerat utfall. Nedan har vi kört männens och kvinnornas regressioner då utfallet är logaritmerad lön: Männen: Kvinnorna: ln (lön) ln (lön) = 9,0 + 0,10 skolår = 9,4 + 0,06 skolår

7 För männen gäller att lönen i snitt ökar med 10 procent för varje ytterligare skolår. För kvinnorna är motsvarande siffra 6 procent. Det är en skillnad på 4 procentenheter: ln (lön) = 9,4 + 0,06skolår 0,4man + 0, 04(skolår man) Är skillnaden i avkastning mellan könen signifikant? Ja, standardfelet för interaktionseffekten är 0,011 vilket ger ett t- värde på ~3,6 och ett p-värde nära 0 (t-värdet = 0,04/0,011). Nedan visas spridningsdiagrammen, skilt för män och kvinnor: På följande sida har vi kombinerat dessa två spridningsdiagram i ett. Skillnaden i lutning mellan männens och kvinnornas regressionslinjer är 0,04, dvs. interaktionseffekten.

8 Det går också bra att kontrollera för andra variabler i den här regressionen. Nedan visas resultatet då vi också kontrollerat för arbetserfarenhet (erf = antalet år som personen jobbat hos nuvarande arbetsgivare): ln (lön) = 9,3 + 0,06skolår 0,4man + 0,04(skolår man) + 0,01erf Vi ser att lönen i snitt ökar med 1 procent för varje extra år hos nuvarande arbetsgivare, kontrollerat för skolår och kön. Men den här effekten är inte signifikant (t-värdet = 1,39; p-värdet = 0,165). I ett tredje steg tillåter vi dessutom att effekten av arbetserfarenhet skiljer sig mellan könen: ln (lön) = 9,2 + 0,06skolår 0,2man + 0,04(skolår man) + 0,02erf 0,01(erf man) Vi ser att kvinnornas lön i snitt ökar med 2 procent för varje extra år hos nuvarande arbetsgivare (kontrollerat för de andra oberoende variablerna). För männen är denna effekt 0,01 enheter lägre, det vill säga 1 procent. Den här skillnaden mellan könen är dock inte signifikant (t-värdet = -0,81, p-värdet = 0,418). Regressioner som innehåller interaktionstermer kan se rätt komplicerade ut och det tar lite tid att vänja sig. Om du känner dig osäker på tolkningen av en viss koefficient, kom då ihåg att du alltid kan skriva om regressionen skilt för de olika grupperna.

9 Nedan har jag gjort just detta; jag har använt regressionen ovan och skrivit om den skilt för män och kvinnor. Kvinnornas regression fås genom att ignorera alla termer som innehåller dummyn man (dessa försvinner ju då vi sätter man = 0): ln(lön) = 9,2 + 0,06skolår 0,2man + 0,04(skolår man) + 0,02erf 0,01(erf man) = 9, 2 + 0, 06skolår + 0, 02erf Männens regression fås genom att sätta man = 1: ln(lön) = 9,2 + 0,06skolår 0,2 man =1 + 0,02erf 0,01 (erf man) + 0,04 (skolår man) =1 =1 = 9,2 + 0,06skolår 0,2 + 0,04skolår + 0,02erf 0,01erf = 9, 0 + 0, 10skolår + 0, 01erf Notera här att skillnaden mellan männens och kvinnornas regressionskoefficienter är just interaktionseffekterna. Exempel: Koefficienten för skolår är 0,10 för männen och 0,06 för kvinnorna; skillnaden är 0,04, dvs. interaktionseffekten.

10 15.2 STANDARDISERAD SKALA Exempel: Regressionen nedan visar hur lönen varierar med antalet skolår och IQ. Regressionen bygger på data för 2061 amerikaner. ln(lön) = 5,58 + 0,026skolår + 0,004IQ Då intelligensen ökar med 1 poäng så ökar lönen i snitt med 0,4 procent, kontrollerat för antalet skolår. Men vad betyder det? Är det här en liten eller stor effekt? Ibland kan det vara svårt att bedöma om en viss effekt är stor eller liten enbart utifrån koefficientens storlek. Det är då vanligt att man använder en standardiserad skala: Istället för att mäta effekten av att intelligensen ökar med 1 poäng, så mäter vi effekten av att intelligensen ökar med 1 standardavvikelse. Intelligensen har här en standardavvikelse på 15,4 poäng: När intelligensen ökar med 1 standardavvikelse (=15,4 poäng) så ökar lönen i snitt med ~6 procent (15,4*0,004 = 0,0616) kontrollerat för utbildning. Vad har då större betydelse för lönen? Antalet skolår eller intelligensen? Vi ser förstås att koefficienten för antalet skolår är större än den för IQ. Men det här betyder inte att utbildning är mer betydelsefullt än intelligens. De här två variablerna mäts ju på olika skalor (år kontra poäng) och vi kan inte jämföra deras koefficienter rakt av. Vi får en bättre jämförelse om vi mäter båda variablerna i samma enhet, nämligen i antal standardavvikelser. Skolår har en standardavvikelse på 2,27 år: Då antalet skolår ökar med 1 standardavvikelse (=2,27 år) så ökar lönen i snitt med ~6 procent (2,27*0,026 = 0,05902) kontrollerat för IQ. Skolår och IQ har med andra ord ungefär samma betydelse för lönen då variablerna mäts i antal standardavvikelser.

11 15.3 ICKE-LINJÄRA EFFEKTER OCH FIXA EFFEKTER Vi har redan sett flera exempel på hur man kan använda en logaritmisk skala då det passar data bättre att mäta förändringar i procent. I kapitel 7 (Att beskriva tidsseriedata) såg vi också hur man kan beskriva kvadratiska trender i en serie över tid. Logaritmer och kvadratiska funktioner är de populäraste sätten att beskriva icke-linjära samband. Logaritmer används mer eller mindre rutinmässigt när vi har variabler som mäts i pengar eller stora kvantiteter (löner, priser, koldioxidutsläpp, befolkningsmängd). Kvadratiska funktioner används när vi vill beskriva att en viss variabel (x) har en avtagande eller tilltagande effekt på y. I det här avsnittet ska vi se ett par exempel på hur kvadratiska funktioner kan användas då vi jobbar med tvärsnittsdata. Vi ska också diskutera ett tredje sätt att beskriva icke-linjära effekter genom användningen av fixa effekter. Kvadratiska funktioner Exempel: Ju mer tid du sätter på att plugga desto bättre blir också tentresultatet. Men effekten av att gå från 0 till 1 studietimmar per vecka är säkert större än effekten av att gå från 11 till 12 timmar som i sin tur är större än effekten av att gå från 21 till 22 timmar. Den positiva effekten av att plugga ytterligare en timme är alltså positiv, men avtagande. Och i något skede om du går från, säg, 100 till 101 timmar så kanske effekten blir negativ. Anta nu att tentpoängen bestäms av antalet studietimmar enligt tabellen nedan.

12 timmar poäng förändring (per vecka) Om du går från att inte studera alls till att studera en timme per vecka så adderar du 14 poäng till tentresultatet. Om du går från en till två studietimmar per vecka så adderar du ytterligare 13 poäng till tentresultatet, och om du går från två till tre studietimmar adderar du ytterligare 12 poäng till tentresultatet. Avkastningen på att plugga ytterligare en timme minskar alltså med 1 poäng för varje timme. Det här är ett exempel på ett kvadratiskt samband. Regressionsmodellen nedan beskriver hur vi mäter ett sådant samband. Vi beskriver då tentresultatet (poäng) som en kvadratisk funktion av antalet arbetstimmar. (Här har vi också adderat till en felterm eftersom tentpoängen i verkligheten knappast bara bestäms av antalet studietimmar.) poäng = β 0 + β 1 timmar + β 2 timmar 2 + u Vi har nu ett datamaterial som täcker 100 studerande, deras arbetstimmar och resultatet på tenten. Vi estimerar modellen ovan med resultatet: poäng = ,5timmar 0,5timmar 2 Spridningsdiagrammet nedan illustrerar detta datamaterial med regressionsekvationen i rött.

13 Låt oss ännu fundera på vad den här regressionen berättar. Koefficienten för timmar är positiv; effekten av att plugga är positiv åtminstone i början. Koefficienten för timmar 2 är negativ; den positiva effekten av att plugga är avtagande, dvs. den blir mindre positiv ju mer du pluggar. I något skede når vi maxpunkten och efter det så lönar det sig inte att plugga ännu mer. Hur mycket predikteras tentpoängen förändras om vi ökar arbetstiden med en timme? Jo, det här beror helt och hållet på hur mycket vi pluggade i utgångsläget. Eller med andra ord: Avkastningen på att plugga ytterligare en timme är en funktion av hur många timmar vi pluggade innan. Vi kan få en bra bild av hur stor den här avkastningen är genom att derivera poäng med avseende på antalet timmar: poäng = ,5timmar 0,5timmar 2 δpoäng = 14,5 1 timmar δtimmar Exempel: Avkastningen på att plugga ytterligare en timme är ~4,5 poäng, givet att vi innan pluggade 10 timmar: δpoäng = 14,5 1 timmar δtimmar = 4,5 =10 Notering: När vi deriverar och sätter timmar = 10, så får vi egentligen lutningen på kurvan i just den punkten (10). 4,5 poäng är med andra ord snarare avkastningen då vi går från 9,5 till 10,5

14 studietimmar, men detta är tillräckligt nära för att duga bra som approximation. Exempel: Är det bra att vara hur smart som helst? Spridningsdiagrammet nedan visar sambandet mellan logaritmerad lön och IQ, och bygger på data för 2061 amerikaner. I rött har vi estimerat ett linjärt samband; i grönt har vi estimerat en kvadratisk funktion. Den kvadratiska funktionen passar data bättre, men hur tolkar vi den? ln(lön) = 4,62 + 0,0288 IQ 0,00012 IQ 2 Koefficienten för IQ är positiv; lönen ökar med högre IQ åtminstone till att börja med. Koefficienten för IQ 2 är negativ; den positiva effekten avtar ju smartare du är. Nedan har vi deriverat ln(lön) med avseende på IQ: δln (lön) δiq = 0,0288 0,00024 IQ Anta att vi har en person med en intelligenskvot på 100: Hur mycket predikteras lönen öka om intelligensen ökar med ytterligare 1 poäng? Jo, med ungefär 0,5 procent: 0,0288 0,00024 IQ = 0,

15 Anta nu att vi har en person med en intelligenskvot på 120: Hur mycket predikteras lönen öka om intelligensen ökar med ytterligare 1 poäng? Jo, inte alls: 0,0288 0,00024 IQ = Det lönar sig alltså inte att vara smartare än så; vid 120 poäng når lönekurvan sin höjdpunkt och därefter predikteras lönen börja sjunka igen. Det går förstås också bra att använda högre gradens polynom, t.ex. att beskriva lönen som en kubisk funktion av IQ: ln(lön) Eller fjärde gradens polynom: ln(lön) = β 0 + β 1 IQ + β 2 IQ 2 + β 3 IQ 3 + u = β 0 + β 1 IQ + β 2 IQ 2 + β 3 IQ 3 + β 4 IQ 4 + u I praktiken använder man dock sällan högre gradens polynom. Det här beror delvis på att det inte brukar behövas, och vi håller gärna modellen så enkel som möjligt. Det går förstås också bra att inkludera andra oberoende variabler i den här regressionen. Nedan har vi också inkluderat mammans utbildning (mätt i antal år): ln(lön) = 4,45 + 0,0306 IQ 0,00013 IQ 2 + 0,01mutb Då mammans utbildning ökar med ett år så ökar lönen i snitt med 1 procent, kontrollerat för IQ. Fixa effekter När vi säger att vi använder fixa effekter så betyder det att vi lägger in en dummy-variabel för varje värde på x. Exempel: Tar äldre pappor ut mer föräldraledighet? Eller är det istället dom yngre som tar ut mer föräldraledighet? Vi har ett datamaterial som består av 6340 nyblivna pappor i åldrarna Regressionen nedan visar att äldre pappor (33-45 år) i snitt tar ut 12 dagar mer ledighet än de yngre (20-32 år): ledighet = 15,9 + 12,0äldre

16 Nedan har vi kört motsvarande regression, men istället delat in papporna i fem åldersgrupper: år, år, år, år och år. Referensgruppen är de yngsta (20-24 år): ledighet = 10,1 + 7,3grupp2 + 13,4grupp3 + 18,0grupp4 + 18,1grupp5 där grupp2 är en dummy för pappor som är år; grupp3 är en dummy för pappor som är år; grupp4 är en dummy för de som är år och grupp5 är en dummy för de äldsta. Vi ser alltså att de yngsta (20-24 år) i snitt tar ut ~10 pappadagar. De äldsta (40-45 år) tar i snitt ut ~18 pappadagar mer än de yngsta. Men varför stanna där? Varför inte använda en dummy för varje ålder? Alltså en dummy för 21-åringar; en dummy för 22-åringar;... ; en dummy för 44-åringar och en sista för 45-åringar. (Här använder vi återigen de yngsta, 20-åringarna, som referens.) Nedan ser du ett utdrag av regressionen: ledighet = 7,4 + 1,3ålder21 + 1,5ålder22 + 3,8ålder ,8ålder45 Tabellen nedan ger hela regressionsutskriften:

17 Figuren nedan visar hur genomsnittlig pappaledighet varierar med ålder, och bygger på estimaten från föregående regression. I det här fallet så skulle vi säga att vi använt åldersfixa effekter. Det fina med fixa effekter är att du aldrig kan ta fel. Hur ser det egentliga sambandet mellan ålder och pappaledighet ut? Linjärt? Kvadratiskt? Kubiskt? Eller kanske genomsnittlig pappaledighet varierar oregelbundet med ålder så att ingen vanlig funktion passar bra som en beskrivning av sambandet? När vi använder ålderfixa effekter så anpassar vi oss totalt efter data; vi behöver inte försöka gissa. Det dåliga med fixa effekter är att vi måste estimera många parametrar (25 stycken + interceptet i det här fallet). Och det kan vara svårt att få en bra bild av sambandet. Av den anledningen brukar man så gott som aldrig använda fixa effekter för den x- variabel som är av huvudsakligt intresse. Anta i det här fallet att vi egentligen är intresserade av att mäta sambandet mellan pappans inkomst och pappaledigheten, kontrollerat för ålder. Nedan visas det råa sambandet: ledighet = 80,3 + 13,3ln (inkomst) När inkomsterna ökar med 1 procent så ökar pappaledigheten i snitt med 0,133 dagar. Nedan visas resultatet när vi dessutom kontrollerat för ålder genom att inkludera åldersfixa effekter: ledighet = 59,8 + 9,1 ln(inkomst) + åldersixa effekter

18 När inkomsterna ökar med 1 procent så ökar pappaledigheten i snitt med 0,091 dagar, kontrollerat för ålder. Nedan ser du regressionsutskriften: Då man presterar resultatet i en tabell så skulle det till exempel kunna se ut så här: Tabell: OLS-regressioner med pappaledighet som utfall (1) (2) VARIABLER Ln(inkomst) 13.34*** 9.053*** (0.494) (0.497) Åldersfixa effekter Nej Ja Konstant *** *** (3.781) (3.838) Observationer 6,340 6,340 R Standardfel inom parenteser *** p<0.01, ** p<0.05, * p<0.1 [Notering: Data från exemplet ovan är fejkat.]

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 6

ÖVNINGSUPPGIFTER KAPITEL 6 ÖVNINGSUPPGIFTER KAPITEL 6 ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet

Läs mer

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 6

ÖVNINGSUPPGIFTER KAPITEL 6 ÖVNINGSUPPGIFTER KAPITEL 6 ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet

Läs mer

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 4

ÖVNINGSUPPGIFTER KAPITEL 4 ÖVNINGSUPPGIFTER KAPITEL 4 REGRESSIONSLINJEN: NIVÅ OCH LUTNING 1. En av regressionslinjerna nedan beskrivs av ekvationen y = 20 + 2x; en annan av ekvationen y = 80 x; en tredje av ekvationen y = 20 + 3x

Läs mer

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 7

ÖVNINGSUPPGIFTER KAPITEL 7 ÖVNINGSUPPGIFTER KAPITEL 7 TIDSSERIEDIAGRAM OCH UTJÄMNING 1. En omdebatterad utveckling under 90-talet gäller den snabba ökningen i VDlöner. Tabellen nedan visar genomsnittlig kompensation för direktörer

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

HYPOTESPRÖVNING sysselsättning

HYPOTESPRÖVNING sysselsättning 0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 8

ÖVNINGSUPPGIFTER KAPITEL 8 ÖVNINGSUPPGIFTER KAPITEL 8 SAMPEL KONTRA POPULATION 1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 12

ÖVNINGSUPPGIFTER KAPITEL 12 ÖVNINGSUPPGIFTER KAPITEL 12 ANOVA I EN MULTIPEL REGRESSION 1. I en amerikansk studie samlade man in data för 601 gifta personer, och mätte hur många utomäktenskapliga affärer de haft under det senaste

Läs mer

Tentamen Metod C vid Uppsala universitet, , kl

Tentamen Metod C vid Uppsala universitet, , kl Tentamen Metod C vid Uppsala universitet, 170503, kl. 08.00-12.00 Anvisningar Av rättningspraktiska skäl skall var och en av de tre huvudfrågorna besvaras på separata pappersark. Börja alltså på ett nytt

Läs mer

Föreläsning 10, del 1: Icke-linjära samband och outliers

Föreläsning 10, del 1: Icke-linjära samband och outliers Föreläsning 10, del 1: och outliers Pär Nyman par.nyman@statsvet.uu.se 19 september 2014-1 - Sammanfattning av tidigare kursvärderingar: - 2 - Sammanfattning av tidigare kursvärderingar: Kursen är för

Läs mer

Resursfördelningsmodellen

Resursfördelningsmodellen PCA/MIH Johan Löfgren Rapport 25-6-26 (6) Resursfördelningsmodellen Växjös skolor våren 25 Inledning Underlag för analyserna utgörs av ett register som innehåller elever som gått ut årskurs nio 2 24. Registret

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)

Läs mer

Höftledsdysplasi hos dansk-svensk gårdshund

Höftledsdysplasi hos dansk-svensk gårdshund Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh 1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10 ÖVNINGSUPPGIFTER KAPITEL 10 För vissa uppgifter behöver du en tabell över den standardiserade normalfördelningen. Se här. SAMPLING 1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 3

ÖVNINGSUPPGIFTER KAPITEL 3 ÖVNINGSUPPGIFTER KAPITEL 3 SAMBAND 1. Nedan ges beskrivningar av tre olika datamaterial. a. I kyrkbänkarna har snittåldern stigit betänkligt under de senaste decennierna, men är unga människor verkligen

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett

Läs mer

import totalt, mkr index 85,23 100,00 107,36 103,76

import totalt, mkr index 85,23 100,00 107,36 103,76 1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk) Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng) 1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

y y 1 = k(x x 1 ) f(x) = 3 x

y y 1 = k(x x 1 ) f(x) = 3 x Räta linjen på olika former Här ska vi bara påpeka att förutom k-form, den som vi är mest vana vid y = k y + m finns också allmän form: ax + by + c = 0 där a och b är konstanter, som inte någon står för

Läs mer

Gamla tentemensuppgifter

Gamla tentemensuppgifter Inte heller idag någon ny teori! Gamla tentemensuppgifter 1 Bestäm det andragradspolynom vars kurva skär x-axeln i x = 3 och x = 1 och y-axeln i y = 3 f(x) = (x 3)(x + 1) = x x 3 är en bra start, men vi

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 13

ÖVNINGSUPPGIFTER KAPITEL 13 ÖVNINGSUPPGIFTER KAPITEL 13 KORSTABELLER 1. Nedan visas tre korstabeller utifrån tre olika dataset (A, B och C). Korstabellerna beskriver sambandet mellan kön och vilken hand man skriver med (vänster,

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Fråga nr a b c d 2 D

Fråga nr a b c d 2 D Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Statistiska samband: regression och korrelation

Statistiska samband: regression och korrelation Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

6 Derivata och grafer

6 Derivata och grafer 6 Derivata och grafer 6.1 Dagens Teori När vi plottar funktionen f(x) = x + 1x 99x 8 med hjälp av dosan kan man få olika resultat beroende på vilka intervall man valt. 00000 100000-00 -100 100 00-100000

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl.

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl. LINKÖPINGS UNIVERSITET 73G71 Statistik B, 8 hp Institutionen för datavetenskap Civilekonomprogrammet, t 3 Avdelningen för Statistik/ANd HT 009 Justeringar och tillägg till Svar till numeriska uppgifter

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10 ÖVNINGSUPPGIFTER KAPITEL 10 För vissa uppgifter behöver du en tabell över den standardiserade normalfördelningen. Se här. SAMPLING 1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta

Läs mer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet 1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om

Läs mer

4 Fler deriveringsregler

4 Fler deriveringsregler 4 Fler deriveringsregler 4. Dagens Teori Derivatan av potensfunktioner. Potensfunktioner med heltalsexponenter, som du redan kan derivera, kallas polynomfunktioner, som till exempel: f(x) = 2x4 x3 + 2x

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Vilka faktorer kan påverka barnafödandet?

Vilka faktorer kan påverka barnafödandet? 29 Vilka faktorer kan påverka barnafödandet? Ålder Kvinnor och män skjuter allt längre på barnafödandet. Kvinnor och män födda 1945 var 23,9 respektive 26,6 år när de fick sitt första barn. Sedan dess

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Verksamhetsutvärdering av Mattecentrum

Verksamhetsutvärdering av Mattecentrum Verksamhetsutvärdering av Mattecentrum April 2016 www.numbersanalytics.se info@numbersanalytics.se Presskontakt: Oskar Eriksson, 0732 096657 oskar@numbersanalytics.se INNEHÅLLSFÖRTECKNING Inledning...

Läs mer

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse

Läs mer

Föreläsning 7 och 8: Regressionsanalys

Föreläsning 7 och 8: Regressionsanalys Föreläsning 7 och 8: Regressionsanalys Pär Nyman 12 september 2014 Det här är anteckningar till föreläsning 7 och 8. Båda föreläsningarna handlar om regressionsanalys, så jag slog ihop dem till ett gemensamt

Läs mer

3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU

3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU . Känslighetsanalys av modell Hans Larsson och Olof Hellgren, SLU Introduktion I kapitel. presenteras en modell över skörd av utvinnbart socker per ha som funktion av fyra variabler ph i matjorden, sådatum,

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Skolkvalitet, lönsamhet och betygsinflation

Skolkvalitet, lönsamhet och betygsinflation Skolkvalitet, lönsamhet och betygsinflation Gabriel Heller-Sahlgren London School of Economics Institutet för Näringslivsforskning Henrik Jordahl Institutet för Näringslivsforskning 2 juli 2018 Innehåll

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

ANOVA Faktoriell (tvåvägs)

ANOVA Faktoriell (tvåvägs) ANOVA Faktoriell (tvåvägs) Faktoriell ANOVA (tvåvägs) Två oberoende variabel ( tvåvägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser.

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009 Företagsklimatet viktigt för ungas val av kommun Johan Kreicbergs April 2009 Inledning 1 Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från som publicerades i slutet av 2007

Läs mer

Sidor i boken f(x) = a x 2 +b x+c

Sidor i boken f(x) = a x 2 +b x+c Sidor i boken 18-151 Andragradsfunktioner Här ska vi studera andragradsfunktionen som skrivs f(x) = ax +bx+c där a, b, c är konstanter (reella tal) och där a 0. Grafen (kurvan) till f(x), y = ax + bx +

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 16 e januari 2015 Tillåtna hjälpmedel: Miniräknare

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 2 ÖVNINGSUPPGIFTER KAPITEL 2 DATAMATRISEN 1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater. Stat Befolkningsmängd Inkomst Marijuana Procent män (miljoner) per person lagligt?

Läs mer

Lösningar och kommentarer till uppgifter i 3.1

Lösningar och kommentarer till uppgifter i 3.1 Lösningar och kommentarer till uppgifter i.1 102 b) TB: Kör de med dessa uppgifter i det här kapitlet också? Det gör inget, jag börjar bli ganska bra på det. Vi har funktionen fx) = x x 2 24x + 1 och man

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer