Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Storlek: px
Starta visningen från sidan:

Download "Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013"

Transkript

1 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari / 33

2 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas 0 och 1. T.ex: Röker - röker inte Uppgång - nedgång för en aktie Beviljas lån eller ej. Hur modelleras Y i då den endast kan anta två olika värden? 2 / 33

3 Logistisk regression Vi tänker oss att värdena 1 och 0 för Y i inträffar med sannolikheterna P(Y i = 1) = Π i P(Y i = 0) = 1 Π i, i = 1, 2,..., n Vi antar att Π i beror på ett antal förklarande variabler och vill därför modellera Π i mot p st förklarande variabler x 1i, x 2i,..., x pi. På samma sätt som i vanlig regression vill vi analysera och dra slutsatser om skattade samband. 3 / 33

4 Hur modelleras sannolikheten Π? Antag att vi för olika grupper av individer vill observera hur många i varje grupp som har respektive inte har en viss egenskap. Då kallas observationerna grupperade och den skattade sannolikheten ˆΠ i för grupp i = 1, 2,..., N beräknas som relativa frekvenser: y 1 n 1, y N n N,..., y N n N där y i är antalet individer i grupp i som har egenskapen och n i är totala antalet individer i grupp i. Vi vill nu försöka modellera de observerade relativa frekvenserna. 5 / 33

5 Hur modelleras sannolikheten Π? Eftersom vi endast har två värden på Y i, måste modellens egenskaper passa definitionen för sannolikheter. Vad händer om vi använder en linjär sannolikhetsmodell? Π i = E(Y i x 1i, x 2i,..., x pi ) = β 0 + β 1 x 1i + β2x 2i β p x pi I modellen tolkas nu t.ex. β 1 som den genomsnittliga förändringen i Π i då x 1i ökar med en enhet (övriga x oförändrade). 6 / 33

6 Nackdelar med en linjär modell Men det finns två stora nackdelar med att modellera Π i med en linjär modell: 1 Det är inte säkert att vi skattar en sannolikhet som finns i intervallet [0,1] vilket motsäger definitionen för sannolikheter! Då parametrarna modellerar Π i linjärt kommer: låga värden på p j=i β jx j att leda till Π i < 0 höga värden på p j=i β jx j att leda till Π i > 1 2 Det går att bevisa att feltermen i den linjära sannolikhetsmodellen är inte längre har konstant varians, dvs vi har heteroskedastiska feltermer: V (ε i ) = ŷ i (1 ŷ i ) Lösningen: Vi skapar en funktion g(π) av Π i som beter sig rätt. 7 / 33

7 Logit och Probit Eftersom fördelningsfunktioner för stokastiska variabler (föreläsning 1) endast definieras i intervallet [0,1] använder vi dessa för att avbilda intervallet (0,1) på (, ) genom funktionen g(π). Två funktioner som gör detta: 1 Logit funktionen baseras på den logistiska fördelningen: ( ) Π g(π) = ln 1 Π 2 Probit funktionen baseras på normalfördelningen g(π) = Φ 1 (Π). 8 / 33

8 Funktioner som skulle kunna användas.

9 Logit funktionen En stor anledning till varför den logistiska modellen är så användbar är att Logitfunktionen (till sklillnad från Probitfunktionen) kan modelleras linjärt som log-odds: ( ) Π ln = β 0 + β 1 x 1i + β 2 x 2i β p x pi 1 Π p = β j x j j=1 Oddsen i detta fall är den relativa sannolikheten att observera y i = 1 gentemot y i = 0. Men oftast vill vi uttrycka modellen i termer av Π. Vi börjar flytta om i uttrycket: p Π 1 Π = e j=1 β j x j 9 / 33

10 Omskrivning till kompendiets form på modellen. Flytta över parantesen, så Π = (1 Π) e p j=1 β j x j. Multiplicera och flytta över igen, så Bryt ut Π och dividera, så Π + Πe p j=1 β j x j = e p j=1 β j x j. ( p ) Π 1 + e j=1 β j x p j = e j=1 β j x j e p j=1 β j x j Π = 1 + e Om vi påminner oss om vad Π betyder så har vi p j=1 β j x j. P (Y i = 1) = 1 + e e p j=1 β j x j p j=1 β j x j. Denna ekvation återfinns i kompendiet på sidan 3. Där är p = 2.

11 Skattningsmetoder Eftersom den logistiska modellen för Π i inte är linjär, kan vi inte använda minsta kvadratmetoden för att härleda parameterskattningar, b 0, b 1, b2 +..., b p. Istället måste vi använda andra skattningsmetoder: 1 Maximum Likelihood: Man försöker hitta de mest sannolika parameterskattningarna givet vårt urval. Är den metod som används oftast. 2 Icke-linjär minsta kvadratmetod: Samma princip som med vanlig minsta kvadratmetod men anpassad för icke-linjära modeller. 10 / 33

12 Hur tolkas parametrarna? Eftersom den logistiska modellen är en logaritmisk funktion blir tolkningarna av parametrarna β 1, β 2,..., β p lite annorlunda: ( ) β 1 är effekten av x 1 på ln Π 1 Π givet att övriga x är konstanta. Om x 1 ökar med en enhet så förändras sannolikheten Π med β 1 %. e β1 är effekten på Π 1 Π, givet övriga x konstanta. Om vi ökar x 1 med en enhet så förändras log-oddsen med e β 1. Interceptet β 0 ger sannolikheten Π då alla x = / 33

13 Den logistiska funktionen Parametrarna i den logistiska modellen avgör logitfunktionens utseende. Det går att visa att funktionens lutning i en enkel logistisk regressionsmodell är: Positiv om β 1 är positiv och negativ om β 1 är negativ. Brantare om β 1 är stor och flack om β 1 är liten. β 0 avgör läget på x-axeln för funktionen. Vi kan se hur funktionen ändras med olika värden på parameterskattningarna b 0 och b 1. I diagrammet betecknas b 0 för a och b 1 för b. 12 / 33

14 Effekten av parametrarna a och b positivt b

15 Effekten av parametrarna a och b negativt b

16 Den logistiska funktionen Vi utgår ifrån den logistiska modellen Π = eb 0+b 1 x e b 0+b 1 x 1 Vilket värde på x 1 ger att sannolikheten Π=50%? Vi söker det x 1 som löser: 1 2 = eb0+b1x1 1 + e b 0+b 1 x 1 För att lösa för x 1 flyttar vi om och förenklar uttrycket: 1 + e b 0+b 1 x 1 = 2e b 0+b 1 x 1 1 = 2e b 0+b 1 x 1 e b 0+b 1 x 1 1 = e b 0+b 1 x 1 13 / 33

17 Den logistiska funktionen Vi logaritmerar både höger och vänsterled: ln 1 = ln(e b 0+b 1 x 1 ) = b 0 + b 1 x 1 Då ln 1 = 0 kan vi till slut lösa ut värdet på x 1 som: x 1 = b 0 b 1 Sannolikheten att Π = 50% får vi då x 1 antar värdet b 0 b 1 14 / 33

18 Ett exempel Vi ska titta på ett exempel ifrån kompendiet av Thorburn och Larsson där vi har grupperat data för: låntagares inkomster, uppdelat i 11 inkomstnivåer. antalet lån vid varje inkomstnivå. antalet av dessa lån där låntagaren hade betalningssvårigheter. Vi vill skatta en enkel logistisk regression för att se om inkomstnivån påverkar sannolikheten för att ha betalningssvårigheter. Modellen vi anpassar skrivs därför: Π i = eβ 0+β 1 x 1i 1 + e β 0+β 1 x 1i 15 / 33

19 Betalningssvårigheter Årsinkomst, kkr(x) Antal lån (nx) Antal med bet.svårigheter (y)

20 Ett exempel Vi kan plotta observationerna med relativa frekvenser (sannolikhet) på y-axeln och inkomst på x-axeln: Grupperat data sannolikhet inkomst 16 / 33

21 Ett exempel Då vi anpassar modellen Π i = vi dessa resultat: eβ 0 +β 1 x 1i till datamaterialet i R får 1+e β 0 +β 1 x 1i Estimate Std. Error z value Pr(> z ) (Intercept) e-48 inkomst e-77 Den skattade modellen kan därför skrivas: ˆΠ i = e x 1i 1 + e x 1i 17 / 33

22 Ett exempel Vi plottar nu observationerna mot den skattade modellen: Observationer och anpassad modell sannolikhet inkomst 18 / 33

23 Enkel logistisk regression med en binär x-variabel En logistisk modell som ofta används är den där vi modellerar Π i mot en binär x-variabel. Vi antar en enkel modell: Π i = eβ 0+β 1 x 1i 1 + e β 0+β 1 x 1i Där x 1 är en dummyvariabel och endast antar värdena 0 eller 1 beroende på om en undersökt person i har en viss egenskap (x 1i = 1) eller inte (x 1i = 0) 20 / 33

24 Enkel logistisk regression med en binär x-variabel I denna modell tolkas e β 1 som oddskvoten. Hur mycket mer/mindre sannolikt är det observera Y i = 1 om x 1i = 1 respektive x 1i = 0? T.ex. e b 1 = 2 Y i = 1 är dubbelt så sannolikt som Y i = 0. b 1 = 0 oddskvot=1 Y i = 1 lika sannolikt då x 1i = 1 och x 1i = 0 b 1 > 0 oddskvot>1 Y i = 1 mer sannolikt då x 1i = 1. b 1 < 0 oddskvot<1 Y i = 1 mer sannolikt då x 1i = 0. Dessa tolkningar är väldigt användbara och en anledning till varför logistisk regression så ofta används. Vi kan även utöka modellen så att vi har fler kategorier för x 1 samt fler kategoriska x-varaibler. 21 / 33

25 Vad är index? Index är ett instrument för att jämföra hur priset, volumen eller värdet för En vara eller en tjänst En grupp eller korg av varor och tjänster stokastiska variabler Förändras över tid i relation till ett valt basår. 23 / 33

26 Notationer Basåret betecknas år 0. Jämförelseåret betecknas år t. Priser betecknas p, kvantiteter q. Index betecknas ofta I, P (prisindex) eller Q (kvantitetsindex). index för basåret är alltid 100. Vi fokuserar främst på prisindex. 24 / 33

27 Prisförändring mellan två tidpunker Det enklaste indexet vi kan beräkna är en prisförändring mellan två tidpunkter: I 0 t = 100 p t p 0 Om vi enbart beräknar priskvoten p t /p 0 får vi den procentuella prisförändringen mellan år 0 och t. I 0 t < 100 negativ prisförändring I 0 t > 100 positiv prisförändring 25 / 33

28 Index för varukorgar Om vi vill ta reda på prisförändringen för en korg av varor, blir indexberäkningarna mer komplexa: Vi vill att indexserien ska uttrycka den sammanfattade prisförändringen. Då varorna har sålts i olika kvantiteter måste dessa vägas in i beräkningarna. Ska vi ha nuvarande eller gamla kvantiteter som vikter? Tre av de vanligaste metoderna för att beräkna index för varukorgar är Laspeyres index, Paasches index och Fishers index. 26 / 33

29 Laspeyres, Paasches och Fishers index Vi beräknar Laspeyres index mellan tidpunkterna 0 och t för i st varor som: n P0 t L p t,i q 0,i = 100, i = 1, 2,..., n. p 0,i q 0,i i=1 Vi beräknar Paasches index mellan tidpunkterna 0 och t för i st varor som: n P0 t P p t,i q t,i = 100, i = 1, 2,..., n. p 0,i q t,i i=1 Vi beräknar Fishers index mellan tidpunkterna 0 och t för i st varor som det geometriska medelvärdet av Laspeyres och Paasches index: P0 t F = P0 t P PL 0 t, i = 1, 2,..., n. 27 / 33

30 Ett räkneexempel Vi har samlat in priser och kvantiteter för torskfilé och falukorv för två tidsperioder, 1994 och 2000: Vara p 94 p 00 q 94 q 00 Falukorv 48,30 47, Torskfilé 72,80 69, Beräkna P L 0 t 2 Beräkna P P 0 t 3 Beräkna P F 0 t. 28 / 33

31 Viktade prisindex Säg att vi istället för få data över kvantiteter har information om relativa vikter för de varor som ingår i varukorgen. Vikten är den relativa tyngd som ges för respektive vara i indexberäkningara. Vikten för vara i betecknas w i. Det måste gälla att n i=1 w i = 1 där 0 w i 1 Det måste gälla att n i=1 w i = 1 där 0 w i 1 29 / 33

32 Viktat Laspeyres index Om vi t.ex. vet de relativa vikterna för varor i en varukorg vid tidpunkt 0 kan vi beräkna ett Laspeyres index enligt formeln: P L 0 t = 100 n i=1 w i p t,i p 0,i, i = 1, 2,..., n. där vi beräknar w i som: w i = p 0,i q 0,i k=1 p 0,kq 0,k, i = 1, 2,..., n. 30 / 33

33 Viktat Laspeyres index Antag att vi i det tidigare exemplet har vikterna w torsk = 1/4 och w falukorv = 3/4. Vi kan då beräkna ett Laspeyres index mellan åren 1994 och 2000: P L = i=1 p 00,i w i = 100 ( 1 47, 90 p 94,i 4 48, , , 80 ) 98 Vi kan se en prisnedgång på ungefär 2% mellan 1994 och / 33

34 Kedjeindex Den indexmetod som oftast tillämpas är kedjeindex. Denna indextyp innebär att man multiplicerar (kedjar) ihop årliga indextal (länkar) enligt principen: I t 0 = 100 (I 1 0 I 2 1 I t t 1) där I 1 0, I 2 1,..., I t t 1 är årliga inflationstakter. Vi kan ständigt ha en någorlunda aktuell varukorg eftersom uppsättningen av varor, priser och kvantiteter hela tiden revideras. Ibland ändras indexkonstruktionen. Detta medför brutna länkar. T.ex. Ändrad definition för arbetslöshet / 2

35 Kedjeindex Kedjeindex används bl.a. för att beräkna KPI. Detta är data hämtade ifrån Statistiska centralbyrån: År Index (årlig inflation) 1,000 1,121 1,086 1,089 1, Utifrån dessa data kan vi t.ex. beräkna kedjeindex för 1984 (1980 är basår för KPI): I = 100 1, 121 1, 086 1, 089 1, 080 = 143, / 33

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk) Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0

Läs mer

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 2 Statistiska metoder 1 Dagens föreläsning o Vägda medeltal o Standardvägning o Index Angående projektet: Senast onsdagen 6 mars 17:00 ska ni ha lämnat in gruppindelning och definition av problemområde!

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

F5 Index. Beräkning av index. Begreppet index har två innebörder: Christian Tallberg

F5 Index. Beräkning av index. Begreppet index har två innebörder: Christian Tallberg F5 Index Christian Tallberg Avdelningen för Nationalekonomi och Statistik Karlstads universitet Beräkning av index Begreppet index har två innebörder: 1. Visare. Ofta i situationer då vi har ett statistiskt

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Index (Extra material) Linda Wänström Linköpings universitet November 19 Wänström (Linköpings universitet) F5 November 19 1 / 17 Index Ett index beskriver en eller

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent

Läs mer

Korgeffekten - effekter av förändringar i varukorgens sammansättning

Korgeffekten - effekter av förändringar i varukorgens sammansättning STATISTISKA CENTRALBYRÅN Pm 1(5) Korgeffekten - effekter av förändringar i varukorgens sammansättning I tabellen nedan visas korgeffekten på KPI i januari sedan 2009. Både effekten på månadstalet (förändringen

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 12, 2013 Bertil Wegmann (statistik, LiU) Kategoriska data November 12, 2013

Läs mer

Korgeffekten - effekter av förändringar i varukorgens sammansättning

Korgeffekten - effekter av förändringar i varukorgens sammansättning STATISTISKA CENTRALBYRÅN Pm 1(5) Korgeffekten - effekter av förändringar i varukorgens sammansättning I tabellen nedan visas korgeffekten på KPI i januari sedan 2008. Både effekten på månadstalet (förändringen

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )

Läs mer

SF1911: Statistik för bioteknik

SF1911: Statistik för bioteknik SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.

Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller. Multinominella modeller Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller. Möjligt att, genom olika modellformuleringar, beakta att vissa regressorer varierar mellan

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 28, 2012 Bertil Wegmann (statistik, LiU) Kategoriska data November 28, 2012

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Något om index. 1 Enkla och sammansatta index. LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard

Något om index. 1 Enkla och sammansatta index. LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard Något om index 1 Enkla och sammansatta index Om man har tillgång till prisuppgifter över en tidsperiod på alla varor och/eller

Läs mer

732G71 Statistik B. Föreläsning 5. Bertil Wegmann. November 12, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 5. Bertil Wegmann. November 12, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 5 Bertil Wegmann IDA, Linköpings universitet November 12, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 12, 2015 1 / 16 Index Ett index beskriver en eller era

Läs mer

Resursfördelningsmodellen

Resursfördelningsmodellen PCA/MIH Johan Löfgren Rapport 25-6-26 (6) Resursfördelningsmodellen Växjös skolor våren 25 Inledning Underlag för analyserna utgörs av ett register som innehåller elever som gått ut årskurs nio 2 24. Registret

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

F23 forts Logistisk regression + Envägs-ANOVA

F23 forts Logistisk regression + Envägs-ANOVA F23 forts Logistisk regression + Envägs-ANOVA Repetition Detta går inteattbeskriva på någotrimligtsättmed en linjär funktion PY Xx) β 0 +β x Den skattade linjen går utanför intervallet0, ): Y ärenbinärvariabel0-,dikotom)manvillmodellera,

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Facit till Extra övningsuppgifter

Facit till Extra övningsuppgifter LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Facit till Extra övningsuppgifter 1. Modellen är en

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 18, 2016 Bertil Wegmann (statistik, LiU) Kategoriska data November 18, 2016

Läs mer

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Statistiska samband: regression och korrelation

Statistiska samband: regression och korrelation Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Observera att inga anteckningar får finnas i formelsamlingen vid tentamenstillfället Thommy Perlinger 17 september 2015 Innehåll

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL) Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3

Läs mer

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016 Räkneövning 4 Statistiska institutionen Uppsala universitet 14 december 2016 Om uppgifterna Uppgift 2 kan med fördel göras med Minitab. I de fall en gur för tidsserien efterfrågas kan du antingen göra

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande

Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande 1 (5) PM Dok.bet. 2016-06-16 Analysavdelningen Tommy Lowen 010-454 20 50 Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande Premiepensionens delningstal minskar med

Läs mer

Vad är risken att dö i en trafikolycka? - En studie över hur kön och ålder hos en personbilsförare påverkar utfallet av en trafikolycka

Vad är risken att dö i en trafikolycka? - En studie över hur kön och ålder hos en personbilsförare påverkar utfallet av en trafikolycka Vad är risken att dö i en trafikolycka? - En studie över hur kön och ålder hos en personbilsförare påverkar utfallet av en trafikolycka Amanda Wiman Kandidatuppsats i matematisk statistik Bachelor Thesis

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4) Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström 1 STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab. Räkneövning 5 Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari 016 1 Om uppgifterna För Uppgift kan man med fördel ta hjälp av Minitab. I de fall en figur för tidsserien efterfrågas

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

Härledning av Black-Littermans formel mha allmänna linjära modellen

Härledning av Black-Littermans formel mha allmänna linjära modellen Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

Beskrivande statistik

Beskrivande statistik Beskrivande statistik Tabellen ovan visar antalet allvarliga olyckor på en vägsträcka under 15 år. år Antal olyckor 1995 36 1996 20 1997 18 1998 26 1999 30 2000 20 2001 30 2002 27 2003 19 2004 24 2005

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Sannolikheter och kombinatorik

Sannolikheter och kombinatorik Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter

Läs mer

Bilaga 2. Metod logistisk regression

Bilaga 2. Metod logistisk regression 45 Bilaga 2 Metod logistisk regression Till analyserna i avsnitten Vad styr barnlöshet? och Vad styr antal barn? har vi med hjälp av logistiska regressionsmodeller försökt att förklara dels vad det är

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala

Läs mer

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPER, MACHINE, OVERHEAD

Läs mer

STOCKHOLMS UNIVERSITET FYSIKUM

STOCKHOLMS UNIVERSITET FYSIKUM STOCKHOLMS UNIVERSITET FYSIKUM Tentamensskrivning i Fysikexperiment, 7,5 hp, för FK2002 Onsdagen den 15 december 2010 kl. 9-14. Skrivningen består av två delar A och B. Del A innehåller enkla frågor och

Läs mer

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler: Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Vi plottar förklaringsvariablerna mot varandra: Graph Matrix Plot Trots att COST verkade ha ett tydligt

Läs mer

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

2. Lära sig beskriva en variabel numeriskt med proc univariate 4. Lära sig rita diagram med avseende på en annan variabel Datorövning 1 Statistikens Grunder 2 Syfte 1. Lära sig göra betingade frekvenstabeller 2. Lära sig beskriva en variabel numeriskt med "proc univariate" 3. Lära sig rita histogram 4. Lära sig rita diagram

Läs mer

Hantering av ränteavdraget

Hantering av ränteavdraget ES/PR Peter Nilsson PM till Nämnden för KPI 2014-10-16 1(10) Hantering av ränteavdraget För diskussion Syftet med denna PM är att utgöra underlag för en diskussion om, och i så fall hur, avdragsrätten

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning Tidsserier Säsongrensning F7 Tidsserier forts från F6 Vi har en variabel som varierar över tiden Ex folkmängd omsättning antal anställda (beroende variabeln/undersökningsvariabeln) Vi studerar den varje

Läs mer

Datorövning 5 Exponentiella modeller och elasticitetssamband

Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. anpassa och tolka analysen av en exponentiell

Läs mer

PROGRAMFÖRKLARING III

PROGRAMFÖRKLARING III Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING III Matematisk statistik, Lunds universitet stik för modellval och prediktion p./22 Statistik

Läs mer

Upphandling av måltidsverksamhet inom äldreomsorgen

Upphandling av måltidsverksamhet inom äldreomsorgen Uppsala universitet HT 2015 Statistiska institutionen Examensarbete 15 hp Upphandling av måltidsverksamhet inom äldreomsorgen En logistisk regressionsanalys Författare: Henrik Olsson Handledare: Anna Bornefalk-Hermansson

Läs mer

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde

Läs mer

Öppnar jämförelser för ökad kvalitet i vård och omsorg om äldre? Bilaga Regressionsanalyser

Öppnar jämförelser för ökad kvalitet i vård och omsorg om äldre? Bilaga Regressionsanalyser Öppnar jämförelser för ökad kvalitet i vård och omsorg om äldre? Bilaga Regressionsanalyser REGRESSIONSANALYSER Ett antal olika regressionsmodeller har konstruerats för att undersöka om resultaten i ÖJ

Läs mer

Linjära ekvationer med tillämpningar

Linjära ekvationer med tillämpningar UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Olof Johansson, Nina Rudälv 2006-10-17 SÄL 1-10p Linjära ekvationer med tillämpningar Avsnitt 2.1 Linjära ekvationer i en variabel

Läs mer