Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
|
|
- Kristin Sandberg
- för 7 år sedan
- Visningar:
Transkript
1 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari / 33
2 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas 0 och 1. T.ex: Röker - röker inte Uppgång - nedgång för en aktie Beviljas lån eller ej. Hur modelleras Y i då den endast kan anta två olika värden? 2 / 33
3 Logistisk regression Vi tänker oss att värdena 1 och 0 för Y i inträffar med sannolikheterna P(Y i = 1) = Π i P(Y i = 0) = 1 Π i, i = 1, 2,..., n Vi antar att Π i beror på ett antal förklarande variabler och vill därför modellera Π i mot p st förklarande variabler x 1i, x 2i,..., x pi. På samma sätt som i vanlig regression vill vi analysera och dra slutsatser om skattade samband. 3 / 33
4 Hur modelleras sannolikheten Π? Antag att vi för olika grupper av individer vill observera hur många i varje grupp som har respektive inte har en viss egenskap. Då kallas observationerna grupperade och den skattade sannolikheten ˆΠ i för grupp i = 1, 2,..., N beräknas som relativa frekvenser: y 1 n 1, y N n N,..., y N n N där y i är antalet individer i grupp i som har egenskapen och n i är totala antalet individer i grupp i. Vi vill nu försöka modellera de observerade relativa frekvenserna. 5 / 33
5 Hur modelleras sannolikheten Π? Eftersom vi endast har två värden på Y i, måste modellens egenskaper passa definitionen för sannolikheter. Vad händer om vi använder en linjär sannolikhetsmodell? Π i = E(Y i x 1i, x 2i,..., x pi ) = β 0 + β 1 x 1i + β2x 2i β p x pi I modellen tolkas nu t.ex. β 1 som den genomsnittliga förändringen i Π i då x 1i ökar med en enhet (övriga x oförändrade). 6 / 33
6 Nackdelar med en linjär modell Men det finns två stora nackdelar med att modellera Π i med en linjär modell: 1 Det är inte säkert att vi skattar en sannolikhet som finns i intervallet [0,1] vilket motsäger definitionen för sannolikheter! Då parametrarna modellerar Π i linjärt kommer: låga värden på p j=i β jx j att leda till Π i < 0 höga värden på p j=i β jx j att leda till Π i > 1 2 Det går att bevisa att feltermen i den linjära sannolikhetsmodellen är inte längre har konstant varians, dvs vi har heteroskedastiska feltermer: V (ε i ) = ŷ i (1 ŷ i ) Lösningen: Vi skapar en funktion g(π) av Π i som beter sig rätt. 7 / 33
7 Logit och Probit Eftersom fördelningsfunktioner för stokastiska variabler (föreläsning 1) endast definieras i intervallet [0,1] använder vi dessa för att avbilda intervallet (0,1) på (, ) genom funktionen g(π). Två funktioner som gör detta: 1 Logit funktionen baseras på den logistiska fördelningen: ( ) Π g(π) = ln 1 Π 2 Probit funktionen baseras på normalfördelningen g(π) = Φ 1 (Π). 8 / 33
8 Funktioner som skulle kunna användas.
9 Logit funktionen En stor anledning till varför den logistiska modellen är så användbar är att Logitfunktionen (till sklillnad från Probitfunktionen) kan modelleras linjärt som log-odds: ( ) Π ln = β 0 + β 1 x 1i + β 2 x 2i β p x pi 1 Π p = β j x j j=1 Oddsen i detta fall är den relativa sannolikheten att observera y i = 1 gentemot y i = 0. Men oftast vill vi uttrycka modellen i termer av Π. Vi börjar flytta om i uttrycket: p Π 1 Π = e j=1 β j x j 9 / 33
10 Omskrivning till kompendiets form på modellen. Flytta över parantesen, så Π = (1 Π) e p j=1 β j x j. Multiplicera och flytta över igen, så Bryt ut Π och dividera, så Π + Πe p j=1 β j x j = e p j=1 β j x j. ( p ) Π 1 + e j=1 β j x p j = e j=1 β j x j e p j=1 β j x j Π = 1 + e Om vi påminner oss om vad Π betyder så har vi p j=1 β j x j. P (Y i = 1) = 1 + e e p j=1 β j x j p j=1 β j x j. Denna ekvation återfinns i kompendiet på sidan 3. Där är p = 2.
11 Skattningsmetoder Eftersom den logistiska modellen för Π i inte är linjär, kan vi inte använda minsta kvadratmetoden för att härleda parameterskattningar, b 0, b 1, b2 +..., b p. Istället måste vi använda andra skattningsmetoder: 1 Maximum Likelihood: Man försöker hitta de mest sannolika parameterskattningarna givet vårt urval. Är den metod som används oftast. 2 Icke-linjär minsta kvadratmetod: Samma princip som med vanlig minsta kvadratmetod men anpassad för icke-linjära modeller. 10 / 33
12 Hur tolkas parametrarna? Eftersom den logistiska modellen är en logaritmisk funktion blir tolkningarna av parametrarna β 1, β 2,..., β p lite annorlunda: ( ) β 1 är effekten av x 1 på ln Π 1 Π givet att övriga x är konstanta. Om x 1 ökar med en enhet så förändras sannolikheten Π med β 1 %. e β1 är effekten på Π 1 Π, givet övriga x konstanta. Om vi ökar x 1 med en enhet så förändras log-oddsen med e β 1. Interceptet β 0 ger sannolikheten Π då alla x = / 33
13 Den logistiska funktionen Parametrarna i den logistiska modellen avgör logitfunktionens utseende. Det går att visa att funktionens lutning i en enkel logistisk regressionsmodell är: Positiv om β 1 är positiv och negativ om β 1 är negativ. Brantare om β 1 är stor och flack om β 1 är liten. β 0 avgör läget på x-axeln för funktionen. Vi kan se hur funktionen ändras med olika värden på parameterskattningarna b 0 och b 1. I diagrammet betecknas b 0 för a och b 1 för b. 12 / 33
14 Effekten av parametrarna a och b positivt b
15 Effekten av parametrarna a och b negativt b
16 Den logistiska funktionen Vi utgår ifrån den logistiska modellen Π = eb 0+b 1 x e b 0+b 1 x 1 Vilket värde på x 1 ger att sannolikheten Π=50%? Vi söker det x 1 som löser: 1 2 = eb0+b1x1 1 + e b 0+b 1 x 1 För att lösa för x 1 flyttar vi om och förenklar uttrycket: 1 + e b 0+b 1 x 1 = 2e b 0+b 1 x 1 1 = 2e b 0+b 1 x 1 e b 0+b 1 x 1 1 = e b 0+b 1 x 1 13 / 33
17 Den logistiska funktionen Vi logaritmerar både höger och vänsterled: ln 1 = ln(e b 0+b 1 x 1 ) = b 0 + b 1 x 1 Då ln 1 = 0 kan vi till slut lösa ut värdet på x 1 som: x 1 = b 0 b 1 Sannolikheten att Π = 50% får vi då x 1 antar värdet b 0 b 1 14 / 33
18 Ett exempel Vi ska titta på ett exempel ifrån kompendiet av Thorburn och Larsson där vi har grupperat data för: låntagares inkomster, uppdelat i 11 inkomstnivåer. antalet lån vid varje inkomstnivå. antalet av dessa lån där låntagaren hade betalningssvårigheter. Vi vill skatta en enkel logistisk regression för att se om inkomstnivån påverkar sannolikheten för att ha betalningssvårigheter. Modellen vi anpassar skrivs därför: Π i = eβ 0+β 1 x 1i 1 + e β 0+β 1 x 1i 15 / 33
19 Betalningssvårigheter Årsinkomst, kkr(x) Antal lån (nx) Antal med bet.svårigheter (y)
20 Ett exempel Vi kan plotta observationerna med relativa frekvenser (sannolikhet) på y-axeln och inkomst på x-axeln: Grupperat data sannolikhet inkomst 16 / 33
21 Ett exempel Då vi anpassar modellen Π i = vi dessa resultat: eβ 0 +β 1 x 1i till datamaterialet i R får 1+e β 0 +β 1 x 1i Estimate Std. Error z value Pr(> z ) (Intercept) e-48 inkomst e-77 Den skattade modellen kan därför skrivas: ˆΠ i = e x 1i 1 + e x 1i 17 / 33
22 Ett exempel Vi plottar nu observationerna mot den skattade modellen: Observationer och anpassad modell sannolikhet inkomst 18 / 33
23 Enkel logistisk regression med en binär x-variabel En logistisk modell som ofta används är den där vi modellerar Π i mot en binär x-variabel. Vi antar en enkel modell: Π i = eβ 0+β 1 x 1i 1 + e β 0+β 1 x 1i Där x 1 är en dummyvariabel och endast antar värdena 0 eller 1 beroende på om en undersökt person i har en viss egenskap (x 1i = 1) eller inte (x 1i = 0) 20 / 33
24 Enkel logistisk regression med en binär x-variabel I denna modell tolkas e β 1 som oddskvoten. Hur mycket mer/mindre sannolikt är det observera Y i = 1 om x 1i = 1 respektive x 1i = 0? T.ex. e b 1 = 2 Y i = 1 är dubbelt så sannolikt som Y i = 0. b 1 = 0 oddskvot=1 Y i = 1 lika sannolikt då x 1i = 1 och x 1i = 0 b 1 > 0 oddskvot>1 Y i = 1 mer sannolikt då x 1i = 1. b 1 < 0 oddskvot<1 Y i = 1 mer sannolikt då x 1i = 0. Dessa tolkningar är väldigt användbara och en anledning till varför logistisk regression så ofta används. Vi kan även utöka modellen så att vi har fler kategorier för x 1 samt fler kategoriska x-varaibler. 21 / 33
25 Vad är index? Index är ett instrument för att jämföra hur priset, volumen eller värdet för En vara eller en tjänst En grupp eller korg av varor och tjänster stokastiska variabler Förändras över tid i relation till ett valt basår. 23 / 33
26 Notationer Basåret betecknas år 0. Jämförelseåret betecknas år t. Priser betecknas p, kvantiteter q. Index betecknas ofta I, P (prisindex) eller Q (kvantitetsindex). index för basåret är alltid 100. Vi fokuserar främst på prisindex. 24 / 33
27 Prisförändring mellan två tidpunker Det enklaste indexet vi kan beräkna är en prisförändring mellan två tidpunkter: I 0 t = 100 p t p 0 Om vi enbart beräknar priskvoten p t /p 0 får vi den procentuella prisförändringen mellan år 0 och t. I 0 t < 100 negativ prisförändring I 0 t > 100 positiv prisförändring 25 / 33
28 Index för varukorgar Om vi vill ta reda på prisförändringen för en korg av varor, blir indexberäkningarna mer komplexa: Vi vill att indexserien ska uttrycka den sammanfattade prisförändringen. Då varorna har sålts i olika kvantiteter måste dessa vägas in i beräkningarna. Ska vi ha nuvarande eller gamla kvantiteter som vikter? Tre av de vanligaste metoderna för att beräkna index för varukorgar är Laspeyres index, Paasches index och Fishers index. 26 / 33
29 Laspeyres, Paasches och Fishers index Vi beräknar Laspeyres index mellan tidpunkterna 0 och t för i st varor som: n P0 t L p t,i q 0,i = 100, i = 1, 2,..., n. p 0,i q 0,i i=1 Vi beräknar Paasches index mellan tidpunkterna 0 och t för i st varor som: n P0 t P p t,i q t,i = 100, i = 1, 2,..., n. p 0,i q t,i i=1 Vi beräknar Fishers index mellan tidpunkterna 0 och t för i st varor som det geometriska medelvärdet av Laspeyres och Paasches index: P0 t F = P0 t P PL 0 t, i = 1, 2,..., n. 27 / 33
30 Ett räkneexempel Vi har samlat in priser och kvantiteter för torskfilé och falukorv för två tidsperioder, 1994 och 2000: Vara p 94 p 00 q 94 q 00 Falukorv 48,30 47, Torskfilé 72,80 69, Beräkna P L 0 t 2 Beräkna P P 0 t 3 Beräkna P F 0 t. 28 / 33
31 Viktade prisindex Säg att vi istället för få data över kvantiteter har information om relativa vikter för de varor som ingår i varukorgen. Vikten är den relativa tyngd som ges för respektive vara i indexberäkningara. Vikten för vara i betecknas w i. Det måste gälla att n i=1 w i = 1 där 0 w i 1 Det måste gälla att n i=1 w i = 1 där 0 w i 1 29 / 33
32 Viktat Laspeyres index Om vi t.ex. vet de relativa vikterna för varor i en varukorg vid tidpunkt 0 kan vi beräkna ett Laspeyres index enligt formeln: P L 0 t = 100 n i=1 w i p t,i p 0,i, i = 1, 2,..., n. där vi beräknar w i som: w i = p 0,i q 0,i k=1 p 0,kq 0,k, i = 1, 2,..., n. 30 / 33
33 Viktat Laspeyres index Antag att vi i det tidigare exemplet har vikterna w torsk = 1/4 och w falukorv = 3/4. Vi kan då beräkna ett Laspeyres index mellan åren 1994 och 2000: P L = i=1 p 00,i w i = 100 ( 1 47, 90 p 94,i 4 48, , , 80 ) 98 Vi kan se en prisnedgång på ungefär 2% mellan 1994 och / 33
34 Kedjeindex Den indexmetod som oftast tillämpas är kedjeindex. Denna indextyp innebär att man multiplicerar (kedjar) ihop årliga indextal (länkar) enligt principen: I t 0 = 100 (I 1 0 I 2 1 I t t 1) där I 1 0, I 2 1,..., I t t 1 är årliga inflationstakter. Vi kan ständigt ha en någorlunda aktuell varukorg eftersom uppsättningen av varor, priser och kvantiteter hela tiden revideras. Ibland ändras indexkonstruktionen. Detta medför brutna länkar. T.ex. Ändrad definition för arbetslöshet / 2
35 Kedjeindex Kedjeindex används bl.a. för att beräkna KPI. Detta är data hämtade ifrån Statistiska centralbyrån: År Index (årlig inflation) 1,000 1,121 1,086 1,089 1, Utifrån dessa data kan vi t.ex. beräkna kedjeindex för 1984 (1980 är basår för KPI): I = 100 1, 121 1, 086 1, 089 1, 080 = 143, / 33
Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merKapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merSkriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012
Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Läs merExempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Läs merTill ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Läs merIndex. Tal procenttal som används vid jämförelser Statistiska uppgifter som visar utveckling under en viss period kan beskrivas med en indexserie
F18 Index Index Tal procenttal som används vid jämförelser Statistiska uppgifter som visar utveckling under en viss period kan beskrivas med en indexserie 69,7/72,8 är % avrundat Medelpriser - för 1 kg
Läs merPreliminärt lösningsförslag - omtentamen i Finansiell statistik,
Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X]
Läs merStockholms Universitet Statistiska institutionen Patrik Zetterberg
Stockholms Universitet Statistiska institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, VT2012 2012-05-31 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merStokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Läs merSpridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 2 Statistiska metoder 1 Dagens föreläsning o Vägda medeltal o Standardvägning o Index Angående projektet: Senast onsdagen 6 mars 17:00 ska ni ha lämnat in gruppindelning och definition av problemområde!
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och
Läs merSTOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh
1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik
Läs merF5 Index. Beräkning av index. Begreppet index har två innebörder: Christian Tallberg
F5 Index Christian Tallberg Avdelningen för Nationalekonomi och Statistik Karlstads universitet Beräkning av index Begreppet index har två innebörder: 1. Visare. Ofta i situationer då vi har ett statistiskt
Läs merAutokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Läs merTentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs mer732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Läs merMarkovkedjor. Patrik Zetterberg. 8 januari 2013
Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)
Läs merRedovisning av KPI:s förändringstal
STATISTISKA CENTRALBYRÅN KPI-nämnds pm 1(6) Redovisning av KPI:s förändringstal För beslut Prisenhetens förslag Prisenheten föreslår att nämnden för Konsumentprisindex fattar ett särskilt beslut om att
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merRegressions- och Tidsserieanalys - F5
Regressions- och Tidsserieanalys - F5 Index (Extra material) Linda Wänström Linköpings universitet November 19 Wänström (Linköpings universitet) F5 November 19 1 / 17 Index Ett index beskriver en eller
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merFinansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data
Läs merF11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merStatistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Läs mer1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och
Läs merRegressions- och Tidsserieanalys - F5
Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?
Läs merFöreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
Läs merKorgeffekten - effekter av förändringar i varukorgens sammansättning
STATISTISKA CENTRALBYRÅN Pm 1(5) Korgeffekten - effekter av förändringar i varukorgens sammansättning I tabellen nedan visas korgeffekten på KPI i januari sedan 2009. Både effekten på månadstalet (förändringen
Läs merKorgeffekten - effekter av förändringar i varukorgens sammansättning
STATISTISKA CENTRALBYRÅN Pm 1(5) Korgeffekten - effekter av förändringar i varukorgens sammansättning I tabellen nedan visas korgeffekten på KPI i januari sedan 2008. Både effekten på månadstalet (förändringen
Läs merSF1911: Statistik för bioteknik
SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion
Läs merTillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Läs merVid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Läs merStatistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merFöreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013
Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process
Läs merEtt A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.
Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merMatematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Läs mer732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15
732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på
Läs merTAMS65 - Föreläsning 2 Parameterskattningar - olika metoder
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 12, 2013 Bertil Wegmann (statistik, LiU) Kategoriska data November 12, 2013
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merF19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Läs merModeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.
Multinominella modeller Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller. Möjligt att, genom olika modellformuleringar, beakta att vissa regressorer varierar mellan
Läs merÖvningshäfte till kursen Regressionsanalys och tidsserieanalys
Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merDekomponering av löneskillnader
Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 28, 2012 Bertil Wegmann (statistik, LiU) Kategoriska data November 28, 2012
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merSänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Läs merNågot om index. 1 Enkla och sammansatta index. LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard
LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Anders Nordgaard Något om index 1 Enkla och sammansatta index Om man har tillgång till prisuppgifter över en tidsperiod på alla varor och/eller
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs merSTOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh
1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik
Läs merResursfördelningsmodellen
PCA/MIH Johan Löfgren Rapport 25-6-26 (6) Resursfördelningsmodellen Växjös skolor våren 25 Inledning Underlag för analyserna utgörs av ett register som innehåller elever som gått ut årskurs nio 2 24. Registret
Läs mer732G71 Statistik B. Föreläsning 5. Bertil Wegmann. November 12, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 5 Bertil Wegmann IDA, Linköpings universitet November 12, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 12, 2015 1 / 16 Index Ett index beskriver en eller era
Läs merTentamen för kursen. Linjära statistiska modeller. 27 oktober
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merRegressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Läs merF12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24
1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar
Läs merKorrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs merLäs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:
Läs merÖvningshäfte till kursen Regressionsanalys och tidsserieanalys
Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande
Läs merEtt A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.
Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann
Läs merStatistiska samband: regression och korrelation
Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel
Läs merTentamen för kursen. Linjära statistiska modeller. 17 februari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 18, 2016 Bertil Wegmann (statistik, LiU) Kategoriska data November 18, 2016
Läs merF2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Läs mer2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Läs merRäkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016
Räkneövning 4 Statistiska institutionen Uppsala universitet 14 december 2016 Om uppgifterna Uppgift 2 kan med fördel göras med Minitab. I de fall en gur för tidsserien efterfrågas kan du antingen göra
Läs merFöreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B
Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så
Läs merSTOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistiska metoder SDA III, 2 poäng ingående i kurserna Grundkurs i statistik 20 p samt Undersökningsmetodik
Läs merF23 forts Logistisk regression + Envägs-ANOVA
F23 forts Logistisk regression + Envägs-ANOVA Repetition Detta går inteattbeskriva på någotrimligtsättmed en linjär funktion PY Xx) β 0 +β x Den skattade linjen går utanför intervallet0, ): Y ärenbinärvariabel0-,dikotom)manvillmodellera,
Läs merSTOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merLäs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26
Läs merFinansiell statistik
Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys
Läs merPrediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merPremiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande
1 (5) PM Dok.bet. 2016-06-16 Analysavdelningen Tommy Lowen 010-454 20 50 Premiepensionens delningstal och dess känslighet för ändrad livslängd och ränteantagande Premiepensionens delningstal minskar med
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merStatistiska Institutionen Gebrenegus Ghilagaber (docent) Skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 15 hp, HT07. Fredagen 18 januari 2008
Statistiska Institutionen Gebrenegus Ghilagaber (docent) Skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 15 hp, HT07. Fredagen 18 januari 2008 Skrivtid: 5 timmar (14-19) Hjälpmedel: Miniräknare,
Läs merFacit till Extra övningsuppgifter
LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Facit till Extra övningsuppgifter 1. Modellen är en
Läs mer