F8 Avvikelser från modellantagandena I

Storlek: px
Starta visningen från sidan:

Download "F8 Avvikelser från modellantagandena I"

Transkript

1 Heteroskedasticitet F8 Avvikelser från modellantagandena I Enligt antagandena för linjär regression ska slumptermernaε i varaiidoberoende,likafördelade)enligt ε i N 0,σ 2) dvsvariansenförslumptermenärkonstantσ 2 oavsett var eller när vi tittar på Y i och X i, mao oavsett i. Tidigareskrevviσ 2 ε menvikansläppaindexettillfälligtvis.) Mendettaärintealltidfalletnärmantittarpåverkliga datamaterial. Istället ser man något som skulle kunna skrivas som ε i N 0,σ 2 ) i dvs slumptermsvariansen är inte längre nödvändigtvis konstant för alla i σ 2 i σ2 j för i j Vi har heteroskedasticitet i slumptermerna. Orsaker till heteroskedasticitet. Error-learning models: ju mer man tränar desto färre fel mindre variation 2. Discretionary income: högre inkomst större variation i hur man disponerar sin inkomst, tex sparande 3. Datainsamlingsmetoder förbättras mindre variation 4. Outliers: beroende på hur många som avviker och vardeliggeroutlieriy elleroutlierixellerbåda) kan man ofta om materialet är litet få indikationer på varierande varians. 5. Felaktig modellspecifikation: saknas en väsentlig term? Tex linjär regression när den"sanna" modellen är ett polynom. 6. Skevhet skewness) i regressorerna: tex inkomst, förmögenhet. 7. Olämpliga a) transformationer: tex kvoter, differenser b) funktionella former: tex linjärt kontra log-linjärt Vanligare med heteroskedasticitet i tvärsnittsstudie än i en i tidseriedata. - Tvärsnittsstudie: en observation från många objekt vid samma tidpunkt, oftast). Objekten tenderar att variera - Tidseriedata: flera observationer från ett objektflera tidpunkter). Objektet tenderar att vara stabili någon mening) - Paneldata, longitudinella studier: flera observationer från många objekt. Vad händer med OLS-skattningarna om data är heteroskedastiskt? Utgå från den enkla modellen Y i =β 0 +β X i +ε i Tex,skattningenförβ setidigareoh)ochvariansen för denna var under antagandet om lika varians dvs σ 2 i =σ2 förallai)var Var ˆβ ) = σ 2 xi x) 2 Menomdetärheteroskedastisktochσ 2 i σ2 j för i j,blirvariansenför ˆβ istället Var ˆβ ) = xi x) 2 σ 2 i xi x) 2) 2 Vad spelar detta för roll egentligen?.2.2) Skattningarna är fortfarande väntevärdesriktiga unbiased), konsistenta, asymptotiskt normalfördelade. Men de är inte längre effektiva.

2 GLS- Generaliserad Minsta Kvadratskattning Vi skriver Y i =β 0 X 0i +β X i +ε i därx 0i =förallai.antagaattσ 2 i ärkändföralla iochskriv ) ) ) Y i X0i Xi εi =β 0 +β + σ i σ i σ i σ i eller Y i =β 0 X 0i +β X i +ε i och observera att ) Eε εi i )=E σ i = σ i Eε i )=0 och Varε i ) = E ε i )2) =E ) 2 εi σ i = σ 2 ie ε 2 ) i = σ 2 σ 2 i = i Idé: ge observationer från områden med stor variation låg vikt och de med liten variation stor vikt. För de senare är mer samlade kring sina medelvärden och man kan få en bättre precision och därmed skatta regressionslinjen"bättre". vilketärkonstantlikamedföralli,dvsvihartransformeratε i tillε i somärhomoskedastiskt! Genom att transformera enligt,x i,y i ), X i, Y ) i =X0i σ i σ i σ,x i,y i ) i och sedan köra på med vanlig OLS MK) så kommer man runt problemet. Vanlig OLS: minimera n ) 2= n Q= yi ˆβ 0 ˆβ x i e 2 i i= i= Vadhänderomman"görfel"? OLS skattning med hänsyn till heteroskedasticitet - enligt.2.2): GLS: minimera där Q n ) 2= n = w i y i ˆβ 0 ˆβ x i i e i= i=w 2 i w i = σ i Kan visas att Var ˆβGLS ) <Var ˆβOLS ) ochkikommerattvaraförbredaochp-värdenkommer att vara missvisande. OLS skattning utan någon hänsyn alls Beteckningen w i kommer av weights eller vikter, dvs varje observation i datamaterialet viktas med inversen till"sin" slumptermsvarians. Därav den vanliga benämningen Weighted Least Squares eller WLS. - inte ens enligt.2.2): Kan visas att Var ˆβ OLS ) Se 2 = xi x) 2 inte är väntevärdesriktig biased). Vi vet inte ens om den över- eller underskattar den sanna variansen. Slutsatser av en sådan analys kan var helt missvisande.

3 När är det heteroskedastiskt? Oftaharmanjuingenaningförränmanharettstickprovatttittapå. - Skatta som om det vore homoskedastiskt, dvs vanlig OLS skattning och analysera residualerna. Grafiskt: Titta på residualplottar. Typiskt utseende kan vara Residual Residuals vs X Formella test: Finns olika beskrivna i litteraturen -Parktest - Glejser test - Spearman s rangkorrelationstestse tidigare OH) - Goldfeld-Quandt test - Breusch-Pagan-Godfrey test Vi behöver inte fördjupa oss i detaljerna om dessa test. Men vi ska veta att det finns sätt att testa för lika variansh 0 ärtypisktattdetinteärheteroskedastiskt, lågap-värdengörattattviförkastarh 0 ) x Åtgärder i skattningsförfarandet Ex)Antagatt Närσ 2 i ärkänd:wlsseexempel) E ε 2 i) =σ 2 X 2 i Närσ 2 i ärokänd:whitesheteroskedasticity-consistent Variances and Standard Errors kanske tveksamt vid små stickprov). dvs residualvariansen ser ut att vara proportionell mot kvadraten på prediktorn. Transformera data enligt När man har en kvalificerad gissning: man kan ibland se att variansen i residualerna kan skrivas som en funktion av prediktornprediktorerna) dvs σ 2 i =fx i) Y i σ i = β 0 = β 0 X0i X i ) ) ) X0i Xi εi +β σ + i σ i σ ) ) i ) Xi εi +β + X i X i = β 0 X i +β +ε i ochdärx i 0>0).

4 Ex2)Antagatt Ex3)Antagatt E ε 2 i) =σ 2 X i dvs residualvariansen ser ut att vara proportionell mot prediktorn. Transformera data enligt Y i X0i = β σ 0 i σ i ) ) Xi +β + σ i ) εi ) X0i Xi = β 0 +β )+ Xi Xi = β 0 Xi +β X i +ε i ochdärx i >0. σ i ) εi Xi E ε 2 ) i =σ 2 EY i X) 2 =σ 2 β 0 +β X i ) 2 dvs residualvariansen ser ut att vara proportionell mot kvadraten på prediktorn. Transformera data enligt ) ) ) Y i X0i Xi εi =β 0 +β + σ i σ i σ i σ ) i ) X =β 0i X 0 )+β i ε + i EY i X) EY i X) EY i X) och där EY i X) 0 > 0). Förutsätter att man vetvadβ 0 ochβ är! Tvåstegsförfarande:. Skattaβ 0 ochβ medols 2. BeräknaŶ i fråndenskattademodellenochanvänd dettaisfey i X). Ex 4) Antag en modell med log-transformation enligt Hurgörmanipraktiken? eller eller lny i =β 0 X 0i +β X i +ε i Y i =β 0 X 0i +β lnx i +ε i lny i =β 0 X 0i +β lnx i +ε i Ex Minitab: Options-knappen ger följande dialogfönster. Observera"Weights"-rutan. Detta kan ofta reducera heteroskedasticiteten i observerade datamaterial. Ex EViews: vid estimering, Options-fliken. Observera "Weights"-rutan.

5 Autokorrelation F9 Avvikelser från modellantagandena II Enligt antagandena för linjär regression ska slumptermernaε i varafördeladeenligt iid ε i N 0,σ 2 ) ε iid = oberoende, lika fördelade). Förragångentittadevipåvadsomhänderomdeinte var lika fördelade, speciellt att de hade olika varians. Nuskavitittavadsomhänderomdeinteäroberoende. Vad är problemet? Samma som förra gången: Formellt antar vi vid vanlig enkel linjär regression att E ε i ε j ) =0 i j men nu gäller alltså att för vissa par, kombinationer el. liknade) att E ε i ε j ) 0 i j Om detta är fallet säger vi att autokorrelation. Speciellt vanligt och intressant är det i samband med analys av tidsseriermen även spatiala data). Typiskt när i tiden närliggande observationerslumptermer) ser ut att samvariera, tex Eε t ε t+s ) 0 s 0 Skattningarna är fortfarande väntevärdesriktiga unbiased), konsistenta, asymptotiskt normalfördelade. Men de är inte längre effektiva. Orsaker till autokorrelation Specifikationsfel: variabel saknas i modellen. Antag att den"sanna" modellen är Y t =β 0 +β X t +β 2 X 2t +ε t men vi prövar modellen Detta innebär att Y t =β 0 +β X t +ν t ν t =β 2 X 2t +ε t ochvikanfåinenautokorrelationviadetlinjärasambandetmellanx 2t ochdeövriga. Lösning: kör båda och se om autokorrelationen försvinner med den utökade modellen. Specifikationsfel: felaktig funktionell form. Antag att den"sanna" modellen är Y t =β 0 +β X t +β 2 X 2 t +ε t men vi prövar modellen Y t =β 0 +β X t +ν t Detta innebär att att vi kommer se det typiska mönstret för kvadrater i residualerna vilket kan ge upphov till en falsk) autokorrelation. Cobweb fenomen En återkopplande effekt, tex om priset är högt, producerarmanmernästaår,prisetgårnerochnästaår producerar man mindre Tillång t =β 0 +β Pris t +ε t Effektenblir attdethela hoppar framochtillbaka autokorrelation.

6 Laggarlags) Transformering av data Typiskt ser man ofta en seriell korrelation i ekonomiska sammanhang,texprisetidagärungefärsomigår,bnp ändras långsamtcyklist) mm. En modell skulle kunna skrivas enligt Y t =β 0 +β X t +β 2 Y t +ε t Kan ses som specialfall av "Specifikationsfel: variabel saknas i modellen" Manipulering av data: aggregering/ interpolering Säg att man har dagskurser men aggregerar till månadsmedelvärden. Detta får till följd att små dagliga störningar dämpas ut, en uppåt kommer tas ut av en störning neråt. Serien blir "mjukare" än innan. autokorrelation. Eller man har årsdata men man interpolerar till månader. Eftersom årsdata är"mjuk" från början kommer interpolationerna också att spegla detta autokorrelation. Säg att ni tittar på differenser från en dag till nästa, dvs antag att modellen kan skrivas och antag att Y t = β 0 +β X t +ε t Y t = β 0 +β X t +ε t iid ε i N 0,σ 2 ) ε Men differenserna kan skrivas där ochvifår Y t =β X t +ν t ν t = ε t =ε t ε t Eν t ν t ) = E[ε t ε t )ε t ε t 2 )] dvs autokorrelation. = Eε t ε t ) Eε t ε t 2 ) Eε t ε t )+Eε t ε t 2 ) = 0 0+σ 2 ε +0 Stationäritet och icke-stationäritet OLS skattning när man har autokorrelation om en tidserie är svagt) stationär behåller den sina statistiska egenskaper genom hela serien, dvs Eε t )=0 Varε t )=σ 2 ε Covε t,ε t+s )=γ s Omovanståendeinteäruppfylltsägerviattserienär icke-stationärochvikanisåfallseteckenpåautokorrelation som egentligen är effekten av en trend i serien. Antag att modellen kan skrivas enligt Y t =β 0 +β X t +υ t och där υ t =ρυ t +ε t ρ < ochdärserienavε t ärstationärdvs Eε t )=0 Varε t )=σ 2 ε och dessutom ej autokorrelerade Covε t,ε t+s )=0 s 0 Då har vi det somkallas enförsta ordningens autoregressiv modellellerenar)islumptermernaυ t.

7 Mankanvisaattvifår Varυ t )= σ2 ε ρ 2 homosked.) Covυ t,υ t+s )=Eυ t υ t+s )=ρ s σ 2 ε ρ 2 Corrυ t,υ t+s )=ρ s Observera att ovanstående innbär att serien av υ t är stationär men poängen är att de inte är oberoende. Serienavε t ärdäremotoberoendeochstationär). Under den vanliga modellen med oberoende) är den vanligaols-skattningenavβ somvanligt ˆβ OLS xt y t = x 2 t vi antar nu att vi har medelvärdesjusterat observationernasåatt x,ȳ=0)medvariansen Var ˆβ OLS ) = σ2 ε 2.2.7) x 2 t Men under AR) modellen blir variansen istället Observeraocksåattυ t ärkorreleradeinteendastmed υ t ρ = ρ ovan ) utan med varje tidpunkt υ t s innan ρ s ovan). Om det gäller att ρ < inses att styrkan i beroendet också avtar med s. ˆβOLS ) Var AR n +2 s= = σ2 ε x 2 t ρ s xt x t s x 2 t 2.2.8) och om vi bortser ifrån AR) komponenten riskerar vi grova felskattningar av variansen! Ex)AntagattävenX t följerärenar)process,dvs X t =rx t +δ t r < där r är X t s autokorrelationskoefficient. Det kan då visas att BLUE-estimat vid autokorrelerade slumptermer VitartillenvariantavGLSochdetkanvisasattBLUEskattning blir Var ˆβ OLS ) =Var AR ˆβ OLS ) ) +rρ rρ ˆβ GLS xt ρx t )y t ρy t ) = xt ρx t ) 2 +C Beroende på vilka värden r respektive ρ antar kan vi antingen över- eller underskatta den sanna variansen för ˆβ. och variansen är Var ˆβ GLS ) σ 2 ε = xt ρx t ) 2+D där C och D är korrektionsfaktorer som kan bortses ifrån. Denna skattning är BLUE. Allmänt om GLS är att man använder mer information änvadolsgör.)

8 Vadhänderomman"görfel"? OLS skattning med hänsyn till autokorrelation - enligt2.2.8): Kan visas att Var ˆβ GLS ) <Var ˆβ OLS ) AR ochkikommerattvaraförbredaochp-värdenkommer att vara missvisande. OLS skattning utan någon hänsyn alls - inte ens enligt2.2.8) utan med2.2.7): Manriskerarattunderskattaσ 2 ε ochdärmedöverskatta R 2.Ävenommaninteunderskattarσ 2 ε riskerarmanatt felskatta2.2.8) om man anväder2.2.7) och därmed kommer t och F-test vara missvisande felaktiga p- värden). Slutsatser av en sådan analys kan var helt missvisande. Hur upptäcker man att det är autokorrelerat? Oftaharmanjuingenaningförränmanharettstickprovatttittapå. - Skatta som om det inte finns atuokorrelation, dvs vanlig OLS skattning, och analysera residualerna, dvs vikommerattfåenserieavˆυ t. Grafiskt: Titta på residualplottar. Kan man se mönsteriˆυ t?vilkaisåfall? Exempel) CBE Residuals Härkanmanseattserienavresidualermöjligenrörsig lite för mjukt, närliggande residualer är relativt lika. Formella test: Finns olika beskrivna i litteraturen -RunstestsetidigareOH) - Durbin-Watson d-test: Används för att detektera om det finns en AR), ej högre ordningar typ AR2). Deiniera nt=2 ˆυ t ˆυ t ) 2 d= nt=ˆυ 2 2 ˆρ) t där nt=2ˆυ tˆυ ˆρ= t nt=ˆυ 2 t ärenskattningavρ.eftersom ρ <gälleratt 0<d<4 -omρ=0,dvsingenautokorrelationsåärd=2. -omρärnärasåärdnära0 -omρärnära-såärdnära4. Manletarupptvåkritiskagränserd L ochd U idurbin- Watson tabellengränserna beror på n och p-värde). Om d ligger i intervallet -d U,4 d U )såärdetinteautokorrelerat. -0,d L )elleri4 d L,4)såärdetautokorrelerat -d L,d U )elleri4 d U,4 d L )vetmanintesäkert. Nackdel med metoden är att det finns s.k. "indecisive zones" och att man endast testar för autokorrelation på lagg. Dessutom kan autokorrelation i en regressor maskera autokorrelation i slumptermerna. - Breusch-GodfreyBG) test också känd som Lagrange MultiplierLM) test: Se texten.

9 - Box-Ljung Q-statistikor: Definiera M ˆρ 2 Q=nn+2) k n k) k= därˆρ k ärenskattningavautokorrelationenpålaggk. Observera att Q är ett test för flera autokorreleationer samtidigt, ett s.k. portmanteau test. Mycket vanligt är att man tittar på AutokorrelationsfunktionenACF) vilket är skattningar av Corrυ t,υ t+s )=ρ s dvs autkorrelationer på olika laggar s, dvs olika tidsavstånd s. Dessa kan åskådliggöras i diagram. Ex) Tecken på atuokorrelation Q är approximativt χ 2 -fördelad om modellen är korrekt specifierad och vid stora värden på Q förkastas nollhypotesen om inga autokorrelationer upp till lagg M. Autocorrelation,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 Autocorrelation Function for X with 5% significance limits for the autocorrelations) Lag Ex) Tecken på avsaknad av autokorrelation Autocorrelation Function for X2 with 5% significance limits for the autocorrelations),0 0,8 0,6 Autocorrelation 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -, Lag

10 X Y F0 Ekonometriska tidserier Stationära processer Stokastiska processer Om en tidserie är svagt stationär behåller den sina statistiska egenskaper genom hela serien, dvs En stokastisk process är en samling slumpvariabler ordnade efter tid. TexomY ärenslumpvariabelsomviobserverarflera gånger i tiden) kan vi betrakta det som stokastisk process. Förtydligande: Om tiden är kontinuerlig skriver man Y t),omtidenärdiskretskrivermany t. Y t självtärtypisktkontinuerlig. EY t )=µ, VarY t )=σ 2 Y Cov Y t,y t+k ) =γk Dvs oavsett t så ska ovanstående gälla. Om ovanstående inte är uppfyllt säger vi att serien är icke-stationär och vikanisåfallseteckenpåautokorrelationsomegentligenäreffektenaventrendiserien. Mankansägaattenstörningsomfårserienatt"hoppa till" inte kommer att ha en bestående effekt utan serien kommer relativt snabbt tillbaks till värden runt medelvärdet mean reversion). Dessutom ska fluktuationerna runt medelvärdet vara ungefär lika stora ivarians). Finns en definition för det som kallas stark stationäritet men ovanstående räcker ofta i praktiken.) HyfsadstationärseriemöjligenvarierandeVarY t )) Random Walk el Slumpvandring utan drift 2 0 Time Series Plot of Y Klassiskt exempel på icke-stationär serie är en Random Walk ModelRWM) eller slumpvandring dvs en modell enligt - Y t =Y t +u t Time EjstationärseriemedavseendepåväntevärdetEY t ) däru t ärvittbruswhitenoise)ellermaoiidslumptermer enligt u t N 0,σ 2) Y t äralltsåenar)process Time Series Plot of X Man kan skriva Y t = Y t +u t =Y t 2 +u t +u t = Y t 3 +u t +u t +u t 2 = Time = Y 0 + t i= u i ochmaninseratt EY t )=Y 0 VarY t )=tσ 2 alltså är den inte stationär med avseende på variansen.

11 Y t äralltsåensummaavettstartvärdeochensumma avslumpmässigastörningaru t. Vidare ser man effekten av dessa störningarna aldrig dör ut! Men observera att om vi bildar differenser av intilliggandey t fårvi Y t = Y t Y t = Y 0 + t i= u i Y 0 + t i= u i = u t dvs den första ordningens differenser är en serie av slumptermer, vitt brus. Denna serie är staionär eftersom och E Y t )=Eu t )=0 konstant) Var Y t )=Varu t )=σ 2 konstant) och dessutom är dessa oberoende och därmed okorreleradekonstant). Random Walk el Slumpvandring med drift Modifiera RWM-modellen enligt Y t =δ+y t +u t därδärenskdriftparameter ochu t ärsomförutvitt brus. Man kan skriva Y t = δ+y t +u t =2δ+Y t 2 +u t +u t = 3δ+Y t 3 +u t +u t +u t 2 =... = tδ+y 0 + t i= u i ochmaninseratt EY t )=tδ+y 0 VarY t )=tσ 2 alltså är den inte stationär med avseende på väntevärde och varians. Termen tδ i väntevärdet ovan är orskaen till benämningen drift. JulängretidsomgårdestolängrebortfrånY 0 kommer mani förväntan) En RWM-process utan drift däremot förväntas komma tillbakatilly 0 förellersenare. Men i båda fallen ökar variansen. Unit Root Process RVMärexempelpådetsomkallasUnitRootprocesser. Definiera Y t =ρy t +u t dvsenar)process. Omnuρärlikamedett)får vi unit root problem, dvs vi får icke-stationäritet. Definiera B som en bakåtoperator back-shift operator)enligt B k Y t =Y t k Då ser man att tex första differenser kan skrivas enligt Y t =Y t Y t = B)Y t Modellen ovan kan då skrivas som ρb)y t =u t Betrakta ρb) som ett polynom i B. Roten till ekvationen ärförvilkab gällerdetta? ρb=0 Allmänt har man kanske ρ B ρ 2 B 2 ρ 3 B 3... ) =0 Om detta polynom har B = som en lösning får vi unit root problem, dvs icke-sationäritet.

12 Trend- och Differensstationär Trend är den långsamma utvecklingen i en tidserie. Man skiljer på - deterministiska trender helt och hållet förutsägbar) och - stokastiska trender För att formalisera det hela definierar vi följande modell Y t =β 0 +β Y t +β 2 t+u t Ur detta kan vi studera några specialfall: )Antagattβ 0 =β 2 =0ochβ =,dåfårvi Y t =Y t +u t dvsenrvmutandrift. Menkomihågatt Y t =u t är stationär. En RWM är en differensstationär process. 2)Antagattβ 0 0,β =ochβ 2 =0,dåfårvi Y t =β 0 +Y t +u t dvsenrvmmeddrift. Ochvikommerattseentrend uppåtellernedåtberoendepåtecknetpåβ 0.Dettaär en stokastisk trend. 3)Antagattβ 0 0,β =0ochβ 2 0,dåfårvi Y t =Y t =β 0 +β 2 t+u t får man en trendstationär process. Väntevärdet er ej konstant men variansen är konstant. 4)Antagattβ 0 0,β =ochβ 2 0,dåfårvi Y t =β 0 +Y t +β 2 t+u t får man en RWM-process med drift och deterministisk trend. 5)Antagattβ 0 0, β <ochβ 2 0,dåfårvi Y t =β 0 +βy t +β 2 t+u t får man en process med deterministisk trend och stationär AR) komponent. Denna process är stationär runt den deterministiska trenden. Integrerade stokastiska processer En integrerad stokastisk processip) är en process som typiskt är icke-staionär men som efter en bestämt antal differensbildningar är stationär. Man säger att en IP är av ordning d om det krävs d stycken differenser för att bli stationär, eller kort Y t Id) Ex) En RWM är icke-stationär se ovan) men bildas första differenser enligt så är denna stationär. Y t =Y t Y t =u t Egenskaper hos integrerade stokastiska processer ) Om X t Id) så är en linjär transformation av denna integrerad enligt Z t =ax t +b Id) dvs den behåller sin ordning. 2)OmX t Id )ochy t Id 2 )ochd <d 2 så är en linjärkombination av dessa integrerad enligt Z t =ax t +by t +c Id 2 ) dvsdenstörstaavd ochd 2 3) Om X t Id) och Y t Id), dvs samma ordning, så är en linjärkombination av dessa integrerad enligt Z t =ax t +by t +c Id ) därd d,dvsordningenärgenerelltlikameddmen ivissalägenkandenvaralägreochmansägerisåfall attx t ochy t kointegrerar. - Kan bli problem vid regressionsanalyser om prediktor och respons är av olika integrerande ordning. Om tex Y t I0)ochX t I)kanseattvariansenförX t växermedticke-stationär)ochattskattningenförβ går mot noll. - Regressionsanalyser med integrerande processer kan leda till spuriösa resultat tex starkölsförsäljning och antal inskrivna vid universitet).

13 Test för stationäritet Grafiskt: Titta på tidserieplottar. Ser det stationärt ut? Exempel) 2800 Time Series Plot of Xt Skattas med och ˆγ k = ) Y t Ȳ) Y t k Ȳ ˆρ k = ˆγ k ˆγ 0 Plottasedandessaförk=,2,3,...tex n Time Series Plot of Xt ACF för Xt with 5% significance limits for the autocorrelations) Xt t Xt t Autocorrelation,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -, Lag Ökande trendej stationärt medelvärde). Icke stationärt beteende AutokorrelationerACF): Time Series Plot of DiffXt),0 0,8 0,6 ACF för första ordningens differenser av Xt with 5% significance limits for the autocorrelations) ACFvidlaggkdefinieras ρ k = γ k = Cov ) ) Yt,Y t k Yt γ 0 CovY t,y t 0 ) =Cov,Y t k VarY t ) Xt t Autocorrelation 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -, Lag Fortfarande beroende men möjligen stationärt. 0 FöratttestaomACFärsignifikantskildfrånnollmer formellt kan man titta på Ljung-Pierce Q statistika M Q=n ˆρ 2 k k= eller ännu hellre Ljung-Box Q-testLB Q test), M ˆρ 2 Q=nn+2) k n k) k= NollhypotesenivarderafallärH 0 :samtligaautokorrelationerupptilllaggm ärnoll. Unit Root test Vi såg att RWM utan drift var icke-stationär. Vi såg också att den kunde formuleras enligt Y t =Y t +u t B)Y t =u t Vidaresågviattengenerellprocessavdettaslagkan skrivas Y t =ρy t +u t ρb)y t =u t där ρ ochattomρ=såärdetenrwm.nu skriver detta som Y t = Y t Y t =ρy t Y t +u t = ρ )Y t +u t = δy t +u t

14 Frågansomärintressantnuärattavgöraom vilket är ekvivalent med δ=0 eller δ<0 ρ= eller ρ< Om δ = 0 så har vi en enhetsrot unit root) och en RWM och således icke-stationäritet. Dickey-FullerDF) test Gällernäru t ärvittbrusdvsokorreleradeslumptermer. Använd formuleringen Y t =δy t +u t och titta på skattningen av δ. Är denna signifikant skild från noll eller inte? Går ej med vanlig t-test ty teststatistikan är inte t- fördelad utan τ-fördelad tau) vilket kräver speciella tabeller. Vidare måste man ta hänsyn till vilken sorts process det är frågan om: )Y t ärenrwmutandrift 2)Y t ärenrwmmeddrift 3)Y t ärenrwmmeddriftruntenstokastisktrend Beroende vilket som gäller gäller olika kritiska värden från τ-fördelningen. Augmented Dickey-FullerADF) test Omdetfinnskorrelationeriu t finnsenvidareutveckling av DF-testet, ADF. Transformationer Inte så komplicerat, läs själva.

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Föreläsning 7: Stokastiska vektorer

Föreläsning 7: Stokastiska vektorer Föreläsning 7: Stokastiska vektorer Johan Thim johanthim@liuse oktober 8 Repetition Definition Låt X och Y vara stokastiska variabler med EX = µ X, V X = σx, EY = µ Y samt V Y = σy Kovariansen CX, Y definieras

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Lycka till!

Lycka till! Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Något om val mellan olika metoder

Något om val mellan olika metoder Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 y 2 y n Säsonger? Ja Nej Trend? Tidsserieregression Nej ARMA-modeller Enkel exponentiell utjämning Tidsserieregression ARIMA-modeller

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Preliminärt lösningsförslag - omtentamen i Finansiell statistik, Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X]

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Paneldata och instrumentvariabler/2sls

Paneldata och instrumentvariabler/2sls Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller

Läs mer

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent

Läs mer

Stokastiska vektorer

Stokastiska vektorer TNG006 F2 9-05-206 Stokastiska vektorer 2 Kovarians och korrelation Definition 2 Antag att de sv X och Y har väntevärde och standardavvikelse µ X och σ X resp µ Y och σ Y Då kallas för kovariansen mellan

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Stokastiska vektorer och multivariat normalfördelning

Stokastiska vektorer och multivariat normalfördelning Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen

Läs mer

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Stockholms Universitet Statistiska institutionen Patrik Zetterberg Stockholms Universitet Statistiska institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, VT2012 2012-05-31 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1 Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Sannolikheter och kombinatorik

Sannolikheter och kombinatorik Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Matematisk statistik TMS064/TMS063 Tentamen

Matematisk statistik TMS064/TMS063 Tentamen Matematisk statistik TMS64/TMS63 Tentamen 29-8-2 Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

AMatematiska institutionen avd matematisk statistik

AMatematiska institutionen avd matematisk statistik Kungl Tekniska Högskolan AMatematiska institutionen avd matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR B OCH K FREDAGEN DEN 11 JANUARI 2002 KL 14.00 19.00. Examinator: Gunnar

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Uppgift a b c d e Vet inte Poäng

Uppgift a b c d e Vet inte Poäng TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )

Läs mer

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson Det framtida medlemsantalet i svenska kyrkan tycks vara intressant för många, då det regelbundet diskuteras i olika sammanhang. Att kyrkans

Läs mer

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I STATISTIKENS GRUNDER 2 STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-01 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:

Läs mer

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Jointly distributed Joint probability function Marginal probability function Conditional probability function Independence

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

F7 Polynomregression och Dummyvariabler

F7 Polynomregression och Dummyvariabler F7 Polnomregression och Dummvariabler Antag att man börjar med enkel linjär regression. Kap Polnomregression Emellanåt upptäcker man samband som är kvadratiska, kubiska osv. Allmänt: polnom av k:te ordningen

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen

Läs mer

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg. Tentamenskrivning för TMS63, Matematisk Statistik. Onsdag fm den 1 juni, 16, Eklandagatan 86. Examinator: Marina Axelson-Fisk. Tel: 7-88113. Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65 Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson, STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson, 5--9 Lösningförslag skriftlig hemtentamen i Fortsättningskurs i statistik, moment, Statistisk Teori, poäng. Deltentamen : Sannolikhetsteori

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-10-29 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Mykola

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

TMS136. Föreläsning 7

TMS136. Föreläsning 7 TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski FACIT för Förberedelseuppgifter: SF9 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 206 KL 4.00 9.00. Examinator: Timo Koski - - - - - - - - - - - - - - - - - - - - - - - - 0. FACIT Problem

Läs mer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek

Läs mer

Föreläsning 8: Konfidensintervall

Föreläsning 8: Konfidensintervall Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-06-03 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk

Läs mer

TMS136. Föreläsning 13

TMS136. Föreläsning 13 TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer