Statistisk undersökning av utdelningar

Storlek: px
Starta visningen från sidan:

Download "Statistisk undersökning av utdelningar"

Transkript

1 ! " # $ % & ' ( ) * ' +, -. / 0 1 ( 2 '. 3 ' 4 2 ( 2. * ' - 5

2 Statistisk undersökning av utdelningar En jämförelse mellan olika branscher i Sverige WILMER LÖFGREN SINA MOZAYYAN Civilingenjör Teknisk fysik Datum: 31 maj 2017 Handledare: Thomas Önskog Examinator: Henrik Hult Engelsk titel: Comparing Dividends from Swedish Companies Skolan för teknikvetenskap

3

4 iii Sammanfattning Varje år delar aktiebolag i Sverige ut stora summor pengar i form av aktieutdelningar. Storleken på ett företags utdelningar anses bland många aktiesparare vara en viktigt faktor då de avgör om de ska köpa aktier i företaget. Det är ett stort beslut för ett företag när de bestämmer vilken utdelning de vill ge, och det är ett beslut som tvingar företaget att ta hänsyn till många faktorer. En stor utdelning kan göra företagets aktier mer attraktiva, men leder till att företaget har mindre eget kapital att använda för exempelvis produktutveckling och andra investeringar. I detta examensarbete inom matematisk statistisk görs en multipel linjär regressionanalys för att modellera direktavkastningen, d.v.s. utdelning dividerat med aktiekurs, för stora svenska företag verksamma inom fastighet och finans (FF); teknologi, hälsa och telekom (THT) och industri. En regressionsmodell gjordes för vardera av dessa tre företagsgrupper, och statistiska test utfördes för att bedöma hur bra dessa modeller beskriver relationen mellan direktavkastning och de företagsvariabler som användes som förklarande variabler. Studiens resultat visar att regressionsmodellen som gjordes för företag inom fastighet och finans är bättre än de som gjordes för industri och teknologi, hälsa och telekom. Nyckelord: Utdelning, Direktavkastning, Regressionsanalys, Statistiska tester, Signaleringsteori, Agentteori, Irrelevansteori,

5 iv Abstract Dividends are of great interest to many, and their impact is felt by shareholders and companies all around the world. Among shareholders dividends are often viewed as being positive. When a company makes decisions regarding their dividend policy there is a lot they have to consider. A large dividend could make the company s shares more attractive, but a large dividend will also mean that the company has less capital to fund product development and other investments. In this study in mathematical statistics, multiple linear regression is used to model the dividend yield, i.e. dividend divided by share price, for large Swedish companies active in three sectors: finance and property; technology, health and telecom, and industry. A regression model was made for each of these three sectors, and statistical tests were conducted to assess how well these models describe the relationship between dividend yield and the variables used as dependent variables. Of the final three models that the study resulted in, the model made for companies in the financial and property sectors fitted the data the best. Keywords: Dividend, Dividend Yield, Regression Analysis, Statistical Tests, Signaling Theory, Agent Theory, Irrelevance Theory,

6 Innehåll 1 Inledning Bakgrund Frågeställning Avgränsningar Syfte och målgrupp Aktieutdelningar Utdelningar Irrelevansteorin Agentteorin Signaleringsteorin och liknande teorier Regressionsanalys Multipel linjär regression Minstakvadratmetoden Antaganden och modellförbättring Heteroskedasticitet Endogenitet Autokorrelation Icke-linjära förhållanden Multikollinearitet Statistiska test av en regressionsmodell Förklaringsvärdet R t-test F-test AIC VIF Residualplot och Durbin-Watson test Normal Q-Q plot v

7 vi INNEHÅLL 4 Metod Tidigare studier Val av företag Val av variabler Resultat och analys Ursprungsmodell Reviderad modell - Fastighet och finans Reviderad modell - Industriella företag Reviderad modell - Företag inom THT Slutsats och diskussion Diskussion Slutsats Litteratur 38 A Lista över företag 39

8 Kapitel 1 Inledning 1.1 Bakgrund Under 2017 kommer de svenska börsbolagen dela ut 187 miljarder SEK i form av utdelningar [3]. De stora mängder pengar som varje år ges i utdelningar har en direkt påverkan på ekonomin för företagen som ger dem och för de aktieägare som tar del av dem. Beloppet på vad ett företag ger som utdelning kan antas bero på flera egenskaper och kvantitativa variabler hos företaget i fråga. För analytiker och aktieägare kan det vara av intresse att ha en djupare förståelse för hur företagsvariabler påverkar beloppet av en utdelning. I denna rapport utförs multipel linjär regressionsanalys för att finna matematiska modeller för direktavkastningen av aktieutdelningar från tre olika företagsgrupper, företag inom fastighet och finans (FF), industriella företag och företag inom teknologi, hälsa och telekom (THT). 1.2 Frågeställning Detta projektarbete strävar efter att undersöka hur direktavkastningen av aktieutdelningar påverkas av egenskaper och kvantitativa variabler hos företagen som ger den. Bland de kvantitativa variablerna som används i studien ingår bland annat vinst och belåning, men inte tidigare utdelningar. Studiens breda frågeställning har begränsats till större svenska företag som tillhör fastighet- och finanssektorerna; teknologi-, hälsa- och telekomsektorerna och industrisektorn. 1

9 2 KAPITEL 1. INLEDNING Vidare har frågeställningen delats upp i två mindre frågeställningar för att göra den mer gripbar. Den första av dessa två frågeställningar är vilka variabler hos företag som har positiv respektive negativ inverkan på storleken av aktieutdelningar. Den andra frågeställningen är om inverkan av dessa variabler på ett företags utdelningsnivå skiljer sig åt beroende på vilken av de tre grupperna företaget tillhör. 1.3 Avgränsningar Den här studien är begränsad till svenska företag som är listade och listade på Nasdaq Nordic. Vidare begränsas studien till företag som på denna börs kategoriserar som att tillhöra Large Cap och som att tillhöra följande sektorer: fastighet, finans, industri, teknologi, hälsa och telekom. 1.4 Syfte och målgrupp Syftet med denna studie är att besvara studiens frågeställning om vilka faktorer som påverkar direktavkastningen av utdelningar från svenska företag verksamma inom tre olika företagsgrupper. Därmed utvecklas tre matematiskt modeller, en för vardera företagsgrupp, för hur direktavkasntingen av aktieutdelningar beror på dessa faktorer. Matematisk modeller för utdelningar kan vara av intresse för de som handlar med aktier, och även för företagen som ger dem. Eftersom modellerna som presenteras i denna rapport inte tar hänsyn till tidigare utdelningar kan de vara till nytta för ett aktiebolag som vill ge en utdelning men inte gett någon tidigare, eller inte gett någon på länge.

10 Kapitel 2 Aktieutdelningar 2.1 Utdelningar En aktieutdelning innebär att ett aktiebolag tar från sitt fria kapital och betalar sina aktieägare. Svenska företag som ger aktieutdelningar gör det i regel en gång per år, men två utdelningar per år är också vanligt. Många företag ger inte utdelningar, och ibland tvingar en försämrad ekonomisk situation företag som brukar ge utdelningar att inte göra det. Det tillskott av pengar som en utdelning innebär för aktieägare gör frågan om ett aktiebolag ger utdelningar, och hur stora de då är, intressant för många. Utöver det direkta sättet att ange storleken på en utdelning, antalet kronor som ges per aktie, kan andra mått användas för att ta hänsyn till faktorer hos företaget eller marknaden. Två sådana mått är direktavkastning (på engelska dividend yield) som definieras som utdelning per aktie dividerat med aktiepriset, och utdelningsgrad (på engelska dividend payout ratio) som definieras som den totala summan som företaget betalar i utdelningar dividerat med företagets nettovinst. I detta arbete undersöks hur direktavkastningen påverkas av företagsvariabler. Frågan om utdelningar är någonting positivt har inget entydigt svar. Istället för att ge utdelningar eller exempelvis investera i produktutveckling väljer en del företag att köpa tillbaka aktier. Genom att köpa tillbaka aktier och makulera dessa, höjer företaget värdet på de aktier som finns kvar då dessa kommer representera en större andel av företaget. Detta motsvarar en indirekt utdelning till aktieägarna då deras aktier ökar i värde. Ytterst ligger beslutet om en utdelning ska ges, och hur stor den då ska vara, av bolagstämman[7]. 3

11 4 KAPITEL 2. AKTIEUTDELNINGAR Det finns många avvägningar som måste göras då beslutet om en utdelningen fattas. Under de nästkommande underrubrikerna presenteras olika teorier om utdelningar och hur företag resonerar när de ger dem. 2.2 Irrelevansteorin Irrelevansteorin formulerades i en artikel 1961 av Miller och Modigliani, och den kan sammanfattas som att utdelningar i längden är irrelevanta för aktieägare[10]. Genom att utgå från idealiserad marknad, där man bland annat kan bortse från skatter och anta att alla har tillgång till samma information, argumenterar Miller och Modigliani för att ett företags värde inte påverkas av deras utdelningspolicy. Det är därför irrelevant för aktieägare om de får utdelningar eller inte, då värdet av deras aktieinnehav inte påverkas. Vidare för Miller och Modigliani fram argumentet att aktieägare själva kan styra över utdelningar. Aktieägare som vill ha en utdelning kan skapa en genom sälja en andel av sina aktier, och aktieägare som inte vill ha en utdelning, eller tycker att en utdelning är för stor, kan använda utdelningskapitalet för att köpa aktier. Miller och Modigliani anser följaktligen att företag inte ska prioritera utdelningar. Deras irrelevansteori har fått stort genomslag och deras artikel blir än idag ofta citerad. Modigliani fick 1985 Riksbankens pris i ekonomisk vetenskap till Alfred Nobels minne (ofta kallat Nobelpriset i ekonomi) för sina bidrag till ekonomisk vetenskap. Det är dock viktigt att ha i åtanke att teorin utgår ifrån en idealiserad marknad och att det därför kan vara svårt att tillämpa den i verkligheten. 2.3 Agentteorin Inom ekonomi och andra samhällsvetenskapliga discipliner är ett principalagent-problem en situation då någon, en agent, fattar beslut för någon annan, och agenten motiveras av skäl som gynnar den själv men som inte gynnar den som representeras av agenten. För ett aktiebolag finns en risk för att principal-agent-problem uppstår om företagets ledning har för stor kontroll över företagets kapital. Om detta leder till utgifter som i annat fall kunnat undvikas kallas dessa för agentkostnader.[5]

12 KAPITEL 2. AKTIEUTDELNINGAR 5 Om företaget betalar utdelningar och därför har mindre eget fritt kapital tvingas ledningen finansiera investeringar med exempelvis lån. Detta kan medföra att ledningen hushåller bättre med företagets resurser, och att agentkostnader därför minimeras. Agentteorin motsäger därför direkt irrelevansteorin, och säger att utdelningar kan ha en direkt inverkan på ett aktiebolags värde. 2.4 Signaleringsteorin och liknande teorier Signaleringsteorin baseras på att utdelningar kan ses som ett sätt för ett aktiebolag att ge information till dess aktieägare. Storleken på utdelningar kan tolkas som ett sätt för företaget att signalera hur företaget ser på dess finansiella situation. Ursprunget till signaleringsteorin kommer från en artikel av Lintner[8]. Han studerade hur ett aktiebolags utdelningspolicy påverkas priset av deras aktier. Bhattacharya utgick i en studie som publicerades 1979 ifrån signaleringsteori och argumenterade för att asymmetrisk information gör att utdelningar är viktiga[1]. Med asymmetrisk information menas att företagsledning kan ha bättre kännedom än aktieägarna om hur företaget förväntas prestera framöver. Lintner fann att bland annat vinst, investeringsmöjligheter och kassaflöden är viktiga variabler som påverkar aktieutdelningar. Utifrån signaleringsteorin formulerade Lintner även utjämningsteorin[8]. Denna teori konstaterar att företag ofta strävar efter att ge utdelningar som håller en jämn nivå, och följer företagens vinstuteckling på lång sikt. Tanken med en sådan strategi är att försöka undvika situationer där utdelningsnivån måste sänkas från föregående år, då en sådan sänkning kan signalera att det går sämre än väntat för företaget. Lintner argumenterar därför för att företag bara ska öka sina utdelningar om de är säkra på att de kommer kunna fortsätta lika stora utdelningar framöver. En annan teori som berör hur utdelningar kan vara informationsbärande är pecking order-teorin[9]. Enligt denna teori kan en låg utdelningsgrad signalera att företaget anser sig ha många möjliga investeringar. Anledningen till detta är att företag vill finansiera investeringar med interna medel istället för exempelvis lån som medför extra kostnader. När företaget beslutar hur dess resurser ska fördelas kommer därför investeringar att vara högre prioriterade än utdelningar.

13 Kapitel 3 Regressionsanalys 3.1 Multipel linjär regression Inom matematisk statistik betyder regression i dess bredaste bemärkelse att man försöker finna hur olika variabler eventuellt beror av varandra. I regel söker man ett uttryck för en variabel, den beroende variabeln, som är en funktion av en eller flera andra variabler, de oberoende variablerna. Den beroende variabeln och de oberoende variablerna kallas också ofta responsvariabel respektive förklarande variabler. De oberoende variablerna kan vidare delas upp i kvantitativa och dummy-variabler. En kvantitativ variabel antar de värden som fås genom observationer av den. En dummy-variabel är kategorisk och kan anta värdet 0 eller 1, och detta svarar mot att en observation saknar eller uppfyller en viss egenskap. Som namnet antyder menas med linjär regression att man försöker hitta en linjär funktion av de oberoende variablerna som kommer så nära som möjligt till att vara ett exakt uttryck för den beroende variabeln. Man särskiljer mellan enkel linjär och multipel linjär regression. Skillnaden ligger i att enkel regression bara har en oberoende variabel. I detta arbete använder vi oss av multipel linjär regression. Vår beroende variabel är direktavkastningen av utdelningen, det vill säga utdelningen per aktie dividerat med aktiepriset, och våra oberoende variabler är egenskaper och kvantitativa storheter hos de företag som ger dessa utdelningar. 6

14 KAPITEL 3. REGRESSIONSANALYS 7 Den matematiska modellen som en multipel linjär regression ger upphov till är att varje uppmätt värde av den beroende variabeln sätts till att vara lika med en summa av de motsvarande uppmätta oberoende variablerna med olika koefficienter, en konstant term och en residual. Detta kan enkelt skrivas på följande sätt. Y j = α + k β i x ij + e j j = 1,..., n (3.1) i=1 Här är Y j det j:te uppmätta värdet av den beroende variabeln. x ij är det j:te uppmätta värdet av den i:te oberoende variabeln, och β i är koefficienten till denna variabel. α är den konstanta termen, och e j är residualen dvs feltermen för den j:te mätpunkten. Den matematiska modellen anpassas till data genom att α och alla β i skattas. Det finns olika tillvägagångssätt för att skatta dessa, men det vanligaste är att Ordinary least squares (OLS), på svenska minstakvadratmetoden, används. 3.2 Minstakvadratmetoden För att anpassa en multipel linjär regressionmodell till en datamängd används i regel Ordinary Least Squares (OLS). Metoden kallas på svenska minstakvadratmetoden. Den är enkel och givet vissa antaganden är den även den matematiskt mest korrekta enligt Gauss-Markovs sats. Denna sats säger att OLS är Best Linear Unbiased Estimatior (BLUE) då dessa antagaden är uppfyllda. Med detta menas att OLS är den väntevärdesriktiga linjära estimator som har den minsta variansen[6]. De antagaden som krävs presenteras i nästa delkapitel, Antagaden och modellförbättring. Minstakvadratmetoden innebär att α och β i från ekvation (3.1) skattas genom att den nedanstående summan av de kvadrerade residualerna minimeras. n (e j ) 2 (3.2) j=1 Genom att kvadrera residualerna innan de summeras säkerställs att positiva och negativa residualer inte tar ut varandra. Vidare leder kvadrering till att stora och små e j viktas så att de blir mer respektive mindre betydelsefulla.

15 8 KAPITEL 3. REGRESSIONSANALYS För att implementera minstakvadratmetoden skrivs först ekvation (3.1) på matrisform. Sedan används metoder från linjär algebra för att finna de koeffecienter som minimerar summa (3.2). y 1 Y =. y n X = Y = X β + e (3.3) 1 x 11 x k1 α 1 x 12 x k β 1 e 1 β =. e =. e 1 x 1n x n kn I IR n ges summa (3.2) av det kvadrerade avståndet mellan Y och X β. Givet att att kolumnerna i X är linjärt oberoende kommer de att spänna upp ett underrum W till IR n. Summan (3.2) kan därför minimeras genom att β skattas till att vara ˆβ givet att X ˆβ är den vektor i W som ligger närmast Y. Denna vektor fås genom att projicera Y på W. Efter denna projicering kommer e att vara ortogonal mot alla vektorer i W. Med omskrivningen e = Y X ˆβ fås då följande. β n X ( Y X ˆβ) = 0 (3.4) Då kolumnerna i X är linjärt oberoende kommer X X vara en inverterbar matris och ˆβ kan lösas ut ur ekvation (3.4). ˆβ = (X X) 1 X Y (3.5) 3.3 Antaganden och modellförbättring För att kunna använda sig av multipel linjär regression, och anpassa en sådan regressionsmodell med minstakvadratmetoden, krävs att man gör antaganden om den data som analyseras. Dessa antaganden krävs dels för att den linjära regressionsmodellen ska vara rimligt, och dels för att minstakvadratmetoden ska vara ett aktuellt tillvägagångssätt för att anpassa modellen till data. I de nedanstående tabellerna, 3.1 och 3.2, presenteras de antaganden som görs. De nästkommande underrubrikerna sammanfattar eventuella avvikelser från dessa antaganden och hur regressionsmodellen kan anpassas för att hantera sådana avvikelser.

16 KAPITEL 3. REGRESSIONSANALYS 9 Nästa delkaptiel, Statistiska test av regressionsmodellen, sammanfattar metoder för att upptäcka avvikelser från antagandena, och metoder för att avgöra hur väl regressionsmodellen beskriver relationen mellan den beroende variabeln och de oberoende variablerna. Tabell 3.1: Antaganden om e j Antagande Normalfördelad residual Homoskedasticitet Exogenitet Sammanfattning Residualen antas tillhöra en normalfördelning. Residualen antas ha en konstant varians. Residualen antas vara oberoende av de andra variablerna och ha väntevärdet noll. Residualerna antas vara oberoende av varandra. Tabell 3.2: Antaganden om Y och X Ingen autokorrelation Antagande Linjär funktion Ingen multikollinearitet Sammanfattning Den beroende variabeln antas vara en linjär funktion av de oberoende variablerna och en felterm. De oberoende variablerna antas vara linjärt oberoende av varandra Heteroskedasticitet Om variansen av residualen inte är konstant utan är olika hos olika subpopulationer av e uppstår heteroskedasticitet. Då kommer inte OLS vara BLUE och till följd av detta kan standardavvikelser som tas fram med OLS vara inkorrekta. Detta är ett problem som kan vara svårt att lösa.

17 10 KAPITEL 3. REGRESSIONSANALYS En metod för att hantera heteroskedasticietet om man har en stor datamängd är att använda White s Heteroscedasticity-Consistent Variances and Standard Errors som tar heteroskedasticitet i beaktning när standardavvikelserna beräknas[6] Endogenitet Om residualen inte har väntevärdet noll och beror på en eller flera av de oberoende variablerna uppstår endogenitet. Detta medför att estimaten som görs med OLS blir inkonsekventa. Det finns många möjliga anledningarna till att endogenitet kan uppstå. Exempelvis kan mätfel av de oberoende variablerna leda till att endogenitet uppstår. En annan möjlig orsak till endogenitet är att relevanta variabler inte har tagits med i regressionsmodellen. Den inverkan som sådana bortglömda variabler skulle ha på den beroende variabeln kommer då istället hamna i residualen[6] Autokorrelation Med autokorrelation menas att en felterm e j beror av en eller flera andra feltermer. Detta påverkar effektiviteten av OLS och vanliga statistiska test av regressionsmodellen kommer då inte med säkerhet vara giltiga. Autokorrelation kan vara svårt att åtgärda, men en vanlig metod är att anta att varje felterm e j är linjärt beroende av den tidigare feltermen e j 1. Om detta antagande är riktigt kan autokorrelationen hanteras genom att Generalized Least Squares (GLS) används istället för OLS[6] Icke-linjära förhållanden Om den beroende variabeln inte är en linjär funktion av de oberoende variablerna, utan exempelvis beror på kvadraten av en av de oberoende variablerna eller produkten av två av de oberoende variablerna, så kommer en linjär regressionsmodell inte vara giltig. Eventuella ickelinjära förhållanden kan dock hanteras genom att regressionsmodellen transformeras. En icke-linjära regressionsmodell kan göras linjär genom att den logaritmeras[6].

18 KAPITEL 3. REGRESSIONSANALYS Multikollinearitet För att multipel linjär regressionsmodell ska vara tillämpbar krävs att modellens oberoende variabler är linjärt oberoende. Om de inte är det uppstår multikollinearitet, och detta medför att standardavvikelserna för regressionskoefficienterna kan bli väldigt stora. Det finns flera sätt att hantera multikollinearitet. Man kan exempelvis addera de variabler som är korrelerade och på så vis att skapa en ny oberoende variabel. Ett annat alternativ är att ta bort alla utom en av de variabler som är starkt korrelerade med varandra[6]. 3.4 Statistiska test av en regressionsmodell Förklaringsvärdet R 2 För att bedöma hur väl en linjär regressionsmodell förklarar sambandet mellan den beroende variabeln och de oberoende variablerna kan förklaringsvärdet R 2 beräknas. Detta värde ligger mellan 0 och 1, och det anger hur väl den framtagna regressionslinjen passar datapunkterna. Förklaringsvärdet blir större ju bättre regressionsmodellen är. Definitionen av förklaringsvärdet ges av följande ekvation, där Ȳ är medelvärdet av den beroende variabeln Y. n R 2 j=1 1 (e j) 2 n j=1 (Y j Ȳ (3.6) )2 Det finns även ett justerat förklaringsvärde Radj 2 som utgår från R2 men som även beaktar antalet oberoende variabler och storleken på den datamängd som analyseras. Anledningen till att Radj 2 kan vara av intresse är att R 2 kan öka till följd av slumpen om antalet oberoende variabler ökas. Radj 2 definieras av nedanstående ekvation där p är antalet oberoende variabler och n är antalet datapunkter[6]. Radj 2 R 2 (1 R 2 p ) n p 1 (3.7)

19 12 KAPITEL 3. REGRESSIONSANALYS t-test För att avgöra signifikansen av en oberoende variabel kan ett t-test utföras. Då testas hypotesen att koefficienten β j som tillhör denna variabel är lika med noll. Detta skulle innebära att denna variabel inte påverkar den beroende variabeln. För utföra ett t-test med hypotesen β j = β 0 beräknas följande där SE() betecknar standardavvikelse[6]. t j = ˆβ j β 0 SE( ˆβ j ) (3.8) t j tillhör en t-fördelning med n k frihetsgrader där n är antalet observationer och k är antalet oberoende variabler. Sedan beräknas P- värdet, vilket anger sannolikheten att en stokastisk variabel som tillhör en t-fördelning med n k frihetsgrader ska vara större än t j. Blir detta större än den signifikansnivå som eftersträvas måste hypotesen att β j = β 0 förkastas F -test Med ett F-test kan man bland annat bestämma signifikansen för en hel regressionsmodell. Det påminner om ett t-test, men istället för att testa hypotesen att en regressionskoefficient är noll testas istället hypotesen att alla regressionskoefficienter är noll. För att utföra ett F-test beräknas F med nedanstående formel. F presenteras i regel i en ANOVAtabell (ANOVA står för analysis of variance). F = ESS/(k 1) RSS/(n k) (3.9) ESS = n (Ŷj Ȳ )2 RSS = j=1 n (Y j Ŷj) 2 F tillhör en F-fördelning med n k frihetsgrader där n är antalet observationer och k är antalet oberoende variabler. Efter att F har beräknas så tas P-värdet fram på liknande sätt som det görs vid ett t-test[6]. j=1

20 KAPITEL 3. REGRESSIONSANALYS AIC Akaike Information Criterion (AIC) är en metod som liknar Radj 2, och som används för att bedöma hur bra en statistisk modell är. AIC tar likt Radj 2 hänsyn till införandet av nya förklarande variabler[6]. AIC definieras enligt nedanstående ekvation. û2 AIC = exp (2k/n) i n = exp (2k/n) RSS n (3.10) Här är k antalet förklarande variabler, n antalet mätpunkter och RSS är summan av de kvadrerade residualerna. Till skillnad från förklaringsvärdena R 2 adj och R2 så medför ett lägre AIC en bättre modell[6] VIF En metod för att avgöra om det finns multikollinearitet hos de oberoende variablerna i regressionsmodellen är Variance Inflation Factor (VIF). Med denna metod görs en regressionsmodell där den j:te oberoende variablen sätts till att vara en beroende variabel av de andra oberoende variablerna. Sedan beräknas R 2 j för denna modell, och VIF j beräknas enligt följande ekvation[6]. VIF j = 1 1 R 2 j (3.11) Ett stort VIF j tyder på att den j:te oberoende variabeln i stor utsträckning korrelerar med en eller flera av de andra oberoende variablerna. En vanlig tumregel är att ett VIF-värde över 10 innebär att en för stark multikollinearitet finns Residualplot och Durbin-Watson test I en residualplot presenteras feltermerna i en graf och av denna kan eventuella mönster i residualen upptäckas. En residualplot är en bra metod för att avgöra om homoskedasticitet föreligger, och om det finns någon autokorrelation. Om feltermerna inte är slumpmässigt spridda kring den horisontella axeln i grafen kan man misstänka att feltermernas varians inte är konstant eller att feltermerna beror av varandra[6].

21 14 KAPITEL 3. REGRESSIONSANALYS En annan metod för att upptäcka autokorrelation är att utföra ett Durbin-Watson test. För att utföra testet beräknas nedanstående kvot[6]. Denna kvot ligger i intervallet 0 d 4. Om värdet ligger mellan 0 och 1 indikerar detta positiv autokorrelation, och om det ligger mellan 3 och 4 indikeras negativ autokorrelation[4]. d = t=n t=2 (ê t ê t 1 ) 2 t=n t=2 (ê t) 2 (3.12) För att ett Durbin-Watson test ska vara riktigt krävs att flera antaganden är uppfylla, bland annat att modellen är utformad som en autoregressiv modell och att residualen är normalfördelad Normal Q-Q plot För att undersöka om feltermerna är normalfördelade kan en normal quantile-quantile plot göras. I en Q-Q plot jämförs två sannolikhetsfördelningar genom att deras kvantiler plottas mot varandra. I en normal Q-Q plot ges y-värdena av de standardiserade feltermerna medan x- värdena ges av de teoretiska kvantilerna för en normalfördelning. Om residualen är normalfördelad bör detta ge en rät linje, och en normal Q-Q plot som inte ger en rät linje tolkas därför som ett tecken på att antagandet om normalfördelade feltermer inte är uppfyllt[6].

22 Kapitel 4 Metod Som tidigare har nämnts finns det flera förklarande variabler som kan antas förklara direktavkastningen, det vill säga kvoten mellan beloppet på utdelningen och den nuvarande aktiekursen, för ett aktiebolag. Som första steg inom modelleringen valdes ett fjorton olika förklarande variabler som antingen var kopplade till företagets balansräkning eller var aktiekursrelaterade. Samtidigt som detta gjordes det även en avgränsning av vilka företag som skulle undersökas. Innan detta arbete kunde påbörjas behövdes dock en granskning av tidigare studier som gjorts, och vad dessa studier hade för resultat. 4.1 Tidigare studier Många studier som berör aktieutdelningar har gjorts, och flera teorier om dem har formulerats. Några av dessa teorier sammanfattas i kapitel 2, Aktieutdelningar. För att kunna sätta denna rapport i perspektiv till tidigare forskning är det dock nödvändigt att även titta på tidigare studier som, precis som detta arbete, analyserar hur olika faktorer faktiskt påverkar utdelningar. En sådan studie publicerades 2011 av Al Shabibi och Ramesh[12]. I deras studie använde de sig av multipel linjär regressionsanalys för att undersöka utdelningspolicyn under 2007 för 90 brittiska företag som inte tillhör finanssektorn. De delade upp de oberoende variabler de använde sig av i två olika typer. Den ena typen var sådant som berör företagens ledning, exempelvis storlek på styrelsen och hur stort inflytande styrelsen har. Den andra typen var företagsfaktorer som ex- 15

23 16 KAPITEL 4. METOD empelvis företagets storlek, belåningsgrad och tillväxt. Bland företagsfaktorerna fann de att företagsstorlek och vinst har en positiv effekt på utdelningar. Detta kan tolkas som en bekräftelse av både signaleringsteorin. En ökad vinst bör enligt signaleringsteorin leda till en ökad utdelning. En ökad företagsstorlek kan lätt medföra en mer komplicerad hierarki, och detta kan eventuellt öka risken för agentkostnader. Studiens resultat kan därför också tolkas som att företagen vill minimera agentkostnader. Vidare fann Al Shabibi och Ramesh att även risk har en positiv inverkan på utdelningar. Med risk menas ett kvantitativt mått av hur instabilt ett företags inkomster är. De fann även att faktorer som berör företagets ledning har inverkan på utdelningar. Bland annat fann de att ett ökat inflytande för företagsstyrelsen har en positiv effekt på utdelningar. 4.2 Val av företag Enligt den senaste uppdateringen av företagsregistret finns det över aktiebolag i Sverige[2]. Av dessa valdes de bolag som är registrerade på Nasdaq OMXNordic och som tillhör Large Cap, det vill säga storbolagslistan som definieras som de företag har ett börsvärde på över en miljard e[11]. För att kunna besvara frågeställningen om hur utdelningsnivån påverkas av vilken sektor ett företag tillhör valdes företag från tre huvudgrupper. Dessa grupper skapades med hjälp av den sektorindelning som Nasdaq använder för att klassificerar företagen. Tillslut valdes 14 stycken företag inom fastighets- och finanssektorn, 15 stycken företag inom industrisektorn och 10 stycken företag inom de innovativa sektorerna teknologi, hälsa och telekom.

24 KAPITEL 4. METOD Val av variabler Den första svårigheten man möts av när man ska utföra en regressionanalys är valet av vilka variabler som ska ingå i regressionsmodellen. Eftersom beloppet på vad ett företag ger för utdelning är ofta korrelerat med aktiekursen valdes direktavkastningen som den beroende variabeln. Med direktavkasning menas utdelningsbeloppet per aktie dividerat med aktiekursen. Medan datainsamlingen pågick undersöktes korrelationen mellan de förklarande variabler som eventuellt skulle ingå i regressionsmodellen och direktavkastningen. En fördel med detta tillvägagångssätt är att man kontinuerligt testar om den data man samlar in bör vara signifikant i den slutgiltiga regressionsanalysen. Första modellen som presenteras i rapporten består av 14 förklarande variabler se tabell 4.1. För att öka signifikansnivån för modellen och för att effektivisera datainsamlingen valdes att samla data för flera år. För de allra flesta företagen valdes åren I och med detta har man paneldata som både består av cross section data det vill säga information från varje företag vid en viss tidpunkt samt tidsseriedata för de tidigare sex åren. Det bör noteras att seriedata ökar risken för positiv autokorrelation[6]. Det beslutades att vikta x1, x2, x3 och x14 genom att dividera dem med N för att få mer homogena variabler. Dessa nya viktade variabler döptes till s1, s2, s3 och s14

25 18 KAPITEL 4. METOD Tabell 4.1: De 14 förklarande variabler som används i modell 1 och symboler för antal aktier och företagsgrupp Variabel Beskrivning x1 Summa långfristiga skulder Långfristiga skulder är skulder som inte förfaller inom ett år x2 Summa kortfristiga skulder Kortfristiga skulder är de skulder som förfaller inom ett år x3 Summa eget kapital och skulder Företagets totala tillgångar x4 Omsättning/aktie Företagets intäkter dividerat med antal aktier x5 Vinst/aktie (Nettointäkt-Utdelningskostnad)/Antal aktier x6 Eget kapital/aktie Företagets egna medel dividerat med antal aktier x7 Balans/aktie Företagets anläggningstillgångar dividerat med antal aktier x8 P/E-tal Aktiekursen dividerat med Vinst/aktie x9 P/S-tal Aktiekursen dividerat med Omsättning/aktie x10 Effektivavkastning(%) Den procentuella avkastningen under året till följd av ändrad aktiekurs och utdelning x11 P/Kassaflöde Aktiekursen dividerat med Kassaflöde/aktie x12 P/Eget kapital Aktiekursen dividerat med Eget kapital/aktie x13 Kassaflöde/aktie Företagets intäkter av likvida medel dividerat med antal aktier x14 Börsvärde Det totala värdet av alla företagets aktier givet aktiekursen N Antal aktier Totala antalet aktier som finns i företaget G Företagsgrupp Om företaget tillhör FF, industri eller THT

26 Kapitel 5 Resultat och analys Efter att data samlats in enligt det tillvägagångssätt som förklaras i kapitel 4 kunde regressionsanalysen påbörjas. Som ursprungsmodell valdes en multilinjär regressionsmodell med samtliga 14 förklarande variabler. Detta gjordes för hela populationen och för varje enskild företagsgrupp, det vill säga för företagen inom fastighet och finans (FFföretag), de industriella företagen och företagen inom teknologi, hälsa och telekom (THT-företag). För att bedöma hur väl modellen stämde överens med data användes följande kriterier: I första hand bedömes modellens signifikansnivå genom F-test, förklaringvärdet samt AIC. Senare reviderades modellerna för varje företagsgrupp genom att stegvis utesluta förklarande variabler som inte var signifikanta enligt t-test och hade ett VIFvärde lägre än 10 och samtidigt minimiera AIC. Vi valde signifikansnivån 5% 5.1 Ursprungsmodell Som urspungsmodell valdes en regressionsmodell med direktavkastningen som oberoende variabel och de 14 tidigare nämnda förklarande variablerna, se tabell 4.1. Y i = α β i s i + β i x i + β 14 s 14 + e i (5.1) i=1 i=4 I tabell 5.1 ser man en sammanställning av regressionsanalysen för hela populationen och även för varje delpopulation. Man kan i kor- 19

27 20 KAPITEL 5. RESULTAT OCH ANALYS ta drag dra slutsatsen att modellen i sin ursprungform, ekvation (5.1), är signifikant för hela populationen och även för varje delpopulation. Tabell 5.1: Resultat från ursprungsmodellen för alla företag och även för varje företagsgrupp Total FF Industri THT n F-värde P-värde <.0001 <.0001 < R R 2 adj AIC I tabell 5.2 presenteras motsvarande P-värde från t-testet där alla P- värden som översteg 0.2 markeras med färg. Värt att observera förklarande variablers ändras beroende på vilka andra variabler som finns med i modellen. Revideringar som görs framöver är för att sträva efter signifikansnivån 5%. Tabell 5.2: Signifikansnivå från t-test för ursprungsmodellen, gråa celler 0.2 < P < 0.4, blåa celler 0.4 < P < 0.8 och röda celler 0.8 < P < 1.0 Total FF Industri THT α <.0001 <.0001 <.0001 <.0001 s s s x x x x7 <.0001 < x x x x x x s

28 KAPITEL 5. RESULTAT OCH ANALYS 21 Ursprungsmodellen i sin helthet modellerar verkligheten på ett bra sätt. Med en signifikansnivå på mindre än 10 4 kan vi dra slutsatsen att åtminstone en av de förklarande variablerna är skild från noll. För företagen i THT har vi en jämförelsevis hög signifikansnivå Förklaringsvärdet och det justerade förklaringsvärdet för de olika grupperna skiljer sig markant, och detta tyder på att de förklarande variablerna förklarar direktavkastningen i olika utsträckning för de tre företagsgrupperna. Exempelvis variabel x9, företagens P/S-värde, är insignifikant för alla modeller utom den för industriföretag. Variabel x11, P/Kassaflöde, är inte signifikant i någon av grupperna. Notera att signifikansnivåerna för olika variabler är proportionella sinsemellan, det vill säga om man tar bort en variabel kan en variabel som tidigare inte var signifikant bli signifikant, eller motsatsen att en variabel som var signifikant blir insignifikant. Man behöver därför utföra en stegvis modellrevidering och ta hänsyn till dessa eventuella effekter av att ta bort förklarande variabler. Vid modellrevideringarna togs därför de variabler med P-värden över 0.2 bort en efter en, och efter varje borttagning av en variabel togs nya P-värden fram. Sedan användes samma procedur för variabler med P-värde över Signifikansnivån som eftersträvades var alltså 5 %. Vidare eftersträvades ett minimalt AIC. Det är värt att observera att detta inte är en komplett modellvalidering då homoskedasticitet och multikollinearitet inte har undersökts, men detta görs för de reviderade modellerna för var och en av dessa grupper.

29 22 KAPITEL 5. RESULTAT OCH ANALYS 5.2 Reviderad modell - Fastighet och finans Genom att utgå från resultatet som sammanfattas i tabell 5.2 reviderades modellen för företag inom fastighet- och finanssektorn. I tabellen kan man se att variablerna s 2, s 4, x 5, x 8, x 9, x 10, x 11, s 14 inte var signifikanta då deras P-värden överstiger 0.2. Dessa variabler togs bort en efter en, och efter varje borttagning av en variabel togs nya P-värden fram. Denna procedur upprepades tills alla variabler hade ett P-värde under Signifikansnivån som eftersträvades var alltså 5 %. Detta medförde att även x 13 togs bort från den slutgiltiga modellen. Utöver denna signifikansnivå eftersträvades också att minimera AIC. I tabell (5.7) kan man se en sammanställning av hur bl.a. förklaringsvärdet och AIC ändrar sig vid varje modelländring. Tabell 5.3: Modellrevideringar för företag-ff, P-värde från t-test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 P VIF P VIF P VIF P VIF P VIF α < < < < < s s s x x x < < < < x7 < < < < < x x x x x < < < < x s Den reviderade modellen presenteras nedan. Y FF = α + β 1 S 1 + β 2 s 3 + β 3 x 6 + β 4 x 7 + β 5 x 12 (5.2) Beroende variabel Y FF : Direktavkastning

30 KAPITEL 5. RESULTAT OCH ANALYS 23 Tabell 5.4: ANOVA tabell - företag inom fastighet och finans Variansanalys (ANOVA) Reviderad modell - FF-företag Källa Frihetsgrader SS MS F-värde Pr >F Modell <.0001 Felterm Total Tabell 5.5: Parameterskattningar - FF-företag Parameterskattning Revidierad modell - företag Variabel DF Skattning Standardfel T värde Pr > t VIF Intercept < s s x < x < x < Från tabell 5.5 kan den skattade funktionen som modellerar direktavkastningen för företag inom fastighet och finans, Ŷ FF från ekvation (5.2), skrivas som: Ŷ FF = s s x x x 12 (5.3) Modellen i sin helhet är signifikant, och undersöker man varje enskild variabel ser man att dessa också är signifikanta. Multikollinearitet är inget problem i denna modell då VIF-värdet för samtliga variabler uppfyller tumregeln att de är mindre 10.

31 24 KAPITEL 5. RESULTAT OCH ANALYS (a) Revidierad modell (b) Revierad modell med hänsyn till extrempunkter Figur 5.1: Normal Q-Q plot - företag inom fastighet och finnans Från figur 5.1 kan man se att det experimentella värdet följer den teoretiskt räta linjen men att det förekommer några extremvärden, bland annat tre värden som ligger till höger i Q-Q plotten. Exkluderar man dessa från modellen fås en bättre modell. I och med detta uppfylls antagandet om normalfördelade residualer. Figur 5.2: Residualer mot skattvärde - företag inom fastighet och finans Residualer Skattad värde I figur 5.2 ser vi att residualerna är utspridda så länge direktavkastningen är mindre än 8 därefter är det svårare att dra några slutsatser för att vi har få datapunkter.

32 KAPITEL 5. RESULTAT OCH ANALYS 25 För att undersöka om autokorrelation råder utfördes ett Durbin- Watson test, och från tabell 5.6 ser man en stark autokorrelation. Tabell 5.6: Durbin-Watson test - FF-företag DW Pr <DW Pr >DW < Sammanfattningsvis kan man se i tabell 5.7 att alla modeller är signifikanta. Vidare kan man se att Radj 2 ökar och AIC minskar vid varje revidering fram till modell 4. Vid revideringen från modell 4 till modell 5 minskar Radj 2 medan AIC ökar, men dessa förändringar är små och modell 5 uppfyller signifikansnivån som eftersträvades för alla oberoende variabler. Modellen förbättrades ytterligare när man tog hänsyn till extremvärden. Tabell 5.7: Resultat för företag inom fastighet och finans. M: Modell, M5UE - modell 5 med hänsyn till extrempunkter M1 M2 M3 M4 M5 M5UE n k F-värde P-värde <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 R Radj AIC

33 26 KAPITEL 5. RESULTAT OCH ANALYS 5.3 Reviderad modell - Industriella företag Som i fallet med FF-företag utgick vi från resultaten i tabell 5.2. Som redan har påpekats måste man vara försiktig när insignifikanta variabler tas bort från en modell då det finns en risk att andra signifikanta variabler förlorar sin signifikans. För industriella företag gjordes totalt tre modellrevideringar. Vid varje revidering togs hänsyn till hur väl modellen i sin helhelt stämmer överens med data, och P- och VIFvärdet för varje förklarande variabel. Som vid modellrevideringen för FF-företag så eftersträvades ett minimalt AIC, och en signifikansnivå på 5 % för alla oberoende variabler. Tabell 5.8: Modellrevideringar för industriella företag, P-värde från t- test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 P VIF P VIF P VIF P VIF α s s s x < x x x x x x x x x s Den slutliga modellen för industriella företag blir: Y Ind = α + β 1 S 3 + β 2 x 4 + β 3 x 6 + β 4 x 9 + β 5 s 14 (5.4) Beroende variabel Y Ind : Direktavkastning

34 KAPITEL 5. RESULTAT OCH ANALYS 27 Tabell 5.9: ANOVA-tabell - Industriella företag Variansanalys (ANOVA) Revidierad modell - Industriella företag Källa Frihetsgrader SS MS F-värde Pr >F Modell <.0001 Felterm Total Tabell 5.10: Parameterskattning - Industriella företag Parameterskattning Revidierad modell - Industriella företag Variabel DF Skattning Standardfel T värde Pr > t VIF α < s x < x x s Från tabell 5.10 kan den skattade funktion som modellerar direktavkastningen för industriella företag, ŶInd från ekvation (5.4), skrivas som: Ŷ Ind = s x x x s 14 (5.5) Modellen i sin helhet är signifikant och undersöker man varje enskild variabel ser man att dessa är också signifikanta. Multikollinearitet är inget problem i denna modell då VIF-värdet för samtliga variabler fyller tumregeln att de är mindre 10. Från figur 5.3 kan man se att det experimentella värdet följer den teoretiskt räta linjen men att det förekommer några extremvärden, bland tre värden som ligger till höger och fyra värden som ligger i den nedre delen av Q-Q plotten. Exkluderar man dessa från modellen fås en bättre modell. I och med detta uppfylls antagandet om normalfördelade residualer.

35 28 KAPITEL 5. RESULTAT OCH ANALYS (a) Revidierad modell (b) Revierad modell med hänsyn till extrempunkter Figur 5.3: Normal Q-Q plot - industriella företag Figur 5.4: Residualer mot skattvärde - industriella företag Residualer Skattad värde I figur 5.4 ser vi att residualerna är helt oberoende direktavkasningen vilket de bör vara enligt de antaganden vi gör om dem. För att undersöka om autokorrelation råder utfördes ett Durbin-Watson test, och från tabell 5.11 ser man precis som för modellen för FF-företagen en stark autokorrelation. Tabell 5.11: Durbin-Watson - Industriella företag DW Pr <DW Pr >DW <

36 KAPITEL 5. RESULTAT OCH ANALYS 29 Sammanfattningsvis kan man se i tabell 5.12 att de reviderade modellerna är fortsatt signifikanta, R 2 har förvisso minskat men det justerade värdet är ungefär detsamma. AIC-värdet ökar något mellan modell 2 och modell 4, men denna ökning är väldigt liten och i modell 4 uppfyller alla förklarande variabler signifikansnivån 5 %. Tabell 5.12: Resultat för industriella företag - M: Modell, M5UE - modell 4 med hänsyn till extrempunkter M1 M2 M3 M4 M4UE n F-värde P-värde <.0001 <.0001 <.0001 <.0001 <.0001 R Radj AIC

37 30 KAPITEL 5. RESULTAT OCH ANALYS 5.4 Reviderad modell - Företag inom THT Som tidigare utgick vi här från resultatet från tabell 5.2. Man såg att de flesta av de förklarande variablerna var inte signifikanta för modellen. Som det tidigare har påpekats behövs en stegvis modellrevidering. Nedan presenteras de stegvisa revideringen av modellen för THT-företag. Vid varje revidering togs hänsyn till hur väl modellen i sin helhelt stämmer överens med data, P- och VIF-värdet för varje förklarande variabel. Även hät eftersträvades ett minimalt AIC, och en signifikansnivå på 5 % för alla oberoende variabler. Gällande modellrevideringen bör dock nämnas att mycket arbete döljer sig bakom steget mellan modell 4 och modell 5. I modell 4 är alla fem kvarvarande förklarande variabler insignifikanta. De variabler med högst P-värden i denna tabell är x 5, x 12 och x 14. Om dessa stegvis tas bort blir de kvarvarande variablerna, x 9 och x 10, fortsatt insignifikanta. Därför testades alla möjliga revideringar av modell 4, och detta mynnade ut i modell 5 som har signifikanta förklarande variabler som även har lägst AIC. Tabell 5.13: Modellrevideringar för THT-företag, P-värde från t-test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 P VIF P VIF P VIF P VIF P VIF α < < < < < s s s x x x x x x x x x x s

38 KAPITEL 5. RESULTAT OCH ANALYS 31 Den slutgiltiga modellen för THT-företagen ges av den nedanstående ekvationen. Här beror direktavkastningen endast av x 10 och x 12. Y THT = α + β 1 x 10 + β 4 x 12 (5.6) Beroende variabel Y THT : Direktavkastning Tabell 5.14: ANOVA - THT-företag Variansanalys (ANOVA) Reviderad modell - THT-företag Källa Frihetsgrader SS MS F-värde Pr >F Modell Felterm Total Tabell 5.15: Parameterskattning - THT-företag Parameterskattning Reviderad modell - THT-företag Variabel DF Skattning SE t-värde Pr > t VIF α < x x Från tabell 5.15 framgår att den skattade funktionen som modellerar direktavkastningen för företag inom THT, ŶTHT från ekvation (5.6), skrivas kan som: Ŷ THT = x x 12 (5.7) Modellen i sin helhet är signifikant, dock har den en högre signifikansnivå än de andra. Undersöker man varje enskild variabel ser man att dessa också är signifikanta. Multikollinearitet är inget problem då VIFvärdet för samtliga variabler är mindre 10.

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

ANOVA Mellangruppsdesign

ANOVA Mellangruppsdesign ANOVA Mellangruppsdesign Envägs variansanlays, mellangruppsdesign Variabler En oberoende variabel ( envägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier,

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 20 mars 2015 9 14 Examinator: Anders Björkström, bjorks@math.su.se Återlämning: Fredag 27/3 kl 12.00, Hus 5,

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

TAMS65 DATORÖVNING 2

TAMS65 DATORÖVNING 2 TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

Statistisk försöksplanering

Statistisk försöksplanering Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 2 November Tid: 09:00-13 Hjälpmedel: Miniräknare

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Statistik för teknologer, 5 poäng Skrivtid:

Statistik för teknologer, 5 poäng Skrivtid: UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer,

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

AID:... Uppgift 1 (2 poäng) Definiera kortfattat följande begrepp. a) IRR b) APR c) Going concern d) APV. Lösningsförslag: Se Lärobok och/alt Google.

AID:... Uppgift 1 (2 poäng) Definiera kortfattat följande begrepp. a) IRR b) APR c) Going concern d) APV. Lösningsförslag: Se Lärobok och/alt Google. Notera att det är lösningsförslag. Inga utförliga lösningar till triviala definitioner och inga utvecklade svar på essä-typ frågor. Och, att kursen undervisas lite olika år från år. År 2013 mera från Kap

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

TVM-Matematik Adam Jonsson

TVM-Matematik Adam Jonsson TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet

Läs mer