! " # $ % & ' ( ) * ' +, -. / 0 1 ( 2 '. 3 ' 4 2 ( 2. * ' - 5
Statistisk undersökning av utdelningar En jämförelse mellan olika branscher i Sverige WILMER LÖFGREN SINA MOZAYYAN Civilingenjör Teknisk fysik Datum: 31 maj 2017 Handledare: Thomas Önskog Examinator: Henrik Hult Engelsk titel: Comparing Dividends from Swedish Companies Skolan för teknikvetenskap
iii Sammanfattning Varje år delar aktiebolag i Sverige ut stora summor pengar i form av aktieutdelningar. Storleken på ett företags utdelningar anses bland många aktiesparare vara en viktigt faktor då de avgör om de ska köpa aktier i företaget. Det är ett stort beslut för ett företag när de bestämmer vilken utdelning de vill ge, och det är ett beslut som tvingar företaget att ta hänsyn till många faktorer. En stor utdelning kan göra företagets aktier mer attraktiva, men leder till att företaget har mindre eget kapital att använda för exempelvis produktutveckling och andra investeringar. I detta examensarbete inom matematisk statistisk görs en multipel linjär regressionanalys för att modellera direktavkastningen, d.v.s. utdelning dividerat med aktiekurs, för stora svenska företag verksamma inom fastighet och finans (FF); teknologi, hälsa och telekom (THT) och industri. En regressionsmodell gjordes för vardera av dessa tre företagsgrupper, och statistiska test utfördes för att bedöma hur bra dessa modeller beskriver relationen mellan direktavkastning och de företagsvariabler som användes som förklarande variabler. Studiens resultat visar att regressionsmodellen som gjordes för företag inom fastighet och finans är bättre än de som gjordes för industri och teknologi, hälsa och telekom. Nyckelord: Utdelning, Direktavkastning, Regressionsanalys, Statistiska tester, Signaleringsteori, Agentteori, Irrelevansteori,
iv Abstract Dividends are of great interest to many, and their impact is felt by shareholders and companies all around the world. Among shareholders dividends are often viewed as being positive. When a company makes decisions regarding their dividend policy there is a lot they have to consider. A large dividend could make the company s shares more attractive, but a large dividend will also mean that the company has less capital to fund product development and other investments. In this study in mathematical statistics, multiple linear regression is used to model the dividend yield, i.e. dividend divided by share price, for large Swedish companies active in three sectors: finance and property; technology, health and telecom, and industry. A regression model was made for each of these three sectors, and statistical tests were conducted to assess how well these models describe the relationship between dividend yield and the variables used as dependent variables. Of the final three models that the study resulted in, the model made for companies in the financial and property sectors fitted the data the best. Keywords: Dividend, Dividend Yield, Regression Analysis, Statistical Tests, Signaling Theory, Agent Theory, Irrelevance Theory,
Innehåll 1 Inledning 1 1.1 Bakgrund............................ 1 1.2 Frågeställning......................... 1 1.3 Avgränsningar......................... 2 1.4 Syfte och målgrupp...................... 2 2 Aktieutdelningar 3 2.1 Utdelningar.......................... 3 2.2 Irrelevansteorin........................ 4 2.3 Agentteorin.......................... 4 2.4 Signaleringsteorin och liknande teorier.......... 5 3 Regressionsanalys 6 3.1 Multipel linjär regression................... 6 3.2 Minstakvadratmetoden.................... 7 3.3 Antaganden och modellförbättring............. 8 3.3.1 Heteroskedasticitet.................. 9 3.3.2 Endogenitet...................... 10 3.3.3 Autokorrelation.................... 10 3.3.4 Icke-linjära förhållanden............... 10 3.3.5 Multikollinearitet................... 11 3.4 Statistiska test av en regressionsmodell.......... 11 3.4.1 Förklaringsvärdet R 2................. 11 3.4.2 t-test.......................... 12 3.4.3 F-test.......................... 12 3.4.4 AIC........................... 13 3.4.5 VIF........................... 13 3.4.6 Residualplot och Durbin-Watson test....... 13 3.4.7 Normal Q-Q plot................... 14 v
vi INNEHÅLL 4 Metod 15 4.1 Tidigare studier........................ 15 4.2 Val av företag......................... 16 4.3 Val av variabler........................ 17 5 Resultat och analys 19 5.1 Ursprungsmodell....................... 19 5.2 Reviderad modell - Fastighet och finans.......... 22 5.3 Reviderad modell - Industriella företag.......... 26 5.4 Reviderad modell - Företag inom THT........... 30 6 Slutsats och diskussion 34 6.1 Diskussion........................... 34 6.2 Slutsats............................. 37 Litteratur 38 A Lista över företag 39
Kapitel 1 Inledning 1.1 Bakgrund Under 2017 kommer de svenska börsbolagen dela ut 187 miljarder SEK i form av utdelningar [3]. De stora mängder pengar som varje år ges i utdelningar har en direkt påverkan på ekonomin för företagen som ger dem och för de aktieägare som tar del av dem. Beloppet på vad ett företag ger som utdelning kan antas bero på flera egenskaper och kvantitativa variabler hos företaget i fråga. För analytiker och aktieägare kan det vara av intresse att ha en djupare förståelse för hur företagsvariabler påverkar beloppet av en utdelning. I denna rapport utförs multipel linjär regressionsanalys för att finna matematiska modeller för direktavkastningen av aktieutdelningar från tre olika företagsgrupper, företag inom fastighet och finans (FF), industriella företag och företag inom teknologi, hälsa och telekom (THT). 1.2 Frågeställning Detta projektarbete strävar efter att undersöka hur direktavkastningen av aktieutdelningar påverkas av egenskaper och kvantitativa variabler hos företagen som ger den. Bland de kvantitativa variablerna som används i studien ingår bland annat vinst och belåning, men inte tidigare utdelningar. Studiens breda frågeställning har begränsats till större svenska företag som tillhör fastighet- och finanssektorerna; teknologi-, hälsa- och telekomsektorerna och industrisektorn. 1
2 KAPITEL 1. INLEDNING Vidare har frågeställningen delats upp i två mindre frågeställningar för att göra den mer gripbar. Den första av dessa två frågeställningar är vilka variabler hos företag som har positiv respektive negativ inverkan på storleken av aktieutdelningar. Den andra frågeställningen är om inverkan av dessa variabler på ett företags utdelningsnivå skiljer sig åt beroende på vilken av de tre grupperna företaget tillhör. 1.3 Avgränsningar Den här studien är begränsad till svenska företag som är listade och listade på Nasdaq Nordic. Vidare begränsas studien till företag som på denna börs kategoriserar som att tillhöra Large Cap och som att tillhöra följande sektorer: fastighet, finans, industri, teknologi, hälsa och telekom. 1.4 Syfte och målgrupp Syftet med denna studie är att besvara studiens frågeställning om vilka faktorer som påverkar direktavkastningen av utdelningar från svenska företag verksamma inom tre olika företagsgrupper. Därmed utvecklas tre matematiskt modeller, en för vardera företagsgrupp, för hur direktavkasntingen av aktieutdelningar beror på dessa faktorer. Matematisk modeller för utdelningar kan vara av intresse för de som handlar med aktier, och även för företagen som ger dem. Eftersom modellerna som presenteras i denna rapport inte tar hänsyn till tidigare utdelningar kan de vara till nytta för ett aktiebolag som vill ge en utdelning men inte gett någon tidigare, eller inte gett någon på länge.
Kapitel 2 Aktieutdelningar 2.1 Utdelningar En aktieutdelning innebär att ett aktiebolag tar från sitt fria kapital och betalar sina aktieägare. Svenska företag som ger aktieutdelningar gör det i regel en gång per år, men två utdelningar per år är också vanligt. Många företag ger inte utdelningar, och ibland tvingar en försämrad ekonomisk situation företag som brukar ge utdelningar att inte göra det. Det tillskott av pengar som en utdelning innebär för aktieägare gör frågan om ett aktiebolag ger utdelningar, och hur stora de då är, intressant för många. Utöver det direkta sättet att ange storleken på en utdelning, antalet kronor som ges per aktie, kan andra mått användas för att ta hänsyn till faktorer hos företaget eller marknaden. Två sådana mått är direktavkastning (på engelska dividend yield) som definieras som utdelning per aktie dividerat med aktiepriset, och utdelningsgrad (på engelska dividend payout ratio) som definieras som den totala summan som företaget betalar i utdelningar dividerat med företagets nettovinst. I detta arbete undersöks hur direktavkastningen påverkas av företagsvariabler. Frågan om utdelningar är någonting positivt har inget entydigt svar. Istället för att ge utdelningar eller exempelvis investera i produktutveckling väljer en del företag att köpa tillbaka aktier. Genom att köpa tillbaka aktier och makulera dessa, höjer företaget värdet på de aktier som finns kvar då dessa kommer representera en större andel av företaget. Detta motsvarar en indirekt utdelning till aktieägarna då deras aktier ökar i värde. Ytterst ligger beslutet om en utdelning ska ges, och hur stor den då ska vara, av bolagstämman[7]. 3
4 KAPITEL 2. AKTIEUTDELNINGAR Det finns många avvägningar som måste göras då beslutet om en utdelningen fattas. Under de nästkommande underrubrikerna presenteras olika teorier om utdelningar och hur företag resonerar när de ger dem. 2.2 Irrelevansteorin Irrelevansteorin formulerades i en artikel 1961 av Miller och Modigliani, och den kan sammanfattas som att utdelningar i längden är irrelevanta för aktieägare[10]. Genom att utgå från idealiserad marknad, där man bland annat kan bortse från skatter och anta att alla har tillgång till samma information, argumenterar Miller och Modigliani för att ett företags värde inte påverkas av deras utdelningspolicy. Det är därför irrelevant för aktieägare om de får utdelningar eller inte, då värdet av deras aktieinnehav inte påverkas. Vidare för Miller och Modigliani fram argumentet att aktieägare själva kan styra över utdelningar. Aktieägare som vill ha en utdelning kan skapa en genom sälja en andel av sina aktier, och aktieägare som inte vill ha en utdelning, eller tycker att en utdelning är för stor, kan använda utdelningskapitalet för att köpa aktier. Miller och Modigliani anser följaktligen att företag inte ska prioritera utdelningar. Deras irrelevansteori har fått stort genomslag och deras artikel blir än idag ofta citerad. Modigliani fick 1985 Riksbankens pris i ekonomisk vetenskap till Alfred Nobels minne (ofta kallat Nobelpriset i ekonomi) för sina bidrag till ekonomisk vetenskap. Det är dock viktigt att ha i åtanke att teorin utgår ifrån en idealiserad marknad och att det därför kan vara svårt att tillämpa den i verkligheten. 2.3 Agentteorin Inom ekonomi och andra samhällsvetenskapliga discipliner är ett principalagent-problem en situation då någon, en agent, fattar beslut för någon annan, och agenten motiveras av skäl som gynnar den själv men som inte gynnar den som representeras av agenten. För ett aktiebolag finns en risk för att principal-agent-problem uppstår om företagets ledning har för stor kontroll över företagets kapital. Om detta leder till utgifter som i annat fall kunnat undvikas kallas dessa för agentkostnader.[5]
KAPITEL 2. AKTIEUTDELNINGAR 5 Om företaget betalar utdelningar och därför har mindre eget fritt kapital tvingas ledningen finansiera investeringar med exempelvis lån. Detta kan medföra att ledningen hushåller bättre med företagets resurser, och att agentkostnader därför minimeras. Agentteorin motsäger därför direkt irrelevansteorin, och säger att utdelningar kan ha en direkt inverkan på ett aktiebolags värde. 2.4 Signaleringsteorin och liknande teorier Signaleringsteorin baseras på att utdelningar kan ses som ett sätt för ett aktiebolag att ge information till dess aktieägare. Storleken på utdelningar kan tolkas som ett sätt för företaget att signalera hur företaget ser på dess finansiella situation. Ursprunget till signaleringsteorin kommer från en artikel av Lintner[8]. Han studerade hur ett aktiebolags utdelningspolicy påverkas priset av deras aktier. Bhattacharya utgick i en studie som publicerades 1979 ifrån signaleringsteori och argumenterade för att asymmetrisk information gör att utdelningar är viktiga[1]. Med asymmetrisk information menas att företagsledning kan ha bättre kännedom än aktieägarna om hur företaget förväntas prestera framöver. Lintner fann att bland annat vinst, investeringsmöjligheter och kassaflöden är viktiga variabler som påverkar aktieutdelningar. Utifrån signaleringsteorin formulerade Lintner även utjämningsteorin[8]. Denna teori konstaterar att företag ofta strävar efter att ge utdelningar som håller en jämn nivå, och följer företagens vinstuteckling på lång sikt. Tanken med en sådan strategi är att försöka undvika situationer där utdelningsnivån måste sänkas från föregående år, då en sådan sänkning kan signalera att det går sämre än väntat för företaget. Lintner argumenterar därför för att företag bara ska öka sina utdelningar om de är säkra på att de kommer kunna fortsätta lika stora utdelningar framöver. En annan teori som berör hur utdelningar kan vara informationsbärande är pecking order-teorin[9]. Enligt denna teori kan en låg utdelningsgrad signalera att företaget anser sig ha många möjliga investeringar. Anledningen till detta är att företag vill finansiera investeringar med interna medel istället för exempelvis lån som medför extra kostnader. När företaget beslutar hur dess resurser ska fördelas kommer därför investeringar att vara högre prioriterade än utdelningar.
Kapitel 3 Regressionsanalys 3.1 Multipel linjär regression Inom matematisk statistik betyder regression i dess bredaste bemärkelse att man försöker finna hur olika variabler eventuellt beror av varandra. I regel söker man ett uttryck för en variabel, den beroende variabeln, som är en funktion av en eller flera andra variabler, de oberoende variablerna. Den beroende variabeln och de oberoende variablerna kallas också ofta responsvariabel respektive förklarande variabler. De oberoende variablerna kan vidare delas upp i kvantitativa och dummy-variabler. En kvantitativ variabel antar de värden som fås genom observationer av den. En dummy-variabel är kategorisk och kan anta värdet 0 eller 1, och detta svarar mot att en observation saknar eller uppfyller en viss egenskap. Som namnet antyder menas med linjär regression att man försöker hitta en linjär funktion av de oberoende variablerna som kommer så nära som möjligt till att vara ett exakt uttryck för den beroende variabeln. Man särskiljer mellan enkel linjär och multipel linjär regression. Skillnaden ligger i att enkel regression bara har en oberoende variabel. I detta arbete använder vi oss av multipel linjär regression. Vår beroende variabel är direktavkastningen av utdelningen, det vill säga utdelningen per aktie dividerat med aktiepriset, och våra oberoende variabler är egenskaper och kvantitativa storheter hos de företag som ger dessa utdelningar. 6
KAPITEL 3. REGRESSIONSANALYS 7 Den matematiska modellen som en multipel linjär regression ger upphov till är att varje uppmätt värde av den beroende variabeln sätts till att vara lika med en summa av de motsvarande uppmätta oberoende variablerna med olika koefficienter, en konstant term och en residual. Detta kan enkelt skrivas på följande sätt. Y j = α + k β i x ij + e j j = 1,..., n (3.1) i=1 Här är Y j det j:te uppmätta värdet av den beroende variabeln. x ij är det j:te uppmätta värdet av den i:te oberoende variabeln, och β i är koefficienten till denna variabel. α är den konstanta termen, och e j är residualen dvs feltermen för den j:te mätpunkten. Den matematiska modellen anpassas till data genom att α och alla β i skattas. Det finns olika tillvägagångssätt för att skatta dessa, men det vanligaste är att Ordinary least squares (OLS), på svenska minstakvadratmetoden, används. 3.2 Minstakvadratmetoden För att anpassa en multipel linjär regressionmodell till en datamängd används i regel Ordinary Least Squares (OLS). Metoden kallas på svenska minstakvadratmetoden. Den är enkel och givet vissa antaganden är den även den matematiskt mest korrekta enligt Gauss-Markovs sats. Denna sats säger att OLS är Best Linear Unbiased Estimatior (BLUE) då dessa antagaden är uppfyllda. Med detta menas att OLS är den väntevärdesriktiga linjära estimator som har den minsta variansen[6]. De antagaden som krävs presenteras i nästa delkapitel, Antagaden och modellförbättring. Minstakvadratmetoden innebär att α och β i från ekvation (3.1) skattas genom att den nedanstående summan av de kvadrerade residualerna minimeras. n (e j ) 2 (3.2) j=1 Genom att kvadrera residualerna innan de summeras säkerställs att positiva och negativa residualer inte tar ut varandra. Vidare leder kvadrering till att stora och små e j viktas så att de blir mer respektive mindre betydelsefulla.
8 KAPITEL 3. REGRESSIONSANALYS För att implementera minstakvadratmetoden skrivs först ekvation (3.1) på matrisform. Sedan används metoder från linjär algebra för att finna de koeffecienter som minimerar summa (3.2). y 1 Y =. y n X = Y = X β + e (3.3) 1 x 11 x k1 α 1 x 12 x k2...... β 1 e 1 β =. e =. e 1 x 1n x n kn I IR n ges summa (3.2) av det kvadrerade avståndet mellan Y och X β. Givet att att kolumnerna i X är linjärt oberoende kommer de att spänna upp ett underrum W till IR n. Summan (3.2) kan därför minimeras genom att β skattas till att vara ˆβ givet att X ˆβ är den vektor i W som ligger närmast Y. Denna vektor fås genom att projicera Y på W. Efter denna projicering kommer e att vara ortogonal mot alla vektorer i W. Med omskrivningen e = Y X ˆβ fås då följande. β n X ( Y X ˆβ) = 0 (3.4) Då kolumnerna i X är linjärt oberoende kommer X X vara en inverterbar matris och ˆβ kan lösas ut ur ekvation (3.4). ˆβ = (X X) 1 X Y (3.5) 3.3 Antaganden och modellförbättring För att kunna använda sig av multipel linjär regression, och anpassa en sådan regressionsmodell med minstakvadratmetoden, krävs att man gör antaganden om den data som analyseras. Dessa antaganden krävs dels för att den linjära regressionsmodellen ska vara rimligt, och dels för att minstakvadratmetoden ska vara ett aktuellt tillvägagångssätt för att anpassa modellen till data. I de nedanstående tabellerna, 3.1 och 3.2, presenteras de antaganden som görs. De nästkommande underrubrikerna sammanfattar eventuella avvikelser från dessa antaganden och hur regressionsmodellen kan anpassas för att hantera sådana avvikelser.
KAPITEL 3. REGRESSIONSANALYS 9 Nästa delkaptiel, Statistiska test av regressionsmodellen, sammanfattar metoder för att upptäcka avvikelser från antagandena, och metoder för att avgöra hur väl regressionsmodellen beskriver relationen mellan den beroende variabeln och de oberoende variablerna. Tabell 3.1: Antaganden om e j Antagande Normalfördelad residual Homoskedasticitet Exogenitet Sammanfattning Residualen antas tillhöra en normalfördelning. Residualen antas ha en konstant varians. Residualen antas vara oberoende av de andra variablerna och ha väntevärdet noll. Residualerna antas vara oberoende av varandra. Tabell 3.2: Antaganden om Y och X Ingen autokorrelation Antagande Linjär funktion Ingen multikollinearitet Sammanfattning Den beroende variabeln antas vara en linjär funktion av de oberoende variablerna och en felterm. De oberoende variablerna antas vara linjärt oberoende av varandra. 3.3.1 Heteroskedasticitet Om variansen av residualen inte är konstant utan är olika hos olika subpopulationer av e uppstår heteroskedasticitet. Då kommer inte OLS vara BLUE och till följd av detta kan standardavvikelser som tas fram med OLS vara inkorrekta. Detta är ett problem som kan vara svårt att lösa.
10 KAPITEL 3. REGRESSIONSANALYS En metod för att hantera heteroskedasticietet om man har en stor datamängd är att använda White s Heteroscedasticity-Consistent Variances and Standard Errors som tar heteroskedasticitet i beaktning när standardavvikelserna beräknas[6]. 3.3.2 Endogenitet Om residualen inte har väntevärdet noll och beror på en eller flera av de oberoende variablerna uppstår endogenitet. Detta medför att estimaten som görs med OLS blir inkonsekventa. Det finns många möjliga anledningarna till att endogenitet kan uppstå. Exempelvis kan mätfel av de oberoende variablerna leda till att endogenitet uppstår. En annan möjlig orsak till endogenitet är att relevanta variabler inte har tagits med i regressionsmodellen. Den inverkan som sådana bortglömda variabler skulle ha på den beroende variabeln kommer då istället hamna i residualen[6]. 3.3.3 Autokorrelation Med autokorrelation menas att en felterm e j beror av en eller flera andra feltermer. Detta påverkar effektiviteten av OLS och vanliga statistiska test av regressionsmodellen kommer då inte med säkerhet vara giltiga. Autokorrelation kan vara svårt att åtgärda, men en vanlig metod är att anta att varje felterm e j är linjärt beroende av den tidigare feltermen e j 1. Om detta antagande är riktigt kan autokorrelationen hanteras genom att Generalized Least Squares (GLS) används istället för OLS[6]. 3.3.4 Icke-linjära förhållanden Om den beroende variabeln inte är en linjär funktion av de oberoende variablerna, utan exempelvis beror på kvadraten av en av de oberoende variablerna eller produkten av två av de oberoende variablerna, så kommer en linjär regressionsmodell inte vara giltig. Eventuella ickelinjära förhållanden kan dock hanteras genom att regressionsmodellen transformeras. En icke-linjära regressionsmodell kan göras linjär genom att den logaritmeras[6].
KAPITEL 3. REGRESSIONSANALYS 11 3.3.5 Multikollinearitet För att multipel linjär regressionsmodell ska vara tillämpbar krävs att modellens oberoende variabler är linjärt oberoende. Om de inte är det uppstår multikollinearitet, och detta medför att standardavvikelserna för regressionskoefficienterna kan bli väldigt stora. Det finns flera sätt att hantera multikollinearitet. Man kan exempelvis addera de variabler som är korrelerade och på så vis att skapa en ny oberoende variabel. Ett annat alternativ är att ta bort alla utom en av de variabler som är starkt korrelerade med varandra[6]. 3.4 Statistiska test av en regressionsmodell 3.4.1 Förklaringsvärdet R 2 För att bedöma hur väl en linjär regressionsmodell förklarar sambandet mellan den beroende variabeln och de oberoende variablerna kan förklaringsvärdet R 2 beräknas. Detta värde ligger mellan 0 och 1, och det anger hur väl den framtagna regressionslinjen passar datapunkterna. Förklaringsvärdet blir större ju bättre regressionsmodellen är. Definitionen av förklaringsvärdet ges av följande ekvation, där Ȳ är medelvärdet av den beroende variabeln Y. n R 2 j=1 1 (e j) 2 n j=1 (Y j Ȳ (3.6) )2 Det finns även ett justerat förklaringsvärde Radj 2 som utgår från R2 men som även beaktar antalet oberoende variabler och storleken på den datamängd som analyseras. Anledningen till att Radj 2 kan vara av intresse är att R 2 kan öka till följd av slumpen om antalet oberoende variabler ökas. Radj 2 definieras av nedanstående ekvation där p är antalet oberoende variabler och n är antalet datapunkter[6]. Radj 2 R 2 (1 R 2 p ) n p 1 (3.7)
12 KAPITEL 3. REGRESSIONSANALYS 3.4.2 t-test För att avgöra signifikansen av en oberoende variabel kan ett t-test utföras. Då testas hypotesen att koefficienten β j som tillhör denna variabel är lika med noll. Detta skulle innebära att denna variabel inte påverkar den beroende variabeln. För utföra ett t-test med hypotesen β j = β 0 beräknas följande där SE() betecknar standardavvikelse[6]. t j = ˆβ j β 0 SE( ˆβ j ) (3.8) t j tillhör en t-fördelning med n k frihetsgrader där n är antalet observationer och k är antalet oberoende variabler. Sedan beräknas P- värdet, vilket anger sannolikheten att en stokastisk variabel som tillhör en t-fördelning med n k frihetsgrader ska vara större än t j. Blir detta större än den signifikansnivå som eftersträvas måste hypotesen att β j = β 0 förkastas. 3.4.3 F -test Med ett F-test kan man bland annat bestämma signifikansen för en hel regressionsmodell. Det påminner om ett t-test, men istället för att testa hypotesen att en regressionskoefficient är noll testas istället hypotesen att alla regressionskoefficienter är noll. För att utföra ett F-test beräknas F med nedanstående formel. F presenteras i regel i en ANOVAtabell (ANOVA står för analysis of variance). F = ESS/(k 1) RSS/(n k) (3.9) ESS = n (Ŷj Ȳ )2 RSS = j=1 n (Y j Ŷj) 2 F tillhör en F-fördelning med n k frihetsgrader där n är antalet observationer och k är antalet oberoende variabler. Efter att F har beräknas så tas P-värdet fram på liknande sätt som det görs vid ett t-test[6]. j=1
KAPITEL 3. REGRESSIONSANALYS 13 3.4.4 AIC Akaike Information Criterion (AIC) är en metod som liknar Radj 2, och som används för att bedöma hur bra en statistisk modell är. AIC tar likt Radj 2 hänsyn till införandet av nya förklarande variabler[6]. AIC definieras enligt nedanstående ekvation. û2 AIC = exp (2k/n) i n = exp (2k/n) RSS n (3.10) Här är k antalet förklarande variabler, n antalet mätpunkter och RSS är summan av de kvadrerade residualerna. Till skillnad från förklaringsvärdena R 2 adj och R2 så medför ett lägre AIC en bättre modell[6]. 3.4.5 VIF En metod för att avgöra om det finns multikollinearitet hos de oberoende variablerna i regressionsmodellen är Variance Inflation Factor (VIF). Med denna metod görs en regressionsmodell där den j:te oberoende variablen sätts till att vara en beroende variabel av de andra oberoende variablerna. Sedan beräknas R 2 j för denna modell, och VIF j beräknas enligt följande ekvation[6]. VIF j = 1 1 R 2 j (3.11) Ett stort VIF j tyder på att den j:te oberoende variabeln i stor utsträckning korrelerar med en eller flera av de andra oberoende variablerna. En vanlig tumregel är att ett VIF-värde över 10 innebär att en för stark multikollinearitet finns. 3.4.6 Residualplot och Durbin-Watson test I en residualplot presenteras feltermerna i en graf och av denna kan eventuella mönster i residualen upptäckas. En residualplot är en bra metod för att avgöra om homoskedasticitet föreligger, och om det finns någon autokorrelation. Om feltermerna inte är slumpmässigt spridda kring den horisontella axeln i grafen kan man misstänka att feltermernas varians inte är konstant eller att feltermerna beror av varandra[6].
14 KAPITEL 3. REGRESSIONSANALYS En annan metod för att upptäcka autokorrelation är att utföra ett Durbin-Watson test. För att utföra testet beräknas nedanstående kvot[6]. Denna kvot ligger i intervallet 0 d 4. Om värdet ligger mellan 0 och 1 indikerar detta positiv autokorrelation, och om det ligger mellan 3 och 4 indikeras negativ autokorrelation[4]. d = t=n t=2 (ê t ê t 1 ) 2 t=n t=2 (ê t) 2 (3.12) För att ett Durbin-Watson test ska vara riktigt krävs att flera antaganden är uppfylla, bland annat att modellen är utformad som en autoregressiv modell och att residualen är normalfördelad. 3.4.7 Normal Q-Q plot För att undersöka om feltermerna är normalfördelade kan en normal quantile-quantile plot göras. I en Q-Q plot jämförs två sannolikhetsfördelningar genom att deras kvantiler plottas mot varandra. I en normal Q-Q plot ges y-värdena av de standardiserade feltermerna medan x- värdena ges av de teoretiska kvantilerna för en normalfördelning. Om residualen är normalfördelad bör detta ge en rät linje, och en normal Q-Q plot som inte ger en rät linje tolkas därför som ett tecken på att antagandet om normalfördelade feltermer inte är uppfyllt[6].
Kapitel 4 Metod Som tidigare har nämnts finns det flera förklarande variabler som kan antas förklara direktavkastningen, det vill säga kvoten mellan beloppet på utdelningen och den nuvarande aktiekursen, för ett aktiebolag. Som första steg inom modelleringen valdes ett fjorton olika förklarande variabler som antingen var kopplade till företagets balansräkning eller var aktiekursrelaterade. Samtidigt som detta gjordes det även en avgränsning av vilka företag som skulle undersökas. Innan detta arbete kunde påbörjas behövdes dock en granskning av tidigare studier som gjorts, och vad dessa studier hade för resultat. 4.1 Tidigare studier Många studier som berör aktieutdelningar har gjorts, och flera teorier om dem har formulerats. Några av dessa teorier sammanfattas i kapitel 2, Aktieutdelningar. För att kunna sätta denna rapport i perspektiv till tidigare forskning är det dock nödvändigt att även titta på tidigare studier som, precis som detta arbete, analyserar hur olika faktorer faktiskt påverkar utdelningar. En sådan studie publicerades 2011 av Al Shabibi och Ramesh[12]. I deras studie använde de sig av multipel linjär regressionsanalys för att undersöka utdelningspolicyn under 2007 för 90 brittiska företag som inte tillhör finanssektorn. De delade upp de oberoende variabler de använde sig av i två olika typer. Den ena typen var sådant som berör företagens ledning, exempelvis storlek på styrelsen och hur stort inflytande styrelsen har. Den andra typen var företagsfaktorer som ex- 15
16 KAPITEL 4. METOD empelvis företagets storlek, belåningsgrad och tillväxt. Bland företagsfaktorerna fann de att företagsstorlek och vinst har en positiv effekt på utdelningar. Detta kan tolkas som en bekräftelse av både signaleringsteorin. En ökad vinst bör enligt signaleringsteorin leda till en ökad utdelning. En ökad företagsstorlek kan lätt medföra en mer komplicerad hierarki, och detta kan eventuellt öka risken för agentkostnader. Studiens resultat kan därför också tolkas som att företagen vill minimera agentkostnader. Vidare fann Al Shabibi och Ramesh att även risk har en positiv inverkan på utdelningar. Med risk menas ett kvantitativt mått av hur instabilt ett företags inkomster är. De fann även att faktorer som berör företagets ledning har inverkan på utdelningar. Bland annat fann de att ett ökat inflytande för företagsstyrelsen har en positiv effekt på utdelningar. 4.2 Val av företag Enligt den senaste uppdateringen av företagsregistret finns det över 438 869 aktiebolag i Sverige[2]. Av dessa valdes de bolag som är registrerade på Nasdaq OMXNordic och som tillhör Large Cap, det vill säga storbolagslistan som definieras som de företag har ett börsvärde på över en miljard e[11]. För att kunna besvara frågeställningen om hur utdelningsnivån påverkas av vilken sektor ett företag tillhör valdes företag från tre huvudgrupper. Dessa grupper skapades med hjälp av den sektorindelning som Nasdaq använder för att klassificerar företagen. Tillslut valdes 14 stycken företag inom fastighets- och finanssektorn, 15 stycken företag inom industrisektorn och 10 stycken företag inom de innovativa sektorerna teknologi, hälsa och telekom.
KAPITEL 4. METOD 17 4.3 Val av variabler Den första svårigheten man möts av när man ska utföra en regressionanalys är valet av vilka variabler som ska ingå i regressionsmodellen. Eftersom beloppet på vad ett företag ger för utdelning är ofta korrelerat med aktiekursen valdes direktavkastningen som den beroende variabeln. Med direktavkasning menas utdelningsbeloppet per aktie dividerat med aktiekursen. Medan datainsamlingen pågick undersöktes korrelationen mellan de förklarande variabler som eventuellt skulle ingå i regressionsmodellen och direktavkastningen. En fördel med detta tillvägagångssätt är att man kontinuerligt testar om den data man samlar in bör vara signifikant i den slutgiltiga regressionsanalysen. Första modellen som presenteras i rapporten består av 14 förklarande variabler se tabell 4.1. För att öka signifikansnivån för modellen och för att effektivisera datainsamlingen valdes att samla data för flera år. För de allra flesta företagen valdes åren 2011-2016. I och med detta har man paneldata som både består av cross section data det vill säga information från varje företag vid en viss tidpunkt samt tidsseriedata för de tidigare sex åren. Det bör noteras att seriedata ökar risken för positiv autokorrelation[6]. Det beslutades att vikta x1, x2, x3 och x14 genom att dividera dem med N för att få mer homogena variabler. Dessa nya viktade variabler döptes till s1, s2, s3 och s14
18 KAPITEL 4. METOD Tabell 4.1: De 14 förklarande variabler som används i modell 1 och symboler för antal aktier och företagsgrupp Variabel Beskrivning x1 Summa långfristiga skulder Långfristiga skulder är skulder som inte förfaller inom ett år x2 Summa kortfristiga skulder Kortfristiga skulder är de skulder som förfaller inom ett år x3 Summa eget kapital och skulder Företagets totala tillgångar x4 Omsättning/aktie Företagets intäkter dividerat med antal aktier x5 Vinst/aktie (Nettointäkt-Utdelningskostnad)/Antal aktier x6 Eget kapital/aktie Företagets egna medel dividerat med antal aktier x7 Balans/aktie Företagets anläggningstillgångar dividerat med antal aktier x8 P/E-tal Aktiekursen dividerat med Vinst/aktie x9 P/S-tal Aktiekursen dividerat med Omsättning/aktie x10 Effektivavkastning(%) Den procentuella avkastningen under året till följd av ändrad aktiekurs och utdelning x11 P/Kassaflöde Aktiekursen dividerat med Kassaflöde/aktie x12 P/Eget kapital Aktiekursen dividerat med Eget kapital/aktie x13 Kassaflöde/aktie Företagets intäkter av likvida medel dividerat med antal aktier x14 Börsvärde Det totala värdet av alla företagets aktier givet aktiekursen N Antal aktier Totala antalet aktier som finns i företaget G Företagsgrupp Om företaget tillhör FF, industri eller THT
Kapitel 5 Resultat och analys Efter att data samlats in enligt det tillvägagångssätt som förklaras i kapitel 4 kunde regressionsanalysen påbörjas. Som ursprungsmodell valdes en multilinjär regressionsmodell med samtliga 14 förklarande variabler. Detta gjordes för hela populationen och för varje enskild företagsgrupp, det vill säga för företagen inom fastighet och finans (FFföretag), de industriella företagen och företagen inom teknologi, hälsa och telekom (THT-företag). För att bedöma hur väl modellen stämde överens med data användes följande kriterier: I första hand bedömes modellens signifikansnivå genom F-test, förklaringvärdet samt AIC. Senare reviderades modellerna för varje företagsgrupp genom att stegvis utesluta förklarande variabler som inte var signifikanta enligt t-test och hade ett VIFvärde lägre än 10 och samtidigt minimiera AIC. Vi valde signifikansnivån 5% 5.1 Ursprungsmodell Som urspungsmodell valdes en regressionsmodell med direktavkastningen som oberoende variabel och de 14 tidigare nämnda förklarande variablerna, se tabell 4.1. Y i = α + 3 13 β i s i + β i x i + β 14 s 14 + e i (5.1) i=1 i=4 I tabell 5.1 ser man en sammanställning av regressionsanalysen för hela populationen och även för varje delpopulation. Man kan i kor- 19
20 KAPITEL 5. RESULTAT OCH ANALYS ta drag dra slutsatsen att modellen i sin ursprungform, ekvation (5.1), är signifikant för hela populationen och även för varje delpopulation. Tabell 5.1: Resultat från ursprungsmodellen för alla företag och även för varje företagsgrupp Total FF Industri THT n 233 84 90 59 F-värde 14.86 68.79 12.42 1.58 P-värde <.0001 <.0001 <.0001 0.1228 R 2 0.4883 0.8428 0.6022 0.3348 R 2 adj 0.4554 0.8305 0.5280 0.1232 AIC 980.3 278.8 319.8 307.3 I tabell 5.2 presenteras motsvarande P-värde från t-testet där alla P- värden som översteg 0.2 markeras med färg. Värt att observera förklarande variablers ändras beroende på vilka andra variabler som finns med i modellen. Revideringar som görs framöver är för att sträva efter signifikansnivån 5%. Tabell 5.2: Signifikansnivå från t-test för ursprungsmodellen, gråa celler 0.2 < P < 0.4, blåa celler 0.4 < P < 0.8 och röda celler 0.8 < P < 1.0 Total FF Industri THT α <.0001 <.0001 <.0001 <.0001 s1 0.1968 0.0323 0.1495 0.4644 s2 0.5351 0.6105 0.3921 0.2111 s3 0.2759 0.0197 0.0122 0.5566 x4 0.0005 0.6679 0.0096 0.846 x5 0.3742 0.9705 0.163 0.3245 x6 0.081 0.0003 0.0093 0.6365 x7 <.0001 <.0001 0.8631 0.4628 x8 0.066 0.5959 0.4159 0.8173 x9 0.8197 0.6945 0.0286 0.4407 x10 0.0271 0.2684 0.1361 0.0899 x11 0.9493 0.7848 0.9775 0.6733 x12 0.0018 0.0002 0.0526 0.4243 x13 0.3632 0.1296 0.0685 0.9861 s14 0.0523 0.8804 0.0081 0.6744
KAPITEL 5. RESULTAT OCH ANALYS 21 Ursprungsmodellen i sin helthet modellerar verkligheten på ett bra sätt. Med en signifikansnivå på mindre än 10 4 kan vi dra slutsatsen att åtminstone en av de förklarande variablerna är skild från noll. För företagen i THT har vi en jämförelsevis hög signifikansnivå 0.1228. Förklaringsvärdet och det justerade förklaringsvärdet för de olika grupperna skiljer sig markant, och detta tyder på att de förklarande variablerna förklarar direktavkastningen i olika utsträckning för de tre företagsgrupperna. Exempelvis variabel x9, företagens P/S-värde, är insignifikant för alla modeller utom den för industriföretag. Variabel x11, P/Kassaflöde, är inte signifikant i någon av grupperna. Notera att signifikansnivåerna för olika variabler är proportionella sinsemellan, det vill säga om man tar bort en variabel kan en variabel som tidigare inte var signifikant bli signifikant, eller motsatsen att en variabel som var signifikant blir insignifikant. Man behöver därför utföra en stegvis modellrevidering och ta hänsyn till dessa eventuella effekter av att ta bort förklarande variabler. Vid modellrevideringarna togs därför de variabler med P-värden över 0.2 bort en efter en, och efter varje borttagning av en variabel togs nya P-värden fram. Sedan användes samma procedur för variabler med P-värde över 0.05. Signifikansnivån som eftersträvades var alltså 5 %. Vidare eftersträvades ett minimalt AIC. Det är värt att observera att detta inte är en komplett modellvalidering då homoskedasticitet och multikollinearitet inte har undersökts, men detta görs för de reviderade modellerna för var och en av dessa grupper.
22 KAPITEL 5. RESULTAT OCH ANALYS 5.2 Reviderad modell - Fastighet och finans Genom att utgå från resultatet som sammanfattas i tabell 5.2 reviderades modellen för företag inom fastighet- och finanssektorn. I tabellen kan man se att variablerna s 2, s 4, x 5, x 8, x 9, x 10, x 11, s 14 inte var signifikanta då deras P-värden överstiger 0.2. Dessa variabler togs bort en efter en, och efter varje borttagning av en variabel togs nya P-värden fram. Denna procedur upprepades tills alla variabler hade ett P-värde under 0.05. Signifikansnivån som eftersträvades var alltså 5 %. Detta medförde att även x 13 togs bort från den slutgiltiga modellen. Utöver denna signifikansnivå eftersträvades också att minimera AIC. I tabell (5.7) kan man se en sammanställning av hur bl.a. förklaringsvärdet och AIC ändrar sig vid varje modelländring. Tabell 5.3: Modellrevideringar för företag-ff, P-värde från t-test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 P VIF P VIF P VIF P VIF P VIF α <.0001 0.00 <.0001 0.00 <.0001 0.00 <.0001 0.00 <.0001 0.00 s1 0.0323 52.1 0.0293 7.62 0.0261 7.58 0.0006 4.03 0.0008 3.48 s2 0.6105 19.5 0.623 2.30 0.6168 2.29 s3 0.0197 75.7 0.0121 10.22 0.0103 10.1 0.003 5.92 0.0008 5.71 x4 0.6679 2.30 0.5815 1.35 0.6143 1.23 x5 0.9705 3.17 0.9894 2.79 x6 0.0003 4.78 <.0001 2.97 <.0001 1.44 <.0001 1.20 <.0001 1.20 x7 <.0001 7.64 <.0001 4.74 <.0001 4.60 <.0001 4.41 <.0001 2.95 x8 0.5959 1.48 0.6146 1.44 0.6218 1.16 x9 0.6945 1.89 0.7517 1.23 x10 0.2684 1.37 0.2779 1.29 0.2544 1.26 0.2697 1.22 x11 0.7848 1.84 x12 0.0002 3.56 <.0001 1.90 <.0001 1.83 <.0001 1.48 <.0001 1.35 x13 0.1296 1.92 0.1286 1.76 0.1254 1.76 0.1094 1.74 s14 0.8804 6.66 Den reviderade modellen presenteras nedan. Y FF = α + β 1 S 1 + β 2 s 3 + β 3 x 6 + β 4 x 7 + β 5 x 12 (5.2) Beroende variabel Y FF : Direktavkastning
KAPITEL 5. RESULTAT OCH ANALYS 23 Tabell 5.4: ANOVA tabell - företag inom fastighet och finans Variansanalys (ANOVA) Reviderad modell - FF-företag Källa Frihetsgrader SS MS F-värde Pr >F Modell 5 522.08711 104.41742 79.31 <.0001 Felterm 78 102.69238 1.31657 Total 83 624.77949 Tabell 5.5: Parameterskattningar - FF-företag Parameterskattning Revidierad modell - företag Variabel DF Skattning Standardfel T värde Pr > t VIF Intercept 1 5.46706 0.27888 19.6 <.0001 0 s1 1-1.1645 0.33297-3.5 0.0008 3.48307 s3 1-1.45732 0.41989-3.47 0.0008 5.7119 x6 1-0.00963 0.00119-8.08 <.0001 1.19856 x7 1 0.00329 0.000216 15.24 <.0001 2.95038 x12 1-0.4009 0.06386-6.28 <.0001 1.348 Från tabell 5.5 kan den skattade funktionen som modellerar direktavkastningen för företag inom fastighet och finans, Ŷ FF från ekvation (5.2), skrivas som: Ŷ FF = 5.47 1.16s 1 1.46s 3 9.63 10 3 x 6 + 3.29 10 3 x 7 0.40x 12 (5.3) Modellen i sin helhet är signifikant, och undersöker man varje enskild variabel ser man att dessa också är signifikanta. Multikollinearitet är inget problem i denna modell då VIF-värdet för samtliga variabler uppfyller tumregeln att de är mindre 10.
24 KAPITEL 5. RESULTAT OCH ANALYS (a) Revidierad modell (b) Revierad modell med hänsyn till extrempunkter Figur 5.1: Normal Q-Q plot - företag inom fastighet och finnans Från figur 5.1 kan man se att det experimentella värdet följer den teoretiskt räta linjen men att det förekommer några extremvärden, bland annat tre värden som ligger till höger i Q-Q plotten. Exkluderar man dessa från modellen fås en bättre modell. I och med detta uppfylls antagandet om normalfördelade residualer. Figur 5.2: Residualer mot skattvärde - företag inom fastighet och finans 2.5 2 1.5 1 Residualer 0.5 0-0.5-1 -1.5-2 -2.5 0 2 4 6 8 10 12 14 16 Skattad värde I figur 5.2 ser vi att residualerna är utspridda så länge direktavkastningen är mindre än 8 därefter är det svårare att dra några slutsatser för att vi har få datapunkter.
KAPITEL 5. RESULTAT OCH ANALYS 25 För att undersöka om autokorrelation råder utfördes ett Durbin- Watson test, och från tabell 5.6 ser man en stark autokorrelation. Tabell 5.6: Durbin-Watson test - FF-företag DW Pr <DW Pr >DW 1.1652 <.0001 1.0000 Sammanfattningsvis kan man se i tabell 5.7 att alla modeller är signifikanta. Vidare kan man se att Radj 2 ökar och AIC minskar vid varje revidering fram till modell 4. Vid revideringen från modell 4 till modell 5 minskar Radj 2 medan AIC ökar, men dessa förändringar är små och modell 5 uppfyller signifikansnivån som eftersträvades för alla oberoende variabler. Modellen förbättrades ytterligare när man tog hänsyn till extremvärden. Tabell 5.7: Resultat för företag inom fastighet och finans. M: Modell, M5UE - modell 5 med hänsyn till extrempunkter M1 M2 M3 M4 M5 M5UE n 84 84 84 84 84 81 k 15 13 11 9 6 6 F-värde 27.43 32.88 40.5 59.32 79.31 105.05 P-värde <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 R 2 0.8477 0.8475 0.8473 0.8453 0.8356 0.8750 Radj 2 0.8168 0.8217 0.8264 0.831 0.8251 0.8667 AIC 278.9 275.0 271.1 266.2 267.3 238.8
26 KAPITEL 5. RESULTAT OCH ANALYS 5.3 Reviderad modell - Industriella företag Som i fallet med FF-företag utgick vi från resultaten i tabell 5.2. Som redan har påpekats måste man vara försiktig när insignifikanta variabler tas bort från en modell då det finns en risk att andra signifikanta variabler förlorar sin signifikans. För industriella företag gjordes totalt tre modellrevideringar. Vid varje revidering togs hänsyn till hur väl modellen i sin helhelt stämmer överens med data, och P- och VIFvärdet för varje förklarande variabel. Som vid modellrevideringen för FF-företag så eftersträvades ett minimalt AIC, och en signifikansnivå på 5 % för alla oberoende variabler. Tabell 5.8: Modellrevideringar för industriella företag, P-värde från t- test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 P VIF P VIF P VIF P VIF α 0.0001 0 0.0001 0 0.0001 0 0.0001 0 s1 00.1495 11.1 0.0443 6.73 0.0484 6.69 s2 00.3921 3.59 s3 0.0122 5.66 0.0055 4.15 0.004 3.85 0.0002 3.33 x4 0.0096 10.3 0.0009 3.90 0.0019 3.87 <.0001 1.90 x5 0 0.163 2.73 x6 0.0093 9.21 0.0035 4.14 0.0174 3.57 0.0071 2.98 x7 00.8631 18.2 x8 00.4159 1.71 x9 0.0286 1.48 0.0335 1.44 0.015 1.37 0.0068 1.31 x10 00.1361 1.51 0 0.129 1.43 x11 00.9775 1.21 x12 00.0526 3.26 00.0718 3.14 00.2728 2.59 x13 00.0685 1.513 00.1164 1.35 s14 0.0081 9.52 0.0005 6.92 0.0019 6.21 0.0025 1.52 Den slutliga modellen för industriella företag blir: Y Ind = α + β 1 S 3 + β 2 x 4 + β 3 x 6 + β 4 x 9 + β 5 s 14 (5.4) Beroende variabel Y Ind : Direktavkastning
KAPITEL 5. RESULTAT OCH ANALYS 27 Tabell 5.9: ANOVA-tabell - Industriella företag Variansanalys (ANOVA) Revidierad modell - Industriella företag Källa Frihetsgrader SS MS F-värde Pr >F Modell 5 177.4348 35.48695 19.31 <.0001 Felterm 84 154.3848 1.83791 Total 89 331.8195 Tabell 5.10: Parameterskattning - Industriella företag Parameterskattning Revidierad modell - Industriella företag Variabel DF Skattning Standardfel T värde Pr > t VIF α 1 3.22911 0.42572 7.59 <.0001 0 s3 1-12.3935 3.19401-3.88 0.0002 3.33477 x4 1 0.01034 0.00158 6.54 <.0001 1.89821 x6 1 0.02433 0.00882 2.76 0.0071 2.98389 x9 1-0.33867 0.12211-2.77 0.0068 1.31698 s14 1-7.9691 2.55623-3.12 0.0025 1.52138 Från tabell 5.10 kan den skattade funktion som modellerar direktavkastningen för industriella företag, ŶInd från ekvation (5.4), skrivas som: Ŷ Ind = 3.229 12.39s 3 + 1.034 10 3 x 4 + 2.433 10 2 x 6 0.3387x 9 7.969s 14 (5.5) Modellen i sin helhet är signifikant och undersöker man varje enskild variabel ser man att dessa är också signifikanta. Multikollinearitet är inget problem i denna modell då VIF-värdet för samtliga variabler fyller tumregeln att de är mindre 10. Från figur 5.3 kan man se att det experimentella värdet följer den teoretiskt räta linjen men att det förekommer några extremvärden, bland tre värden som ligger till höger och fyra värden som ligger i den nedre delen av Q-Q plotten. Exkluderar man dessa från modellen fås en bättre modell. I och med detta uppfylls antagandet om normalfördelade residualer.
28 KAPITEL 5. RESULTAT OCH ANALYS (a) Revidierad modell (b) Revierad modell med hänsyn till extrempunkter Figur 5.3: Normal Q-Q plot - industriella företag Figur 5.4: Residualer mot skattvärde - industriella företag 2.5 2 1.5 1 Residualer 0.5 0-0.5-1 -1.5-2 -1 0 1 2 3 4 5 6 7 Skattad värde I figur 5.4 ser vi att residualerna är helt oberoende direktavkasningen vilket de bör vara enligt de antaganden vi gör om dem. För att undersöka om autokorrelation råder utfördes ett Durbin-Watson test, och från tabell 5.11 ser man precis som för modellen för FF-företagen en stark autokorrelation. Tabell 5.11: Durbin-Watson - Industriella företag DW Pr <DW Pr >DW 1.0687 <.0001 1.000
KAPITEL 5. RESULTAT OCH ANALYS 29 Sammanfattningsvis kan man se i tabell 5.12 att de reviderade modellerna är fortsatt signifikanta, R 2 har förvisso minskat men det justerade värdet är ungefär detsamma. AIC-värdet ökar något mellan modell 2 och modell 4, men denna ökning är väldigt liten och i modell 4 uppfyller alla förklarande variabler signifikansnivån 5 %. Tabell 5.12: Resultat för industriella företag - M: Modell, M5UE - modell 4 med hänsyn till extrempunkter M1 M2 M3 M4 M4UE n 90 90 90 90 83 F-värde 8.11 12.42 14.75 19.31 41.29 P-värde <.0001 <.0001 <.0001 <.0001 <.0001 R 2 0.6022 0.5828 0.5574 0.5347 0.7283 Radj 2 0.528 0.5359 0.5196 0.5070 0.7107 AIC 319.865666 314.160855 315.490513 315.976371 191.951051
30 KAPITEL 5. RESULTAT OCH ANALYS 5.4 Reviderad modell - Företag inom THT Som tidigare utgick vi här från resultatet från tabell 5.2. Man såg att de flesta av de förklarande variablerna var inte signifikanta för modellen. Som det tidigare har påpekats behövs en stegvis modellrevidering. Nedan presenteras de stegvisa revideringen av modellen för THT-företag. Vid varje revidering togs hänsyn till hur väl modellen i sin helhelt stämmer överens med data, P- och VIF-värdet för varje förklarande variabel. Även hät eftersträvades ett minimalt AIC, och en signifikansnivå på 5 % för alla oberoende variabler. Gällande modellrevideringen bör dock nämnas att mycket arbete döljer sig bakom steget mellan modell 4 och modell 5. I modell 4 är alla fem kvarvarande förklarande variabler insignifikanta. De variabler med högst P-värden i denna tabell är x 5, x 12 och x 14. Om dessa stegvis tas bort blir de kvarvarande variablerna, x 9 och x 10, fortsatt insignifikanta. Därför testades alla möjliga revideringar av modell 4, och detta mynnade ut i modell 5 som har signifikanta förklarande variabler som även har lägst AIC. Tabell 5.13: Modellrevideringar för THT-företag, P-värde från t-test samt tillhörande VIF-värde Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 P VIF P VIF P VIF P VIF P VIF α <.0001 0.00 <.0001 0.00 <.0001 0.00 <.0001 0.00 <.0001 0 s1 0.4644 237 0.4589 209 0.6123 36.4 s2 0.2111 103 0.188 95.3 0.1035 25.4 s3 0.5566 660 0.5583 603 x4 0.8460 18.3 x5 0.3245 7.46 0.1515 3.73 0.1374 3.51 0.5708 1.52 x6 0.6365 74.9 0.5898 64.9 x7 0.4628 202 0.4527 188 0.3647 84.0 x8 0.8173 2.88 x9 0.4407 4.95 0.1654 2.53 0.1852 2.41 0.0593 2.19 x10 0.0899 1.41 0.0443 1.16 0.0419 1.15 0.0596 1.13 0.0328 1 x11 0.6733 1.55 0.6375 1.32 x12 0.4243 5.47 0.3781 3.91 0.2841 3.57 0.4805 2.56 0.0016 1 x13 0.9861 4.80 s14 0.6744 16.61 0.5115 7.72 0.3845 5.67 0.5387 1.83
KAPITEL 5. RESULTAT OCH ANALYS 31 Den slutgiltiga modellen för THT-företagen ges av den nedanstående ekvationen. Här beror direktavkastningen endast av x 10 och x 12. Y THT = α + β 1 x 10 + β 4 x 12 (5.6) Beroende variabel Y THT : Direktavkastning Tabell 5.14: ANOVA - THT-företag Variansanalys (ANOVA) Reviderad modell - THT-företag Källa Frihetsgrader SS MS F-värde Pr >F Modell 2 125.84159 62.92080 7.90 0.0009 Felterm 56 445.96093 7.96359 Total 58 571.80252 Tabell 5.15: Parameterskattning - THT-företag Parameterskattning Reviderad modell - THT-företag Variabel DF Skattning SE t-värde Pr > t VIF α 1 6.68289 0.81828 8.17 <.0001 0 x10 1-0.03761-0.01718-2.19 0.0328 1.000 x12 1-0.67849-0.20445-3.32 0.0016 1.000 Från tabell 5.15 framgår att den skattade funktionen som modellerar direktavkastningen för företag inom THT, ŶTHT från ekvation (5.6), skrivas kan som: Ŷ THT = 6.6828 0.03761x 10 0.6784x 12 (5.7) Modellen i sin helhet är signifikant, dock har den en högre signifikansnivå än de andra. Undersöker man varje enskild variabel ser man att dessa också är signifikanta. Multikollinearitet är inget problem då VIFvärdet för samtliga variabler är mindre 10.