Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression

Relevanta dokument
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressionsanalys av lägenhetspriser i Spånga

Multipel Regressionsmodellen

Linjär regressionsanalys. Wieland Wermke

Regressions- och Tidsserieanalys - F4

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Sänkningen av parasitnivåerna i blodet

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Analys av bostadsrättspriset i Stockholms innerstad

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F19, (Multipel linjär regression forts) och F20, Chi-två test.

NÄR SKA MAN SÄLJA SIN BOSTAD?

10.1 Enkel linjär regression

Föreläsning 12: Regression

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

En nyttomaximerande skola i det innovationsdrivna samhället

Medicinsk statistik II

Industriell matematik och statistik, LMA /14

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

LABORATION 3 - Regressionsanalys

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Matematisk statistik, Föreläsning 5

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

, s a. , s b. personer från Alingsås och n b

Prissättningsanalys av annonser på internet

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Regressions- och Tidsserieanalys - F7

LABORATION 3 - Regressionsanalys

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Prediktion av villapris

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Föreläsning 4. Kap 5,1-5,3

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Metod och teori. Statistik för naturvetare Umeå universitet

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Grundläggande matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Lektionsanteckningar 11-12: Normalfördelningen

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 12: Linjär regression

Analys av faktorer som påverkar bränsleförbrukningen i en personbil

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Hur skriver man statistikavsnittet i en ansökan?

InStat Exempel 4 Korrelation och Regression

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Skrivning i ekonometri torsdagen den 8 februari 2007

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TVM-Matematik Adam Jonsson

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik för D, I, Π och Fysiker

7.5 Experiment with a single factor having more than two levels

OBS! Vi har nya rutiner.

Laboration 2 multipel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Lösningar till SPSS-övning: Analytisk statistik

Medicinsk statistik II

Regressionsanalys av huspriser i Vaxholm

tentaplugg.nu av studenter för studenter

MVE051/MSG Föreläsning 14

8 Inferens om väntevärdet (och variansen) av en fördelning

Repetitionsföreläsning

F3 Introduktion Stickprov

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Finansiell statistik

HYPOTESPRÖVNING sysselsättning

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Laboration 2: Styrkefunktion samt Regression

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Att välja statistisk metod

Prediktion av bostadsrättspriser i Stockholms innerstad

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Finansiell statistik. Multipel regression. 4 maj 2011

Transkript:

DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2015 Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON, REBECCA KÄLLSBO KTH ROYAL INSTITUTE OF TECHNOLOGY SCI SCHOOL OF ENGINEERING SCIENCES

Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON REBECCA KÄLLSBO Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 credits) Civilingenjörsutbildning i industriell ekonomi (300 credits) Kungliga Tekniska Högskolan 2015 Handledare på KTH Henrik Hult och Anna Jerbrant Examinator Boualem Djehiche TRITA-MAT-K 2015:26 ISRN-KTH/MAT/K--15/26--SE Kungliga Tekniska Högskolan Skolan för Teknikvetenskap KTH SCI SE-100 44 Stockholm, Schweden URL: www.kth.se/sci

Abstract This thesis combines mathematical statistics with industrial economics and management to examine the profitability of the fitness industry in Sweden. The study was conducted with a dozen fitness businesses and the data mainly consisted of the companies annual reports from 2009 to 2014. The operating margin is the measure for profitability used in the calculations. A survey was conducted with multiple linear regressions to identify explanatory variables that affect the profitability and the extent of influence by these variables. The results of the regression analysis are discussed from economic aspects. This thesis contributes with strategic conclusions to the development of a business model for new and existing fitness businesses that aim to maximize profitability. The thesis can also be used as a tool in strategic development and give insight to how companies should approach the market. It includes an analysis of the competitive forces and external factors that may affect companies in the industry. Risk factors and growth opportunities are taken into account in the discussion about how companies can finance their operations. The regression analysis concludes that it is primarily the factors that affect the companies revenues and costs that have a significant impact on profitability. However, the results of the thesis also indicate that qualitative factors have a major impact on profitability. 1

Sammanfattning Detta examensarbete, inom matematisk statistik och industriell ekonomi, undersökte lönsamheten i gymbranschen i Sverige. Studien genomfördes på ett tiotal gymaktörer där data främst baserades på företagens årsredovisningar från 2009 till 2014. Vid beräkningar användes rörelsemarginalen som lönsamhetsmått. Undersökningen genomfördes med multipel linjär regression för att identifiera förklarande variabler som påverkar lönsamheten och dessa variablers faktiska påverkan. Resultatet från regressionsanalysen diskuteras utifrån ekonomiska aspekter. Arbetet bistår med strategiska slutsatser som bidrar till utformningen och utvecklingen av en affärsmodell till såväl nya som befintliga gymaktörer som strävar efter att maximera lönsamheten. Arbetet kan även användas som ett verktyg för att utveckla en strategi för hur företag ska förhålla sig till marknaden. Det inkluderar en analys av konkurrenskrafter och omvärldsfaktorer som kan påverka företag i branschen. Även riskfaktorer och tillväxtmöjligheter diskuteras med hänsyn till hur företag kan finansiera verksamheten. Slutsatsen utifrån regressionsanalysen är att det framförallt är faktorer som påverkar företagets intäkter och kostnader som påverkar lönsamheten. Dessutom diskuteras kvalitativa faktorers påverkan på lönsamheten. 2

Innehåll Tabellförteckning... 5 Figurförteckning... 5 1 Inledning... 6 1.1 Bakgrund... 6 1.2 Syfte... 6 1.3 Problemformulering... 7 2 Teori... 8 2.1 Multipel Linjär Regressionsanalys... 8 2.1.1 Antaganden... 8 2.1.2 Variabler... 9 2.1.3 Ordinary Least Square... 9 2.2 Modellfel... 10 2.2.1 Multikolinjäritet... 10 2.2.2 Endogenitet... 10 2.2.3 Heteroskedasticitet... 11 2.3 Modellvalidering... 12 2.3.1 Hypotestestning... 12 2.3.2 T-test... 12 2.3.3 Kritik mot hypotestest och p-värde... 13 2.3.4 Eta squared... 13 2.3.5 Förklaringsgrad... 14 2.3.6 AIC och BIC... 15 2.3.7 VIF... 15 2.3.8 Normal Q-Q Plot... 16 2.3.9 Residual Plot... 17 3 Metod... 19 3.1 Urval av variabler... 19 3.1.1 Responsvariabel... 19 3.1.2 Förklaringsvariabler... 19 3.2 Datainsamling... 22 3.2.1 Kvantitativ datainsamling... 22 3.2.2 Kvalitativ datainsamling... 22 3.3 Studiens omfattning... 22 3.4 Avgränsningar... 23 3.4.1 Urval av observationer... 23 3.4.2 Geografiska områden... 23 3.4.3 Val av variabler... 24 3.5 Grundmodell... 24 3.5.1 Parameterförklaring... 25 4 Resultat... 26 4.1 Grundmodell... 26 4.1.1 VIF... 26 4.1.2 Skattning av grundmodell... 27 4.1.3 Förklaringsgrad... 27 4.2 Reducering av modell... 27 4.2.1 P-värde och eta squared... 27 3

4.2.2 AIC och BIC... 28 4.2.3 Reducering av variabler... 28 4.3 Slutgiltig modell... 31 4.3.1 Skattning av slutmodell... 31 4.3.2 Slutekvation... 31 4.3.3 Förklaringsgrad... 31 4.3.4 Residual Plots... 32 4.3.5 Normal Q-Q Plot... 32 5 Diskussion... 34 5.1 Analys av slutgiltig modell... 34 5.2 Marknadsstrategi och affärsmodell... 40 5.2.1 Marknadsstrategi... 40 5.2.2 Affärsmodell... 44 5.3 Finansiering... 47 5.3.1 Tillväxtmöjligheter... 47 5.3.2 Osäkerhetsfaktorer i branschen... 47 5.3.3 Ägarförhållanden... 49 5.3.4 Franchise... 49 5.4 Långsiktig lönsamhet... 51 5.4.1 Porters femkraftsmodell... 51 5.4.2 PEST... 56 5.5 Utvecklingsmöjligheter... 57 6 Slutsats... 58 7 Referenser... 60 Appendix... 64 4

Tabellförteckning Tabell 1. Medverkande företag i undersökningen... 23! Tabell 2. Beskrivning av grundmodellens variabler... 25! Tabell 3. Beräknade VIF-värden för samtliga variabler... 26! Tabell 4. Resultat från regression av grundmodell... 27! Tabell 5. Underlag för reducering av bindningstid... 28! Tabell 6. Resultat från regression efter första reduceringen... 29! Tabell 7. Underlag för reducering av anläggningar... 29! Tabell 8. Resultat från regression efter andra reduceringen... 29! Tabell 9. Underlag för reducering av pris... 30! Tabell 10. Resultat från regression efter tredje reduceringen... 30! Tabell 11. Underlag för reducering av franchise... 30! Tabell 12. Resultat av slutgiltig modell... 31! Tabell 13. Skuldsättningsgrad för företagen i studien... 48! Figurförteckning Figur 1. Normal Q-Q Plot vid normalfördelade residualer... 16! Figur 2. Normal Q-Q Plot vid icke-normalfördelade residualer... 17! Figur 3. Residual Plot vid homoskedasticitet... 17! Figur 4. Residual Plot vid heteroskedasticitet... 18! Figur 5. Residual Plot År på marknaden... 32! Figur 6. Normal Q-Q Plot... 33! Figur 7. SATS rörelsemarginal över tiden... 35! Figur 8. SATS antal anläggningar över tiden... 35! Figur 9. Rörelsemarginalen för gymkedjorna i undersökningen i jämförelse med den genomsnittliga rörelsemarginalen i branschen... 42! Figur 10. Residual Plot Anställda... 64! Figur 11. Residual Plot Enskilt gym... 64! Figur 12. Residual Plot Franchise... 64! Figur 13. Residual Plot Gruppklasser... 65! Figur 14. Residual Plot Medlemmar per anläggning... 65! Figur 15. Residual Plot År på marknaden... 65! Figur 16. Residual Plot Öppettider... 65! 5

1 Inledning 1.1 Bakgrund Gymmarknaden består av en rad stora kedjor och enskilda gym. Marknaden har de senaste åren varit på stark uppgång och gymaktörerna omsätter mångmiljonbelopp. De befintliga aktörerna blir större samtidigt som nya aktörer tillkommer. Finanskrisen 2008 påverkade andra branscher negativt genom låg konsumtion, medan de största aktörerna inom gymbranschen ökade sin omsättning med 80 % under en femårsperiod. [1] Trots marknadens starka tillväxt är det hög konkurrens. Gymaktörerna väljer därför olika sätt att profilera sig för att utmärkas på marknaden och därmed kunna ta stora marknadsandelar [2]. För att attrahera kunder erbjuds allt från lågpris- till premiumgym med helhetskoncept och en rad tilläggstjänster. De gym som använder sig av en lågprisstrategi har ofta lägre personaltäthet. Motsatsen är de som använder sig av en differentieringsstrategi. De tar mer betalt för ett medlemskap men har istället högre personaltäthet, exklusivare anläggningar, gruppklasser och tjänster som exempelvis barnpassning. Marknaden är i ständig förändring och påverkas i stor utsträckning av trender i samhället. Aktörerna förändrar sitt produktutbud för att kunna interagera med marknadens förändringar och möta kundernas efterfrågan. Majoriteten av gymaktörerna har det gemensamma målet att skapa lönsamhet. 1.2 Syfte Syftet med detta examensarbete är att undersöka hur gymaktörers marknadsstrategi och affärsmodell påverkar lönsamheten. Arbetet vänder sig till företag i branschen med mål att maximera lönsamheten. Genom att visa på vilka faktorer som har en linjär korrelation med lönsamheten bistår arbetet med ett verktyg för företag i deras strategiarbete samt utformning och utveckling av deras affärsmodell. Detta arbete är framförallt av intresse 6

för nya företag med mål att inta marknaden men även för strategisk affärsutveckling för befintliga företag på marknaden. 1.3 Problemformulering Frågeställningen för problemet är följande Vilka kvantitativa faktorer har störst påverkan på lönsamheten i gymbranschen och hur stor är respektive faktors påverkan? Hur påverkar kvalitativa faktorer lönsamheten? Hur kan hänsyn tas till samtliga faktorer för att förbättra lönsamheten för befintliga företag och skapa förutsättningar för nya företag att inta marknaden? 7

2 Teori 2.1 Multipel Linjär Regressionsanalys Modellen som används vid multipel linjär regressionsanalys är!!! =!!!!!"!! +!!!!!!!!!!!!! = 1,.,! (1) Värdet på den beroende variabeln y beror av ett antal förklarande variabler!!, så kallade kovariat, och residualerna!!. Responsvariabeln och kovariaten är givna medan residualerna är stokastiska variabler. Regressionskoefficienterna!! för kovariaten estimeras med modellen. Modellen innehåller k kovariat och n observationer [3]. Modellen skrivs med matrisnotation! =!" +! (2) där! =!!!!,! =!! 1!!!!!! 1!!"!!!,! = 1!!!!!"!!!!,! =!!!!!!!! 2.1.1 Antaganden Den linjära regressionsmodellen utgår från att följande antaganden uppfylls [4] Den beroende variabeln kan uttryckas som en linjär funktion av de oberoende variablerna och en felterm. Detta uttrycks enligt (1). Anledningar till att antagandet inte uppfylls kan vara felaktiga kovariat, icke-linjäritet eller icke-konstanta skattningar av!. Feltermerna har väntevärde noll, det vill säga!!! = 0. Detta innebär att regressionslinjen, i genomsnitt, är korrekt [5]. 8

Modellen är homoskedastisk, vilket innebär att variansen hos feltermerna är konstant. Detta formuleras enligt!!!! =!!. Feltermerna antas dessutom vara okorrelerade [4]. Feltermerna är normalfördelade [3]. Ingen multikolinjäritet (se avsnitt 2.2.1) mellan de oberoende variablerna. 2.1.2 Variabler Variabler som används vid multipel linjär regressionsanalys är [3] Kvantitativa variabler: Variabler som antar det värde som observeras. Dummy-variabler: Variabler som anger en egenskap. Variabeln kan anta värdet 0 eller 1. Om värdet på variabeln är 1 innehar observationen egenskapen och om värdet är 0 saknar observationen egenskapen. 2.1.3 Ordinary Least Square Ordinary Least Square, OLS, används för att estimera värden på regressionskoefficienterna!. Dessa värden betecknas! och är de värden som minimerar kvadratsumman av residualerna!! [3]. OLS-estimatet av! erhålls utifrån normalekvationerna!!! = 0 (3) där! =!!! (4) (4) i (3) ger!!!!! =!!!!!!!! =!!!!! =!!!! =!!!!!!!! (5) 9

2.2 Modellfel 2.2.1 Multikolinjäritet Multikolinjäritet uppstår när två eller flera av de oberoende variablerna i regressionsmodellen i hög utsträckning är korrelerade med varandra. Detta är ett problem då det medför att det är svårt att hålla isär effekterna av de oberoende variablerna på den beroende variabeln. Multikolinjäritet kan leda till att matrisen!!! är nära icke-inverterbar [5] och detta kännetecknas av höga standardavvikelser och oväntade storlekar eller tecken på de skattade regressionskoefficienterna. För att undvika multikolinjäritet bör många observationer användas i modellen där värdet på variablerna varierar. Om multikolinjäritet trots detta uppstår, kan en eller flera variabler som i hög utsträckning korrelerar uteslutas. Alternativt kan de korrelerade variablerna sammanfogas [6]. 2.2.2 Endogenitet Endogenitet uppstår då det finns en korrelation mellan residualen och en eller flera kovariat. I detta fall uppfylls inte antagandet om att feltermerna har väntevärde noll, vilket leder till att OLS inte ger konsekventa estimat. Problemet med endogenitet kan lösas genom att tillämpa Two Stage Least Square, 2SLS, som ersättning för OLS [3]. Den endogena variabeln ersätts då med en eller flera instrumentvariabler. En instrumentvariabel är en variabel som är korrelerad med den endogena variabeln, men okorrelerad med residualen. På så sätt kan den endogena variabeln uteslutas ur modellen och därefter genomförs 2SLS för att ta fram skattningar på regressionskoefficienterna. Nedan följer exempel på situationer som leder till endogenitet [3]. Utelämnande av relevanta variabler Om en relevant variabel utelämnas ur modellen kommer effekten av denna variabel inrymmas i residualen. För att undvika detta problem är det därför viktigt att identifiera så många relevanta variabler som möjligt innan regressionen utförs. 10

Simultaneity Simultaneity innebär att den beroende variabeln har en inverkan på en eller flera kovariat. Detta betyder att den påverkande effekten verkar i två riktningar och endogenitet uppstår. Sample selection bias Sample selection bias uppstår då selektionen av data inte är slumpvis vald från ett större stickprovsunderlag. Detta leder till problem med endogenitet och det finns risk för missvisande slutsatser. Mätfel Mätfel i de oberoende variablerna leder till endogenitet då det uppstår korrelation mellan dessa variabler och residualen. Eventuella mätfel i responsvariabeln leder inte till endogenitet, utan det adderar istället en komponent i residualen. 2.2.3 Heteroskedasticitet Heteroskedasticitet innebär att variansen hos feltermerna inte är konstanta [5], vilket är en förutsättning för OLS. Detta påverkar standardavvikelserna och signifikansen för de estimerade koefficienterna. Standardavvikelsen för koefficienterna kommer att vara större eller mindre än vad de ska vara. Detta medför i sin tur att hypotestesten (se avsnitt 2.3.1) för vilka koefficienter som ska ingå i modellen inte blir korrekta. Heteroskedasticitet uttrycks enligt [3]!!!! =!!! (6) För att åtgärda problemet med heteroskedasticitet kan modellen omformuleras genom att addera förklarande variabler eller genom transformation av de befintliga variablerna. Ett annat alternativ är att använda White s Consistent Variance Estimator. Kovariansmatrisen estimeras då enligt!"#! =!!!!!!!!!!!!!!!!!!!!!! (7) 11

Standardavvikelserna beräknas då genom att ta kvadratroten ur diagonalelementen för denna matris [5]. Regressionen kan sedan genomföras med OLS som tidigare. 2.3 Modellvalidering Nedan följer en rad olika metoder som kan användas för att utvärdera regressionsmodellen och för att reducera kovariat som inte bidrar med förklaringsvärde till modellen. 2.3.1 Hypotestestning Hypotestest kan användas för att undersöka vilka kovariat som ska ingå i modellen. Nollhypotesen!! är att koefficienten för det aktuella kovariatet är noll, vilket är detsamma som att kovariatet ska uteslutas ur modellen. Mothypotesen!! är att koefficienten är skiljt från noll och motsvarar att kovariatet inkluderas. Detta kan matematiskt betecknas enligt följande!! :!!! = 0!! :!!! 0 Vid hypotestestning beräknas en teststatistika utifrån det observerade stickprovet. Beräkningen baseras på en given fördelning under antagandet att nollhypotesen är sann [5]. För att testa om hypotesen ska förkastas beräknas p-värdet (se avsnitt 2.3.2) för att undersöka om detta värde är osannolikt att komma från denna fördelning, vilket indikerar att nollhypotesen inte är sann. 2.3.2 T-test T-test är en typ av hypotestest som utvärderar varje regressionskoefficient för sig. Teststatistika för hypotesen!! =!! ges av [7]!! =!!!!!!"(!! ) (8) 12

som har en t-fördelning med!! frihetsgrader och beräknas under antagandet att nollhypotesen är sann [5]. Antal observationer betecknas! och antal kovariat betecknas!.!! är det estimerade värdet för den aktuella koefficienten som undersöks och!"(!! ) är dess standardavvikelse.!"(!! ) fås genom att ta kvadratroten ur!!! som är diagonalelementen i matrisen!!! [3]. För att kontrollera om nollhypotesen ska avvisas studeras p-värdet, vilket ges av Pr!(! >! ), där X har t-fördelning. P-värdet anger sannolikheten att erhålla ett minst lika extremt resultat som det observerade, under antagandet att!! är sann [5]. Om p-värdet för det observerade värdet! är större än en förutbestämd signifikansnivå kan nollhypotesen inte avvisas och det aktuella kovariatet utesluts ur modellen [7]. 2.3.3 Kritik mot hypotestest och p-värde P-värdet används, som nämnt ovan, vid hypotestestning för att fatta beslut om modellen ska reduceras. Om p-värdet understiger det traditionella värdet 0,05 avvisas nollhypotesen och resultat anses vara statistiskt signifikant. En nackdel med hypotestest är att nollhypotesen i princip aldrig stämmer, vilket betyder att avvisning av nollhypotesen är relativt intetsägande [8]. Variabler som tas med i grundmodellen har sällan en koefficient som är precis noll, vilket är det som testas i nollhypotestest. Ytterligare kritik är att stickprovsunderlagets storlek har stor effekt på de p-värden som genereras [9]. Vid få observationer tenderar p-värdet att överreducera modellen. Vid ett stort antal observationer sker det motsatta, p-värdet indikerar att samtliga variabler har betydande effekt på responsvariabeln, trots att effekterna kan vara triviala. För att undvika problemet och minimera risken att effekten av variabler under- eller överestimeras bör även effektstorleken för respektive variabel beräknas och utvärderas som ett komplement till hypotestestet [10]. 2.3.4 Eta squared Ett mått som anger storleken av effekten från en variabel men som är oberoende av stickprovets storlek är eta squared,!!. Eta squared beräknas för alla variabler i modellen och definieras som kvoten mellan variansen som 13

den aktuella variabeln bidrar med och den totala variansen. Detta beräknas enligt!! =!!!!!!! (9) där!! är kvadratsumman av residualerna från den reducerade modellen och!! är kvadratsumman av residualerna från den ursprungliga modellen. Måttet tolkas som andelen av den totala variansen som kan kopplas till ett kovariat [11]. Ett lågt värde på eta sqaured indikerar därmed att variabeln bidrar med en liten effekt till modellen och att modellen ska reduceras. Ett värde bedöms som lågt om det understiger 0,02 [12]. 2.3.5 Förklaringsgrad Förklaringsgrad!! är ett mått på andelen av variansen i responsvariabeln som kan förklaras av kovariaten i modellen och används därmed för att utvärdera den linjära approximationen som fås ut vid OLS.!! kallas även goodness-of-fit, vilket syftar till hur väl den linjära approximationen passar de givna observationerna. Målet är att modellen ska ha så hög förklaringsgrad som möjligt. Förklaringsgraden betecknas enligt [7]!! =!"#(!!)!"#(!) = (!!!!)! (!!!!)! (10) En nackdel med!! är att den inte minskar om antalet variabler ökar, även om de adderade variablerna inte har något förklaringsvärde [5]. Detta betyder att!! kommer att föredra en modell med fler förklarande variabler. För att ta hänsyn till antal frihetsgrader kan justerad förklaringsgrad,!!, användas [3]. Därmed kommer!! minska om en adderad variabel inte tillför något förklaringsvärde till modellen. Justerad förklaringsgrad betecknas enligt [13]!! = 1 (1!! )!!!!!!!! (11) 14

2.3.6 AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) är ytterligare två metoder som kan användas för att ta reda på om en variabel ska ingå i modellen. Precis som den justerade förklaringsgraden!! gynnar inte AIC och BIC en modell med variabler som inte tillför ett högre förklaringsvärde. AIC respektive BIC beräknas för både den reducerade och den oreducerade modellen och den modell som minimerar värdet på AIC och BIC är den modell som ska användas [3]. Den reducerade modellen är den modell där kovariat uteslutits som gav höga p-värden och låga värden på eta sqaured. AIC och BIC definieras enligt!"# =! ln!! + 2! (12)!"# =! ln!! + 1 +! ln!(!) (13) För att jämföra två modeller studeras skillnaden i AIC- respektive BICvärdena.!"# =!"#!"# (14)!"# =!"#!"# (15) där!"# och!"# är värden beräknade från den reducerade modellen. Värden på!"# respektive!"# som är lägre än noll indikerar att modellen ska reduceras. 2.3.7 VIF Variance Inflation Factor, VIF, används för att mäta i vilken utsträckning de oberoende variablerna korrelerar och kan därför användas som verktyg för att upptäcka multikolinjäritet. Den mäter hur mycket variansen hos en estimerad regressionskoefficient ökar om de oberoende variablerna är korrelerade [14]. Ett högt värde på VIF indikerar multikolinjäritet. VIF beräknas genom att utföra en regression där den kovariat som undersöks används som responsvariabel. De övriga kovariaten i modellen används som oberoende variabler [6]. Utifrån förklaringsgraden för denna regression beräknas VIF enligt 15

!"# =!!!!! (16) Det finns inget givet gränsvärde för VIF som avgör om det råder allvarlig multikolinjäritet. Dock är en ofta förekommande rekommendation att VIF bör understiga 10 [15]. En nackdel med VIF är att det vid upptäckt av multikolinjäritet inte anges vilken av de övriga variablerna som den aktuella variabeln korrelerar med. För att få svar på detta krävs ytterligare analys av dessa variabler [14]. 2.3.8 Normal Q-Q Plot En Normal Quantile-Quantile Plot används för att kontrollera att feltermerna är normalfördelade [16]. Detta är, som tidigare nämnt, ett antagande vid OLS. I grafen plottas de standardiserade residualerna mot de teoretiska kvantilerna. Om punkterna i grafen följer en rät linje antas antagandet om att feltermerna är normalfördelade vara korrekt (Figur 1). Om punkterna inte följer en rät linje uppfylls inte antagandet (Figur 2). Standardized Residuals Normal Q-Q Plot 2-1,5 1,5-2 Theoretical Quantiles Figur 1. Normal Q-Q Plot vid normalfördelade residualer 16

Normal Q-Q Plot 40! Standardized Residuals "20! 20! "30! Theoretical Quantiles Figur 2. Normal Q-Q Plot vid icke-normalfördelade residualer 2.3.9 Residual Plot Heteroskedasticitet kan upptäckas genom att studera grafer där residualerna plottas för varje koefficient. Om punkterna i denna graf är slumpmässigt utspridda längs med den horisontella axeln är variansen konstant och homoskedasticitet råder (Figur 3) [6]. Om ett tydligt mönster kan avläsas i grafen och residualernas avstånd till den horisontella axeln varierar vid rörelse längs med axeln, är variansen inte konstant och heteroskedasticitet råder (Figur 4). Figur 3 visar ett exempel på en Residual Plot som visar på homoskedasticitet, där avståndet mellan punkterna och den horisontella axeln är slumpmässigt. I Figur 4 kan ett trattliknande mönster avläsas, därmed är variansen inte konstant vilket visar på heteroskedasticitet. Residuals Residual Plot 0,15! "0,35! 0,23! "0,18! Variable Figur 3. Residual Plot vid homoskedasticitet 17

Residual Plot 0,2 Residuals -0,4 0,4-0,2 Variable Figur 4. Residual Plot vid heteroskedasticitet 18

3 Metod 3.1 Urval av variabler I detta avsnitt motiveras valet av responsvariabeln och förklaringsvariablerna samt hur dessa beräknats för att användas i regressionsmodellen. 3.1.1 Responsvariabel Huvudmålet för aktiebolag är i praktiken att skapa långsiktig lönsamhet. Det finns flera nyckeltal för att mäta lönsamhet och gemensamt är att de anger effektiviteten i företagets resursanvändning för att generera vinst [17]. I rapporten används rörelsemarginal vid beräkningar av lönsamheten. Vinstmarginalen har inte använts som mått då det är ett lönsamhetsmått som påverkas av hur verksamheten har skuldfinansierats och av ränteförändringar [18]. Därmed är vinstmarginalen inte ett lämpligt mått i studien då jämförelser mellan företag görs över tiden. Räntabilitet är ett ytterligare mått som ofta används vid beräkningar av lönsamhet. Detta mått är inte relevant eftersom gymbranschen inte är kapitalintensiv då företagen i stor utsträckning leasar sina anläggningar och träningsredskap, vilket kan utläsas från företagens årsredovisningar [19]. Rörelsemarginal anger hur stor del av omsättningen som blir över för att täcka räntor, skatt och resultat [18]. Rörelsemarginalen grundas på resultatet före räntekostnaderna, vilket medför att hänsyn inte tas till finansiering av verksamheten. Detta betyder att rörelsemarginalen är lämplig att använda vid analys av en hel bransch. Rörelsemarginalen beräknas genom EBIT, rörelseresultat före finansiella poster och skatt, dividerat med nettoomsättningen för året. 3.1.2 Förklaringsvariabler Variablerna i modellen har identifierats genom att utgå från vilka faktorer som kan tänkas påverka lönsamheten. De inkluderade variablerna i 19

undersökningen är anläggningar, anställda, bindningstid, enskilt gym, franchise, gruppklasser, medlemmar per anläggning, pris, år på marknaden och öppettider. Franchise är inte en kundvänd faktor men antas ha påverkan på lönsamheten och tas därför också med i grundmodellen. Nedan följer en förklaring av innebörden av respektive variabel samt de antaganden som gjorts vid beräkningarna. Anläggningar Anläggningar representerar antal anläggningar aktören haft för det aktuella året lönsamheten beräknats för. Då undersökningen baserats på data för ett antal år tillbaka i tiden har antaganden gjorts i de fall som information om antal anläggningar för det aktuella året inte varit tillgänglig. Leasingkostnader antas då variera proportionellt med antal anläggningar. Dock finns det brister i detta antagande då företag med stor sannolikhet förhandlar varje nytt hyreskontrakt för sig och dessutom förhandlar kontinuerligt med befintliga fastighetsägare för att sänka kostnaderna för sina anläggningar. Detta betyder att kostnaderna kan variera från år till år. Antagandet ger därför ett approximativt värde på variabeln. Anställda Anställda anger medelantalet anställda för aktuellt räkenskapsår. Bindningstid Bindningstid representerar det minsta antal månader som en kund är bunden till att betala för ett medlemskap. Majoriteten av gymaktörerna har en avtalad bindningstid på 12 månader. För övriga gym representeras denna variabel av uppsägningstiden för medlemskapet. Enskilt gym Enskilt gym är en dummy-variabel som antar värdet ett för de gym som enbart har en anläggning. För samtliga gym som har mer än en anläggning, det vill säga för gymkedjorna i undersökningen, antar denna variabel värdet noll. 20

Franchise Franchise är en dummy-variabel som antar värdet ett om företaget använder franchise som affärsmodell. Gruppklasser Gruppklasser är en dummy-variabel som antar värdet ett om gymmet har gruppklasser på majoriteten av sina gym. För övriga gym, vilket inkluderar gym som erbjuder gruppklasser enbart på enstaka anläggningar, antar variabeln värdet noll. Medlemmar per anläggning Medlemmar per anläggning anges i tusental. Totalt antal medlemmar har, i de fall data inte tillhandahållits, beräknats utifrån ett antagande om att antal medlemmar årligen förändras proportionerligt mot företagets omsättning, då priset är konstant. Pris Pris anges i hundratal SEK. De flesta gym erbjuder olika typer av medlemskap. Variabeln representerar priset för att kunna träna på gymkedjans samtliga gym i kundens stad eftersom det är det medlemskap de flesta antas välja. I de fall priset varierat mellan olika städer har ett genomsnittligt pris beräknats. År på marknaden Ett starkt varumärke antas korrelera med lönsamheten. Genom att utelämna varumärke från regressionen kan endogenitet uppstå och detta kan leda till stora feltermer. Variabeln år på marknaden antas korrelera med varumärke och fick därmed representera detta. Variabeln anger antal år som företaget varit aktivt på marknaden. Öppettider Öppettider representerar antal timmar som gymmet har öppet i veckan. I vissa fall varierar öppettiderna mellan gymkedjans olika anläggningar. I dessa fall har en genomsnittlig öppettid beräknats. 21

3.2 Datainsamling 3.2.1 Kvantitativ datainsamling För att genomföra regressionsanalysen hämtades kvantitativ data för kovariaten främst från företagens årsredovisningar, men även från deras hemsidor. I årsredovisningarna hämtades information från det aktuella året som lönsamheten beräknades för. För att tillgå den information som var otillgänglig i årsredovisningarna och på hemsidan kontaktades de aktuella företagen. Även data för att beräkna rörelsemarginalen hämtades från respektive företags årsredovisning [19]. 3.2.2 Kvalitativ datainsamling Den kvalitativa datainsamlingen baserades på en 2,5 timmar lång intervju med Göran Järbin, marknadschef på Puls & Träning, som utgick från frågor kring företagets affärsmodell. Även ostrukturerade telefonintervjuer har genomförts med VDs på flera mindre företag. Samtliga företag har kontaktats för vidare information kring övriga frågor. För att undersöka och analysera hur kvalitativa faktorer kan påverka företagens lönsamhet har en litteraturstudie genomförts. Litteraturstudien utgick ifrån på relevanta böcker och vetenskapliga artiklar inom ämnet Industriell Ekonomi, bland annat från Harvard Business Review. Exempel på sökord som använts är strategy, business model, branding och profitability. 3.3 Studiens omfattning Studien omfattar ett tiotal utvalda gymkedjor och enskilda gym. Gymkedjorna som har valts är de största aktörerna på marknaden. De medverkande företagen i undersökningen listas i tabellen nedan (Tabell 1). 22

Tabell 1. Medverkande företag i undersökningen, *brutet räkenskapsår Gymkedjor Omsättning 2013 Mkr Actic 468,9 Balance 42,9 Fitness24Seven* 325,8 Flex 30,1 Itrim 80,5 Nordic Wellness 418,1 Puls & Träning* 56,8 SATS 913,0 STC Training Club 115,9 Worldclass 14,9!! Enskilda gym!! Exclusive Training 6,8 Metropolis 5,9 Planet Fitness 11,9 3.4 Avgränsningar Studien är avgränsad utifrån geografiska områden samt i urvalet av observationer och variabler. 3.4.1 Urval av observationer Arbetet avgränsar sig till studier kring företag med mål att vinstmaximera. Friskis&Svettis, som är en väletablerad gymkedja på marknaden, kommer därför inte behandlas i undersökningen då det är en ideell organisation [20] och därmed inte har vinstmaximering som mål. Även företag som inte har gym som huvudsaklig verksamhet utesluts från undersökningen, exempelvis spa med gymavdelning. Medley, som är en stor aktör på marknaden, utesluts därför ur undersökningen då deras huvudsakliga verksamhet är badanläggningar. 3.4.2 Geografiska områden Samtliga utvalda gymkedjor och enskilda gym är etablerade i Sverige. Studien har inte tagit hänsyn till placering av anläggning på lokal nivå, 23

vilket kan vara en påverkande faktor till varför en anläggning generar lönsamhet. Detta är en brist i arbetet då invånartätheten där anläggningen är placerad troligtvis har en stor påverkan på medlemsantalet. 3.4.3 Val av variabler Faktorer som är en del av produktinnehållet beaktas inte som ett val av affärsmodell och tas därmed inte med i regressionen. Exempel på dessa faktorer är barnpassning, bad, personlig träning och rehabilitering. Inskrivningsavgift är även en variabel som utesluts ur regressionen eftersom den i de flesta fall kan bortförhandlas. Detta har erfarits genom kontakt med respektive aktör. En svårighet vid de matematiska beräkningarna är att det finns variabler som påverkar lönsamheten som är svåra att kvantifiera. Marknadsföring är en variabel som kan antas korrelera med lönsamheten. Dock är frågan hur denna variabel ska mätas för att ge korrekta estimat av koefficienten. Genom att ha en variabel som representerar företagens kostnad för marknadsföring kan estimaten bli felaktiga. Stora ekonomiska satsningar på marknadsföring förväntas bidra positivt till lönsamheten i form av ökad publicitet och därmed fler kunder. Men hänsyn måste även tas till hur denna satsning har använts och om kampanjen som genomförts varit lyckad. Det räcker inte enbart med att satsa ett stort kapital utan det krävs att kampanjen når ut till kunder och därmed ökar antalet medlemmar. Företag som har negativa resultat har satsat på marknadsföring, vilket kan utläsas ur deras årsredovisning [19], vilket kan indikera att marknadsföring har en negativ påverkan på lönsamheten. 3.5 Grundmodell Grundmodellen utgick från att alla identifierade variabler ska ingå. Modellen utvärderades därefter genom statistiska tester för att undersöka vilka variabler som skulle ingå i den slutgiltiga modellen. Regressionerna genomfördes i Microsoft Excel 2010. 24

3.5.1 Parameterförklaring En beskrivning av parametrarna i grundmodellen ges i tabellen nedan (Tabell 2). Tabell 2. Beskrivning av grundmodellens variabler Variabel Benämning Enhet!! Responsvariabel!!! Rörelsemarginal Procent, %!! Kovariat!!!,!! Anläggningar Antal!!,!! Anställda Medelantal!!,!! Bindningstid Månad!!,!! Enskilt gym Dummy: 0 eller 1!!,!! Franchise Dummy: 0 eller 1!!,!! Gruppklasser Dummy: 0 eller 1!!,!! Medlemmar per Tusental anläggning!!,!! Pris! Hundratal!!,!! År på marknaden År!!",!! Öppettider Timmar per vecka Grundekvationen blir då enligt (1)!! =!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!!!!!!!!!!!,!!! +!!",!!!" +!! (17) 25

4 Resultat 4.1 Grundmodell I detta kapitel presenteras skattningarna utifrån grundmodellen. 4.1.1 VIF VIF-test kontrollerar multikorrelation mellan de oberoende variablerna och beräknades enligt (16). Samtliga VIF-värden understiger 10 och påvisar därmed ingen allvarlig multikolinjäritet mellan variablerna (Tabell 3). Variablerna anläggningar och år på marknaden har högst VIF-värde. En viss korrelation antas förekomma mellan dessa variabler då ett företag som varit verksamt längre har haft mer tid att expandera. Dock blir detta motsägelsefullt då även enskilda gym tagits med i modellen. En viss korrelation mellan anställda och anläggningar kan också förekomma eftersom ju fler anläggningar en kedja har desto fler anställda krävs. Detta medför dock ingen allvarlig multikolinjäritet då personaltätheten skiljer sig mellan gymaktörerna. En viss korrelation kan också förekomma mellan enskilt gym och anläggningar eftersom de aktörer som är enskilda gym endast innehar en anläggning. Enskilt gym representerar om gymaktören inte ingår i en kedja och eftersom kedjornas anläggningar skiljer sig i antal medför detta ingen allvarlig multikolinjäritet. VIF-värdet för enskilt gym indikerar också på att ingen allvarlig multikolinjäritet förekommer. Tabell 3. Beräknade VIF-värden för samtliga variabler Variabel VIF Anläggningar 9,91 Anställda 5,94 Bindningstid 3,44 Enskilt gym 5,16 Franchise 3,24 Gruppklasser 4,92 Medlemmar per anläggning 2,15 Pris 1,54 År på marknaden 8,12 Öppettider 3,97 26

4.1.2 Skattning av grundmodell Resultatet som genererades utifrån den första regressionen på rörelsemarginalen anges i tabellen nedan (Tabell 4). Tabell 4. Resultat från regression av grundmodell Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3911 0,2002 1,9537 0,0585-0,0149 0,7970 0,0959 Anläggningar -0,0002 0,0013-0,1411 0,8886-0,0029 0,0025 0,0006 Anställda -0,0003 0,0002-1,5557 0,1285-0,0007 0,0001 0,0630 Bindningstid 0,0004 0,0075 0,0470 0,9628-0,0149 0,0156 0,0001 Enskilt gym -0,3514 0,0844-4,1638 0,0002-0,5226-0,1802 0,3251 Franchise -0,0849 0,0611-1,3884 0,1735-0,2088 0,0391 0,0508 Gruppklasser -0,3725 0,0824-4,5228 0,0001-0,5395-0,2055 0,3623 Medlemmar per anläggning 0,0718 0,0245 2,9370 0,0057 0,0222 0,1215 0,1933 Pris 0,0013 0,0023 0,5369 0,5946-0,0035 0,0060 0,0079 År på marknaden 0,0260 0,0113 2,3031 0,0272 0,0031 0,0489 0,1284 Öppettider -0,0029 0,0011-2,7279 0,0098-0,0051-0,0008 0,1713 4.1.3 Förklaringsgrad Den justerade förklaringsgraden,!!, är 63 %, vilket betyder att 63 % av variationen i lönsamheten är förklarad av variablerna. 4.2 Reducering av modell I detta kapitel presenteras reduceringen av modellen utifrån p-värde, eta squared, AIC och BIC. 4.2.1 P-värde och eta squared För att resultatet ska ha statistisk signifikans ska p-värdet understiga 0,05 och eta squared överstiga 0,02. Den skattningen som har högst p-värde över 0,05 och lägst eta squared under 0,02 utesluts från modellen. Modellen reduceras tills dess att p-värdet understiger 0,05 och eta squared överstiger 0,02. Ett p-värde över 0,05 behöver inte betyda att skattningen ska uteslutas ur regressionen eftersom p-värdet påverkas av antal observationer. Regressionen utförs på 47 observationer, vilket är relativt få, och därmed kan inte enbart p-värdet tala för om modellen ska reduceras. Därför tas även hänsyn till eta squared, AIC och BIC innan modellen reduceras för att undvika överreducering av modellen. 27

Tabell 4 ovan visar att flera kovariat har ett p-värde som överstiger 0,05 och eta squared som understiger 0,02 och detta leder till att modellen reduceras då dessa variabler inte bidrar med värde till modellen. 4.2.2 AIC och BIC För att undersöka reduceringen av modellen beräknades!"# och!"# för varje modell där en kovariat reducerades i taget. För varje reducerad modell genomfördes en ny regression. 4.2.3 Reducering av variabler Bindningstid Den första variabeln som kontrollerades för uteslutning ur modellen är bindningstid. P-värdet för bindningstid är 0,96, vilket indikerar att bindningstid bör reduceras från modellen. Även eta squared antyder att modellen ska reduceras, då eta squared beräknats till 0,0001, vilket understiger 2 %. Dessutom är både!!! och!!! negativa, vilket ytterligare indikerar på att bindningstid ska reduceras från modellen. Den justerade förklaringsgraden är dessutom större efter reduceringen än vid grundmodellen (Tabell 5). Tabell 5. Underlag för reducering av bindningstid Adjusted!! AIC BIC 64% -1,997-3,847 Detta leder till en reducering av modellen och resultatet från regressionen ges i tabellen nedan (Tabell 6). 28

Tabell 6. Resultat från regression efter första reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3973 0,1475 2,6945 0,0105 0,0985 0,6961 0,1640 Anläggningar -0,0002 0,0010-0,2297 0,8196-0,0022 0,0018 0,0014 Anställda -0,0003 0,0002-1,5884 0,1207-0,0007 0,0001 0,0638 Enskilt gym -0,3523 0,0812-4,3402 0,0001-0,5167-0,1878 0,3374 Franchise -0,0847 0,0602-1,4071 0,1677-0,2066 0,0373 0,0508 Gruppklasser -0,3732 0,0798-4,6748 0,0000-0,5350-0,2114 0,3713 Medlemmar per anläggning 0,0718 0,0241 2,9776 0,0051 0,0230 0,1207 0,1933 Pris 0,0012 0,0023 0,5446 0,5893-0,0034 0,0059 0,0080 År på marknaden 0,0261 0,0109 2,3964 0,0217 0,0040 0,0482 0,1344 Öppettider -0,0029 0,0010-2,8914 0,0064-0,0050-0,0009 0,1843 Anläggningar Den andra variabeln som kontrollerades för uteslutning ur modellen är anläggningar. P-värdet är 0,82, vilket indikerar att modellen bör reduceras. Eta squared är 0,0014, vilket ytterligare indikerar på en reducering.!!! och!!! är negativa och den justerade förklaringsgraden är större utan anläggningar (Tabell 7). Tabell 7. Underlag för reducering av anläggningar Adjusted!! AIC BIC 64,9% -1,933-3,783 Detta leder till att anläggningar utesluts ur modellen och resultatet från regressionen utan anläggningar ges i tabellen nedan (Tabell 8). Tabell 8. Resultat från regression efter andra reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3781 0,1200 3,1504 0,0032 0,1352 0,6211 0,2071 Anställda -0,0003 0,0002-1,6106 0,1155-0,0007 0,0001 0,0639 Enskilt gym -0,3397 0,0593-5,7247 0,0000-0,4599-0,2196 0,4631 Franchise -0,0769 0,0490-1,5679 0,1252-0,1761 0,0224 0,0608 Gruppklasser -0,3604 0,0565-6,3802 0,0000-0,4748-0,2461 0,5172 Medlemmar per anläggning 0,0715 0,0238 3,0066 0,0047 0,0234 0,1196 0,1922 Pris 0,0015 0,0021 0,7092 0,4826-0,0027 0,0056 0,0131 År på marknaden 0,0244 0,0077 3,1850 0,0029 0,0089 0,0399 0,2107 Öppettider -0,0028 0,0009-3,1048 0,0036-0,0047-0,0010 0,2023 Pris Den tredje variabeln som kontrollerades för uteslutning ur modellen är pris. P-värdet för denna variabel är 0,48 och värdet på eta squared är 0,013. Dessa två värden indikerar att variabeln bör reduceras ur modellen.!!! och!!! för är negativt, vilket ytterligare motiverar att variabeln bör reduceras. 29

Dessutom är den justerade förklaringsgraden större för reduceringen (Tabell 9). Tabell 9. Underlag för reducering av pris Adjusted!! AIC BIC 65% -1,382-3,232 Detta leder till att pris utesluts ur modellen och resultatet från regressionen ges i tabellen nedan (Tabell 10). Tabell 10. Resultat från regression efter tredje reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3736 0,1191 3,1372 0,0032 0,1327 0,6145 0,2015 Anställda -0,0003 0,0002-1,6352 0,1100-0,0007 0,0001 0,0642 Enskilt gym -0,3317 0,0579-5,7310 0,0000-0,4487-0,2146 0,4572 Franchise -0,0656 0,0461-1,4236 0,1625-0,1589 0,0276 0,0494 Gruppklasser -0,3533 0,0552-6,3962 0,0000-0,4650-0,2416 0,5120 Medlemmar per anläggning 0,0705 0,0236 2,9906 0,0048 0,0228 0,1182 0,1865 År på marknaden 0,0241 0,0076 3,1770 0,0029 0,0088 0,0395 0,2056 Öppettider -0,0028 0,0009-3,0573 0,0040-0,0046-0,0009 0,1933 Franchise Den fjärde variabeln som kontrollerades för uteslutning ur modellen är franchise med p-värde 0,16, vilket antyder att variabeln bör uteslutas.!!! är negativt, vilket ytterligare indikerar på att modellen bör reduceras. Däremot antyder eta squared-värdet 0,049, det positiva värdet på!!! och den justerade förklaringsgraden att variabeln bör behållas (Tabell 11). Tabell 11. Underlag för reducering av franchise Adjusted!! AIC BIC 64,5% 0,381-1,469 Detta leder till att franchise bibehålls i modellen. Utifrån ovan nämnda kriterier reduceras därmed grundmodellen genom att utesluta variablerna bindningstid, anläggningar och pris. 30

4.3 Slutgiltig modell I detta kapitel presenteras den reducerade modellen utan bindningstid, anläggningar och pris och modellens skattade beta-värden. 4.3.1 Skattning av slutmodell En regression genomfördes på de kovariat som utifrån den statistiska analysen bedömdes vara signifikanta och skattningarna för regressionskoefficienterna presenteras i tabellen nedan (Tabell 12). De skattningarna med ett negativt beta-värde har en negativ påverkan på lönsamheten och de skattningarna med positivt beta-värde har en positiv påverkan på lönsamheten. Tabell 12. Resultat av slutgiltig modell Coefficients Standard Error P-value Intercept 0,3736 0,1191 0,0032 Anställda -0,0003 0,0002 0,1100 Enskilt gym -0,3317 0,0579 0,0000 Franchise -0,0656 0,0461 0,1625 Gruppklasser -0,3533 0,0552 0,0000 Medlemmar per anläggning 0,0705 0,0236 0,0048 År på marknaden 0,0241 0,0076 0,0029 Öppettider -0,0028 0,0009 0,0040 4.3.2 Slutekvation Utifrån skattningen (Tabell 12) formuleras slutekvationen enligt!ö!"#$h!" = 0,3736 0,0003!"#$ä!!"# 0,3317!"#$%&'!!"#!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!0,0656!"#$%h!"# 0,3533!"#$$%&'(()! (18)!!+!0,0705!"#$"%%&'!!"#!!"#ä!!"#"!!!!!!!!!!!!!!!!!!!!!!!!!+0,0241 Å!!!å!!"#$%"&'% 0,0028 Ö!!"##$%"& 4.3.3 Förklaringsgrad Den justerade förklaringsgraden!! är 65 % och det betyder att 65 % av variationen i lönsamheten är förklarad av variablerna. Slutmodellen har därmed högre förklaringsgrad än grundmodellen, som hade 63 % i 31

förklaringsgrad, vilket ytterligare indikerar att reducering av grundmodellen var lämpligt. 4.3.4 Residual Plots För att kontrollera att modellen följer antagandet om homoskedasticitet har Residual Plots tagits fram för samtliga variabler som ingår i den slutgiltiga modellen. Ett tydligt mönster i grafen tyder på heteroskedasticitet medan ett slumpmässigt mönster tyder på homoskedasticitet. I figuren nedan visas ett exempel på en Residual Plot för variabeln år på marknaden (Figur 5). Inget tydligt mönster kan avläsas och därmed stämmer antagandet om att homoskedasticitet råder och variansen för feltermerna är därmed konstant. Samma slutsats fattades utifrån graferna för de resterande variablerna (Appendix). Figur 5. Residual Plot År på marknaden 4.3.5 Normal Q-Q Plot För att antagandet om normalfördelade residualer ska gälla ska punkterna i Normal Q-Q Plot anta en linjär form. Inga stora avvikelser kan utläsas ur grafen och därmed är antagandet uppfyllt (Figur 6). 32

Figur 6. Normal Q-Q Plot 33

5 Diskussion 5.1 Analys av slutgiltig modell I detta avsnitt analyseras de bakomliggande faktorerna till resultatet av regressionsmodellen. Regressionen av den slutgiltiga modellen visar att variablerna anställda, enskilt gym, franchise, gruppklasser och öppettider har en negativ påverkan på lönsamheten. Av variablerna som ingår i modellen har medlemmar per anläggning och år på marknaden en positiv påverkan på lönsamheten. Bindningstid, anläggningar och pris reducerades ur modellen. Orsakerna bakom resultatet av regressionen diskuteras nedan. Förklaringsgrad Den relativt låga förklaringsgraden, 65 %, beror troligtvis på uteslutande av relevanta variabler. En sådan variabel kan tänkas vara varumärke, vilket är svårt att kvantifiera och har därmed inte tagits med i regressionen. År på marknaden är troligtvis den variabel som har starkast korrelation med varumärket av de variablerna som har tagits med i modellen. Det finns även andra interna och externa faktorer som påverkar lönsamheten för ett företag som är svåra att kvantifiera, t ex konkurrenters och omvärldsfaktorers påverkan. Dessa diskuteras i senare avsnitt (se kapitel 5). Förklaringsgraden visar på i vilken grad variablerna i regressionen förklarar lönsamheten. Men även de variabler som inte förklarar lönsamheten, som därmed reduceras ur modellen, är av intresse i denna undersökning. Att dessa variabler reducerades visar på att dessa faktorer inte har stor påverkan på lönsamheten, vilket är intressant information för företag inom branschen. Anläggningar Anläggningar reducerades ur modellen, vilket antyder att variabeln inte har någon större påverkan på lönsamheten. En förklaring till detta kan vara att antal anläggningar kan ha både positiv och negativ påverkan på lönsamheten beroende på vilket tidsperspektiv som undersöks. Det krävs kapital för att öppna fler gym, vilket kan påverka lönsamheten negativt det aktuella året då 34

investeringen genomförs. Däremot är expansion troligtvis positivt för lönsamheten i ett längre perspektiv. Om företaget öppnat nya anläggningar under året, kommer rörelsemarginalen troligtvis vara lägre än året innan. När företag öppnar nya anläggningar kan det ta en viss tid innan anläggningen når ett medlemsantal som genererar lönsamhet till verksamheten och anläggningen utgör då endast en kostnad. Detta syns tydligt i förändringarna i SATS rörelsemarginal (Figur 7). De tre åren, 2009, 2010 och 2011, då de hade samma antal anläggningar (Figur 8) ökade rörelsemarginalen eftersom antalet medlemmar till de befintliga anläggningarna ökade. Åren då de expanderade minskade rörelsemarginalen. Fler anläggningar medför att valmöjligheten för träning ökar för företagets medlemmar, vilket ökar kundnöjdheten samtidigt som det kan attrahera fler medlemmar. Dessutom bygger företaget genom exponering upp sitt varumärke, vilket ytterligare kan påverka lönsamheten positivt på längre sikt. Figur 7. SATS rörelsemarginal över tiden Figur 8. SATS antal anläggningar över tiden 35

Anställda Skattningen som representerar anställda är negativ, vilket innebär att personal på anläggningarna påverkar lönsamheten negativt. Detta beror troligtvis på att personal är en stor kostnad och ju fler anställda, desto större personalkostnader. Det mervärde som personal tillför överstiger, enligt skattningen, inte kostnaden. Det finns dock en begränsning i reducering av anställda eftersom det krävs ett minimum antal anställda för administrativa uppgifter. Det innebär att även om företaget väljer att ha låg personaltäthet på anläggningarna, kräver en större gymkedja ett större antal administrativ personal. Enligt en undersökning genomförd av Svenskt Kvalitetsindex, som tog mått på kundnöjdheten i gymbranschen, är kunder i stor utsträckning missnöjda med kundbemötande och engagemang hos personalen [21]. Majoriteten av gymaktörerna har personal på sina anläggningar. En rekommendation till de företag som väljer att ha hög personaltäthet på sina anläggningar, trots de stora kostnader som personal medför, är därför att engagera medarbetarna då det annars inte skapar ett mervärde för kunden, utan snarare tvärtom. I regressionsanalysen har anställda inte kategoriserats, vilket är en brist i studien då olika typer av anställda kan generera olika värde för kunden. Troligtvis tillför personliga tränare och instruktörer ett högre värde än exempelvis receptionister. Däremot tillför receptionister troligtvis ett högre värde om receptionen är ansluten till en shop som säljer träningstillbehör vilket möjliggör för merförsäljning. Detta har i sin tur har positiv påverkan på lönsamheten. Det kan däremot ifrågasättas om instruktörer kan ersättas med virtuella klasser, förinspelade klasser som visas på en bildskärm, och om virtuella klasser på så sätt tillför samma värde som traditionella gruppträningsklasser men till en lägre kostnad. För detta behöver värdet kvantifieras för både klasserna och därefter övervägas vilken typ som ska användas. Resultaten kan visa att kombinationen av dessa två är det som genererar störst lönsamhet. 36

Resultatet av studien visar att anställda ska minskas för att öka lönsamheten. Genom att kategorisera anställda i regressionen kunde resultatet blivit mer specifikt då det kan ge information om vilken typ av anställda som har positiv respektive negativ påverkan på lönsamheten. Anledningen till att detta inte medtogs i undersökningen var att typer av anställda inte gick att särskilja från varandra i årsredovisningarna. Bindningstid Bindningstid reduceras ur modellen, vilket betyder att den inte har en stor påverkan på lönsamheten. Genom att binda upp sina kunder säkrar företaget sina framtida intäkter men det kan även avskräcka kunder som inte vill binda upp sig på långa avtal. Enskilt gym Marknaden går mer och mer åt att de stora kedjorna tar över, vilket syns i variabeln enskilt gym som representerar de gym som inte ingår i en kedja. Denna variabel är negativ, vilket var ett väntat resultat då två av de tre enskilda gymaktörerna i undersökningen har negativa årliga resultat. En annan sak som talar för detta är Puls & Tränings anläggning i Göteborg. Där har kedjan endast en anläggning som kan betraktas som ett enskilt gym på den lokala marknaden. I Göteborg har Puls & Träning inte lyckats bygga upp sitt varumärke i samma utsträckning som de större kedjorna, som till exempel SATS och Friskis&Svettis, och anläggningen har därför svårt att generera lönsamhet. Puls & Träning är som störst i Stockholmsregionen, där det är en välkänd gymkedja, och där genererar verksamheten också lönsamhet. Det är därför en fördel att vara en kedja eftersom det ger större möjligheter att bygga ett starkt varumärke. Dessutom har deras kunder större valmöjligheter, då det finns fler anläggningar att träna på. Kedjornas stordriftsfördelar har också en positiv påverkan på lönsamheten. Exempel på stordriftsfördelar i branschen är att en stor kedja har möjligheter att förhandla lägre hyreskostnader av lokaler och utrustning än enskilda gym. Franchise Regressionskoefficienten till variabeln franchise är negativ, vilket betyder att franchise har en negativ påverkan på lönsamheten. Variabeln tolkas som 37