Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression

Storlek: px
Starta visningen från sidan:

Download "Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression"

Transkript

1 DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2015 Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON, REBECCA KÄLLSBO KTH ROYAL INSTITUTE OF TECHNOLOGY SCI SCHOOL OF ENGINEERING SCIENCES

2

3 Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON REBECCA KÄLLSBO Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 credits) Civilingenjörsutbildning i industriell ekonomi (300 credits) Kungliga Tekniska Högskolan 2015 Handledare på KTH Henrik Hult och Anna Jerbrant Examinator Boualem Djehiche TRITA-MAT-K 2015:26 ISRN-KTH/MAT/K--15/26--SE Kungliga Tekniska Högskolan Skolan för Teknikvetenskap KTH SCI SE Stockholm, Schweden URL:

4

5 Abstract This thesis combines mathematical statistics with industrial economics and management to examine the profitability of the fitness industry in Sweden. The study was conducted with a dozen fitness businesses and the data mainly consisted of the companies annual reports from 2009 to The operating margin is the measure for profitability used in the calculations. A survey was conducted with multiple linear regressions to identify explanatory variables that affect the profitability and the extent of influence by these variables. The results of the regression analysis are discussed from economic aspects. This thesis contributes with strategic conclusions to the development of a business model for new and existing fitness businesses that aim to maximize profitability. The thesis can also be used as a tool in strategic development and give insight to how companies should approach the market. It includes an analysis of the competitive forces and external factors that may affect companies in the industry. Risk factors and growth opportunities are taken into account in the discussion about how companies can finance their operations. The regression analysis concludes that it is primarily the factors that affect the companies revenues and costs that have a significant impact on profitability. However, the results of the thesis also indicate that qualitative factors have a major impact on profitability. 1

6

7 Sammanfattning Detta examensarbete, inom matematisk statistik och industriell ekonomi, undersökte lönsamheten i gymbranschen i Sverige. Studien genomfördes på ett tiotal gymaktörer där data främst baserades på företagens årsredovisningar från 2009 till Vid beräkningar användes rörelsemarginalen som lönsamhetsmått. Undersökningen genomfördes med multipel linjär regression för att identifiera förklarande variabler som påverkar lönsamheten och dessa variablers faktiska påverkan. Resultatet från regressionsanalysen diskuteras utifrån ekonomiska aspekter. Arbetet bistår med strategiska slutsatser som bidrar till utformningen och utvecklingen av en affärsmodell till såväl nya som befintliga gymaktörer som strävar efter att maximera lönsamheten. Arbetet kan även användas som ett verktyg för att utveckla en strategi för hur företag ska förhålla sig till marknaden. Det inkluderar en analys av konkurrenskrafter och omvärldsfaktorer som kan påverka företag i branschen. Även riskfaktorer och tillväxtmöjligheter diskuteras med hänsyn till hur företag kan finansiera verksamheten. Slutsatsen utifrån regressionsanalysen är att det framförallt är faktorer som påverkar företagets intäkter och kostnader som påverkar lönsamheten. Dessutom diskuteras kvalitativa faktorers påverkan på lönsamheten. 2

8

9 Innehåll Tabellförteckning... 5 Figurförteckning Inledning Bakgrund Syfte Problemformulering Teori Multipel Linjär Regressionsanalys Antaganden Variabler Ordinary Least Square Modellfel Multikolinjäritet Endogenitet Heteroskedasticitet Modellvalidering Hypotestestning T-test Kritik mot hypotestest och p-värde Eta squared Förklaringsgrad AIC och BIC VIF Normal Q-Q Plot Residual Plot Metod Urval av variabler Responsvariabel Förklaringsvariabler Datainsamling Kvantitativ datainsamling Kvalitativ datainsamling Studiens omfattning Avgränsningar Urval av observationer Geografiska områden Val av variabler Grundmodell Parameterförklaring Resultat Grundmodell VIF Skattning av grundmodell Förklaringsgrad Reducering av modell P-värde och eta squared

10 4.2.2 AIC och BIC Reducering av variabler Slutgiltig modell Skattning av slutmodell Slutekvation Förklaringsgrad Residual Plots Normal Q-Q Plot Diskussion Analys av slutgiltig modell Marknadsstrategi och affärsmodell Marknadsstrategi Affärsmodell Finansiering Tillväxtmöjligheter Osäkerhetsfaktorer i branschen Ägarförhållanden Franchise Långsiktig lönsamhet Porters femkraftsmodell PEST Utvecklingsmöjligheter Slutsats Referenser Appendix

11 Tabellförteckning Tabell 1. Medverkande företag i undersökningen... 23! Tabell 2. Beskrivning av grundmodellens variabler... 25! Tabell 3. Beräknade VIF-värden för samtliga variabler... 26! Tabell 4. Resultat från regression av grundmodell... 27! Tabell 5. Underlag för reducering av bindningstid... 28! Tabell 6. Resultat från regression efter första reduceringen... 29! Tabell 7. Underlag för reducering av anläggningar... 29! Tabell 8. Resultat från regression efter andra reduceringen... 29! Tabell 9. Underlag för reducering av pris... 30! Tabell 10. Resultat från regression efter tredje reduceringen... 30! Tabell 11. Underlag för reducering av franchise... 30! Tabell 12. Resultat av slutgiltig modell... 31! Tabell 13. Skuldsättningsgrad för företagen i studien... 48! Figurförteckning Figur 1. Normal Q-Q Plot vid normalfördelade residualer... 16! Figur 2. Normal Q-Q Plot vid icke-normalfördelade residualer... 17! Figur 3. Residual Plot vid homoskedasticitet... 17! Figur 4. Residual Plot vid heteroskedasticitet... 18! Figur 5. Residual Plot År på marknaden... 32! Figur 6. Normal Q-Q Plot... 33! Figur 7. SATS rörelsemarginal över tiden... 35! Figur 8. SATS antal anläggningar över tiden... 35! Figur 9. Rörelsemarginalen för gymkedjorna i undersökningen i jämförelse med den genomsnittliga rörelsemarginalen i branschen... 42! Figur 10. Residual Plot Anställda... 64! Figur 11. Residual Plot Enskilt gym... 64! Figur 12. Residual Plot Franchise... 64! Figur 13. Residual Plot Gruppklasser... 65! Figur 14. Residual Plot Medlemmar per anläggning... 65! Figur 15. Residual Plot År på marknaden... 65! Figur 16. Residual Plot Öppettider... 65! 5

12

13 1 Inledning 1.1 Bakgrund Gymmarknaden består av en rad stora kedjor och enskilda gym. Marknaden har de senaste åren varit på stark uppgång och gymaktörerna omsätter mångmiljonbelopp. De befintliga aktörerna blir större samtidigt som nya aktörer tillkommer. Finanskrisen 2008 påverkade andra branscher negativt genom låg konsumtion, medan de största aktörerna inom gymbranschen ökade sin omsättning med 80 % under en femårsperiod. [1] Trots marknadens starka tillväxt är det hög konkurrens. Gymaktörerna väljer därför olika sätt att profilera sig för att utmärkas på marknaden och därmed kunna ta stora marknadsandelar [2]. För att attrahera kunder erbjuds allt från lågpris- till premiumgym med helhetskoncept och en rad tilläggstjänster. De gym som använder sig av en lågprisstrategi har ofta lägre personaltäthet. Motsatsen är de som använder sig av en differentieringsstrategi. De tar mer betalt för ett medlemskap men har istället högre personaltäthet, exklusivare anläggningar, gruppklasser och tjänster som exempelvis barnpassning. Marknaden är i ständig förändring och påverkas i stor utsträckning av trender i samhället. Aktörerna förändrar sitt produktutbud för att kunna interagera med marknadens förändringar och möta kundernas efterfrågan. Majoriteten av gymaktörerna har det gemensamma målet att skapa lönsamhet. 1.2 Syfte Syftet med detta examensarbete är att undersöka hur gymaktörers marknadsstrategi och affärsmodell påverkar lönsamheten. Arbetet vänder sig till företag i branschen med mål att maximera lönsamheten. Genom att visa på vilka faktorer som har en linjär korrelation med lönsamheten bistår arbetet med ett verktyg för företag i deras strategiarbete samt utformning och utveckling av deras affärsmodell. Detta arbete är framförallt av intresse 6

14 för nya företag med mål att inta marknaden men även för strategisk affärsutveckling för befintliga företag på marknaden. 1.3 Problemformulering Frågeställningen för problemet är följande Vilka kvantitativa faktorer har störst påverkan på lönsamheten i gymbranschen och hur stor är respektive faktors påverkan? Hur påverkar kvalitativa faktorer lönsamheten? Hur kan hänsyn tas till samtliga faktorer för att förbättra lönsamheten för befintliga företag och skapa förutsättningar för nya företag att inta marknaden? 7

15 2 Teori 2.1 Multipel Linjär Regressionsanalys Modellen som används vid multipel linjär regressionsanalys är!!! =!!!!!"!! +!!!!!!!!!!!!! = 1,.,! (1) Värdet på den beroende variabeln y beror av ett antal förklarande variabler!!, så kallade kovariat, och residualerna!!. Responsvariabeln och kovariaten är givna medan residualerna är stokastiska variabler. Regressionskoefficienterna!! för kovariaten estimeras med modellen. Modellen innehåller k kovariat och n observationer [3]. Modellen skrivs med matrisnotation! =!" +! (2) där! =!!!!,! =!! 1!!!!!! 1!!"!!!,! = 1!!!!!"!!!!,! =!!!!!!!! Antaganden Den linjära regressionsmodellen utgår från att följande antaganden uppfylls [4] Den beroende variabeln kan uttryckas som en linjär funktion av de oberoende variablerna och en felterm. Detta uttrycks enligt (1). Anledningar till att antagandet inte uppfylls kan vara felaktiga kovariat, icke-linjäritet eller icke-konstanta skattningar av!. Feltermerna har väntevärde noll, det vill säga!!! = 0. Detta innebär att regressionslinjen, i genomsnitt, är korrekt [5]. 8

16 Modellen är homoskedastisk, vilket innebär att variansen hos feltermerna är konstant. Detta formuleras enligt!!!! =!!. Feltermerna antas dessutom vara okorrelerade [4]. Feltermerna är normalfördelade [3]. Ingen multikolinjäritet (se avsnitt 2.2.1) mellan de oberoende variablerna Variabler Variabler som används vid multipel linjär regressionsanalys är [3] Kvantitativa variabler: Variabler som antar det värde som observeras. Dummy-variabler: Variabler som anger en egenskap. Variabeln kan anta värdet 0 eller 1. Om värdet på variabeln är 1 innehar observationen egenskapen och om värdet är 0 saknar observationen egenskapen Ordinary Least Square Ordinary Least Square, OLS, används för att estimera värden på regressionskoefficienterna!. Dessa värden betecknas! och är de värden som minimerar kvadratsumman av residualerna!! [3]. OLS-estimatet av! erhålls utifrån normalekvationerna!!! = 0 (3) där! =!!! (4) (4) i (3) ger!!!!! =!!!!!!!! =!!!!! =!!!! =!!!!!!!! (5) 9

17 2.2 Modellfel Multikolinjäritet Multikolinjäritet uppstår när två eller flera av de oberoende variablerna i regressionsmodellen i hög utsträckning är korrelerade med varandra. Detta är ett problem då det medför att det är svårt att hålla isär effekterna av de oberoende variablerna på den beroende variabeln. Multikolinjäritet kan leda till att matrisen!!! är nära icke-inverterbar [5] och detta kännetecknas av höga standardavvikelser och oväntade storlekar eller tecken på de skattade regressionskoefficienterna. För att undvika multikolinjäritet bör många observationer användas i modellen där värdet på variablerna varierar. Om multikolinjäritet trots detta uppstår, kan en eller flera variabler som i hög utsträckning korrelerar uteslutas. Alternativt kan de korrelerade variablerna sammanfogas [6] Endogenitet Endogenitet uppstår då det finns en korrelation mellan residualen och en eller flera kovariat. I detta fall uppfylls inte antagandet om att feltermerna har väntevärde noll, vilket leder till att OLS inte ger konsekventa estimat. Problemet med endogenitet kan lösas genom att tillämpa Two Stage Least Square, 2SLS, som ersättning för OLS [3]. Den endogena variabeln ersätts då med en eller flera instrumentvariabler. En instrumentvariabel är en variabel som är korrelerad med den endogena variabeln, men okorrelerad med residualen. På så sätt kan den endogena variabeln uteslutas ur modellen och därefter genomförs 2SLS för att ta fram skattningar på regressionskoefficienterna. Nedan följer exempel på situationer som leder till endogenitet [3]. Utelämnande av relevanta variabler Om en relevant variabel utelämnas ur modellen kommer effekten av denna variabel inrymmas i residualen. För att undvika detta problem är det därför viktigt att identifiera så många relevanta variabler som möjligt innan regressionen utförs. 10

18 Simultaneity Simultaneity innebär att den beroende variabeln har en inverkan på en eller flera kovariat. Detta betyder att den påverkande effekten verkar i två riktningar och endogenitet uppstår. Sample selection bias Sample selection bias uppstår då selektionen av data inte är slumpvis vald från ett större stickprovsunderlag. Detta leder till problem med endogenitet och det finns risk för missvisande slutsatser. Mätfel Mätfel i de oberoende variablerna leder till endogenitet då det uppstår korrelation mellan dessa variabler och residualen. Eventuella mätfel i responsvariabeln leder inte till endogenitet, utan det adderar istället en komponent i residualen Heteroskedasticitet Heteroskedasticitet innebär att variansen hos feltermerna inte är konstanta [5], vilket är en förutsättning för OLS. Detta påverkar standardavvikelserna och signifikansen för de estimerade koefficienterna. Standardavvikelsen för koefficienterna kommer att vara större eller mindre än vad de ska vara. Detta medför i sin tur att hypotestesten (se avsnitt 2.3.1) för vilka koefficienter som ska ingå i modellen inte blir korrekta. Heteroskedasticitet uttrycks enligt [3]!!!! =!!! (6) För att åtgärda problemet med heteroskedasticitet kan modellen omformuleras genom att addera förklarande variabler eller genom transformation av de befintliga variablerna. Ett annat alternativ är att använda White s Consistent Variance Estimator. Kovariansmatrisen estimeras då enligt!"#! =!!!!!!!!!!!!!!!!!!!!!! (7) 11

19 Standardavvikelserna beräknas då genom att ta kvadratroten ur diagonalelementen för denna matris [5]. Regressionen kan sedan genomföras med OLS som tidigare. 2.3 Modellvalidering Nedan följer en rad olika metoder som kan användas för att utvärdera regressionsmodellen och för att reducera kovariat som inte bidrar med förklaringsvärde till modellen Hypotestestning Hypotestest kan användas för att undersöka vilka kovariat som ska ingå i modellen. Nollhypotesen!! är att koefficienten för det aktuella kovariatet är noll, vilket är detsamma som att kovariatet ska uteslutas ur modellen. Mothypotesen!! är att koefficienten är skiljt från noll och motsvarar att kovariatet inkluderas. Detta kan matematiskt betecknas enligt följande!! :!!! = 0!! :!!! 0 Vid hypotestestning beräknas en teststatistika utifrån det observerade stickprovet. Beräkningen baseras på en given fördelning under antagandet att nollhypotesen är sann [5]. För att testa om hypotesen ska förkastas beräknas p-värdet (se avsnitt 2.3.2) för att undersöka om detta värde är osannolikt att komma från denna fördelning, vilket indikerar att nollhypotesen inte är sann T-test T-test är en typ av hypotestest som utvärderar varje regressionskoefficient för sig. Teststatistika för hypotesen!! =!! ges av [7]!! =!!!!!!"(!! ) (8) 12

20 som har en t-fördelning med!! frihetsgrader och beräknas under antagandet att nollhypotesen är sann [5]. Antal observationer betecknas! och antal kovariat betecknas!.!! är det estimerade värdet för den aktuella koefficienten som undersöks och!"(!! ) är dess standardavvikelse.!"(!! ) fås genom att ta kvadratroten ur!!! som är diagonalelementen i matrisen!!! [3]. För att kontrollera om nollhypotesen ska avvisas studeras p-värdet, vilket ges av Pr!(! >! ), där X har t-fördelning. P-värdet anger sannolikheten att erhålla ett minst lika extremt resultat som det observerade, under antagandet att!! är sann [5]. Om p-värdet för det observerade värdet! är större än en förutbestämd signifikansnivå kan nollhypotesen inte avvisas och det aktuella kovariatet utesluts ur modellen [7] Kritik mot hypotestest och p-värde P-värdet används, som nämnt ovan, vid hypotestestning för att fatta beslut om modellen ska reduceras. Om p-värdet understiger det traditionella värdet 0,05 avvisas nollhypotesen och resultat anses vara statistiskt signifikant. En nackdel med hypotestest är att nollhypotesen i princip aldrig stämmer, vilket betyder att avvisning av nollhypotesen är relativt intetsägande [8]. Variabler som tas med i grundmodellen har sällan en koefficient som är precis noll, vilket är det som testas i nollhypotestest. Ytterligare kritik är att stickprovsunderlagets storlek har stor effekt på de p-värden som genereras [9]. Vid få observationer tenderar p-värdet att överreducera modellen. Vid ett stort antal observationer sker det motsatta, p-värdet indikerar att samtliga variabler har betydande effekt på responsvariabeln, trots att effekterna kan vara triviala. För att undvika problemet och minimera risken att effekten av variabler under- eller överestimeras bör även effektstorleken för respektive variabel beräknas och utvärderas som ett komplement till hypotestestet [10] Eta squared Ett mått som anger storleken av effekten från en variabel men som är oberoende av stickprovets storlek är eta squared,!!. Eta squared beräknas för alla variabler i modellen och definieras som kvoten mellan variansen som 13

21 den aktuella variabeln bidrar med och den totala variansen. Detta beräknas enligt!! =!!!!!!! (9) där!! är kvadratsumman av residualerna från den reducerade modellen och!! är kvadratsumman av residualerna från den ursprungliga modellen. Måttet tolkas som andelen av den totala variansen som kan kopplas till ett kovariat [11]. Ett lågt värde på eta sqaured indikerar därmed att variabeln bidrar med en liten effekt till modellen och att modellen ska reduceras. Ett värde bedöms som lågt om det understiger 0,02 [12] Förklaringsgrad Förklaringsgrad!! är ett mått på andelen av variansen i responsvariabeln som kan förklaras av kovariaten i modellen och används därmed för att utvärdera den linjära approximationen som fås ut vid OLS.!! kallas även goodness-of-fit, vilket syftar till hur väl den linjära approximationen passar de givna observationerna. Målet är att modellen ska ha så hög förklaringsgrad som möjligt. Förklaringsgraden betecknas enligt [7]!! =!"#(!!)!"#(!) = (!!!!)! (!!!!)! (10) En nackdel med!! är att den inte minskar om antalet variabler ökar, även om de adderade variablerna inte har något förklaringsvärde [5]. Detta betyder att!! kommer att föredra en modell med fler förklarande variabler. För att ta hänsyn till antal frihetsgrader kan justerad förklaringsgrad,!!, användas [3]. Därmed kommer!! minska om en adderad variabel inte tillför något förklaringsvärde till modellen. Justerad förklaringsgrad betecknas enligt [13]!! = 1 (1!! )!!!!!!!! (11) 14

22 2.3.6 AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) är ytterligare två metoder som kan användas för att ta reda på om en variabel ska ingå i modellen. Precis som den justerade förklaringsgraden!! gynnar inte AIC och BIC en modell med variabler som inte tillför ett högre förklaringsvärde. AIC respektive BIC beräknas för både den reducerade och den oreducerade modellen och den modell som minimerar värdet på AIC och BIC är den modell som ska användas [3]. Den reducerade modellen är den modell där kovariat uteslutits som gav höga p-värden och låga värden på eta sqaured. AIC och BIC definieras enligt!"# =! ln!! + 2! (12)!"# =! ln!! + 1 +! ln!(!) (13) För att jämföra två modeller studeras skillnaden i AIC- respektive BICvärdena.!"# =!"#!"# (14)!"# =!"#!"# (15) där!"# och!"# är värden beräknade från den reducerade modellen. Värden på!"# respektive!"# som är lägre än noll indikerar att modellen ska reduceras VIF Variance Inflation Factor, VIF, används för att mäta i vilken utsträckning de oberoende variablerna korrelerar och kan därför användas som verktyg för att upptäcka multikolinjäritet. Den mäter hur mycket variansen hos en estimerad regressionskoefficient ökar om de oberoende variablerna är korrelerade [14]. Ett högt värde på VIF indikerar multikolinjäritet. VIF beräknas genom att utföra en regression där den kovariat som undersöks används som responsvariabel. De övriga kovariaten i modellen används som oberoende variabler [6]. Utifrån förklaringsgraden för denna regression beräknas VIF enligt 15

23 !"# =!!!!! (16) Det finns inget givet gränsvärde för VIF som avgör om det råder allvarlig multikolinjäritet. Dock är en ofta förekommande rekommendation att VIF bör understiga 10 [15]. En nackdel med VIF är att det vid upptäckt av multikolinjäritet inte anges vilken av de övriga variablerna som den aktuella variabeln korrelerar med. För att få svar på detta krävs ytterligare analys av dessa variabler [14] Normal Q-Q Plot En Normal Quantile-Quantile Plot används för att kontrollera att feltermerna är normalfördelade [16]. Detta är, som tidigare nämnt, ett antagande vid OLS. I grafen plottas de standardiserade residualerna mot de teoretiska kvantilerna. Om punkterna i grafen följer en rät linje antas antagandet om att feltermerna är normalfördelade vara korrekt (Figur 1). Om punkterna inte följer en rät linje uppfylls inte antagandet (Figur 2). Standardized Residuals Normal Q-Q Plot 2-1,5 1,5-2 Theoretical Quantiles Figur 1. Normal Q-Q Plot vid normalfördelade residualer 16

24 Normal Q-Q Plot 40! Standardized Residuals "20! 20! "30! Theoretical Quantiles Figur 2. Normal Q-Q Plot vid icke-normalfördelade residualer Residual Plot Heteroskedasticitet kan upptäckas genom att studera grafer där residualerna plottas för varje koefficient. Om punkterna i denna graf är slumpmässigt utspridda längs med den horisontella axeln är variansen konstant och homoskedasticitet råder (Figur 3) [6]. Om ett tydligt mönster kan avläsas i grafen och residualernas avstånd till den horisontella axeln varierar vid rörelse längs med axeln, är variansen inte konstant och heteroskedasticitet råder (Figur 4). Figur 3 visar ett exempel på en Residual Plot som visar på homoskedasticitet, där avståndet mellan punkterna och den horisontella axeln är slumpmässigt. I Figur 4 kan ett trattliknande mönster avläsas, därmed är variansen inte konstant vilket visar på heteroskedasticitet. Residuals Residual Plot 0,15! "0,35! 0,23! "0,18! Variable Figur 3. Residual Plot vid homoskedasticitet 17

25 Residual Plot 0,2 Residuals -0,4 0,4-0,2 Variable Figur 4. Residual Plot vid heteroskedasticitet 18

26 3 Metod 3.1 Urval av variabler I detta avsnitt motiveras valet av responsvariabeln och förklaringsvariablerna samt hur dessa beräknats för att användas i regressionsmodellen Responsvariabel Huvudmålet för aktiebolag är i praktiken att skapa långsiktig lönsamhet. Det finns flera nyckeltal för att mäta lönsamhet och gemensamt är att de anger effektiviteten i företagets resursanvändning för att generera vinst [17]. I rapporten används rörelsemarginal vid beräkningar av lönsamheten. Vinstmarginalen har inte använts som mått då det är ett lönsamhetsmått som påverkas av hur verksamheten har skuldfinansierats och av ränteförändringar [18]. Därmed är vinstmarginalen inte ett lämpligt mått i studien då jämförelser mellan företag görs över tiden. Räntabilitet är ett ytterligare mått som ofta används vid beräkningar av lönsamhet. Detta mått är inte relevant eftersom gymbranschen inte är kapitalintensiv då företagen i stor utsträckning leasar sina anläggningar och träningsredskap, vilket kan utläsas från företagens årsredovisningar [19]. Rörelsemarginal anger hur stor del av omsättningen som blir över för att täcka räntor, skatt och resultat [18]. Rörelsemarginalen grundas på resultatet före räntekostnaderna, vilket medför att hänsyn inte tas till finansiering av verksamheten. Detta betyder att rörelsemarginalen är lämplig att använda vid analys av en hel bransch. Rörelsemarginalen beräknas genom EBIT, rörelseresultat före finansiella poster och skatt, dividerat med nettoomsättningen för året Förklaringsvariabler Variablerna i modellen har identifierats genom att utgå från vilka faktorer som kan tänkas påverka lönsamheten. De inkluderade variablerna i 19

27 undersökningen är anläggningar, anställda, bindningstid, enskilt gym, franchise, gruppklasser, medlemmar per anläggning, pris, år på marknaden och öppettider. Franchise är inte en kundvänd faktor men antas ha påverkan på lönsamheten och tas därför också med i grundmodellen. Nedan följer en förklaring av innebörden av respektive variabel samt de antaganden som gjorts vid beräkningarna. Anläggningar Anläggningar representerar antal anläggningar aktören haft för det aktuella året lönsamheten beräknats för. Då undersökningen baserats på data för ett antal år tillbaka i tiden har antaganden gjorts i de fall som information om antal anläggningar för det aktuella året inte varit tillgänglig. Leasingkostnader antas då variera proportionellt med antal anläggningar. Dock finns det brister i detta antagande då företag med stor sannolikhet förhandlar varje nytt hyreskontrakt för sig och dessutom förhandlar kontinuerligt med befintliga fastighetsägare för att sänka kostnaderna för sina anläggningar. Detta betyder att kostnaderna kan variera från år till år. Antagandet ger därför ett approximativt värde på variabeln. Anställda Anställda anger medelantalet anställda för aktuellt räkenskapsår. Bindningstid Bindningstid representerar det minsta antal månader som en kund är bunden till att betala för ett medlemskap. Majoriteten av gymaktörerna har en avtalad bindningstid på 12 månader. För övriga gym representeras denna variabel av uppsägningstiden för medlemskapet. Enskilt gym Enskilt gym är en dummy-variabel som antar värdet ett för de gym som enbart har en anläggning. För samtliga gym som har mer än en anläggning, det vill säga för gymkedjorna i undersökningen, antar denna variabel värdet noll. 20

28 Franchise Franchise är en dummy-variabel som antar värdet ett om företaget använder franchise som affärsmodell. Gruppklasser Gruppklasser är en dummy-variabel som antar värdet ett om gymmet har gruppklasser på majoriteten av sina gym. För övriga gym, vilket inkluderar gym som erbjuder gruppklasser enbart på enstaka anläggningar, antar variabeln värdet noll. Medlemmar per anläggning Medlemmar per anläggning anges i tusental. Totalt antal medlemmar har, i de fall data inte tillhandahållits, beräknats utifrån ett antagande om att antal medlemmar årligen förändras proportionerligt mot företagets omsättning, då priset är konstant. Pris Pris anges i hundratal SEK. De flesta gym erbjuder olika typer av medlemskap. Variabeln representerar priset för att kunna träna på gymkedjans samtliga gym i kundens stad eftersom det är det medlemskap de flesta antas välja. I de fall priset varierat mellan olika städer har ett genomsnittligt pris beräknats. År på marknaden Ett starkt varumärke antas korrelera med lönsamheten. Genom att utelämna varumärke från regressionen kan endogenitet uppstå och detta kan leda till stora feltermer. Variabeln år på marknaden antas korrelera med varumärke och fick därmed representera detta. Variabeln anger antal år som företaget varit aktivt på marknaden. Öppettider Öppettider representerar antal timmar som gymmet har öppet i veckan. I vissa fall varierar öppettiderna mellan gymkedjans olika anläggningar. I dessa fall har en genomsnittlig öppettid beräknats. 21

29 3.2 Datainsamling Kvantitativ datainsamling För att genomföra regressionsanalysen hämtades kvantitativ data för kovariaten främst från företagens årsredovisningar, men även från deras hemsidor. I årsredovisningarna hämtades information från det aktuella året som lönsamheten beräknades för. För att tillgå den information som var otillgänglig i årsredovisningarna och på hemsidan kontaktades de aktuella företagen. Även data för att beräkna rörelsemarginalen hämtades från respektive företags årsredovisning [19] Kvalitativ datainsamling Den kvalitativa datainsamlingen baserades på en 2,5 timmar lång intervju med Göran Järbin, marknadschef på Puls & Träning, som utgick från frågor kring företagets affärsmodell. Även ostrukturerade telefonintervjuer har genomförts med VDs på flera mindre företag. Samtliga företag har kontaktats för vidare information kring övriga frågor. För att undersöka och analysera hur kvalitativa faktorer kan påverka företagens lönsamhet har en litteraturstudie genomförts. Litteraturstudien utgick ifrån på relevanta böcker och vetenskapliga artiklar inom ämnet Industriell Ekonomi, bland annat från Harvard Business Review. Exempel på sökord som använts är strategy, business model, branding och profitability. 3.3 Studiens omfattning Studien omfattar ett tiotal utvalda gymkedjor och enskilda gym. Gymkedjorna som har valts är de största aktörerna på marknaden. De medverkande företagen i undersökningen listas i tabellen nedan (Tabell 1). 22

30 Tabell 1. Medverkande företag i undersökningen, *brutet räkenskapsår Gymkedjor Omsättning 2013 Mkr Actic 468,9 Balance 42,9 Fitness24Seven* 325,8 Flex 30,1 Itrim 80,5 Nordic Wellness 418,1 Puls & Träning* 56,8 SATS 913,0 STC Training Club 115,9 Worldclass 14,9!! Enskilda gym!! Exclusive Training 6,8 Metropolis 5,9 Planet Fitness 11,9 3.4 Avgränsningar Studien är avgränsad utifrån geografiska områden samt i urvalet av observationer och variabler Urval av observationer Arbetet avgränsar sig till studier kring företag med mål att vinstmaximera. Friskis&Svettis, som är en väletablerad gymkedja på marknaden, kommer därför inte behandlas i undersökningen då det är en ideell organisation [20] och därmed inte har vinstmaximering som mål. Även företag som inte har gym som huvudsaklig verksamhet utesluts från undersökningen, exempelvis spa med gymavdelning. Medley, som är en stor aktör på marknaden, utesluts därför ur undersökningen då deras huvudsakliga verksamhet är badanläggningar Geografiska områden Samtliga utvalda gymkedjor och enskilda gym är etablerade i Sverige. Studien har inte tagit hänsyn till placering av anläggning på lokal nivå, 23

31 vilket kan vara en påverkande faktor till varför en anläggning generar lönsamhet. Detta är en brist i arbetet då invånartätheten där anläggningen är placerad troligtvis har en stor påverkan på medlemsantalet Val av variabler Faktorer som är en del av produktinnehållet beaktas inte som ett val av affärsmodell och tas därmed inte med i regressionen. Exempel på dessa faktorer är barnpassning, bad, personlig träning och rehabilitering. Inskrivningsavgift är även en variabel som utesluts ur regressionen eftersom den i de flesta fall kan bortförhandlas. Detta har erfarits genom kontakt med respektive aktör. En svårighet vid de matematiska beräkningarna är att det finns variabler som påverkar lönsamheten som är svåra att kvantifiera. Marknadsföring är en variabel som kan antas korrelera med lönsamheten. Dock är frågan hur denna variabel ska mätas för att ge korrekta estimat av koefficienten. Genom att ha en variabel som representerar företagens kostnad för marknadsföring kan estimaten bli felaktiga. Stora ekonomiska satsningar på marknadsföring förväntas bidra positivt till lönsamheten i form av ökad publicitet och därmed fler kunder. Men hänsyn måste även tas till hur denna satsning har använts och om kampanjen som genomförts varit lyckad. Det räcker inte enbart med att satsa ett stort kapital utan det krävs att kampanjen når ut till kunder och därmed ökar antalet medlemmar. Företag som har negativa resultat har satsat på marknadsföring, vilket kan utläsas ur deras årsredovisning [19], vilket kan indikera att marknadsföring har en negativ påverkan på lönsamheten. 3.5 Grundmodell Grundmodellen utgick från att alla identifierade variabler ska ingå. Modellen utvärderades därefter genom statistiska tester för att undersöka vilka variabler som skulle ingå i den slutgiltiga modellen. Regressionerna genomfördes i Microsoft Excel

32 3.5.1 Parameterförklaring En beskrivning av parametrarna i grundmodellen ges i tabellen nedan (Tabell 2). Tabell 2. Beskrivning av grundmodellens variabler Variabel Benämning Enhet!! Responsvariabel!!! Rörelsemarginal Procent, %!! Kovariat!!!,!! Anläggningar Antal!!,!! Anställda Medelantal!!,!! Bindningstid Månad!!,!! Enskilt gym Dummy: 0 eller 1!!,!! Franchise Dummy: 0 eller 1!!,!! Gruppklasser Dummy: 0 eller 1!!,!! Medlemmar per Tusental anläggning!!,!! Pris! Hundratal!!,!! År på marknaden År!!",!! Öppettider Timmar per vecka Grundekvationen blir då enligt (1)!! =!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!,!!! +!!!!!!!!!!!!,!!! +!!",!!!" +!! (17) 25

33 4 Resultat 4.1 Grundmodell I detta kapitel presenteras skattningarna utifrån grundmodellen VIF VIF-test kontrollerar multikorrelation mellan de oberoende variablerna och beräknades enligt (16). Samtliga VIF-värden understiger 10 och påvisar därmed ingen allvarlig multikolinjäritet mellan variablerna (Tabell 3). Variablerna anläggningar och år på marknaden har högst VIF-värde. En viss korrelation antas förekomma mellan dessa variabler då ett företag som varit verksamt längre har haft mer tid att expandera. Dock blir detta motsägelsefullt då även enskilda gym tagits med i modellen. En viss korrelation mellan anställda och anläggningar kan också förekomma eftersom ju fler anläggningar en kedja har desto fler anställda krävs. Detta medför dock ingen allvarlig multikolinjäritet då personaltätheten skiljer sig mellan gymaktörerna. En viss korrelation kan också förekomma mellan enskilt gym och anläggningar eftersom de aktörer som är enskilda gym endast innehar en anläggning. Enskilt gym representerar om gymaktören inte ingår i en kedja och eftersom kedjornas anläggningar skiljer sig i antal medför detta ingen allvarlig multikolinjäritet. VIF-värdet för enskilt gym indikerar också på att ingen allvarlig multikolinjäritet förekommer. Tabell 3. Beräknade VIF-värden för samtliga variabler Variabel VIF Anläggningar 9,91 Anställda 5,94 Bindningstid 3,44 Enskilt gym 5,16 Franchise 3,24 Gruppklasser 4,92 Medlemmar per anläggning 2,15 Pris 1,54 År på marknaden 8,12 Öppettider 3,97 26

34 4.1.2 Skattning av grundmodell Resultatet som genererades utifrån den första regressionen på rörelsemarginalen anges i tabellen nedan (Tabell 4). Tabell 4. Resultat från regression av grundmodell Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3911 0,2002 1,9537 0,0585-0,0149 0,7970 0,0959 Anläggningar -0,0002 0,0013-0,1411 0,8886-0,0029 0,0025 0,0006 Anställda -0,0003 0,0002-1,5557 0,1285-0,0007 0,0001 0,0630 Bindningstid 0,0004 0,0075 0,0470 0,9628-0,0149 0,0156 0,0001 Enskilt gym -0,3514 0,0844-4,1638 0,0002-0,5226-0,1802 0,3251 Franchise -0,0849 0,0611-1,3884 0,1735-0,2088 0,0391 0,0508 Gruppklasser -0,3725 0,0824-4,5228 0,0001-0,5395-0,2055 0,3623 Medlemmar per anläggning 0,0718 0,0245 2,9370 0,0057 0,0222 0,1215 0,1933 Pris 0,0013 0,0023 0,5369 0,5946-0,0035 0,0060 0,0079 År på marknaden 0,0260 0,0113 2,3031 0,0272 0,0031 0,0489 0,1284 Öppettider -0,0029 0,0011-2,7279 0,0098-0,0051-0,0008 0, Förklaringsgrad Den justerade förklaringsgraden,!!, är 63 %, vilket betyder att 63 % av variationen i lönsamheten är förklarad av variablerna. 4.2 Reducering av modell I detta kapitel presenteras reduceringen av modellen utifrån p-värde, eta squared, AIC och BIC P-värde och eta squared För att resultatet ska ha statistisk signifikans ska p-värdet understiga 0,05 och eta squared överstiga 0,02. Den skattningen som har högst p-värde över 0,05 och lägst eta squared under 0,02 utesluts från modellen. Modellen reduceras tills dess att p-värdet understiger 0,05 och eta squared överstiger 0,02. Ett p-värde över 0,05 behöver inte betyda att skattningen ska uteslutas ur regressionen eftersom p-värdet påverkas av antal observationer. Regressionen utförs på 47 observationer, vilket är relativt få, och därmed kan inte enbart p-värdet tala för om modellen ska reduceras. Därför tas även hänsyn till eta squared, AIC och BIC innan modellen reduceras för att undvika överreducering av modellen. 27

35 Tabell 4 ovan visar att flera kovariat har ett p-värde som överstiger 0,05 och eta squared som understiger 0,02 och detta leder till att modellen reduceras då dessa variabler inte bidrar med värde till modellen AIC och BIC För att undersöka reduceringen av modellen beräknades!"# och!"# för varje modell där en kovariat reducerades i taget. För varje reducerad modell genomfördes en ny regression Reducering av variabler Bindningstid Den första variabeln som kontrollerades för uteslutning ur modellen är bindningstid. P-värdet för bindningstid är 0,96, vilket indikerar att bindningstid bör reduceras från modellen. Även eta squared antyder att modellen ska reduceras, då eta squared beräknats till 0,0001, vilket understiger 2 %. Dessutom är både!!! och!!! negativa, vilket ytterligare indikerar på att bindningstid ska reduceras från modellen. Den justerade förklaringsgraden är dessutom större efter reduceringen än vid grundmodellen (Tabell 5). Tabell 5. Underlag för reducering av bindningstid Adjusted!! AIC BIC 64% -1,997-3,847 Detta leder till en reducering av modellen och resultatet från regressionen ges i tabellen nedan (Tabell 6). 28

36 Tabell 6. Resultat från regression efter första reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3973 0,1475 2,6945 0,0105 0,0985 0,6961 0,1640 Anläggningar -0,0002 0,0010-0,2297 0,8196-0,0022 0,0018 0,0014 Anställda -0,0003 0,0002-1,5884 0,1207-0,0007 0,0001 0,0638 Enskilt gym -0,3523 0,0812-4,3402 0,0001-0,5167-0,1878 0,3374 Franchise -0,0847 0,0602-1,4071 0,1677-0,2066 0,0373 0,0508 Gruppklasser -0,3732 0,0798-4,6748 0,0000-0,5350-0,2114 0,3713 Medlemmar per anläggning 0,0718 0,0241 2,9776 0,0051 0,0230 0,1207 0,1933 Pris 0,0012 0,0023 0,5446 0,5893-0,0034 0,0059 0,0080 År på marknaden 0,0261 0,0109 2,3964 0,0217 0,0040 0,0482 0,1344 Öppettider -0,0029 0,0010-2,8914 0,0064-0,0050-0,0009 0,1843 Anläggningar Den andra variabeln som kontrollerades för uteslutning ur modellen är anläggningar. P-värdet är 0,82, vilket indikerar att modellen bör reduceras. Eta squared är 0,0014, vilket ytterligare indikerar på en reducering.!!! och!!! är negativa och den justerade förklaringsgraden är större utan anläggningar (Tabell 7). Tabell 7. Underlag för reducering av anläggningar Adjusted!! AIC BIC 64,9% -1,933-3,783 Detta leder till att anläggningar utesluts ur modellen och resultatet från regressionen utan anläggningar ges i tabellen nedan (Tabell 8). Tabell 8. Resultat från regression efter andra reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3781 0,1200 3,1504 0,0032 0,1352 0,6211 0,2071 Anställda -0,0003 0,0002-1,6106 0,1155-0,0007 0,0001 0,0639 Enskilt gym -0,3397 0,0593-5,7247 0,0000-0,4599-0,2196 0,4631 Franchise -0,0769 0,0490-1,5679 0,1252-0,1761 0,0224 0,0608 Gruppklasser -0,3604 0,0565-6,3802 0,0000-0,4748-0,2461 0,5172 Medlemmar per anläggning 0,0715 0,0238 3,0066 0,0047 0,0234 0,1196 0,1922 Pris 0,0015 0,0021 0,7092 0,4826-0,0027 0,0056 0,0131 År på marknaden 0,0244 0,0077 3,1850 0,0029 0,0089 0,0399 0,2107 Öppettider -0,0028 0,0009-3,1048 0,0036-0,0047-0,0010 0,2023 Pris Den tredje variabeln som kontrollerades för uteslutning ur modellen är pris. P-värdet för denna variabel är 0,48 och värdet på eta squared är 0,013. Dessa två värden indikerar att variabeln bör reduceras ur modellen.!!! och!!! för är negativt, vilket ytterligare motiverar att variabeln bör reduceras. 29

37 Dessutom är den justerade förklaringsgraden större för reduceringen (Tabell 9). Tabell 9. Underlag för reducering av pris Adjusted!! AIC BIC 65% -1,382-3,232 Detta leder till att pris utesluts ur modellen och resultatet från regressionen ges i tabellen nedan (Tabell 10). Tabell 10. Resultat från regression efter tredje reduceringen Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Eta-squared Intercept 0,3736 0,1191 3,1372 0,0032 0,1327 0,6145 0,2015 Anställda -0,0003 0,0002-1,6352 0,1100-0,0007 0,0001 0,0642 Enskilt gym -0,3317 0,0579-5,7310 0,0000-0,4487-0,2146 0,4572 Franchise -0,0656 0,0461-1,4236 0,1625-0,1589 0,0276 0,0494 Gruppklasser -0,3533 0,0552-6,3962 0,0000-0,4650-0,2416 0,5120 Medlemmar per anläggning 0,0705 0,0236 2,9906 0,0048 0,0228 0,1182 0,1865 År på marknaden 0,0241 0,0076 3,1770 0,0029 0,0088 0,0395 0,2056 Öppettider -0,0028 0,0009-3,0573 0,0040-0,0046-0,0009 0,1933 Franchise Den fjärde variabeln som kontrollerades för uteslutning ur modellen är franchise med p-värde 0,16, vilket antyder att variabeln bör uteslutas.!!! är negativt, vilket ytterligare indikerar på att modellen bör reduceras. Däremot antyder eta squared-värdet 0,049, det positiva värdet på!!! och den justerade förklaringsgraden att variabeln bör behållas (Tabell 11). Tabell 11. Underlag för reducering av franchise Adjusted!! AIC BIC 64,5% 0,381-1,469 Detta leder till att franchise bibehålls i modellen. Utifrån ovan nämnda kriterier reduceras därmed grundmodellen genom att utesluta variablerna bindningstid, anläggningar och pris. 30

38 4.3 Slutgiltig modell I detta kapitel presenteras den reducerade modellen utan bindningstid, anläggningar och pris och modellens skattade beta-värden Skattning av slutmodell En regression genomfördes på de kovariat som utifrån den statistiska analysen bedömdes vara signifikanta och skattningarna för regressionskoefficienterna presenteras i tabellen nedan (Tabell 12). De skattningarna med ett negativt beta-värde har en negativ påverkan på lönsamheten och de skattningarna med positivt beta-värde har en positiv påverkan på lönsamheten. Tabell 12. Resultat av slutgiltig modell Coefficients Standard Error P-value Intercept 0,3736 0,1191 0,0032 Anställda -0,0003 0,0002 0,1100 Enskilt gym -0,3317 0,0579 0,0000 Franchise -0,0656 0,0461 0,1625 Gruppklasser -0,3533 0,0552 0,0000 Medlemmar per anläggning 0,0705 0,0236 0,0048 År på marknaden 0,0241 0,0076 0,0029 Öppettider -0,0028 0,0009 0, Slutekvation Utifrån skattningen (Tabell 12) formuleras slutekvationen enligt!ö!"#$h!" = 0,3736 0,0003!"#$ä!!"# 0,3317!"#$%&'!!"#!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!0,0656!"#$%h!"# 0,3533!"#$$%&'(()! (18)!!+!0,0705!"#$"%%&'!!"#!!"#ä!!"#"!!!!!!!!!!!!!!!!!!!!!!!!!+0,0241 Å!!!å!!"#$%"&'% 0,0028 Ö!!"##$%"& Förklaringsgrad Den justerade förklaringsgraden!! är 65 % och det betyder att 65 % av variationen i lönsamheten är förklarad av variablerna. Slutmodellen har därmed högre förklaringsgrad än grundmodellen, som hade 63 % i 31

39 förklaringsgrad, vilket ytterligare indikerar att reducering av grundmodellen var lämpligt Residual Plots För att kontrollera att modellen följer antagandet om homoskedasticitet har Residual Plots tagits fram för samtliga variabler som ingår i den slutgiltiga modellen. Ett tydligt mönster i grafen tyder på heteroskedasticitet medan ett slumpmässigt mönster tyder på homoskedasticitet. I figuren nedan visas ett exempel på en Residual Plot för variabeln år på marknaden (Figur 5). Inget tydligt mönster kan avläsas och därmed stämmer antagandet om att homoskedasticitet råder och variansen för feltermerna är därmed konstant. Samma slutsats fattades utifrån graferna för de resterande variablerna (Appendix). Figur 5. Residual Plot År på marknaden Normal Q-Q Plot För att antagandet om normalfördelade residualer ska gälla ska punkterna i Normal Q-Q Plot anta en linjär form. Inga stora avvikelser kan utläsas ur grafen och därmed är antagandet uppfyllt (Figur 6). 32

40 Figur 6. Normal Q-Q Plot 33

41 5 Diskussion 5.1 Analys av slutgiltig modell I detta avsnitt analyseras de bakomliggande faktorerna till resultatet av regressionsmodellen. Regressionen av den slutgiltiga modellen visar att variablerna anställda, enskilt gym, franchise, gruppklasser och öppettider har en negativ påverkan på lönsamheten. Av variablerna som ingår i modellen har medlemmar per anläggning och år på marknaden en positiv påverkan på lönsamheten. Bindningstid, anläggningar och pris reducerades ur modellen. Orsakerna bakom resultatet av regressionen diskuteras nedan. Förklaringsgrad Den relativt låga förklaringsgraden, 65 %, beror troligtvis på uteslutande av relevanta variabler. En sådan variabel kan tänkas vara varumärke, vilket är svårt att kvantifiera och har därmed inte tagits med i regressionen. År på marknaden är troligtvis den variabel som har starkast korrelation med varumärket av de variablerna som har tagits med i modellen. Det finns även andra interna och externa faktorer som påverkar lönsamheten för ett företag som är svåra att kvantifiera, t ex konkurrenters och omvärldsfaktorers påverkan. Dessa diskuteras i senare avsnitt (se kapitel 5). Förklaringsgraden visar på i vilken grad variablerna i regressionen förklarar lönsamheten. Men även de variabler som inte förklarar lönsamheten, som därmed reduceras ur modellen, är av intresse i denna undersökning. Att dessa variabler reducerades visar på att dessa faktorer inte har stor påverkan på lönsamheten, vilket är intressant information för företag inom branschen. Anläggningar Anläggningar reducerades ur modellen, vilket antyder att variabeln inte har någon större påverkan på lönsamheten. En förklaring till detta kan vara att antal anläggningar kan ha både positiv och negativ påverkan på lönsamheten beroende på vilket tidsperspektiv som undersöks. Det krävs kapital för att öppna fler gym, vilket kan påverka lönsamheten negativt det aktuella året då 34

42 investeringen genomförs. Däremot är expansion troligtvis positivt för lönsamheten i ett längre perspektiv. Om företaget öppnat nya anläggningar under året, kommer rörelsemarginalen troligtvis vara lägre än året innan. När företag öppnar nya anläggningar kan det ta en viss tid innan anläggningen når ett medlemsantal som genererar lönsamhet till verksamheten och anläggningen utgör då endast en kostnad. Detta syns tydligt i förändringarna i SATS rörelsemarginal (Figur 7). De tre åren, 2009, 2010 och 2011, då de hade samma antal anläggningar (Figur 8) ökade rörelsemarginalen eftersom antalet medlemmar till de befintliga anläggningarna ökade. Åren då de expanderade minskade rörelsemarginalen. Fler anläggningar medför att valmöjligheten för träning ökar för företagets medlemmar, vilket ökar kundnöjdheten samtidigt som det kan attrahera fler medlemmar. Dessutom bygger företaget genom exponering upp sitt varumärke, vilket ytterligare kan påverka lönsamheten positivt på längre sikt. Figur 7. SATS rörelsemarginal över tiden Figur 8. SATS antal anläggningar över tiden 35

43 Anställda Skattningen som representerar anställda är negativ, vilket innebär att personal på anläggningarna påverkar lönsamheten negativt. Detta beror troligtvis på att personal är en stor kostnad och ju fler anställda, desto större personalkostnader. Det mervärde som personal tillför överstiger, enligt skattningen, inte kostnaden. Det finns dock en begränsning i reducering av anställda eftersom det krävs ett minimum antal anställda för administrativa uppgifter. Det innebär att även om företaget väljer att ha låg personaltäthet på anläggningarna, kräver en större gymkedja ett större antal administrativ personal. Enligt en undersökning genomförd av Svenskt Kvalitetsindex, som tog mått på kundnöjdheten i gymbranschen, är kunder i stor utsträckning missnöjda med kundbemötande och engagemang hos personalen [21]. Majoriteten av gymaktörerna har personal på sina anläggningar. En rekommendation till de företag som väljer att ha hög personaltäthet på sina anläggningar, trots de stora kostnader som personal medför, är därför att engagera medarbetarna då det annars inte skapar ett mervärde för kunden, utan snarare tvärtom. I regressionsanalysen har anställda inte kategoriserats, vilket är en brist i studien då olika typer av anställda kan generera olika värde för kunden. Troligtvis tillför personliga tränare och instruktörer ett högre värde än exempelvis receptionister. Däremot tillför receptionister troligtvis ett högre värde om receptionen är ansluten till en shop som säljer träningstillbehör vilket möjliggör för merförsäljning. Detta har i sin tur har positiv påverkan på lönsamheten. Det kan däremot ifrågasättas om instruktörer kan ersättas med virtuella klasser, förinspelade klasser som visas på en bildskärm, och om virtuella klasser på så sätt tillför samma värde som traditionella gruppträningsklasser men till en lägre kostnad. För detta behöver värdet kvantifieras för både klasserna och därefter övervägas vilken typ som ska användas. Resultaten kan visa att kombinationen av dessa två är det som genererar störst lönsamhet. 36

44 Resultatet av studien visar att anställda ska minskas för att öka lönsamheten. Genom att kategorisera anställda i regressionen kunde resultatet blivit mer specifikt då det kan ge information om vilken typ av anställda som har positiv respektive negativ påverkan på lönsamheten. Anledningen till att detta inte medtogs i undersökningen var att typer av anställda inte gick att särskilja från varandra i årsredovisningarna. Bindningstid Bindningstid reduceras ur modellen, vilket betyder att den inte har en stor påverkan på lönsamheten. Genom att binda upp sina kunder säkrar företaget sina framtida intäkter men det kan även avskräcka kunder som inte vill binda upp sig på långa avtal. Enskilt gym Marknaden går mer och mer åt att de stora kedjorna tar över, vilket syns i variabeln enskilt gym som representerar de gym som inte ingår i en kedja. Denna variabel är negativ, vilket var ett väntat resultat då två av de tre enskilda gymaktörerna i undersökningen har negativa årliga resultat. En annan sak som talar för detta är Puls & Tränings anläggning i Göteborg. Där har kedjan endast en anläggning som kan betraktas som ett enskilt gym på den lokala marknaden. I Göteborg har Puls & Träning inte lyckats bygga upp sitt varumärke i samma utsträckning som de större kedjorna, som till exempel SATS och Friskis&Svettis, och anläggningen har därför svårt att generera lönsamhet. Puls & Träning är som störst i Stockholmsregionen, där det är en välkänd gymkedja, och där genererar verksamheten också lönsamhet. Det är därför en fördel att vara en kedja eftersom det ger större möjligheter att bygga ett starkt varumärke. Dessutom har deras kunder större valmöjligheter, då det finns fler anläggningar att träna på. Kedjornas stordriftsfördelar har också en positiv påverkan på lönsamheten. Exempel på stordriftsfördelar i branschen är att en stor kedja har möjligheter att förhandla lägre hyreskostnader av lokaler och utrustning än enskilda gym. Franchise Regressionskoefficienten till variabeln franchise är negativ, vilket betyder att franchise har en negativ påverkan på lönsamheten. Variabeln tolkas som 37

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

NÄR SKA MAN SÄLJA SIN BOSTAD?

NÄR SKA MAN SÄLJA SIN BOSTAD? NÄR SKA MAN SÄLJA SIN BOSTAD? En multipel regressionsanalys av bostadsrätter i Stockholm Oscar Jonsson Moa Englund Stockholm 2015 Matematik Institutionen Kungliga Tekniska Högskolan Sammanfattning Projektet

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

En nyttomaximerande skola i det innovationsdrivna samhället

En nyttomaximerande skola i det innovationsdrivna samhället EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 En nyttomaximerande skola i det innovationsdrivna samhället ERIC FORNANDER SIMON PARK KTH KUNGLIGA TEKNISKA HÖGSKOLAN SKOLAN FÖR TEKNIKVETENSKAP

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Prissättningsanalys av annonser på internet

Prissättningsanalys av annonser på internet EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 Prissättningsanalys av annonser på internet En analys av variabler som påverkar slutpriset GUSTAF ERLANDSSON CHRISTOFER TÄRNELL KTH KUNGLIGA

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

Prediktion av villapris

Prediktion av villapris Prediktion av villapris och dess faktorers inverkan Examensarbete inom farkostteknik, grundnivå, SA105X Institutionen för Matematik, inriktning Matematisk Statistik Kungliga Tekniska Högskolan Maj 2013

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Analys av faktorer som påverkar bränsleförbrukningen i en personbil

Analys av faktorer som påverkar bränsleförbrukningen i en personbil EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2018 Analys av faktorer som påverkar bränsleförbrukningen i en personbil Med multipel linjär regression FILIP JOVANOVIC PAUL SINGH KTH SKOLAN

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Hur skriver man statistikavsnittet i en ansökan?

Hur skriver man statistikavsnittet i en ansökan? Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1 Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β

Läs mer

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa. Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

TVM-Matematik Adam Jonsson

TVM-Matematik Adam Jonsson TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018 Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

8 Inferens om väntevärdet (och variansen) av en fördelning

8 Inferens om väntevärdet (och variansen) av en fördelning 8 Inferens om väntevärdet (och variansen) av en fördelning 8. Skattning av µ och Students T-fördelning Om σ är känd, kan man använda statistikan X µ σ/ n för att hitta konfidensintervall för µ. Om σ inte

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

HYPOTESPRÖVNING sysselsättning

HYPOTESPRÖVNING sysselsättning 0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller: Statistik 2 Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen SST021 ACEKO16h, ACIVE16h 7,5 högskolepoäng Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: Valfri miniräknare Linjal

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Att välja statistisk metod

Att välja statistisk metod Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...

Läs mer

Prediktion av bostadsrättspriser i Stockholms innerstad

Prediktion av bostadsrättspriser i Stockholms innerstad Prediktion av bostadsrättspriser i Stockholms innerstad Examensarbete inom teknisk fysik, grundnivå SA104X Kandidatexamensarbete vid institutionen för KTH Matematik, avdelning Matematisk Statistik Av Ludvig

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer