PÅVERKAS DEN KOMMUNALA SKATTESATSEN AV POLITISKT STYRE?

Relevanta dokument
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Matematisk statistik, Föreläsning 5

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Laboration 2: Styrkefunktion samt Regression

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressionsanalys av lägenhetspriser i Spånga

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Statistik 1 för biologer, logopeder och psykologer

Bayesiansk statistik, 732g43, 7.5 hp

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Regressions- och Tidsserieanalys - F1

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

F13 Regression och problemlösning

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

STATISTISKA CENTRALBYRÅN 1 (6) Enheten för social välfärdsstatistik Uppdaterad Redovisningsgrupper

10.1 Enkel linjär regression

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

LKT325/LMA521: Faktorförsök

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Regressions- och Tidsserieanalys - F1

MVE051/MSG Föreläsning 14

Föreläsning 12: Regression

Grundläggande matematisk statistik

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Medicinsk statistik II

Regressions- och Tidsserieanalys - F4

Statistik 1 för biologer, logopeder och psykologer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Vad påverkar en kommuns totala kostnad?

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F19, (Multipel linjär regression forts) och F20, Chi-två test.

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Examinationsuppgifter del 2

Industriell matematik och statistik, LMA /14

Föreläsning 12: Linjär regression

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Regressions- och Tidsserieanalys - F7

Enkel och multipel linjär regression

LABORATION 3 - Regressionsanalys

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Metod och teori. Statistik för naturvetare Umeå universitet

Urval av lämpliga kommuner. Hans Petterson Tillsynskonferens mars 2014

Innehåll. KOSTNADSJÄMFÖRELSER... 2 Varför jämföra... 2

Repetitionsföreläsning

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Matematisk statistik KTH. Formelsamling i matematisk statistik

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Matematisk statistik för D, I, Π och Fysiker

Finansiell statistik. Multipel regression. 4 maj 2011

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Regressionsanalys av NHL-statistik

Laboration 4 R-versionen

TAMS65 - Seminarium 4 Regressionsanalys

Analys av bostadsrättspriset i Stockholms innerstad

Laboration 2 multipel linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Härledning av Black-Littermans formel mha allmänna linjära modellen

Linjär regressionsanalys. Wieland Wermke

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901 Sannolikhetsteori och statistik I

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

4 Diskret stokastisk variabel

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

F11. Kvantitativa prognostekniker

Multipel Regressionsmodellen

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Fråga nr a b c d 2 D

Sänkningen av parasitnivåerna i blodet


EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

oberoende av varandra så observationerna är

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

MVE051/MSG Föreläsning 7

Lektionsanteckningar 11-12: Normalfördelningen

Statistisk analys av komplexa data

Transkript:

KUNGLIGA TEKNISKA HÖGSKOLAN PÅVERKAS DEN KOMMUNALA SKATTESATSEN AV POLITISKT STYRE? En strukturell analys av faktorer som avgör skatten i svenska kommuner Lovisa Styrud styrud@kth.se Handledare: Henrik Hult hult@kth.se Kandidatexamensarbete SA104X 15 hp Avdelningen för matematisk statistik Institutionen för matematik VT15

Abstract The aim of this report was to investigate which factors determine municipal taxes in Sweden. The aim was also to nd out whether and how the forms of political rule are signicant covariates. A multiple regression analysis was performed using data from 289 municipalities. The analysis resulted in ve dierent models, of which a model based on municipal grouping was found to be most satisfactory. In all of the models, there are eects from the form of political rule. The results indicate that socialist municipalities have higher tax rates than non-socialist. Also, coalitions between socialist and non-socialist parties have higher tax rates than purely non-socialist rules. Finally, majority rules have higher tax rates compared to minorities. Sammanfattning Syftet med denna rapport var att undersöka vilka faktorer som avgör primärkommunalskatten i svenska kommuner. Syftet var även att ta reda på huruvida formerna av politiskt styre är relevanta förklaringsvariabler. En multipel regressionsanalys genomfördes med data från 289 av Sveriges kommuner. Analysen resulterade i fem modeller, där en modell som baserats på kommungruppsindelning befanns vara mest tillfredsställande. I alla modeller nns tydliga eekter från formen av politiskt styre. Resultaten indikerar att vänsterstyrda kommuner har högre skatter än borgerligt styrda. Vidare har blocköverskridande styren högre skatter än borgerligt styrda kommuner. Slutligen resulterar majoritetsstyren i högre primärkommunalskatt än minoritetsstyren. 2

Tack Jag vill först och främst tacka Henrik Hult för insiktsfull handledning. Vidare vill jag även tacka Margareta Olofsson för tips och råd i skrivprocessen. Slutligen vill jag tacka mina klasskamrater för värdefulla kommentarer. 3

Innehållsförteckning 1 Inledning 6 1.1 Syfte, frågeställningar och hypotes....................... 6 2 Bakgrund 8 2.1 Sveriges kommuner................................ 8 2.2 Ansvarsområden och ekonomi.......................... 9 3 Metod 11 3.1 Multipel linjär regression............................. 11 3.1.1 Minsta kvadratmetoden......................... 11 3.1.2 Antaganden................................ 12 3.1.3 Heteroskedasticitet............................ 12 3.1.4 Multikollinearitet............................. 13 3.1.5 Endogenitet................................ 14 3.2 Val av modell................................... 14 3.2.1 t-test och F-test............................. 14 3.2.2 Hypotesprövning............................. 15 3.2.3 Förklaringsgrad.............................. 15 3.2.4 AIC och BIC............................... 15 3.2.5 Q-Q plot................................. 16 3.3 Förklaringsvariabler............................... 16 3.4 Data........................................ 18 4 Utförande 18 4.1 Metod 1: Modellval genom ämnesanalys.................... 18 4.1.1 Modell 1.................................. 18 4.1.2 Modell 2.................................. 19 4.1.3 Modell 3.................................. 19 4.1.4 Modell 4.................................. 19 4.2 Metod 2: Modellval genom stegvis regression med AIC............ 20 4.2.1 Modell 5.................................. 20 5 Resultat 20 5.1 Metod 1: Modellval genom ämnesanalys.................... 20 5.1.1 Modell 1.................................. 20 5.1.2 Modell 2.................................. 21 5.1.3 Modell 3.................................. 22 5.1.4 Modell 4.................................. 23 5.2 Metod 2: Modellval genom stegvis regression med AIC............ 24 5.2.1 Modell 5.................................. 24 4

6 Diskussion 26 6.1 Analys av Modell 1-5............................... 26 6.2 Gemensamma resultat för Modell 1-5..................... 27 6.3 Förklaring av data................................ 28 7 Slutsatser 28 5

1 Inledning Inkomstskatt är något de esta i Sverige berörs av. Alla som har inkomster över ca 17 000 kr per år betalar skatt [26]. Den kommunala skattesatsen varierar mellan kommunerna och skatten används till en mängd olika samhällsfunktioner, såsom infrastruktur, sjukvård, skola och äldreomsorg. Men vad motiverar egentligen hur hög skattesatsen ska vara? Ett transparent skattesystem där det är enkelt att se och förstå vad medborgarnas skatt går till är grundläggande för en demokrati. Ett svårförståeligt och irrelevant system minskar tilltron till politiker och samhället i stort. Detta projekt syftar till att öka förståelsen för hur skattesatsen i kommunerna motiveras. Projektet avser även att undersöka om det nns en politisk eekt på den kommunala skattesatsen. Genom att belysa hur skattepengarna fördelas skapas möjligheter att hitta områden där den kommunala ekonomin kan eektiviseras vilket är av intresse för såväl enskilda kommuner som intresseorganisationer och politiska föreningar. Om en politisk förklaringsvariabel kan isoleras skulle dessutom resultatet av analysen kunna användas i kampanjsyfte av berörda politiska partier. I projektet analyseras skatten till primärkommunen, primärkommunalskatten. Det som i dagligt tal kallas för kommunalskatt utgörs av primärkommunalskatt, landstingsskatt och en begravningsavgift eller en kyrkoavgift beroende på medlemskap i svenska kyrkan [1]. 1.1 Syfte, frågeställningar och hypotes Avsikten med rapporten är att göra en strukturell analys av variabler som förklarar primärkommunalskatten i svenska kommuner. Ytterst syftar denna analys till att utröna om det nns en politisk eekt, dvs. om typen av kommunalt styre påverkar primärkommunalskatten. Notera att arbetet inte behandlar hur skatteintäkterna används. De två frågor som analysen ämnar att besvara är således: ˆ Vilka variabler förklarar primärkommunalskatten i svenska kommuner? ˆ Påverkas primärkommunalskatten av politiskt styre? Allmänt känt är att partier med socialistisk bakgrund ofta förespråkar högre skattesatser än borgerliga partier, vilket baserar sig på en skillnad i ideologisk uppfattning om statens roll i förhållande till landets medborgare. Hypotesen för denna analys är därför att vänsterstyrda kommuner har en något högre primärkommunalskatt, givet konstanta övriga förutsättningar. Eftersom majoritetsstyren har större förutsättningar att genomföra sin 6

politik än minoritetsstyren, är det rimligt att anta att det även här existerar en politisk eekt. Hypotesen för detta är således att skillnaden i primärkommunalskatt är högre vid socialistiska majoritetsstyren. Gällande blocköverskridande styren innebär de per denition kompromissande mellan partier tillhörande olika politiska block. Hypotesen är att ett blocköverskridande styre har högre skatt än ett uteslutande borgerligt, även om eekten är mindre jämfört med vänsterstyrda kommuner. 7

2 Bakgrund I detta avsnitt ges en kortfattad framställning av Sveriges kommuner samt deras ansvarsområden och verksamhet. 2.1 Sveriges kommuner Sverige styrs på fyra olika politiska nivåer. Inom landet är den högsta nivån den nationella, där riksdagen och den lagstiftande makten nns. Sveriges 21 län och 20 landsting utgör den regionala nivån medan styret på lokal nivå ansvaras för av 290 kommuner. Utöver dessa nationella nivåer styrs Sverige även på EU-nivå [5]. I alla kommuner nns en folkvald kommunfullmäktige som fattar beslut om kommunens verksamhet. Kommunfullmäktige utser en kommunstyrelse vilken är det högsta styrande organet i kommunen och ansvarar för förvaltning av de beslut som fattas i fullmäktige [4]. Beroende på kommunernas funktion och demograska situation delas de in i tio olika kommungrupper. Varje kommun tillhör endast en grupp, och dessa denieras enligt följande [22]: 1. Storstäder Kommuner med en folkmängd som överstiger 200 000 invånare. 2. Förortskommuner till storstäder Kommuner där mer än 50 procent av nattbefolkningen pendlar till arbetet i någon annan kommun. Det vanligaste utpendlingsmålet ska vara någon av storstäderna. 3. Större städer Kommuner med 50 000-200 000 invånare samt en tätortsgrad överstigande 70 procent. 4. Förortskommuner till större städer Kommuner där mer än 50 procent av nattbefolkningen pendlar till arbetet i en annan kommun. Det vanligaste utpendlingsmålet ska vara någon av de större städerna i grupp 3. 5. Pendlingskommuner Kommuner där mer än 40 procent av nattbefolkningen pendlar till en annan kommun. 6. Turism- och besöksnäringskommuner Kommuner där antalet gästnätter på hotell, vandrarhem och campingar överstiger 21 per invånare eller där antalet fritidshus överstiger 0,20 per invånare. 7. Varuproducerande kommuner Kommun där 34 procent eller mer av nattbefolkningen mellan 16 och 64 år är sysselsatta inom tillverkning och utvinning, energi och miljö samt byggverksamhet. 8

8. Glesbygdskommuner Kommun med en tätortsgrad understigande 70 procent och mindre än åtta invånare per kvadratkilometer. 9. Kommuner i tätbefolkad region Kommun med mer än 300 000 personer inom en radie på 112,5 kilometer. 10. Kommuner i glesbefolkad region Kommun med mindre än 300 000 personer inom en radie på 112,5 km. 2.2 Ansvarsområden och ekonomi De frågor som behandlas i kommunfullmäktige rör bland annat skola, kommunal infrastruktur, äldrevård och energi [4]. Kommunenernas intäkter utgörs i huvudsak av kommunalskatter, statsbidrag samt taxor och avgifter, se gur 1. Figur 1: Diagram över den genomsnittliga fördelningen av kommuners intäkter för 2013 [6]. Den genomsnittliga fördelningen av kommunernas kostnader ses i gur 2. De större posterna utgörs av skolverksamhet och äldreomsorg. 9

Figur 2: Diagram över den genomsnittliga fördelningen av kommuners kostnader för 2013 [6]. Kommunerna beslutar autonomt om primärkommunalskatten och hur skatteintäkterna ska nansiera den kommunala verksamheten [5]. Kommunalskatten står för omkring 70 % av intäkterna, vilket ses i gur 1. En stor del av statsbidragen utgörs av kommunalekonomisk utjämning och innebär bland annat inkomst- och kostnadsutjämning. Syftet med detta är att "skapa likvärdiga ekonomiska förutsättningar för alla kommuner och landsting i landet för att kunna bedriva den kommunala verksamheten" [11]. 10

3 Metod I detta avsnitt behandlas den matematiska bakgrunden till multipel linjär regressionsanalys. Även olika problem som kan uppstå vid analys diskuteras. 3.1 Multipel linjär regression Utgångpunkten i multipel linjär regression är att en beroende variabel, y, kan uttryckas som en funktion av ett antal kovariater (förklaringsvariabler), x j, samt residualen e i. Detta skrivs enligt följande linjära modell [12] y i = Σ k j=0x ij β j + e i, i = 1,..., n (1) där β j är en konstant, n är antalet observationer av den beroende variabeln y och k är antalet förklaringsvariabler. På matrisform ser (1) ut enligt Y = Xβ + e (2) där Y är en matris av storleken n 1, X är n (k+1), β är n 1 och e är n 1. Vid (multipel) linjär regressionsanalys anpassas data till denna modell. Syftet är att skatta den okända koecientvektorn β samt standardavvikelsen hos varje ingående element [13]. Med skattad β kan modellen användas för prediktion eller strukturell tolkning. Vid prediktion uppskattas värdet av den beroende variabeln givet en uppsättning värden av förklaringsvariablerna. Utgångspunkten vid strukturell tolkning är att den beroende variabeln påverkas av förklaringsvariablerna, och inte tvärtom [13]. Syftet med strukturell tolkning är att utröna graden av påverkan från respektive förklaringsvariabel på den beroende variabeln. 3.1.1 Minsta kvadratmetoden Ett sätt att anpassa data till den linjära modellen är minsta kvadratmetoden. Genom minsta kvadratmetoden bestäms β så att summan av residualerna i kvadrat, ê t ê = ê 2, minimeras. Här betecknar ê skattningen av e. Minsta kvadratanpassningen fås genom att lösa normalekvationerna för β [14] X t ê = 0 (3) Insättning av (2) i (3) ger minsta kvadratuppskattningen av β enligt Den till data anpassade modellen skrivs där ˆβ och ê betecknar skattade värden. β = (X t X) 1 X t Y (4) Y = X ˆβ + ê (5) 11

3.1.2 Antaganden Vid användande av minsta kvadratmetoden för anpassning av data till en linjär modell görs ett antal antaganden. Dessa behöver beaktas vid analys och eventuella överträdelser av dessa måste hanteras. Antagandena är följande [7]: 1. den beroende variabeln kan uttryckas enligt den linjära modellen Det antas att den beroende variabeln är linjärt beroende av förklaringsvariablerna plus residualen. Det antas även att elementen i β är konstanter. 2. väntevärdet av residualen är noll Residualen (feltermen) har väntevärdet noll: E(e) = 0. 3. residualerna har samma standardavvikelse och är inte linjärt beroende Detta innebär att E(ee t ) = σ 2 I, där I är identitetsmatrisen av storlek n n. 4. observationerna av förklaringsvariablerna är konstanta vid upprepade mätningar Detta innebär att det är möjligt att vid upprepade insamlingar av data återfå samma värden av de oberoende variablerna. 5. antalet observationer är större än antalet förklaringsvariabler och förklaringsvariablerna är ej linjärt beroende. Detta betyder att rank(x) < n, där n är antalet observationer. 3.1.3 Heteroskedasticitet Problemet då antagande 3 är ogiltigt kallas heteroskedasticitet. Vid heteroskedasticitet gäller att E(e 2 i ) = σ2 i, där i = 1,..., n. Detta innebär att minsta kvadratskattningen av standardavvikelserna för β inte är väntevärdesriktig, vilket ger felaktiga värden vid användande av t-test, se avsnitt 3.2.1 [15]. Heteroskedasticitet kan upptäckas genom att studera residualerna plottade mot predikterade värden. Om residualerna fördelar sig jämnt kring 0 föreligger homoskedasticitet. Heteroskedasticitet upptäcks genom att det nns trender i fördelningen av residualerna. Ett exempel är då residualerna har ett trattliknande mönster, såsom i gur 3. I gur 3 ses att variansen av residualerna ökar med x. Figur 3: Exempel på heteroskedasticitet 12

En första åtgärd vid heteroskedasticitet är att revidera modellen. Exempelvis är det vid jämförelse mellan olika stora kommuner lämpligt att skala både beroende och oberoende variabler med folkmängd [16]. En annan lämplig åtgärd är att använda sig av White's consistent variance estimator. Estimatorn lyder Ĉov( ˆβ) = (X t X) 1 (Σ n i=1ê i 2 x t ix i )(X t X) 1 (6) där Ĉov( ˆβ) är kovariansmatrisen för β. Estimatorn bör dessutom skalas med n/(n k 1) [17]. 3.1.4 Multikollinearitet Felaktighet i det femte antagandet kallas multikollinearitet. Vid exakt multikollinearitet nns ett fullständigt linjärt beroende mellan ett par eller ett antal av förklaringsvariablerna. Detta kan uppstå vid felaktigt användande av dummy-variabler. Ett exempel skulle kunna vara att inkludera både kovariater för majoritets- och minoritetsstyre i den linjära modellen. Eftersom en kommun styrs antingen i majoritet eller i minoritet föreligger ett exakt linjärt beroende mellan dessa förklaringsvariabler. Mer vanligt i praktiska tillämpningar är dock ungefärlig linearitet mellan ett par eller ett antal av de oberoende variablerna. Multikollinearitet kan upptäckas genom att standardavvikelserna för β vid minsta kvadratanpassning är stora. Ett annat sätt är att undersöka kovariansmatrisen för att upptäcka linearitet mellan två av förklaringsvariablerna. En tredje metod är att undersöka konditionstalet för X [8]. Dessutom kan diagonalelementen i inversen av kovariansmatrisen studeras, kallade variance ination factors, VIF i = (1 Ri 2) 1. Ri 2 beräknas enligt (9), där regression utförts på den i:te förklaringsvariabeln mot övriga kovariater. Ett VIF i > 10 kan betyda stora problem med multikollinearitet [9]. Minsta kvadratskattningen är dock fortfarande väntevärdesriktig vid multikollinearitet. Det största problemet orsakat av multikollinearitet är att de stora standardavvikelserna i β försvårar testande av hypoteser. Dessutom går det inte att skilja mellan varians orsakad av multikollinearitet och varians orsakad av spridning i data. Åtgärder mot multikollinearitet behöver dock inte alltid vidtas. Om R 2 från minsta kvadratanpassningen är större än R 2 från regression av en förklaringsvariabel mot övriga oberoende variabler kan problemen med multikollinearitet bortses från. Om t-test för alla element i β > 2 behöver heller inga åtgärder vidtas [8]. Möjliga åtgärder mot multikollinearitet listas nedan [8]: ˆ lägg till mer data. ˆ specicera beroendet mellan förklaringsvariablerna. estimationsproblem. Detta leder till ett simultant 13

ˆ ta bort en förklaringsvariabel. Detta bör endast göras då dess koecient uppskattas vara noll. 3.1.5 Endogenitet Endogenitet innebär att E(e i ) 0 eftersom feltermen e i är korrelerad med en eller era av förklaringsvariablerna. Detta ger icke-konsistenta uppskattningar av β med minsta kvadratmetoden. Kort sammanfattat uppstår endogenitet vid följande situationer: ˆ urvalsfel. Urvalsfel uppstår när uppsättningar av data väljs ut på ett sätt som inte återspeglas i förklaringsvariablerna ˆ samtidighet. Samtidighet innebär att den beroende variabeln påverkar en eller era av förklaringsvariablerna. ˆ avsaknad av relevanta variabler. ˆ mätfel. Ett sätt att hantera förekomst av endogenitet är införande av instrumentella variabler. Detta görs genom att hitta nya oberoende och exogena variabler som är korrelerade med de endogena. De instrumentella variablerna utgörs nu av samtliga exogena variabler. Sedan utförs en "Two Stage Least Squares"-analys (2SLS) [18]. 3.2 Val av modell Essentiellt vid regressionsanalys är att hitta en lämplig modell för sina data. Analys av modellen sker med hjälp av metoder förklarade i detta avsnitt. 3.2.1 t-test och F-test För att testa hypoteser och konstruera kondensintervall för β används t- och F-test. Vid test av en enskild parameter kan både t- och F-test användas. En teststatistika är ˆβ i β 0 i S.E.( ˆβ i ) (7) där S.E.( ˆβ i ) är standardavvikelsen för ˆβ i. Denna teststatistika är t-fördelad [10]. En teststatistika för F-test är ( ˆβi βi 0 ) 2 S.E.( ˆβ (8) i ) Denna teststatistika är F(1, n k 1)-fördelad, där n är antalet observationer och k är antalet förklaringsvariabler [19]. 14

3.2.2 Hypotesprövning Hypotesprövning syftar till att dra slutsatser om giltigheten för beräknade koecientvärden. Ofta är det av intresse att testa nollhypotesen, vilket innebär undersökning av huruvida en koecient är noll. Vid testande av ett enskilt koecientvärde under nollhypotesen vid linjär regression används oftast t-test, med teststatistika enligt (7) [10]. Värdet på teststatistikan, som är t-fördelat, jämförs med t-fördelningen med syftet att bestämma p- värdet för den givna koecienten. P-värdet motsvarar sannolikheten att erhålla ett minst lika extremt värde på teststatistikan under förutsättning att nollhypotesen är sann. Vid lågt p-värde förkastas nollhypotesen. På signikansnivån 5 % förkastas nollhypotesen för p-värden under 0.05. Detta innebär att koecienten är statistiskt signikant på nivån 5 %. F-test används vid test av simultana hypoteser. En teststatistika är (8), vilken är F-fördelad. Hypotesprövningen går till på samma sätt som för t-test. 3.2.3 Förklaringsgrad Förklaringsgraden R 2 är ett mått på hur väl data anpassats till modellen och beräknas enligt R 2 = ê 2 ê 2 ê 2 = 1 ê 2 ê 2 (9) där ê 2 är kvadratsumman av residualerna vid regression på enbart en intercept, vilket är skärningen med y-axeln [20]. Vid justerat R 2, R 2, skalas R 2 med antalet frihetsgrader [21]. Enligt (9) varierar R 2 mellan 0 och 1. Ett högt värde på R 2 innebär en hög förklaringsgrad i modellen. 3.2.4 AIC och BIC Akaike's Information Criterion, AIC, och Bayesian Information Criterion, BIC, är två tester för evaluering av modellen. Vid AIC väljs den modell som minimerar 2k 2ln(L) (10) där L är maximum likelihood-funktionen för den givna modellen, k är antalet kovariater och n är antalet observationer. AIC minimeras vid få kovariater och ett högt värde på L [23]. Notera att AIC kan anta negativa värden. Enligt BIC väljs den modell som minimerar k ln(n) 2ln(L) (11) Även här är L maximum likelihood-funktionen, k är antalet kovariater och n är antalet observationer [24]. Notera att BIC kan anta negativa värden. 15

3.2.5 Q-Q plot En Q-Q plot används för att bestämma om två datamängder tillhör samma statistiska fördelning. Detta görs genom att plotta datamängdernas kvantiler mot varandra. En kvantil denieras av hur stor andel av data som har ett värde under värdet för kvantilen. Exempelvis innebär 0.1-kvantilen att 10% av datamängden har ett värde under värdet för kvantilen. Tillhör de två datamängderna samma fördelning ligger kvantilerna längs linjen y=x. Om den ena datamängden väljs att genereras från en normalfördelning fås en normal Q-Q plot. Detta är fördelaktigt att använda för att undersöka om residualerna vid en linjär regression är normalfördelade [25]. Figur 4 visar ett exempel på data som inte är normalfördelad. Figur 4: Q-Q plot där observerade data inte är normalfördelad 3.3 Förklaringsvariabler Följande kovariater har bedömts vara tänkbara förklaringsvariabler för analysen. Variablerna har valts genom en kvalitativ bedömning av faktorer som kan tänkas påverka kommunalskatten, med stöd av bland annat gur 1 och 2. 16

Tabell 1: Förklaringsvariabler som använts i analysen Förklaringsvariabel Typ Beskrivning areal per invånare kvantitativ km 2 /inv täthet kvantitativ inv/km 2 folkmängd kvantitativ antal förvärvsinkomst 1 kvantitativ kr/inv arbetslöshet kvantitativ andel av folkmängd medelålder kvantitativ år andel 1-5 år kvantitativ andel av folkmängd andel 6-15 år kvantitativ andel av folkmängd andel 16-19 år kvantitativ andel av folkmängd andel 65-79 år kvantitativ andel av folkmängd andel >80 år kvantitativ andel av folkmängd andel med funktionshinder kvantitativ andel av folkmängd andel 1-5 år inskrivna på förskola kvantitativ andel av antal 1-5 år betyg nationellt prov 2 kvantitativ skala 0-20 där F=0, A=20 utrikes födda kvantitativ andel av folkmängd yktingmottagande kvantitativ andel av folkmängd kommunens externa intäkter 3 kvantitativ kr/inv kommunkoncernens 4 externa intäkter 5 kvantitativ kr/inv kommunalekonomisk utjämning kvantitativ kr/inv, se avsnitt 2.2 generella statsbidrag 6 kvantitativ kr/inv tätortsgrad kvantitativ andel av folkmängd i tätort storstad dummy se avsnitt 2.1 förortskommun till storstad dummy se avsnitt 2.1 större stad dummy se avsnitt 2.1 förortskommun till större stad dummy se avsnitt 2.1 pendlingskommun dummy se avsnitt 2.1 turism- och besöksnäringskommun dummy se avsnitt 2.1 varuproducerande kommun dummy se avsnitt 2.1 glesbygdskommun dummy se avsnitt 2.1 kommuner i tätbefolkad region dummy se avsnitt 2.1 kommuner i glesbefolkad region dummy se avsnitt 2.1 socialistiskt styre 7 dummy S, MP, V och/eller FI blocköverskridande styre dummy blocköverskridande koalition 8 majoritetsstyre dummy majoritet i kommunfullmäktige 1 genomsnitt över befolkningen 2 i matematik åk 9 3 avgifter, försäljningsintäkter, specialdestinerade statsbidrag etc [3] 4 kommunkoncernen utgörs av kommunen samt kommunägda företag [3] 5 avgifter, försäljningsintäkter, specialdestinerade statsbidrag etc [3] 6 generella statsbidrag, utjämning och fastighetsavgift 17 7 kommuner med socialistiskt styre benämns även som vänsterstyrda kommuner 8 koalition med M, FP, C och/eller KD

3.4 Data Den data som använts i analysen är oentlig och är hämtad från de statliga myndigheterna Statistiska centralbyrån, Skatteverket, Migrationsverket och Skolverket. Data har även hämtats från Sveriges Kommuner och Landsting, som är en arbetsgivar- och intresseorganisation. I analysen har Gotland identierats som en outlier och exkluderats, då Gotlands län saknar landsting, och kommunen därför ansvarar för frågor som i övriga kommuner hanteras av landstingen. Kommunalskatten på Gotland är därför inte jämförbar med skatten i övriga svenska kommuner. 4 Utförande Modeller har tagits fram utifrån två olika infallsvinklar. Dels har modeller utformats efter kvalitativa bedömningar av hur modeller beskrivande primärkommunalskatten rimligtvis kan se ut. Detta har baserats på bland annat analys av kommuners genomsnittliga kostnadsoch intäktsfördelning. Utöver detta ämnesanalytiska tillvägagångssätt har stegvis regression tillämpats genom baklänges elimination med minimering av AIC. Alla beräkningar har genomförts i RStudio som är ett program för statistiska beräkningar. 4.1 Metod 1: Modellval genom ämnesanalys Metoden att välja modell baserat på ämnesanalys förespråkas av Burnham & Anderson [2]. Författarna menar att era modeller grundade i noggrann analys av ämnesområdet bör tas fram för att sedan testas mot data. Data har anpassats till modellerna med minsta kvadratmetoden. Sedan har multikollinearitet testats för med VIF och studier av kovariansmatriser. Signikanta koecienter har undersökts med t-test. Antagandet om normalfördelning av residualerna har analyserats med hjälp av en Q-Q plot och förekomst av heteroskedasticitet har testats genom plottning av residualer mot de predikterade värdena för primärkommunalskatten. 4.1.1 Modell 1 En första modell bygger på studie av kommuners genomsnittliga fördelning av kostnader på olika utgiftskategorier, se gur 2. Som synes är de största utgiftsposterna förskoleverksamhet och skolbarnomsorg, grundskola, gymnasieskola, äldreomsorg och funktionshindrade. Andelen av folkmängden i kommunen inom respektive kategori antas i Modell 1 bestämma kommunalskatten. Enligt hypotes antas även kommunens politiska styre påverka, i form av styrets politiska färg samt graden av majoritet i kommunfullmäktige. Borgerligt minoritetsstyre sätts som referenspunkt. Modell 1 ser därför ut som följer: 18

primärkommunalskatt=β 0 +(andel 1-5 år)β 1 +(andel 6-15 år)β 2 +(andel 16-19 år)β 3 +(andel 65-79 år)β 4 +(andel 80 år)β 5 +(andel funktionshindrade)β 6 +(socialistiskt styre)β 7 + (blocköverskridande styre)β 8 +(majoritetsstyre)β 9 +(majoritetsstyre) (socialistiskt styre)β 10 4.1.2 Modell 2 I ett andra försök till en enkel ämnesanalytisk modell modelleras primärskatten som en linjär funktion av kommunernas inkomster genom studie av gur 1. De största intäktsposterna utgörs av skatteintäkter och generella statsbidrag. För att representera kommuners skatteintäkter väljs förklaringsvariabeln förvärvsinkomst (kr/inv). Denna variabel bör vara starkt positivt korrelerad med skatteintäkter. Även i denna modell antas politiskt styre ha en påverkande eekt på primärkommunalskatten. Modell 2 ser då ut enligt följande: primärkommunalskatt=β 0 +(förvärvsinkomst)β 1 +(generella statsbidrag)β 2 + (socialistiskt styre)β 3 +(blocköverskridande styre)β 4 +(majoritetsstyre)β 5 + (majoritetsstyre) (socialistiskt styre)β 6 4.1.3 Modell 3 Modell 3 valdes som en sammanslagning av de slutgiltiga versionerna av Modell 1 och Modell 2, efter modieringar av respektive modell. Det är rimligt att tänka sig att kommunalskattens storlek beror både av kommunens intäkter och utgifter, vilket denna modell försöker fånga. 4.1.4 Modell 4 En fjärde modell som undersöktes utifrån den ämnesanalytiska utgångspunkten bygger på indelningen av alla kommuner i kommungrupper. Förutom rent geograska aspekter fångar dessa förklaringsvariabler även upp demograska skillnader mellan kommuner. Enligt hypotes antas även en politisk eekt nnas. Modell 4 ser då ut enligt följande primärkommunalskatt=β 0 +(förortskommun till storstad)β 1 +(större stad)β 2 + (förortskommun till större stad)β 3 +(pendlingskommun)β 4 + (turism- och besöksnäringskommun)β 5 +(varuproducerande kommun)β 6 + (glesbygdskommun)β 7 +(kommuner i tätbefolkad region)β 8 + (kommuner i glesbefolkad region)β 9 +(tätortsgrad)β 10 +(täthet)β 11 + (socialistiskt styre)β 12 +(blocköverskridande styre)β 13 +(majoritetsstyre)β 14 + (majoritetsstyre) (socialistiskt styre)β 15 19

4.2 Metod 2: Modellval genom stegvis regression med AIC Även om Burnham & Anderson föredrar modellval genom ämnesanalys meder de att direkt analys av data genom exempelvis nollhypotestester för att hitta signikanta förklaringsvariabler kan vara lämpligt då undersökande analyser görs. De framhäver även AIC som ett enkelt och eektivt sätt att hitta en passande modell till data [2]. 4.2.1 Modell 5 Den andra utgångspunkten har därför valts till stegvis regression med minimerande av AIC. Detta eftersom frågeställningarna har just en undersökande karaktär och det är intressant att jämföra matchning av data till modellerna som fåtts utifrån de två utgångspunkterna. I RStudio har därför en baklänges elimination genomförts, där kovariater plockas bort successivt från den ursprungliga datamängden tills en modell med lägsta möjliga AIC erhållits. Efter genomförd stegvis regression har modellen testats för multikollinearitet med VIF och studie av kovariansmatrisen. Modellen har testats för signikanta koecienter med t-test. Antagandet om normalfördelning av residualerna har analyserats med hjälp av en Q-Q plot och förekomst av heteroskedasticitet har testats genom plottning av residualer mot de predikterade värdena för primärkommunalskatten. Beroende på testernas utfall har modellen reviderats. 5 Resultat 5.1 Metod 1: Modellval genom ämnesanalys 5.1.1 Modell 1 Anpassning av data till modellen gav relativt höga VIF-värden (> 5) för kovariaterna "andel 1-5 år", "andel 6-15 år", "andel 65-79 år" och "andel 80 år". Detta innebär en något för hög grad av multikollinearitet mellan några eller samtliga av dessa. Detta var väntat eftersom det är rimligt ur en demogrask synvinkel att förhållandet mellan några eller alla av ålderskategorierna är någorlunda konstant i varje kommun. Modellen hade R 2 =0.45, vilket är en jämförelsevis låg förklaringsgrad. Vidare var AIC= -53.33 och BIC = -13.00. Koecienterna för kovariaterna "andel 1-5 år", "andel funktionshindrade", "majoritetsstyre" och "(socialistiskt styre) (majoritetsstyre)" var inte signikanta på nivån 5 %. Regressionen kördes igen utan kovariaten "andel 1-5 år", vilket gav VIF < 5 för samtliga förklaringsvariabler. Koecienterna för kovariaterna "andel funktionshindrade", "majoritetsstyre" och "(socialistiskt styre) (majoritetsstyre)" var fortfarande icke-signikanta. Dessa kovariater avlägsnades successivt från modellen och följande värden erhölls: 20

Tabell 2: Resultat för Modell 1 koecient värde standardavvikelse t-värde p-värde intercept 17,62722 0.96171 18.329 <2 10 16 andel 6-15 år -0.18827 0.06622-2.843 0.004797 andel 16-19 år 0.55131 0.17157 3.213 0.001464 andel 65-79 år 0.12423 0.03241 3.834 0.000156 andel 80 år 0.14054 0.06514 2.158 0.031803 socialistiskt styre 0.78195 0.13693 5.711 2.85 10 8 blocköverskridande styre 0.45934 0.13476 3.408 0.000749 Denna modell har R 2 =0.45, AIC=-56.84 och BIC=-31.17. Residualerna plottades mot de predikterade värdena på primärkommunalskatten, vilket ses i gur 5. Spridningen av residualerna visar inga tecken på heteroskedasticitet, varför antagandet om homoskedasticitet är giltigt. Antagandet om normalfördelade residualer är någorlunda giltigt, vilket ses i gur 6 genom att kvantilerna från data i stort sett sammanfaller med de teoretiskt förväntade från normalfördelningen. Figur 5: Residualplot för Modell 1 Figur 6: Q-Q plot för Modell 1 5.1.2 Modell 2 Vid regression med Modell 2 erhölls VIF < 4 för samtliga kovariater. Alla förklaringsvariabler förutom "blocköverskridande styre" och "(majoritetsstyre) (socialistiskt styre)" var signikanta på nivån 5 %. Dessa kovariater avlägsnades successivt och följande värden erhölls: 21

Tabell 3: Resultat för Modell 2 koecient värde standardavvikelse t-värde p-värde intercept 25,90 0,4513 57.383 < 2 10 16 förvärvsinkomst 1, 895 10 5 1.610 10 6-11.775 < 2 10 16 generella statsbidrag 0,1836 0.03503 5,241 3.12 10 7 socialistiskt styre 0,5056 0,1046 4,832 2.22 10 6 majoritetsstyre 0,3643 0,1049 3.473 0,000595 Modellen har R 2 =0.53, AIC=-103.05 och BIC= -84.71. I gur 7 ses residualerna plottade mot den predikterade primärkommunalskatten. Grafen visar på en jämn spridning av residualerna runt 0, vilket betyder att antagandet om homoskedasticitet är giltigt. Figur 8 visar på approximativ normalfördelning av residualerna. modell2.residuals 3 1 1 2 Sample Quantiles 3 1 1 3 18 20 22 24 3 2 1 0 1 2 3 fitted.values Theoretical Quantiles Figur 7: Residualplot för Modell 2 Figur 8: Q-Q plot för Modell 2 5.1.3 Modell 3 Modell 3 skapades som en sammanslagning av de bearbetade versionerna av Modell 1 och 2 enligt: primärkommunalskatt=β 0 +(förvärvsinkomst)β 1 +(generella statsbidrag)β 2 + (andel 6-15 år)β 3 +(andel 16-19 år)β 4 +(andel 65-79 år)β 5 +(andel 80 år)β 6 + (socialistiskt styre)β 7 +(blocköverskridande styre)β 8 +(majoritetsstyre)β 9 Efter regression visade sig kovariaterna "6-15 år", "andel 16-19 år", "andel 80 år" och "blocköverskridande styre vara icke-signikanta och avlägsnades successivt från modellen. Den resulterande modellen hade VIF < 2 för samtliga kovariater, R2 =0.56, AIC=-118.41 och BIC=-96.41. Övriga värden för modellen visas nedan. 22

Tabell 4: Resultat för Modell 3 koecient värde standardavvikelse t-värde p-värde intercept 23.66 0.6915 34.218 < 2 10 16 förvärvsinkomst 1.604 10 5 1.712 10 6-9.368 <2 10 16 generella statsbidrag 0.1293 0.03644 3.549 0.000452 andel 65-79 år 0.09460 0.02260 4.186 3.80 10 5 socialistiskt styre 0.4814 0.1019 4.725 3.64 10 6 majoritetsstyre 0.3095 0.1028 3.010 0.002846 Även antagandena om homoskedasticitet och normalfördelning av residualerna är giltiga för denna modell, se gur 9 och 10. modell3.residuals 2 0 1 2 Sample Quantiles 3 1 1 3 18 19 20 21 22 23 fitted.values 3 2 1 0 1 2 3 Theoretical Quantiles Figur 9: Residualplot för Modell 3 Figur 10: Q-Q plot för Modell 3 5.1.4 Modell 4 Vid regression sågs att den ursprungliga versionen av Modell 4 hade problem med multikollinearitet. Kovariaterna "tätortsgrad" och "förort till storstad" avlägsnades, vilket resulterade i en modell utan multikollinearitet. Koecienterna för "majoritetsstyre" och "(majoritetsstyre) (socialistiskt styre)" var icke-signikanta och avlägsnades en efter en. Förklaringsvariabeln för "förvärvsinkomst" visade sig ge betydligt bättre förklaringsgrad för modellen och lades därför till. Modell 4 ck slutligen följande värden: 23

Tabell 5: Resultat för Modell 4 koecient värde standardavvikelse t-värde p-värde intercept 23.24 0.6424 36.175 < 2 10 16 större stad 0.6244 0.2160 2.891 0.004151 förort till större stad 0.5974 0.2304 2.593 0.010035 pendlingskommun 0.9048 0.2120 4.268 2.72 10 5 turism/besöksnäringskom. 1.173 0.2605 4.503 9.88 10 6 varuproducerande kommun 0.8034 0.2156 3.727 0.000235 glesbygdkommun 1.742 0.2703 6.445 5.13 10 10 kom. i tätbefolkad region 0.7473 0.2258 3.310 0.001056 kom. i glesbefolkad region 1.372 0.2686 5.108 6.08 10 7 täthet 5.480 10 4 1.007 10 4-5.444 1.15 10 7 socialistiskt styre 0.5851 0.1188 4.927 1.44 10 6 blocköverskridande styre 0.2354 0.1153 2.041 0.042183 förvärvsinkomst 1.020 10 5 1.955 10 6-5.215 3.61 10 7 Modellen har R 2 =0.61, AIC=-146.56 och BIC=-98.89. En residualplot ses i gur 11 och en Q-Q plot i gur 12, vilka visar homoskedasticitet och normalfördelning av residualerna. Alla koecienter är signikanta på nivån 5 %. modell4.residuals 2 0 1 Sample Quantiles 3 1 1 18 19 20 21 22 23 fitted.values 3 2 1 0 1 2 3 Theoretical Quantiles Figur 11: Residualplot för Modell 4 Figur 12: Q-Q plot för Modell 4 5.2 Metod 2: Modellval genom stegvis regression med AIC 5.2.1 Modell 5 Den stegvisa regressionen resulterade i en modell med hög multikollinearitet mellan ett ertal av kovariaterna. Efter avlägsnande av multikollineära och/eller icke-signikanta förklaringsvariabler och erhölls en modell med följande värden: 24

Tabell 6: Resultat för Modell 5 koecient värde standardavvikelse t-värde p-värde intercept 25.06 0.5845 42.870 < 2 10 16 socialistiskt styre 0.6337 0.1094 5.793 1.86 10 8 blocköverskridande styre 0.3170 0.1084 2.924 0.00374 förort till större stad -0.6219 0.1739-3.577 0.00041 täthet 4.252 10 4 9.633 10 5-4.414 1.45 10 5 förvärvsinkomst 8.825 10 6 2.023 10 6-4.363 1.81 10 5 utrikes födda -4.116 0.8204-5.017 9.34 10 7 kom.koncernens ext. intäkter 0.1399 0.02180 6.419 5.86 10 10 betyg nationellt prov -0.1007 0.03627-2.776 0.00588 Modellen har R 2 =0.66, AIC=-191.90 och BIC= -158.90. Residualplotten i gur 13 visar att homoskedasticitet kan antas på grund av jämn spridning av residualerna kring 0, och Q-Q plotten i gur 14 visar på normalfördelade residualer. stepwise_model.residuals 2 0 1 2 18 19 20 21 22 23 24 Sample Quantiles 3 1 1 3 2 1 0 1 2 3 fitted.values Theoretical Quantiles Figur 13: Residualplot för Modell 5 Figur 14: Q-Q plot för Modell 5 25

6 Diskussion I samtliga modeller är antagandena om heteroskedasticitet och normalfördelning av residualerna giltiga. Nedan visas en sammanställning av Modell 1-5. Tabell 7: Jämförelse mellan Modell 1-5 # kovariater R2 AIC BIC Modell 1 6 0.45-56.84-31.17 Modell 2 4 0.53-103.05-84.71 Modell 3 5 0.56-118.41-96.41 Modell 4 12 0.61-146.56-98.89 Modell 5 8 0.66-191.90-158.90 6.1 Analys av Modell 1-5 Modell 1 har lägst R 2 samt högst AIC och BIC vilket tyder på en relativt dålig anpassning till data. Modellen baseras på den genomsnittliga fördelningen av kostnader på olika utgiftsposter hos svenska kommuner: skola, äldreomsorg och stöd till funktionshindrade. Andelen funktionshindrade visade sig vara icke-signikant på nivån 5 %. Det visade sig även nnas multikollinearitet mellan ålderskategorierna, vilket tyder på en någorlunda homogen åldersfördelning i kommunerna. Kovariaten "socialistiskt styre" är signikant och ger ett positivt bidrag till primärkommunalskatten. Även kovariaten "blocköverskridande styre" är signikant och positiv. Eftersom referenspunkten är borgerligt styre är tolkningen att både ett socialistiskt och ett blocköverskridande styre ger högre skatt jämfört ett borgerligt. Modell 2 har både bättre förklaringsgrad samt lägre AIC och BIC än Modell 1. Modell 2 baseras på den genomsnittliga fördelningen av intäkter från olika poster, där de dominerande är skatteintäkter och generella statsbidrag. För att undvika samtidighet valdes kovariaten "förvärvsinkomst" för att representera skatteunderlaget i kommunen. En förmodad linearitet mellan förklaringsvariablerna "förvärvsinkomst" och "generella statsbidrag" fanns ej stöd för, vilket kan bero på att de generella statsbidragen förutom socioekonomisk obalans även grundas på andra strukturella skillnader mellan kommunerna. Även i denna modell är förklaringsvariabeln "socialistiskt styre" signikant på nivån 5 % och ger en positiv påverkan på primärkommunalskatten, vid jämförelse mellan två lika kommuner gällande övriga förklaringsvariabler. Kovariaten "blocköverskridande styre" var icke-signikant i denna modell medan "majoritetsstyre" är signikant på nivån 5 %. Modell 3 utformades som en sammanslagning av Modell 1 och 2. Som väntat är förklaringsgraden högre än för Modell 1 och 2 enskilt. Både AIC och BIC är lägre för Modell 3 jämfört med Modell 1 och 2. Kovariaten "socialistiskt styre" är statistiskt signikant på nivån 5 % 26

och bidrar positivt till primärkommunalskatten. Även "majoritetsstyre" är signikant och positiv. Tolkningen är att en kommun med majoritetsstyre har högre skatt jämfört med en kommun med minoritetsstyre. Eftersom koecienten för "(majoritetsstyre) (socialistiskt styre)" inte var signikant kan inga slutsatser dras om majoritetsstyre i kombination med socialistiskt styre. Strategin bakom Modell 4 var att utnyttja kommunernas indelning i grupper för att täcka demograska skillnader, vilka tros ha en stor påverkan på kommunalskatten. Detta rör bland annat inkomst- och åldersfördelning. Förklaringsgraden för modellen är förhållandevis hög, ca 61 %. AIC och BIC är lägre för Modell 4 än för Modell 1, 2 och 3. Även i denna modell är kovariaten "socialistiskt styre" statistiskt signikant på nivån 5 %. Koecienten för förklaringsvariabeln "blocköverskridande styre" är positiv, samtidigt som den är lägre än för kovariaten "socialistiskt styre". Eftersom referenspunkten är "borgerligt styre", innebär detta att både socialistiskt och blocköverskridande styre ger högre skatt i förhållande till om en kommun är borgerligt styrd. Samtidigt innebär det också att en kommun med socialistiskt styre har högre skatt än en kommun med blocköverskridande styre. Allt detta är i samstämmighet med hypotesen, dvs. att borgerligt styrda kommuner har lägre skatt än vänsterstyrda. Modell 5 är resultatet av den stegvisa regressionen. Då den stegvisa regressionen hittar delmängden av de tänkbara förklaringsvariablerna med lägst AIC, är det inte förvånande att Modell 5 har både lägst AIC och BIC samt högst R 2. Modell 5 ger samma resultat som Modell 1 och 4 gällande socialistiskt och blocköverskridande styre. Nackdelen med Modell 5 modell är att den är svårtolkad ur ett ämnesanalytiskt perspektiv. 6.2 Gemensamma resultat för Modell 1-5 Ett genomgående resultat från samtliga modeller är signikansen för kovariaten "socialistiskt styre". Resultaten visar att socialistiskt styre ger en ökning av ca 0.6 procentenheter på primärkommunalskatten. I Modell 1, 4 och 5 är förklaringsvariabeln "blocköverskridande styre" signikant på nivån 5 %. Eftersom koecienten är > 0 innebär detta att en kommun med blocköverskridande styre har högre kommunalskatt än en jämförbar kommun med borgerligt styre. Resultaten visar på en ökning av omkring 0.3 procentenheter för ett blocköverskridande styre jämfört med ett borgerligt. Modell 2 och 3 har signikans för "majoritetsstyre". Koecienterna indikerar att vid jämförelse mellan två likvärda kommuner har den med majoritetsstyre högre primärkommunalskatt. Skillnaden är ungefär 0.3 procentenheter. Däremot har ingen av modellerna visat signikans för interaktionskovariaten "(majoritetsstyre) (socialistiskt styre)". Därför 27

kan inga slutsatser dras om primärkommunalskatten vid vänsterstyre i majoritet. Värt att notera är koecienten för "förvärvsinkomst" i Modell 2-5, vars genomsnittliga värde är ca 1.4 10 5. Den genomsnittliga förvärvsinkomsten varierar stort mellan kommunerna och ligger i intervallet 214000-503000 kr. Detta innebär att en ökning i förvärvsinkomst på 100000 kr ger ca 1.4 procentenheter lägre primärkommunalskatt då övriga kovariater hålls konstanta. Kovariaten "förvärvsinkomst" har därmed en relativt stor påverkan på primärkommunalskatten. 6.3 Förklaring av data I samtliga modeller är förklaringsgraden R 2 relativt låg. Detta är dock främst problematiskt vid prediktion. Eftersom denna analys är strukturell och samtliga koecienter i modellerna signikanta, ger modellerna trots en något låg förklaringsgrad värdefulla resultat om data. Vidare förväntas heller inte förklaringsgraden bli lika hög i denna typ av samhällsanalytiska undersökning jämfört med exempelvis analys av fysikaliska data, eftersom beslutsfattandet om kommunalskatten troligen är mer slumpartat och inte följer deterministiska lagar. En vanlig anledning till en låg förklaringsgrad är oavsiktligt utelämnande av relevanta variabler. Detta skulle kunna vara en rimlig tolkning, även om det i detta fall är mer troligt att ämnets slumpmässiga natur ger det observerade beteendet. Höga förklaringsgrader av data betyder heller inte per automatik att modellen förklarar data på ett tillfredsställande sätt. 7 Slutsatser Med det primära syftet att utföra en strukturell analys av faktorer som påverkar primärkommunalskatten är Modell 4 en lämplig utgångspunkt. Indelningen av kommuner i kommunalgrupper fångar många demograska aspekter i kommunerna och modellen är lättolkad. Gällande politiska eekter på primärkommunalskatten har analysen resulterat i följande: ˆ Vänsterstyrda kommuner har i genomsnitt högre skatt än borgerliga (ca 0.6 procentenheter) ˆ Kommuner med blocköverskridande styre har i genomsnitt högre skatt än borgerliga (ca 0.3 procentenheter) och lägre skatt än vänsterstyrda ˆ Majoritetsstyren har högre skatt än minoritetsstyren (ca 0.3 procentenheter) 28

References [1] Maria Ahrengart. Vart tar våra skattepengar vägen? Institutet för Privatekonomi, Swedbank. 2012. url: https://www.swedbank.se/idc/groups/public/@i/@sc/ @all/@mainnews/@se/documents/article/cid_682679.pdf. [2] Anderson D. R. Burnham K. P. Model Selection and Multimodel Interference. Springer, 2002, p. 2. [3] Denitionstexter till tabellpaketet Vad kostar verksamheten i Din kommun. Statistiska centralbyrån. 2013. url: http://www.scb.se/statistik/oe/oe0107/2013a01c/ Definitioner_VKV2013.pdf. [4] Den lokala nivån - kommuner. Regeringskansliets kommunikationsenhet. 2013. url: http://www.regeringen.se/sb/d/505/a/3038. [5] Det oentliga Sverige. Regeringskansliets kommunikationsenhet. 2014. url: http : //www.regeringen.se/sb/d/505. [6] Diagram för kommunerna - kommunernas kostnader och intäkter. Sveriges kommuner och landsting. 2014. url: http://skl.se/ekonomijuridikstatistik/ekonomi/ sektornisiffror/diagramforkommunerna.1882.html. [7] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp. 4142. [8] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp. 192 196. [9] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, p. 199. [10] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp. 5152. [11] Kommunalekonomisk utjämning och utjämning av LSS-kostnader. url: http://www. scb. se / sv _ /Hitta - statistik / Statistik - efter - amne / Offentlig - ekonomi / Finanser - for - den - kommunala - sektorn / Kommunalekonomisk - utjamning - och - utjamning-av-lss-kostnader/#c_undefined. [12] Harald Lang. Elements of Regression Analysis. 2014, p. 3. [13] Harald Lang. Elements of Regression Analysis. 2014, p. 4. [14] Harald Lang. Elements of Regression Analysis. 2014, p. 5. [15] Harald Lang. Elements of Regression Analysis. 2014, p. 16. [16] Harald Lang. Elements of Regression Analysis. 2014, p. 21. [17] Harald Lang. Elements of Regression Analysis. 2014, p. 17. [18] Harald Lang. Elements of Regression Analysis. 2014, pp. 2428. [19] Harald Lang. Elements of Regression Analysis. 2014, p. 54. [20] Harald Lang. Elements of Regression Analysis. 2014, p. 48. 29

[21] Harald Lang. Elements of Regression Analysis. 2014, p. 8. [22] Linda Tidekrans Möller. Kommungruppsindelning. Sveriges Kommuner och Landsting. 2015. url: http://skl.se/tjanster/kommunerlandsting/faktakommunerochlandsting/ kommungruppsindelning.2051.html. [23] Model Selection and Multimodel Interference. Springer, 2002. [24] Model Selection and Multimodel Interference. Springer, 2002. [25] Quantile-Quantile Plot. NIST Sematech. url: http://www.itl.nist.gov/div898/ handbook/eda/section3/qqplot.htm. [26] Student med sommarjobb. Swedbank. url: https://www.swedbank.se/om-swedbank/ analyser/institutet-for-privatekonomi/aktuellt-studentens-inkomstgranser/ index.htm. 30