PÅVERKAS DEN KOMMUNALA SKATTESATSEN AV POLITISKT STYRE?

Storlek: px
Starta visningen från sidan:

Download "PÅVERKAS DEN KOMMUNALA SKATTESATSEN AV POLITISKT STYRE?"

Transkript

1 KUNGLIGA TEKNISKA HÖGSKOLAN PÅVERKAS DEN KOMMUNALA SKATTESATSEN AV POLITISKT STYRE? En strukturell analys av faktorer som avgör skatten i svenska kommuner Lovisa Styrud styrud@kth.se Handledare: Henrik Hult hult@kth.se Kandidatexamensarbete SA104X 15 hp Avdelningen för matematisk statistik Institutionen för matematik VT15

2 Abstract The aim of this report was to investigate which factors determine municipal taxes in Sweden. The aim was also to nd out whether and how the forms of political rule are signicant covariates. A multiple regression analysis was performed using data from 289 municipalities. The analysis resulted in ve dierent models, of which a model based on municipal grouping was found to be most satisfactory. In all of the models, there are eects from the form of political rule. The results indicate that socialist municipalities have higher tax rates than non-socialist. Also, coalitions between socialist and non-socialist parties have higher tax rates than purely non-socialist rules. Finally, majority rules have higher tax rates compared to minorities. Sammanfattning Syftet med denna rapport var att undersöka vilka faktorer som avgör primärkommunalskatten i svenska kommuner. Syftet var även att ta reda på huruvida formerna av politiskt styre är relevanta förklaringsvariabler. En multipel regressionsanalys genomfördes med data från 289 av Sveriges kommuner. Analysen resulterade i fem modeller, där en modell som baserats på kommungruppsindelning befanns vara mest tillfredsställande. I alla modeller nns tydliga eekter från formen av politiskt styre. Resultaten indikerar att vänsterstyrda kommuner har högre skatter än borgerligt styrda. Vidare har blocköverskridande styren högre skatter än borgerligt styrda kommuner. Slutligen resulterar majoritetsstyren i högre primärkommunalskatt än minoritetsstyren. 2

3 Tack Jag vill först och främst tacka Henrik Hult för insiktsfull handledning. Vidare vill jag även tacka Margareta Olofsson för tips och råd i skrivprocessen. Slutligen vill jag tacka mina klasskamrater för värdefulla kommentarer. 3

4 Innehållsförteckning 1 Inledning Syfte, frågeställningar och hypotes Bakgrund Sveriges kommuner Ansvarsområden och ekonomi Metod Multipel linjär regression Minsta kvadratmetoden Antaganden Heteroskedasticitet Multikollinearitet Endogenitet Val av modell t-test och F-test Hypotesprövning Förklaringsgrad AIC och BIC Q-Q plot Förklaringsvariabler Data Utförande Metod 1: Modellval genom ämnesanalys Modell Modell Modell Modell Metod 2: Modellval genom stegvis regression med AIC Modell Resultat Metod 1: Modellval genom ämnesanalys Modell Modell Modell Modell Metod 2: Modellval genom stegvis regression med AIC Modell

5 6 Diskussion Analys av Modell Gemensamma resultat för Modell Förklaring av data Slutsatser 28 5

6 1 Inledning Inkomstskatt är något de esta i Sverige berörs av. Alla som har inkomster över ca kr per år betalar skatt [26]. Den kommunala skattesatsen varierar mellan kommunerna och skatten används till en mängd olika samhällsfunktioner, såsom infrastruktur, sjukvård, skola och äldreomsorg. Men vad motiverar egentligen hur hög skattesatsen ska vara? Ett transparent skattesystem där det är enkelt att se och förstå vad medborgarnas skatt går till är grundläggande för en demokrati. Ett svårförståeligt och irrelevant system minskar tilltron till politiker och samhället i stort. Detta projekt syftar till att öka förståelsen för hur skattesatsen i kommunerna motiveras. Projektet avser även att undersöka om det nns en politisk eekt på den kommunala skattesatsen. Genom att belysa hur skattepengarna fördelas skapas möjligheter att hitta områden där den kommunala ekonomin kan eektiviseras vilket är av intresse för såväl enskilda kommuner som intresseorganisationer och politiska föreningar. Om en politisk förklaringsvariabel kan isoleras skulle dessutom resultatet av analysen kunna användas i kampanjsyfte av berörda politiska partier. I projektet analyseras skatten till primärkommunen, primärkommunalskatten. Det som i dagligt tal kallas för kommunalskatt utgörs av primärkommunalskatt, landstingsskatt och en begravningsavgift eller en kyrkoavgift beroende på medlemskap i svenska kyrkan [1]. 1.1 Syfte, frågeställningar och hypotes Avsikten med rapporten är att göra en strukturell analys av variabler som förklarar primärkommunalskatten i svenska kommuner. Ytterst syftar denna analys till att utröna om det nns en politisk eekt, dvs. om typen av kommunalt styre påverkar primärkommunalskatten. Notera att arbetet inte behandlar hur skatteintäkterna används. De två frågor som analysen ämnar att besvara är således: ˆ Vilka variabler förklarar primärkommunalskatten i svenska kommuner? ˆ Påverkas primärkommunalskatten av politiskt styre? Allmänt känt är att partier med socialistisk bakgrund ofta förespråkar högre skattesatser än borgerliga partier, vilket baserar sig på en skillnad i ideologisk uppfattning om statens roll i förhållande till landets medborgare. Hypotesen för denna analys är därför att vänsterstyrda kommuner har en något högre primärkommunalskatt, givet konstanta övriga förutsättningar. Eftersom majoritetsstyren har större förutsättningar att genomföra sin 6

7 politik än minoritetsstyren, är det rimligt att anta att det även här existerar en politisk eekt. Hypotesen för detta är således att skillnaden i primärkommunalskatt är högre vid socialistiska majoritetsstyren. Gällande blocköverskridande styren innebär de per denition kompromissande mellan partier tillhörande olika politiska block. Hypotesen är att ett blocköverskridande styre har högre skatt än ett uteslutande borgerligt, även om eekten är mindre jämfört med vänsterstyrda kommuner. 7

8 2 Bakgrund I detta avsnitt ges en kortfattad framställning av Sveriges kommuner samt deras ansvarsområden och verksamhet. 2.1 Sveriges kommuner Sverige styrs på fyra olika politiska nivåer. Inom landet är den högsta nivån den nationella, där riksdagen och den lagstiftande makten nns. Sveriges 21 län och 20 landsting utgör den regionala nivån medan styret på lokal nivå ansvaras för av 290 kommuner. Utöver dessa nationella nivåer styrs Sverige även på EU-nivå [5]. I alla kommuner nns en folkvald kommunfullmäktige som fattar beslut om kommunens verksamhet. Kommunfullmäktige utser en kommunstyrelse vilken är det högsta styrande organet i kommunen och ansvarar för förvaltning av de beslut som fattas i fullmäktige [4]. Beroende på kommunernas funktion och demograska situation delas de in i tio olika kommungrupper. Varje kommun tillhör endast en grupp, och dessa denieras enligt följande [22]: 1. Storstäder Kommuner med en folkmängd som överstiger invånare. 2. Förortskommuner till storstäder Kommuner där mer än 50 procent av nattbefolkningen pendlar till arbetet i någon annan kommun. Det vanligaste utpendlingsmålet ska vara någon av storstäderna. 3. Större städer Kommuner med invånare samt en tätortsgrad överstigande 70 procent. 4. Förortskommuner till större städer Kommuner där mer än 50 procent av nattbefolkningen pendlar till arbetet i en annan kommun. Det vanligaste utpendlingsmålet ska vara någon av de större städerna i grupp Pendlingskommuner Kommuner där mer än 40 procent av nattbefolkningen pendlar till en annan kommun. 6. Turism- och besöksnäringskommuner Kommuner där antalet gästnätter på hotell, vandrarhem och campingar överstiger 21 per invånare eller där antalet fritidshus överstiger 0,20 per invånare. 7. Varuproducerande kommuner Kommun där 34 procent eller mer av nattbefolkningen mellan 16 och 64 år är sysselsatta inom tillverkning och utvinning, energi och miljö samt byggverksamhet. 8

9 8. Glesbygdskommuner Kommun med en tätortsgrad understigande 70 procent och mindre än åtta invånare per kvadratkilometer. 9. Kommuner i tätbefolkad region Kommun med mer än personer inom en radie på 112,5 kilometer. 10. Kommuner i glesbefolkad region Kommun med mindre än personer inom en radie på 112,5 km. 2.2 Ansvarsområden och ekonomi De frågor som behandlas i kommunfullmäktige rör bland annat skola, kommunal infrastruktur, äldrevård och energi [4]. Kommunenernas intäkter utgörs i huvudsak av kommunalskatter, statsbidrag samt taxor och avgifter, se gur 1. Figur 1: Diagram över den genomsnittliga fördelningen av kommuners intäkter för 2013 [6]. Den genomsnittliga fördelningen av kommunernas kostnader ses i gur 2. De större posterna utgörs av skolverksamhet och äldreomsorg. 9

10 Figur 2: Diagram över den genomsnittliga fördelningen av kommuners kostnader för 2013 [6]. Kommunerna beslutar autonomt om primärkommunalskatten och hur skatteintäkterna ska nansiera den kommunala verksamheten [5]. Kommunalskatten står för omkring 70 % av intäkterna, vilket ses i gur 1. En stor del av statsbidragen utgörs av kommunalekonomisk utjämning och innebär bland annat inkomst- och kostnadsutjämning. Syftet med detta är att "skapa likvärdiga ekonomiska förutsättningar för alla kommuner och landsting i landet för att kunna bedriva den kommunala verksamheten" [11]. 10

11 3 Metod I detta avsnitt behandlas den matematiska bakgrunden till multipel linjär regressionsanalys. Även olika problem som kan uppstå vid analys diskuteras. 3.1 Multipel linjär regression Utgångpunkten i multipel linjär regression är att en beroende variabel, y, kan uttryckas som en funktion av ett antal kovariater (förklaringsvariabler), x j, samt residualen e i. Detta skrivs enligt följande linjära modell [12] y i = Σ k j=0x ij β j + e i, i = 1,..., n (1) där β j är en konstant, n är antalet observationer av den beroende variabeln y och k är antalet förklaringsvariabler. På matrisform ser (1) ut enligt Y = Xβ + e (2) där Y är en matris av storleken n 1, X är n (k+1), β är n 1 och e är n 1. Vid (multipel) linjär regressionsanalys anpassas data till denna modell. Syftet är att skatta den okända koecientvektorn β samt standardavvikelsen hos varje ingående element [13]. Med skattad β kan modellen användas för prediktion eller strukturell tolkning. Vid prediktion uppskattas värdet av den beroende variabeln givet en uppsättning värden av förklaringsvariablerna. Utgångspunkten vid strukturell tolkning är att den beroende variabeln påverkas av förklaringsvariablerna, och inte tvärtom [13]. Syftet med strukturell tolkning är att utröna graden av påverkan från respektive förklaringsvariabel på den beroende variabeln Minsta kvadratmetoden Ett sätt att anpassa data till den linjära modellen är minsta kvadratmetoden. Genom minsta kvadratmetoden bestäms β så att summan av residualerna i kvadrat, ê t ê = ê 2, minimeras. Här betecknar ê skattningen av e. Minsta kvadratanpassningen fås genom att lösa normalekvationerna för β [14] X t ê = 0 (3) Insättning av (2) i (3) ger minsta kvadratuppskattningen av β enligt Den till data anpassade modellen skrivs där ˆβ och ê betecknar skattade värden. β = (X t X) 1 X t Y (4) Y = X ˆβ + ê (5) 11

12 3.1.2 Antaganden Vid användande av minsta kvadratmetoden för anpassning av data till en linjär modell görs ett antal antaganden. Dessa behöver beaktas vid analys och eventuella överträdelser av dessa måste hanteras. Antagandena är följande [7]: 1. den beroende variabeln kan uttryckas enligt den linjära modellen Det antas att den beroende variabeln är linjärt beroende av förklaringsvariablerna plus residualen. Det antas även att elementen i β är konstanter. 2. väntevärdet av residualen är noll Residualen (feltermen) har väntevärdet noll: E(e) = residualerna har samma standardavvikelse och är inte linjärt beroende Detta innebär att E(ee t ) = σ 2 I, där I är identitetsmatrisen av storlek n n. 4. observationerna av förklaringsvariablerna är konstanta vid upprepade mätningar Detta innebär att det är möjligt att vid upprepade insamlingar av data återfå samma värden av de oberoende variablerna. 5. antalet observationer är större än antalet förklaringsvariabler och förklaringsvariablerna är ej linjärt beroende. Detta betyder att rank(x) < n, där n är antalet observationer Heteroskedasticitet Problemet då antagande 3 är ogiltigt kallas heteroskedasticitet. Vid heteroskedasticitet gäller att E(e 2 i ) = σ2 i, där i = 1,..., n. Detta innebär att minsta kvadratskattningen av standardavvikelserna för β inte är väntevärdesriktig, vilket ger felaktiga värden vid användande av t-test, se avsnitt [15]. Heteroskedasticitet kan upptäckas genom att studera residualerna plottade mot predikterade värden. Om residualerna fördelar sig jämnt kring 0 föreligger homoskedasticitet. Heteroskedasticitet upptäcks genom att det nns trender i fördelningen av residualerna. Ett exempel är då residualerna har ett trattliknande mönster, såsom i gur 3. I gur 3 ses att variansen av residualerna ökar med x. Figur 3: Exempel på heteroskedasticitet 12

13 En första åtgärd vid heteroskedasticitet är att revidera modellen. Exempelvis är det vid jämförelse mellan olika stora kommuner lämpligt att skala både beroende och oberoende variabler med folkmängd [16]. En annan lämplig åtgärd är att använda sig av White's consistent variance estimator. Estimatorn lyder Ĉov( ˆβ) = (X t X) 1 (Σ n i=1ê i 2 x t ix i )(X t X) 1 (6) där Ĉov( ˆβ) är kovariansmatrisen för β. Estimatorn bör dessutom skalas med n/(n k 1) [17] Multikollinearitet Felaktighet i det femte antagandet kallas multikollinearitet. Vid exakt multikollinearitet nns ett fullständigt linjärt beroende mellan ett par eller ett antal av förklaringsvariablerna. Detta kan uppstå vid felaktigt användande av dummy-variabler. Ett exempel skulle kunna vara att inkludera både kovariater för majoritets- och minoritetsstyre i den linjära modellen. Eftersom en kommun styrs antingen i majoritet eller i minoritet föreligger ett exakt linjärt beroende mellan dessa förklaringsvariabler. Mer vanligt i praktiska tillämpningar är dock ungefärlig linearitet mellan ett par eller ett antal av de oberoende variablerna. Multikollinearitet kan upptäckas genom att standardavvikelserna för β vid minsta kvadratanpassning är stora. Ett annat sätt är att undersöka kovariansmatrisen för att upptäcka linearitet mellan två av förklaringsvariablerna. En tredje metod är att undersöka konditionstalet för X [8]. Dessutom kan diagonalelementen i inversen av kovariansmatrisen studeras, kallade variance ination factors, VIF i = (1 Ri 2) 1. Ri 2 beräknas enligt (9), där regression utförts på den i:te förklaringsvariabeln mot övriga kovariater. Ett VIF i > 10 kan betyda stora problem med multikollinearitet [9]. Minsta kvadratskattningen är dock fortfarande väntevärdesriktig vid multikollinearitet. Det största problemet orsakat av multikollinearitet är att de stora standardavvikelserna i β försvårar testande av hypoteser. Dessutom går det inte att skilja mellan varians orsakad av multikollinearitet och varians orsakad av spridning i data. Åtgärder mot multikollinearitet behöver dock inte alltid vidtas. Om R 2 från minsta kvadratanpassningen är större än R 2 från regression av en förklaringsvariabel mot övriga oberoende variabler kan problemen med multikollinearitet bortses från. Om t-test för alla element i β > 2 behöver heller inga åtgärder vidtas [8]. Möjliga åtgärder mot multikollinearitet listas nedan [8]: ˆ lägg till mer data. ˆ specicera beroendet mellan förklaringsvariablerna. estimationsproblem. Detta leder till ett simultant 13

14 ˆ ta bort en förklaringsvariabel. Detta bör endast göras då dess koecient uppskattas vara noll Endogenitet Endogenitet innebär att E(e i ) 0 eftersom feltermen e i är korrelerad med en eller era av förklaringsvariablerna. Detta ger icke-konsistenta uppskattningar av β med minsta kvadratmetoden. Kort sammanfattat uppstår endogenitet vid följande situationer: ˆ urvalsfel. Urvalsfel uppstår när uppsättningar av data väljs ut på ett sätt som inte återspeglas i förklaringsvariablerna ˆ samtidighet. Samtidighet innebär att den beroende variabeln påverkar en eller era av förklaringsvariablerna. ˆ avsaknad av relevanta variabler. ˆ mätfel. Ett sätt att hantera förekomst av endogenitet är införande av instrumentella variabler. Detta görs genom att hitta nya oberoende och exogena variabler som är korrelerade med de endogena. De instrumentella variablerna utgörs nu av samtliga exogena variabler. Sedan utförs en "Two Stage Least Squares"-analys (2SLS) [18]. 3.2 Val av modell Essentiellt vid regressionsanalys är att hitta en lämplig modell för sina data. Analys av modellen sker med hjälp av metoder förklarade i detta avsnitt t-test och F-test För att testa hypoteser och konstruera kondensintervall för β används t- och F-test. Vid test av en enskild parameter kan både t- och F-test användas. En teststatistika är ˆβ i β 0 i S.E.( ˆβ i ) (7) där S.E.( ˆβ i ) är standardavvikelsen för ˆβ i. Denna teststatistika är t-fördelad [10]. En teststatistika för F-test är ( ˆβi βi 0 ) 2 S.E.( ˆβ (8) i ) Denna teststatistika är F(1, n k 1)-fördelad, där n är antalet observationer och k är antalet förklaringsvariabler [19]. 14

15 3.2.2 Hypotesprövning Hypotesprövning syftar till att dra slutsatser om giltigheten för beräknade koecientvärden. Ofta är det av intresse att testa nollhypotesen, vilket innebär undersökning av huruvida en koecient är noll. Vid testande av ett enskilt koecientvärde under nollhypotesen vid linjär regression används oftast t-test, med teststatistika enligt (7) [10]. Värdet på teststatistikan, som är t-fördelat, jämförs med t-fördelningen med syftet att bestämma p- värdet för den givna koecienten. P-värdet motsvarar sannolikheten att erhålla ett minst lika extremt värde på teststatistikan under förutsättning att nollhypotesen är sann. Vid lågt p-värde förkastas nollhypotesen. På signikansnivån 5 % förkastas nollhypotesen för p-värden under Detta innebär att koecienten är statistiskt signikant på nivån 5 %. F-test används vid test av simultana hypoteser. En teststatistika är (8), vilken är F-fördelad. Hypotesprövningen går till på samma sätt som för t-test Förklaringsgrad Förklaringsgraden R 2 är ett mått på hur väl data anpassats till modellen och beräknas enligt R 2 = ê 2 ê 2 ê 2 = 1 ê 2 ê 2 (9) där ê 2 är kvadratsumman av residualerna vid regression på enbart en intercept, vilket är skärningen med y-axeln [20]. Vid justerat R 2, R 2, skalas R 2 med antalet frihetsgrader [21]. Enligt (9) varierar R 2 mellan 0 och 1. Ett högt värde på R 2 innebär en hög förklaringsgrad i modellen AIC och BIC Akaike's Information Criterion, AIC, och Bayesian Information Criterion, BIC, är två tester för evaluering av modellen. Vid AIC väljs den modell som minimerar 2k 2ln(L) (10) där L är maximum likelihood-funktionen för den givna modellen, k är antalet kovariater och n är antalet observationer. AIC minimeras vid få kovariater och ett högt värde på L [23]. Notera att AIC kan anta negativa värden. Enligt BIC väljs den modell som minimerar k ln(n) 2ln(L) (11) Även här är L maximum likelihood-funktionen, k är antalet kovariater och n är antalet observationer [24]. Notera att BIC kan anta negativa värden. 15

16 3.2.5 Q-Q plot En Q-Q plot används för att bestämma om två datamängder tillhör samma statistiska fördelning. Detta görs genom att plotta datamängdernas kvantiler mot varandra. En kvantil denieras av hur stor andel av data som har ett värde under värdet för kvantilen. Exempelvis innebär 0.1-kvantilen att 10% av datamängden har ett värde under värdet för kvantilen. Tillhör de två datamängderna samma fördelning ligger kvantilerna längs linjen y=x. Om den ena datamängden väljs att genereras från en normalfördelning fås en normal Q-Q plot. Detta är fördelaktigt att använda för att undersöka om residualerna vid en linjär regression är normalfördelade [25]. Figur 4 visar ett exempel på data som inte är normalfördelad. Figur 4: Q-Q plot där observerade data inte är normalfördelad 3.3 Förklaringsvariabler Följande kovariater har bedömts vara tänkbara förklaringsvariabler för analysen. Variablerna har valts genom en kvalitativ bedömning av faktorer som kan tänkas påverka kommunalskatten, med stöd av bland annat gur 1 och 2. 16

17 Tabell 1: Förklaringsvariabler som använts i analysen Förklaringsvariabel Typ Beskrivning areal per invånare kvantitativ km 2 /inv täthet kvantitativ inv/km 2 folkmängd kvantitativ antal förvärvsinkomst 1 kvantitativ kr/inv arbetslöshet kvantitativ andel av folkmängd medelålder kvantitativ år andel 1-5 år kvantitativ andel av folkmängd andel 6-15 år kvantitativ andel av folkmängd andel år kvantitativ andel av folkmängd andel år kvantitativ andel av folkmängd andel >80 år kvantitativ andel av folkmängd andel med funktionshinder kvantitativ andel av folkmängd andel 1-5 år inskrivna på förskola kvantitativ andel av antal 1-5 år betyg nationellt prov 2 kvantitativ skala 0-20 där F=0, A=20 utrikes födda kvantitativ andel av folkmängd yktingmottagande kvantitativ andel av folkmängd kommunens externa intäkter 3 kvantitativ kr/inv kommunkoncernens 4 externa intäkter 5 kvantitativ kr/inv kommunalekonomisk utjämning kvantitativ kr/inv, se avsnitt 2.2 generella statsbidrag 6 kvantitativ kr/inv tätortsgrad kvantitativ andel av folkmängd i tätort storstad dummy se avsnitt 2.1 förortskommun till storstad dummy se avsnitt 2.1 större stad dummy se avsnitt 2.1 förortskommun till större stad dummy se avsnitt 2.1 pendlingskommun dummy se avsnitt 2.1 turism- och besöksnäringskommun dummy se avsnitt 2.1 varuproducerande kommun dummy se avsnitt 2.1 glesbygdskommun dummy se avsnitt 2.1 kommuner i tätbefolkad region dummy se avsnitt 2.1 kommuner i glesbefolkad region dummy se avsnitt 2.1 socialistiskt styre 7 dummy S, MP, V och/eller FI blocköverskridande styre dummy blocköverskridande koalition 8 majoritetsstyre dummy majoritet i kommunfullmäktige 1 genomsnitt över befolkningen 2 i matematik åk 9 3 avgifter, försäljningsintäkter, specialdestinerade statsbidrag etc [3] 4 kommunkoncernen utgörs av kommunen samt kommunägda företag [3] 5 avgifter, försäljningsintäkter, specialdestinerade statsbidrag etc [3] 6 generella statsbidrag, utjämning och fastighetsavgift 17 7 kommuner med socialistiskt styre benämns även som vänsterstyrda kommuner 8 koalition med M, FP, C och/eller KD

18 3.4 Data Den data som använts i analysen är oentlig och är hämtad från de statliga myndigheterna Statistiska centralbyrån, Skatteverket, Migrationsverket och Skolverket. Data har även hämtats från Sveriges Kommuner och Landsting, som är en arbetsgivar- och intresseorganisation. I analysen har Gotland identierats som en outlier och exkluderats, då Gotlands län saknar landsting, och kommunen därför ansvarar för frågor som i övriga kommuner hanteras av landstingen. Kommunalskatten på Gotland är därför inte jämförbar med skatten i övriga svenska kommuner. 4 Utförande Modeller har tagits fram utifrån två olika infallsvinklar. Dels har modeller utformats efter kvalitativa bedömningar av hur modeller beskrivande primärkommunalskatten rimligtvis kan se ut. Detta har baserats på bland annat analys av kommuners genomsnittliga kostnadsoch intäktsfördelning. Utöver detta ämnesanalytiska tillvägagångssätt har stegvis regression tillämpats genom baklänges elimination med minimering av AIC. Alla beräkningar har genomförts i RStudio som är ett program för statistiska beräkningar. 4.1 Metod 1: Modellval genom ämnesanalys Metoden att välja modell baserat på ämnesanalys förespråkas av Burnham & Anderson [2]. Författarna menar att era modeller grundade i noggrann analys av ämnesområdet bör tas fram för att sedan testas mot data. Data har anpassats till modellerna med minsta kvadratmetoden. Sedan har multikollinearitet testats för med VIF och studier av kovariansmatriser. Signikanta koecienter har undersökts med t-test. Antagandet om normalfördelning av residualerna har analyserats med hjälp av en Q-Q plot och förekomst av heteroskedasticitet har testats genom plottning av residualer mot de predikterade värdena för primärkommunalskatten Modell 1 En första modell bygger på studie av kommuners genomsnittliga fördelning av kostnader på olika utgiftskategorier, se gur 2. Som synes är de största utgiftsposterna förskoleverksamhet och skolbarnomsorg, grundskola, gymnasieskola, äldreomsorg och funktionshindrade. Andelen av folkmängden i kommunen inom respektive kategori antas i Modell 1 bestämma kommunalskatten. Enligt hypotes antas även kommunens politiska styre påverka, i form av styrets politiska färg samt graden av majoritet i kommunfullmäktige. Borgerligt minoritetsstyre sätts som referenspunkt. Modell 1 ser därför ut som följer: 18

19 primärkommunalskatt=β 0 +(andel 1-5 år)β 1 +(andel 6-15 år)β 2 +(andel år)β 3 +(andel år)β 4 +(andel 80 år)β 5 +(andel funktionshindrade)β 6 +(socialistiskt styre)β 7 + (blocköverskridande styre)β 8 +(majoritetsstyre)β 9 +(majoritetsstyre) (socialistiskt styre)β Modell 2 I ett andra försök till en enkel ämnesanalytisk modell modelleras primärskatten som en linjär funktion av kommunernas inkomster genom studie av gur 1. De största intäktsposterna utgörs av skatteintäkter och generella statsbidrag. För att representera kommuners skatteintäkter väljs förklaringsvariabeln förvärvsinkomst (kr/inv). Denna variabel bör vara starkt positivt korrelerad med skatteintäkter. Även i denna modell antas politiskt styre ha en påverkande eekt på primärkommunalskatten. Modell 2 ser då ut enligt följande: primärkommunalskatt=β 0 +(förvärvsinkomst)β 1 +(generella statsbidrag)β 2 + (socialistiskt styre)β 3 +(blocköverskridande styre)β 4 +(majoritetsstyre)β 5 + (majoritetsstyre) (socialistiskt styre)β Modell 3 Modell 3 valdes som en sammanslagning av de slutgiltiga versionerna av Modell 1 och Modell 2, efter modieringar av respektive modell. Det är rimligt att tänka sig att kommunalskattens storlek beror både av kommunens intäkter och utgifter, vilket denna modell försöker fånga Modell 4 En fjärde modell som undersöktes utifrån den ämnesanalytiska utgångspunkten bygger på indelningen av alla kommuner i kommungrupper. Förutom rent geograska aspekter fångar dessa förklaringsvariabler även upp demograska skillnader mellan kommuner. Enligt hypotes antas även en politisk eekt nnas. Modell 4 ser då ut enligt följande primärkommunalskatt=β 0 +(förortskommun till storstad)β 1 +(större stad)β 2 + (förortskommun till större stad)β 3 +(pendlingskommun)β 4 + (turism- och besöksnäringskommun)β 5 +(varuproducerande kommun)β 6 + (glesbygdskommun)β 7 +(kommuner i tätbefolkad region)β 8 + (kommuner i glesbefolkad region)β 9 +(tätortsgrad)β 10 +(täthet)β 11 + (socialistiskt styre)β 12 +(blocköverskridande styre)β 13 +(majoritetsstyre)β 14 + (majoritetsstyre) (socialistiskt styre)β 15 19

20 4.2 Metod 2: Modellval genom stegvis regression med AIC Även om Burnham & Anderson föredrar modellval genom ämnesanalys meder de att direkt analys av data genom exempelvis nollhypotestester för att hitta signikanta förklaringsvariabler kan vara lämpligt då undersökande analyser görs. De framhäver även AIC som ett enkelt och eektivt sätt att hitta en passande modell till data [2] Modell 5 Den andra utgångspunkten har därför valts till stegvis regression med minimerande av AIC. Detta eftersom frågeställningarna har just en undersökande karaktär och det är intressant att jämföra matchning av data till modellerna som fåtts utifrån de två utgångspunkterna. I RStudio har därför en baklänges elimination genomförts, där kovariater plockas bort successivt från den ursprungliga datamängden tills en modell med lägsta möjliga AIC erhållits. Efter genomförd stegvis regression har modellen testats för multikollinearitet med VIF och studie av kovariansmatrisen. Modellen har testats för signikanta koecienter med t-test. Antagandet om normalfördelning av residualerna har analyserats med hjälp av en Q-Q plot och förekomst av heteroskedasticitet har testats genom plottning av residualer mot de predikterade värdena för primärkommunalskatten. Beroende på testernas utfall har modellen reviderats. 5 Resultat 5.1 Metod 1: Modellval genom ämnesanalys Modell 1 Anpassning av data till modellen gav relativt höga VIF-värden (> 5) för kovariaterna "andel 1-5 år", "andel 6-15 år", "andel år" och "andel 80 år". Detta innebär en något för hög grad av multikollinearitet mellan några eller samtliga av dessa. Detta var väntat eftersom det är rimligt ur en demogrask synvinkel att förhållandet mellan några eller alla av ålderskategorierna är någorlunda konstant i varje kommun. Modellen hade R 2 =0.45, vilket är en jämförelsevis låg förklaringsgrad. Vidare var AIC= och BIC = Koecienterna för kovariaterna "andel 1-5 år", "andel funktionshindrade", "majoritetsstyre" och "(socialistiskt styre) (majoritetsstyre)" var inte signikanta på nivån 5 %. Regressionen kördes igen utan kovariaten "andel 1-5 år", vilket gav VIF < 5 för samtliga förklaringsvariabler. Koecienterna för kovariaterna "andel funktionshindrade", "majoritetsstyre" och "(socialistiskt styre) (majoritetsstyre)" var fortfarande icke-signikanta. Dessa kovariater avlägsnades successivt från modellen och följande värden erhölls: 20

21 Tabell 2: Resultat för Modell 1 koecient värde standardavvikelse t-värde p-värde intercept 17, < andel 6-15 år andel år andel år andel 80 år socialistiskt styre blocköverskridande styre Denna modell har R 2 =0.45, AIC= och BIC= Residualerna plottades mot de predikterade värdena på primärkommunalskatten, vilket ses i gur 5. Spridningen av residualerna visar inga tecken på heteroskedasticitet, varför antagandet om homoskedasticitet är giltigt. Antagandet om normalfördelade residualer är någorlunda giltigt, vilket ses i gur 6 genom att kvantilerna från data i stort sett sammanfaller med de teoretiskt förväntade från normalfördelningen. Figur 5: Residualplot för Modell 1 Figur 6: Q-Q plot för Modell Modell 2 Vid regression med Modell 2 erhölls VIF < 4 för samtliga kovariater. Alla förklaringsvariabler förutom "blocköverskridande styre" och "(majoritetsstyre) (socialistiskt styre)" var signikanta på nivån 5 %. Dessa kovariater avlägsnades successivt och följande värden erhölls: 21

22 Tabell 3: Resultat för Modell 2 koecient värde standardavvikelse t-värde p-värde intercept 25,90 0, < förvärvsinkomst 1, < generella statsbidrag 0, , socialistiskt styre 0,5056 0,1046 4, majoritetsstyre 0,3643 0, , Modellen har R 2 =0.53, AIC= och BIC= I gur 7 ses residualerna plottade mot den predikterade primärkommunalskatten. Grafen visar på en jämn spridning av residualerna runt 0, vilket betyder att antagandet om homoskedasticitet är giltigt. Figur 8 visar på approximativ normalfördelning av residualerna. modell2.residuals Sample Quantiles fitted.values Theoretical Quantiles Figur 7: Residualplot för Modell 2 Figur 8: Q-Q plot för Modell Modell 3 Modell 3 skapades som en sammanslagning av de bearbetade versionerna av Modell 1 och 2 enligt: primärkommunalskatt=β 0 +(förvärvsinkomst)β 1 +(generella statsbidrag)β 2 + (andel 6-15 år)β 3 +(andel år)β 4 +(andel år)β 5 +(andel 80 år)β 6 + (socialistiskt styre)β 7 +(blocköverskridande styre)β 8 +(majoritetsstyre)β 9 Efter regression visade sig kovariaterna "6-15 år", "andel år", "andel 80 år" och "blocköverskridande styre vara icke-signikanta och avlägsnades successivt från modellen. Den resulterande modellen hade VIF < 2 för samtliga kovariater, R2 =0.56, AIC= och BIC= Övriga värden för modellen visas nedan. 22

23 Tabell 4: Resultat för Modell 3 koecient värde standardavvikelse t-värde p-värde intercept < förvärvsinkomst < generella statsbidrag andel år socialistiskt styre majoritetsstyre Även antagandena om homoskedasticitet och normalfördelning av residualerna är giltiga för denna modell, se gur 9 och 10. modell3.residuals Sample Quantiles fitted.values Theoretical Quantiles Figur 9: Residualplot för Modell 3 Figur 10: Q-Q plot för Modell Modell 4 Vid regression sågs att den ursprungliga versionen av Modell 4 hade problem med multikollinearitet. Kovariaterna "tätortsgrad" och "förort till storstad" avlägsnades, vilket resulterade i en modell utan multikollinearitet. Koecienterna för "majoritetsstyre" och "(majoritetsstyre) (socialistiskt styre)" var icke-signikanta och avlägsnades en efter en. Förklaringsvariabeln för "förvärvsinkomst" visade sig ge betydligt bättre förklaringsgrad för modellen och lades därför till. Modell 4 ck slutligen följande värden: 23

24 Tabell 5: Resultat för Modell 4 koecient värde standardavvikelse t-värde p-värde intercept < större stad förort till större stad pendlingskommun turism/besöksnäringskom varuproducerande kommun glesbygdkommun kom. i tätbefolkad region kom. i glesbefolkad region täthet socialistiskt styre blocköverskridande styre förvärvsinkomst Modellen har R 2 =0.61, AIC= och BIC= En residualplot ses i gur 11 och en Q-Q plot i gur 12, vilka visar homoskedasticitet och normalfördelning av residualerna. Alla koecienter är signikanta på nivån 5 %. modell4.residuals Sample Quantiles fitted.values Theoretical Quantiles Figur 11: Residualplot för Modell 4 Figur 12: Q-Q plot för Modell Metod 2: Modellval genom stegvis regression med AIC Modell 5 Den stegvisa regressionen resulterade i en modell med hög multikollinearitet mellan ett ertal av kovariaterna. Efter avlägsnande av multikollineära och/eller icke-signikanta förklaringsvariabler och erhölls en modell med följande värden: 24

25 Tabell 6: Resultat för Modell 5 koecient värde standardavvikelse t-värde p-värde intercept < socialistiskt styre blocköverskridande styre förort till större stad täthet förvärvsinkomst utrikes födda kom.koncernens ext. intäkter betyg nationellt prov Modellen har R 2 =0.66, AIC= och BIC= Residualplotten i gur 13 visar att homoskedasticitet kan antas på grund av jämn spridning av residualerna kring 0, och Q-Q plotten i gur 14 visar på normalfördelade residualer. stepwise_model.residuals Sample Quantiles fitted.values Theoretical Quantiles Figur 13: Residualplot för Modell 5 Figur 14: Q-Q plot för Modell 5 25

26 6 Diskussion I samtliga modeller är antagandena om heteroskedasticitet och normalfördelning av residualerna giltiga. Nedan visas en sammanställning av Modell 1-5. Tabell 7: Jämförelse mellan Modell 1-5 # kovariater R2 AIC BIC Modell Modell Modell Modell Modell Analys av Modell 1-5 Modell 1 har lägst R 2 samt högst AIC och BIC vilket tyder på en relativt dålig anpassning till data. Modellen baseras på den genomsnittliga fördelningen av kostnader på olika utgiftsposter hos svenska kommuner: skola, äldreomsorg och stöd till funktionshindrade. Andelen funktionshindrade visade sig vara icke-signikant på nivån 5 %. Det visade sig även nnas multikollinearitet mellan ålderskategorierna, vilket tyder på en någorlunda homogen åldersfördelning i kommunerna. Kovariaten "socialistiskt styre" är signikant och ger ett positivt bidrag till primärkommunalskatten. Även kovariaten "blocköverskridande styre" är signikant och positiv. Eftersom referenspunkten är borgerligt styre är tolkningen att både ett socialistiskt och ett blocköverskridande styre ger högre skatt jämfört ett borgerligt. Modell 2 har både bättre förklaringsgrad samt lägre AIC och BIC än Modell 1. Modell 2 baseras på den genomsnittliga fördelningen av intäkter från olika poster, där de dominerande är skatteintäkter och generella statsbidrag. För att undvika samtidighet valdes kovariaten "förvärvsinkomst" för att representera skatteunderlaget i kommunen. En förmodad linearitet mellan förklaringsvariablerna "förvärvsinkomst" och "generella statsbidrag" fanns ej stöd för, vilket kan bero på att de generella statsbidragen förutom socioekonomisk obalans även grundas på andra strukturella skillnader mellan kommunerna. Även i denna modell är förklaringsvariabeln "socialistiskt styre" signikant på nivån 5 % och ger en positiv påverkan på primärkommunalskatten, vid jämförelse mellan två lika kommuner gällande övriga förklaringsvariabler. Kovariaten "blocköverskridande styre" var icke-signikant i denna modell medan "majoritetsstyre" är signikant på nivån 5 %. Modell 3 utformades som en sammanslagning av Modell 1 och 2. Som väntat är förklaringsgraden högre än för Modell 1 och 2 enskilt. Både AIC och BIC är lägre för Modell 3 jämfört med Modell 1 och 2. Kovariaten "socialistiskt styre" är statistiskt signikant på nivån 5 % 26

27 och bidrar positivt till primärkommunalskatten. Även "majoritetsstyre" är signikant och positiv. Tolkningen är att en kommun med majoritetsstyre har högre skatt jämfört med en kommun med minoritetsstyre. Eftersom koecienten för "(majoritetsstyre) (socialistiskt styre)" inte var signikant kan inga slutsatser dras om majoritetsstyre i kombination med socialistiskt styre. Strategin bakom Modell 4 var att utnyttja kommunernas indelning i grupper för att täcka demograska skillnader, vilka tros ha en stor påverkan på kommunalskatten. Detta rör bland annat inkomst- och åldersfördelning. Förklaringsgraden för modellen är förhållandevis hög, ca 61 %. AIC och BIC är lägre för Modell 4 än för Modell 1, 2 och 3. Även i denna modell är kovariaten "socialistiskt styre" statistiskt signikant på nivån 5 %. Koecienten för förklaringsvariabeln "blocköverskridande styre" är positiv, samtidigt som den är lägre än för kovariaten "socialistiskt styre". Eftersom referenspunkten är "borgerligt styre", innebär detta att både socialistiskt och blocköverskridande styre ger högre skatt i förhållande till om en kommun är borgerligt styrd. Samtidigt innebär det också att en kommun med socialistiskt styre har högre skatt än en kommun med blocköverskridande styre. Allt detta är i samstämmighet med hypotesen, dvs. att borgerligt styrda kommuner har lägre skatt än vänsterstyrda. Modell 5 är resultatet av den stegvisa regressionen. Då den stegvisa regressionen hittar delmängden av de tänkbara förklaringsvariablerna med lägst AIC, är det inte förvånande att Modell 5 har både lägst AIC och BIC samt högst R 2. Modell 5 ger samma resultat som Modell 1 och 4 gällande socialistiskt och blocköverskridande styre. Nackdelen med Modell 5 modell är att den är svårtolkad ur ett ämnesanalytiskt perspektiv. 6.2 Gemensamma resultat för Modell 1-5 Ett genomgående resultat från samtliga modeller är signikansen för kovariaten "socialistiskt styre". Resultaten visar att socialistiskt styre ger en ökning av ca 0.6 procentenheter på primärkommunalskatten. I Modell 1, 4 och 5 är förklaringsvariabeln "blocköverskridande styre" signikant på nivån 5 %. Eftersom koecienten är > 0 innebär detta att en kommun med blocköverskridande styre har högre kommunalskatt än en jämförbar kommun med borgerligt styre. Resultaten visar på en ökning av omkring 0.3 procentenheter för ett blocköverskridande styre jämfört med ett borgerligt. Modell 2 och 3 har signikans för "majoritetsstyre". Koecienterna indikerar att vid jämförelse mellan två likvärda kommuner har den med majoritetsstyre högre primärkommunalskatt. Skillnaden är ungefär 0.3 procentenheter. Däremot har ingen av modellerna visat signikans för interaktionskovariaten "(majoritetsstyre) (socialistiskt styre)". Därför 27

28 kan inga slutsatser dras om primärkommunalskatten vid vänsterstyre i majoritet. Värt att notera är koecienten för "förvärvsinkomst" i Modell 2-5, vars genomsnittliga värde är ca Den genomsnittliga förvärvsinkomsten varierar stort mellan kommunerna och ligger i intervallet kr. Detta innebär att en ökning i förvärvsinkomst på kr ger ca 1.4 procentenheter lägre primärkommunalskatt då övriga kovariater hålls konstanta. Kovariaten "förvärvsinkomst" har därmed en relativt stor påverkan på primärkommunalskatten. 6.3 Förklaring av data I samtliga modeller är förklaringsgraden R 2 relativt låg. Detta är dock främst problematiskt vid prediktion. Eftersom denna analys är strukturell och samtliga koecienter i modellerna signikanta, ger modellerna trots en något låg förklaringsgrad värdefulla resultat om data. Vidare förväntas heller inte förklaringsgraden bli lika hög i denna typ av samhällsanalytiska undersökning jämfört med exempelvis analys av fysikaliska data, eftersom beslutsfattandet om kommunalskatten troligen är mer slumpartat och inte följer deterministiska lagar. En vanlig anledning till en låg förklaringsgrad är oavsiktligt utelämnande av relevanta variabler. Detta skulle kunna vara en rimlig tolkning, även om det i detta fall är mer troligt att ämnets slumpmässiga natur ger det observerade beteendet. Höga förklaringsgrader av data betyder heller inte per automatik att modellen förklarar data på ett tillfredsställande sätt. 7 Slutsatser Med det primära syftet att utföra en strukturell analys av faktorer som påverkar primärkommunalskatten är Modell 4 en lämplig utgångspunkt. Indelningen av kommuner i kommunalgrupper fångar många demograska aspekter i kommunerna och modellen är lättolkad. Gällande politiska eekter på primärkommunalskatten har analysen resulterat i följande: ˆ Vänsterstyrda kommuner har i genomsnitt högre skatt än borgerliga (ca 0.6 procentenheter) ˆ Kommuner med blocköverskridande styre har i genomsnitt högre skatt än borgerliga (ca 0.3 procentenheter) och lägre skatt än vänsterstyrda ˆ Majoritetsstyren har högre skatt än minoritetsstyren (ca 0.3 procentenheter) 28

29 References [1] Maria Ahrengart. Vart tar våra skattepengar vägen? Institutet för Privatekonomi, Swedbank url: [2] Anderson D. R. Burnham K. P. Model Selection and Multimodel Interference. Springer, 2002, p. 2. [3] Denitionstexter till tabellpaketet Vad kostar verksamheten i Din kommun. Statistiska centralbyrån url: Definitioner_VKV2013.pdf. [4] Den lokala nivån - kommuner. Regeringskansliets kommunikationsenhet url: [5] Det oentliga Sverige. Regeringskansliets kommunikationsenhet url: http : // [6] Diagram för kommunerna - kommunernas kostnader och intäkter. Sveriges kommuner och landsting url: sektornisiffror/diagramforkommunerna.1882.html. [7] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp [8] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp [9] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, p [10] Peter Kennedy. A Guide to Econometrics. 6th ed. Wiley-Blackwell, 2011, pp [11] Kommunalekonomisk utjämning och utjämning av LSS-kostnader. url: scb. se / sv _ /Hitta - statistik / Statistik - efter - amne / Offentlig - ekonomi / Finanser - for - den - kommunala - sektorn / Kommunalekonomisk - utjamning - och - utjamning-av-lss-kostnader/#c_undefined. [12] Harald Lang. Elements of Regression Analysis. 2014, p. 3. [13] Harald Lang. Elements of Regression Analysis. 2014, p. 4. [14] Harald Lang. Elements of Regression Analysis. 2014, p. 5. [15] Harald Lang. Elements of Regression Analysis. 2014, p. 16. [16] Harald Lang. Elements of Regression Analysis. 2014, p. 21. [17] Harald Lang. Elements of Regression Analysis. 2014, p. 17. [18] Harald Lang. Elements of Regression Analysis. 2014, pp [19] Harald Lang. Elements of Regression Analysis. 2014, p. 54. [20] Harald Lang. Elements of Regression Analysis. 2014, p

30 [21] Harald Lang. Elements of Regression Analysis. 2014, p. 8. [22] Linda Tidekrans Möller. Kommungruppsindelning. Sveriges Kommuner och Landsting url: kommungruppsindelning.2051.html. [23] Model Selection and Multimodel Interference. Springer, [24] Model Selection and Multimodel Interference. Springer, [25] Quantile-Quantile Plot. NIST Sematech. url: handbook/eda/section3/qqplot.htm. [26] Student med sommarjobb. Swedbank. url: analyser/institutet-for-privatekonomi/aktuellt-studentens-inkomstgranser/ index.htm. 30

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

STATISTISKA CENTRALBYRÅN 1 (6) Enheten för social välfärdsstatistik Uppdaterad Redovisningsgrupper

STATISTISKA CENTRALBYRÅN 1 (6) Enheten för social välfärdsstatistik Uppdaterad Redovisningsgrupper STATISTISKA CENTRALBYRÅN 1 (6) Redovisningsgrupper Följande är en beskrivning av de redovisningsgrupper som används i SCB:s Undersökningarna av levnadsförhållanden (ULF/SILC). Ålder Tabellerna omfattar

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

LKT325/LMA521: Faktorförsök

LKT325/LMA521: Faktorförsök Föreläsning 2 Innehåll Referensfördelning Referensintervall Skatta variansen 1 Flera mätningar i varje grupp. 2 Antag att vissa eekter inte existerar 3 Normalfördelningspapper Referensfördelning Hittills

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från Svenskt Näringsliv som publicerades i

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Vad påverkar en kommuns totala kostnad?

Vad påverkar en kommuns totala kostnad? Vad påverkar en kommuns totala kostnad? En multipel regressionsanalys av faktorer som korrelerar med kommuners kostnader MARKUS BERG OCH MALTE KROON Stockholm 15 Kandidatexamensarbete i Teknisk Fysik Institutionen

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik

Läs mer

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009 Företagsklimatet viktigt för ungas val av kommun Johan Kreicbergs April 2009 Inledning 1 Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från som publicerades i slutet av 2007

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Urval av lämpliga kommuner. Hans Petterson Tillsynskonferens 19 20 mars 2014

Urval av lämpliga kommuner. Hans Petterson Tillsynskonferens 19 20 mars 2014 Urval av lämpliga kommuner Hans Petterson Tillsynskonferens 19 20 mars 2014 Kontrollera med berörda kommuner Har kommunen/-ernaredan valt kommuner att jämföra sig med bör dessa beaktas i första hand. Men

Läs mer

Innehåll. KOSTNADSJÄMFÖRELSER... 2 Varför jämföra... 2

Innehåll. KOSTNADSJÄMFÖRELSER... 2 Varför jämföra... 2 Innehåll KOSTNADSJÄMFÖRELSER... 2 Varför jämföra... 2 Vem ska man jämföra sig med?... 2 Egna resultat över tid... 2 Jämförelse med kommungrupp... 2 Jämförelse med standardkostnader... 4 Likhetsutsökta

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader Fatemeh Engqvist Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2017:23

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse

Läs mer

Regressionsanalys av NHL-statistik

Regressionsanalys av NHL-statistik Regressionsanalys av NHL-statistik Av Gustav Hedén gheden@kth.se Examensarbete inom teknisk fysik, grundnivå SA104x KTH Matematisk statistik Handledare Fredrik Armerin 1 Innehållsförteckning Sammanfattning:...

Läs mer

Laboration 4 R-versionen

Laboration 4 R-versionen Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Härledning av Black-Littermans formel mha allmänna linjära modellen

Härledning av Black-Littermans formel mha allmänna linjära modellen Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

4 Diskret stokastisk variabel

4 Diskret stokastisk variabel 4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Fråga nr a b c d 2 D

Fråga nr a b c d 2 D Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson (examinator) VT2017 TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2017-04-20 LÖSNINGSFÖRSLAG Första version, med reservation för tryck-

Läs mer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN): Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 2018-09-19 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Läs mer

oberoende av varandra så observationerna är

oberoende av varandra så observationerna är Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data

Läs mer