Vad påverkar en kommuns totala kostnad?

Storlek: px
Starta visningen från sidan:

Download "Vad påverkar en kommuns totala kostnad?"

Transkript

1 Vad påverkar en kommuns totala kostnad? En multipel regressionsanalys av faktorer som korrelerar med kommuners kostnader MARKUS BERG OCH MALTE KROON Stockholm 15 Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik, KTH Handledare: Boualem Djehiche

2 Sammanfattning Denna uppsats undersöker hur olika faktorer påverkar den totala verksamhetskostnaden per capita i Sveriges kommuner. Detta görs genom en multipel linjär regressionsanalys. Datan som används är från 13 och de oberoende variablerna är valda så att modellen dels får god prediktiv förmåga och dels kan tolkas strukturellt. Den slutgiltiga modellen har god prediktiv förmåga (R =.9) och några av de faktorer som korrelerar med kostnaderna är politiskt styre, kommunal skattesats, kommunala tillgångar, medelålder och folktäthet. 1

3 Abstract This paper examines how different factors affect the overall operation costs per capita in Swedish municipalities. This is done by a multiple linear regression analysis. The data used are from 13, and the independent variables are chosen such that the model has both good predictive ability and can be interpreted structurally. The final model has good predictive ability (R =.9) and some of the factors that correlate with the costs are political governance, municipal tax, municipal assets, average age and population density.

4 Innehåll 1 Inledning 1.1 Bakgrund Syfte Teori 5.1 Multipel regression Ordinary Least Squares F-test R η Cohen s rule of thumb Fel i modellen Endogenitet Heteroskedasticitet Multikollinearitet Akaike information criterion Metod 3.1 Regressionsförfarande Kovariat i den ursprungliga modellen Kovariat i den reducerade modellen Resultat 13 5 Diskussion Data Resultat Svårigheter Förbättringar Slutsats 1 A Appendix 19 3

5 1 Inledning 1.1 Bakgrund Ett demokratiskt samhälle bygger på att folkvalda politiker får förtroendet att bestämma hur samhället ska styras och hur skattepengarna förvaltas. Det ligger i medborgarnas intresse att de folkvalda arbetar i linje med vad som har utlovats och att pengarna används på bästa sätt. Således är det viktigt att kunna granska den offentliga sektorns arbete. Det kan emellertid vara svårt för den enskilda medborgaren att bilda sig en uppfattning om hur mycket olika verksamheter kostar i snitt och huruvida skattepengarna används effektivt, varför det är viktigt med verktyg som hjälper till och förenklar granskningen. Den offentliga sektorn granskas ständigt av till exempel medier, där det ibland hävdas att skattepengar slösas bort.[1] Det saknas dock systematiska metoder för att på ett objektivt sätt jämföra vilka kostnader en kommun bör ha i snitt, givet vissa inneboende egenskaper. 1. Syfte Modellen som tas fram i denna uppsats ger möjlighet att se vilka faktorer, exempelvis politiskt styre, kommunal skattesats,kommunala tillgångar, medelålder och folktäthet, som påverkar en kommuns totala kostnad per capita. Modellen kan sedan användas för att jämföra kommuners totalkostnad per capita i förhållande till skattningen. Resultaten kan dels användas av kommuner för att effektivisera verksamheten och dels av privatpersoner och media för att granska kommuners arbete.

6 Teori.1 Multipel regression En multipel linjär regression är en metod för att modellera ett linjärt beroende mellan en beroende variabel Y och oberoende kovariat X enligt: Y = Xβ + ɛ (1) y 1 x T 1 1 x 11 x 1p β ε 1 y där Y =., X = x T. = 1 x 1 x p......, β = β 1. och ε = ε. y n 1 x n1 x np β p ε n x T n Detta skrivs med tensornotation som: y i = β + β 1 x i β p x ip + ɛ i = x T i β + ɛ i () β i är en okänd parameter som förklarar hur starkt y i beror på x i enligt: β i = y i x i (3) ɛ är residualerna, vilka är oberoende stokastiska variabler med egenskaperna: E[ɛ i ] = och E[ɛ i ] = σ () Dessa egenskaper beskrivs under rubrikerna Ordinary Least Squares samt Heteroskedasticitet. Effekter som endast kan vara aktiva eller ej kan beskrivas med dummy-variabler {x i } som definieras enligt: { 1, om effekten är aktiv. x i = (5), annars.. Ordinary Least Squares Ordinary Least Squares (OLS) är en metod som skattar β i genom att minimera kvadratsumman av residualerna. Kvadratsumman skrivs som: n n ê i = (y i ŷ i ) = (Y Xβ) T (Y X β) = () i=1 i=1 = Y T Y Y T X β + β T X T X β Skattningen β som minimerar residualerna söks, varför uttrycket deriveras och sätts till noll: 5

7 n i=1 ê i β = X T Y + X T X β = X T Y = X T X β β = (X T X) 1 X T Y (7) Antaganden för att OLS-estimatorn ska vara konsistent är: Exogena variabler Ingen perfekt kollinearitet OLS är även den optimala linjärna estimatorn, Best Linear Unbiased EStimator (BLUES), om felen är: Homoskedastiska Saknar autokorrelation Detta tillsammans med att väntevärdet av residualerna är noll kallas Gauss- Markov-antaganden. Kovariansmatrisen för ˆβ beräknas enligt: Cov( ˆβ) = E[( ˆβ β)( ˆβ β) T ] = () En estimator för σ är: = (X T X) 1 X T (σ I)X(X T X) 1 = (X T X) 1 σ s = Således kan kovariansmatrisen estimeras som: 1 n k 1 ê (9) Cov( ˆβ) = (X T X) 1 s () För att detta skall gälla måste modellen vara homoskedastisk. Annars kan kovariansmatrisen skattas medelst White s konsistenta variansmatris, se Heteroskedasticitet nedan..3 F-test F-test används för att avgöra huruvida en eller flera skattade parametrar är lika med noll och således kan uteslutas ur modellen. Testet bygger på att två regressioner genomförs: en för den fulla modellen med samtliga variabler och en för den reducerade modellen där ett antal testvariabler utelämnas. F-variabeln är ett mått på hur mycket residualerna skiljer sig åt mellan dessa modeller

8 och testar huruvida de utelämnade variablerna bidrar till att förklara datan. F-värdet beräknas enligt nedan: F = n k 1 ( ê ) r ê 1 (11) ê är residualerna från den fulla regressionen med k variabler, ê är residualerna för den reducerade regressionen där r variabler har avlägsnats och n är det totala antalet observationer. F-värdet kommer att ha en F-fördelning, F F (r, n k 1), vilket ger sannolikheten för ett visst F-värde. Om F-värdet är stort är sannolikheten för nollhypotesen att de utelämnade variablerna inte påverkar den beroende variabeln liten, varför den kan förkastas.. R R är en skalär som beskriver hur väl data och modell stämmer överens, där R = 1 betyder att regressionen passar datan perfekt. R beräknas som andelen av den totala variationen i datan som förklaras av modellen enligt: R = 1 n i=1 (y i ŷ i ) n i=1 (y i ȳ) (1) ŷ i är det av modellen skattade värdet, ȳ är medelvärdet och y i är en observation av y..5 η R beskriver hur väl alla kovariat tillsammans beskriver datan. På liknande sätt kan man vilja undersöka hur mycket en enskild variabel bidrar till att förklara datan. Detta kallas effektstorleken för en variabel. Ett mått på effektstorlek är η vilket bestäms genom att två regressioner genomförs, en med samtliga kovariat i modellen och en där en variabel har avlägsnats. Sedan beräknas η som följer: η = ê ê ê = R R 1 R (13) Nedsänkt * betyder att värdet har beräknats för en reducerad modell..5.1 Cohen s rule of thumb Det är vanligt att inkludera η -värden i en regressionsutskrift. För att tolka dessa så kan Cohen s rule of thumb [] användas, vilken kategoriserar effektstorlekarna enligt: Tabell 1: Cohen s rule of thumb. Effektstorlek Liten Mellan Stor η

9 . Fel i modellen Om antagandena för OLS inte är uppfyllda riskerar estimaten och dess standardavvikelser att bli inkonsistenta...1 Endogenitet Då feltermen korrelerar med en eller flera av kovariaten föreligger endogenitet, varpå väntevärdet av feltermerna blir nollskillt och skattningen inkonsistent. Endogenitet kan uppstå då den beroende variabeln influerar de oberoende variablerna eller om relevanta variabler saknas i modellen. Det kan även uppstå vid urvalsbias eller på grund av mätfel. En lösning på detta är att lägga till relevanta variabler i modellen eller försöka hitta instrumentvariabler (IV), vilket är ett slags ersättningsvariabler som förklarar samma fenomen men som ej korrelerar med feltermen... Heteroskedasticitet Heteroskedasticitet innebär att inte alla residualer har samma standardavvikelse; motsatsen är homoskedasticitet. Om modellen felaktigt antas vara homoskedastisk kan punktskattningar göras men variansskattningarna blir felaktiga. För att avhjälpa heteroskedasticitet kan modellen försöka omformuleras eller så används White s konsistenta variansmatris, vilken skrivs: Cov( ˆβ) = (X T X) 1 X T D(ê )X(X T X) 1 = (1) ( n ) = (X T X) 1 ê i x T i x i (X T X) 1 i=1 D(ê ) är en diagonal n n-matris vars i:te diagonalelement är ê i. En metod för att upptäcka heteroskedasticitet är Breusch-Pagan-testet, vilket kollar om den skattade variansen av residualerna i kvadrat går att uttrycka som en linjärkombination av kovariaten enligt: p ê = γ 1 + γ i X i + η i (15) i= Sedan görs ett F-test för denna modell. Om p-värdet understiger en bestämd gräns så förkastas nollhypotesen, γ =... = γ p =, varför modellen är heteroskedastisk. Om White s variansmatris används är F-testet ej tillämpbart när flera β skattas. Istället används ett Wald-test. De β som antas vara noll under nollhypotesen samlas i en vektor β så att modellen blir: Waldfaktorn beräknas sedan som: Y = X 1 β 1 + X β + e (1) W = β T 1 ˆV β (17) ˆV är den skattade kovariansmatrisen för ˆβ och r är antalet element i β. r 1 W är fördelad som r 1 W F (r, n k 1) varvid det beräknade värdet på W kan användas för att testa nollhypotesen. [3]

10 ..3 Multikollinearitet Multikollinearitet är när kovariat korrelerar med varandra. Vid perfekt multikollinearitet kan en variabel bestämmas exakt som en linjärkombination av andra variabler, varpå matrisen X inte får full rang och kan därmed inte inverteras, vilket krävs för genomförandet av OLS. Parvisa korrelationer kan studeras i en korrelationsmatris för att undersöka om det finns multikollinearitet i modellen. Om ett par har hög korrelation så tas den ena bort ur modellen. Studeras kovariat för parvis korrelation upptäcks inte korrelation med flera variabler samtidigt. Detta kan upptäckas med VIF-testet, vilket ger ett värde på hur starkt olika kovariat i en modell korrelerar med övriga kovariat. Testet utförs på följande vis: Först körs en regression för varje oberoende variabel, X j = c + i j α i X i + e (1) c är en konstant och e är feltermen. Sedan beräknas VIF-faktorn för varje kovariat som VIF = 1. Som tumregel avlägsnas en kovariat om den har ett 1 Ri värde på VIF >. [].7 Akaike information criterion För att avgöra vilka kovariat som skall ingå i den slutgiltiga modellen används Akaike Information Criterion (AIC), vilket är ett mått för att jämföra modellers relativa styrka. AIC bygger på informationsteori och hanterar utbytet mellan hur väl modellen beskriver observerad data (goodness of fit) och risken att modellen beskriver slumpmässiga fel (overfitting). AIC-värdet beräknas som: AIC = n ln( ê ) + k (19) där n är antalet observationer, e är residualerna och k är antalet kovariat. AIC beräknas för möjliga modeller och sedan väljs den modell som minimerar värdet. Som alternativ till AIC kan Bayesian Information Criterion (BIC) användas, men inom litteraturen tycks det inte råda konsensus om vilken som bör användas. 9

11 3 Metod Kommundata som misstänks korrelera med kommunens kostnader hämtas från i huvudsak Statistiska centralbyrån (SCB) och Sveriges Kommuner och Landsting (SKL). 3.1 Regressionsförfarande Datan importeras till Matlab och en fullständig modell med alla kovariat skapas. Sedan betraktas beskrivande statistik i form av kostnad plottad mot respektive kovariat. De variabler som inte ser linjära ut logaritmeras, varefter variabler som ter sig tydligt olinjära avlägsnas från modellen. Beskrivande statistik för de kovariat som är med i den slutgiltiga modellen visas i Appendix. Sedan testas kovariaten för multikorrelation medelst ett VIF-test. De kovariat som har ett för högt VIF-värde kommer att tas bort en i taget - i fallande ordning - tills inget värde ligger över gränsen på. Sedan testas modellen för heteroskedasticitet med ett Breusch-Pagan-test. Om kraftig heteroskedasticitet föreligger omformuleras modellen genom att ta bort eller transformera heteroskedastiska kovariat. Måttlig heteroskedasticitet kommer att försummas ty det inte innebär några problem då White s robusta estimator används. Modellen reduceras sedan för att minska dess komplexitet och därmed risk för överanpassning. Huruvida en variabel skall ingå i modellen avgörs med AIC. Först beräknas den fullständiga modellens AIC-värde. Sedan utelämnas det minst signifikanta kovariatet och AIC beräknas igen. Om den reducerade modellen har lägre AIC utelämnas kovariatet. Denna procedur upprepas till den slutgiltiga modellen får ett minimerat AIC-värde. Sedan testas modellen med Breusch-Pagan igen för att se huruvida heteroskedasticitet föreligger. Modellen testas även för endogenitet genom att plotta residualerna mot respektive kovariat för att se om linjära samband föreligger. Dessa plottar finns i Appendix för kovariat i den slutgiltiga modellen. En gräns för signifikans sätts till α = 5%.

12 3. Kovariat i den ursprungliga modellen Den ursprungliga modellen innehåller följande kovariat: Tabell : Kovariat i fulla modellen. Arbetslöshet Area Folkmängd Andel med studentexamen Medelålder Andel med eftergymnasial utbildning Skatteintäkter per capita Alliansstyre Blandat styre Andel med utländsk bakgrund Andel gifta Andel skilda Folktäthet Medellängd äktenskap Hushållsstorlek Andel singelhushåll Antal grundskoleelever per capita Andel kommunanställda Gymnasiedensitet Andel som bor på äldreboende Andel som får hemhjälp Elever per lärare Andel med hjälp för funktionsnedsättning Huspris Kommunal skattesats Inkomst kommunalanställda Tätortsgrad Andel vägarea Kommunala tillgångar 3.3 Kovariat i den reducerade modellen Modellens beroende variabel är: Verksamhetens kostnader Verksamhetens kostnader är kommunens löpande externa kostnader mätt i svenska kronor (SEK) i form av löner, arbetsgivaravgifter, hyror, bidrag, förändrad pensionsavsättning, utbetalda pensioner, inköp av varor och tjänster etc. per invånare år 13.[5] Efter att multikorrelerande variabler tagits bort och modellen reducerats enligt AIC så återstår följande kovariat: Medelålder Medelålder beräknas för kommunens alla invånare den 31 december 13. [] Politiskt styre Datan för det politiska styret avser mandatperioden mellan åren -1 i kommunfullmäktige. Det politiska styret delas in i tre kategorier: alliansstyre, vänsterstyre samt blandat styre. Med Alliansstyre avses ett styre som består av Moderaterna, Centerpartiet, Folkpartiet och Kristdemokraterna samt eventuellt Miljöpartiet och andra lokala småpartier. Med vänsterstyre avses ett styre som består av Socialdemokraterna och/eller Vänsterpartiet samt eventuellt Miljöpartiet och andra lokala småpartier. Med Blandat styre avses ett styre som består av en koalition med minst ett av allianspartierna samt Socialdemokraterna och/eller Vänsterpartiet samt eventuellt Miljöpartiet och andra lokala småpartier. 11

13 I modellen kommer Alliansstyre och Blandat styre att utgöras av två dummyvariabler och vänsterstyre kommer att vara benchmark. Detta innebär att estimaten för dummyvariablerna kommer att utgöra skillnaden i förhållande till vänsterstyre.[7] Andel gifta Variabeln Andel gifta anger andelen av invånarna som den 31 december 13 var gifta eller registrerade partners.[] Folktäthet Folktätheten beräknas som antalet invånare i kommunen dividerat med kommunens landareal. Folkmängden avser antalet invånare den 31 december 13 och landarealen är mätt i kvadratkilometer år 13.[9][] Andel kommunanställda Andel kommunanställda anger den andel av kommunens invånare som år 13 var anställda och månadsavlönade av kommunen.[11] Gymnasiedensitet Gymnasiedensitet beräknas som kvoten mellan antalet elever som är folkbokförda i kommunen och går i gymnasiet dividerat med kommunens totala antal invånare.[1] Elever per lärare Elever per lärare anger antalet elever per heltidsanställd lärare i grundskolan år 13.[1] Huspris Huspris anger medelpriset på småhus för permanentboende år 13. Detta antas spegla den generella prisnivån på kommunens fastighetsmarknad.[13] Kommunal skattesats Kommunal skattesats avser skattesatsen i kommunen år 13.[1] Kommunala tillgångar Kommunala tillgångar avser kommunens totala tillgångar enligt balansräkningen per invånare, mätt i kronor år 13.[15] 1

14 Resultat Beskrivande statistik för de kovariat som ingår i den slutgiltiga modellen finns bifogat i Appendix A. De variabler som logaritmerades var Folktäthet, Huspris, Kommunal skattesats samt Kommunala tillgångar. De som föreföll icke-linjära efter logaritmering var Tätortsgrad och Andel hjälp. Följande variabler hade VIF-värden över och togs bort: Andel med eftergymnasial utbildning, Hushållsstorlek och Andel singelhushåll. Medelålder hade initialt ett värde över, vilket dock hamnade under gränsen när de andra togs bort. Sedan testades den VIF-reducerade modellen för heteroskedasticitet medelst Breusch-Pagan. Detta resulterade i ett p-värde på.515, varför nollhypotesen att modellen är homoskedastisk inte kunde förkastas. De kovariat som uteslöts enligt AIC var: Tabell 3: Uteslutna kovariat enligt AIC. Arbetslöshet Area Andel med studentexamen Andel med eftergymnasial utbildning Skatteintäkter per capita Andel med utländsk bakgrund Andel skilda Medellängd äktenskap Hushållsstorlek Andel singelhushåll Anta grundskoleelever per capita Inkomst kommunalanställda Andel som bor på äldreboende Andel som får hemhjälp Andel vägarea Folkmängd Den AIC-reducerade modellen gav följande regressionsresultat: Tabell : Regressionsresultat för den reducerade modellen. Estimate Std.Error Eta.sq p.value Intercept Medelålder Alliansstyre Blandat styre Andel gifta log(folktathet) Andel kommunanställda Gymnasiedensitet Elever per lärare log(huspris) log(kommunal skattesats) log(kommunala tillgångar) Modellen har Breusch-Pagan-värdet p =.19. Detta p-värde är betydligt lägre än för den fulla modellen. Enligt den deskriptiva statistiken syns ingen tydlig heteroskedasticitet. White s konsistenta variansmatris används för alla beräkningar, varför heteroskedasticitet inte innebär några större problem. Waldvärdet dividerat med antalet kovariat är W r =, vilket svarar mot ett p-värde väldigt nära 1. Modellen har ett R =.9. 13

15 5 Diskussion 5.1 Data Icke-slumpmässighet, antal observationer, saknade observationer och urvalsbias kommer inte att innebära några problem då vi tittar på hela populationen av kommuner. Datainsamlingen gick obehindrat då SCB sammanställer mycket kommunal data. Därför testades många variabler i den fulla modellen. Även variabler som inte har ett uppenbart samband med kommunens kostnader togs med, exempelvis Alliansstyre, Blandat styre, Andel gifta och Medelålder. Att antalet anställda påverkar kommunens kostnader är apparent, men variabeln är med dels för att öka modellens prediktionsförmåga och dels för att ta hänsyn till antalet anställda då effekten av andra kovariat bestäms. 5. Resultat I stort har estimaten bra p-värden, men blandade η -värden. Således är det osannolikt att estimaten uppkommit på grund av slumpmässighet. Överlag är effektstorleken liten till mellanstor enligt Cohen s tumregel. Ett intressant resultat är att det politiska styret i en kommun korrelerar med dess kostnader, men detta är inte signifikant för Alliansstyre varvidlag resultatet är osäkert. Sambandet är förmodligen inte kausalt ty det politiska styret i sig inte ger upphov till kostnader, utan snarare hur politiker beslutar att sköta verksamheten. Hade alla kausala variabler varit med i modellen hade alltså inte politiskt styre haft någon inverkan. Detta kallas att politiskt styre inte har någon inverkan ceteris paribus. Resultatet är likväl intressant, då det säger något om korrelationen mellan politiskt styre och kommunkostnader. En intressant observation är att Blandat styre har lägre kostnader än Alliansstyre. Ser man till den politiska ideologin bör alliansstyrda kommuner ha lägst kostnader, då de strävar efter en mindre offentlig sektor än ett vänsterstyre. Orsakerna till detta kan bara spekuleras om, vilket överlåts till andra. Denna uppsats kan dock ge bra underlag för en sådan undersökning. Regressionsutskriften ger vidare att Medelålder korrelerar med kostnaderna. Detta är förmodligen inte ett kausalt samband, varför effekten ändras om man tillför förklarande variabler. Att ha med alla förklarande variabler är inte möjligt då data inte är tillgängligt och dessutom gör modellen för komplex. Således kan Medelålder ses som en samlingsvariabel". Vid val av kovariat görs en avvägning mellan att ha en enkel modell och att minska multikorrelationen. Även Andel gifta har sannolikt ett icke-kausalt samband. Enligt våra resultat hänger större andel gifta samman med lägre expenser för kommunen. En anledning kan vara att vissa kostnader för kommunen beror av antalet hushåll snarare än antalet invånare. I den ursprungliga modellen fanns snittstorleken för hushåll med, men denna variabel led av stark multikorrelation, eventuellt med andel gifta. 1

16 Elever per lärare och Andel kommunanställda bör ha kausala samband med kostnader. Detta då utbetalda löner dyker upp explicit i resultaträkningen som en kostnadspost. Ett märkligt resultat är att fler elever per lärare hänger samman med högre kostnader. Intuitivt bör det omvända gälla, vilket talar för ett icke-kausalt samband. Många Elever per lärare ger lägre Andel kommunanställda, något som kan tyckas vara ett korrelationsproblem. VIF gav dock inga sådana indikationer, vilket kan bero på att lärarna bara utgör en liten del av alla anställda. Estimaten är positiva och signifikanta. Om log(folktäthet) ökar så minskar Verksamhetens kostnader, troligtvis på grund av att fler personer delar på den offentliga verksamheten, såsom gatustädning och parkskötsel. Detta resultat är dock inte signifikant. Hög Gymnasiedensitet bidrar till högre kostnader. Detta är rimligt ty elevmängden renderar utgifter i form av lokalkostnader och dylikt. Likaså leder högt log(huspris) till höga kostnader. Under antagandet att huspriserna speglar det generella kvadratmeterpriset för lokaler är detta rimligt, då skolor och äldreomsorg kräver lokaler. log(kommunal skattesats) korrelerar med högre kostnader. Här skulle det dock kunna föreligga omvänd kausalitet, då högre kostnader kan leda till att skatten höjs. Annars kan det vara så att Parkinsons andra lag har verifierats, vilken säger att: "Utgifterna stiger för att motsvara inkomsterna"[1]. Ett intressant resultat är att hög log(kommunala tillgångar), det vill säga en större balansräkning, tycks hänga samman med högre kostnader. Detta skulle kunna indikera att kommuner bör köpa in tjänster snarare än att försöka driva verksamhet själva. Detta ligger i linje med samlingen managementidéer som ryms inom begreppet New Public Management[17], där man strävar efter att outsourca och marknadsanpassa offentliga verksamheter. 5.3 Svårigheter En av de stora svårigheterna var att avgränsa modellen. Det kommer alltid att föreligga en viss multikorrelation, varför de enskilda estimaten - och således modellens strukturella tolkning - beror av övriga inkluderade kovariat. Det är således viktigt vilka kovariat som ingår i modellen. Det blir även svårt att tolka estimaten för icke-kausala samband, vilket är ett besläktat problem. Att bara hitta kausala samband hade inte varit intressant, ty det i sådana fall hade varit lättare att titta i resultaträkningen direkt. Ett mål med studien var att dels titta på inneboende egenskaper hos kommunen, exempelvis Folktäthet och Gymnasiedensitet och dels faktorer som går att påverka, exempelvis Elever per lärare. För att välja variabler till modellen samlades först mycket data in för faktorer som antogs korrelera med kostnaderna. Sedan tilläts metodiken under Regressionsförfarande avgöra vilka variabler som skulle ingå i den slutgiltiga modellen. 15

17 5. Förbättringar I brist på liknande arbeten saknades vägledning vid formulering av frågeställning och val av modell. I efterhand kan det spekuleras om huruvida en mer specificerad frågeställning hade gett mer lättolkade resultat. Något som liknande arbeten kan beakta i framtiden är att specificera kostnaderna för en viss verksamhet och undersöka den i större detalj, exempelvis skolkostnader. Då finns större möjlighet att ta med samtliga korrelerande variabler och således få en starkare tolkning av modellen. Slutsats Valda kovariat predikterar kommuners kostnader väl, med R =.9. Modellen ger en bra bild av några faktorer som starkt korrelerar med kostnaderna. De resultat som författarna anser intressantast är att alliansstyre och blandat styre tenderar att hänga samman med lägre kostnader samt att en större balansräkning korrelerar med högre kostnader, varför kommuner kanske bör outsourca mer. 1

18 Referenser [1] Rebecca Weidmo Uvell. Lagstifta mot slarvet med skattepengarna. url: www. expressen. se/ debatt/ lagstifta- mot- slarvet- medskattepengarna/. [] Peter Watson. Rules of thumb on magnitudes of effect sizes. url: http: //imaging.mrc-cbu.cam.ac.uk/statswiki/faq/effectsize. [3] Harald Lang. Elements of Regression Analysis. 1. [] J. Neter M. H. Kutner C. J. Nachtsheim. Applied Linear Regression Models (th ed.) McGraw-Hill Irwin,. isbn: [5] Statistiska centralbyrån. Resultaträkning 13. url: www. scb. se/sv_/hitta-statistik/statistik-efter-amne/offentlig-ekonomi/ Finanser-for-den-kommunala-sektorn/Rakenskapssammandrag-forkommuner-och-landsting/1197/119/. [] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 13. url: http : / / www. scb. se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/57/5795/. [7] Sveriges Kommuner och Landsting. Styren i kommuner. url: skl.se/demokratiledningstyrning/valmaktfordelning/valresultatmaktfordelning1. 9.html. [] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 13. url: http : / / www. scb. se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/57/5795/. [9] Statistiska centralbyrån. Sveriges befolkning, kommunala jämförelsetal, 31 december 13. url: http : / / www. scb. se / sv _ /Hitta - statistik / Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/ Befolkningsstatistik/57/5795/. [] Statistiska centralbyrån. Land- och vattenareal per den 1 januari efter region och arealtyp. url: statistik/ Statistik-efter-amne/Miljo/Markanvandning/Land--och-vattenarealer/ #c_undefined. [11] Statistiska centralbyrån. Antal anställda efter ålder, kön och kommun. url: personalstatistik/personalenidiagramochsiffror/tabellerkommunalpersonal1/ kommunalpersonal13.7.html. [1] Skolverket. url: [13] Statistiska centralbyrån. Köpeskilling för småhus. url: se/sv_/hitta-statistik/statistik-efter-amne/boende-byggandeoch-bebyggelse/fastighetspriser-och-lagfarter/fastighetspriseroch-lagfarter/957/9/kommunstatistik/5399/. [1] Statistiska centralbyrån. Kommunalskatteuppgifter efter region. År url: START OE OE1/Kommunalskatter/?rxid=dd57b7e- fbb- cca-b5-ba9911fc. 17

19 [15] Statistiska centralbyrån. Balansräkning för kommuner efter region och balansräkningsposter. År url: scb. se / pxweb / sv / ssd / START OE OE7 OE7A / BalansKn /?rxid=1f959a-e-51-1-c777a9. [1] C. N. Parkinson. Parkinson s Law. Buccaneer Books, 199. isbn: [17] Roland Almqvist. New Public Management - om konkurrensutsättning, kontrakt och kontroll. Liber,. isbn:

20 A Appendix Deskriptiv statistik Medelålder 3 5 Andel gifta... Gymnasiedensitet log(kommunal skattesats).5 1 Alliansstyre -5 5 log(folktäthet) 5 15 Elever per lärare - log(kommunala tillgångar).5 1 Blandat styre.1. Andel kommunanställda log(huspris) Figur 1: Deskriptiv statistik för kovariat i slutgiltiga modellen. 19

21 Medelålder Andel gifta -... Gymnasiedensitet log(kommunal skattesats) Alliansstyre log(folktäthet) Elever per lärare - - log(kommunala tillgångar) Blandat styre Andel kommunanställda - log(huspris) Figur : Samband mellan residualer och kovariat i den slutgiltiga modellen.

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Prissättningsanalys av annonser på internet

Prissättningsanalys av annonser på internet EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 Prissättningsanalys av annonser på internet En analys av variabler som påverkar slutpriset GUSTAF ERLANDSSON CHRISTOFER TÄRNELL KTH KUNGLIGA

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Paneldata och instrumentvariabler/2sls

Paneldata och instrumentvariabler/2sls Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från Svenskt Näringsliv som publicerades i

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009 Företagsklimatet viktigt för ungas val av kommun Johan Kreicbergs April 2009 Inledning 1 Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från som publicerades i slutet av 2007

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression

Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2015 Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON,

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Föreläsning 10, del 1: Icke-linjära samband och outliers

Föreläsning 10, del 1: Icke-linjära samband och outliers Föreläsning 10, del 1: och outliers Pär Nyman par.nyman@statsvet.uu.se 19 september 2014-1 - Sammanfattning av tidigare kursvärderingar: - 2 - Sammanfattning av tidigare kursvärderingar: Kursen är för

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Regression med Genetiska Algoritmer

Regression med Genetiska Algoritmer Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet

Läs mer

Hur skriver man statistikavsnittet i en ansökan?

Hur skriver man statistikavsnittet i en ansökan? Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24 1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

import totalt, mkr index 85,23 100,00 107,36 103,76

import totalt, mkr index 85,23 100,00 107,36 103,76 1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Att välja statistisk metod

Att välja statistisk metod Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

TAMS65 DATORÖVNING 2

TAMS65 DATORÖVNING 2 TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018 Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer