Inflyttning i Stockholmsområdet
|
|
- Hanna Månsson
- för 8 år sedan
- Visningar:
Transkript
1 Inflyttning i Stockholmsområdet - En regressionsanalys av variabler som påverkar inflyttningen i Stockholmskommunerna. Fredrik Arbegard 1 Rapport Kandidatexamensarbete Farkostteknik (SA105X) Handledare: Tobias Rydén Monterrey, 26 Maj 2012
2 Sammanfattning Undersökningen handlade om att ta fram en modell med variabler för att avgöra om det finns några variabler som påverkar inflyttningen till en kommun i Stockholmsområdet och i så fall vilka dessa är. Undersökningen gjordes med hjälp av regressionsanalys av variablerna och metoden som användes var stepwise regression. På så sätt erhölls koefficienterna till modellen och med hjälp utav dessa kunde man tolka om variablerna hade positiv eller negativ inverkan samt testa huruvida väntevärdet skulle kunna vara negativt eller positivt med hjälp av hypotestest med konfidensintervall. Vid tolkning av variablerna så erhöll man att dem flesta variablerna betedde sig enligt dem hypoteserna man slagit fast vid tidigare. Det visade sig att dem flesta utav variablernas väntevärde vid 95% konfidens intervall faktiskt låg inom ett område där det kunde anta både positivt och negativt tecken. Dessutom gjordes residualplottar för att undersöka hur bra modellen var och om det förekom några mönster i variansen, det slogs fast vid observation att inga mönster förekom i plottarna. Slutsatsen man kom fram till att även om vissa variabler betedde sig enligt dem uppskattade hypoteserna så tar modellen inte hänsyn till en del faktorer som kan ändra inflyttningen, samt att det finns fler variabler som kan ha större betydelse för hur folk väljer sin hemkommun. 2
3 Innehållsförteckning Inledning... 4 Variabler... 5 Metod... 6 Multipel linjär regression... 6 Metod för variabelinkludering... 7 Forward selection... 7 Backward elimination... 7 Stepwise regression... 7 Hypotestest... 8 Definitoner... 9 Gränserna F IN och F OUT... 9 Hypoteser Genomförande Resultat Diskussion Koefficienterna Hypotestest Residualplottar Slutsatser Referenser Bilagor Bilaga 1.1 Tabell över T-statistic Bilaga 1.2 Tabeller över variabeldata Bilaga 1.3 Residualplottar för enskilda variabler Bilaga 1.4 Residualplottar för enskilda variabler Bilaga 1.5 Residualplottar för enskilda variabler Bilaga 1.6 Exempel MATLAB-kod för beräkning av residualer
4 Inledning Syftet med detta projekt är att statistiskt undersöka befolkningsökningen i Upplands-Väsbys kommun. Projektet gjordes på uppdrag av Linnéa Askling, statistiker på kommunen. I beställningen önskades svar på följande frågor Finns det andra variabler än nybyggnation som påverkar befolkningsutvecklingen? Om det finns andra variabler, vilka är då dessa? Går det att förklara varför kommunen växer så mycket? Projektet gjordes med hjälp av utav regressionsanalys och stepwise regression för att avgöra vilka variabler som var signifikanta. Befolkningsökningen beror på fyra variabler, antalet inflyttade i kommunen, antalet utflyttade, antalet födda och antalet döda I en kommun. I denna undersökning så har fokus lagts på inflyttningen då denna variabel som kan tänkas bero på många faktorer. Inflyttningen är även normerad för att få ett populäritetsmått på kommunen mellan 0 och 1. Bland kommunerna så har Nykvarn utgått pga. svårigheter att erhålla data för en utav variablerna. 4
5 Variabler Variablerna valdes utifrån kriterier på vad som kunde tänkas påverka inflyttningen samt för vilka år data fanns tillgängligt. Det slutade totalt med åtta stycken variabler att undersöka. q Serie Källa Syfte för inkludering Antalet lägenheter i flerbostadshus (Antal) Boende, byggande och bebyggelse Nybyggnad av bostäder SCB.se Ingick i den undersökning som gjordes 2010 Antalet lägenheter i småhus (Antal) Antal hektar naturreservat (Ha) Kontant bruttolön (tkr) Medelpendlingstid med kollektivtrafik (min) Avstånd till Stockholm (km) Nyanmälda platser hos arbetsförmedlingen Invånare/Km 2 Boende, byggande och bebyggelse Nybyggnad av bostäder Miljö Skyddad natur Hushållens ekonomi Inkomster och skatter Fakta om SL och länet Årlig statistik Från Google Maps Google s definition. Beräknade med länk hänvisad i källa. Tidigare statistik Platser Befolkning Befolkning efter ålder, civilstånd och kön SCB.se SCB.se SCB.se SL.se Senast hämtad: Arbetsformedlingen.se SCB.se Ingick i den undersökning som gjordes 2010 Ingick för att testa om tillgänglighet till natur påverkar befolkningsökningen. Ingick för att undersöka om höga löner är en faktor. Ingick för att undersöka om god tillgänglighet till kollektiv trafik är en faktor. Det antogs att förändringarna i kollektivtrafiken mellan är minimala och inte påverkar tiderna. Ingick för att undersöka om avståndet är en faktor. Det antogs att förändringarna i avstånd mellan är minimala. Ingick för att undersöka hur tillgången till arbete kan vara en faktor. Ingick för att undersöka hur befolkningstätheten påverkar. 5
6 Metod Multipel linjär regression Den regressionsmodell som användes i detta projekt kallas för multipel linjär regression. Denna modell består av en variabel som tros bero på två eller fler variabler, därför så kan den beroende variabeln approximeras enligt följande modell. Där är den beroende variablen, dem oberoende variablerna, koeffcienterna för modellen och felet i modellen. Det antags även att ( ) och ( ), där är variansen. Uttryck 1.1 kan skrivas om till matrisform enligt Där ( ), ( ), ( ), och ( ). För att skatta används minstakvadratmetoden genom uttryck 1.3 nedan. ( ) 1.3 Man erhåller då följande modell enligt Eller på matrisform. 1.5 För att erhålla felet så räknas skillnaden mellan och ut enligt
7 Metod för variabelinkludering Den metod som användes för att göra denna analys kallas för Stepwise Regression och är en kombination av metoderna Forward selection och Backyard elimination. Vid samtliga metoder används det så kallade F-statistic för att avgöra om en modell inte innehåller några statistiskt betydelsefulla variabler. ( ) 1.7 Där RSS p är den kvadratiska summan av residualerna av modell nummer p, RSS p+1 är den kvadratiska summan av residualerna av modell nummer p+1, n är antalet observationer och p är numret på den modell vi undersöker. Forward selection Forward selection innebär att man börjar med en tom modell med endast den konstanta termen. Man börjar vid p=1 och konstruerar en modell för varje variabel i tur och ordning så man erhåller flera modeller med en konstant term och en variabel. Därefter beräknar man den kvadratiska residualsumman och beräknar F-statistic, man introducerar därefter den icke redan inkluderade variabeln med högst värde på F. Detta fortsätter man sedan med för p=2, 3,.. förutsatt att det högsta värdet på F inte överstiger ett visst gränsvärde F IN. Backward elimination Vid Backward elimination så börjar man med en modell med samtliga variabler inkluderade och eliminerar varje variabel i tur och ordning och beräknar därefter värdet på F. Man eliminerar den variabel som har lägst värde på F, detta håller på så länge värdet på F är mindre än något gränsvärde F OUT. Stepwise regression Med Forward selection och Backward elimination så finns det nackdelar, i Backward elimination så kan en variabel när den blivit eliminerad ej bli återinförd och med Forward selection så kan en variabel som blivit introducerad j bli eliminerad. Dessutom kan respektive metod ge olika resultat på samma dataset. Metoden Stepwise regression bygger på en algoritm som använder både Forward selection och Backward elimination. Metoden enligt följande: 1) Man börjar med en tom modell och börjar med ett FS-steg som introducerar en variabel. 2) Ett BE-steg följer sedan och eliminerar en variabel om dess F-värde är mindre än F OUT. Denna metod fortsätter tills inga nya variabler introduceras i FS-steget enligt ett visst gränsvärde F IN. 7
8 Hypotestest För att avgöra om vissa koefficienter till variablerna är positiva eller negativa så användes något som kallas hypotestest. Detta test går ut på att man antar att koefficienten måste vara mindre eller lika med noll ( ) eller större än noll ( ). Därefter konstrueras ett intervall för en viss konfidens (t.ex. 95 %) och sedan undersöks det om det är möjligt för koefficienten att anta negativa värden inom detta intervall. Om koefficienten inte gör detta så kan vi förkasta med 95 % säkerhet, om den dock kan anta negativa värden inom detta intervall så kan vi på 95 % säkerhet inte förkasta. Matematiskt ser uttrycket ut enligt följande: ( ) ( ) 1.8 Där är en koefficient, en den minstakvadratskattning av, ( ) standardavvikelsen och ( ) det kritiska t-värdet meden viss konfidens och med observationer och variabler för den aktuella modellen. När beräknas så jämför man det mot det kritiska t-värdet ( ), om ( ) så kan vi inte förkasta, om dock ( ) så förkastar vi. 8
9 Definitoner Gränserna FIN och FOUT Innan man gör själva Stepwise regression så måste man definiera gränserna för F IN och F OUT. För att definiera gränserna så gjordes för var och en av årsdatablocken ett test i SPSS med stepwise regression för att se vika variabler som ingick vid vissa F IN. Notera att i detta fall används sannolikheten som gräns i stället, vilket innebär att istället för F IN så har vi P IN. P IN varierades från 0.5 till 0.1 och sedan jämna tiondelar tills alla variabler ingick, grönt står för att variabeln ingår och gult för att den inte gjorde det. Resultatet visas ned i tabellerna PIN P=0.05 P=0.1 P=0.2 P=0.3 P=0.4 P=0.5 P=0.6 P=0.7 P=0.8 P=0.9 Flerbostadshus Småhus Naturreservat (ha) Kontant bruttolön Restid SL Avstånd till Stockholm Nyanmälda platser Invånare/km2 Tabell 1.1. Tabell över ingående variabler vid olika P IN år PIN P=0.05 P=0.1 P=0.2 P=0.3 P=0.4 P=0.5 P=0.6 P=0.7 P=0.8 P=0.9 Flerbostadshus Småhus Naturreservat (ha) Kontant bruttolön Restid SL Avstånd till Stockholm Nyanmälda platser Invånare/km2 Tabell 1.2. Tabell över ingående variabler vid olika P IN år PIN P=0.05 P=0.1 P=0.2 P=0.3 P=0.4 P=0.5 P=0.6 P=0.7 P=0.8 P=0.9 Flerbostadshus Småhus Skyddad natur (ha) Kontant bruttolön Restid SL Avstånd till Stockholm Nyanmälda platser Invånare/km2 Tabell 1.2. Tabell över ingående variabler vid olika P IN år
10 Som det går att observera från tabellerna så är det vid P IN =0.6 då flest variabler ingår just vid det värdet. För F OUT (eller P OUT som det blir i detta fall) så undersöks P-värdena för varje ingående variabel i modellen vid P IN =0.6. För att få liknande modeller så tas variabeln flerbostadshus bort från modell 2 och 3. Hypoteser Det var svårt att säga vilka förväntningar som fanns på variablerna, men genom att undersöka en tidigare undersökning av bostadsbyggandet i Stockholm (se referens 6) kunde det slås fast att bostadsbyggnadsvariablerna flerbostadshus och småhus borde ha positiva värden då majoriteten av dem hade detta i den undersökningen. Övriga variabler baserades på uppskattningar och antaganden om hur variablerna väger in när medelsvensken skall välja sin hemkommun. Baserat på detta kunde följande hypoteser slås fast. Nära till naturområden, gärna skyddade från bebyggelse. Om denna jobbar inom kommunen, gärna en hög bruttolön. Kort pendlingstid förutsatt att denna person utnyttjar kollektivtrafiken. Kort avstånd in till innerstan. Om denna nu skall jobba inom kommunen så skal det gärna finns många jobb att välja mellan. Gärna låg befolkningstäthet. Självklart går det att argumentera om hypoteserna är riktigt fast slagna utifrån uppskattningar och antaganden, men det är viktigt att slå fast vissa hypoteser och sedan utifrån dem resultat som ges av undersökningen fastslå om dessa stämmer eller inte. 10
11 Genomförande Först så samlades datan ihop från dem olika källorna och sammanställdes i datatabeller om år. Därefter användes programmet SPSS och metoden stepwise regression för att fastställa vilka variabler som skulle inkluderas i modellen. När variablerna fastställts så erhölls koefficienterna, ANOVA-tabellerna och standardavvikelserna för de tre modellerna för dem olika åren. Dessa tolkades och användes sedan för att göra dem så kallade hypotestesten för att fastställa om koefficienterna är positiva eller negativa. Dessutom användes MATLAB (se kod i bilaga 1.6) för att konstruera residualplottar för at undersöka huruvida variansen följer ett mönster eller inte. 11
12 Resultat Coefficientsa Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta 1 (Constant),074535, ,967,009 t Sig. småhus, , ,030,843,411 skyddad, , ,027,966,348 natur (ha) kontant -,000239, ,080-2,357,031 bruttolön Restid SL -,000326, ,031-1,019,322 (min) ( ) Avstånd till -,000460, ,088-2,161,045 Stockholm (km) Nyanmälda, , ,906 20,944,000 platser Invånare/km2, , ,063 1,544,141 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1,994,989,984 0, Tabell 1.4. Tabell över ingående variabler vid P IN =0.6 år Coefficientsa Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta 1 (Constant),057083, ,295,035 t Sig. småhus,000115, ,061 1,987,063 skyddad, , ,034 1,310,208 natur (ha) kontant -,000213, ,069-2,251,038 bruttolön Restid SL -,000134, ,013 -,452,657 (min) ( ) Avstånd till -,000464, ,087-2,458,025 Stockholm (km) Nyanmälda, , ,890 24,536,000 platser Invånare/km2, , ,080 2,113,050 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1,996,991,988 0, Tabell 1.5. Tabell över ingående variabler vid P IN =0.6 år
13 Coefficientsa Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta 1 (Constant),035934, ,825,086 t Sig. småhus,000111, ,094 3,991,001 Skyddad, , ,043 2,119,049 natur (ha) kontant -,000105, ,035-1,378,186 bruttolön Restid SL -,000178, ,017 -,800,435 (min) ( ) Avstånd till -,000321, ,060-2,038,057 Stockholm (km) Nyanmälda, , ,883 33,441,000 platser Invånare/km2, , ,091 3,012,008 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1,997,995,993 0, Tabell 1.6. Tabell över ingående variabler vid P IN =0.6 år Figur 1.1. Plot med residualen som funktion av den förväntade responsen för
14 Figur 1.2. Plot med residualen som funktion av den förväntade responsen för Figur 1.3. Plot med residualen som funktion av den förväntade responsen för
15 Diskussion Koefficienterna Enligt resultatet i tabellerna är signifikansen för varje variabel ej är över P IN vilket innebär att eftersom P OUT > P IN så kommer ingen av dessa variabler att kunna uteslutas ur modellen, alltså behöver vi ingen gräns för P OUT. Variabel Beteckning Konstant,074535,057083, Småhus, ,000115, Skyddad natur (ha), , , Kontant bruttolön -, , , Restid SL -, , , Avstånd till Stockholm -, , , Nyanmälda platser, , , Invånare/km2, , , Tabell 1.7. Tabell över koefficienterna för varje årsdatablock. Det går av resultatet att observera att koefficienternas skiljer sig lite från varandra siffermässigt, men detta är pga. att inflyttningen och variabeldatan ej ser likadan ut från år till år. Trots detta går det att observera att samtliga variabler har samma tecken och att dem ligger i samma storleksklass. När det gäller småhus så går det att observera en positiv trend vilket stämmer överens med hypotesen, detta är det resultatet man kunde förvänta sig då folk lockas av att det byggs nya bostäder i kommuner. Elasticiteten för den skyddade naturen är även den positiv vilket kan tolkas som att tillgången till grönområden också är en faktor som påverkar folk när dem flyttar in I kommunen. Detta stämmer även bra med den hypotes som lades fram. Den kontanta bruttolönens koefficient är negativ vilket kan tyckas märkligt då hypotesen var att den skulle vara positiv, dock kan detta bero på att folk primärt kanske väljer att bosätta sig i en kommun och sedan pendla till arbetet I en annan varför lön inte är en store faktor i varför man väljer kommun. Restiden har också en negativ inverkan vilket även detta stämmer med den hypotes som lades fram att folk vill ha kort restid med kommunaltrafik. Avståndet till Stockholm har negativt tecknen vilket också stämmer överens med hypotesen som lades fram under förväntningar. 15
16 Nyanmälda platser tyder på en positiv trend viket innebär att fler arbetstillfällen gör kommunen mer attraktiv och detta stämmer också med hypotesen, dock som med bruttolönen så kan detta vara missvisande med folk som bor i en kommun och arbetar i en annan. När det gäller invånare per kvadratmeter så har denna en positiv trend vilket inte stämmer med hypotesen, anledningen till detta kan vara att avståndet in till Stockholm spelar en större roll än befolkningstätheten då enligt datan ju närmare Stockholm, desto högre befolkningstäthet. När det gäller hur koefficienterna skiljer sig från år till år så går det att observera att småhusens inverkan minskar samt att den skyddade naturen och befolkningstätheten ökar. Det är svårt att säga vad detta beror på annat än att kanske folk dras mer till kommuner med fler grönområden och att dem i så ökar i befolkningstäthet. Det finns några kommuner som har en hög andel skyddade grönområden samt hög befolkningstäthet. Hypotestest Ett test som gjordes var att undersöka tecken på koefficienterna i ett konfidensintervall för att se om det fanns en chans att dem kunde vara negativa. I hypotestestet så testades det om dem kunde vara mindre eller lika med noll, detta gjordes för alla koefficienter positiva som negativa. Med formel 1.8 så beräknades t-värdet för variablerna och dessa visas i följande tabell. Konfidensnivån som användes var 5 % och tvåsidigt intervall. Modell Modell 1 Modell 2 Modell 3 Koefffcienter t H 0 t H 0 t H 0 förkastas förkastas förkastas t krit 2,9669 Ja 2,2953 Ja 1,8250 Nej 2,101 0,8422 Nej 1,9931 Nej 3,9785 Ja 2,101 0,9668 Nej 1,3091 Nej 2,1214 Ja 2,101-2,3663 Ja -2,2421 Ja -1,3816 Nej 2,101-1,0188 Nej -0,4527 Nej -0,8018 Nej 2,101-2,1596 Ja -2,4550 Ja Ja 2,101 20,9695 Ja 24,5989 Ja 33,5490 Ja 2,101 1,5455 Nej 2,1087 Ja 3,0168 Ja 2,101 Tabell 1.8. Tabell över t-värden för koefficienterna, dem kritiska t-värdena, samt om H 0 förkastas. Resultatet som erhölls, säger att endast två koefficienter är opåverkade av tecknen i dem tre modellerna. 16
17 Det går också att observera att om högre konfidensnivå väljs (t.ex. 0.1 %) så kan man inte förkasta H 0 för alla utom i samtliga modeller. Detta tyder på att helt klart är positivt. 17
18 Residualplottar I figur samt i bilaga så finns det en del residualplottar, dessa är residualen plottad mot den predikterade responsen, d.v.s. det värdet som räknas ut via modellen för koefficienterna och dem oberoende variablerna. Det som man söker efter i dessa plottar är om det finns något mönster i variansen på värdena för om det finns det så betyder detta att modellen inte är en bra modell. Detta eftersom antagandet för modellen för linjär regression är att både residualen och den beroende variabeln är normalfördelade. Vid observation av plottarna så kan man konstatera att inget synligt mönster fram kommer, i vissa av dem så verkar det som om ett värde står ut. Detta värde är troligen Stockholms kommuns värde då detta ofta är större pga. att kommunen är större än genomsnittet. 18
19 Slutsatser Dem slutsatserna man kunde dra av denna undersökning är att det var svårt att erhålla något entydigt svar på hur mycket dessa variabler påverkade inflyttningen i realiteten. Undersökningen visade att i modellen så gör dem det och att man i dem flesta fall kunde bekräfta dem hypoteser och antaganden som gjordes med modellen. Men det fanns en del saker modellen inte tog hänsyn till och i vissa fall kan det till exempel vara mönster som är svåra att beskriva statistiskt. Dessutom saknades en del variabler i undersökningen som kanske kunde ha haft större influens än dem inkluderade variabeln. Exempel på sådana är mäklarpriset som uteslöts pga. svårigheter att få tillgång till materialet, även antalet skolor och vårdcentraler som även dem kan ha en påverkan på hur folk väljer kommun. Anledning till att dem två sistnämnda uteslöts berodde på svårigheten att göra dem relevanta då både skolor och vårdcentraler har olika kapacitet, ett bra mått på detta vore kanske att ha ett genomsnittsmått som antalet besökare på vårdcentraler totalt i kommunen dividerat på antalet vårdcentraler per kommun samt antal elever i kommunen delat på antalet skolor i kommunen. Då får man in bra vägningsmått som i framtiden kanske kan användas för en liknande undersökning. För att svara på frågan om det går att förklara varför just Upplands Väsby växt så mycket så kunde man utifrån resultatet från variablerna dra följande slutsatser. Beläget nära Stockholm, vilket hade en stor inverkan enligt modellen. Mycket skyddad natur för sin kommunstorlek. Stor del nyanmälda jobb inom kommunen. En sak som inte togs hänsyn till heller gällande Upplands Väsby specifikt är tillgången till den internationella flygplatsen Arlanda, anledningen till att den inte undersöktes var att man inte kunde komma på någon bra metod för att undersöka detta. 19
20 Referenser 1. SPSS, Version , IBM Corporation, MATLAB R2011a, Version , The MathWorks Inc., March Learning and Practicing Econometrics, William E. Griffiths, R. Carter Hill, George G. Judge, John Wiley and Sons, Inc., ISBN , Linear Regression Analysis, George A.F. Seber, Alan J. Lee, John Wiley and Sons, Inc., ISBN , Sannorlikhetslära och statistiksteori med tillämpningar, Gunnar Blom Jan Enger Gunnar Englund Jan Grandell Lars Holst, Studentlitteratur AB, ISBN , Bostadsbyggande och befolkningstillväxt i Stockholms län Regressionsanalys, Stockholms läns landsting, Tillväxt miljö och regionsplanering, 2010:11 Länk: nde_och_befolkningstillvaxt.pdf Senast hämtad: (Omslagsbild) Stockholms Stadshus, ArildV, Länk: Senast hämtad:
21 Bilagor Bilaga 1.1 Tabell över T-statistic PERCENTAGE POINTS OF THE T DISTRIBUTION Tail Probabilities One Tail Two Tails D E G R E E S O F F R E E D O M Two Tails One Tail Tail Probabilities Länk: Senast hämtad:
22 Bilaga 1.2 Tabeller över variabeldata Figur Tabell över datan För variabeln Avståndet till Stockholm och observationen Stockholm så är denna lika med noll då det är utifrån denna ort som avståndet definieras. 2 För variabeln Restid SL ( ) och observationen Stockholm så är värdet ett medelvärde då kommunen var uppdelad i tre delar. 22
23 Figur Tabell över datan
24 Figur Tabell över datan
25 Bilaga 1.3 Residualplottar för enskilda variabler 2008 Figur Plot med residualen som funktion av variablen småhus. 25
26 Figur Plot med residualen som funktion av variablen skyddad natur. Figur Plot med residualen som funktion av variablen kontant bruttolön. 26
27 Figur Plot med residualen som funktion av variablen restid. Figur Plot med residualen som funktion av variablen avstånd till stockholm. 27
28 Figur Plot med residualen som funktion av variablen nyanmälda platser. Figur Plot med residualen som funktion av variablen invånare/km 2. 28
29 Bilaga 1.4 Residualplottar för enskilda variabler 2009 Figur Plot med residualen som funktion av variablen småhus. Figur Plot med residualen som funktion av variablen skyddad natur. 29
30 Figur Plot med residualen som funktion av variablen kontant bruttolön. Figur Plot med residualen som funktion av variablen restid. 30
31 Figur Plot med residualen som funktion av variablen avstånd till stockholm. Figur Plot med residualen som funktion av variablen nyanmälda platser. 31
32 Figur Plot med residualen som funktion av variablen invånare/km 2. 32
33 Bilaga 1.5 Residualplottar för enskilda variabler 2010 Figur Plot med residualen som funktion av variablen småhus. Figur Plot med residualen som funktion av variablen skyddad natur. 33
34 Figur Plot med residualen som funktion av variablen kontant bruttolön. Figur Plot med residualen som funktion av variablen restid. 34
35 Figur Plot med residualen som funktion av variablen avstånd till stockholm. Figur Plot med residualen som funktion av variablen nyanmälda platser. 35
36 Figur Plot med residualen som funktion av variablen invånare/km 2. 36
37 Bilaga 1.6 Exempel MATLAB-kod för beräkning av residualer % %Fredrik Arbegard %SA1015x clear all close all clc format long A = xlsread('2008.xlsx'); %Loading Excel file Y = A(:,1); %Assigning first row as dependent variable X1 = A(:,2:8); %Asigning the independet variables one1 = ones(25); %Creating a matrix with ones one = one1(:,1); %Creating a column vector with ones X = [one X1]; %Constructing the X-matrix b = inv(x'*x)*x'*y; %Calculating the coeffcients Yhat = X*b; %Calcuating Yhat - the caulculated Y e = Y - Yhat; %Caulculating the residual %Plotting the results figure(1) axis([ ]) scatter(yhat, e) Title('Residual plots') ylabel('residual e') xlabel('yhat') figure(2) %axis([ ]) scatter(x(:,2)*b(2), e) Title('Residual plots') ylabel('residual e') xlabel('småhus') figure(3) %axis([ ]) scatter(x(:,3)*b(3), e) Title('Residual plots') ylabel('residual e') xlabel('skyddad natur') figure(4) %axis([ ]) scatter(x(:,4)*b(4), e) Title('Residual plots') ylabel('residual e') xlabel('kontant bruttolön') 37
38 figure(5) %axis([ ]) scatter(x(:,5)*b(5), e) Title('Residual plots') ylabel('residual e') xlabel('restid') figure(6) axis([ ]) scatter(x(:,6)*b(6), e) Title('Residual plots') ylabel('residual e') xlabel('avstånd till Stockholm') figure(7) %axis([ ]) scatter(x(:,7)*b(7), e) Title('Residual plots') ylabel('residual e') xlabel('nyanmälda platser') figure(8) %axis([ ]) scatter(x(:,8)*b(8), e) Title('Residual plots') ylabel('residual e') xlabel('invånare/km2') 38
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Uppgift 1. Deskripitiv statistik. Lön
Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot
Regressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1
Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Lösningar till SPSS-övning: Analytisk statistik
UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
Regressionsanalys av lägenhetspriser i Spånga
Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016
Multipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Demografisk rapport 2014:10. Prognosmetoder och modeller. Regressionsanalys. Befolkningsprognos /45
Demografisk rapport 214:1 Prognosmetoder och modeller Regressionsanalys Befolkningsprognos 214-223/45 PCA/MIH Michael Franzén Version 4. 1(32) Rapport 214-1-8 Regressionsmodellen för inrikes inflyttning
Laboration 4: Lineär regression
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 Laboration 4: Lineär regression 1 Syfte Denna laboration handlar om regressionsanalys och
Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Tentamen i matematisk statistik
Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:
1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Metod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Fråga nr a b c d 2 D
Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841
Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 20 mars 2015 9 14 Examinator: Anders Björkström, bjorks@math.su.se Återlämning: Fredag 27/3 kl 12.00, Hus 5,
Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Samhällsvetenskaplig metod, 7,5 hp
Samhällsvetenskaplig metod, 7,5 hp Provmoment: Individuell skriftlig tentamen kvantitativ metod, 2,0 hp Ladokkod: 11OA63 Tentamen ges för: OPUS kull H13 termin 6 TentamensKod: Tentamensdatum: Fredag 24
a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?
Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten
Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Modellutveckling 2016: Regressionsmodellen för inrikes inflyttning
Demografisk rapport 2016:01 Modellutveckling 2016: Regressionsmodellen för inrikes inflyttning Befolkningsprognos 2016 2025/50 2(38) 3(38) Regressionsmodellen för inrikes inflyttning i befolkningsprognosen
Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
TVM-Matematik Adam Jonsson
TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet
LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING
LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga
Regressionsanalys av huspriser i Vaxholm
Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se
Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp
Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.
Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018
Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial
Skrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Föreläsning 4. Kap 5,1-5,3
Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet
Regressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Statistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
LABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet
2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller
S0004M Statistik 1 Undersökningsmetodik. Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller Till denna laboration ska det angivna datamaterialet användas och bearbetas med den statistiska
Modellutveckling 2015: Regressionsmodellen för inrikes inflyttning
Demografisk rapport 215:6 Modellutveckling 215: Regressionsmodellen för inrikes inflyttning Befolkningsprognos 215 224/5 2(38) 3(38) Regressionsmodellen för inrikes inflyttning i befolkningsprognosen Inledning
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Regressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
tentaplugg.nu av studenter för studenter
tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift
7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.
Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 4I2B KINAF4, KINAR4, KINLO4, KMASK4 7,5 högskolepoäng Tentamensdatum: 28 oktober 206 Tid:
Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper
Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från Svenskt Näringsliv som publicerades i
En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:
1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt
732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Laboration 2: Styrkefunktion samt Regression
Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens
Att välja statistisk metod
Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...
Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009
Företagsklimatet viktigt för ungas val av kommun Johan Kreicbergs April 2009 Inledning 1 Inledning Många av Sveriges kommuner minskar i befolkning. Enligt en prognos från som publicerades i slutet av 2007
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta
Tentamen Tillämpad statistik A5 (15hp)
Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik
Multipel regression och Partiella korrelationer
Multipel regression och Partiella korrelationer Joakim Westerlund Kom ihåg bakomliggande variabelproblemet: Temperatur Jackförsäljning Oljeförbrukning Bakomliggande variabelproblemet kan, som tidigare
Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson
Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson Det framtida medlemsantalet i svenska kyrkan tycks vara intressant för många, då det regelbundet diskuteras i olika sammanhang. Att kyrkans
Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.
Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,
Matematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt
Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi
Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm
Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:
tentaplugg.nu av studenter för studenter
tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift
LABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal
732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00
Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 5Hp 41I12B KINAF13, KINAR13, KINLO13,KMASK13 7,5 högskolepoäng Tentamensdatum: 30 oktober
Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer
Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,
Forsknings- och undersökningsmetodik Skrivtid: 4h
Forsknings- och undersökningsmetodik Skrivtid: h Tentamen 8..00 Hjälpmedel: Kalkylator Formel- & tabellsamling Provtexten får bortföras. DEL, DEL eller HELA KURSEN: Besvara frågor! Varje fråga är värd
Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp
Sid 1 (10) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 Betrakta nedanstående täthetsfunktion för en normalfördelad slumpvariabel X med väntevärde
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen
Industriell matematik och statistik, LMA136 2013/14
Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2
InStat Exempel 4 Korrelation och Regression
InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och
Statistisk försöksplanering
Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 2 November Tid: 09:00-13 Hjälpmedel: Miniräknare
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland
Repetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Grundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data
Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler
7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens
Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större
TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Laboration 3: Enkel linjär regression och korrelationsanalys
STOCKHOLMS UNIVERSITET 13 februari 2009 Matematiska institutionen Avd. för matematisk statistik Gudrun Brattström Laboration 3: Enkel linjär regression och korrelationsanalys I sista datorövningen kommer
Examinationsuppgifter del 2
UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).
1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli
NÄR SKA MAN SÄLJA SIN BOSTAD?
NÄR SKA MAN SÄLJA SIN BOSTAD? En multipel regressionsanalys av bostadsrätter i Stockholm Oscar Jonsson Moa Englund Stockholm 2015 Matematik Institutionen Kungliga Tekniska Högskolan Sammanfattning Projektet
Laboration 2 multipel linjär regression
Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera
D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.
1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga
Matematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska