Regressionsanalys av NHL-statistik

Storlek: px
Starta visningen från sidan:

Download "Regressionsanalys av NHL-statistik"

Transkript

1 Regressionsanalys av NHL-statistik Av Gustav Hedén Examensarbete inom teknisk fysik, grundnivå SA104x KTH Matematisk statistik Handledare Fredrik Armerin 1

2 Innehållsförteckning Sammanfattning:... 2 Abstract:... 2 Inledning:... 2 Teoretisk bakgrund: 3 Metod:... 4 Resultat:... 5 Diskussion: Slutsatser: 16 Sammanfattning: Denna studie har undersökt vad NHL-lag ska förbättra. Detta har skett genom att studera statistiskt signifikant statistik från NHL-säsonger med linjär regression i syfte att kunna identifiera vad NHL-lag ska göra för att ta många poäng och således hamna högt i tabellen. Det mest intressanta som studien har gett är att antalet skott och antalet vunna tekningar samt effektiviteten i power play i en NHLmatch för de flesta av de studerade säsongerna inte har någon statistik betydelse för vilket lag som vinner matchen. Abstract: The study examined what NHL-teams should improve. This has been done by studying the significant statistics of NHL-seasons, and with linear regression identifying what NHL-teams should do to win many points and thereby get a good placement in the final table. The most interesting result of the study is that the statistics on faceoffs and shots on goal and power play efficiency most seasons where irrelevant for the outcome of a season. Inledning: Syftet med projektet är att studera NHL-lag och deras tagna poäng under en säsong i relation till erkänt statistiskt viktiga moment under en hockeymatch. Detta görs med en multipel linjär regressionsanalys i syfte att kunna relatera de olika statistikerna till varandra och antalet tagna poäng. Ur denna analys kan de statistiskt signifikanta momenten skiljas från de icke statistiskt signifikanta och ur det kan slutsatser dras kring vad NHL-lag ska försöka förbättra. En tidigare studie har påvisat en totalökning med fyra mer tagna poäng per säsong om ett NHL-lags tekningsvinstprocent ökar från 50% till 60%(Schuckers, Pascuali och Curro, 2012). Det skulle innebära att tekningsvinststatistiken är en del ett lag kan förbättra om de vill ta mer poäng under en säsong och således är det resultatet intressant vid jämförande med den här regressionsanalysen av NHL-statistik. 2

3 Teoretisk bakgrund: Referensen till den teoretiska bakgrunden är studiehäftet Topics on Applied Mathematical Statistics av Harald Lang. Den teoretiska modell som används i denna analys heter linjär regression. Matematiskt beskrivs denna som y i = k j=0 x ij β j + e i Där y i är att betrakta som en observation av en slumpmässig, beroende variabel y, vars värde ges av kovariaterna x ij. Feltermen e i antas vara oberoende av de olika observationerna så att E e i x jl = 0 och E e i 2 x jl = σ 2 Där σ 2 är variansen. I matrisnotation brukar denna modell skrivas som y = Xβ + e där E(e X) = 0 och E(ee t X) = Iσ 2 För att analysera datan efter modellen för linjär regression används minsta kvadratmetoden(ols) till att ta fram ett skattat värde av β som benämns β. Detta sker genom att minimera kvadratsumman till residualen e t e = e 2. Den minimeringen sker genom att lösa normalekvationerna ur X t e = 0. Ur den skattade residualekvatioen e = y Xβ och normalekvationerna X t e = 0 ges att β = (X t X) 1 X t Y Notera även att β = (X t X) 1 X t (Xβ + e) = β + (X t X) 1 X t e eller β β = (X t X) 1 X t e Och då β är en väntevärdesriktig skattning av β ges kovariansmatrisen för β som: Cov β X = (X t X) 1 σ 2 Vilket ger en väntevärdesriktig skattning av σ 2 som: s 2 = 1 n k 1 e 2 Därefter kan t-statistiken beräknas för den väntevärdesriktiga skattningen av β som: t β = β β 0 s. e. β Vilket ur tabell ger ett p-värde för varje t-statistik för β. Dessutom kan ett R 2 -värde beräknas till modellen som beskriver hur korrekt modellen har passats till y. Det ges som: R 2 = 1 Var(e ) Var(y) Där ett värde närmare ett ger en bättre passning och vice versa. 3

4 Metod: Modellen som jag har valt att använda för att undersöka vad NHL-lag ska förbättra är: y = Totala antalet tagna poäng på säsongen β 0 = Konstant = Intercept y = β 0 + x 1 β 1 + x 2 β 2 + x 3 β 3 + x 4 β 4 + x 5 β 5 + e x 1 = Mål per match minus insläppta mål per match = G/G GA/G x 2 = Antal gjorda mål i powerplay genom antalet powerplay = PP% x 3 = Antalet offensiva skott per match minus antalet mottagna skott per match = S/G SA/G x 4 = Antalet vinster vid första gjorda målet genom antalet matcher laget gör första målet = SC1% x 5 = Antalet vunna tekningar genom antalet tekningar = FO% e = residualvektor Dessa koefficienter studeras alltså med linjär regression. Varje årgångsanalys kommer att börja med regressionen ovan. Därefter studeras vilka variabler som inte verkar inverka på antalet tagna poäng den säsongen. Sedan testas att ta bort en koefficient åt gången. Detta genom att studera de olika p- värdena och välja bort den med p-värdet närmast ett. Därefter genomförs en linjär regression med den nya modellen och om dess standardavvikelse har minskat kommer den att behållas. Denna process upprepas tills modellen inte kan förminskas mer och är då således optimerad. När regressionsmodellen har optimerats för samtliga säsonger kan studier göras kring vilka variabler som oftast blir kvar och vilka som optimeras bort. Därefter kan generella slutsatser dras om vad som faktiskt är viktigt för att vinna en NHL-match och hur detta har utvecklats med tiden. 4

5 Resultat: Totalt har 15 NHL-säsonger, från 97/98 till 12/13 analyserats med multipel linjär regression. Därefter har modellerna stegvis optimerats med ett Waldtest. Allt detta gjordes i programmet XLSTAT. Den optimerade modellen består av de statistiskt säkerställda variablerna som inverkar till antalet tagna poäng under den säsongen. 97/98: Intercept 78,179 18,815 4,155 0,000 38, ,427 GA/G 25,074 3,585 6,993 < 0, ,595 32,553 PP% 10,248 46,825 0,219 0,829-87, ,923 SA/G 0,079 0,286 0,276 0,786-0,519 0,676 SC 1% 17,586 10,028 1,754 0,095-3,333 38,505 FO% -16,360 34,609-0,473 0,642-88,554 55,834 Tabell 1 Anpassat R 2 0,956 Intercept 81,989 0, ,668 < 0, ,664 83,314 GA/G 28,638 1,214 23,581 < 0, ,131 31,144 Tabell 2 Anpassat R 2 0,957 5

6 98/99: Intercept 92,383 23,631 3,909 0,001 43, ,527 GA/G 31,562 3,346 9,434 < 0, ,604 38,519 PP% -20,696 34,291-0,604 0,553-92,009 50,616 SA/G -0,276 0,331-0,832 0,415-0,965 0,413 SC 1% -8,729 16,743-0,521 0,608-43,548 26,089 FO% -3,080 43,804-0,070 0,945-94,176 88,015 Tabell 3 Anpassat R 2 0,923 Intercept 82,000 0, ,827 < 0, ,358 83,642 GA/G 28,605 1,521 18,813 < 0, ,473 31,736 Tabell 4 Anpassat R 2 0,931 99/00: Intercept 48,728 19,601 2,486 0,021 8,077 89,378 GA/G 24,651 2,512 9,815 < 0, ,442 29,859 PP% 11,968 35,387 0,338 0,738-61,419 85,355 SA/G -0,071 0,245-0,292 0,773-0,578 0,436 SC 1% 10,789 12,053 0,895 0,380-14,207 35,785 FO% 57,915 39,469 1,467 0,156-23, ,769 Tabell 5 Anpassat R 2 0,960 6

7 Intercept 86,052 0, ,348 < 0, ,735 87,369 GA/G 27,269 1,065 25,602 < 0, ,080 29,458 Tabell 6 Anpassat R 2 0,960 00/01: Intercept 62,227 18,599 3,346 0,003 23, ,614 GA/G 25,633 2,806 9,133 < 0, ,840 31,425 PP% 40,455 38,154 1,060 0,300-38, ,200 SA/G 0,133 0,394 0,338 0,738-0,679 0,945 SC 1% 3,490 12,057 0,289 0,775-21,394 28,374 FO% 29,761 39,638 0,751 0,460-52, ,569 Tabell 7 Anpassat R 2 0,943 Intercept 86,047 0, ,728 < 0, ,484 87,611 GA/G 28,826 1,303 22,125 < 0, ,157 31,495 Tabell 8 Anpassat R 2 0,944 01/02: 7

8 Intercept 43,451 17,472 2,487 0,020 7,390 79,511 GA/G 21,182 3,093 6,849 < 0, ,799 27,566 PP% 83,639 39,527 2,116 0,045 2, ,220 SA/G 0,099 0,292 0,339 0,738-0,504 0,702 SC 1% 21,026 13,057 1,610 0,120-5,922 47,973 FO% 33,031 33,927 0,974 0,340-36, ,053 Tabell 9 Anpassat R 2 0,935 Intercept 69,551 6,016 11,561 < 0, ,207 81,894 GA/G 25,317 1,640 15,439 < 0, ,953 28,682 PP% 104,918 38,026 2,759 0,010 26, ,941 Tabell 10 Anpassat R 2 0,933 02/03: Intercept 65,881 17,560 3,752 0,001 29, ,123 GA/G 26,287 2,790 9,423 < 0, ,530 32,045 PP% -0,382 28,713-0,013 0,989-59,642 58,878 SA/G -0,190 0,231-0,826 0,417-0,667 0,286 SC 1% 19,017 9,626 1,976 0,060-0,850 38,883 FO% 20,318 26,135 0,777 0,444-33,621 74,257 Tabell 11 Anpassat R 2 0,960 8

9 Intercept 75,847 4,571 16,594 < 0, ,469 85,226 GA/G 25,398 1,529 16,611 < 0, ,260 28,535 SC 1% 19,244 7,717 2,494 0,019 3,410 35,077 Tabell 12 Anpassat R 2 0,963 03/04: Intercept 45,285 23,919 1,893 0,070-4,081 94,652 GA/G 23,693 3,081 7,691 < 0, ,335 30,052 PP% 5,770 34,809 0,166 0,870-66,072 77,613 SA/G -0,180 0,440-0,409 0,686-1,087 0,727 SC 1% 25,255 10,821 2,334 0,028 2,923 47,588 FO% 50,681 45,988 1,102 0,281-44, ,595 Tabell 13 Anpassat R 2 0,929 Intercept 70,858 6,334 11,186 < 0, ,861 83,855 GA/G 23,031 2,029 11,349 < 0, ,867 27,195 SC 1% 26,446 10,409 2,541 0,017 5,089 47,802 Tabell 14 Anpassat R 2 0,933 9

10 05/06: Intercept -11,369 40,112-0,283 0,779-94,156 71,419 GA/G 22,429 3,968 5,653 < 0, ,239 30,618 PP% -33,049 72,440-0,456 0, , ,460 SA/G -0,272 0,513-0,530 0,601-1,330 0,787 SC 1% 36,619 17,212 2,128 0,044 1,095 72,144 FO% 169,002 67,248 2,513 0,019 30, ,795 Tabell 15 Anpassat R 2 0,879 GA/G 0,718 0,105 6,812 < 0,0001 0,501 0,935 SC 1% 0,216 0,102 2,112 0,044 0,006 0,426 FO% 0,173 0,066 2,596 0,015 0,036 0,309 Tabell 16 Anpassat R 2 0,887 06/07: Intercept 65,029 32,747 1,986 0,059-2, ,616 GA/G 22,313 3,140 7,106 < 0, ,832 28,793 PP% 4,775 48,326 0,099 0,922-94, ,514 SA/G -0,025 0,355-0,070 0,945-0,757 0,707 SC 1% 38,315 19,103 2,006 0,056-1,111 77,741 FO% -0,513 61,522-0,008 0, , ,462 Tabell 17 10

11 Anpassat R 2 0,889 Intercept 65,560 11,456 5,723 < 0, ,055 89,065 GA/G 22,356 2,762 8,094 < 0, ,689 28,023 SC 1% 38,392 16,998 2,259 0,032 3,514 73,270 Tabell 18 Anpassat R 2 0,901 07/08: Intercept 47,539 32,096 1,481 0,152-18, ,783 GA/G 24,666 3,697 6,672 < 0, ,036 32,297 PP% -14,919 42,781-0,349 0, ,215 73,378 SA/G -0,237 0,291-0,813 0,424-0,837 0,364 SC 1% 31,364 12,104 2,591 0,016 6,383 56,344 FO% 48,667 52,887 0,920 0,367-60, ,821 Tabell 19 Anpassat R 2 0,852 Intercept 69,329 7,922 8,751 < 0, ,074 85,584 GA/G 22,892 2,562 8,937 < 0, ,636 28,148 SC 1% 31,237 11,348 2,753 0,010 7,953 54,521 Tabell 20 Anpassat R 2 0,862 11

12 08/09: Intercept 78,291 19,310 4,054 0,000 38, ,145 GA/G 26,175 2,325 11,260 < 0, ,378 30,973 PP% -32,311 24,276-1,331 0,196-82,415 17,792 SA/G 0,732 0,264 2,775 0,011 0,187 1,276 SC 1% 9,682 11,686 0,829 0,416-14,436 33,800 FO% 25,479 37,169 0,685 0,500-51, ,193 Tabell 21 Anpassat R 2 0,941 Intercept 91,429 0, ,265 < 0, ,181 92,678 GA/G 26,252 1,586 16,551 < 0, ,998 29,507 SA/G 0,859 0,212 4,049 0,000 0,424 1,294 Tabell 22 Anpassat R 2 0,942 09/10: Intercept 69,962 21,858 3,201 0,004 24, ,074 GA/G 25,636 2,797 9,166 < 0, ,864 31,409 PP% -38,461 35,748-1,076 0, ,242 35,319 SA/G 0,120 0,302 0,398 0,694-0,504 0,744 SC 1% 28,828 9,765 2,952 0,007 8,673 48,982 FO% 19,443 42,313 0,460 0,650-67, ,773 Tabell 23 Anpassat R 2 0,916 12

13 Intercept 71,078 6,334 11,222 < 0, ,082 84,074 GA/G 25,012 2,004 12,479 < 0, ,899 29,124 SC 1% 31,210 9,367 3,332 0,003 11,990 50,429 Tabell 24 Anpassat R 2 0,919 10/11: Intercept 55,632 22,136 2,513 0,019 9, ,319 GA/G 21,480 3,570 6,017 < 0, ,113 28,847 PP% 33,635 33,960 0,990 0,332-36, ,725 SA/G 0,455 0,471 0,966 0,344-0,517 1,427 SC 1% 31,244 16,464 1,898 0,070-2,736 65,224 FO% 17,481 43,556 0,401 0,692-72, ,377 Tabell 25 Anpassat R 2 0,869 Intercept 74,353 9,737 7,636 < 0, ,373 94,332 GA/G 25,114 2,567 9,785 < 0, ,847 30,380 SC 1% 25,525 14,129 1,807 0,082-3,466 54,516 Tabell 26 Anpassat R 2 0,869 13

14 11/12: Intercept 91,794 29,875 3,073 0,005 30, ,452 GA/G 18,622 4,397 4,235 0,000 9,546 27,697 PP% 2,186 45,203 0,048 0,962-91,109 95,480 SA/G -0,013 0,439-0,030 0,976-0,920 0,893 Sc 1% 40,027 16,545 2,419 0,023 5,879 74,174 FO% -54,200 55,836-0,971 0, ,439 61,039 Tabell 27 Anpassat R 2 0,822 Intercept 66,484 10,635 6,251 < 0, ,662 88,306 GA/G 18,138 3,675 4,935 < 0, ,597 25,679 Sc 1% 37,939 15,750 2,409 0,023 5,622 70,256 Tabell 28 Anpassat R 2 0,835 12/13: Intercept 53,311 21,133 2,523 0,019 9,695 96,927 GA/G 16,255 1,924 8,448 < 0, ,284 20,226 PP% -1,476 23,676-0,062 0,951-50,340 47,389 SA/G 0,172 0,326 0,529 0,602-0,500 0,844 SC 1% 15,106 12,797 1,180 0,249-11,306 41,517 FO% -20,373 36,193-0,563 0,579-95,070 54,325 Tabell 29 Anpassat R 2 0,842 14

15 Intercept 40,420 6,460 6,257 < 0, ,166 53,674 GA/G 16,028 1,733 9,246 < 0, ,471 19,584 SC 1% 18,595 9,201 2,021 0,053-0,283 37,473 Tabell 30 Anpassat R 2 0,857 Total optimeringsstatistik utföll enligt följande: Optimeringsdiagram 14 antal optimeringsbortfall GA/G PP% SA/G SC 1% FO% Diagram 1 Diskussion: Fel och upplägg: När analysen konstruerades var det viktigt att undvika multikollinjäritet. Multikollinjäritet innebär att flera variabler i analysen är en linjär kombination av varandra. Till exempel att ett gjort mål för ett lag per definition innebär ett insläppt mål för ett annat och således linjärt beroende av varandra. Detta gjorde att den valda datan för mål och skott konstruerades till mål och skottskillnad per spelad match. Det kan däremot finnas en viss endogenisk risk i mätningsupplägget kring målskillnaden. Detta då definitionen av en vunnen match är att göra fler mål än motståndaren kommer lag som vinner fler matcher än de förlorar att troligtvis göra fler mål. Det är däremot inte självklart då man tillexempel kan förlora en match med många mål och sedan vinna flera matcher med bara ett måls marginal och 15

16 det var vad jag ville undersöka om det fanns sådana tendenser. Det får dock till följd att en viss endogenisk komplikation kan uppstå vid studerandet av resultaten. Den anpassade R 2 -statistiken var för de flesta säsonger hög nog för att kunna fastslå att beskrivningsmodellen var bra anpassad. Det innebär att slutsatserna som dras av denna studie kan anses legitima och relevanta. Analys av resultaten: Resultaten gav mycket entydigt att varje säsong var målskillnaden en statistiskt signifikant variabel att beakta om ett lag ska komma högt upp i tabellen. P-värderna varierade mellan säsongerna men höll sig ändå väldigt lågt i förhållande till de övriga koefficienterna. Effektiviteten i power play var statistiskt signifikant i en säsong(se diagram 1). När studier över de 15 tabellerna görs finns det ingen talande trend över tid utan effektiviteten i powerplay är i 14 säsonger av 15 inte statistiskt signifikant och således kan det med en relativt stor signifikans sägas att power play inte är något som en statistiskt vanlig säsong spelar en signifikant roll för vilken slutpoäng ett lag får. Skottskillnaden i en match har i 14 av de 15 studerade säsongerna inte varit statistiskt signifikant nog för att påverka slutpoängen i tabellen. Alltså kan samma resultat som för power play skönjas där det med en stor sannolikhet kan sägas att det inte är statistiskt signifikant för ett NHL-lag att deras skottstatistik påverkar slutpoängen. Statistiken kring ett lags procentuella vinstchans vid det första gjorda målet i matchen var statistiskt signifikant i 9 av de 15 säsongerna. Över tid kunde inte generella mönster skönjas. Det innebär att statistiken kring vilket lag som gör det första målet och därefter vinner inte kan nonchaleras utan bör tas i beaktande trotts att det inte har en statistiskt säker påverkan varje säsong. Vinstprocenten i tekningar var bara statistiskt signifikant i en säsong av 15. Det innebär att samma slutsats kan dras som för power play och skottstatistiken att de inte spelar en signifikant roll för hur många poäng ett NHL-lag kommer att ta under en säsong. Det innebär att denna rapport motsäger (Schuckers, Pascuali och Curro, 2012) där de kunde påvisa en, dock litet, samband mellan vinstprocent i tekningar och tagna poäng. Denna motsägelse är logisk då studierna skiljer sig i den meningen att deras resultat visar på en hypotetisk höjning av tekningsvinstprocenten med tio procentenheter och extrapolerar ut det till fyra fler tagna poäng över en säsong. Detta resultat är något komplicerat då deras studier består av flera antaganden, bland annat en variabel baserad på målgörandestatistik från vunnen tekning inom 20 sekunder. Denna variabel är problematisk då studien inte kompenserar för insläppta mål med samma villkor och således är studien dömd att ge ett positivt utfall för alla lag. Därmed kan det fastslås att denna regressionsanalys av NHL-statistik inte motsäger (Schuckers, Pascuali och Curro, 2012) och att tekningsvinstprocenten inte är en statistiskt signifikant statistik för ett NHL-lags tagna poäng över en säsong. 16

17 Slutsatser: Den främsta slutsatsen som kan göras från denna studie är att målskillnad är viktigt och något värt att lägga extra kraft på för att ta mera poäng över en säsong. Dessutom kan slutsatsen att göra första målet anses som statistiskt relevant då 6 säsonger av 15 visade på att det inte spelade någon statistisk roll. Det som däremot är intressant är att varken power play, skottskillnad eller vunna tekningar spelar någon statistisk säker roll för en hockeymatch i NHL. Vissa säsonger har det gjort det men eftersom det endast är en säsong av femton för samtliga för de säsongerna betraktas som anomalier. Slutsatsen att varken power play, skottskillnad eller tekningsvinstprocent spelar någon statistiskt signifikant roll för ett NHL-lag är uppseendeväckande då de flesta hockeyspelare och tränare nog skulle anse det som viktigt att ha ett bra powerplay, att skjuta fler skott än motståndaren och att vinna fler tekningar än de förlorar. Det innebär istället att ett NHL-lag ska fokusera på att göra fler mål än de släpper in över säsongen. Alltså kan det antas att varje mål räknas även om en match kan anses avgjord. Dessutom är det viktigt att satsa på att göra första målet. Det innebär att något som lagen bör fokusera på i en statistisk mening är att vara fullt fokuserade från start och inte släppa in första målet oftare än då laget gör första målet. Dessa slutsatser får nog anses vara relativt legitima över tid då inga klara förändringar över tid har kunnat upptäckas under studiens femton år långa tidsspann. Det innebär att denna studie och dess slutsatser kan anses legitima för i alla fall ett antal säsonger framöver. Referenser: 1. An Analysis of NHL Faceoffs Michael Schuckers, Tom Pasquali and Jim Curro St. Lawrence University and Statistical Sports Consulting, LLC Topics on Applied Mathematical Statistics av Harald Land Nov.2013, version

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Analys av betygsstatistik från KTH

Analys av betygsstatistik från KTH Martin Möllberg mollberg@kth.se Alexei Zaitsev alexeiz@kth.se SA104X Examensarbete i teknisk fysik, grundnivå Avdelningen för matematisk statistik 17 maj 2011 Författarnas tack Vi vill särskilt tacka två

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, 8-5-4 EXEMPEL: Hur mycket kunder förlorar vi om vi höjer biljettpriset?

Läs mer

Tisdagen den 16 januari 2007 9-14

Tisdagen den 16 januari 2007 9-14 STOCKHOLMS UNIVERSITET TENTAMEN MATEMATISKA INSTITUTIONEN Statistik för naturvetare Avd. Matematisk statistik Tisdagen den 16 januari 2007 Tentamen för kursen Statistik för naturvetare Tisdagen den 16

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Taktik/spelanalys. Snabba uppspel i Svenska Basketligan. Juan Alonso

Taktik/spelanalys. Snabba uppspel i Svenska Basketligan. Juan Alonso Taktik/spelanalys Snabba uppspel i Svenska Basketligan Juan Alonso GYMNASTIK- OCH IDROTTSHÖGSKOLAN Träningslära II, Ht-09 Handledare: Mårten Fredriksson Innehållsförteckning 1 Taktik/spelanalys... 3 1.1

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp UMEÅ UNIVERSITET Tentamen 2016-08-24 Sid 1 TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp Skrivtid: 16-22 Tillåtna hjälpmedel: Miniräknare. Formelblad och tabeller bifogas till tentamen. Studenterna

Läs mer

oberoende av varandra så observationerna är

oberoende av varandra så observationerna är Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n

Läs mer

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24 1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Hur de bästa PP lagen i SHL 13/14 gjorde sina PP mål

Hur de bästa PP lagen i SHL 13/14 gjorde sina PP mål Svenska Ishockeyförbundet Elitkurs Hur de bästa PP lagen i SHL 13/14 gjorde sina PP mål Jan-Axel Alavaara Handledare: Göran Lindblom 2014-05-20 Sammanfattning Syftet med denna studie var att se hur och

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Fråga nr a b c d 2 D

Fråga nr a b c d 2 D Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare och enkäter "Det finns inget så praktiskt som en bra teori" September 2011 och enkäter Inledning Inledning Om vi vill mäta en egenskap hos en population individer (individer kan vara personer, företag

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, 5p. Tid: Lördag den 29 mars, 2008 kl 14.00-18.00 i V-huset. Examinator: Olle Nerman, tel 7723565. Jour: Alexandra Jauhiainen,

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-03-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-10-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: A. Jonsson, M. Shykula,

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 15, FMSF45 Multipel linjär regression Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n

Läs mer

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse

Läs mer

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p) UMEÅ UNIVERSITY Department of Mathematics and Mathematical Statistics Pre-exam in mathematics Linear algebra 2012-02-07 1. Compute the following matrix: (2 p 3 1 2 3 2 2 7 ( 4 3 5 2 2. Compute the determinant

Läs mer

Bilaga 6 till rapport 1 (5)

Bilaga 6 till rapport 1 (5) till rapport 1 (5) Bilddiagnostik vid misstänkt prostatacancer, rapport UTV2012/49 (2014). Värdet av att undvika en prostatabiopsitagning beskrivning av studien SBU har i samarbete med Centrum för utvärdering

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett

Läs mer

Laboration 4 R-versionen

Laboration 4 R-versionen Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

TVM-Matematik Adam Jonsson

TVM-Matematik Adam Jonsson TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet

Läs mer