Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Storlek: px
Starta visningen från sidan:

Download "Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1"

Transkript

1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad:

2 Motivering Vi motiverade enkel linjär regression som ett alternativ till Pearsons korrelation med att vi inte bara får styrkan i ett samband, utan det ger oss också möjlighet att för ett givet värde på x förutsäga y. Vi ska nu generalisera enkel linjär regression till multipel linjär regression.

3 Motivering, Ex1: Födelsevikt Låg födelsevikt har varit ett viktigt utfall att studera ur flera perspektiv (medicinskt, folkhälso, ekonomiskt). Låg födelsevikt är en stark prediktor för hög spädbarndsdödlighet, men är även associerat med senare utfall i livet som astma, låg IQ och högt blodtryck. 1 Förutom genetiska faktorer så påverkar en kvinnas vanor under gravidetet (diet, rökvanor, kontakt med vården osv) sannolikheten för fullgången graviditet (dvs även chansen för att föda ett barn med normal födelsevikt). För att studera oberoende variabler som kan tänkas vara associerade med födelsevikt ser vi på data som insamlat från 189 kvinnor och barn från Baystate Medical Center, Springfield, Massachusetts, Wilcox, A. J. (2001). On the importance and the unimportance of birthweight. International journal of epidemiology, 30(6), Hosmer, D.W., Lemeshow, S. and Sturdivant, R.X. (2013) Applied Logistic Regression: Third Edition.

4 Exempel 1: Data, n=189 Id-kod ID Låg födelsevikt (0 om 2500g, 1 om < 2500g) LOW Mammans ålder i år AGE Vikt i kg under senaste menstruation LWT Socio-ekonomisk status (Låg = 1, Mellan = 2, Hög = 3) SES Röker under gravididet (1 = Ja, 0 = Nej) SMOKE Antal tidigare för tidigt födda barn (0 = None 1 = One, etc.) PTL Högt blodtryck (1 = Ja, 0 = Nej) HT Sammandragning tidigt under gravidetet (1 = Ja, 0 = Nej) UI Antal läkarbesök under första trimestern FTV Födelsevikt i gram BWT

5 Ex1 En del av originaldatat och variabelnamn är ändrade pga pedagogiska skäl. Vi har således flera potentiella oberoende variabler som potentiellt förklarar utfallet.

6 Ex1 Anta att vi använder följande modell för att beskriva ett barns födelsevikt: y = β 0 + β 1 x 1 + ε där x 1 är mammans ålder och y är barnets vikt i gram vid födseln. Vi kan också skriva modellen som BWT = β 0 + β 1 AGE + ε

7 Motivering: Ex1 Minitab anger inte hat, men formellt ska det stå BWT = ,14AGE

8 Motivering: Ex1 Tolkning: Verkar finnas en liten positiv lutning på riktningskoefficienten, dvs ett positivt samband mellan ålder och födelsevikt som skulle tolkas som att ökar åldern ett år så ökar födelsevikten i genomsnitt med 11,1 gram. Ett t-test (p = 0,275) visar dock att vi inte kan förkasta nollhypotesen att riktningskoefficient i populationen är noll (H 0 : β 1 = 0). Vi kan inte påvisa ett linjärt samband mellan ålder och födelsevikt. Har interceptet någon vettig tolkning?

9 Motivering, Ex1 Mammans ålder verkade inte vara en bra förklarande variabel. Vi provar därför en annan konkurrerande modell med en alternativ förklarande variabel: y = β 0 + β 2 x 2 + ε där x 2 är mammans vikt i kg vid senaste menstruation och y är barnets vikt i gram vid födseln. Vi kan också skriva modellen som BWT = β 0 + β 2 LWT + ε

10 Motivering, Ex1

11 Motivering, Ex1 Tolkning: Verkar finnas en liten positiv lutning på riktningskoefficienten, dvs ett positivt samband mellan mammans vikt och födelsevikt som skulle tolkas som att ökar åldern ett år så ökar födelsevikten i genomsnitt med 9,7 gram. Ett t-test (p = 0,011) visar även att vi kan förkasta nollhypotesen att riktningskoefficient i populationen är noll (H 0 : β 1 = 0). Det verkar alltså som att det finns ett linjärt samband mellan mammans vikt och födelsevikt. Har interceptet någon vettig tolkning?

12 Motivering Om vi vill förklara ett barns födelsevikt är det inte säkert att vår teori stämmer och då måste fundera på alternativa teorier. Ofta består dessutom vår teori inte enbart av en förklarande variabel utan i regel vi vill ta med andra potentiellt viktiga oberoende variabler i modellen för att kunna göra precisare prediktion.

13 Multipel linjär regression Definition (1) En multipel linjär regressions kan beskrivas y = β 0 + β 1 x 1 + β 2 x β k x k + ε där y är den beroende variabeln, x 1,..., x k är oberoende variabler, ε är en slumpmässig felterm och E(y x 1,..., x k ) = E(y x) = β 0 +β 1 x 1 +β 2 x 2 + +β k x k är regressionsfunktionen i populationen, även kallat deterministisk del av modellen.

14 Regressionslinjen i populationen, k = 2 E(y x 1, x 2 ) = E(y x) = x 1 + 7x 2 Ge dig tid till att förstå figuren!

15 Tolkning av β 1 och β 2 Tolkningen av na är viktig! Enkel linjär regression E(y x) = β 0 + β 1 x 1 : En enhets ökning i x 1 leder i genomsnitt till β 1 enheters öknings i y. Multipel linjär regression E(y x) = β 0 + β 1 x 1 + β 1 x 2 : Den genomsnittliga förändringen av y om x 1 ökar en enhet och x 2 förblir oförändrad. På samma sätt, om x 2 ökar en enhet och x 1 är oförändrad förväntar vi oss en förändring av y med β 2 enheter. Vi ska exemplifiera detta senare!

16 Definition Estimatorer för β j Vi estimerar regressionslinjen i populationen: E(y x) = β 0 + β 1 x 1 + β 2 x β k x k med minsta-kvadratestimatorerna ŷ = ˆβ 0 + ˆβ 1 x ˆβ k x k Vi hittar ˆβ 0, ˆβ 1,..., ˆβ k genom att minimera residualkvadratsumman n n SSE = (y i ŷ i ) 2 = (y i ( ˆβ 0 + ˆβ 1 x 1,i + + ˆβ k x k,i )) 2 i=1 i=1 genom att derivera SSE med avseende på ˆβ 0, ˆβ 1,..., ˆβ k, sätta de k + 1 derivatorna till noll och sedan lösa ut ˆβ 0, ˆβ 1,..., ˆβ k.

17 Egenskaper för β j Motsvarande resonemang gäller vid multipel linjär regression som vid enkel linjär regression, dvs vi måste vi först fundera på modellens (i) linjäritet och hur feltermen ε beter sig, där vi förutsätter (ii) oberoende observationer och att (iii) att feltermen för varje värde på x 1, x 2,... x k har medelvärde noll, E(ε x) Om (i)-(iii) är uppfyllda Bias: E( ˆβ j ) = β j, dvs vvr! Det innebär att ŷ = ˆβ 0 + ˆβ 1 x ˆβ k x k i genomsnitt skattar E(y x) = β 0 + β 1 x 1 + β 2 x β k x k rätt. Formlerna för ˆβ j är något komplicerade vid multipel linjär regressin och vi låter programpaket räkna åt oss. Men principerna är desamma!

18 Egenskaper för β j Nästa som vi måste fundera på är feltermens varians V (ε x 1, x 2,..., x k ) Om feltermens varians är (iv) samma för alla värden på x 1, x 2,..., x k så är V (ε x 1, x 2..., x k ) = σ 2 ε Om antagande (iv) gäller så är E(s 2 ε ) = σ 2 ε. Precision: Om (iv) gäller så är V ( ˆβ j ) = σ 2ˆβj skattas med ˆV ( ˆβ j ) = s 2ˆβj. vilken Formlerna är något komplicerade och vi låter programpaket räkna åt oss. Beståndsdelarna är dock samma som vid enkel linjär regression, t ex V ( ˆβ j ) består av feltermens varians σ 2 ε multiplicerat med kvadratiska avvikelser och vid skattning byts σ 2 ε ut mot s 2 ε. Se App.B7.

19 Egenskaper för β j Antagande (v) är att feltermens fördelning är normalfördelad för alla värden på x 1, x 2,..., x k. Om (v) är uppfyllt så gäller följande: Fördelning: ˆβ j N(β j, V (β j )). Pga CGS är ˆβ j approximativt normalfördelad i stora stickprov även om ε inte är normalfördelad.

20 Hypotesprövning och KI för β j Om (i-(v) är uppfylld så är t = β j s ˆβ j t-fördelad med n (k + 1) frihetsgrader om H 0 är sann. Ett 100(1 α)% konfidensintervall för β j erhålls med ˆβ j ± t (n (k+1)),α/2 s ˆβj

21 Ex1: Inkluderande av två variabler Vi vill nu inte bara studera hur mammans ålder och vikt är assocerade med födelsevikt i separata modellen utan vi tittar nu på bägge variablerna i en och samma modell. Vi vill nu skatta β 0, β 1 och β 2 i modellen E(y x) = β 0 + β 1 x 1 + β 2 x 2 BWT = β 0 + β 1 AGE + β 2 LWT Vi inkluderar nu bägge variablerna och får följande resultat:

22 Ex1: Inkluderande av två variabler Tolkning: Givet oförändrad ålder, så leder en ökad vikt med 1 kg att barnets födelsevikt ökar med 9,3 gram i genomsnitt (p = 0,017). Åldersvariabeln är fortfarande icke-signifikant.

23 Vi kontrollerar om (i)-(v) är uppfyllda genom att studera residualerna! Tolkning? Gå igenom varje antagande! Ex1: Inkluderande av två variabler

24 Skattning av σ 2 ε Feltermen beskriver oförklarad variation i modellen. Då feltermens varians σ 2 ε är okänd skattas den. Om (iv) är uppfyllt är V (ε) = σ 2 ε. Definition (3) Låt SSE = n i=1 (y i ŷ i ) 2 och k vara antalet variabler i regressionsmodellen. Om (i)-(iv) är uppfyllt skattas σε 2 väntevärdesriktigt med sε 2 SSE = MSE = n (k + 1) Notera: vi kan alltid räkna ut residualvariansen s 2. Det ger ett deskriptivt mått på spridningen i stickprovet. Dock skattar den inte σ 2 ε om inte (i-iv) gäller!

25 Skattning av σ 2 ε s 2 kallas i många outputs för mean square for error (MSE). Notera att (k + 1) är antalet parameterar i modellen, dvs intercept plus k riktningskoefficienter. Frihetsgrader försvinner för varje parameter som skattas. Jmf med stickprovsvariansen s 2 = (xi x) 2 n 1 där vi har skattat en parameter, µ, innan s 2 kan beräknas. På samma sätt som tidigare är s 2 ε = MSE = s ε regressionsmodellens medelfel.

26 Ex1: Skattning av σ 2 ε

27 Ex1: Från s ε till t-värde och konfidensintervall

28 Testa nyttan av modellen: Globalt test Nackdelen med t-testen för β j är upprepad testning om vi har många variabler. Anta att vi har 10 stycken obseroende variabler och individuellt testar varje parameter H 0 : β 1 =, H 0 : β 2 = 0,...,H 0 : β 10 = 0. Anta dessutom att alla nollhypoteser är sanna, dvs i verkligheten har ingen av variablerna ett linjär samband med y. Om vi testar på 5%-nivån kommer vi nu i 40% av fallen konstatera att minst en β j är skild från noll! Vi vill därför kunna göra ett globalt test för att testa H 0 : β 1 = β 2 = = β k = 0 mot H 1 : Minst en β j 0

29 F - modellens nytta Definition (2) Vi har en modell y = β 0 + β 1 x 1 + β 2 x β k x k och (i)-(v) är uppfyllda. För att testa H 0 : β 1 = β 2 = = β k = 0 mot används F = H 1 : Minst en β j 0 (SS yy SSE)/k SSE/(n (k + 1)) = MS(Model) MSE som följer fördelningen F k,(n (k+1)) om H 0 är sann. Vi förkastar H 0 om F obs > F k,(n (k+1)),α

30 Ex1: Test av modellen Kontrollräkna!

31 Ex1: Formellt F - hela modellen Mål: Bidrar ålder och/eller mammors vikt till att förklara utfallet utöver mammors vikt. Hypoteser: H 0 : β LWT = β AGE = 0. H 1 : Minst en av β LWT och β AGE är skild från noll. Förutsättningar: (i)-(v)! Testfunktion: F = (SS yy SSE)/k SSE/(n (k + 1)) som är F k,(n (k+1)) -fördelad om H 0 är sann. Beslutsregel: Vi testar på 5% signifikansnivå, dvs α = 0,05. Förkasta om F obs > F k,(n (k+1)),α = F 2,(189 (2+1)),0,05 = F krit = 3,045

32 Ex1: Test av modellen

33 F -test Beräkning: Insättning av värden från uppgiften ( )/2 ger F obs = = 3, /(189 (2 + 1)) Beslut: Eftersom F obs = 3, 50 > 3,045 = F krit förkastar vi nollhypotesen. Svar: Vi kan påvisa att minst en av modellens koefficienter är skild från noll. verkar vara statistiskt användbar för att förutsäga födelsevikt. Notera att statistiskt användbar inte innebär praktiskt användbar.

34 F - modellens nytta MS(Model) är förklarad variation i y medan MSE är den oförklarade variationen. Ju större förklarad variation, relativt oförklarad, desto större värde har modellen. F -värdet ökar! Total variation = Förklarad variation + Oförklarad variation SS yy = SS(Model) + SSE

35 F - modellens nytta Notera att en statistiskt användbar modell inte innebär praktiskt användbar eller att det inte finns modeller som är bättre. F -testet av hela modellen visar att vi har en användbar modell som förklarar mer än ingenting. Ofta betraktat som ett första krav innan vi går vidare med analysen. F -testet ska först visa att någon av β j 0. Sen går vi vidare och gör individuella t-test för de som vi främst är intresserade av.

36 F -test för jämförelse av nestade modeller Vad vi har gjort med F -testet är att vi jämför nestade modeller. Det innebär att alla i den reducerade modellen finns med i den fulla modellen. Om vi testar H 0 : β 1 = β 2 = 0 så innebär det att vi jämför modellerna Reducerad modell: E(y x) = β 0 Full modell: E(y x) = β 0 + β 1 x 1 + β 2 x 2 Om vi förkastar H 0 så konstaterar vi att minst en av na i den fulla modellen är skilda från noll och modellen är därför användbar.

37 F -test för jämförelse av nestade modeller Anta nu att vi vill jämföra modellerna Reducerad modell: E(y x) = β 0 + β 1 x 1 Full modell: E(y x) = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 I den reducerade modellen har vi en oberoende variabel x 1 och i den fulla modellen har vi den oberoende variabeln x 1 och två ytterligare oberoende variabler x 2 och x 3. Målet är att se om den fulla modellen är mer användbar än den första. Vi testar därför H 0 : β 2 = β 3 = 0 med hjälp av ett F -test. Förkastas H 0 konstateras att minst en β 2 och β 3 är skild från noll.

38 F - modellens nytta Definition (3, forts.) Vi har en reducerad modell med g variabler: E(y x) = β 0 + β 1 x β k x g och full modell med k variabler: E(y x) = β 0 +β 1 x 1 + +β k x g +β g+1 x g+1 + +β k x k Vi testar H 0 : β g+1 = = β k = 0 mot H 1 : minst av de testade na är skild från 0.

39 F - modellens nytta Definition (3, forts.) Testfunktionen som används är F = (SSE R SSE C )/(k g) SSE C /(n (k + 1)) = (SSE R SSE C )/(k g) MSE C där SSE R för den reducerade modellen och SSE C för den fulla modellen. Testfunktionen har fördelningen F (k g),(n (k+1)) om H 0 är sann. Vi förkastar H 0 om F o bs > F (k g),(n (k+1)),α

40 Ex1: Test av nestad modell En tänkbar modell för födelsevikt: BWT = β 0 + β 1 LWT

41 Ex1: Test av modell med 2 variabler utöver vikt Mammans vikt är visserligen signifikant (p = 0, 011), men förklaringsgraden R 2 = 3, 41% är låg. Det finns mycket oförklarad variation. Vi provar därför en ny modell där vi utöver mammans vikt inkluderar mammans ålder och antal läkarbesök under den första trimester (första tredjedelen av gravidideten), FTV. Den fulla modellen är nu: BWT = β 0 + β 1 LWT + β 2 AGE + β 3 FTV

42 Ex1: Test av modell med 2 variabler utöver vikt

43 Ex1: Test av modell med 2 variabler utöver vikt Testet finns inte implementerat i Minitab, så ni måste göra det för hand!

44 Formellt F -test Mål: Bidrar ålder och/eller antal läkarbesök till att utöver mammors vikt förklara födelsevikt? Hypoteser: H 0 : β AGE = β FTV = 0 H 1 : Minst en av β AGE och β FTV är skild från noll. Förutsättningar: Se (i)-(v). Vi kontrollerar för varje modell.

45 Ex1: Test av modell med 2 variabler utöver vikt

46 Formellt F -test Testfunktion: F = (SSE R SSE C )/(k g) SSE C /(n (k + 1)) som är F (k g),(n (k+1)) -fördelad om H 0 är sann. Beslutsregel: Vi testar på 5% signifikansnivå, dvs α = 0,05. Förkasta om F obs > F (k g),(n (k+1)),α = F (3 1),(189 (3+1)),0,05 = F krit = 3,045

47 Formellt F -test Mål: Bidrar ålder och/eller antal besök till att förklara utfallet utöver mammors vikt. Hypoteser: H 0 : β AGE = β FTV = 0. H 1 : Minst en av β AGE och β FTV är skild från noll. Förutsättningar: Se 1-5! Testfunktion: F = (SSE R SSE C )/(k g) SSE C /(n (k + 1)) som är F (k g),(n (k+1)) -fördelad om H 0 är sann. Beslutsregel: Vi testar på 5% signifikansnivå, dvs α = 0,05. Förkasta om F obs > F (k g),(n (k+1)),α = F (3 1),(189 (3+1)),0,05 = F krit = 3,045

48 Formellt F -test

49 Formellt F -test Beräkning: Insättning av värden från uppgiften ger ( )/(3 1) F obs = = 0, /(189 (3 + 1)) Beslut: Eftersom F obs = 0,265 < 3,045 = F krit förkastar vi inte nollhypotesen. Svar: Vi kan inte påvisa att ålder och antal besök förbättrar modellens förmåga att förklara födelsevikt jämfört med den reducerade modellen.

50 Formellt F -test: p-värde p-värdet är 0,7675

51 Jämförelse av modeller med eller utan nestning Kan vi inte använda förklaringsgraden, R 2, för att jämföra modeller? I modellen var R 2 = 0,6% och i BWT = β 0 + β 1 AGE BWT = β 0 + β 1 LWT var R 2 = 3,41% Det vore naturligt att välja den modell som förklarar mest i utfallet. Dessutom, i denna situation kan inte F -testet användas eftersom modellerna inte är nestade.

52 Egenskap hos R 2 R 2 har dock (bl a) en nackdel. Den ökar alltid när vi adderar oberoende variabler till modellen! Oavsett om variabler de facto förklarar utfallet eller inte. Exempelvis om vi i Ex1 antar följande modell BWT = β 0 + β 1 LWT + 0 x 2 där x 2 är värden från en tärning som jag (eller Minitab...) har slagit 189 gånger. Värdena blev: 1 30ggr, 2 33ggr, 3 30ggr, 4 29ggr, 5 30ggr, 6 37ggr. Detta förklarar naturligtvis inte BWT alls. Trots detta blir R 2 = 3, 48% i skattningen av modellen ovan, vilket är högre än modellen utan x 2.

53 Definition (4) Justerad förklaringsgrad Den justerade förklaringsgraden Ra 2 är [ ] Ra 2 n 1 = 1 (1 R 2 ) n (k + 1) där R 2 är förklaringsgraden. R 2 a R 2 n ska vara samma i modellerna som jämförs. Modellerna kan vara nestade eller icke-nestade, men med (naturligtvis) samma y R 2 a kan vara negativ.

54 Justerad förklaringsgrad Jämför R 2 och R 2 a i den fulla och reducerade modellen ovan i BWT = β 0 + β 1 LWT med R 2 = 3,41% och R 2 a = 2,9 mot BWT = β 0 + β 1 LWT + β 2 AGE + β 3 FTV med R 2 = 3,68% och R 2 a = 2,1 När vi jämför modeller med olika antal variabler använder vi R 2 a. När vi rapporterar resultat väljs R 2. R 2 a har nämligen ingen riktig tolkning.

55 Estimation av µ y x=xp i multipel linjär regression Målet är att skatta ett medelvärdet i en viss del av populationen, dvs medelvärdet för y för givna värden på x 1, x 2,..., x k. Analogt med tidigare vi hade k = 1 används nu estimatorn Ê(y x 1 = x 1p, x 2 = x 2p,..., x k = x kp ) = ŷ Samma antaganden gäller för ŷ som för ˆβ j. Den skattade variansen ˆV (ŷ) är komplicerad och vi låter programpaket beräkna ut den åt oss.

56 Ex1: Estimation av µ y x=xp

57 Ex1: Estimation av µ y x=xp Tolkningen av 3067 är det är den skattade medelvikten i gram för nyfödda vars mammor väger 76 kg och är 30 år gamla. Dessutom, med 95% säkerhet kan vi säga att medelvikten för nyfödda med mammor som väger 76 kg och är 30 år gamla ligger mellan 2928 till 3206 gram.

58 Prediktion av enskilda okända observationer Målet är att skatta vilket värde en individ i populationen har för givna värden på x 1, x 2,..., x k. Analogt med tidigare när k = 1 används nu estimatorn Ê(y x 1 = x 1p, x 2 = x 2p,..., x k = x kp ) = ŷ Samma antaganden gäller för ŷ som för ˆβ j. Den skattade variansen för prediktionen är ˆV (ŷ) + s 2 ε. Den är komplicerad och vi låter programpaket beräkna denna åt oss. Kom ihåg skillnaden i inferens jämfört med när vi skattar parametern µ y x.

59 Ex1: Prediktion av okänd observation ŷ i för givna värden på x

60 Ex1: Estimation av µ y x=xp Den predikterade födelsevikten för ett barn vars mamma väger 76 kg och är 30 år gammal är 3067 gram Dessutom, med 95% säkerhet kan vi säga att vikten för en nyfödd med en mamma som väger 76 kg och är 30 år gammal ligger mellan 1641 till 4493 gram. Brett intervall!

61 Läsanvisningar MS: , 4.13

62 Övningsuppgifter MS: 4.1, 4.3, 4.5, 4.7, 4.9, 4.11, 4.13, 4.15, 4.17, 4.19, 4.21, 4.63, 4.67 a)-f)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl. 09.00-13.00

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl. 09.00-13.00 Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 4 januari 004, kl. 09.00-13.00 Tillåtna hjälpmedel: Ansvarig lärare:

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2011-10-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Lennart

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:.. TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Resultatet läggs in i ladok senast 13 juni 2014.

Resultatet läggs in i ladok senast 13 juni 2014. Matematisk statistik Tentamen: 214 6 2 kl 14 19 FMS 35 Matematisk statistik AK för M, 7.5 hp Till Del A skall endast svar lämnas. Samtliga svar skall skrivas på ett och samma papper. Övriga uppgifter fordrar

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen 1. One-Sample T-Test 1.1 När? Denna analys kan utföras om man vill ta reda på om en populations medelvärde på en viss variabel kan antas

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) Aktuella avsnitt i boken är Kapitel 7. Lektionens mål: Du

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler UPPSALA UNIVESITET Matematiska institutionen Jesper ydén Matematisk statistik 1MS026 vt 2014 DATOÖVNING MED : EGESSION I den här datorövningen studeras följande moment: Enkel linjär regression: skattning,

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Hjälpmedel:'Valfri'räknare,'egenhändigt'handskriven'formelsamling'(4''A4Esidor'på'2'blad)' och'till'skrivningen'medhörande'tabeller.''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

Läs mer

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade) 5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

Datorlaboration 2 Konfidensintervall & hypotesprövning

Datorlaboration 2 Konfidensintervall & hypotesprövning Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1902 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 23:E MAJ 2013 KL 14.00 19.00. Kursledare och examinator : Björn-Olof Skytt Tillåtna hjälpmedel: miniräknare, lathund

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15 Tentamen i Statistik, STA A och STA A13 (9 poäng) Onsdag 1 november 00, Kl 0.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 Laboration 5: Regressionsanalys Syftet med den här laborationen är att du skall

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

F14 Repetition. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 6/3 2013 1/15

F14 Repetition. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 6/3 2013 1/15 1/15 F14 Repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 6/3 2013 2/15 Dagens föreläsning Tentamensinformation Exempel på tentaproblem På kurshemsidan finns sex gamla

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2012-01-13 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan 8.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan 8.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A och STA A3 (9 poäng) 3 februari 4, klockan 85-35 Tillåtna hjälpmedel: Bifogad formelsamling

Läs mer

Föreläsning 7 och 8: Regressionsanalys

Föreläsning 7 och 8: Regressionsanalys Föreläsning 7 och 8: Pär Nyman par.nyman@statsvet.uu.se 12 september 2014-1 - Vårt viktigaste verktyg för kvantitativa studier. Kan användas till det mesta, men svarar oftast på frågor om kausala samband.

Läs mer

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet 732G71 Statistik B Föreläsning 2 Bertil Wegmann IDA, Linköpings universitet November 13, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 13, 2015 1 / 26 Kap. 4.1-4.5, multipel linjär regressionsanalys

Läs mer

Statistik Lars Valter

Statistik Lars Valter Lars Valter LARC (Linköping Academic Research Centre) Enheten för hälsoanalys, Centrum för hälso- och vårdutveckling Statistics, the most important science in the whole world: for upon it depends the applications

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant? LÖSNINGAR till tentamen: Statistik och sannolikhetslära (LMA12) Tid och plats: 8.3-12.3 den 24 augusti 215 Hjälpmedel: Typgodkänd miniräknare, formelblad Betygsgränser: 3: 12 poäng, 4: 18 poäng, 5: 24

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Statistiska analyser C2 Inferensstatistik. Wieland Wermke + Statistiska analyser C2 Inferensstatistik Wieland Wermke + Signifikans och Normalfördelning + Problemet med generaliseringen: inferensstatistik n Om vi vill veta ngt. om en population, då kan vi ju fråga

Läs mer

Hypotestestning och repetition

Hypotestestning och repetition Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att

Läs mer

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2. Tentamenskrivning för TMS63, Matematisk Statistik. Onsdag fm den 3 juni, 15, V-huset. Examinator: Marina Axelson-Fisk. Tel: 7-88113 Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

ANOVA Mellangruppsdesign

ANOVA Mellangruppsdesign ANOVA Mellangruppsdesign Envägs variansanlays, mellangruppsdesign Variabler En oberoende variabel ( envägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier,

Läs mer

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15 Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15 Tillåtna hjälpmedel: Ansvarig lärare: Räknedosa, bifogade formel- och tabellsamlingar, vilka skall returneras. Christian Tallberg Telnr:

Läs mer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Thommy erlinger Innehåll 1 Beskrivande statistik 3 1.1 Medelvärdeochstandardavvikelse... 3 1.2 Chebyshevsregel... 3 1.3 Empiriskaregeln(normalfördelningsregeln)...

Läs mer

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14 KA RKUNSKAP Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc Vad vet samhällsvetarna om sin kår? STAA31 HT14 Handledare: Peter Gustafsson Ekonomihögskolan, Statistiska institutionen Innehållsförteckning

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

5 Kontinuerliga stokastiska variabler

5 Kontinuerliga stokastiska variabler 5 Kontinuerliga stokastiska variabler Ex: X är livslängden av en glödlampa. Utfallsrummet är S = x : x 0}. X kan anta överuppräkneligt oändligt många olika värden. X är en kontinuerlig stokastisk variabel.

Läs mer

Lektion 1: Fördelningar och deskriptiv analys

Lektion 1: Fördelningar och deskriptiv analys Density Lektion 1: Fördelningar och deskriptiv analys 1.,3 Uniform; Lower=1; Upper=6,3,2,2,1,, 1 2 3 X 4 6 7 Figuren ovan visar täthetsfunktionen för en likformig fördelning. Kurvan antar värdet.2 över

Läs mer

Summor av slumpvariabler

Summor av slumpvariabler 1/22 Summor av slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 8/2 2013 2/22 Dagens föreläsning Väntevärde och varians Vanliga kontinuerliga fördelningar Parkeringsplatsproblemet

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p) Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 74 16. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 4 Syfte: 1. Lära sig beräkna konfidensintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera

Läs mer

Statistisk undersökningsmetodik (Pol. kand.)

Statistisk undersökningsmetodik (Pol. kand.) TENTAMEN Tentamensdatum 2008-10-02 Statistisk undersökningsmetodik (Pol. kand.) Namn:.. Personnr:.. Tentakod: Obs! Var noga med att skriva din tentakod på varje lösningsblad som du lämnar in. Skrivtid

Läs mer

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Laboration 5 Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Deluppgift 1: Enkel linjär regression Övning Under denna uppgift ska enkel

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 20 mars 2015 9 14 Examinator: Anders Björkström, bjorks@math.su.se Återlämning: Fredag 27/3 kl 12.00, Hus 5,

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Statistik 1 för biologer, logopeder och psykologer Paul Blomstedt Innehåll 1 Inledning 2 2 Deskriptiv statistik 2 2.1 Variabler och datamaterial...................... 2 2.2 Tabulering och grask beskrivning.................

Läs mer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Rapporten till den här laborationen skall lämnas in senast den 19e December 2014.

Läs mer

Tenta i Statistisk analys, 15 december 2004

Tenta i Statistisk analys, 15 december 2004 STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Uppgift 1. Deskripitiv statistik. Lön

Uppgift 1. Deskripitiv statistik. Lön Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Ytterligare urvalsmetoder och skattningsmetoder

Ytterligare urvalsmetoder och skattningsmetoder F6 Ytterligare urvalsmetoder och skattningsmetoder Flerstegsurval Anta att man vill göra ett urval som täcker ett stort geografiskt område vill använda besöksintervju som insamlingsmetod Praktiskt omöjligt

Läs mer

MSG830 Statistisk analys och experimentplanering - Lösningar

MSG830 Statistisk analys och experimentplanering - Lösningar MSG830 Statistisk analys och experimentplanering - Lösningar Tentamen 15 Januari 2015, 8:30-12:30 Examinator: Staan Nilsson, telefon 073 5599 736, kommer till tentamenslokalen 9:30 och 11:30 Tillåtna hjälpmedel:

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Lösningar till Tentafrågor

Lösningar till Tentafrågor Lösningar till Tentafrågor 1. I en stor studie skattade man nedre och övre kvartilen till 100 resp 140. Hur många kan man därmed anse har värden över 140? Övre kvartilen år 75% percentil, vilket betyder

Läs mer

Statistisk försöksplanering

Statistisk försöksplanering Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 2 November Tid: 09:00-13 Hjälpmedel: Miniräknare

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

Facit till Extra övningsuppgifter

Facit till Extra övningsuppgifter LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Facit till Extra övningsuppgifter 1. Modellen är en

Läs mer

Tidsserier och Prognoser

Tidsserier och Prognoser Tidsserier och Prognoser Mattias Villani Sveriges Riksbank och Stockholms Universitet Stockholm, Oktober 2008 Mattias Villani () Tidsserier och Prognoser Stockholm, Oktober 2008 1 / 16 Översikt Tidsserier,

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng

Läs mer