Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Storlek: px
Starta visningen från sidan:

Download "Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2"

Transkript

1 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad:

2 Faktum är att vi i praktiken nästan alltid har en blandning av kvalitativa/kvantitativa variabler. y måste dock fortfarande vara kvantitativ! variabler Hittills bara studerat kvantitativa variabler, men till skillnad från Pearsons korrelationskoefficient måste x i multipel linjär regression inte vara kvantitativ. Betrakta återigen regression som ett betingat väntevärde E(y x) så inses det lätt att den ns skalnivå inte har betydelse för regressionens giltighet. Om x är en kategori är t ex E(y x = Kategori A ) populationsmedelvärdet i kategori A. Vi kan också skriva detta som µ y x=a

3 variabler Typiska kategorivariabler är kön utbildningsnivå attitydfrågor på ordinalskala i enkäter länder eller regioner i makroekonomisk statsvetenskaplig utvärdering specifika händelser när data observeras över tid (t ex för att indikera Estoniakatastrofen om vi observerar antalet döda i abrbetskraftaolyckor över tid eller för att indikera finanskrisen 2008 om vi observerar finansdata) Kategorivariabler kan vara på nominal- eller ordinalskala.

4 En binär kvalitativ Den linjära modellen specificeras som förut: y = β 0 + β 1 x + ε men x ha värdet 0 eller 1. För observationer med x = 1 kommer utfallet y från modellen: y = β 0 + β ε För observationer med x = 0 kommer utfallet y från modellen: y = β 0 + β ε Modellerna kan även formuleras E(y x = 1) = µ y x=1 = β 0 + β 1 1 = β 0 + β 1 respektive E(y x = 0) = µ y x=0 = β 0 + β 1 0 = β 0

5 En binär kvalitativ Då E(y x = 1) E(y x = 0) är skillnaden mellan medelvärdet för observationer med x = 1 medelvärdet för observationer med x = 0 blir E(y x = 1) E(y x = 0) = β 0 + β 1 β 0 = β 1 β 1 är skillnaden mellan gruppernas medelvärden i populationen! Att β 1 är skillnaden i medelvärden när x kan anta värdena 0 eller 1 är viktigt! Spendera tid till att förstå varför (om det inte är uppenbart direkt). Detta resultat används (väldigt) mycket i praktiken! 1 1 Vad en eventuell skillnad beror på återkommer vi till senare på kursen när vi talar om kausalitet. Än så länge talar vi enbart om association!

6 Ex1: Födelsevikt bland rökare icke-rökare Anta att vi vill studera om rökning bland gravida är associerat med födelsevikt. Så här skulle ni undersökt det på en första kurs i statistik: Mål: Studera om medelvikten bland nyfödda till mammor som rökte under graviditet, µ y x=1, skiljer sig åt från medelvikten bland nyfödda till mammor som inte rökte under graviditeten, µ y x=0. Hypoteser: H 0 : µ y x=1 µ y x=0 = 0 H 1 : µ y x=1 µ y x=0 0

7 Ex1: Födelsevikt bland rökare icke-rökare Förutsättningar: 1) OSU från respektive grupp. Varianserna för y i respektive grupp, σy x=1 2 σy x=0 2, är okända. För att bestämma testfunktionen undersöker vi varianserna lika. Bägge stickproven är stora n x=1 = 115, n x=0 = 74 > 30, vilket innebär att även om y inte är normalfördelad i respektive grupp så kan vi använda oss av CGS (såvida y inte är väldigt skevt fördelad)

8 Ex1: Födelsevikt bland rökare icke-rökare Skattningarna för µ y x=1 µ y x=0 är ȳ x=0 = 3055 ȳ x=1 = 2773 i gruppen där x = 1, vilket innebär att skattningen för µ y x=1 µ y x=1 = 282 I stickprovet är den genomsnittliga födelsevikten för barn till rökande mammor 282 gram mindre än den genomsnittliga födelsevikten för barn till mammor som inte röker.

9 Ex1: Födelsevikt bland rökare icke-rökare Vi studerar alltid datamaterialet grafiskt. (Hypoteserna formulerade innan.) Spridningen i y verkar inte vara alltför olika enligt boxplottarna ovan. Tumregeln: Om vi använder oss av tumregeln σ1 2/σ2 0 < 2 så antar vi lika varianser.

10 Ex1: Födelsevikt bland rökare icke-rökare

11 Ex1: Födelsevikt bland rökare icke-rökare Testfunktion: Enligt förutsättningarna används: t = ȳ 1 ȳ 0 sp(1/n /n 0 ) där den poolade variansen (med insättning av tidigare värden) är: s 2 ε = (s2 y 1 (n 1 1) + s 2 y 0 (n 0 1) n 2 = ,6 Testfunktionen är t-fördelad med n 2 frihetsgrader om H 0 är sann.

12 Ex1: Födelsevikt bland rökare icke-rökare Beslutsregel: Vi testar på 5%-signifikansnivå, dvs p < 0,05 betraktas som statistiskt signifikant. Beräkning. Se Minitab-output på nästa slide! Beslut: Eftersom p = 0,009 förkastas H 0. Svar på tenta: Vi kan påvisa att den genomsnittliga födelsevikten bland barn till gravida som röker inte är samma som den genomsnittliga födelsevikten bland barn till gravida som inte röker. Redovisning i rapport/artikel: Barn till gravida som röker väger i genomsnitt 282 gram mindre än barn till gravida som inte röker (p = 0,009). 2 2 Ange inte bara testet utan ange alltid punktskattningen, dvs skillnaden i medelvärden!

13 Ex1: Födelsevikt bland rökare icke-rökare

14 E(BWT SMOKE = 0) = β 0 om icke-rökare Ex1: Födelsevikt bland rökare icke-rökare Istället för ett t-test enligt ovan undersöks nu associationen mellan rökning (SMOKE) födelsevikt (BWT ) via den linjära modellen: BWT = β 0 + β 1 SMOKE + ε där SMOKE är 1 om den gravida mamman rökte 0 om hon var icke-rökare. Detta innebär att BWT = β 0 + β 1 + ε om rökare, dvs SMOKE = 1 BWT = β 0 + ε om rökare, dvs SMOKE = 0 alternativt E(BWT SMOKE = 1) = β 0 + β 1 om rökare

15 Ex1: Födelsevikt bland rökare icke-rökare Modell: BWT = β 0 + β 1 SMOKE + ε Hypoteser: H 0 : β 1 = 0 vs H 1 : β 1 0 Förutsättningar: (i) linjär modell (vilket per automatik är uppfyllt om vi har en enda binär ), (ii) observationer, (iii) E(ε x) = 0, (iv) ε har konstant varians σ 2 ε. Eventuellt (v) ε är normalfördelad. Beslutsregel: Vi testar tvåsidigt på 5%-signifikansnivå, dvs förkasta H 0 om p < 0,05

16 Ex1: Födelsevikt bland rökare icke-rökare Modellen skattas med minstakvadratmetoden vi erhåller BWT = SMOKE dvs ˆβ 1 = 282

17 Ex1: Födelsevikt bland rökare icke-rökare

18 Ex1: Födelsevikt bland rökare icke-rökare Kontrollera antagande (i)-(v). Plotten i nedre högre hörnet skulle dock kunna indikera ett problem! Det verkar som observationerna faktiskt är beroende. Emellertid beror detta på observationerna i datat är sorterat på födelsevikt. Detta påverkar inte resultaten utan via datainsamlingen garanteras observationer.

19 Ex1: Födelsevikt bland rökare icke-rökare Beslut: Eftersom p = 0,009 förkastas H 0. Svar på tenta: Vi kan påvisa att röknig är associerat med födelsevikt då den genomsnittliga födelsevikten bland barn till gravida som röker inte är samma som den genomsnittliga födelsevikten bland barn till gravida som inte röker. Redovisning i rapport/artikel: Barn till gravida som röker väger i genomsnitt 282 gram mindre än barn till gravida som inte röker (p = 0,009). 3 3 Ange inte bara testet utan ange alltid punktskattningen, dvs skillnaden i medelvärden! Detta avgör vad som är praktiskt signifikant.

20 Ex1: Födelsevikt bland rökare icke-rökare Redovisning i rapport/artikel om vi redovisar konfidensintervall: Barn till gravida som röker väger i genomsnitt 282 gram mindre än barn till gravida som inte röker (95% KI: -479; -71). 4 4 I regel anges KI, men pga av utrymmeskäl exkluderas dessa outputsen. Kontrollera för dig själv att du förstår genom att beräkna intervallet från outputen. Om målet är att skatta ett KI för β 1 kan du gå igenom motsvarande steg som ovan.

21 Jämförelse med t-testet t-testet i linjär regression Jämför outputen från t-testet från regressionsanalysen. Skillnaden mellan första t-testet är regressionsanalysens t-test är att regressionsanalysen bygger på en modell. Betydelse av antagande (iv) om lika varianser för alla x blir nu uppenbart. Detta är precis det antagande som görs när gör ett t-test med poolad varians, då antog vi att σ1 2 = σ2 2. vilket också skattar σε 2 om (iv) gäller.

22 Ex1: Intervallskattning av E(y x = 1) E(y x = 0) Mål: Intervallskatta genomsnittlig födelsevikt bland barn till rökare µ y x=1 genomsnittlig födelsevikt bland barn till icke-rökare µ y x=0 Samma modell förutsättningar som tidigare Skattningar: Använd tidigare output. µ y x=1 skattas med µ y x=0 skattas med ˆβ 0 = ȳ x=1 = 3055 ˆβ 0 + ˆβ 1 = ȳ x=1 = = 2773

23 Ex1: Födelsevikt bland rökare icke-rökare Vi tar fram lite beskrivande statistik som kan vara användbar.

24 Ex1: Intervallskattning av E(y x = 1) E(y x = 0) Ett 95% KI (under givna förutsättningar) för µ y x=xp ges av ŷ ± t n 2,α/2 ˆV (ŷ) ( där ˆV 1 (ŷ) = sε 2 n + (x p x) 2 ) t = 1,973 SS xx För µ y x=xp har vi då ( ) 1 (1 0,3915)2 ˆV (ŷ) = = 6962, ,0265 där SS xx = (n 1)s 2 x = 45,0265.

25 Ex1: Intervallskattning av E(y x = 1) E(y x = 0) Beräkning ger intervallet (2608, 64, 2937, 85). Med 95% säkerhet är den genomsnittliga födelsevikten bland barn till mammor som rökt under graviditeten mellan gram. Motsvarande intervall för icke-rökande mammor är (2922,92; 3187,00). Prova räkna!

26 Ex1: Födelsevikt bland rökare icke-rökare

27 Att ha i åtanke beträffande binära variabler En kvalitativ binär benämns även dikotom, dummy-, indikator. Om n är på nominalskala kan den (i princip) kodas hur vi vill eftersom värdet i sig saknar betydelse. Man måste däremot alltid vara noga med vad som är referenskategorin Om n är på ordinalskala kan den (i princip) kodas hur vi vill så länge inbördes rangordning bibehålls. Kodningen har ingen betydelse för testens slutsatser. Vi få exakt samma p-värde.

28 Att ha i åtanke beträffande binära variabler Kodningen har betydelse för punktskattningarnas värde om vi inte anger för programmet att x är en kategori. Vid kodningen ( 1, 1) erhålls t ex en annan punktskattning än om n kodas (0, 1). Ibland används kodningen (1, 2). Tolkningen görs utifrån vad som väljs som referenskategori. Syftet är ju att jämföra en grupp med annan.

29 Ex1 Rökningsn heter nu C12 är här kodad 1 för icke-rökare 1 för rökare. Jämför med (0, 1) kodningen tolka skillnaden! Räkna ut medelvärdet bland rökare medelvärdet bland icke-rökare.

30 Ex1 Explicit angett att C12 är en kategori.

31 Ex1 Explicit angett att C12 är en kategori.

32 Att ha i åtanke beträffande binära variabler I statistikprogram måste man ofta ange att n är en kategori. I praktiken används oftast (0,1)-kodningen eftersom vi direkt har en tydlig referenskategori. Dessutom har en interceptet en tydlig tolkning eftersom det är medelvärdet för referenskategorin när alla övriga variabler är noll. Om vi är nöjda med tolkningen vid (0,1)-kodningen behöver vi i princip inte ange att n är en kategori. Vid kodningen (-1,1) erhålls andra goda egenskaper som vi ska se närmare på senare på kursen. På samma sätt, är vi medvetna om kodningen behöver vi inte ange att n är en kategori, men vi måste tolka parametrarna rätt! En kategori kallas också för faktor

33 fler än två F-test Analys av enskilda parametrar Test för linjär trend Låt x vara en med 3. Baserat på x-n skapar vi nu tre nya binära variabler d 1, d 2, d 3 som indikerar kategoritillhörighet. Eftersom en individ inte kan tillhöra flera grupper gäller följande: Om x = 1 så d 1 = 1 d 2 = 0 d 3 = 0 Om x = 2 så d 2 = 0 d 2 = 1 d 3 = 0 Om x = 3 så d 3 = 0 d 2 = 0 d 3 = 1 Bestäm sedan en referenskategori. Dummy-variablerna som inte baseras på referenskategorin används sedan i en linjär modell.

34 fler än två F-test Analys av enskilda parametrar Test för linjär trend HAr vi en kvalitativ med 3 resulterar det i en linjär modell med 2 dummy-variabler välja 1 som referens erhålls modellen: vilket också kan skriva som y = β 0 + β 1 d 2 + β 2 d 3 + ε y = β 0 + β β ε om x = 1 (eller d 1 = 1) y = β 0 + β β ε om x = 2 (eller d 2 = 1) y = β 0 + β β ε om x = 3 (eller d 3 = 1)

35 fler än två Alternativt: E(y x = 1) = β 0 F-test Analys av enskilda parametrar Test för linjär trend E(y x = 2) = β 0 + β 1 E(y x = 3) = β 0 + β 2 Enligt ovanstående opecifikation kan vi skatta alla betingade medelvärden E(y x). Dessutom har vi följande praktiska tolkningar β 1 = E(y x = 2) E(y x = 1) β 2 = E(y x = 3) E(y x = 1)

36 Ex1: SES BWT F-test Analys av enskilda parametrar Test för linjär trend Vi vill nu undersöka om socio-ekonomisk status (1=låg, 2=mellan, 3=hög) är associerat med födelsevikt. Vi börjar därför med kodningen till dummy-variabler. Ett snabbt sätt att göra detta i Minitab är genom Calc-Make Indicator Variables...

37 Ex1: SES BWT F-test Analys av enskilda parametrar Test för linjär trend Vi misstänker att låg SES är associerat med låg födelsevikt så sätter vi hög SES som referens. Återigen, detta är godtyckligt, men att sätta hög SES som referens kan i det här fallet förenkla tolkningar. Vi sätter därför upp modellen BWT = β 0 + β 1 SES 1 + β 2 SES 2 + ε där målet är att testa hypoteserna H 0 : β 1 = β 2 = 0 mot H 1 : Att minsta en av parametrarna är skild från noll Men innan vi testar så ska se närmare på tolknigen av parameterskattningarna som vi erhåller från regressionsmodellen ovan.

38 Ex1: SES BWT F-test Analys av enskilda parametrar Test för linjär trend Utan att göra någon regression så kan vi ta fram skattningarna: E(y x = 1) som skattas med ȳ x=1 = 2720 E(y x = 2) som skattas med ȳ x=2 = 2804 E(y x = 3) som skattas med ȳ x=3 = 3103,7

39 Ex1: SES BWT F-test Analys av enskilda parametrar Test för linjär trend

40 F-test Analys av enskilda parametrar Test för linjär trend Ex1: SES BWT På motsvarade sätt som formulerat i populationsmodellerna tidigare kan de skattande medelvärden erhållas direkt från den skattade regressionsmodellen: ˆβ 0 = 3103, 7 ˆβ 0 + β 1 = 3103, 7 + ( 384) = 2720 ˆβ 0 + ˆβ 2 = ( 300) = 2804 Dessutom skattas direkt de (i regel) mest relevanta parametrarna, skillnader i medelvärden. Vi ser att nyfödda till mammor med låg SES väger i genomsnitt 384 gram mindre än nyfödda till mammor med hög SES. Dessutom är födelsevikten bland barn till mammor med mellannivå SES i genomsnitt 300 gram mindre jämfört med födelsevikten bland barn till mammor med hög SES. Observera! Vi ännu inte angett konfidensintervall eller testat. Det är enbart punktskattningar så här långt.

41 F-test Analys av enskilda parametrar Test för linjär trend Ex1: Test av association mellan SES BWT Utgångspunkten är modellen BWT = β 0 + β 1 SES 1 + β 2 SES 2 + ε vi ser nu att även om vi bara har en, SES, så har vi flera parametrar att testa. För att formellt testa om det finns en association mellan SES BWT så ska vi alltså testa hypoteserna H 0 : β 1 = β 2 = 0 H 1 : Att minsta en av parametrarna är skild från noll Test av flera parametrar samtidigt gjordes tidigare med ett F -test. Vi gör på motsvarande sätt nu.

42 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend Mål: Är SES associerat med BWT? Modell: BWT = β 0 + β 1 SES 1 + β 2 SES 2 + ε Hypoteser: H 0 : β 1 = β 2 = 0 H 1 : Att minsta en av parametrarna 0 Förutsättningar för F -test: (i) En linjär modell följer av enbart disjunkta indikatorvariabler. (ii) Observationerna är pga datainsamlingen (tvärsnittsdata utan några kluster). (iii) E(ε x) = 0. (iv) Feltermens varians är konstant, dvs V (ε x) = σ 2 ε. (v) Feltermens fördelning är normalfördelad.

43 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend Mål: Är SES associerat med BWT? Modell: BWT = β 0 + β 1 SES 1 + β 2 SES 2 + ε Hypoteser: H 0 : β 1 = β 2 = 0 H 1 : Att minsta en av parametrarna 0 Förutsättningar för F -test: (i) En linjär modell följer av enbart disjunkta indikatorvariabler. (ii) Observationerna är pga datainsamlingen (tvärsnittsdata utan några kluster). (iii) E(ε x) = 0. (iv) Feltermens varians är konstant, dvs V (ε x) = σ 2 ε. (v) Feltermens fördelning är normalfördelad.

44 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend Testfunktion: F = MS(Model) MSE Beslutsregel: Förkasta H 0 på 5%-signifikansnivå, α = 0,05 om p < 0,05. F = MS(Model) MSE

45 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend

46 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend

47 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend

48 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend (ii) observationer gäller från designen i datainsamlingen där det inte finns kluster/grupper. Plotten nere till höger är i regel bara tillämplig vid tidsseriedata. Vi har observationer. (iv) Samma varianser. Residualplotten indikerar inte alltför olika spridning av residualerna i de olika na. Samma sak observeras för varianserna för y i respektive SES-grupp.

49 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend Beslut: Eftersom p < 0,05 förkastar vi H 0. Svar: Vi kan påvisa SES är statistiskt användbart för att förklara BWT. Rapport/artikel: Gravida mödrars socio-ekonomiska status är associerad med barnens vikt vid födsel (F 2,186 = 4,97, p = 0,008).

50 Ex1: Test av association mellan SES BWT F-test Analys av enskilda parametrar Test för linjär trend Om det redan finns andra variabler i modellen måste vi göra ett nested F -test. Detta finns inte implementerat i Minitab utan måste utföras för hand.

51 Test konfidensintervall för enskilda β j F-test Analys av enskilda parametrar Test för linjär trend Efter F -testet brukar det vara av intresse testa för att se vilka skillnader som finns. Det görs genom test av enskilda β j (som ju är skillnad i medelvärden). F -testet påverkas inte av vilken kategori som används som referens. Samma gäller inte när vi betraktar enskilda parametrar. Vi måste välja en referens! Teori. Vad vill vi jämföra mot? I vilken riktning går sambandet? Styrka. Välj den referens med flest antal observationer. Val av referensgrupp påverkar p-värdet i enskilda testen.

52 Test konfidensintervall för enskilda β j F-test Analys av enskilda parametrar Test för linjär trend

53 Test konfidensintervall för enskilda β j F-test Analys av enskilda parametrar Test för linjär trend

54 Test konfidensintervall för enskilda β j F-test Analys av enskilda parametrar Test för linjär trend Varför p-värdena blir olika är tydligt om vi studerar. Signifikanta skillnader erhålls om vi jämför grupper vars medelvärden ligger långt ifrån varandra. Vi ska dock välja test utifrån figurer! Hypoteserna ska vara formulerade i förväg! Alternativt baserat på vad som uppkommer i samband med datainsamling när en kategori erhåller få observationer.

55 F-test Analys av enskilda parametrar Test för linjär trend Konfidensintervall för enskilda β j I regel är konfidensintervall mer informativa än p-värden. Tolkning: Nyfödda till mödrar med låg SES väger i genomsnitt 384 gram mindre än nyfödda till mödrar med hög socio-ekonomisk status (95% KI: -696; -73). Vi finner även att nyfödda till mödrar med mellan-nivå av SES i väger i genomsnitt 300 gram mindre än nyfödda till mödrar med hög SES (95% KI: -524; -75) Vi kan däremot inte uttala oss skillnaden mellan låg mellan SES

56 F-test Analys av enskilda parametrar Test för linjär trend Test för linjär trend Om den kvalitativa n är på ordinalskala används ibland ett test för linjär test. Vi har då ett värde för varje kategori sedan jämna skalsteg 1, 2, 3,...,. Därefter inkluderas n i regressionen som om den vore kvantitativ, dvs med samma avstånd mellan svarsalternativen. Vi testar då om det finns en linjär trend spar samtidigt frihetsgrader (testar bara en parameter). Men tolkningen är just att vi testar en linjär trend under den givna förutsättningen med lika avstånd. Detta test gäller av naturliga skäl inte för variabler på nominalskala.

57 Ex1: Test för linjär trend mellan BWT SES F-test Analys av enskilda parametrar Test för linjär trend

58 MS: 5.2, s213-s217, 5.7

59 Övningsuppgifter MS: 4.45, 4.51, 5.25

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 5. Kapitel 6, sid Inferens om en population Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1 Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

TMS136. Föreläsning 10

TMS136. Föreläsning 10 TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek

Läs mer

TMS136. Föreläsning 13

TMS136. Föreläsning 13 TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra

Läs mer

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:

Läs mer

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl Karlstads Universitet Avdelningen för Nationalekonomi och Statistik Tentamen i Statistik, STG A0 och STG A06 (3,5 hp) Torsdag 5 juni 008, Kl 4.00-9.00 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Hur man tolkar statistiska resultat

Hur man tolkar statistiska resultat Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Varför använder vi oss av statistiska tester?

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 15, FMSF45 Multipel linjär regression Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Hypotestestning och repetition

Hypotestestning och repetition Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att

Läs mer

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I STATISTIKENS GRUNDER 2 STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-01 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:

Läs mer

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng

Läs mer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN): Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-06 En stratifierad sundersökning: NTU2014 Från NTU2014 Från NTU2014 Dellens

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17 1/17 F8 Skattningar Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 14/2 2013 Inledande exempel: kullager Antag att diametern på kullager av en viss typ är normalfördelad N(µ,

Läs mer

Att välja statistisk metod

Att välja statistisk metod Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...

Läs mer

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson, STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson, 5--9 Lösningförslag skriftlig hemtentamen i Fortsättningskurs i statistik, moment, Statistisk Teori, poäng. Deltentamen : Sannolikhetsteori

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har

Läs mer

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Deskriptiv statistik Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Deskriptiv statistik Tabeller Figurer Sammanfattande mått Vilken

Läs mer

F7 Polynomregression och Dummyvariabler

F7 Polynomregression och Dummyvariabler F7 Polnomregression och Dummvariabler Antag att man börjar med enkel linjär regression. Kap Polnomregression Emellanåt upptäcker man samband som är kvadratiska, kubiska osv. Allmänt: polnom av k:te ordningen

Läs mer

2. Test av hypotes rörande medianen i en population.

2. Test av hypotes rörande medianen i en population. Stat. teori gk, ht 006, JW F0 ICKE-PARAMETRISKA TEST (NCT 15.1, 15.3-15.4) Ordlista till NCT Nonparametric Sign test Rank Icke-parametrisk Teckentest Rang Teckentest Teckentestet är formellt ingenting

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 1 januari 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel-

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A

Läs mer

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson (examinator) VT2017 TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2017-04-20 LÖSNINGSFÖRSLAG Första version, med reservation för tryck-

Läs mer

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5. February 6, 2018 1 Föreläsning VIII 1.1 Punktskattning Punktskattning av µ Vi låter {ξ 1, ξ 2,..., ξ n } vara oberoende likafördelade stokastiska variabler (med ett gemensamt µ). ξ =: µ är en punktskattning

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier: Stat. teori gk, ht 006, JW F1 χ -TEST (NCT 16.1-16.) Ordlista till NCT Goodness-of-fit-test χ, chi-square Test av anpassning χ, chi-två Test av anpassning: sannolikheter specificerade i förväg Data: n

Läs mer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa. Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Thomas Önskog 28/

Thomas Önskog 28/ Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 5 Johan Lindström 12 september 216 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 1/23 Repetition Gauss approximation Delta metoden

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse

Läs mer

Parade och oparade test

Parade och oparade test Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-06-07 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 7 Statistiska metoder 1 Dagens föreläsning o Hypotesprövning för två populationer Populationsandelar Populationsmedelvärden Parvisa observationer Relation mellan hypotesprövning och konfidensintervall

Läs mer