GRUNDLÄGGANDE REGRESSIONSANALYS Problemsamling

Storlek: px
Starta visningen från sidan:

Download "GRUNDLÄGGANDE REGRESSIONSANALYS Problemsamling"

Transkript

1 GRUNDLÄGGANDE REGRESSIONSANALYS Problemsamling Martin Singull Kapitel 1 GR-1.1. Uppgift 1. i Grundläggande Regressionsanalys. GR-1.2. Uppgift 2. i Grundläggande Regressionsanalys. GR-1.3. Uppgift 3. i Grundläggande Regressionsanalys. GR-1.4. Uppgift 4. i Grundläggande Regressionsanalys. see the last two pages for the problems (see the first 4 questions) GR-1.5. Låt X 1, X 2 och X 3 vara stokastiska variabler sådana att X X 2 N 5, X 3 a) Beräkna P(X 2 > X 1 + 1). b) Man vill göra en linjärkombination Y = a 1 X 1 + a 2 X 2 + a 3 X 3 sådan att E(Y ) = 5 och var(y ) minimeras. Bestäm a 1, a 2 och a 3. GR-1.6. De stokastiska variablerna X 1, X 2,..., X 5 är oberoende och N(10, 4). Betrakta Y 1 = 1 5 (X 1 + X X 5 ), Y 2 = 4X 1 + X 2 X 3 X 4 X 5. a) Bestäm simultana fördelningen för (Y 1, Y 2 ). b) Beräkna P(Y 1 > Y 2 ) c) Beräkna korrelationskoefficienten mellan Y 1 och Y 2. GR-1.7. Låt X 1 och X 2 vara resultaten på två psykologiska test för en person och X 3 en betygssättning av personens förmåga att sköta en viss typ av arbetsuppgifter inom ett företag. Genom lång erfarenhet vet man att ( ) X 1 X 2 X 3 har tredimensionell normalfördelning med väntevärdesvektor och kovariansmatris µ = 53 ; C = Man vill ha information om X 3 via X 1 och X 2. Man kan bestämma en bästa linjär prediktor genom att kräva ˆX 3 = a + bx 1 + cx 2 1

2 (i) E( ˆX 3 ) = E(X 3 ) (ii) var(x 3 ˆX 3 ) minimal. a) Bestäm denna bästa linjära prediktor ˆX 3. b) Visa att predikteringsfelet ɛ = X 3 ˆX 3 är oberoende av X 1. (Predikteringsfelet är oberoende av X 2 också, men det behöver du inte visa.) GR-1.8. Den stokastiska variabeln ( X 1 X 2 ) X 3 har en tredimensionell normalfördelning med väntevärdesvektor och kovariansmatris respektive 7/2 1/2 1 1/2 1/ /2 a) Bestäm väntevärdesvektorn och kovariansmatris för ( Y 1 Y 2 Y 3 ), där b) Beräkna P(Y 2 > 2Y 3 ). Y 1 = X 2 + X 3 Y 2 = X 1 + X 3 Y 3 = X 1 + X 2 c) Undersök om Y 1 och Y 2 är oberoende. Svaret skall motiveras. GR-1.9. Störningarna ε 1, ε 2, ε 3 vid tre på varandra följande signalöverföringar i ett kommunikationssystem kan anses utgöra komponenterna i en normalfördelad vektor med väntevärdesvektor µ och kovariansmatris C enligt nedan µ = Beräkna sannolikheten att medelvärdet 0 0, C = ε = (ε 1 + ε 2 + ε 3 )/3 av de tre störningarna till sitt belopp överstiger 2 enheter. Kapitel 2 GR-2.1. Visa att residualvektorn e = Y Ŷ har kovariansmatrisen (I X(X X) 1 X )σ 2. GR-2.2. Betrakta den enkla linjära regressionsmodellen Y j = β 0 + β 1 x j + ε j, j = 1, 2,..., n där ε 1, ε 2,..., ε n är oberoende och N(0, σ 2 ). Visa att minsta-kvadrat-metodens skattningar ˆβ 0 och ˆβ 1 är oberoende om och endast om n x j = 0. j=1 GR-2.3. En ny medicin mot cancer prövades på tio möss, som var och en hade en tumör av storleken 4 gram. Mössen fick olika doser (x) av medicinen, och minskningen (y) av tumören bestämdes för varje mus. Resultat: 2

3 x y Modell: Y = β 0 + β 1 x + β 2 x 2 + ε där ε N(0, σ 2 ). En variansanalys enligt denna modell gav: Skattad regressionslinje: y = x x REGR RES TOT a) Pröva på nivån H 0 : β 1 = β 2 = 0 mot H 1 : minst en av β 1 och β 2 0. b) Bestäm den dos som är optimal enligt den här regressionsanalysen. c) Vore det tänkbart att ta bort en av förklaringsvariablerna? Motivera ditt svar kortfattat. GR-2.4. I en studie av lönsamheten för filmbolag har man valt ut 20 hollywoodfilmer slumpmässigt och för varje film tagit fram observerade värden på y = bruttointäkt (enhet: miljoner dollar) x 1 = produktionskostnad (enhet: miljoner dollar) x 2 = marknadsföringskostnad (enhet: miljoner dollar). Man var speciellt intresserad av om det hade betydelse om filmen baserats på en bok, som publicerats innan filmen producerades. För att separera sådana filmer från de övriga definierades en så kallad dummmy-variabel { 1 för film baserad på en bok x 3 = 0 annars Resultat 3

4 Data har analyserats enligt modellerna Modell 1: Y = β 0 + β 2x 2 + ε x 1 x 2 x 3 y Modell 2: Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε där ε respektive ε i de två modellerna antas vara oberoende och N(0, σ 2 ) respektive N(0, σ 2 ). er finns nedan. nr 1 Skattad regressionslinje: y = x REGR RES TOT nr 2 Skattad regressionslinje: y = x x x REGR RES TOT a) Förklara kortfattat varför modell 2 beskriver datamaterialet bättre än modell 1. Motivera ditt svar med hjälp av lämpliga parametrar från datorutskriften. b) Verkar det ha betydelse för intäkten om filmen baserats på en bok och i så fall på vilket sätt? Motivera ditt svar med hjälp av ett lämpligt 95% konfidensintervall. c) En film baserad på en nyutkommen bok ska produceras. Man uppskattar produktionskostnaden till 11 miljoner dollar och man tänker satsa 9 miljoner dollar på marknadsföring av filmen. Uppskatta den förväntade bruttointäkten från filmen med hjälp av modell 2. Du behöver inte göra 4

5 något intervall (X X) 1 = GR-2.5. Antag att tiden Y för en kemisk reaktion har linjär regression med avseende på temperaturen x. Följande observerade data föreligger: a) Beräkna punktskattningar av β 0, β 1 och σ 2. x i y i b) Rita in värdena tillsammans med den beräknade regressionslinjen i ett koordinatsystem. GR-2.6. Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet av cirka 100 km/h till stillastående på en torr asfaltväg. Vid varje försök mätte man dels hastigheten vid inbromsningens början (det var i praktiken svårt att hålla exakt hastigheten 100 km/h), dels bromssträckan. Resultat: Begynnelsehastighet Bromssträcka a) Låt Y j, j = 1, 2,..., 5 beteckna bromssträckan i respektive försök. Antag att Y 1, Y 2,..., Y 5 är oberoende och N(µ, σ 2 ), där µ betecknar den förväntade bromssträckan vid begynnelsehastigheten 100 km/h. (Vi betraktar sålunda all variation hos bromssträckan, även den som orsakas av varierande begynnelsehastighet, som ren slumpvariation.) Vi har alltså Y j = µ + ε j där ε j N(0, σ 2 ). Bestäm ett 95% konfidensintervall för µ. b) En del av variationen i bromssträckan beror troligen på att hastigheten inte varit exakt 100 km/h. Via en linjär modell bör man kunna ta hänsyn till hastigheten. I försök nummer j har vi haft hastigheten x j och vi har fått bromssträckan y j, som är observation av Y j = β 0 + β 1 x j + ε j där ε j N(0, σ 2 ). En variansanalys gav: Skattad regressionslinje: y = x REGR RES TOT (X X) 1 = ( ) Beräkna ett 95% konfidensintervall för den förväntade bromssträckan vid hastigheten 100, dvs för β β 1. c) Jämför resultaten i a) och b). Vilken analysmetod föredrar du? GR-2.7. Vid en fabrik tillverkas salpetersyra genom oxidation av ammoniak. Under 21 dagar har man mätt samhörande värden på x 1 = luftflödet. x 2 = ingående kylvattnets temperatur. x 3 = koncentrationen av HNO 3 i den absorberande vätskan y = 10 andelen (i %) av NH 3 som förloras, dvs ett omvänt måttpå utbytet. Data from Operation of a Plant for the Oxidation of Ammonia to Nitric Acid. 5

6 Air Cooling Water Acid Stack Flow Inlet Temp. Concentration Loss Run No. x 1 x 2 x 3 y er enligt följande modeller finns nedan. Modell 1: Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε Modell 2: Y = β 0 + β 1 x 1 + β 2 x 2 + ε Konstruera med hjälp av modell 2 ett 95% konfidensintervall för E(Y ) då x 1 = 50 och x 2 = 18. Är du nöjd med intervallet? 1 Skattad regressionslinje: y = x x x REGR RES TOT Skattad regressionslinje: y = x x REGR RES TOT (X X) 1 = GR-2.8. Man vill utnyttja en regressionsmodell för att beräkna priser på passagerarplan. Som beroende variabel har man 6

7 Y = flygplanets pris/antal passagerarplatser (enhet: tal 8mm dollar) och som förklaringsvariabler x 1 = startvikten / antalet passagerarplatser x 2 = ln (hastigheten) Observerade värden: Modell: Y = β 0 + β 1 x 1 + β 2 x 2 + ε x 1 x 2 y Skattad regressionslinje: y = x x REGR RES TOT (X X) 1 = Konstruera ett 95% prediktionsintervall för priset på ett flygplan med 60 platser, startvikten och hastigheten 287. Är du nöjd med intervallet? GR-2.9. I mitten av 1800-talet ville den skotske fysikern James D. Forbes uppskatta höjden över havet genom att mäta kokpunkten för vatten. Han visste att höjden över havet kunde bestämmas med hjälp av lufttrycket. I en serie experiment studerade han sambandet mellan lufttryck och kokpunkt. Intresset för problemet motiverades av svårigheten för resenärer att transportera 1800-talets ömtåliga barometrar. Forbes samlade data i Alperna och Skottland, och följande datamaterial publicerades 1857: 7

8 En analys enligt Case Boiling Pressure No. Point ( o F) (in. Hg) Log(Pressure) 100 Log(Pressure) Modell 1: Y j = β 0 + β 1 x j + ε j där ε N(0, σ 2 ), x j = temperaturen och y j = 100 log (tryck), finns nedan. Residualplotten avslöjar en avvikande observation, en sk outlier, nämligen nr 12. Vi vill undersöka om det är troligt att avvikelsen har uppstått av en ren slump. a) Datamaterialet har också analyserats enligt Modell 2: Y j = β 0 + β 1 x j + β 2 u j + ε j där u j = { 1 för j=12 0 annars. Undersök med hjälp av ett lämpligt test eller konfidensintervall om observation nr 12 kan anses vara avvikande. Nivå b) I analys nr 3 har observation nr 12 strukits och återstående data har analyserats enligt modell 1. Konstruera utgående från denna analys ett 95% intervall med vars hjälp man kan undersöka om observation nr 12 kan anses vara avvikande. Vad blir din slutsats? Anm. Man kan visa att metoderna i a) och b) är ekvivalenta, se Weisberg (1985), sid Skattad regressionslinje: y = x REGR RES TOT Skattad regressionslinje: y = x u REGR RES TOT

9 3 Skattad regressionslinje: y = x REGR RES TOT (X X) 1 = ( ) GR En psykolog intresserade sig för effekterna av sömnbrist. 20 personer med likartade sömnvanor delades slumpmässigt in i fem grupper med fyra individer i varje. Ett försök genomfördes under två dagar. Natten mellan dag 1 och dag 2 fick: Grupp 1: 0 timmars sömn Grupp 2: 2 timmars sömn Grupp 3: 4 timmars sömn Grupp 4: 6 timmars sömn Grupp 5: 8 timmars sömn Dag 1: På morgonen fick varje person genomgå ett test, som gick ut på att utföra additioner av tal under tio minuter. Dag 2: Personerna fick på morgonen genomgå ett nytt men likvärdigt test med additioner av tal. För varje person beräknades skillnaden mellan antalet korrekt utförda additioner dag 1 och antalet korrekt utförda additioner dag 2. Resultat: Grupp nr Observerade data Modell: För person nr i gäller att skillnaden i testresultat y i är observation av Y i = β 0 + β 1 x i + ε i där ε 1,..., ε 20 är oberoende och N(0, σ 2 ) och där x i = antalet timmar sömn. En variansanalys ges nedan. a) Konstruera ett 95% konfidensintervall för β 1 och pröva på nivån 0.05 H 0 : β 1 = 4 mot H 1 : β 1 4. b) Undersök med hjälp av ett lämpligt test eller konfidensintervall om regressionslinjen skär x-axeln vid x = 8, dvs om de som sovit åtta timmar har oförändrad förmåga att klara testet. Nivå 5%. Skattad regressionslinje: y = x REGR RES TOT

10 ( ) (X X) = GR Följande tabell visar utgifterna för privat konsumtion (y) samt den disponibla inkomsten (x 1 ) båda uttryckta i miljarder dollar. Variabeln x 2 anger krigstillståndet { 1 då landet är i krig x 2 = 0 annars Uppgifterna gäller USA under åren Analys av datamaterialet enligt modellen där ε N(0, σ 2 ) gav x 1 x 2 y Y = β 0 + β 1 x 1 + β 2 x 2 + ε Skattad regressionslinje: y = x x REGR RES TOT (X X) 1 = a) På vilket sätt påverkas den privata konsumtionen av landets krigstillstånd enligt den här analysen? Motivera ditt svar genom att konstruera ett lämpligt tvåsidigt 99% konfidensintervall. b) Konstruera ett 99% prediktionsintervall för den privata konsumtionen ett år, då x 1 = 150 och då landet inte är i krig. GR Nedanstående material utgör data från 20 affärsmäns investeringar och motsvarande vinster. Om vi önskar investera kapitalet 20, vilken vinst kan vi då räkna med? Ta fram punktskattning och 95% intervallskattning. 10

11 Invest (x) Vinst (y) Invest (x) Vinst (y) Skattad regressionslinje: y = x REGR RES TOT (X X) 1 = ( ) GR Ett universitet har en dator som dels utnyttjas av lärare och elever, dels av externa användare. Låt x 1 = antalet universitetsanvändare x 2 = antalet externa användare y = genomsnittlig svarstid i hundradels sekunder Samhörande värden på x 1, x 2 och y har observerats: En analys enligt modellen x 1 x 2 y x 1 x 2 y x 1 x 2 y x 1 x 2 y har gjorts. finns nedan. Y = β 0 + β 1 x 1 + β 2 x 2 + ε a) Pröva på nivån H 0 : β 1 = β 2 = 0 mot H 1 : minst en av β 1 och β 2 är 0. b) Belastar interna och externa användare datorn lika mycket, dvs är det möjligt att β 1 = β 2? Konstruera ett konfidensintervall för β 1 β 2 med konfidensgraden 95%. Skattad regressionslinje: y = x x REGR RES TOT (X X) 1 =

12 Kapitel 3 GR-3.1. Man har observerat en tidsserie y t, där t = 1, 2,..., 40. För att göra en lämplig modell för Y t gör man en analys enligt den preliminära modellen Y t = β 0 + β 1 t + ε t där ε t -variablerna är oberoende och N(0, σ 2 ). Residualerna plottades mot t. a) Efter att ha studerat residualplotten bestämmer man sig för att analysera datamaterialet enligt modellen Y t = β 0 + β 1 t + β 2 t 2 + ε t där ɛ t -variablerna är oberoende och N(0, σ 2 t). Ange två skäl till att man väljer denna modell. b) Ange en formel med vars hjälp β 0, β 1, β 2 i modellen i a) kan skattas. Eventuella matriser mm, som ingår i formeln, skall definieras fullständigt. (Ledning: Transformera datamaterialet på lämpligt sätt.) Kapitel 4 GR-4.1. För att jämföra tre olika sorters järnvägsräls lade man i fem olika distrikt ut två mil av vardera sorten och noterade under två år Resultat: x = genomsnittliga antalet tåg per dag, som passerade rälsavsnittet. y = antalet sprickor i rälsen. Typ A Typ B Typ C x y x y x y

13 Modell: Y = β 0 + β 1 z 1 + β 2 z 2 + β 3 x + ε där ε N(0, σ 2 ) och där { { 1 för typ B 1 för typ C z 1 = z 2 = 0 för övrigt 0 för övrigt. En variansanalys finns nedan. a) Verkar det genomsnittliga antalet tåg per dag vara av betydelse för sprickbildningen? Genomför ett lämpligt test på nivån 0.05 för modellen ovan. b) Finns det skillnader mellan spårtyperna vad gäller sprickbildningen? Genomför ett lämpligt test på nivån Skattad regressionslinje: y = x x x REGR RES TOT Skattad regressionslinje: y = x REGR RES TOT GR-4.2. Ett företag har jämfört efterfrågan av en viss sorts hygienartiklar i tolv olika försäljningsdistrikt. I fem av distrikten har varan sålts enbart genom detaljhandelskedjan A och i de sju övriga distrikten genom ett mycket stort antal detaljister. Följande resultat har erhållits: Distrikt Distribution Urbanise- Relativ Försäljningsnr ringsgrad inkomst volym per inv 1 Enbart A Flera detaljister Vi vill bland annat undersöka om distributionsformen kan ha betydelse för försäljningsvolymen genom att utnyttja en regressionsmodell. Sätt x 1 = { 1, om distribution genom enbart A 0, om distribution genom stort antal detaljister. x 2 = urbaniseringsgrad. 13

14 x 3 = relativ inkomst. Y = försäljningsvolym per invånare. Regressionsanalys med modellen Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε gav följande resultat: Skattad regressionslinje: y = x x x REGR RES TOT a) Verkar valet av distributionsform ha någon effekt? b) Nedan följer några analyser för olika kombinationer av förklarande variabler. Vilken förklarande variabel skulle du välja, om du bara fick ta med en variabel? Kan man vara säker på att det bästa paret av förklarande variabler innehåller den variabel du tog med ovan? Hur många förklarande variabler (en, två eller tre) anser du rimligt att ta med i detta exempel? Skattad regressionslinje: y = x REGR RES TOT Skattad regressionslinje: y = x REGR RES TOT Skattad regressionslinje: y = x REGR RES TOT Skattad regressionslinje: y = x x REGR RES TOT

15 Skattad regressionslinje: y = x x REGR RES TOT Skattad regressionslinje: y = x x REGR RES TOT GR-4.3. En viss typ av buss har bara en dörr, som måste användas både av dem som stiger av och dem som stiger på. Man har vid 20 tillfällen mätt tiden y (i sekunder) från det att bussen stannat vid en hållplats tills den åter satt igång. Samtidigt har man noterat antalet påstigande (x 1 ) och antalet avstigande (x 2 ). x 1 x 2 y Man vill försöka förklara bussens stopptid y med hjälp av en linjär regressionsmodell på x 1 och/eller x 2. En variansanalys ges nedan. a) Om du bara fick använda en förklarande variabel i regressionen, vilken skulle du då välja? Motivera svaret. Gör den nytta som förklaringsvariabel? Genomför ett lämpligt test på nivån 1%. b) Utgående från modellen i a) är det någon mening med att ta med även den andra förklarande variabeln i regressionen? Test skall genomföras på nivån 1%. Skattade korrelationer ges av x 1 x 2 x y

16 Skattad regressionslinje: y = x 1 REGR RES TOT Skattad regressionslinje: y = x x 2 REGR RES TOT GR-4.4. I en studie av överlevnadstiden för patienter med prostatacancer har man för varje patient noterat behandlingstypen (x 1 ), åldern i år (x 2 ) vid behandlingens början, halten (x 3 ) av ett visst karakteristiskt ämne, AP, i blodet, förekomsten av skelettmetastaser (x 4 ) samt överlevnadstiden (y) i månader räknat från behandlingens början. Vi har { 0 vid placebobehandling (= ingen behandling) x 1 = 1 vid östrogenbehandling x 4 = En variansanalys av datamaterialet för modellerna där ε N(0, σ 2 ), och där ɛ N(0, σ 2 ) gav de skattade korrelationerna { 0 om skelettmetastaser ej förekommer 1 om skelettmetastaser förekommer Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε (1) Y = β 0 + β 1 x 1 + β 3 x 3 + ε (2) och x 1 x 2 x 3 x 4 x x x y Skattad regressionslinje: y = x x x x REGR RES TOT Skattad regressionslinje: y = x x 3 16

17 REGR RES TOT a) Betrakta modell 1. Hur tycks östrogenhalten påverka överlevnadstiden? Motivera ditt svar genom att konstruera ett lämpligt konfidensintervall med konfidensgraden 80%, vilket egentligen är en väl låg konfidensgrad. b) Variabeln x 3 fungerar bäst som ensam förklaringsvariabel (varför?), x 1 vill man ha med i modellen, eftersom ett av målen är att avgöra om östrogenbehandlingen gör nytta, men är det meningsfullt att ta med även x 2 och x 4? Genomför ett lämpligt test på nivån 5%. c) Nämn någon fördel med regressionsanalyser av den typ vi gjort här jämfört med att dela in patienterna i två behandlingsgrupper och undersöka om det finns någon skillnad i förväntad överlevnadstid. GR-4.5. Följande datamaterial illustrerar tillväxten i en bakterieodling. t y där t = antalet dagar efter inympningen och y = antalet bakterier. Modell 1: Y t = e β0+β1t+εt där ε t N(0, σ 2 ). Konstruera ett 95% prediktionsintervall för antalet bakterier vid tidpunkten 20, dvs för Y 20. Skattad regressionslinje: ln(y) = t REGR RES TOT (X X) 1 = ( )

18 Svar GR-1.5. a) 1 Φ(0.577) 0.28 b) Y = (X 1 + X 3 )/2. GR-1.6. a) Y N (( ) ( 10 20, )) ; b) 1 Φ(1.135) 0.13; c) ρ = 0.2. GR-1.7. ˆX3 = X X GR-1.8. a) Y = AX = X. Då är E(Y ) = A E(X) = b) P (Y 2 > 2Y 3 ) = P (Y 2 2Y 3 > 0); Y 2 2Y 3 = (0 1 2)Y; Y 2 2Y 3 N ( ) 1 1, ( ) C Y 0 1 = N(1, 10); 0 2 P (Y 2 2Y 3 > 0) = Φ(1/ 10) och C Y = AC X A = c) Y 1 och Y 2 är oberoende, eftersom de har simultan normalfördelning med cov(y 1, Y 2 ) = 0. GR-1.9. ε N(0, 1.02); P ( ε > 2) = GR-2.1. Skriv e som en linjär transformation av Y -vektorn. GR-2.3. a) v = > (ur F (2.7)-tabell). H 0 förkastas. b) x = 5.82 ger maximum för det skattade regressionsuttrycket. c) Med hänsyn till kurvans utseende bör inte någon av förklaringsvariablerna uteslutas. GR-2.4. a) Modell 2 har förklaringsgrad R 2 = 96.7% vilket är klart bättre än R 2 = 77.9% för modell 1. b) I β3 = ( ) = (3.312, ). Ett manus baserat på en bok ser ut att ge högre bruttointäkter. c) ˆβ ˆβ ˆβ 2 + ˆβ 3 = Den förväntade bruttointäkten är cirka 67 miljoner dollar. GR-2.5. a) Y = Xβ + ε där X = ( ) 1 ( ) ˆβ = (X X) 1 X y = ˆβ 0 + ˆβ 1 x i : σ 2 skattas med s 2 = 1 3 (yi ˆβ 0 ˆβ 1 x i ) 2 = GR-2.6. a) I µ = (50.0, 57.4) b) I β0+100β 1 = (53.4, 54.4) ( ) ; y = ( ) = ( ) ( ) = ( ) c) Den linjära modellen beskriver datamaterialet bäst; detta styrks både av plotten och variansskattningarna. GR-2.7. I µ0 = (ˆµ 0 t s ) (4.2, 8.8). Värdena i I µ0 verkar låga, vilket bland annat kan bero på att sambandet mellan y och x 2 inte är linjärt. GR-2.8. U 0 = 60Y 0 där Y 0 = β β β 2 + ε 0 ; I Y0 = (123.79, ) ger I u0 (7 400, ). Intervallet är så långt att det är tveksamt om man har nytta av det. 18

19 GR-2.9. a) I β2 = (1.20, 1.70) dvs 0 I β2 och observation nr 12 tycks avvika från de övriga. b) Med hjälp av analys 3 gör vi ett prediktionsintervall för Y 12 : I Y12 = (140.74, ) dvs y 12 = I Y12 och observation nr 12 tycks avvika. GR a) I β1 = ( t ) = ( 6.03, 4.82) där t = 2.10 ges i t(18)-tabell. 4 / I β1. Alltså kan H 0 förkastas på nivån b) Vi konstruerar ett konfidensintervall för β 0 + 8β 1. ˆβ 0 +8 ˆβ 1 = 5.30; den stokastiska variabeln ˆβ 0 +8 ˆβ 1 N(β 0 +8β 1, 0.15σ 2 ) eftersom var( ˆβ 0 +8 ˆβ 1 ) = σ 2 (1 8)(X T X) 1( 1 8) = 0.15σ 2. σ 2 skattas med s 2 = Q res /18 = ; frihetsgrader: 18 Hjälpvariabeln ˆβ 0+8 ˆβ 1 (β 0+8β 1) s 0.15 I β0+8β 1 t(18) och den ger = ( ˆβ ˆβ 2.10s 0.15) ( 8.28, 2.32). 0 / I β0+8β 1. Alltså kan vi förkasta hypotesen att regressionslinjen skär x-axeln vid x = 8. Eftersom intervallet bara innehåller negativa värden tycks åtta timmars sömn förbättra testresultatet, vilket kan innebära att utvilade personer har en inlärningseffekt. GR a) I β2 = ( t ) ( 29.6, 17.1). Krigstillstånd verkar ge lägre privat konsumtion. b) Vi söker ett prediktionsintervall för Y 0 = β β 1 + ε 0 ; m 0 = ( ) β; ˆm 0 = ( ) ˆβ = ; notera att ˆβ0 = interceptskattningen; var( ˆm 0 ) = ( ) 1 σ 2 (X X) = σ 2 0 Den stokastiska variabeln Y 0 ˆm 0 N(0, σ 2 ). σ 2 skattas med s 2 = Q RES /12 = ; s = 3.411; frihetsgrader: 12. Hjälpvariabeln (Y 0 ˆm 0 )/(s ) t(12) den ger I Y0 = ( ˆm 0 t s ) = (128.5, 150.7) där t = GR Prediktionsintervall för vinsten I Y0 = (74, 183) GR a) v = > 9.8 (ur F (2, 21)-tabell). H 0 förkastas. b) β 1 β 2 = ( ) β; den stokastiska variabeln ˆβ 1 ˆβ 2 N(β 1 β 2, σ 2 ); I β1 β 2 = ( 4.18, 1.90); 0 / I β1 β 2. De externa användarna tycks belasta datorn hårdare. GR-3.1. a) Sambandet mellan y t och t ser ut att vara en krökt kurva av andragradstyp. var(ε t ) ser ut att växa då t växer. b) Skatta β genom att utgå från Z t = Y t / t som får en regressionsmodell utan konstantterm. ˆβ = (X X) 1 X Z där X är koefficientmatrisen som hör ihop med Z-vektorn. GR-4.1. a) I β3 = (0.27, 0.54); 0 / I β3. Antalet tåg per dag tycks vara av betydelse. b) H 0 : β 1 = β 2 = 0 prövas med hjälp av v = 5.22 > H 0 förkastas. Det finns med stor sannolikhet skillnader mellan spårtyperna. GR-4.2. a) Ja, eftersom konfidensintervallet för β 1 inte innehåller nollan. b) Fråga 1: x 2. Fråga 2: Nej. Fråga 3: Modellen med x 1 och x 2 som förklaringsvariabler ger minst variansskattning. GR-4.3. a) x 1 är den bästa ensamma förklaringsvariabeln, eftersom den är starkast korrelerad med y. Teststorheten u = > 8.29, varför x 1 gör nytta som förklaringsvariabel. b) Teststorheten v = > 8.4. Ta med även x 2 i modellen. 19

20 GR-4.4. a) I β1 = ( ± t ) = ( ± ) (1, 19) där t = 1.30 ges i t(45)-tabell. Östrogenbehandling tycks öka överlevnadstiden. b) x 3 är starkast korrelerad med y och fungerar därför bäst som ensam förklaringsvariabel. Vi prövar modell 2 mot modell 1, dvs med ett F-test. Teststorhet H 0 : β 2 = β 4 = 0 mot H 1 : någon av β 2 och β 4 0 v = ( )/ /45 = 1.84 F (2, 45)-tabell ger kritiska gränsen < 3.2. H 0 kan ej förkastas. Modell 2 duger. c) Genom att ta med extra förklaringsvariabler utöver behandlingstypen kan man förklara en del av variationen, vilket ger mindre variansskattning, och då är det lättare att upptäcka behandlingseffekter. Vidare kan man hitta variabler som har betydelse för överlevnadstiden mm. GR-4.5. I Z0 = I ln Y0 = ( , ) dvs I Y0 = (878000, ). 20

21

22

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

TAMS65. Problemsamling. Martin Singull

TAMS65. Problemsamling. Martin Singull TAMS65 Problemsamling Martin Singull 1 2 1. En tillverkare av datorer har tagit emot ett mycket stort parti elektroniska komponenter, vars livslängd mätta i år skall vara oberoende och exponentialfördelade

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65 Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Stokastiska vektorer

Stokastiska vektorer TNG006 F2 9-05-206 Stokastiska vektorer 2 Kovarians och korrelation Definition 2 Antag att de sv X och Y har väntevärde och standardavvikelse µ X och σ X resp µ Y och σ Y Då kallas för kovariansen mellan

Läs mer

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24 1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

REGRESSIONSANALYS. Martin Singull

REGRESSIONSANALYS. Martin Singull REGRESSIONSANALYS Martin Singull 16 april 2018 Innehåll 1 Beroendemått och stokastiska vektorer 4 1.1 Beroendemått........................................... 4 1.2 Stokastiska vektorer.......................................

Läs mer

oberoende av varandra så observationerna är

oberoende av varandra så observationerna är Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

TAMS65 DATORÖVNING 2

TAMS65 DATORÖVNING 2 TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Föreläsning 9: Linjär regression del II

Föreläsning 9: Linjär regression del II Föreläsning 9: Linjär regression del II Johan Thim (johan.thim@liu.se) 29 september 2018 No tears, please. It s a waste of good suffering. Pinhead Vi fixerar en vektor u T = (1 u 1 u 2 u k ), där u i kommer

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013.

TAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013. Formel- och tabellsamling i matematisk statistik c Martin Singull 2 Innehåll 3.3 Tukey s metod för parvisa jämförelser.................... 14 1 Sannolikhetslära 5 1.1 Några diskreta fördelningar.........................

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 2, 6 DECEMBER 2017 Syfte Syftet med den här laborationen är att du ska

Läs mer

Bayesiansk statistik, 732g43, 7.5 hp

Bayesiansk statistik, 732g43, 7.5 hp Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Extrauppgifter i matematisk statistik

Extrauppgifter i matematisk statistik Extrauppgifter i matematisk statistik BT 2014 1. Mängden A är dubbelt så sannolik som B. Hur förhåller sig P(A B) till P(B A)? 2. Två händelser A och B har sannolikheter skilda från noll. (a) A och B är

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Lycka till!

Lycka till! Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och

Läs mer

Extrauppgifter - Statistik

Extrauppgifter - Statistik Extrauppgifter - Statistik Uppgifter 1. Den stokastiska variabeln Y t 10 ). Bestäm c så att P ( c < Y < c) = 2. Vid tillverkning av en viss sorts färg tillsätts färgpigmentet med hjälp av en doseringsapparat,

Läs mer

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska

Läs mer

Thomas Önskog 28/

Thomas Önskog 28/ Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Föreläsning 7: Stokastiska vektorer

Föreläsning 7: Stokastiska vektorer Föreläsning 7: Stokastiska vektorer Johan Thim johanthim@liuse oktober 8 Repetition Definition Låt X och Y vara stokastiska variabler med EX = µ X, V X = σx, EY = µ Y samt V Y = σy Kovariansen CX, Y definieras

Läs mer

9. Konfidensintervall vid normalfördelning

9. Konfidensintervall vid normalfördelning TNG006 F9 09-05-016 Konfidensintervall 9. Konfidensintervall vid normalfördelning Låt x 1, x,..., x n vara ett observerat stickprov av oberoende s.v. X 1, X,..., X n var och en med fördelning F. Antag

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Stokastiska vektorer och multivariat normalfördelning

Stokastiska vektorer och multivariat normalfördelning Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två

Läs mer

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 15, FMSF45 Multipel linjär regression Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd

Läs mer

2.1 Mikromodul: stokastiska processer

2.1 Mikromodul: stokastiska processer 2. Mikromodul: stokastiska processer 9 2. Mikromodul: stokastiska processer 2.. Stokastiska variabler En stokastiskt variabel X beskrivs av dess täthetsfunktion p X (x), vars viktigaste egenskaper sammanfattas

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 6 Johan Lindström 13 september 2017 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 1/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

TAMS65 - Föreläsning 6 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning TAMS65 - Föreläsning 6 Hypotesprövning Martin Singull Matematisk statistik Matematiska institutionen Innehåll Exempel Allmän beskrivning P-värde Binomialfördelning Normalapproximation TAMS65 - Fö6 1/33

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik. UPPSALA UNIVERSITET Matematiska institutionen Erik Broman, Jesper Rydén TENTAMEN I MATEMATISK STATISTIK Sannolikhet och statistik 1MS5 214-1-11 Skrivtid: 8.-13.. För betygen 3, 4 resp. 5 krävs 18, 25 resp.

Läs mer

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 12, FMSF45 Hypotesprövning Föreläsning 12, FMSF45 Hypotesprövning Stas Volkov 2017-11-14 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 1/1 Konfidensintervall Ett konfidensintervall för en parameter θ täcker rätt

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, 8-5-4 EXEMPEL: Hur mycket kunder förlorar vi om vi höjer biljettpriset?

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.

Läs mer

TAMS65 - Föreläsning 6 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning TAMS65 - Föreläsning 6 Hypotesprövning Martin Singull Matematisk statistik Matematiska institutionen Innehåll Exempel Allmän beskrivning p-värde Binomialfördelning Normalapproximation TAMS65 - Fö6 1/36

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2015-10-23 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Jesper Martinsson,

Läs mer

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018 SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 11 INTERVALLSKATTNING. Tatjana Pavlenko 24 april 2018 PLAN FÖR DAGENS FÖRELÄSNING Vad är en intervallskattning? (rep.) Den allmänna metoden för

Läs mer

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski FACIT för Förberedelseuppgifter: SF9 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 206 KL 4.00 9.00. Examinator: Timo Koski - - - - - - - - - - - - - - - - - - - - - - - - 0. FACIT Problem

Läs mer

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsningsanteckningar till kapitel 8, del 2 Föreläsningsanteckningar till kapitel 8, del 2 Kasper K. S. Andersen 4 oktober 208 Jämförelse av två väntevärden Ofte vil man jämföra två eller fler) produkter, behandlingar, processer etc. med varandra.

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Uppgift a b c d e Vet inte Poäng

Uppgift a b c d e Vet inte Poäng TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk

Läs mer

Finansiell statistik

Finansiell statistik Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-06-03 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande

Läs mer

F9 Konfidensintervall

F9 Konfidensintervall 1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen för kursen. Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Sal 22, hus

Läs mer

Lufttorkat trä Ugnstorkat trä

Lufttorkat trä Ugnstorkat trä Avd. Matematisk statistik TENTAMEN I SF1901 och SF1905 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 18:E OKTOBER 2012 KL 14.00 19.00. Examinator: Tatjana Pavlenko, tel 790 8466. Tillåtna hjälpmedel:

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =

Läs mer

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:... Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för

Läs mer

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M Tentamen i Sannolikhetslära och statistik Kurskod S0008M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-10-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Mykola

Läs mer