Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik, Föreläsning 5

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Kompletterande kursmaterial till kursen Matematisk statistik.

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Matematisk statistik TMS064/TMS063 Tentamen

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

tentaplugg.nu av studenter för studenter

10.1 Enkel linjär regression

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

LABORATION 3 - Regressionsanalys

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

LABORATION 3 - Regressionsanalys

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Antal P(ξ = x)

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN Datum: 14 feb 2011

Metod och teori. Statistik för naturvetare Umeå universitet

Examinationsuppgifter del 2

Läs noggrant informationen nedan innan du börjar skriva tentamen

TENTAMEN I STATISTIK B,

0 om x < 0, F X (x) = c x. 1 om x 2.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Regressions- och Tidsserieanalys - F3

Matematisk statistik LKT325 Tentamen med lösningar

Läs noggrant informationen nedan innan du börjar skriva tentamen

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Stockholms Universitet Statistiska institutionen Termeh Shafie

Regressions- och Tidsserieanalys - F3

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

tentaplugg.nu av studenter för studenter

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Stockholms Universitet Statistiska institutionen Termeh Shafie

b) Förekommer A- och B-fel oberoende av varandra? (Motivering krävs naturligtvis!) (5 p)

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Lycka till!

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Avd. Matematisk statistik

TENTAMEN I MATEMATISK STATISTIK

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i matematisk statistik

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (7 uppgifter) Tentamensdatum 2011-01-14 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och Ove Edlund Jourhavande lärare: Adam Jonsson Tel: 0766-317460 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium i Regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, ska enbart svar lämnas in, men lösningar får bifogas. Observera dock att dessa kommer ej att bedömas utan enbart användas vid gränsfall för att avgöra om någon uppgift kan rättas upp på grund av slarvfel. På del 1 ges inga delpoäng på uppgifterna. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Detta blad måste lämnas in. Lägg detta blad först bland lösningarna. Om inte det ifyllda svarsbladet har lämnats in så bedöms tentamen som underkänd. För godkänt krävs minst 19 poäng på del 1. Med 4 extrapoäng från laborationerna och KGB så räcker det med 15 poäng av de 25 möjliga för godkänt. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2011-01-14 1. En slumpmässigt utvald student vid en högskola betalar sina räkningar genom någon internetbank med sannolikheten 42 %. Sannolikheten att en student har mobiltelefon är 62 %. Sannolikheten att en student har både mobiltelefon och betalar sina räkningar genom en internetbank är 35 %. (a) Beräkna sannolikheten att en student varken har mobiltelefon eller betalar sina räkningar genom en internetbank. (b) En slumpmässigt vald student har mobiltelefon. Hur stor är sannolikheten att han också betalar räkningarna genom en internetbank? 2. Timo kastar en tärning om och om igen. Låt ξ beteckna antalet kast som krävs för att få den första sexan. De möjliga värdena på ξ är alltså de positiva heltalen 1, 2, 3,.... Beräkna sannolikheten att det krävs minst 4 kast för att få en sexa, dvs beräkna P (ξ 4). 3. Längden för graviditeter hos honor i en mycket stor population apor, pop1, kan beskrivas med en normalfördelning som har väntevärdet 136 dagar och standardavvikelsen 18.6 dagar. (a) Bestäm den längsta av de 3 % kortaste graviditeterna. (b) I en annan stor population apor, pop2, kan graviditeternaz längd beskrivas med en N(121, 12.4) fördelning. Vad är då sannolikheten att graviditeten för en hona i pop1 är längre än den för en hona i pop2? 4. Iljan tar varje morgon två bussar för att komma till skolan. Bussarna avgår 6 ggr/timme, men eftersom tidtabell saknas betraktar Iljan de två väntetiderna ξ 1, ξ 2 som oberoende slumpvariabler, var och en med en rektangelfördelning R(0, 10). Man kan visa att Iljans totala väntetid, ξ Iljan = ξ 1 + ξ 2, har frekvensfunktionen x 100, 0 x 10 f(x) = 2 10 x 100, 10 x 20 0 för övrigt. (a) Beräkna sannolikheten att Iljans totala väntetid en morgon blir mellan 8 och 12 minuter. Iljans syster Vera tar de två bussarna tillsammans med Iljan, men tar sedan en ytterligare buss som går 4 ggr/timme. Hennes totala väntetid är ξ V era = ξ Iljan + ξ 3, där ξ 3 R(0, 15). (b) Bestäm E(ξ V era ), dvs bestäm Veras förväntade totala väntetid. 5. En läkare vill veta om svenska män har större överarmsmått på höger sida eller om måttet på höger och vänster sida i genomsnitt är detsamma. Hon hittar en undersökning av 10 män som genomförts av en 2 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2011-01-14 kollega. Kollegan har dock inte noterat de faktiska mätvärdena, utan endast angivit (med +) om personens högra överarmsmått var större. Resultatet återges nedan: Man nr 1 2 3 4 5 6 7 8 9 10 Mätning + + + + + + - + + + (a) Läkaren tycker att det är rimligt att använda antalet + tecken för att testa H 0 : ingen genomsnittlig skillnad H 1 : höger sida är större i genomsnitt (1) och förkasta H 0 om antalet + tecken är minst 8. Hon förkastar därför hypotesen att måtten i genomsnitt är lika på höger och vänster sida. Vilken signifikansnivå har det test som läkaren tillämpat? (b) Läkaren är inte nöjd med den metod som användes i (a) och beslutar sig därför för att göra en ny undersökning om 10 personer. Resultatet återges nedan. Nr 1 2 3 4 5 6 7 8 9 10 H 38.2 46.2 37.5 39.1 39.5 46.1 26.6 34.7 31.4 28.4 V 38.3 44.1 36.2 37.7 38.8 44.1 27.2 33.7 31.5 26.8 En beräkning gav x H = 36.77, x V = 35.84, s H = 6.65, s V = 6.10, z = 0.930, s z = 0.933, där z och s z betecknar medelvärde och standardavvikelse för differensserien z i = x H,i x V,i, i = 1, 2,..., 10. Beräkna ett lämpligt 98% konfidensintervall för den genomsnittliga skillnaden mellan överarmsmåttet på höger och den vänster sida (höger minus vänster) under rimliga normalfördelningsantaganden. Ange intervallets nedre ändpunkt. 6. Livslängderna för en viss typ av elektroniska komponenter antas vara oberoende och Exponentialfördelade med väntevärde 1/λ år. (a) Man vill pröva hypotesen att den förväntade livslängden är 2 år. För att testa H 0 : λ = 1/2 mot H 1 : λ > 1/2 använder man observerade livslängder x 1,..., x 40 för 40 slumpmässigt utvalda komponenter och beslutsregeln: förkasta H 0 om x < 1.48. Använd centrala gränsvärdessatsen för att beräkna styrkan hos testet om λ = 2/3. (b) När man tillämpade testet i (a) kunde H 0 inte förkastas. Man antog därför att λ = 1/2. Givet att en slumpmässigt utvald komponent har fungerat i 3 år, vad är sannolikheten att den fungerar i ytterligare 1 år? 3 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2011-01-14 7. I en studie av tryckhållfastheten hos betong varieras proportioner hos beståndsdelarna samt betongens ålder. I undersökningen användes som förklarande variabler bl.a. andelen Cement, masugnsslagg (Slag) och vatten (Water), alla i enheten kg/m 3, samt betongens ålder (Age) i enhet dagar. Mot detta mättes den beroende variabeln, tryckhållfasthet (Concrete compressive strength) i enheten MPa. En regressionsanalys av en delmängd av datamaterialet, bestående av 30 observationer, ger upphov till resultatet i tabell 1. (a) Bestäm residualspridningen s e. (b) Bestäm den justerade förklaringsgraden R 2 a. (c) För att avgöra om Slag ska vara med som förklarande variabel på 1% signifikansnivå, jämförs t-kvot med ett tal. Ange detta tal samt ange (Ja eller Nej) om Slag ska behållas som förklarande variabel. (Ange Ja om variabeln Slag skall behållas.) (d) Finn ett 99% konfidensintervall för hur Concrete compressive strength förändras i genomsnitt om Water ökar med 1 kg/m 3 och övriga förklarande variabler hålls konstant. Svara med den undre gränsen. Tabell 1: Regression Analysis: Concrete compres versus Cement; Slag; Water; Age The regression equation is Concrete compressive strength = - 0,3-0,0984 Cement - 0,122 Slag + 0,374 Water + 0,0233 Age Predictor Coef SE Coef T P Constant -0,32 12,43-0,03? Cement -0,09837 0,01358-7,24? Slag -0,12164 0,01748-6,96? Water 0,37374 0,06440 5,80? Age 0,023329 0,004444 5,25? S =? R-Sq =? R-Sq(adj) =? Analysis of Variance Source DF SS MS F P Regression? 1185,37 Residual Error? 241,29 Total 29? Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2011-01-14 Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Ett fel i svaret på uppgift 2 rättades den 25 januari Fråga Svar Poäng 1 a Sannolikhet (procent, en decimal) 31.0 1 b Sannolikhet (procent, två decimaler ) 56.45 2 2 Sannolikhet (procent, en decimal) 57.9 (exakt 2 (5/6) 3 ) 3 a Längden (en decimal) 101.0 1 b Sannolikhet 74.9 (Φ(0.67)) 2 4 a Sannolikhet (procent, en decimal) 36.0 2 b Väntevärde (en decimal) 17.5 2 5 a Signifikansnivå (procent, två decimaler) 5.47 2 b Nedre gräns (en tre decimaler) 0.098 2 6 a Styrka (procent, en decimal) 46.8 (Φ( 0.08)) 2 Sannolikhet (procent, en decimal) 60.7 (e 0.5 ) 2 7 a Residualspridning (tre decimaler) 3.107 1 b Justerad förklaringsgrad (procent, tre decimaler) 80.381 1 c t-kvot jämförs med (tre decimaler) 2.787 Ja eller Nej Ja 1 d Undre gräns (fyra decimaler) 0.1943 (0.1942572 exakt) 2 Totalt antal poäng 25 5 (10)

Tentamen i Matematisk statistik, S0001M, del 1 2011-01-14 6 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2011-01-14 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 8. Alla räkneregler för sannolikheter som vi är vana att använda kan härledas från sannolikhetsaxiomen. Tex så kan man bevisa Sats 2B på följande sätt: A A c = Ω och P (Ω) = 1 ger att P (A A c ) = 1. Eftersom A och A c (per definition) är disjukta får vi 1 = P (A A c ) = P (A) + P (A c ), dvs P (A) = 1 P (A c ). (a) Antag att A och B är händelser och att B alltid inträffar då A inträffar. Antag med andra ord att A är en delmängd av B. Visa att P (A) P (B). (b) Antag att A och B är oberoende händelser. Visa att A c och B c är oberoende händelser. (5p) (5p) Det kan underlätta att rita Venndiagram men endast figurer kommer inte att ge full poäng. Du kan använda Sats 2B och Sats 2C utan bevis. Lösning (a) Vi har B = A E, där E = B A c. Eftersom A och E är disjunkta och P (E) 0 får vi P (B) = P (A E) = P (A) + P (E) P (A). (b) Vi vet att P (A B) = P (A)P (B) och vill visa att P (A c B c ) = P (A c )P (B c ). Vi har A c B c = (A B) c. (Mer allmänt gäller n j=1 Ac j = ( n j=1 A j) c. Resultatet kallas ibland De Morgans lag och gäller för en godtycklig samling mängder {A j } j J.) Vi får P (A c B c ) = P ((A B) c ) = 1 P (A B) enligt Sats 2B = 1 (P (A) + P (B) P (A B)) enligt Sats 2C = 1 P (A) P (B) + P (A)P (B) = (1 P (A))(1 P (B)) = P (A c )P (B c ) enligt Sats 2B. (2) 9. Vi fortsätter med uppgift 5. En läkare vill veta om svenska män har större överarmsmått på höger sida eller om måttet på höger och vänster sida i genomsnitt är detsamma. Hon betraktar de tio differenserna z 1 = 0.1, z 2 = 2.1,..., z 10 = 1.6 från sin undersökning som observationer på oberoende N(δ, σ) fördelade stokastiska variabler, där σ är okänd och δ är den genomsnittliga skillnaden mellan överarmsmåttet 7 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2011-01-14 på höger och vänster sida. För att testa H 0 : δ = 0 mot H 1 : δ > 0 väljer hon mellan teckentestet: förkasta H 0 om x 8, där x är det observerade antalet positiva differenser, och t-testet: förkasta H 0 om t = z s z / 10 > 1.83. (a) Tillämpa de två testen. Ger de samma slusats? (b) Beräkna styrkan för teckentestet i fallen att δ = 1.2816, σ = 1 och δ = 1.6445, σ = 1. (c) Styrkefunktionen S(µ, σ) för teckentestet beror av både δ och σ men om vi t.ex. betraktar fallet σ = 1 så kan S(µ, 1) skissas som funktion av δ. Gör det. Skissen behöver inte vara exakt. Motsvarande styrkefunktion för t-testet kan inte beräknas exakt med de metoder vi har lärt oss i kursen men. Visa med hjälp av en skiss i samma diagram hur du tror att den ser ut. Det är förhållandet mellan de två funktionerna som är av betydelse. Motivera varför du tror att förhållandet som du skissat gäller. (4p) (6p) Lösning (a) Vi har x = 7 och t = 3.15. Alltså skall H 0 förkastas enligt t-testet och accepteras enligt teckentestet. (b) Eftersom z i är en observation från N(δ, 1) är sannolikheten för en positiv differens i fallen δ = 1.2816 och δ = 1.6445 lika med 0.9 resp 0.95. Det betyder att x i de två fallen är en observation från Bin(10, 0.9) respektive Bin(10, 0.95) och såldes att x = 10 x, dvs antalet negativa differenser, är en observation från Bin(10, 0.1) eller Bin(10, 0.05). Med hjälp av Binomialfördelningstabellen får vi att styrkan i de två fallen är P (x 2) = 0.9104 respektive P (x 2) = 0.9848. (c) Grafen till S(δ), δ > 0 skall ritas mjuk. Det skall framgå att S(1.2816) = 0.91, S(1.6445) = 0.98 samt att signifikansnivån är ca 5% (5.47% exakt). Grafen till styrkefunktionen för t-testet skall ritas mjuk och det skall framgå att signifikansnivån är 5%. Styrkefunktionen för t-testet ligger över Styrkefunktionen för teckentestet. Det beror på att t-testet konstruerats med modellantagandet (dvs normalfördelningsantagandet) som utgångspunkt. Det har inte teckentestet. Så under förutsättning att antagandet är rimligt kan man säga att t-testet använder informationen bättre och däför upptäcker när H 0 är falsk med större sannolikhet. 10. Datamaterialet i Tabell 2, som består av 38 observationer, beskriver hur antal inkomna ordrar (ordrar 1000) för postorderföretag beror av upplagan på katalogen (uppl 1000) och antal tryckta sidor i katalogen (sidor). 8 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2011-01-14 Tabell 2: Datamaterialet som beskriver hur antal inkomna ordrar varierar med upplagan och antal tryckta sidor. Antalet observationer är n = 38. uppl sidor ordrar 2800 22 437 2670 14 204 2800 37 725 2784 15 279 2800 38 474 2620 172 1587 2620 249 2630 2470 84 798 2620 242 2509 2475 100 1192 2620 114 882 2620 37 511 2448 96 896 uppl sidor ordrar 2648 116 1297 2525 94 857 1000 47 388 980 48 462 1000 15 67 1112 45 326 1000 23 145 1000 44 298 2188 23 179 1028 47 289 2200 31 200 1000 48 461 980 48 223 uppl sidor ordrar 728 47 235 2510 26 235 1500 58 594 2500 128 1800 2620 120 1457 2528 120 1710 2630 121 1715 2550 122 1615 1150 61 196 1150 50 309 1150 50 263 1147 60 332 För att förklara hur ordrar beror av upplaga och sidor, gör vi multipel linjär regressionanalys. Vi skapar en matris X R 38 3 vars första kolumn är ettor, andra kolumnen är uppl och tredje är sidor, och en vektor y som innehåller ordrar. Följande kvantiteter beräknas sedan 2.08385 10 1 8.64954 10 5 1.48187 10 4 (X T X) 1 = 8.64954 10 5 5.49082 10 8 2.98962 10 7 1.48187 10 4 2.98962 10 7 9.99443 10 6 364.846 (X T X) 1 (X T y) = 0.183301 10.2639 38 i=1 e 2 i = 1.15929 10 6 38 i=1 (y i y) 2 = 1.69303 10 7 där e i är elementen i residualen. Genomför följande uppgifter: Ange fullständiga modellantaganden. Plocka fram den modellfunktion som minsta-kvadratmetoden ger. Bestäm förklaringsgraden R 2. Bestäm residualspridningen s e. Bestäm skattad standardavvikelse för koefficienten till uppl, och till sidor. Gör hypotesprövning på koefficienten till uppl för att avgöra om den är skilld från 0 på 1% signifikansnivå. Bestäm ett 99% konfidensintervall för koefficienten till sidor. (9 p) Lösning: Modellantagande Y i = β 0 + β 1 X i,1 + β 2 X i,2 + ε i, där i = 1... 38 är index, Y i är antal ordrar, 728 X i,1 2800 är upplagan, 15 X i,2 249 är antal sidor, och ε i N(0, σ) är oberoende stokastiska variabler. 9 (10)

Tentamen i Matematisk statistik, S0001M, del 2 2011-01-14 I modellfunktionen skattas β 0, β 1, β 2 med b 0, b 1, b 2 som ges av normalekvationen (X T X) 1 (X T y), dvs skattade modellen är Förklaringsgraden R 2 = 1 Ŷ i = 364.846 + 0.183301 X 1,i + 10.2639 X 2,i 38 i=1 e2 i 1.15929 106 38 i=1 (y = 1 = 0.9315 = 93.15% i y) 2 1.69303 107 Residualspridningen s e = 1 38 3 38 i=1 e 2 i = 1.15929 10 6 /35 = 182.0 Skattad standardavvikelse för b 1 ges av s e gånger roten ur diagonalelement 2 i (X T X) 1, dvs s b1 = 182.0 5.49082 10 8 = 4.265 10 2 På samma sätt används diagonalelement 3 för s b2, s b2 = 182.0 9.99443 10 6 = 0.5754 Vi beräknar t-kvot = b 1 0.183301 = = 4.298. Eftersom s b1 4.265 10 2 denna är större än kritiska gränsen t 0.005 (30) = 2.750 > t 0.005 (35), kan vi dra slutsatsen att b 1 är signifkant skild från 0. Konfidensintervallet ges av [b 2 s b2 t 0.005 (35), b 2 + s b2 t 0.005 (35)] Återigen finns inte t 0.005 (35) med i tabellen, så vi använder t 0.005 (30) = 2.750 istället [10.2639 0.5754 2.750, 10.2639 + 0.5754 2.750] = [8.68, 11, 85] 10 (10)