Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Matematisk statistik TMS064/TMS063 Tentamen

Matematisk statistik, Föreläsning 5

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

0 om x < 0, F X (x) = c x. 1 om x 2.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik LKT325 Tentamen med lösningar

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Avd. Matematisk statistik

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

LABORATION 3 - Regressionsanalys

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Matematisk statistik TMS063 Tentamen

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Föreläsning 11: Mer om jämförelser och inferens

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Kompletterande kursmaterial till kursen Matematisk statistik.

FÖRELÄSNING 7:

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Lufttorkat trä Ugnstorkat trä

Tentamen i Matematisk Statistik, 7.5 hp

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

LABORATION 3 - Regressionsanalys

Avd. Matematisk statistik

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

TMS136. Föreläsning 13

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Föreläsning 12: Linjär regression

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Lycka till!

Föreläsningsanteckningar till kapitel 8, del 2

Avd. Matematisk statistik

4 Diskret stokastisk variabel

FÖRELÄSNING 8:

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Uppgift 1. f(x) = 2x om 0 x 1

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-06-03 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Jesper Martinsson Tel: 0920-491425 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs godkända webbuppgifter och minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (9)

1. Antag att dom tre händelserna A, B och C är oberoende, där P (A) = 0.3, P (B) = 0.6, P (C) = 0.18. Beräkna den betingade sannolikheten för att både B och C inträffar givet att A inträffar. 2. På Luleå Airport genomförs en slumpmässig kontroll av resenärerna. Alva ska resa från Luleå en gång i veckan under två månaders tid, dvs åtta gånger totalt. Om sannolikheten att en person blir utvald för kontroll varje gång är 0.15, vad är då sannolikheten att Alva kommer att bli kontrollerad minst tre gånger under de två månaderna? 3. Slumpvaraiblerna ξ 1 och ξ 2 är oberoende, där ξ 1 P o(1.5) och där ξ 2 har sannolikhetsfunktionen i tabellen nedan: Låt ξ = ξ 1 + ξ 2. x 0 1 2 P (ξ 2 = x) 0.4 0.5 0.1 (a) Bestäm väntevärdet av ξ. (b) Bestäm P (ξ 0). (1p) 4. Slumpvariabeln ξ har en Exponentialfördelning. Variansen i fördelningen är lika med 100. (a) Bestäm P (1 ξ < 3). (b) Bestäm medianen i fördelningen. (1p) 5. Antag att ξ 1 N(0, 1) och ξ 2 N(0, 1) är oberoende. Beräkna sannolikheten P (ξ 1 ξ 2 + 1). 6. Det har visat sig att återbäringen varje år från aktier följer en tämligen symmetrisk fördelning, men att de extrema resultaten är vanligare än i en normalfördelning. Antag att ett visst aktieindex har väntevärdet 1% och standardavvikelsen 4.7%. Antag nu att detta gäller i 43 år. Vad är den approximativa sannolikheten att medelåterbäringen under denna tidsperiod blir större än 1.3%? 7. Anders undrar om utomhustemperaturen är högre i Luleå Centrum än på Bergnäset. För att undersöka detta mäter han temperaturen vid fem tidpunkter under en dag i juni. Tid 08:15 10:00 12:00 16:00 18:00 Centrum 16.5 18.3 22.6 21.2 19.0 Bergnäset 15.3 17.7 22.9 19.5 18.1 2 (9)

Beräkna ett 95% konfidensintervall för den genomsnittliga temperaturskillnaden mellan Centrum och Bergnäset (Centrum- Bergnäset) lämpliga normalfördelningsantaganden. 8. Antag att du har ansvar för att undersöka om tillverkningstiden för en komponent till bakaxlar kan bli kortare. En ny tillverkningsmetod ska provas, och du tror att denna nya metod ger en kortare genomsnittstid än de 125 sekunder som gällt hittills. Du ska därför utföra 25 mätningar, och resultaten ska studeras i ett hypotestest där du bestämt att testet ska fungera så att det är 1 % signifikansnivå. Du tror dig kunna anta att tillverkningstiden kan beskrivas med en normalfördelning där standardavvikelsen är 5 sekunder. Ett sätt att utföra detta hypotestest är att bestämma värdet på testvariabeln w = x 125 och att sedan jämföra w med ett visst kritiskt värde. Vad blir detta kritiska värde? 9. Antag att x 1,..., x 10 är ett observerat stickprov från en fördelning vars standardavvikelse är σ 1 och att y 1,..., y 10 är ett observerat stickprov från en fördelning vars standardavvikelse är σ 2. För att testa H 0 : σ 1 = σ 2 mot H 1 : σ 1 σ 2 på 1% signifikansnivå så har man bestämt sig för att beräkna ett 99% konfidensintervall för β = σ 1 /σ 2 och sedan utgå från det intervallet för att definiera en beslutsregel. Anser du att någon av följande sex meningar beskriver en rimlig beslutsregel för att testa H 0 mot H 1 och i så fall vilken? Ange ett av alternativen (a)-(g) på svarsbladet. (a) Förkasta H 0 om konfidensintervallet innehåller β. (b) Förkasta H 0 om konfidensintervallet inte innehåller β. (c) Förkasta H 0 om konfidensintervallet innehåller talet 1. (d) Förkasta H 0 om konfidensintervallet inte innehåller talet 1. (e) Förkasta H 0 om konfidensintervallet innehåller talet 0. (f) Förkasta H 0 om konfidensintervallet inte innehåller talet 0. (g) Inget av alternativen ovan beskriver en rimlig beslutsregel. 10. Jane letar lägenhet i Storstad. Med hjälp av uppgifter från 31 nyligen avslutade lägenhetsförsäljningar tar hon fram en skattad regressionsmodell Ŷ = b 0 + b 1 X 1 + b 2 X 2, där Y är priset (enhet: kkr) för en lägenhet, X 1 är lägenhetens yta och där X 2 är en dummyvariabel som antar värdet 1 om lägenheten har balkong och 0 om den saknar balkong. Tabellen nedan innehåller minsta-kvadrat skattningar av regressionskoefficienterna samt deras skattade standardavvikelser: 3 (9)

b 0 = 894 s b0 = 195 b 1 = 25.88 s b1 = 2.33 b 2 = 489 s b2 = 159 Regressionskvadratsumman och den totala kvadratsumman är 31 i=1 (Ŷi Ȳ )2 = 20318884 respektive 31 i=1 (Y i Ȳ )2 = 23959368. (a) Bestäm den justerade förklaringsgraden. (1p) (b) För att testa om en balkong i genomsnitt påverkar priset på lägenheter i Storstad så kan man antingen beräkna en lämplig t-kvot och jämföra den med ett tal från t-tabellen, eller så kan man jämföra ett lämpligt P-värde med önskad signifikansnivå. Besvara följande två frågor: 1. Vad är är värdet på t-kvoten? 2. Är P-värdet i fråga mindre eller större än 0.001 (dvs 0.1%)? För poäng på denna uppgift krävs rätt svar på båda frågorna. (c) Låt 1 beteckna det genomsnittliga priset för lägenheter i Storstad som har balkong och är på 35 kvm, och låt 0 beteckna det genomsnittliga priset för lägenheter i Storstad som inte har balkong och är på 35 kvm. Bestäm ett 99 % konfidensintervall för 1 0. Dvs utgå från den skattade modellen och bestäm ett 99 % konfidensintervall för den genomsnittliga effekt som en balkong har på priset för lägenheter som är på 35 kvm. Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (9)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.108 2 2 Sannolikhet (tre decimaler) 0.105 2 3 a Väntevärde (tre decimal) 2.200 2 b Sannolikhet (tre decimaler) 0.089 1 4 a Sannolikhet (tre decimaler) 0.164 1 b fördelningsmedian(tre decimaler) 6.931 2 5 Sannolikhet (tre decimaler) 0.761 2 6 Sannolikhet (tre decimaler) 0.337 2 7 Undre och övre gräns (tre decimaler) -0.107, 1.747 2 8 kritiska värdet (tre decimaler) -2.326 2 9 ett av alternativen (a)-(g) (d) 2 10 a justerad förklaringsgrad (fyra decimaler) 0.8372 1 b värde på t-kvoten (tre decimaler) 3.075 Ange STÖRRE eller MINDRE STÖRRE 2 c Undre och övre gräns (tre decimaler) 49.683, 928.317 2 Totalt antal poäng 25 5 (9)

1. Vi har Oberoendet ger P (B C A) P (A) P (B C A) = = P (B)P (C)P (A) P (A) P (B C A) 0.6 0.18. P (A) = P (B)P (C) = 0.6 0.18 = 0.108. 2. Låt ξ =antal gånger som Alva blir kontrollerad. Om vi antar att kontrollerna är stokastisk oberonde (vilket vi gör) så har vi ξ Bin(8, 0.15). Sannolikheten P (ξ 3) beräknas med hjälp av miniräknare eller tabell. 3. (a) Vi har E(ξ 1 ) = 0 0.4 + 1 0.5 + 2 0.1 = 0.7 och E(ξ 2 ) = 1.5 enligt formelbladet. Sats 5A ger E(ξ 1 +ξ 2 ) = E(ξ 1 )+E(ξ 2 ) = 0.7+1.5 = 2.2. (b) Eftersom P (ξ < 0) = 0 så har vi P (ξ 0) = P (ξ = 0). Att ξ är noll är samma sak som att ξ 1 och ξ 2 båda är noll. Så P (ξ = 0) = P (ξ 1 = 0, ξ 2 = 0) = P (ξ 1 = 0)P (ξ 2 = 0) = 0.4 e 1.5 = 0.089. 4. Vi har V (ξ) = 1/λ 2. Så att variansen är lika med 100 betyder att λ = 0.1. Fördelningsfunktionen är således P (ξ x) = 1 e 0.1x. (a) Vi har P (ξ 3) = F (3) F (1). (b) Medianen definieras via ekvationen Alltså ska det gälla att F (m) = 0.5. 1 e m/10 = 0.5. Då vi löser ut m får vi m = 10 log(0.5) = 6.931. 5. Vi har P (ξ 1 ξ 2 + 1) = P (ξ 1 ξ 2 1), där ξ 1 ξ 2 N(0, 2) enligt Sats 6B. Det ger P (ξ 1 ξ 2 + 1) = P ( ξ 1 ξ 2 1 ) = Φ(1/ 2). 2 2 }{{} N(0,1) 6. Låt ξ 1,..., ξ 43 vara återbäringen de olika åren. Vi söker P ( ξ > 1.3), där ξ = (ξ 1 + + ξ 43 )/43. Enligt uppgift har vi µ = E(ξ i ) = 1 och σ = V (ξ i ) = 4.7. Centrala gränsvärdessatsen ger att ξ approximativt är N(1, 4.7/ 43) = N(1, 0.7167). Det ger (approximativt) att P ( ξ > 1.3) = 1 P ( ξ 1.3) = 1 P ( ξ 1 1.3 1 ) } 0.7167 {{}} 0.7167 {{} N(0,1) 0.4185 1 Φ(0.42) = 0.337. 6 (9)

7. Här använder vi metoden för stickprov i par. Detta eftersom temperaturen varierar över dygnet. 8. Låt µ vara den genomsnittliga tillverkningstiden. Vi har att x är en observation på N(µ, 5/ 25), dvs på N(µ, 1). Då µ = 225 så är x en observation på N(225, 1) och w en observation på N(0, 1). Här ska vi testa H 0 : µ = 225 mot H 1 : µ < 225. Lämplig beslutsregel är: förkasta H 0 om w k, och detta ska ske med sannolikhet 0 då H 0 är sann. Eftersom w är en observation på N(0, 1) när H 0 är sann så får vi. 9. Att β är skild från 1 är samma sak som att H 0 är falsk. Att talet 1 inte finns med i intervallet för β tyder alltså på att H 0 är falsk. Dvs d ger en lämplig beslutsregel. 10. (a) Vi använder formeln i regressionshäftet med n = 31 och K = 3. (b) Hypoteser ges av H 0 : β 2 = 0 (balkong har ingen effekt) och H 1 : β 2 0 (balkong har effekt). T-kvoten b 2 /s b2 är 3.075. Den är mindre än t 0.0005 (28), så H 0 förkastas inte på 0.1 %. Då måste P-värdet vara större än 0.1%. (Annars skulle ju H 0 förskastas.) (c) Modellantagandet för den skattade modellen kan förenklas E(Y ) = β 0 + β 1 X 1 + β 2 X 2. Då X 2 = 0 får vi Då X 2 = 1 får vi E(Y ) = β 0 + β 1 X 1. E(Y ) = β 0 + β 2 + β 1 X 1. Differensen av dessa kvantiteter ger effekten av balkong och den är β 2, oavsett vilken storlek lägenheten har. Konfidensintervallet för β 2 ges av b 2 ± t 0.005 (28)s b2. 7 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2016-06-03 Till uppgifterna på del 2 krävs fullständiga lösningar. 11. Ett godtyckligt tal kan skrivas som en summa av ett heltal och ickeheltalsdel. För icke-heltalsdelen av ett tal a, som vi här betecknar [a], gäller att 0 [a] < 1. Dvs om a = 3.25 så har vi [a] = 0.25. Om a = 6.667, så har vi [a] = 0.667. Låt ξ 1 och ξ 2 vara oberonde och R(0, 1)-fördelade. Deras summa ξ = ξ 1 + ξ 2 har följande frekvensfunktion (behöver inte visas): x om 0 x < 1, f(x) = 2 x om 1 x 2, 0 annars. Låt ζ = [ξ] vara icke-heltalsdelan av ξ. Beräkna P (ζ 0.3). Lösning: Vi har att (10p) {ζ 0.3} = {ξ 0.3} {1 ξ 0.3}. Så P (ζ 0.3) = P (ξ 0.3) + P (1 ξ 0.3). Uträkning ger P (ξ 0.3) + P (1 ξ 0.3) = = 0.3 0 0.3 0 f(x)dx + xdx + = 0.045 + 0.255 = 0.30. 1.3 1 1.3 1 f(x)dx (2 x)dx 12. Ett problem då man testar hypoteser med en testvariabel som har diskret fördelning är att det kan bli svårt att få ett test som har exakt den signifikansnivå man söker. Ett sätt att hantera detta på är att man randomiserar, vilket innebär att man förutom sin testvariabel introducerar ett annat slumpmässigt element för att avgöra om H 0 ska förkastas. Linus utgår från en observation x på ξ Bin(18, p) för att testa H 0 : p = 0.5 mot H 1 : p > 0.5 på 5% signifikansnivå. Han skulle vilja ha en beslutsregel på formen förkasta H 0 om x k, men inser att inget k ger exakt 5% signifikansnivå. Han tänker istället att med hjälp av miniräknarens randfunktion generera en observation y från R(0, 1) för att sedan använda beslutsregeln förkasta H 0 om x k och y r. (a) Ange värden på k och r som gör att denna beslutsregel får exakt 5% signifikansnivå. (Här ska k vara ett heltal mellan 0 och 18 och r ett tal mellan 0 och 1.) (8p) 8 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2016-06-03 (b) Beräkna styrkan för testet i (a) i fallet att p = 0.75. Lösning: (a) För givna värden på k och r blir signifikansnivån α = P (förkasta H 0 H 0 ) = P (ξ k och η r), där η R(0, 1) och ξ Bin(18, 0.5) är oberoende. Oberoendet ger P (ξ k och η r) = P (ξ k)p (η r). Här gäller ju att P (η r) = r. Alltså har vi α = P (ξ k ξ Bin(18, 0.5)) r. Så beslutsregeln får signifikansnivån 0.05 om r = 0.05/P (ξ k ξ Bin(18, 0.5)). Detta funkar så länge som P (ξ k ξ Bin(18, 0.5)) 0.05. Tex funkar k = 12 och r = 0.05/P (ξ 12 ξ Bin(18, 0.5)) = 0.420. (b) Styrkan för testet i (a) på p = 0.75 är P (förkasta H 0 p = 0.75) = P (ξ 12 och η r), där η R(0, 1) och ξ Bin(18, 0.75) är oberoende. Oberoendet ger P (ξ 12 och η 0.420) = P (ξ 12)P (η 0.420) = 0.861 0.42 = 0.361. Rättning: Om man behandlat testet som ett vanligt binomialtest (dvs ignorerat randomiseringen som görs med y) så har man inte fått poäng. (4p) 13. Vi fortsätter med uppgift 10 från del 1. Janes kompis Anna tror att man kan få en bättre modell om man bortser från balkong och istället tilllåter sambandet mellan pris och yta att ha en kvadratisk term. Dvs hon föreslår modellen Y = β 0 + β 1 X 1 + β 2 (X 1 ) 2 + ε, där ε N(0, σ). Tabellen nedan innehåller minsta-kvadrat skattningar av regressionskoefficienterna samt deras skattade standardavvikelser: b 0 = 1405 s b0 = 399 b 1 = 20.2 s b1 = 10.4 b 2 = 0.0458 s b2 = 0.0630 Regressionskvadratsumman och den totala kvadratsumman är 31 i=1 (Ŷi Ȳ )2 = 19179306 respektive 31 i=1 (Y i Ȳ )2 = 23959368. Anser du att den modell som Anna föreslår är bättre än den från uppgift 10? Du kan anta att en residualanalys visar att båda modellerna är rimliga modeller. Rättning: Det finns tre saker att kolla på här: justerad förklaringsgrad (eller förklaringsgrad: modellerna har samma antal variabler), residualspridning, samt ett test för att se om β 2 är signfikant skild från noll. Alla dessa saker pekar på att modellen här inte är bättre än den från del 1. Man har fått 4 poäng om man korrekt använt en av dessa storheter och 8 poäng om man tittat på minst två av dom. (8p) 9 (9)