Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Avd. Matematisk statistik

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Matematisk statistik TMS064/TMS063 Tentamen

Formel- och tabellsamling i matematisk statistik

TENTAMEN Datum: 14 feb 2011

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Matematisk statistik, Föreläsning 5

Tentamen i Dataanalys och statistik för I den 28 okt 2015

FÖRELÄSNING 7:

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Lufttorkat trä Ugnstorkat trä

0 om x < 0, F X (x) = c x. 1 om x 2.

LABORATION 3 - Regressionsanalys

Tentamen LMA 200 Matematisk statistik,

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

TENTAMEN I STATISTIKENS GRUNDER 2

LABORATION 3 - Regressionsanalys

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

TENTAMEN I MATEMATISK STATISTIK 19 nov 07

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

4 Diskret stokastisk variabel

Föreläsning 11: Mer om jämförelser och inferens

Kompletterande kursmaterial till kursen Matematisk statistik.

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Stockholms Universitet Statistiska institutionen Termeh Shafie

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen MVE302 Sannolikhet och statistik

Avd. Matematisk statistik

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2018-10-30 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson och Ove Edlund Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Examinator: Adam Jonsson Tillåtna hjälpmedel: Räknare, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen (del 1), som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För betyg 3 krävs minst 17 poäng (inkl ev bonusp) på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen (på sid 4). Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen (del 2), som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på del 1 samt minst 13 poäng från del 2. För betyg 5 krävs godkänt på del 1 samt minst 23 poäng från del 2. OBS! Det går inte att kompensera underkänt på del 1 av tentamen med poäng på del 2. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (12)

Tentamen i Matematisk statistik, S0001M, del 1 2018-10-30 1. För många sjukdommar gäller att diagnosen inte alltid är säker. Dels kan en person med sjukdomen bli friskförklarad, dels kan en frisk person få diagnosen sjuk. Antag att en slumpmässigt vald person har en viss sjukdom med sannolikhet 0.07. Antag vidare att för diagnosmetoden i fråga, så blir en frisk person sjukförklarad med sannolikhet 0.23, och att en sjuk person får diagnosen frisk med sannolikhet 0.14. Beräkna sannolikheten för att en slumpmässigt vald person får korrekt diagnos. 2. Slumpvariablerna ξ 1, ξ 2 och ξ 3 är oberoende. Deras respektive frekvensfunktioner är f 1, f 2 och f 3, där f 1 (x) = 2 2π e 2x2, < x <, f 2 (x) = 1 2π e x2 /2, < x <, f 3 (x) = 1 2π e (x 1)2 /2, < x <. (a) Bestäm variansen för ξ 1. (b) Beräkna P (ξ 2 > ξ 3 ). 3. Antag att ξ har Exponentialfördelad, där E(ξ) = 5. Beräkna den betingade sannolikheten P (ξ > 4 ξ > 3). (1p) 4. I en boule-klubb planerar man en insamling av pengar och skickar därför till var och en av de 200 medlemmarna ett brev, i vilket man ber om ett bidrag på 50 kr eller 100 kr. Från tidigare erfarenhet gör man uppskattningen att det är lika vanligt med det större som det mindre bidraget och att 30% av medlemmarna inte ger något bidrag alls. Låt ξ beteckna summan av alla bidrag som klubben får in. (a) Beräkna väntevärdet av ξ. (b) Beräkna standardavvikelsen för ξ. 5. Vid tillverkningen av persiska mattor har det visat sig att förväntat antal fel per kvadratmeter var 26.8 och att standardavvikelsen för antalet fel per kvadratmeter var 6.5. Inom företaget diskuteras olika procedurer för provtagning av mattor. Ett förslag är att ta ut 43 prov ur tillverkningen, räkna antalet fel på dessa och beräkna medelvärdet av antalet fel per kvadratmeter. Approximera sannolikheten för att det medelvärdet av antalet fel per kvaderatmeter för de 43 proven blir minst 24.8. (1p) 6. Man ville undersöka om handledsmått (omkrets) skiljer sig i genomsnitt mellan dominant och icke-dominant sida, utan att göra något antagande om normalfördelning. Totalt 18 slumpmässigt valda LTUstudenter tillfångatogs och fick sina handleder mätta. Man ville testa H 0 : ingen genomsnittlig skillnad mellan dominant och icke-dominant 2 (12)

Tentamen i Matematisk statistik, S0001M, del 1 2018-10-30 mot H 1 : genomsnittlig skillnad finns. Man använde testvariabeln ξ = antal studenter bland de 18 med större mått på dominant sida, samt beslutsregeln: förkasta H 0 om ξ k eller ξ 18 k, där k är en konstant (ett positivt heltal). Bestäm det största värdet på k för vilket testet får en signifikansnivå som är högst 0.1. 7. En forskare har konstruerat konfidensinervall för 12 olika okända konstanter. Varje intervall har konfidensgrad 90 % och de olika intervallen härrör från av varandra oberoende mätserier. Vad är sannolikheten att det för minst 10 av de 12 intervallen gäller att intervallet täcker den konstant för vilket intervallet konstruerats? 8. Antag att ξ är Poissonfördelad med väntevärde λ, där λ är okänd. För att testa mot H 0 : λ = 10 H 1 : λ < 10 har man bestämt sig för att använda beslutsregeln: förkasta H 0 om ξ antar ett värde som är mindre än eller lika med 5. Beräkna testets styrka då λ = 5. 9. En geokemist undersöker halterna av hur järn (mg/l) i skogsmark påverkas av ett visst gift och gör därför mätningar på sex angivna platser. Sedan behandlar hon var och en av dessa platser med miljögiftet och återkommer en dag senare för att undersöka om järnhalten förändrats. Järnhalterna som observerades på utan att miljögift använts var följande: 14.1 13.9 12.0 10.3 23.9 17.4 Och med miljögift blev värdena för respektive plats: 19.6 17.3 18.7 13.1 26.9 19.8 Beräkna, under lämpliga normalfördelningsantaganden, ett 95 % konfidensintervall för hur mycket giftet i genomsnitt höjer järnhalten. Svara med den övre gränsen. 3 (12)

Tentamen i Matematisk statistik, S0001M, del 1 2018-10-30 10. Man vill använda regressionsanalys för att studera hur Y =priset för en lägenhet (enhet: tusentals kronor) i en viss stad berodde på följande variabler: X 1 =lägenhetens yta (enhet: kvm), X 2 =lägenhetens våning (0,1,2,3,...), X 3 =balkong, där X 3 = 1 om lägenheten har balkong, X 3 = 0 annars, X 4 = X 2 X 3. Uppgifter från 31 nyligen sålda lägenheter studerades för att få den skattade regressionsmodellen Ŷ = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3 + b 4 X 4. Residualspridningen blev 358.181 och förklaringsgraden (R-Sq) blev 85.97. Skattningar av regressionskoefficienterna och deras standardavvikelser anges i tabellen nedan. b 0 = 1046 s b0 = 220 b 1 = 26.73 s b1 = 2.41 b 2 = 73.2 s b2 = 54.8 b 3 = 271 s b3 = 246 b 4 = 74.1 s b4 = 63.7 (a) En av de sålda lägenheterna såldes för 3910 (kkr), låg på fjärde våningen,var på 88 kvm, och hade balkong. Vad är residualen för den lägenheten? (1p) (b) För lägenheter i staden i fråga som inte har balkong, hur mycket dyrare är i genomsnitt lägenheter på våning 4 jämfört med lägenheter på våning 1? Besvara frågan genom att beräkna ett 98 % konfidensintervall. Svara med den övre gränsen. (2 p) (c) Kan man på 5 % signifikansnivå påstå att den effekt som en balkong i genomsnitt har på en lägenhets pris beror på hur högt upp (dvs på vilken våning) lägenheten ligger? För att undersöka detta kan man utgå från en lämplig t-kvot och jäföra denna t- kvot med ett tabell-värde. Vad är värdet på den t-kvoten? Vilket värde ska t-kvoten jämföras med? Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Är detta P-värde i detta fall större eller mindre än 0.05? För 2 poäng på denna uppgift krävs att du på svarsbladet anger korrekt t-kvot, rätt tabellvärde samt rätt svar (STÖRRE eller MINDRE) på frågan om P-värdet. (2 p) Slut på del 1. Glöm inte att bifoga svarsbladet (se nästa sida) med tentan! 4 (12)

Tentamen i Matematisk statistik, S0001M, del 1 2018-10-30 Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Fråga Svar Poäng 1 Sannolikhet (två decimaler) 0.78 2 2 a Varians (två decimaler) 0.25 1 b Sannolikhet (två decimaler) 0.24 2 3 Betingad sannolikhet (två decimaler) 0.82 2 4 a Väntevärde (tre decimaler) 10500.000 1 b Standardavvikelse (två decimaler) 568.99 2 5 Sannolikhet (två decimaler) 0.98 2 6 Största värde på k (heltal) 5 2 7 Sannolikhet (två decimaler) 0.89 2 8 Styrka (två decimaler) 0.62 2 9 Nedre gräns (två decimaler) (2.16,5.78) 2 10 a residual (två decimaler) 237.16 1 b övre gräns (två decimaler) 187.95 2 c värde på t-kvot (tre decimaler) 1.163265 tabellvärde (tre decimaler) 2.056 MINDRE eller STÖRRE än 0.05 STÖRRE 2 Totalt antal poäng 25 5 (12)

Tentamen i Matematisk statistik, S0001M, del 1 2018-10-30 6 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 Till uppgifterna på del 2 krävs fullständiga lösningar. 1. I en fabrik använder man lysrör vars livslängder är oberoende och Exponentialfördelade med väntevärde 200 timmar. Då ett lysrör brunnit ut byts det omedelbart ut mot ett nytt. Låt ξ vara antalet lysrör som har satt in då man för första gången får ett lysrör med en livslängd på mer än 300 timmar. (a) Bestäm sannolikhetsfunktionen för ξ. (b) För att beräkna väntevärdet för ξ behöver man använda metoder som inte ingår i kursen S0001M. Men man kan gissa sig till vad E(ξ) borde vara. Gör det. (9p) (1p) 2. Standardavvikelsen σ(ξ) = E((ξ µ) 2 ) ger ett mått på hur mycket en slumpvariabel i genomsnitt avviker från sitt väntevärde, dvs från µ = E(ξ). Ett annat mått på genomsnittlig avvikelse från väntevärdet fås om man tar väntevärdet av absolutbeloppet av ξ µ, dvs om man tar ρ(ξ) = E( ξ µ ) som mått på genomsnittlig avvikelse. Visa genom ett exempel att det inte alltid gäller att σ(ξ) = ρ(ξ). Du skall alltså definiera en slumpvariabel ξ och visa att σ(ξ) ρ(ξ) genom att beräkna σ(ξ) och ρ(ξ). Tips: Låt ξ Bin(1, p) för något lämpligt värde på p. (10p) 3. Antag att ξ R(0, b), där b > 0 är okänd. Man vill testa H 0 : b = 1 mot H 1 : b = 2 på en signifikansnivå som är högst 0.1. (a) Ett sätt att genomföra testet är att använda beslutsregeln: förkasta H 0 om η = 1, där η har likformig fördelning på talen 1, 2, 3,..., 10 och där ξ och η är oberoende. Beräkna signifikansnivån för detta test. Beräkna även styrkan. (2 p) (b) Föreslå ett annat test för att testa hypoteserna ovan och beräkna dess styrka. För poäng på denna uppgift krävs att det test du föreslår har högre stryrka än testet i (a) samt att dess signifikansnivå är högst 0.1. (8 p) 7 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 Lösningsförslag Del 1 1 Låt F vara händelsen att en slumpmässigt vald person är frisk, låt S vara händelsen att en slumpmässigt vald person är sjuk, och låt K vara händelsen att en slumpmässigt vald person får korrekt diagnos. Enligt uppgift gäller P (S) = 0.07, P (F ) = 0.93, P (K F ) = 0.77, P (K F ) = 0.86. Vi får P (K) = P (K F )P (F )+P (K S)P (S) = 0.77 0.93+0.86 0.07 = 0.7763. 2 (a) Frekvensfunktionen för en slumpvariabel fördelad N(µ, σ) är f(x) = 1 2πσ e (x µ)2 /2σ 2, < x <. Om vi jämför denna funktion med f 1, så ser vi att ξ 1 N(0, 0.5). Det betyder att variansen för ξ 1 är 0.5 2 = 0.25. (b) Om vi jämför f 2 och f 3 med frekvensfunktionen för en N(µ, σ)- fördelad slumpvariabel så ser vi att ξ 2 N(0, 1) och ξ 3 N(1, 1). Vi söker P (ξ 2 > ξ 3 ) = P (ξ 2 ξ 3 > 0). Sats 6B i kursboken ger ξ 2 ξ 3 N( 1, 2). Så P (ξ 2 ξ 3 > 0) = 1 P (ξ 2 ξ 3 0) = 1 P ( ξ 2 ξ 3 ( 1) ( 1) ) 2 2 }{{} N(0,1) = 1 Φ(1/ 2). 0.24. 3 Eftersom ξ Exp(λ) och E(ξ) = 5 så gäller det att ξ Exp(0.2), vilket betyder att P (ξ > x) = e 0.2x. Vi får P (ξ > 4 ξ > 3) = P (ξ > 4 och ξ > 3)/P (ξ > 3) = P (ξ > 4)/P (ξ > 3) = e 0.2 3 /e 0.2 3 = e 0.2. Kommentar: Här har man hjälp av Exempel 4.5 på sidan 114 i boken. 4 Låt ξ i stå för det bidrag som medlem nummer i ger, i = 1, 2,..., 200, och låt ξ vara det totala bidraget som klubben får in, dvs ξ = ξ 1 + ξ 2 +... + ξ 200. De möjliga värdena på ξ i är 0, 50 och 100 och enligt den informationen som ges i uppgiften har vi P (ξ i = 0) = 0.3, P (ξ i = 0) = 0.35, P (ξ i = 0) = 0.35. 8 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 (a) Väntvärdet för ξ i är E(ξ i ) = 0 0.3 + 50 0.35 + 100 0.35 = 52.5. Sats 5A ger E(ξ) = 200 i=1 E(ξ i) = 200 52.5 = 10500. (b) Variansen för ξ i är V (ξ i ) = (0 52.5) 2 0.3+(50 52.5) 2 0.35+(100 52.5) 2 0.35 = 1618.75. Då vi antar att bidragen från olika medlemmar är oberoende ger Sats 5A att V (ξ) = 200 i=1 V (ξ i) = 200 1618.75 = 323750. Standardavvikelsen blir V (ξ) = 568.99. 5 Låt ξ 1,..., ξ 43 beteckna antalet fel på de 43 proven (ξ i = antal fel på prov nr i). Vi söker P ( ξ 24.8), där ξ = (ξ 1 + ξ 2 +... + ξ 43 )/43. Centrala gränsvärdessaten ger att fördelningen för ξ är approximativt N(µ, σ/ 43), där µ = E(ξ i ) = 26.8 och där σ = V (ξ i ) = 6.5 enligt uppgift. Dvs fördelningen är approximativt N(26.8, 6.5/ 43). Vi får approximationen P ( ξ 24.5) = P ( ξ 26.5 6.5/ 24.5 26.5 43 6.5/ ) 43 }{{}}{{} approx N(0,1) 2.02 1 Φ( 2.02) = Φ(2.02) = 0.978. 6 För ett givet värde på k är signifikansnivån P (förkasta H 0 H 0 sann) = P (ξ k eller ξ 18 k H 0 sann). Här har vi att ξ Bin(18, p), där p är sannolikheten för att en slumpvis vald person har större handledsmått på dominant sida. Då H 0 är sann är p = 0.5. Ju större värde på k desto större blir värdet på P (k) = P (ξ k eller ξ 18 k ξ Bin(18, 0.5)). För att hitta det största värdet på k som ger P (k) 0.1, så får man testa sig fram med hjälp av Binomialfördelningstabellen eller miniräknaren. Vi har P (5) = 0.096 och P (6) = 0.24. Så det största värdet på k för vilket gäller att P (k) 0.1, är 5. 7 Låt ξ vara antal intervall som täcker sin konstant. Vi söker P (ξ 10). Eftersom intervallen härrör från oberoende stickprov så har vi ξ Bin(12, p), där p är sannolikheten att ett intervall täcker sin konstant. Att konfidensgraden är 90 % betyder att p = 0.9. Vi får P (ξ 10) = 1 P (ξ 9) = 0.8891. 8 Då λ = 5 är styrkan lika med P (förkasta H 0 λ = 5), dvs P (ξ 5 λ = 5) = P (ξ 5 ξ P o(5)) = 0.616. 9 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 9 Eftersom proven görs på olika platser bör järnhalten på en plats då gift används jämföras med järnhalten på samma plats då giftet inte används. Detta då det ju kan förekomma variationer i järnhalten mellan de olika platserna. (Om man tittar på mätserierna så tycks detta också vara fallet.) Vi beräknar därför ett konfidensintervall för den genomsnittliga effekten av giftet med hjälp av metoden stickprov i par, där differenserna beräknas som värde med gift värde utan gift. Intervallet blir [2.16, 5.78]. 10 Den modell som skattas kan skrivas E(Y ) = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4. (a) Residualen är Y Ŷ, där Y är det observerade priset, dvs 3910, och där Ŷ är det predikterade priset för den aktuella observationen, dvs b 0 + b 1 88 + b 2 4 + b 3 1 + b 4 4 = 3672.84. Det ger Y Ŷ = 237.16. (b) Att balkongens effekt beror på våningsplan är samma sak som att variabeln X 4 har effekt, vilket är samma sak som att β 4 är skild från noll. För att testa H 0 : β 4 = 0 mot H 1 : β 4 0, så kan vi använda beslutsregeln: förkasta H 0 om b 4 /s b4 t 0.025 (n K), där n = 31 och där K = 5. Så beslutsregeln är: förkasta H 0 om b 4 /s b4 2.056. Om vi använder P-värdet för att testa hypotserna ovan på 5 %signifikansnivå, så förkastas H 0 om P-värdet är mindre än 0.05. De två metoderna ger alltid samma resultat. Eftersom t-kvoten 1.163 så kan H 0 inte förkastas på 5 %. Det betyder att P-värdet måste vara större än 0.05. (c) För lägenheter utan balkong (X 3 = 0) kan det genomsnittliga (förväntade) priset skrivas E(Y ) = β 0 + β 1 X 1 + β 2 X 2. Då X 2 ökar med tre enheter så ökar det förväntade priset med 3β 2 enheter. Vi söker alltså ett konfidensintervall för 3β 2 med konfidensgrad 98 %. Ett konfidensintervall för β 2 med konfidensgrad 98 % har gränserna b 2 ± s b2 t 0.01 (26) = 73.2 ± 54.8 2.479. Numeriskt blir intervallet [ 209.0492, 62.6492]. Att detta intervall täcker β 2 med konfidensgrad 98 % betyder att intervallet [ 627.1476, 187.9476] täcker 3β 2 med konfidensgrad 98 %. 10 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 Del 2 11 Låt ξ Bin(1, p). Då har vi (tex enligt formelbladet) att E(ξ) = p och σ(ξ) = p(1 p). Vi beräknar ρ(ξ) = E( ξ µ ) = E( ξ p ). Låt η = ξ p. Denna slumpvariabel antar värdet p (om ξ = 0) eller 1 p (om ξ = 1), där P (η = p) = P (ξ = 0) = (1 p) och Så P (η = 1 p) = P (ξ = 1) = p. E(η) = P (η = p)p + P (η = 1 p)(1 p) = (1 p)p + p(1 p). För tex p = 0.25 har vi σ(ξ) = 0.433... och ρ(ξ) = 0.375. 12 (a) De möjliga värdena på ξ är 1, 2, 3,... Att ξ är lika med ett är samma sak som att det första röret har en livslängd på mer än 300 timmar. Så vi har P (ξ = 1) = p, där p är sannolikheten för att ett rör räcker mer än 300 timmar. Att rören är Exp(1/200)-fördelade ger p = e 300/200. Att ξ är lika med två är samma sak som att det första röret har en livslängd på högst 300 timmar och att det andra röret har en livslängd som är mer än 300 timmar. Så För ett godtyckligt x har vi P (ξ = 2) = (1 p)p. P (ξ = x) = (1 p) 1 x p, x = 1, 2, 3,... (b) Man skulle kunna gissa att väntevärdet är 1/p, vilket är ca 4.4. För om man upprepar oberoende försök som lyckas med sannolikhet p borde det i genomsnitt krävas 1/p försök för att få ett lyckat försök. Om man tex kastar en tärning så borde förväntat antal kast för att få en 1:a vara 6. Kommentar: En liknande uppgift är övning 3.6 på sidan 81 i boken. 13 (a) Här beror inte fördelningen för η på vad vi har för värde på b. Så signifikansnivån är och styrkan är P (förkasta H 0 H 0 sann) = P (η = 1) = 0.1 P (förkasta H 0 H 1 sann) = P (η = 1) = 0.1. 11 (12)

Tentamen i Matematisk statistik, S0001M, del 2 2018-10-30 (b) Testet som baseras på η använder inte information om vad vi har för värde på ξ. En beslutsregel som använder denna information är följande: förkasta H 0 om ξ k, där k väljs så att vi får signifikansnivån 0.1. Detta villkor kan skrivas P (ξ k H 0 ) = 0.1, vilket ger k = 0.9. Så beslutsregeln är: förkasta H 0 om ξ 0.9 Styrkan blir P (förkasta H 0 H 1 sann) = P (ξ 0.9 ξ R(0, 2)) = 0.55. Detta är bättre än strykan för testet i (a). 12 (12)