Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Matematisk statistik TMS064/TMS063 Tentamen

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = ξ = 2ξ 1 3ξ 2

Lufttorkat trä Ugnstorkat trä

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Avd. Matematisk statistik

Uppgift 1. f(x) = 2x om 0 x 1

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 12, FMSF45 Hypotesprövning

FÖRELÄSNING 7:

TENTAMEN Datum: 14 feb 2011

Tentamen i Matematisk statistik Kurskod S0001M

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

, s a. , s b. personer från Alingsås och n b

Avd. Matematisk statistik

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Kompletterande kursmaterial till kursen Matematisk statistik.

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Matematisk statistik, Föreläsning 5

Lycka till!

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Föreläsningsanteckningar till kapitel 8, del 2

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

Lösningar till tentamen i Matematisk Statistik, 5p

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-03-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson, Mykola Shykula, Ove Edlund, Inge Söderkvist Jourhavande lärare: Adam Jonsson Tel: 0920-49 19 48 Examinator: Adam Jonsson Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentan består av två delar. På den första delen (del 1), som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in även lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen (del 2), som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på del 1 samt minst 13 poäng på del 2. För betyg 5 krävs godkänt på del 1 samt minst 23 poäng på del 2. Approximationer får användas då sådana är motiverade. Det går inte att kompensera underkänt på del 1 med poäng från del 2. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (11)

1. Fyra komponenter, a,b,c och d, kan vid en given tidpunkt antingen fungera eller vara trasiga. Låt händelserna A,B,C,D stå för att komponent a,b,c respektive d fungerar. Dessa händelser antas oberoende, där P (A) = 0.2, P (B) = 0.36, P (C) = 0.24, P (D) = 0.7. Beräkna sannolikheten att minst en av de fyra komponenterna vid en given tidpunkt är trasiga. (2 p) 2. Lars funderar på att köpa lotter i två lotterier: Lilla lotteriet (anordnas av hans barn) har 20 lotter. Stora lotteriet (statligt) har 100 000 lotter. Andelen vinstlotter är i båda lotterierna 20%. (a) Om Lars tar 4 lotter i lilla lotteriet, vad är då sannolikheten att minst 25% (dvs minst 1 lott) blir vinstlotter? (2 p) (b) Om Lars tar 300 lotter i Stora lotteriet, vad är då sannolikheten att högst 25% blir vinstlotter? (2 p) 3. Den diskreta slumpvariabeln ξ har följande fördelningsfunktion: 0 om x < 1, 0.3 om 1 x < 3, F (x) = 0.9 om 3 x < 4, 1 om x 4. (a) Bestäm sannolikheten P (ξ = 3). (1 p) (b) Bestäm väntevärdet E(ξ). (1 p) 4. Den kontinuerliga slumpvariabeln ξ har R( 5,10)-fördelning. Bestäm den betingade sannolikheten P (ξ > 7 ξ > 6). (2 p) 5. I en viss bank samlas uppgifter in om handläggningstiden av olika slags ärenden från alla lokalkontor. För ett givet rutinärende har det visat sig att handläggningstiden kan beskrivas med en exponentialfördelning där den förväntade handläggningstiden är 7 timmar. Hur lång är den längsta tiden för de 2 % kortaste handläggningstiderna? (2 p) 6. Slumpvariablerna ξ 1 och ξ 2 är oberoende, där ξ 1 N(4,1), ξ 2 N(3,2). Beräkna sannolikheten P (3ξ 1 2ξ 2 10). (2p) 2 (11)

7. Vid LTU pågick ett projekt där man studerade underbenssvullnaden hos personer med stillasittande arbete. Man hade konstruerat en apparat för noggrann mätning av underbenens volym. Med denna mätte man volymsökningen under dagen av underbenen hos 6 personer dels under normala arbetsdagar, dels under dagar där personerna fick röra sig var 15:e minut, s.k omväxlingsdagar. Man fick följande värden på volymsökningen (i %) Försökspersonen 1 2 3 4 5 6 normaldag (x i ) 3.6 4.0 5.6 3.9 3.4 5.3 omväxlingsdag (y i ) 2.0 2.2 2.7 1.9 2.9 3.2 Kan man påstå att det är skillnad på genomsnittlig volymsökningen vid normaldagar och omväxlingsdagar? Besvara frågan genom att bilda ett 99% konfidensintervall för den systematiska förväntade skillnaden under lämpliga normalfördelningsantaganden. Svara ocskå JA (det finns med 99% säkerhet en skillnad) eller NEJ. (2 p) 8. Ljusblixtar som levereras till ett laboratorium uppges ha sannolikheten p = 0.01 att inte fungera. För att testa detta mot alternativet att felsannolikheten är större provar man 120 blixtar. Om antalet felaktiga är 5 eller flera så förkastas nollhypotesen att sannolikheten för fel är p = 0.01. Bestäm testets styrka i p = 0.03. (2 p) 9. Antag att x 1, x 2,..., x 5 är ett observerat stickprov från N(µ,2.3). För att testa H 0 : µ = 125 mot H 1 : µ < 125 ville man använda beslutsregeln förkasta H 0 om intervallet I = (, x + a) inte innehåller talet 125. Bestäm a så att testet får 1% signifikansnivå. (2 p) Var god vänd. 3 (11)

10. På amerikanskt företag studerades hur livslängden, Y, för en svarv kunde relateras till svarvens hastighet och till svarvtyp, där två olika typer A och B förekommer. Man gjorde 10 observationer på livslängden (enhet: timmar), svarvhastigheten mätt i 100-tals varv per minut, samt verktygstyp och skattade en regressionsmodell där Y förklarades av svarvhastigheten, x 1, och x 2, där x 2 är en dummy-variabel definierad som x 2 = 0 för typ A och x 2 = 1 för typ B. Observationerna blev: i x 1,i x 2,i y i (livslängd) 1 5.3 0 24.3 2 6.8 0 13.3 3 5.4 0 22.7 4 8.9 0 12.7 5 7.3 0 19.3 6 5.9 1 35.6 7 9.1 1 26.1 8 6.5 1 36.8 9 8.1 1 34.9 10 5.0 1 43.7 Skattade regressionskoefficienterna och deras standardavvikelser: b 0 = 40.124 s b0 = 4.788 b 1 = 3.2143 s b1 = 0.6811 b 2 = 17.539 s b2 = 1.926 (a) Betrakta funktionen f av de tre variablerna u,v,w definierad 10 f(u,v,w) = (y i u v x 1,i w x 2,i ) 2. i=1 Bestäm de värden på u,v,w för vilka f antar sitt minsta värde. (b) För att undersöka om livslängden för en given hastighet i genomsnitt är olika för svarvar av typ A än för de av typ B ska ett hypotestest genomföras. Ett sätt att genomföra testet är att beräkna värdet på en lämplig t-kvot och jämföra denna t-kvot med ett tal från t-tabellen. Vad är värdet på t-kvoten? Vilket värde ska t-kvoten jämföras med om man vill att testet ska ha 1 % signifikansnivå? Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Är detta P-värde större eller mindre än 0.02 (dvs 2 %)? (c) En anställd menade att för svarvar som har en hastighet på 800 varv per minut är den genomsnittliga livslängden för svarvar av typ A 10 timmar kortare jämfört med svarvar av typ B. För att testa om så är fallet så skulle man kunna beräkna ett tvåsidigt 98%-konfidensintervall och se om intervallet innehåller talet 10. Beräkna ett sådant intervall. (1p) (2p) (2p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (11)

Tabell för svar till del 1 Lägg detta blad först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter anges som ett tal mellan 0 och 1 i decimalform om inget annat anges. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.988 2 2 a Sannolikhet (fyra decimaler) 0.624 2 b Sannolikhet (fyra decimaler) 0.985 0.986 2 3 a Sannolikhet (två decimaler) 0.60 1 b Väntevärde (två decimaler) 2.50 1 4 Betingad sannolikhet (tre decimaler) 0.75 2 5 Längsta av 2 % kortaste tiderna (två decimaler) 0.14 2 6 Sannolikhet (tre decimaler) 0.788 2 7 övre och nedre gräns (två decimaler) [0.53,3.11] JA eller NEJ JA 2 8 Styrka (sannolikhet, tre decimaler) 0.292 0.294 2 9 Värde på a (tre decimaler) 2.393 2 10 a värden på u,v,w (två decimaler) u = b 0 = 40.12 v = b 1 = 3.21 w = b 2 = 17.54 1 b Värde på t-kvot (tre decimaler) 9.106 Värde från tabell (tre decimaler) 3.499 STÖRRE ELLER MINDRE MINDRE 2 c Intervallgränser (två decimaler) [11.76,23.31] 2 Totalt antal poäng 25 5 (11)

Lösningar till del 1 1. Vi har P (minst en kompenent är trasig) = 1 P (alla komponenter är hela) = 1 P (A B C D) = 1 P (A)P (B)P (C)P (D) = 1 0.2 0.36 0.24 0.72 = 0.9875 2. Låt ξ stå för antalet vinstlotter. (a) Vi har ξ Hyp(N,n,p) där N = 20, n = 4, p = 0.2. Så P (ξ 1) = 1 P (ξ = 0) )( 16 ) 4 = 1 ( 4 0 = 0.624. ( 20 4 ) (b) För Stora lotteriet gäller ξ Hyp(N,n,p), där N = 100000, n = 300, p = 0.2. Vi söker P (ξ 75). Med binomialapproximation (n/n = 0.003 < 0.1) och räknare får vi att den sökta sannolikheten är approximativt lika med 0.9856. Villkoren på sid 171 för normalapproximation med centrala gränsvärdessatsen är också uppfyllda. Detta ger att den sökta sannolikheten är approximativt 0.985. 3. Fördelningsfunktionen för en diskret slumpvariabel är en trappstegsfunktion som har språng i de x-värden där P (ξ = x) > 0 och språngens storlek ger sannolikheten för att variabeln antar dessa värden (sid 79 i boken). Alltså gäller här att P (ξ = 1) = 0.3, P (ξ = 3) = 0.6, P (ξ = 4) = 0.1. Väntevärdet blir 1 P (ξ = 1) + 3 P (ξ = 3) + 4 P (ξ = 4) = 1 0.3 + 3 0.6 + 4 0.1 = 2.5. 4. Vi ska beräkna P (ξ > 7 ξ > 6) = P (ξ > 7 och ξ > 6). P (ξ > 6) Eftersom {ξ > 7 och ξ > 6} = {ξ > 7} så får vi P (ξ > 7 ξ > 6) = P (ξ > 7) P (ξ > 6) Eftersom ξ R( 5,10) så får vi P (ξ > 7) = 3/15 och P (ξ > 6) = 4/15 P (ξ > 7 ξ > 6) = 3/4. 5. Låt den stokastiska variabeln ξ beteckna den tid som ett ärende tar. Det gäller att ξ Exp(λ) där E(ξ) = 7. Eftersom väntevärdet i Exp(λ) är 1/λ får vi λ = 1/7. För den längsta av de 2% kortaste tiderna, säg T, gäller 6 (11)

P ( T ) = 0.02. Alltså ska T uppfylla 1 e T/7 = 0.02. Vi löser ut T och får T = 7 ln(0.98) = 0.14. 6. Sats 6C ger att 3ξ 1 2ξ 2 N(12 6, 3 2 1 2 + 2 2 2 2 ) = N(6,5). Vi får P (3ξ 1 2ξ 2 10) = P ( 3ξ 1 2ξ 2 6 5 }{{} =η N(0,1) = P (η 0.8) = Φ(0.8) = 0.7881 10 6 ) 5 7. Vi har Stickprov i par då vi har olika personer som var och en mäts under två olika omständigheter. Vi beräknar z i = x i y i, i = 1,2,...,6 (eller y i x i ), och använder räknaren (T-interval på Texas) för att ta fram ett konfidensintervall med metoden i avsnitt 8.2.2. Intervallet blir [0.53,3.11]. Eftersom 0 inte finns med i intervallet så kan vi med 99 % säkerhet påstå att det finns genomsnittlig skillnad. 8. Låt ξ=antalet felaktiga blixtar bland de 120 utvalda. Det gäller att ξ Bin(120,p), där p är felsannolikheten. Styrkan i p = 0.03 är P (förkasta H 0 p = 0.03) = P (ξ 5 ξ Bin(120,0.03)) = 1 P (ξ 4 ξ Bin(120,0.03)) Exakt beräkning på räknaren (binomialcdf på Texas) ger 0.292. Med Poissonapproximation (n = 120 > 10, p = 0.03 < 0.1) får vi 1 P (ξ 4 ξ P o(3.6) = 0.294. 9. Att intervallet (, x+a) inte innehåller talet 125 är samma sak som att x + a 125, dvs x 125 a. Beslutsregeln är alltså: förkasta H 0 om x 125 a. Signifikansnivån är P (förkasta H 0 H 0 sann) = P ( ξ 125 a µ = 125) = P ( ξ 125 2.3/ 5 }{{} =η N(0,1) a 2.3/ µ = 125) 5 Villkoret att signifikansnivån ska vara 1% ger ekvationen P (η a 2.3/ 5 ) = 0.01. Om vi ritar en figur och jämför med tabellen på sidan 310 så ser vi att a 2.3/ 5 = λ 0.01 = 2.3263. 7 (11)

Alltså är a = 2.3263 2.3/ 5 = 2.3928. Kommentar om rättning av uppgift 9: På denna uppgift skulle nollhypotesen varit H 1 : µ < 125. Detta spelar ingen roll för lösningen eftersom man utgår från H 0 för att beräkna signifikansnivån. Men om H 1 : µ > 125 är det ologiskt att förkasta H 0 om x är mindre än ett givet värde och detta medförde att en alternativ strategi för att lösa uppgiften inte fungerade. En sådan strategi var att utgå från den rimliga beslutsregeln förkasta H 0 om x > k och ta fram det värde på k som ger signifikansnivån 1%. Om man sedan jämförde detta värde med 125 a fick man a = 2.393. Vid rättning har vi försökt ta hänsyn till detta om lösning funnits, men det är möjligt att vi missat något fall. Kontakta examinator om du inte fått poäng för en lösning där det tydligt framgår att du utgått från en rimlig beslutsregel och fått svaret a = 2.393. 10. (a) Skattningarna b 0, b 1, b 2 är de värden på u,v,w som minimerar den kvadratsumma som f definieras av. Alltså är svaret att f(u,v,w) antar sitt minsta värde för u = b 0, v = b 1, w = b 2. (b) Modellantagandet för modellen i fråga kan skrivas { β 0 + β 1 x 1 om x 2 = 0, dvs för typ A, E(Y ) = β 0 + β 1 x 1 + β 2 x 2 = β 0 + β 1 x 1 + β 2 om x 2 = 1, dvs för typ B. Skillnaden mellan den genomsnittliga livslängden för de två typerna, givet ett värde på x 1, är alltså β 0 +β 1 x 1 +β 2 (β 0 +β 1 x 1 ) = β 2. För att avgöra om den genomsnittliga livslängden för de två typerna skiljer testas H 0 : β 2 = 0 mot H 0 : β 2 0 på 1% signifikansnivå. Beslutsregeln är: förkasta H 0 om b 2 /s b2 > t 0.005 (n } {{ K } ), 10 3 dvs H 0 förkastas om b 2 /s b2 > 3.499. Värdet på t-kvoten är 17.539/1.926 = 9.106. För att avgöra om P-värdet i fråga är mindre än 0.02 kollar vi om H 0 kan förkastas på 2%-nivån. På 2% signifikansnivå förkastas H 0 om b 2 /s b2 > t 0.01 (7). }{{} 2.998 Eftersom värdet på t-kvoten är 9.106 så förkastas H 0 på 2% signifikansnivå. Alltså måste P-värdet vara mindre än 0.02. (Om det var större än 0.02 så skulle H 0 inte förkastas på 2% signifikansnivå.) Man kunde också konstaterat att eftersom b 2 /s b2 > t 0.005 (7) så ska H 0 förkastas på 1%. Det betyder att P-värdet är mindre än 0.01 och alltså mindre än 0.02. (c) Enligt ovan är skillnaden mellan den genomsnittliga livslängden för de två typerna, givet ett värde på x 1, lika med β 2. Vi vill därför beräkna ett 98 % konfidensintervall för β 2. Intervallet blir b 2 ±t 0.01 (7)s b2. Numeriskt: [11.76, 23.31] 8 (11)

Tentamen i Matematisk statistik, S0001M, del 2 2019-03-28 Till uppgifterna på del 2 krävs fullständiga lösningar. 11. Lena ska genomföra ett 50-meterslopp på följande något ovanliga sätt. Då startskottet går väntar hon en slumpmässig tid ξ 1 och tar sedan ett kliv som är 1 meter långt. Därefter väntar hon en tid ξ 2 och tar sedan ett kliv som är 1 meter långt. Efter detta kliv väntar hon en tid ξ 3 och tar sedan ett kliv som är 1 meter långt, osv. Om de stokastiska variablerna ξ 1,ξ 2,ξ 3,... är oberoende och Exp(1)-fördelade, vad är då sannolikheten att Lena inte hinner i mål på en minut? Bortse från den tid som det tar att ta ett steg. (10p) Lösning Låt ξ beteckna den tid det tar för Lena att ta sig i mål, dvs tiden det tar att ta 50 steg. Vi har ξ = 50 i=1 ξ 1. Vi söker P (ξ > 60). Enligt centrala gränsvärdessatsen gäller approximativt att ξ N(50 µ, 50σ), där µ = E(ξ i ) = 1 och σ = V (ξ i ) = 1. Vi får (approximativt) P (ξ > 60) = 1 P (ξ 60) = 1 P ( ξ 50 50 }{{} N(0,1) = 1 Φ(1.41) = 0.08. 60 50 50 } {{ } 1.41 ) 12. Antag att följande värden är ett observerat stickprov från N(µ + 1,2): 4.9 9.7 7.2 5.3 Följande värden är ett observerat stickprov från N(2µ 3,4): 6.1 8.2 8.1 4.3 Bestäm ett konfidensintervall för µ med konfidensgrad 99 %. (10p) Lösning Om vi subtraherar talet 1 från alla observationsvärden i det första stickprovet så har vi ett stickprov från N(µ,2). Om vi adderar talet 3 till alla observationsvärden i det andra stickprovet så har vi ett stickprov från N(2µ,4), och om vi sedan delar dessa värden med 2 så har vi enligt resultat från boken (Sats 5C eller 6C) ett stickprov från N(µ,2). Efter att dessa operationer gjorts så har vi stickproven och 3.9 8.7 6.2 4.3 4.505 5.6 5.55 3.65. Detta är alltså stickprov från N(µ,2). Så 3.9 8.7 6.2 4.3 4.505 5.6 5.55 3.65 9 (11)

Tentamen i Matematisk statistik, S0001M, del 2 2019-03-28 är ett observerat stickprov från N(µ,2). Ett konfidensintervall för µ med konfidensgrad 99 % ges av metoden i avsnitt 8.2.1 i boken (Tinterval på räknaren). Det blir (3.4,7.1). Kommentar: Ett annat sätt att beräkna konfidensintervall för µ är att ta differensen av de två stickproven (det andra minus det första) och sedan addera talet 4. Då får man ett stickprov av storlek 4 från N(µ, 20). Denna metod ger dock ett mycket bredare intervall. Det blir [ 5.86,5.66]. 13. På ett svenskt företag används svarvar av två typer, typ A och B. Livslängden (i timmar) observerades för tio svarvar. Resultatet blev: Svarv nr Typ Livslängd 1 A 18.7 2 A 14.5 3 A 17.4 4 A 14.6 5 A 13.4 6 B 30.2 7 B 27.1 8 B 25.4 9 B 26.1 10 B 33.4 En kvalitetstekniker ville använda följande regressionsmodell: Y i = β 0 + β 1 x i + ε i, (1) där Y är livslängd, där x är en indikatorvariabel som tar värdet 0 för typ A och värdet 1 för typ B, och där de stokastiska variablerna ε 1,ε 2,...,ε 10 är oberoende och N(0,σ)-fördelade. (a) En anställd menade att modellen i ekvation (1) är precis samma modell som modellen för Två stickprov (sid. 216 i boken). Förklara varför detta stämmer. För full poäng ska du uttrycka regressionskoefficienterna β 0 och β 1 med hjälp av parametrarna µ 1 och µ 2 (µ 1 och µ 2 avser parametrarna i modellen på sid. 216). (b) Förklara hur man kan beräkna ett 98%-konfidensintervall för β 1 med hjälp av metoder från kapitel 8 i kursboken. (5p) (5p) Lösning (a) Modellen i (1) kan skrivas Y i = β 0 + ε i om x i = 0 Y i = β 0 + β 1 + ε i om x i = 1. Eftersom ε i N(0,σ) så har vi alltså Y i N(β 0,σ) om x i = 0 Y i N(β 0 + β 1,σ) om x i = 1. 10 (11)

Tentamen i Matematisk statistik, S0001M, del 2 2019-03-28 Detta är modellantagandet för två stickprov. Mer exakt: om vi låter x 1,...,x 5 beteckna livslängderna för de första fem svarvarna och y 1,...,y 5 livslängderna för svarv 6-10 så gäller att x 1,...,x 5 är ett stickprov från N(µ 1,σ) och y 1,...,y 5 är ett stickprov från N(µ 2,σ), där µ 1 = β 0 och där µ 2 = β 0 + β 1. (b) Med beteckningarna från (a) har vi β 1 = µ 1 µ 2. För att beräkna konfidensintervall för µ 1 µ 2 använder vi formeln högst upp på sidan 216 i boken. 11 (11)