Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson, Mykola Shykula Jourhavande lärare: Mykola Shykula Tel: 0920-493056 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs godkända webbuppgifter och minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (6)
1. Vid etsning av kretskort kontrolleras de färdiga korten. Kort läggs ihop i förpackningar om 12 kort, varav 4 tas ut för undersökning. Om det bland de 12 korten finns 5 defekta, hur stor är då sannolikheten att exakt 2 av de 4 korten i urvalet är defekta. 2. För många sjukdomar gäller att diagnosen inte alltid är säker. Dels kan en person med sjukdomen bli friskförklarad, dels kan en frisk person få diagnosen sjuk. Antag att en godtycklig person har en viss sjukdom med sannolikhet 0.08. Antag vidare att diagnosmetoden ger rätt resultat om en person är frisk med sannolikhet 0.87, och rätt resultat om personen är sjuk med sannolikhet 0.92. Hur stor är sannolikheten för felaktig diagnos? 3. Antalet jobb som en firma får under en månad kan betraktas som en stokastisk variabel ξ vars sannolikhetsfunktion ges i tabellen nedan. x 0 1 2 3 P (ξ = x) 0.3 0.4 0.2 0.1 Varje jobb ger en inkomst på 25 (enhet: tusentals kr). Förutom arbetsinkomsten har firman fasta kostnader om 15 tusen kr. Låt η beteckna firmans resultat för en månad, dvs firmans intäkter minus firmans kostader. Vi har alltså η = 25ξ 15. (a) Beräkna E(η). (b) Beräkna V (η). (1p) (1p) 4. För betjäningstiden ξ för en kund i ett kösystem (enhet: minuter) gäller att 0 om x < 0, P (ξ x) = 1 (30 x)2 900 om 0 x 30, 1 om x 30. Bestäm väntevärdet av ξ. 5. Antalet telefonsamtal som en växel på ett stort företag får in under en vecka kan beskrivas med en Poissonfördelad slumpvariabel. I genomsnitt får växeln 300 samtal på en månad. Använd en lämplig metod för att approximera sannolikheten att man får in mer än 330 samtal på en månad. Kommentar: Det går också bra att svara exakt. 6. Slumpvariabeln ξ har Exponentialfördelning med väntevärdet 200 timmar. Bestäm medianen i fördelningen. 7. Slumpvariablerna ξ 1, ξ 2,..., ξ 10 är oberoende och R( 1, 1)-fördelade. Låt η vara antalet variabler av de tio som antar ett värde som är större än 0.5. Beräkna P (η 8). 2 (6)
8. Du har fått i uppdrag att studera skillnaden i förväntad sjukfrånvaro bland män och kvinnor i en viss organisation. Du vet sedan tidigare att det är rimligt att betrakta sjukfrånvaron mätt i antal dagar per år i de två grupperna som normalfördelad och att standardavvikelsen kan förutsättas vara lika stor i båda grupperna. Undersökningen görs så att ett slumpmässigt urval om 13 män och 11 kvinnor tas ut, varefter dessa personers sjukfrånvaro undersöks. I gruppen av män blev medelvärdet för sjukfrånvaro 11.4 och standardavvikelsen blev 4.9 dagar per år. Bland kvinnor blev medelvärdet 13.2 och standardavvikelsen 4.6 dagar per år. Bestäm ett konfidensintervall med konfidensgrad 95 % för skillnaden (kvinnor-män) mellan de två gruppernas förväntade sjukfrånvaro. Tyder resultatet på att det finns en skillnad i förväntad sjukfrånvaro mellan män och kvinnor? Ange JA eller NEJ på svarsbladet. 9. Antag att slumpvariablerna ξ 1,..., ξ n är oberoende där ξ i N(µ, 1). För att testa H 0 : µ = 20 mot H 1 : µ = 19 vill man använda beslutsregeln förkasta H 0 om ξ är mindre än k, där ξ = ξ 1 + ξ 2 + + ξ n. n (a) Antag att n = 10. Bestäm k så att testets styrka blir 0.9. (b) Betrakta beslutsregeln: förkasta H 0 om ξ < 19.47. Hur stort måste n vara för att signifikansnivån ska bli mindre än 0.01? Kommentar: Uppgift (a) och uppgift (b) beror inte av varandra. 10. I ett växthus utförs experiment för att avgöra om mängden belysning påverkar hur mycket jordgubbar växer. Belysningen mäts med hjälp av ett belysningsindex och jordgubbarnas vikt mäts i gram. De första fyra erhållna observationerna (observation i = 1, 2, 3, 4) blev i Y i = Jordgubbsvikt X i = Belysningsindex 1 20 5 2 27 10 3 34 10 4 41 15 Man antog att det föreligger ett linjärt samband mellan variablerna Y =jordgubbsvikt (i gram) och X =belysningsindex och använde därför en regressionsmodell. Tabellen nedan innehåller minsta-kvadrat skattningarna av regressionskoefficienterna samt deras skattade standardavvikelser: b 0 = 9.5 s b0 = 5.25 b 1 = 2.1 s b1 = 0.495 3 (6)
(a) Beräkna residualspridningen. (b) För att på 5% signifikansnivå testa om belysningsindex har någon effekt på jordgubbsvikten så kan man jämföra en lämplig t-kvot med ett värde ur t-tabellen. Vad är värdet på t-kvoten? Vilket värde skall t-kvoten jämföras med? Ett annat sätt att testa om belysningsindex har en effekt på jordgubbsvikten är att utgå från ett lämpligt P-värde. Är detta P-värde större eller mindre än 0.1 (dvs större eller mindre än 10%)? Ange STÖRRE eller MINDRE på svarsbladet. Ett tredje sätt att testa om belysningsindex har en effekt på jordgubbsvikten, på 5% signifikansnivå, är att beräkna ett lämpligt konfidensintervall och sedan kolla om intervallet innehåller noll. Beräkna ett sådant lämpligt intervall. Svara med den övre gränsen. (3p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (6)
Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform om inte annat anges. Man kan inte få poängavdrag för att man anger fler decimaler än vad som efterfrågas. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.424 2 2 Sannolikhet (tre decimaler) 0.126 2 3 a Väntevärde (två decimaler) 12.5 1 b Varians (två decimaler) 556.250 1 4 Väntevärde (tre decimaler) 10.000 2 5 Sannolikhet (tre decimaler) 0.042 2 6 Fördelningsmedian (tre decimaler) 138.629 2 7 Sannolikhet (tre decimaler) 1.000 2 8 Intervallets övre gräns (två decimaler) intervallet ( 2.25, 5.85) JA eller NEJ NEJ 2 9 a Värde på k (tre decimaler) 19.405 2 b värde på n (heltal) 20 2 10 a Residualspridning (två decimaler) 3.50 2 b värde på t-kvot (tre decimaler) 4.242 värde från t-tabellen (tre decimaler) 4.303 MINDRE eller STÖRRE MINDRE Intervallets övre gräns (två decimaler) 4.230 3 Totalt antal poäng 25 5 (6)
Tentamen i Matematisk statistik, S0001M, del 2 2019-01-18 Till uppgifterna på del 2 krävs fullständiga lösningar. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. I en låda finns 100 bollar. Vissa bollar är röda och de övriga är vita. Andelen röda bollar, säg θ, är okänd. För att skatta θ kan man göra på följande sätt: 20 bollar väljs slumpmässigt och utan återläggning. Sedan beräknas andelen röda bollar i urvalet. Denna andel, kalla den θ, används som skattning av θ. Är θ en väntevärdesriktig skattning? Motivera tydligt. Kommentar: Endast svar ger 0 poäng. För full poäng krävs bevis. (10p) 12. Arne menar att han är en bättre boulespelare än vad Thomas är. De spelar tio matcher, varav Arne vinner 7. Kan Arne därmed påstå att han är bättre än Thomas? Besvara frågan genom att formulera och genomföra ett lämpligt hypotestest. Använd 10 % signifikansnivå. (10p) 13. Följande är ett observerat stickprov från en Exponentialfördelning. Bestäm ett konfidensintervall för medianen i fördelningen som ligger så nära 96 % som möjligt. 0.98 0.33 0.71 4.05 0.27 0.49 0.72 0.33 0.41 (10p) 6 (6)