Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2015-08-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Jesper Martinsson, Adam Jonssson Jourhavande lärare: Jesper Martinsson Tel: 0920-491425 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (5)
1. Vid en stickprovskontroll skall man avvisa eller acceptera inkommande partier om 60 enheter vardera. Man använder följande tvåstegsförfarande. I den första kontrollen väljs 5 enheter på måfå ur partiet och om någon av dessa är defekt avvisas partiet. Om ingen är defekt går de 55 enheter som inte kontrollerats vidare till en sista kontroll där man på måfå väljer ut ytterligare 10 enheter. Om någon av dessa är defekt så avvisas partiet, i annat fall accepteras det. Om ett parti innehåller 5 defekta enheter, vad är sannolikheten att (a) avvisa ett parti efter den första kontrollen? (b) avvisa ett parti efter båda kontrollerna? 2. Det finns tre typer av fel som leder till driftstopp för ett transportband: typ 1, typ 2 och typ 3 fel. Sannolikheten att få de olika feltyperna under en drifttid på en månad bedöms vara 0.5 för typ 1, 0.7 för typ 2 och 0.3 för typ 3. Här antas också att dessa feltyper uppstår oberoende av varandra. Låt ξ beteckna antalet fel av någon typ som ett transportband får på en månad. Bestäm P (0 < ξ 2). 3. Förseningen i antal dagar av en leverans kan betraktas som en stokastisk variabel ξ med följande sannolikhetsfunktion. x 1 2 3 4 P (ξ = x) 0.4 0.3 0.2 0.1 Om leveransen försenas ger det en fast kostnad på 3000 kr och sedan en ytterligare kostnad på 4000 kr per försenad dag. Bestäm den totala kostnadens (a) väntevärde (b) standardavvikelse 4. Låt η R( 1, 1). Bestäm sannolikheten P (η < 0.5 η < 0). 5. En kedja ska sättas ihop med hjälp av många små länkar. Antag att länkarnas längd varierar något oberoende av varandra och där länkens längd ξ kan beskrivas som en stokastisk variabel ξ R(0.9, 1.1) cm. Om en kedja med hundra länkar ska bildas, hur stor är sannolikheten att kedjans länd är mellan 100 och 101 cm? 6. Nödljus som tillverkas har enligt specifikation sannolikheten 0.02 att inte fungera, dvs. en felsannolikhet på 0.02. För att testa detta mot alternativet att felsannolikheten är större än vad som är specificerat provar man 100 nödljus. Om fler än k ljus är felaktiga så förkastas att felsannolikheten är 0.02. Man kan då med en viss signifikansnivå påstå att felsannolikheten är större än 0.02. Signifikansnivån bestäms av (och bestämmer) värdet på konstanten k, som är ett positivt heltal. 2 (5)
(a) Ingenjören Anders vill genomföra testet med en signifikansnivå så nära 0.05 som möjligt. Vilket värde på k ska han använda? (b) Ingenjören Alva genomför testet med k = 5. Beräkna styrkan för hennes test givet att felsannolikheten är 0.15. Kommentar: Denna uppgift kräver att du använder lämpliga approximationer. 7. Draghållfastheten för ett repsnöre gjort av dynema kan anses vara N(µ, σ) fördelad. Man gör oberoende mätningar av draghållfastheten för 15 repsnören och får medelvärdet 25.3 och stickprovsstandardavvikelsen 3.2 kn. Bestäm ett 95% konfidensintervall för den förväntade draghållfastheten µ som är (a) tvåsidigt, (a) ensidigt, neråt begränsat. 8. Jane letar lägenhet på bostadsmarknaden i centrala Solna. Med hjälp av uppgifter från 21 nyligen avslutade försäljningar tar hon fram en skattad regressionsmodell Ŷ = b 0 + b 1 X 1 + b 2 X 2, där Y är priset för en lägenhet, X 1 är antal rum, och X 2 är en dummyvariabel som antar värdet 1 om lägenheten har balkong och 0 om den saknar balkong. Tabellen nedan innehåller minsta-kvadrat skattningarna av regressionskoefficienterna samt deras skattade standardavvikelser: b 0 = 1140 s b0 = 369 b 1 = 596 s b1 = 107 b 2 = 483 s b2 = 284 Regressionskvadratsumman och residualkvadratsumman är 21 i=1 (Ŷi Ȳ )2 = 9194306 respektive 21 i=1 (Y i Ŷi) 2 = 4683668. (a) Bestäm minstakvadratskattningen av det genomsnittliga priset för tvårumslägenheter med balkong i Solna. (b) För att bestämma om priset på en lägenhet i genomsnitt påverkas av om lägenheten har balkong så kan man ställa upp ett hypotestest. Ett sätt att genomföra ett sådant test är att beräkna en lämplig t-kvot och jämföra dess absolutbelopp med ett värde från t-tabellen på sidan 311 i kursboken. Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Ungefär hur stort är detta P-värde? Ange antingen 0%, 1%, 5%, 10 % eller 20 % på svarsbladet. (c) Beräkna ett konfidensintervall för hur mycket dyrare fyrarumslägenheter är i genomsnitt jämfört tvårumslägenheter. Använd 99% konfidensgrad. Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 3 (5)
Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges som ett tal mellan 0 och 1 i decimalform. Fråga Svar Poäng 1 a Sannolikhet (tre decimaler) 0.363 2 b Sannolikhet (tre decimaler) 0.7763 2 2 Sannolikhet (tre decimaler) 0.79 2 3 a Väntevärde (tre decimaler) 11000.000 2 b Standardavvikelse (tre decimaler) 4000.000 2 4 Sannolikhet (tre decimaler) 0.500 2 5 Sannolikhet (tre decimaler) 0.459 2 6 a Värdet på k (heltal) 4.000 2 b Styrka (tre decimaler) 0.997 2 7 a nedre gräns (tre decimaler) 23.527 1 b nedre gräns (tre decimaler) 23.844 1 8 a skattning (tre decimaler) 2815.000 1 b P -värde (0%, 1%, 5%, 10 % eller 20 %) 10% 2 c övre och nedre gräns (tre decimaler) 576.013, 1807.987 2 Totalt antal poäng 25 4 (5)
Tentamen i Matematisk statistik, S0001M, del 2 2015-08-25 Till uppgifterna på del 2 krävs fullständiga lösningar 9. Vi fortsätter med uppgiften om kejdan från del 1. En beställning på en 1000 cm lång kedja har inkommit. En tillverkningsstrategi är att man länkar ihop kedjan vid sidan av ett måttband och slutar då längden överskrider 1000 cm. Mätfelet för längden antas försumbar. Beräkna sannolikheten att kedjan innehåller minst 1000 länkar. (10p) 10. En automatisk nödbroms till en linbana består av tre parallella bromssystem som fungerar oberoende av varandra. Bromssystemens livslängd efter ett underhåll antas vara oberoende och Exponentialfördelad med väntevärde 5000 drifttimmar. För att bestämma underhållsintervallet för linbanans nödbroms är man intresserad av sannolikhetsfördelningen för ζ, där ζ är den tid som den automatiska nödbromsen fungerar (dvs. tiden fram tills dessa att alla tre bromssystem slutat fungera). (a) Bestäm sannolikhetsfördelningen. (b) Bestäm en tid T sådan att sannolikheten att linbanans automatiska nödbroms fungerar i minst T timmar är 0.99. (7p) (3p) 11. Maximum likelihood -metoden är en generellt användbar och mycket populär metod för parameterskattning. Metoden ingår inte i kursen men är både lätt att beskriva och använda. Så här går det till: Antag att du har en observation x (eller en serie observationer) på en stokastisk variabel ξ vars fördelning bestäms av den okända parametern θ. Maximum likelihood (ML) skattningen är det värde på θ som maximerar sannolikheten för det observerade utvallet. Alltså, först bestäms sannolikheten för det observerade utfallet. Den sannolikheten, som beror på θ, kallas likelihoodfunktionen. ML-skattningen är det värde på θ som maximerar likelihoodfunktionen (det vill säga det värde där likelihoodfunktionen antar till största värde). Antalet trasiga pixlar på en LED-tv av ett visst märke kan antas ha Poisson(λ)-fördelning, där λ är okänd. Antag att du köpt två LEDtv av märket i fråga (en till sovrummet) och upptäcker att en har 2 trasiga pixlar och den andra 1 trasig pixel. Beräkna ML-skattningen av λ. (10p) 5 (5)