Avd. Matematisk statistik TENTAMEN I SF1901, SF1905 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 11 JANUARI 2016 KL 14.00 19.00. Kursledare för CINEK2: Thomas Önskog, tel: 08 790 84 55 Kursledare för CSAMH2, CMETE2 och CLGYM3: Jimmy Olsson, tel: 08 790 72 01 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 2 HT 2015 tillgodoräknas. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 Antalet tåg per dag som ankommer med mer än tre minuters försening till Umeå C kan antas vara Po2)-fördelat. a) Bestäm sannolikheten att minst tre tåg är försenade under en given dag. 4 p) b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka. 6 p) Uppgift 2 Följande data visar antalet genomsnittliga förluster i arbetstimmar per vecka på grund av olyckor från tio olika industrianläggningar före respektive efter att ett säkerhetsprogram implementerats. före: 45 73 46 74 33 57 83 34 26 17 efter: 36 60 44 69 35 51 77 29 24 11 Man kan anta att antalet förlorade arbetstimmar i en given industrianläggning är normalfördelat både med och utan säkerhetsprogram). a) Bestäm ett relevant 99%-igt konfidensintervall som beskriver effekten av säkerhetsprogrammet. 7 p) b) Testa på nivån 1% om säkerhetsprogrammet har någon effekt. 3 p)
forts tentamen i SF1901 2016-01-11 2 Uppgift 3 Inom det s.k. STAD-projektet Stockholm förebygger alkohol- och drogproblem) 2002 ville man undersöka inställningen till narkotika hos restauranganställda i Stockholm. Ett slumpmässigt urval på restauranganställda tillfrågades. Av de som valdes ut i stickprovet var 179 kvinnor, och av dessa var 27 positiva till en legalisering av narkotika; bland de 264 männen i stickprovet var 22 positiva till en legalisering. Kan man hävda att inställningen till legalisering av narkotika skiljer sig åt mellan könen? Svara på frågan med hjälp av ett lämpligt statistiskt test på nivån 5%. 10 p) Uppgift 4 En binär signal som antar värdet 0 med sannolikhet 2/3 och värdet 1 med sannolikhet 1/3 sänds ut. Signalen passerar två stationer som var och en, oberoende av varandra, återger inkommande signal felaktigt med sannolikhet 1/7. Därefter når signalen mottagaren. Bestäm den betingade sannolikheten att den utsända signalen var 0 givet att mottagaren tog emot signalen 0. 10 p) Uppgift 5 Ett e-handelsföretag använder sig av online-reklam i form av klickbara annonser på Internet s.k. ads ) för att marknadsföra sin produkt, vilken finns i en billigare och en dyrare version. Om man klickar på annonsen kommer man till företagets nätbutik. Av de Internetanvändare som väljer att klicka på annonsen köper sedan 8% den billigare versionen av produkten, vilket ger en vinst på 100 kr till företaget, medan 2% köper den dyrare versionen av produkten, vilket ger en vinst på 200 kr till företaget. Ingen gör mer än ett köp och 90% av de som klickar på annonsen köper ingenting. 1 Reklam är dock inte gratis, och varje gång någon klickar på annonsen måste företaget betala 6 kr för annonseringstjänsten, oavsett om klicket leder till ett köp eller inte. Bestäm sannolikheten att företaget totalt sett gjort en nettovinst efter det att 100 Internetanvändare har klickat på annonsen. Lämpliga approximationer och oberoendeantaganden får göras. 10 p) Uppgift 6 Livslängden i dagar) hos en för ett kontrollsystem kritisk komponent är exponentialfördelad med täthetsfunktion fx) 1 µ e x/µ, x > 0, dvs. livslängden hos komponenten är exponentialfördelad med väntevärde µ > 0. I kontrollsystemet kopplas två sådana komponenter med oberoende livslängder X 1 och X 2 i serie med varandra. Detta ger livslängden Y minx 1, X 2 ) hos kontrollsystemet. a) Bestäm täthetsfunktionen för Y samt EY ) och V Y ). 5 p) b) Man mäter livslängderna y 1, y 2,..., y 50 hos 50 stycken oberoende kontrollsystem varvid medellivslängden ȳ 19.5 erhålles. Bestäm ML-skattningen µ av µ baserat på dessa observationer samt beräkna Eµ ) och Dµ ). 5 p) Om du inte lyckats lösa a) kan du i b) anta, inkorrekt, att Y har täthetsfunktionen f ovan.) Lycka till! 1 Detta betyder att den s.k. konverteringsgraden är 10% i detta fall.
Avd. Matematisk statistik LÖSNINGAR TILL TENTAMEN I SF1901, SF1905 SANNOLIKHETSTEORI OCH STATISTIK I MÅNDAGEN DEN 11 JANUARI 2016 KL 14.00 19.00. Svar är understrukna. Uppgift 1 a) Antalet försenade tåg per dag, X, är Po2)-fördelat. Sannolikheten att minst tre tåg är försenade en given dag ges, enligt tabell, av P X 3) 1 P X 2) 1 0.67668 0.3233 0.32. b) Antalet dagar, Y, en given vecka som minst tre tåg är försenade är Bin7, p)-fördelat, där sannolikheten p 0.3233 erhölls i a). Sannolikheten att minst tre tåg är försenade högst tre dagar en given vecka ges av P Y 3) 3 k0 ) 7 p k 1 p) 7 k {med p 0.3233} 0.84. k Uppgift 2 a) Beteckna antalet förlorade timmar vid fabrik i före och efter säkerhetsprogrammets införande med x i resp. y i, i 1, 2,..., 10. Antalen förlorade timmar antas vara observationer av oberoende stokastiska variabler X i Nµ i, σ 1 ) resp. Y i Nµ i, σ 2 ), i 1, 2,..., 10. Alla parametrar i normalfördelningarna är okända. Det föreligger stickprov i par, och vi bildar därför differenserna Z i X i Y i N, σ), i 1,..., 10. Motsvarande observationer är 9, 13, 2, 5, 2, 6, 6, 5, 2, 6 och vi erhåller z 5.2 och s z 4.077. Eftersom standardavvikelsen σ är okänd, så är z s z / 10 5.2 4.077/ 10 en observation av en t9)-fördelad stokastisk variabel. Då vi vill undersöka huruvida programmet har haft någon effekt antingen positiv eller negativ), så konstruerar vi ett tvåsidigt konfidensintervall för på nivån 99%. t-metoden ger I z ± t 0.005 n 1) s z 10 ) 5.2 ± 3.25 4.077 10 ) 1.01, 9.39). b) Eftersom konfidensintervallet för ovan bara innehåller positiva tal drar vi slutsatsen på nivån 99% att säkerhetsprogrammet har effekt på olycksrisken.
forts tentamen i SF1901 2016-01-11 2 Uppgift 3 Vi använder ett χ 2 -oberoendetest för att testa hypotesen att inställningen till legalisering av narkotika är oberoende av könstillhörighet. Låt p ij vara andelen av kön i, där i 1 och i 2 motsvarar kvinnor resp. män, som har inställning j till legalisering av narkotika, där j 1 och j 2 motsvarar negativ resp. positiv inställning. Nollhypotesen H 0 är att p ij p i p j, där p i är andelen av populationen som har könstillhörighet i och p j är andelen av hela populationen som har inställning j till legalisering av narkotika. Mothypotesen H 1 är att H 0 inte gäller, dvs. p ij p i p j för något i och j. Vi får kontingenstabellen Den observerade teststorheten är 152 179 Q 394 179 394 242 264 + 394 264 394 j 1 j 2 Totalt i 1 152 27 179 i 2 242 22 264 Totalt 394 49 ) 2 ) 2 + + 27 179 ) 49 2 179 49 22 264 49 264 49 ) 2 4.94. Under H 0 är approximativt Q en observation av en χ 2 -fördelad stokastisk variabel med 2 1)2 1) 1 frihetsgrad och vi förkastar H 0 för stora värden på Q. Eftersom, enligt tabell, χ 2 0.051) 3.84 och Q 4.94 > 3.84, så förkastar vi på nivån 5% hypotesen att inställningen till legalisering av narkotika är oberoende av könstillhörighet. Vi har således påvisat ett beroende mellan könstillhörighet och inställningen till legalisering av narkotika hos restauranganställda i Stockholm. Uppgift 4 Låt I 0 och I 1 beteckna händelserna att inkommande signal är 0 resp. 1. Det är givet att P I 0 ) 2/3 och att P I 1 ) 1/3. Sannolikheten att signalen får ett felaktigt värde efter den passerat de båda stationerna är 1 P inget signalbyte) P två signalbyten) 1 6 7 6 7 1 7 1 7 12 49, och sannolikheten att signalen behåller sitt värde är följaktligen 37/49. Låt nu M 0 och M 1 beteckna händelserna att den mottagna signalen är 0 respektive 1. Vi vill bestämma P I 0 M 0 ). Bayes sats och lagen om total sannolikhet ger P I 0 M 0 ) P M 0 I 0 )P I 0 ) P M 0 ) 37 2 49 3 37 2 + 12 1 49 3 49 3 P M 0 I 0 )P I 0 ) P M 0 I 0 )P I 0 ) + P M 0 I 1 ) P I 1 ) 37 43 0.86, där de betingade sannolikheterna P M 0 I 0 ) och P M 0 I 1 ) är lika med sannolikheterna att signalens värde behålls resp. ändras när den passerar de båda stationerna.
forts tentamen i SF1901 2016-01-11 3 Uppgift 5 Låt X i vara intäkten för företaget då internetanvändare i 1,..., 100 klickar på annonsen. Väntevärdet för X i är E X i ) 0.08 100 + 0.02 200 6 6, och variansen för X i är V X i ) E ) Xi 2 E Xi ) 2 0.08 94 2 + 0.02 194 2 + 0.9 6) 2) 6 2 1456. Intänkterna X 1,..., X 100 antas vara oberoende, likafördelade stokastiska variabler, så enligt centrala gränsvärdessatsen är den totala intäkten S X 1 +... + X 100 approximativt normalfördelad med väntevärde 100 6 600 och standardavvikelse 100 1456 381.58. En approximation av sannolikheten att den totala intäkten är positiv ges sålunda av S 600 P S > 0) 1 P S 0) 1 P 381.58 0 600 ) 1 Φ 600 ) 381.58 381.58 1 Φ 1.5724) 0.94. Uppgift 6 a) Fördelningsfunktionen för X i, i 1, 2, ges av F Xi x) P X i x) x 0 1 µ e z/µ dz [ e z/µ] x z0 1 e x/µ, x > 0. Eftersom Y min X 1, X 2 ) > y om endast om såväl X 1 > y som X 2 > y, så blir fördelningsfunktionen för Y, då X 1 och X 2 är oberoende, F Y y) P Y y) 1 P Y > y) 1 P X 1 > y, X 2 > y) 1 P X 1 > y) P X 2 > y) 1 1 1 e y/µ)) 2 1 e 2y/µ, y > 0. Täthetsfunktionen för Y fås sedan genom derivering med avseende på y. Detta ger f Y y) df Y dy y) 2 µ e 2y/µ, y > 0, varvid vi inser att Y Exp2/µ). Därmed följer direkt, med hjälp av formelsamlingen, att EY ) µ/2 och V Y ) µ 2 /4. b) ML-skattningen µ av parametern µ maximerar likelihoodfunktionen Lµ) eller, ekvivalent, log-likelihoodfunktionen ) 2 ln Lµ) ln µ e 2y i/µ 50 2 µ e 2y i/µ, ln 2 ln µ 2y ) i 50 ln 2 50 ln µ 2 µ µ y i.
forts tentamen i SF1901 2016-01-11 4 För att bestämma ett maximum sätter vi derivatan av ln Lµ) med avseende på µ) till noll och löser ut µ enligt d ln L µ) 50 dµ µ + 2 µ 2 y i 0 µ obs 2 50 y i 50 2ȳ 39. Det återstår att bestämma Eµ ) och Dµ ). Gällande väntevärdet får vi, med hjälp av a), Eµ ) E 2Ȳ ) 2 50 EY i ) 2 50 50 EY ) 2 50 50 µ 2 µ. ML-skattningen är alltså väntevärdesriktig i detta fall.) Variansen för µ ges av, då Y i :na är oberoende, V µ ) V 2Ȳ ) 4 50 ) 50 2 V Y i 4 50 2 V Y i ) 4 2 50 V Y ). 50 Genom att använda a) får vi vilket ger standardavvikelsen V µ ) 4 µ2 2 50 50 4 µ2 50, D µ ) µ 5 2.