Avd. Matematisk statistik TENTAMEN I SF90, SF905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 8:E AUGSTI 204 KL 08.00 3.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 0 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift a) A och B är två händelser sådana att P (A B) = 0.2, P (B A) = 0.5 och P (A B) = 0.6. Beräkna P (A) och P (B) samt avgör om A och B är oberoende. (5 p) b) För att bestämma om en patient har blivit smittad med en sällsynt parasitsjukdom tar man ett blodprov från patienten och testar detta. Det specifika test som man använder har egenskapen att det ger ett positivt falskt svar med sannolikheten 0.05, dvs P (Testet är positivt Patient är frisk) = 0.05 samt ett negativt falskt svar med sannolikheten 0.0, dvs P (Testet är negativt Patient är smittad) = 0.0. Det visar sig att patienten har varit på semester under en längre tid i den del av världen där cirka 99% av befolkningen är smittad av parasiten. Man vet också av erfarenhet att om man vistas länge i regionen har man samma risk att bli infekterad som lokalbefolkningen. Om testet i detta fall visar ett negativt resultat hur stor sannolikheten är att patienten är smittad? (5 p) Uppgift 2 De oberoende stokastiska variablerna X och Y har båda täthetsfunktionen 3, x, x f X (x) = 4 0 f. ö.
forts tentamen i SF90 204-08-8 2 a) Bestäm V (X). (3 p) b) Bestäm täthetsfunktionen för T = max(x, Y ) dvs för den största av X och Y. (7 p) Uppgift 3 I ett kvartersbageri handlar en viss dag 00 personer. Antaler limpor en kund efterfrågar betraktas som en stokastisk variabel X med sannolikhetsfunktionen 0.4 om k = 0, 0.3 om k =, p X (k) = 0.3 om k = 2, 0 om k > 2. Olika personers inköp förutsättes oberoende. a) Bestäm E(X) och D(X). (3 p) b) Beräkna med lämplig och välmotiverad approximation sanolikheten at lagret räcker om bageriet har bakat 95 limpor ovannämnda dag. (7 p) Uppgift 4 Snabb, Rent och Blank är tre konkurrerande diskmedel till diskmaskin. Under en längre tid har 30% av kunderna efterfrågat diskmedel Snabb, 50% diskmedel Rent, och 20% diskmedel Blank. Nyligen har diskmedel Blank genomgått en förändring, och man vill veta om diskmedels marknadsandelar därigenom har förändrats. Vid en marknadundersökning av 200 kunder fann man att 48 nu sade sig föredra diskmedel Snabb, 98 diskmedel Rent och 54 diskmedel Blank. Avgör med felrisken 5% om förändringen av diskmedel Blank medför en ändring av marknadsandelarna. Det måste klart framgå av svaret vad slutsatsen är. (0 p) Uppgift 5 Vattenprover från en insjö analyseras en gång per dag av två forskare, A och B. För att undersöka om det fanns några systematiska skillnader mellan de båda forskarnas mätresultat gör man följande experiment: varje dag under 8 dagars tid togs ett vattenprov från sjön. Detta delas i två delar och A och B fick analysera var sitt sådant delprov. Resultatet av analysen (enhet:bakteriehalt per lämplig volumsenht) blev enligt följande. Dag nr 2 3 4 5 6 7 8 A: 0.0 7.8 6.3 5.9 9.8 0.2 0.9 8.8 B:. 9. 4.9 5.8 9.5 0.7 0.3 7.7 a) Konstruera ett konfidensintervall för den förväntade skillnaden i märtesultat mellan A och B, med konfidensgrad 95%. Var noga med att ange dina antaganden! (8 p) (b) Undersök som ett hypotesprövningsproblem på signifikansnivån 5% om det finns någon systematisk skillnad mellan A och B märtesultat. Formulera noga de hypoteser du använder! (2 p)
forts tentamen i SF90 204-08-8 3 Uppgift 6 Livslängden hos en typ av glödlampor kan på goda gruder antagas vara en stokastisk variabel T som är exponentialfördelad, T Exp(/µ) där µ > 0 är okänd. Om lampan har defekt vakuum är µ = 2 timmar och om den har felfritt vakuum är µ = 000 timmar. För att testa en lampa provlyser man den i 0 timmar. Vi testar H 0 : µ = 000 mot H : µ = 2 och förkastar H 0 om lampan lyser kortare tid än 0 timmar. Bestäm testets signifikansnivå och beräkna styrkan mot alternativet µ = 2. (0 p)
Avd. Matematisk statistik LÖSNINGAR TILL TENTAMEN I SF90, SF905 SANNOLIKHETSTEORI OCH STATISTIK I MÅNDAGEN DEN 8 AUGUSTI 204 KL 08.00 3.00. Uppgift a) P (A B) = P (B) P (B) = P (A B) = 0.2 = 5. Vidare P (A) = P (B A) = 2. P (A B) = P (A) + P (B) = 2 + 5 = 6 Detta ger = 0.6 6 = 0.. P (A) = 2 0. = 0.2, P (B) = 5 0. = 0.5. Eftersom P (A) P (B) = 0.2 0.5 = är A och B oberoende. Svar: P (A) = 0.2, P (B) = 0.5, A och B är oberoende. b) P (Smittad) = 0.99. P (Test neg.) = P ( Test neg. Smittad ) P (Smittad ) + P (Test neg. Frisk ) P (Frisk) = Vidare P (Smittad Test neg.) = = 0.0 0.99 + 0.95 0.0 = 0.094. P (Test neg. Smittad) P (Smittad) P (Test neg.) = 0.0 0.99 0.0 0.99 + 0.95 0.0 = 0.503. Svar: P (Smittad Test neg.) = 0.503. a) E(X) = E(X 2 ) = xf X (x)dx = x 2 f X (x)dx = Uppgift 2 x 3 x 4 dx = 3 2 x 2 =.5. x 2 3 x 4 dx = 3x = 3.
forts tentamen i SF90 204-08-8 2 Svar: V (X) = 0.75. V (X) = E(X 2 ) (E(X)) 2 = 3 (.5) 2 = 0.75. b) Vi bestämmer först fördelningsfunktion av X som ges av F X (x) = P (X x) = x f(y)dy = x 3 y 4 dy = y 3 x = x 3, x. Vidare F T (t) = P (T t) = P (max(x, Y ) t) = P (X t, Y t) = ober.x, Y = P (X t) P (Y t) = (F X (t)) 2 = f T (t) = d dt F T (t) = 2 ( t 3 ) ( 3 t 4 ), t 0 f. ö. ( ) 2 t, t, 3 0 f. ö. = 6 ( ) t 4 t, t 7. 0 f.ö.. a) Uppgift 3 2 E(X) = k p X (k) = 0 0.4 + 0.3 + 2 0.3 = 0.9. k=0 2 E(X 2 ) = k 2 p X (k) = 0 2 0.4 + 2 0.3 + 2 2 0.3 =.5. k=0 V (X) = E(X 2 ) (E(X)) 2 =.5 0.8 = 0.69, D(X) = V (X) = 0.69 0.83. Svar: D(X) 0.83. b) Låt den stokastiska variabeln X j, j =,..., 00 beteckna antalet limpor som kund nr j köper. Låt Y = 00 j= X j vara det totala antalet köpta limpor under dagen. Vidare 00 E(Y ) = E(X j ) = 00 0.9 = 90, j= 00 V (Y ) = oberoende X j = V (X j ) = 00 0.69 = 69. Enligt Centrala gränsvärdessatsen följer Y approximativt N(90, 69) fördelning. Detta ger ( ) ( ) Y 90 95 90 5 P (lager räcker) = P (Y 95) = P Φ = 0.726. 69 69 69 j= Svar: P (lager räcker) = 0.726.
forts tentamen i SF90 204-08-8 3 Uppgift 4 Vi gör ett χ 2 -test av H 0 : p = 0.3, p 2 = 0.5, p 3 = 0.2. Vi har 200 P (Snabb) = 200 0.3 = 60, 200 P (Rent) = 00 och 200 P (Blank) = 200 0.2 = 40. Villkoret np i > 5 är alltså uppfyllt. Testvariabeln är alltså Q obs = (48 60)2 60 + (98 00)2 00 + (54 40)2 40 7.34 Vi testar en given fördelning, så Q obs är en observation av en χ 2 -fördelad stokastisk variabel med 3-=2 frihetsgrader. Eftersom Q obs > χ 2 α(2) = 5.99 förkastar vi H 0 med felrisken 5% dvs. vi drar slutsatsen att förändringen av Blank medfört en ändring av marknadsandelarna. Svar: Förändringen av Blank medfört en ändring av marknadsandelarna Uppgift 5 Rätt sätt att analysera sådana data är som stickprov i par. Bilda alltså z j = x j y j, där x j och y j är mätresultat under dag j för forskare A respektive B. Vi finner nu z j = x j y j = 0.6. Vi antar att observation z j kommer från en och samma fördelning med något väntevärde, och vi vill göra ett konfidensintervall för denna parameter. Vi antar också att variationen i z- observationerna är normalfördelad. Skattningarna vi använder är då och σ = s = obs = z = 0.6/8 = 0.075 (zj z) n 2 = 0.9809. Under normalfördelningsantagandet ges ett konfidensintervall för med 95% konfidensgrad av z±t 0.025 (n )s/ n (se formelsamlingen). Då t 0.025 (n ) = 2.36 (t ex ur tabell) blir det numeriska resultatet (0.075 ± 0.884). Svar: I = (0.075 ± 0.884). (b) Med parametern som i deluppgift (a) vill vi testa H 0 : = 0 mot H : 0. Eftersom det konfidensintervall vi beräknade i (a), med konfidensgrad 95%, innehåller punkten 0, så förkastar vi inte H 0 på signifikansnivån 5%. Svar: H 0 : = 0 förkastas ej på 5%-nivån. Ingen systematisk skillnad mellan A:s och B:s mätresulat upptä Uppgift 6 Givet är att T Exp(/µ), dvs T är en stokastisk variabel med fördelningsfunktion e x µ, x 0, F T (x; µ) = 0 f. ö. där µ > 0 är en okänd parameter. Låt t vara ett utfall av T. Vi testar H 0 : µ = 000 mot H : µ = 2 med följande test: H 0 förkastas om t < 0, H 0 förkastas inte om t 0. Testets nivå = P (H 0 förkastas H 0 är sann) = P (T < 0 µ = 000)
forts tentamen i SF90 204-08-8 4 = F T (0; 000) = e 0 000 = e 0.0 0.00995. Testets styrka = P (H 0 förkastas H är sann) = P (T < 0 µ = 2) = F T (0; 2) = e 0 2 = e 5 0.9933. Svar: Testets nivå 0.00995, testets styrka under alternativ 0.9933.