; Örebro universitet Handelshögskolan, statistik Statistik A, Grundläggande statistik TENTAMEN FREDAGEN DEN 23 MARS 2012, Kl 08.15-13.15 Hjälpmedel: Miniräknare, ett A4-papper med egna anteckningar, tabell- och formelsamling utgiven av statistiska enheten. Jourhavande lärare: Niklas Karlsson, tel: 070... 8 uppgifter, 11axpoäng: 100 + 10 (maxpoäng från dugga). Gräns för Godkänd: 50 p (inklusive ev. poäng från dugga). Gräns för Väl Godkänd: 75 p {inklusive ev. poäng från dugga). Obs: Efter varje löst uppgift, börja nästa uppgift på nytt papper.
l. Kostnaden för att delta i ett visst lotteri är 10 kronor. Vinsten i lotteriet, där kostnaden har dragits bort, är en stokastisk variabel X med nedanstående sannolikhetsfördelning: x 990 90 o -10 P(X =x) 0.001 0.009 0.14 0.85 (a) Hur stor är sannolikheten att vinsten blir positiv? (b) Bestäm förväntad vinst och standardavvikelse för vinsten. (c) En person spelar lotteriet varje vecka under ett år (52 veckor). Beräkna approximativt sannolikheten att den sammanlagda vinsten efter ett års spelande är positiv? Ledtråd: Använd Centrala gränsvärdessatsen. (15p} 2. Ett inbrottslarm har egenskapen att i händelse av ett inbrottsförsök utlöser larmet med sannolikheten 0.9. Tyvärr utlöser larmet också 10% av de dagar då det inte sker något inbrott. Utgå från att ett inbrottsförsök görs i genomsnitt var hundrade dag då du löser deluppgifterna nedan. (a) Hur stor är sannolikheten att larmet utlöser en slumpmässigt vald dag? (b) Hur stor är sannolikheten att det faktiskt är ett inbrottsförsök om larmet utlöser en dag? (lop) 3. Uppmätt mängd X av ett visst ohälsosamt ämne i en viss produkt anses N(J-1, a). Företaget som tillverkar produkten har förändrat produktionstekniken för att åstadkomma en sänkning av den genomsnittliga mängden av det farliga ämnet ifråga. Man har därefter gjort 30 oberoende mätningar och erhållit x= 4.60 och s= 0.322. Ett 1-1-värde i intervallet ( 4,3, 4.8} anses acceptabelt. Tyder resultatet på att man nu har ett acceptabelt JJ.-värde? Besvara frågan med ett lämpligt 95% konfidensintervall. (10p)
4. Vid en motorväg uppmättes för tre år sedan följande halter (ppm) koloxid vid 5 mättillfällen: A: 98.4 101.0 98.7 100.6 99.2 Under likartade förhållanden gjordes 5 mätningar även i år och man erhöll: B: 102.2 99.6 103.0 100.5 102.1 Antag att det föreligger två oberoende stickprov från normalfördelningar med samma varians. Kan vi påvisa en skillnad mellan genomsnittshalterna i år jämfört med för tre år sedan? Genomför ett test på signifikansnivå 5%. (Inför själv lämplig notation.) (15p) 5. Din chef har givit dig i uppdrag att uppskatta kostnaderna för datakonsulter som din arbetsgivare måste inhandla. 1\i har nämligen hittat ett gammalt magnetband som har använts som extern hårddisk för länge sedan. Chefen vill att du ska ta reda på hur många filer av de som magnetbandet innehåller som experter måste hjälpa er att lagra i ett nytt format. Magnetbandet innehåller 3000 filer och du gör ett urval om 400, bland dem visade sig 70 filer vara omöjliga att öppna. Beräkna ett 95%-igt konfidensintervall för det totala antalet filer som är omöjliga att öppna. (15p) r'" 6. En population har följande värden: l Individ nr l 2 3 4 5 6 7 8 9 10 11 12 l Värde 20 15 35 70 30 80 25 14 80 35 lo 50 Individ nr 13 14 15 16 17 18 19 20 21 22 23 24 Värde 45 92 29 lo 65 28 49 29 65 23 43 56 Individ nr 25 26 27 28 29 30 31 32 33 34 35 36 l Värde 20 7 24 92 90 80 26 5 19 9 16 48 l Drag ett stickprov om n = 3 individer genom systematiskt urval. Använd följande utdrag ur en slumptalstabell: 19223 95034 05756 28713 96409 12531 För full poäng måste du redogöra för hur du har använt slumptalstabellen. (10p)
7. En mäklare analyserade huruvida priserna på småhus i Skåne kan antas vara beroende av antalet kvadratmeter i husen. Som utgångsdata har man följande: 40 observationer x= 195.90, standardavvikelsen för x: sd(x) = 68.534 y= 283.57, standardavvikelsen för y: sd(y) = 112.68 Korrelationen mellan y och x, korr(x, y): r= 0.619 (x = antal kvadratmeter i huset och y = priset i tiotusentals kr) (a) Skatta regressionslinjens parametrar med NIK-metoden. (b) Är lutningskoefficienten signifikant (=l= O) på 5%-nivån? (8p) (12p) 8. I ett slumpmäsigt urval av 2000 invånare i Örebro och Kurnia fick invånarna ta ställning till vilket av tre givna alternativ (här betecknade I, II~ III) som de ansåg vara viktigast för den egna stadens framtida utvecklil!g. Resultatet framgår av nedanstående korstabell med observerade frekvenser. I II III Total O re bro 220 310 370 900 Kurnia 280 390 430 1100 Total 500 700 800 2000 Gör ett x 2 -test på signifikansnivå a = 5%, för att undersöka om det råder beroende mellan boendeort och åsikt (om vilket utvecklingsalternativ som är viktigast). (5p)
ÖREBRO UNIVERSITET Handelshögskolan, Statistik LÖSNINGAR TENTAMEN STATISTIK A, 23 MARS, 2012 l. (a) P( X> O)= P(X = 990) + P(X = 90) =l 0.011 (b) E(X) = 990 0.001 + 90 0.009-10 0.85 = l-6.71 E(X 2 ) = 990 2 0.001 + 90 2 0.009 + 10 2 0.85 = 113S => V(X) = 1138-6.7 2 = 11093.111 (c) Låt Xi =vinsten i vecka i, i= l,..., 52. Vi har enl CGS att L:~! 1 Xi a~r N(52 (-6.7), v'52 1093.11) = N( -348.4, v'5684.172) Alltså: P(L:~! 1 Xi >O)= l- P( Z:::; 0 ;i~~~~;~>) ~l- P(Z:::; 1.46) ~ 10.0721 2. Låt A= {Larmet utlöses} och B= {Inbrottsförsök} Vi har då att P(AIB) = 0.9, P(AIB) = 0.1, samt att P(B) = 0.01. (a) ~(A) l P(AIB)P(B) + P(AIB)P(B) = 0.9 0.01 + 0.1 0.99 = 0.108 (b) P(BIA) - P(AIB)P(B) - 0.9 0.01 "J l o 0831 - P(A) - 0.108 - L-. - -----J. (Att sannolikheten i (b) blir så förskräckande låg, beror på att larmet utlöses mycket oftare 'falskt' än när det verkligen ska utlösas.) 3. lp. =X± ta/2-jn Här är n = 30~ x = 4.60, s = 0.322 och Zaf2 = 2.0452 (t-fördelning med 30-1=29 frihetsgrader och a = 0.05) :. lp.= 4.60 ± 0.120 =l (4.48, 4.72) (95%) l Intervallet täcks av (4.3, 4.8), vilket innebär att vi med stor säkerhet har ett acceptabelt J.L-värde.
4. XA rv N(J.LA, a), XB rv N(J.LB, a) Pröva Ho : J-LA = J.LB mot H 1 : J.LA =l= J.LB på signifikansnivå 5%. Två oberoende stickprov: Testvariabel: x~ rv t(8) under H 0 (8=5+5-2), där s 2/5 8 2 = (S}A + S}B)/2 Förkasta Ho om ITI ~ to.o2s = 2.306. XA = 99.58, SxA = 1.1584..., XB = 101.45, Sxs = 1.3881..., s= 1.2784... =>T~ -2.35 1:. Förkasta Hol 5. Vi ska åstadkomma ett 95%-igt konfidensintervall för A, som vi minns är lika med N P. Om P är populationsandelen, så är N P det totala antalet i populationen. Enestimator av N P är N p. Ett 95%-igt konfidensintervall för A = N P ges av Np ± 1.96v N 2 (l-~) fj~l ~ :). Här N = 3000 och n = 400, samt p = 70/400. Då blir Np = 525. Felmarginalen blir 1.96JN2 (1- ~) p(l- p)= N n-1 30002 (l - 400 ) 0.175 (l - 0.175) = 104 1269 3000 399 o och därmed blir konfidensintervallet 1525 ± 104.12691 6. Kvoten N= 36 = 12. n 3 Det finns alltså tolv möjliga stickprov beroende på vilket värde a antar. Samtliga stickprov återges vertikalt i nedanstående tabell: I II III IV v VI VII VIII IX x XI XII 20 15 35 70 30 80 25 14 80 35 lo 50 45 92 29 10 65 28 49 29 65 23 43 56 20 7 24 92 90 80 26 5 19 9 16 48
. Eftersom a ligger mellan l och 12, så måste vi dra tvåsiffriga slumptal. Om vi drar ensiffriga slumptal har ju de tre talen 10, 11 och 12 sannolikheten noll att bli utvalda. De tvåsiffriga slumptalen är 19, 22, 39, 50, 34, 05, o.s.v. De fem första talen kan vi inte använda, men det sjätte ger oss a= 5, så vårt stickprov blir alltså här 30, 65, 90. 7. (a) Syy = sd(y) 2 (n- l) = 112.68 2 39 = 495174.5136 Bxx = sd(x)2 (n- l)= 68.534 2 39 = 183179.4571 ~ = r~ = 11.01771 ~=y-,bx =.---184-.2-02---.61 (b) Vi vill pröva H 0 : {3 = O mot H 1 : {3 i= O, med teststatistikan f. {J som är t-fördelad med 40-2=38 frihetsgrader under H 0. Sp = JYj!, där MSE = ssr3sssr och där SSR = SST R 2 = Syy r 2 = 189731.5618~ vilket ger att MSE = 8037.972416. Vi får då att S i3 = 0.2094 76289 och f ~ 4.86 {J Kritiska värdet är t3s,o.o25 ~ 2.02, vilket betyder att l vi förkastar Ho l 8. Förväntade frekvenser (under nollhypotesen som innebär oberoende): 225 315 360 275 395 440 2 _ "" (O-E)2 _ (220-225) 2 +... + (430-440) 2 "J 0 8514 X - L, E - 225 440 - ' Kritiskt värde ((3-1)(2-1)=2 frihetsgrader)=5.9915 Alltså: l \Ti kan inte förkasta nollhypotesen om oberoende l