Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare. Ansvarig lärare: Abdullah Almasri, telefon 00 46 - (0)54 700 1672 Övrigt: För att få maximala 10 poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 40 poäng, för betyget Väl Godkänd krävs minst 60 poäng. Uppgift 1 En undersökning har gjorts med 11 pojkar som går i sjätte klass. Pojkarna valdes ut slumpmässigt från en grupp med mycket låg vikt. Pojkarnas vikt mättes både före och efter att de har genomgått en speciell kostdiet under en månad. Nedan finns de uppmätta vikterna hos dessa 11 pojkar: Pojke 1 2 3 4 5 6 7 8 9 10 11 Före 65 63 71 60 66 72 78 74 58 59 65 (lbs) Efter (lbs) 70 68 75 60 69 70 81 81 66 56 71 a) Illustrera data materialet med två box-plots (lådagram) brevid varandra, alltså både före och efter. (5 poäng) b) Förklara den information man får i diagrammet när man jämför före behandling mot efter behandling. (5 poäng) Uppgift 2 För händelserna A och B gäller att A) = 0,5 och B) = 0,3 samt A eller B) = 0,65, dvs. A B). a) Först beräkna A och B), dvs. A B), sedan avgör om A och B är oberoende händelser. (5 poäng) b) Beräkna A I A eller B), dvs. A A B). (5 poäng)
Uppgift 3 Beräkna P ( X μ + σ ) i följande tre fall: a) X är Bin ( n = 7; π = 0,4) b) X är Hyp ( N = 25, n = 5, S = 4) c) X är Po( μ = 3 ) (a-c 10 poäng total) Uppgift 4 Vid en lektion i statistik utför läraren ett antal kast med en symmetrisk tärning som är numrerad på vanligt sätt. Efter sex kast har läraren fått värdet 5 i samtliga kast. a) Om vi låt X beteckna antal sexor vid 6 kast av tärningen, vad kan vi säga om fördelningen för X? Motivera noga och ange värdet på parametrarna. Vad är väntevärdet och standardavvikelsen av X? (5 poäng) b) Beräkna sannolikheten att få värdet 5 i samtliga kast. (2 poäng) c) Läraren frågar studenterna vad som kommer att ske om hon fortsätter kasta tärningen. En student resonerar på följande sätt: I det långa loppet skall samtliga värden förekomma lika ofta. Eftersom värdet 5 redan har erhållits i sex kast måste sannolikheten för detta värde i det sjunde kastet nu vara betydligt mindre än 1/6. Kommentera resonemanget. (3 poäng) Uppgift 5 Betrakta en population med µ=300 och σ = 16. Ur denna population konstruerar man en samplingfördelning av X baserad på ett stickprov med 81 individer. a) Vad är samplingfördelnings medelvärde och standardavvikelse? b) Vad menas med Centrala Gränsvärdessatsen? (10 poäng) Uppgift 6 En student som läser statistik har fått en uppgift om att göra en undersökning om antal timmar som varje student i STAA10 pluggar under en vecka. Sex studenter valdes slumpmässigt och antalet studerade timmar veckan innan noterades (i timmar). 33, 15, 6, 31, 20, 13 Antag att Antal studietimmar är normalfördelad. Bestäm ett 95% konfidensintervall för den genomsnittliga antal studietimmar hos studenter i STAA10 om:
a) σ 2 = 4. b) σ 2 är okänd och skattas med s 2. (10 poäng) Uppgift 7 En forskare ville undersöka om genomsnittliga intelligensen (IQ) i populationen av svenska barn är 100. För detta valde han slumpmässigt 16 barn. Barnen poäng hade x = 109 och s = 9. a) Testa H0: µ = 100 mot H1: µ 100. b) Vad menas med typ I fel och typ II fel. (10 poäng) Uppgift 8 Antag att vi ska skatta den regressionsmodellen: Y i = β 0 + β 1 X i + ε i Med hjälp av N = 8 observationer på X i och Y i. Man har följande datamaterial. Yi: 0 1 3 2 5 4 7 9 Xi: 3 2 4 0 3 6 5 7 a) Beräkna med hjälp av minsta kvadrat metoden (least square method) interceptet a och regressionskoefficienten b. b) Använd dina beräkningar i (a) för att beräkna residualspridningen (standard error of estimate). c) Beräkna determinationskoefficienten r 2, och tolka den. (10 poäng)
Lösningar Uppgift 1 Ordnat data (lägst till högst): Förre Efter 58 56 59 60 60 66 63 68 65 69 65 70 66 70 71 71 72 75 74 81 78 81 Placering i ordnat 11+ 1 data: L 25 = = 3 4 Placering i ordnat 11+ 1 data: L 50 = = 6 2 Placering i ordnat 3(11+ 1) data: L 75 = = 9 4 Q = Q3-Q1 Extremobservationer ligger under: Q1 1,5Q Eller över: Q3 + 1,5Q Pojkensvikt förre Q1 ligger vid individ 3 Q 1 = 60 Q2 ligger vid individ 6 Q 2 = 65 Q3 ligger vid individ 9 Q 3 = 72 Q = 12 60 1,5(12) = 42 72 + 1,5(12) = 90 Pojkens vikt efter Q1 ligger vid individ 3 Q 1 = 66 Q2 ligger mellan individ 6 Q 2 = 70 Q3 ligger vid individ 9 Q 3 = 75 Q = 9 66 1,5(9) = 52,5 75 + 1,5(9) = 88,5 Dvs. det finns inga extrema observationer. Dvs. det finns inga extrema observationer Minsta värdet 58 56 Max värdet 78 81
Kommentera diagrammet med egna ord. Notera: SPSS räknar fram en extremobservation i gruppen Pojkens vikt efter behandlingen. Varför? Jag vet inte! Uppgift 2 Från uppgiften vet vi att A) = 0,5 och B) = 0,3 samt A eller B) = 0,65 a) Additionssatsen är AellerB) = A) + B) AochB) Från uppgiften vet vi att: 0,65 = 0,5 + 0,3 AochB) Vi kan lösa detta och får fram A och B) = 0,5 + 0,3-0,65 = 0,15 Eftersom A och B) = 0,15 = 0,5(0,3) = A)B) då inse vi att A och B är oberoende av varandra.
**Notera: Man kan inte börja med att anta oberoendet finns, först tar man fram A och B) och sen visar man att A och B) = A)BIA) = A)B) dvs. oberoendet finns. b) Aoch( AellerB)) A) 0,5 10 P ( A AellerB) = = = = = 0,77 AellerB) AellerB) 0,65 13 Tips: Använd en venn diagram för att 'se' på A och (A eller B)). **Notera man kan inte anta att händelser A och (A eller B) är oberoende av varandra. Uppgift 3 a) X är Bin ( n = 7; π = 0,4) Vi söker: P ( X μ + σ ) μ = n π = 7 (0,4) = 2,8 σ = n π ( 1 π ) = 7(0,4)(0,6) = 1,3 Då söker vi: X μ + σ ) = X 2,8 + 1,3) = X 4,1) Eftersom X är diskret söker vi X 5) P ( X 5) = 1 X 4) = 1 b) X är Hyp ( N = 25, n = 5, S = 4) S 4 π = = = 0,16 N 25 Vi söker: P ( X μ + σ ) μ = n π = 5 (0,16) = 0,8 N n 25 5 σ = nπ ( 1 π ) = 5(0,16)(0,84) = 0,75 N 1 25 1 Då söker vi: X μ + σ ) = X 0,8 + 0,76) = X 0,92) Eftersom X är diskret söker vi: X 1) P ( X 1) = 1 X = 0) = 1 4 C 0 25 21 C 5 C 5 1 20349 = 1 = 0,62 53130
c) X är Po( μ = 3 ) Vi söker: P ( X μ + σ ) μ = σ 2 = 3 σ = 3 = 1,73 Då söker vi: X μ + σ ) = X 3 + 1,73) = X 4,73) Eftersom X är diskret söker vi: X 5) P ( X 5) = 1 X 4) = 1 Uppgift 4 a) b) c) Man gör ett försök och kasta tärningen 6 gånger, n=6. I varje delförsök, när man kasta tärningen, får man antigen 5:a eller något annat. antal5 : or 1 Sannolikheten att få en 5:a är π = = = 0, 17, och är antalalternativ 6 densamma vid varje kast. Sannolikheten att få en 5:a är oberoende av tidigare kast, dvs. delförsöken är oberoende av varandra. X betecknar antal 5:or vid 6 kast av en symmetrisk tärning. X är en diskretslumpvariabel. 1 X följer en Binomialfördelning, X ~ Bin(n=6, π = = 0, 17 ) 6 1 Väntevärdet: E ( X ) = μ n π = 6 = 1 6 2 1 5 5 Variansen: Var ( X ) = σ = nπ (1 π ) = 6 = = 0, 83 6 6 6 5 Standardavvikelse: σ = n π ( 1 π ) = = 0, 91 6 X=6) = {1/6 är inte med i tabellsamling, vi använder formeln [6-3]} 6 0 6 1 5 1 P ( X = 6) = 6 C6 = = 0,0002 6 6 6 Det är väldigt osannolik att få 6 5:or vid 6 kast av en tärning, är tärningen faktisk symmetriskt? Egna kommentarer.
Uppgift 5 a) 300, 16/9. b) Se boken. Uppgift 6 x = 19.66 a) 19.66±1.96*(2/2.45) 19.66±1.6 [18.06,21.26] b) σ = 10.57 19.66±2.57*(10.57/2.45) [8.57, 30.75] Uppgift 7 109 100 a) Testfunktionens observerade värde: t = = 4 9 / 16 Vid 5% signifikansnivå t med (16-1) antal f.g. från tabellen = +- 2.31. 4 ligger i det kritiska området. Vi förkastar H 0 och drar med ledning av detta stickprov slutsatsen att genomsnitts intelligensen för populationen ifråga är skild från 100. b) se boken Uppgift 8 a) a = 0.204 och b = 0.979. b) S Y.X = 2.267414. c) R 2 = 0.524.