Tentamen i Statistik, STA A13 ( poäng) Lördag 11 november 00, Kl 09.00-13.00 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare. Ansvarig lärare: Hannah Hall, telefon 00 - (0)5 700 113 Övrigt: För att få maximala poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 30 poäng, för betyget Väl Godkänd krävs minst 5 poäng. Uppgift 1 5 31 0 5 3 51 3 1 5 3 7 35 39 77 35 5 a) Illustrera ovanstående data i ett stam-blad diagram. b) Beräkna medianen. c) Beräkna kvartilavståndet. d) Illustrera materialet i ett boxplot (lådagram). e) Utifrån dina diagram, blir medelvärdet större eller mindre än medianen? (a-e poäng vardera) Uppgift För händelserna A och B gäller att A) = 0,5 och B) = 0,3 samt A eller B) = 0,5, dvs. A B). a) Beräkna A och B), dvs. A B), samt avgör om A och B är oberoende händelser. (5 poäng) b) Beräkna A I A eller B), dvs. A A B). (5 poäng)
Uppgift 3 Hannah tar 5 lotter i ett lotteri. Lotteriet har totalt 0 lotter varav stycken är vinstlotter. Abdullah tar 5 lotter från ett annat lotteri som total har 000 lotter varav 00 är vinstlotter. Vem av de båda har störst chans att få åtminstone två stycken vinster? Motivera noga! ( poäng) Uppgift personer reste en viss dag med ett tåg från Karlstad och utfrågades då kortfattat om sina resvanor. I nedanstående korstabell visas hur dessa resenärer var fördelade när de sorteras på variablerna kön och hemkommun. Karlstad Kristinehamn Kil Annat kommun inom Värmland Annat kommun utanför Värmland Man 5 3 1 3 3 Kvinna 7 11 13 Anta att en av dessa personer väljs ut slumpmässigt. a) Hur sannolikt är det att personen är från Karlstad eller Kristinehamn? b) Hur sannolikt är det att personen är en man eller från Kristinehamn (eller båda)? c) Hur sannolikt är det att personen är en kvinna från en annan kommun än Karlstad? d) Givit att personen är från en kommun utanför Värmland, hur sannolikt är det att det är en man? e) Givit att personen är en kvinna, hur sannolikt är det att hon är från Karlstad eller Kristinehamn? (a-e poäng vardera)
Uppgift 5 Till varje del uppgift (a-e), ange, och motivera, fördelningen för X i följande exempel. Glöm inte att ange värdet på parametrarna. a) På en parkeringsplats står 150 bilar, där 90 bilar har vinterdäck. Hannah väljer slumpmässigt ut 0 bilar och X betecknar antal bilar på parkeringsplatsen med vinterdäck. b) En viss process i en dator som körs en gång per sekund dygnet runt åstadkommer att datorn havererar med sannolikheten 1 på hundra tusen. Låt X beteckna antalet haverier per vecka (7 dagar). c) En revolver med plats för skott har laddats med åtta tomhylsor och två skarpa skott, slumpmässigt placerade. Man vill beräkna hur sannolikt det är att ett skott går av när man trycker fyra gånger på avtryckaren (X betecknar antal skott). d) Under en dag kommer i genomsnitt 0 personer till ett bibliotek. Låt X beteckna antal personer som kommer till biblioteket under en vecka (7 dagar). e) Kristoffer går upp på en tentamen utan att han har pluggat innan! Han har tur, varje fråga består av sex kryssalternativ, varav ett är rätt. Totalt är det 0 frågor. Låt X beteckna antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. (a-e poäng vardera)
Uppgift Fyra variabler X1, X, X3 och X presenterades i följande histogram: Frequency 0 Frequency 1 1 0 X1 X Frequency Frequency 0 0 X3 X Samma variabler presenterades också i en boxplot diagram (lådagram), men etiketten om variabelns namn fattas. Para ihop boxplot diagrammen A, B, C och D med respektive variabel. ( poäng) 0 A B C D Variabel
Följande boxplot diagram visar fördelningen av en viss variabel delat på fem olika grupper. Jämför och kommentera på fördelningarna av de fem olika grupper (1-5). ( poäng)
Lösningar Uppgift 1 a) Stam-blad diagram Frequency Stem & Leaf 9. 01557 7 3. 1559. 5 1 5. 1 1. Extremes (>=7,5 eller <=-5,5) b) Medianen: Q c) Kvartilavståndet: Q d) Boxplot (lådagram) Placering i ordnat + 1 data: L 5 = =, 5 Placering i ordnat + 1 data: L 50 = = 1, 5 Placering i ordnat 3( + 1) data: L 75 = = 1, 75 Kvartilavståndet Q = Q3-Q1 Extremobservationer ligger under: Q1 1,5Q Eller över: Q3 + 1,5Q Q1 ligger mellan obs och7 Q1 = 5 + 0,5( 5) = 5,5 Q ligger mellan obs 1 och 13 35 + 35 Q = = 35 Q3 ligger mellan obs 1 och 19 Q3 = 5 + 0,75( 5) = 5,75 Q = 5,75-5,5 = 0,5 5,5 1,5(0,5) = -5,5 5,75 + 1,5(0,5) = 7,5 Minsta värdet 0 Max värdet Det finns två extrema observationer med värde: 77 och 5 5 (om man bortser från extrema observationer är det )
90 0 3 70 0 50 0 30 0 Y e) Utifrån diagramen (stam-blad och boxplot) ser man att fördelningen är positiv skev, det betyder att medelvärdet är större än medianen. Uppgift Utgår ifrån fördelningen i histogramet och jämför detta med boxploterna, tänk på spridning, gruppering, medianen, skevhet mm. X1 = C X = D X3 = A X = B Kommentera på de enskillda grupper (tex. spridning, skevhet och central tendensen) och jämför alla fem grupper (tex. störst/ minst spridning, lika/olika skevhet, central tendensen, spridning).
Uppgift 3 Från uppgiften vet vi att A) = 0,5 och B) = 0,3 samt A eller B) = 0,5 a) Additionssatsen är AellerB) = A) + B) AochB) Från uppgiften vet vi att: 0,5 = 0,5 + 0,3 AochB) Vi kan lösa detta och får fram A och B) = 0,5 + 0,3-0,5 = 0,15 Eftersom A och B) = 0,15 = 0,5(0,3) = A)B) då inse vi att A och B är oberoende av varandra. **Notera: Man kan inte börja med att anta oberoendet finns, först tar man fram A och B) och sen visar man att A och B) = A)BIA) = A)B) dvs. oberoendet finns. b) Aoch( AellerB)) A) 0,5 P ( A AellerB) = = = = = 0,77 AellerB) AellerB) 0,5 13 Tips: Använd en venn diagram för att 'se' på A och (A eller B)). **Notera man kan inte anta att händelser A och (A eller B) är oberoende av varandra. Uppgift Karlstad Kristinehamn Kil Annat kommun inom Värmland Annat kommun utanför Värmland TOTAL Man 5 3 1 3 3 13 Kvinna 7 11 13 1 TOTAL 1 9 3 7 Lösningarna utgår från tabellen. a) Personen är från Karlstad eller Kristinehamn) 5 + 3+ 7 + 1 = = = 0,73 b) Personen är en man eller från Kristinehamn, eller båda) 13 + 1 = = = 0,503
c) Personen är en kvinna från en annan kommun än Karlstad) + 11+ 13 + 7 = = = 0,57 d) Personen är en man I Personen är från en kommun utanför Värmland) 3 = = 0, 7 e) Personen är från Karlstad eller Kristinehamn I Personen är en kvinna) 7 + = = = 0, 1 1 Uppgift 5 Andelen vinstlotter är lika i de båda lotterierna men antalet lotter skiljer sig kraftigt åt. Hannah gör ett försök och väljer slumpmässigt 5 lotter, n=5. Det finns totalt 0 lotter att välja från, N=0, av dessa är vinstlotter (den önskad S egenskap), S=. Andelen vinstlotter är π = = = 0, N 0 X betecknar antal vinst lotter Hannah erhåller. I varje delförsök en lott ger vinst eller förlust. Delförsökerna är beroende av varandra, dvs. lotterna väljs utan återläggning. X följer en hypergeometrisk fördelning, X~Hyp(N=0, n=5, S=) Vi söker: X ) = 1 X 1) = 1 0) 1) C0 1 C5 C1 1 C 1 3 + X ) = 1 = 1 = 1 0,7513 = 0, 7 C C 1550 0 5 0 5 Låt Y vara antalet vinstlotter Abdullah erhåller. Y är hypergeometrisk fördelad, Y~Hyp(N=000, n=5, S=00) Beräkningen med Hyp blir besvärlig, kan en approximation används? n/n = 5/000 = 0,005 < tumregel 0,05, då är en approximation till S 00 Binomialfördelningen tillåten. Y~approx Bin(n=5, π = = = 0, ) N 000 Vi söker: P ( Y ) = 1 Y 1) = 1 0,7373 = 0, 7 **Om man räknar exakt med hypergeometriskfördelningen får man svaret: 0, Abdullah har lite större chans att få åtminstone vinstlotter.
Uppgift a) Man gör ett försök och väljer slumpmässigt 0 bilar, n=0. Det finns totalt 150 bilar på parkeringsplatsen, N=150, av dessa 90 bilar har vinterdäck (den önskad egenskap), S=90. Andelen med vinterdäck är S 90 π = = = 0, N 150 X betecknar antal bilar på parkeringsplatsen med vinterdäck. I varje delförsök en bil bedöms att ha eller inte ha vinterdäck. Delförsökerna är beroende av varandra, dvs. bilarna väljs utan återläggning. X följer en hypergeometrisk fördelning, X ~ Hyp(N=150,n=0, S=90) b) X betecknar antalet haverier per vecka (7 dagar), dvs. här kan man anta att det finns ingen övre gräns på antalet haverier, det är tiden som är begränsad till en vecka (se fotnot **). På en vecka körs processen: n = 0(sek)*0(min)*(tim)*7(dagar) = 0 00 gånger 1 Varje gång processen körs är sannolikheten för haveri π = = 0,00001 0000 Det genomsnittliga antalet haverier per vecka är alltså: μ = n π = 000 * 0,00001 =,0 X följer en Poissonfördelning, X ~ Po( μ =, 0 ) **Här kan man se på svaret som en approximation till slumpvariabel X som är Binomialfördelad (eftersom π är liten och n stor), X räknar antalet haverier under en vecka, dvs. X är begränsad till antal gånger processen körs, 1 n= 000, där sannolikheten för haverie är π = = 0,00001. 0000
c) Man gör ett försök och trycker fyra gånger på avtryckaren av en revolver, n=. Det finns totalt plats för skott i revolvern, N=, av dessa har laddats med ett skott (den önskad egenskap), S=. Andelen med skott är S π = = = 0, N X betecknar antal skott när man trycker gånger på avtryckaren. I varje delförsök, tryckning av avtryckaren, resulterar med en skott eller ingenting. Delförsökerna är beroende av varandra, dvs. det finns ingen återläggning av skott. X följer en hypergeometrisk fördelning, X ~ Hyp(N=, n=, S=) d) X betecknar antalet personer som kommer till ett bibliotek under en vecka (7 dagar), dvs. det finns ingen övre gräns på antalet besökare, det är tiden som är begränsad till en vecka. Det genomsnittliga antalet besökare per dag är μ perdag = 0, genomsnittliga antalet besökare per vecka är alltså: μ pervecka = 7 dagar μ perdag = 7 0 = X följer en Poissonfördelning, X ~ Po( μ = ) e) Man gör ett försök och går upp på en tenta med 0 frågor, n=0. I varje delförsök, när man svarar på en fråga, får man antligen rätt eller fel. Sannolikheten att välja ut rätt svar på ett slumpmässigt sätt är antalrätt 1 π = = = 0,17, och är densamma vid varje fråga. antalalternativ Sannolikheten att svara rätt på en fråga är oberoende av tidiagre gissningar, dvs. delförsöken är oberoende av varandra. X betecknar antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. 1 X följer en Binomialfördelning, X ~ Bin(n=0, π = = 0, 17 )