Tentamen i Statistik, STA A och STA A13 (9 poäng) Onsdag 1 november 00, Kl 0.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare. Ansvarig lärare: Hannah Hall, telefon 00 - (0)5 700 113 Övrigt: För att få maximala poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 0 poäng, för betyget Väl Godkänd krävs minst 0 poäng. Uppgift 1 9 35 77 7 7 95 3 79 77 9 9 7 57 1 77 1 5 a) Illustrera ovanstående data i ett stam-blad diagram. b) Beräkna medianen. c) Beräkna kvartilavståndet. d) Illustrera materialet i ett boxplot (lådagram). e) Utifrån dina diagram, blir medelvärdet större eller mindre än medianen? (a-e poäng vardera) Uppgift En gång om dagen på ett visst kärnkraftverk genomförs ett byte av en radioaktiv detalj, varvid en nödsituation kan uppstå. Att en nödsituation uppstår är dock mycket ovanligt, sannolikheten för det är endast 0,00. Man använder för säkerhets skull ändå ett larmsystem för att övervaka bytet. Om en nödsituation råder så går larmet med sannolikheten 0,9. Om en nödsituation inte råder så går larmet med sannolikheten 0,0. Vad är sannolikheten för att det faktiskt råder en nödsituation när larmet går? Kommentera. ( poäng)
Uppgift 3 Fyra variabler X1, X, X3 och X presenterades i följande histogram: 1 Frequency Frequency 0 0 X1 X Frequency Frequency 0 0 X3 X Samma variabler presenterades också i en boxplot diagram (lådagram), men etiketten om variabelns namn fattas. Para ihop boxplot diagrammen A, B, C och D med respektive variabel. ( poäng) 0 A B C D
Följande boxplot diagram visar fördelningen av en viss variabel delat på fem olika grupper. Jämför och kommentera på fördelningarna av de fem olika grupper (1-5). ( poäng) Uppgift Till varje del uppgift (a-e) ange och motivera fördelningen för X i följande exempel. Glöm inte att ange värdet på parametrarna. a) Hannah tar 5 lotter i ett lotteri. Lotteriet har totalt 0 lotter varav stycken är vinstlotter. Låt X beteckna antal vinstlotter som Hannah erhåller. b) En viss process i en dator som körs en gång per sekund dygnet runt åstadkommer att datorn havererar med sannolikheten 1 på en miljon. Låt X beteckna antalet haverier per månad (30 dagar). c) En revolver med plats för skott har laddats med åtta tomhylsor och två skarpa skott, slumpmässigt placerade. Man vill beräkna hur sannolikt det är att ett skott går av när man trycker fyra gånger på avtryckaren (X betecknar antal skott). d) Sannolikheten att ett flygplan av en viss typ kraschar under en flygning är 0,0001. Under ett år görs 7 000 flygningar med den aktuella flygplanstypen. Låt X beteckna antal flygplaner som kraschar ett visst år. e) Kristoffer går upp på en tentamen utan att han har pluggat innan! Han har tur, varje fråga består av sex kryssalternativ, varav ett är rätt. Totalt är det 0 frågor. Låt X beteckna antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. (a-e poäng vardera)
Uppgift 5 SCB har fått ett uppdrag att skatta medelåldern och proportionen med en viss egenskap i en mycket stor population. För att kunna genomföra detta så tog man ett slumpmässigt stickprov som består av 00 personer. Medelåldern för dessa beräknades till 50 år och standardavvikelsen till 5 år. Man noterade också att bland personerna i stickprovet var 0 över 55 år. Tänk att du är anställd hos SCB och du har fått följande uppgifter angående detta uppdrag: a) Skatta medelåldern i populationen med ett 95% konfidensintervall. b) Skatta andelen personer över 55 år i populationen med ett 95% konfidensintervall. Uppgift ( poäng) Antag att livslängden för glödlampor producerade av ett visst företag är en normalfördelad slump variabel med väntevärdet µ och standardavvikelsen σ = 00 timmar. Vi vill pröva nollhypotesen µ = 00 mot hypotesen µ > 00 med hjälp av ett stickprov som består av 0 individer och signifikansnivån 5%. a) Genomför hypotestestning om stickprovets medelvärdet x = 10. b) Förklara innebörden av begreppen typ I fel och typ II fel i anslutning till detta exempel. Uppgift 7 För två variabler X och Y har vi följande datamaterial: Y X 3 9 5 1 5 1 19 a) Skissa observationerna på X och Y i en graf. ( poäng)
b) Beräkna med hjälp av minsta kvadrat metoden (least square method) interceptet a och regressionskoefficienten b. c) Använd dina beräkningar i (b) för att beräkna residualspridningen (standard error of estimate). d) Beräkna determinationskoefficienten r, och tolka den. Uppgift ( poäng) En doktorand från statsvetenskap vill komplettera sin avhandling med en empirisk studie. För att denna studie skall genomföras tar han ett stickprov som består av n personer som skall intervjuas. Anta att sannolikheten att en slumpmässigt vald person befinner sig hemma vid första kontakttillfället är 0.. a) Vad är sannolikheten att högst 1 personer befinner sig hemma vid första kontakttillfället om n = 0. b) Vad är sannolikheten att högst 1 personer befinner sig hemma vid första kontakttillfället om n = 0. ( poäng)
Lösning Uppgift 1 a) Stam-blad diagram. Frequency Stem & Leaf 1 Extremes (=<35) 1. 5. 7. 9 7 7. 7779. 113 3 9. 5 b) Medianen: Q c) Kvartilavståndet: Q d) Boxplot (lådagram) Placering i ordnat + 1 data: L 5 = =, 5 Placering i ordnat + 1 data: L 50 = = 1, 5 Placering i ordnat 3( + 1) data: L 75 = = 1, 75 Kvartilavståndet Q = Q3-Q1 Extremobservationer ligger under: Q1 1,5Q Eller över: Q3 + 1,5Q Q1 ligger mellan obs och7 Q 1 = + 0,5( ) =,5 Q ligger mellan obs 1 och 13 77 + 77 Q = = 77 Q3 ligger mellan obs 1 och 19 Q3 = 3 + 0,75( 3) = 3,75 Q = 3,75 -,5 = 19,5,5 1,5(19,5) = 35,5 3,75 + 1,5(19,5) = 11,5 Det finns en extrem observation med värde 35. Minsta värdet 35 (om man bortser från extrema observationer är det ) Max värdet 9
0.00 90.00 0.00 70.00 0.00 50.00 0.00 5 30.00 VAR00007 e) Utifrån diagrammen (stam-blad och boxplot) ser man att fördelningen är negativ skev, då är medelvärdet mindre än medianen. Uppgift Från uppgiften får vi följande information: A = nödsituation råder)= 0,00 ~A) = 1 - A) = 1-0,00 = 0,99 B = Larmet går I A = nödsituation) = 0,9 B = Larmet går I ~A = nödsituation inte råder) = 0,0 Vi söker: Sannolikheten för att det faktiskt råder en nödsituation när larmet går, dvs. A = nödsitation råder I B = Larmet går) Från sannolikhetsteori vet vi: P ( A B) = Då måste vi beräkna AB) och B). AB) B) Från sannolikhetsteori vet vi: P ( B A) = AB) A) Då kan vi ta fram AB): P ( AB) = A) B A) = 0,00(0,9) = 0, 0019 Från sannolikhetsteori vet vi: P ( B) = BA) + B ~ A)
Vi vet att AB) = BA). Men vi måste tar fram B~A): B ~ A) Vi vet att: P ( B ~ A) =, ~ A) då är: P ( B ~ A) = ~ A) B ~ A) = 0,99(0,0) = 0, 079 P ( B) = BA) + B ~ A) = 0,0019 + 0,079 = 0,01 AB) 0,0019 Svaret är: P ( A B) = = = 0, 0391 B) 0,01 Dvs. % chans att det faktiskt råder en nödsituation när larmet går! Uppgift 3 Utgår ifrån fördelningen i histogramet och jämför detta med boxploterna, tänk på spridning, gruppering, medianen, skevhet mm. X1 = C X = D X3 = A X = B Kommentera på de enskillda grupper (tex. spridning, skevhet och central tendensen) och jämför alla fem grupper (tex. störst/ minst spridning, lika/olika skevhet, central tendensen, spridning).
Uppgift a) Man gör ett försök och väljer slumpmässigt 5 lotter, n=5. Det finns totalt 0 lottar i lotteriet, N=0, av dessa är vinstlotter (dvs. har S den önskad egenskap), S=. Andelen vinstlotter är π = = = 0, N 0 X betecknar antal vinstlotter Hannah erhåller. X är en diskretslumpvariabel. I varje delförsök en lott ger vinst eller ej. Delförsökerna är beroende av varandra, dvs. lotterna väljs utan återläggning. X följer en hypergeometrisk fördelning, X ~ Hyp(N=0,n=5, S=) b) X betecknar antalet haverier per månad (30 dagar), dvs. här kan man anta att det finns ingen övre gräns på antalet haverier, det är tiden som är begränsad till en månad (se fotnot **). X är en diskretslumpvariabel. På en månad körs processen: n = 0(sek)*0(min)*(tim)*30(dagar) = 59 000 gånger Varje gång processen körs är sannolikheten för haveri 1 π = = 0,000001 00000 Det genomsnittliga antalet haverier per vecka är alltså: μ = n π = 59000 * 0,000001 =,59 X följer en Poissonfördelning, X ~ Po( μ =, 59 ) **Här kan man se på svaret som en approximation till slumpvariabel X som är Binomialfördelad (eftersom π är liten och n stor), X räknar antalet haverier under en månad, dvs. X är begränsad till antal gånger processen körs, 1 n= 9 000, där sannolikheten för haverie är π = = 0,000001. 00000
c) Man gör ett försök och trycker fyra gånger på avtryckaren av en revolver, n=. Det finns totalt plats för skott i revolvern, N=, av dessa har laddats med ett skott (den önskad egenskap), S=. Andelen med skott är S π = = = 0, N X betecknar antal skott när man trycker gånger på avtryckaren. X är en diskretslumpvariabel. I varje delförsök, tryckning av avtryckaren, resulterar med en skott eller ingenting. Delförsökerna är beroende av varandra, dvs. det finns ingen återläggning av skott. X följer en hypergeometrisk fördelning, X ~ Hyp(N=, n=, S=) d) X betecknar antalet flygplaner som kraschar ett visst år, dvs. det finns ingen övre gräns på antalet krashcar, det är tiden som är begränsad till ett år. (Se fotnot**). X är en diskretslumpvariabel. Sannolikheten att ett flygplan av en viss typ kraschar under en flygning är π =0,0001, under ett år görs n=7000 flygningar. Det genomsnittliga antalet kraschar per år är: μ perår = antalflygningar sannolikhetenförkrash = 7000 0,0001 = 0,7 X följer en Poissonfördelning, X ~ Po( μ = 0, 7 ) **Här kan man se på svaret som en approximation till slumpvariabel X som är Binomialfördelad (eftersom π är liten och n stor), X räknar antalet krashar, som kan vara max antal flygningar som är n = 7 000 under ett år, där sannolikheten för krash är π = 0, 0001. e) Man gör ett försök och går upp på en tenta med 0 frågor, n=0. I varje delförsök, när man svarar på en fråga, får man antligen rätt eller fel. Sannolikheten att välja ut rätt svar på ett slumpmässigt sätt är antalrätt 1 π = = = 0,17, och är densamma vid varje fråga. antalalternativ Sannolikheten att svara rätt på en fråga är oberoende av tidiagre gissningar, dvs. delförsöken är oberoende av varandra. X betecknar antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. X är en diskretslumpvariabel. 1 X följer en Binomialfördelning, X ~ Bin(n=0, π = = 0, 17 )
Uppgift 5 a) n = 00, x = 50 och s=5. 50 ± 1,9.(5/0) 50 ±.5 (7,55, 5,5) b) p=0/00=0,55 0,55±1,9. 0,55.0,5/ 00 0,55±0,0 (0,50, 0,59) Uppgift a) H 0 :µ=00 H 1 :µ>00 Z=10-00/(00/)=5 Z från tabellen = 1, 5 >1, vi förkastar H 0. b) se boken. Uppgift 7 a) Y=a+b.X b=1,71 a=1,5 b) residuals: 0.9375-0.73150-1.1500 1.37500-1.715 0.905 0.59375 S Y.X =1,3. c) R =0,93.
Uppgift a) X: antal personer som befinner sig hemma vid första kontakttillfället. n=0, p=0, X är Bin(0, 0,) n*p 5 n*(1-p) 5 X är appox. N(0, ) X 1)=(X-µ)/σ (1-0)/) = Z -15,5) = 0 b) X: antal personer som befinner sig hemma vid första kontakttillfället. n=0, p=0,. X är Bin(0, 0,) X 1)=0,930 (från tabellen).