LUNDS UNIVERSITET STATISTISK TEORI STATISTISKA INSTITUTIONEN STAB0 Jakob Bergman 008-0-08 Tentamen i statistisk teori lördagen den januari 008. Tillåtna hjälpmedel: Körner: Tabeller och formler för statistiska beräkningar, Formelsamling i statistisk teori (delas ut), miniräknare. Uppgifter. Det svenska statliga lotteriet (Svenska Spels Lotto ) består av 35 nummer av vilka man drar sju stycken. (Dessutom drar man två tilläggstal, men det bortser vi från i denna uppgift.) a) Hur många olika lottorader med sju nummer är möjliga? [p] b) Hur många rader med sju nummer finns det som ger fem rätt? [p] c) Vad är sannolikheten för fem respektive sju rätt? [p]. Låt X och Y vara två slumpvariabler. Följande är känt: mx = 0 s X = 4 m Y = s Y = r X,Y = 0.6 Låt nu U = X 5Y och W = X + Y. Bestäm utifrån detta a) E(U ) [p] b) E(W ) [p] c) V (U ) [p] d) V (W ) [p] e) ru,w [4p] 3. Låt de oberoende slumpvariablerna X i (i =, ) vara likformigt fördelad på intervallet (, ) och låt Y i = X i. Låt vidare Z = max(y, Y ). a) Visa att Y i har följande fördelningsfunktion. y > F Yi (y) = y y 0 y < [5p] b) Bestäm P(Y i > 3 4 ). [p] c) Bestäm täthetsfunktionen för Y i. [5p] d) Bestäm E(Y i ). [4p]
e) Bestäm V (Y i ). [5p] f) Bestäm medianen för Y i. [4p] g) Visa att Z har följande täthetsfunktion. { ( ) f Z (z) = z z z [5p] h) Bestäm P( 3 4 < Z < 7 8 ). [p] 4. Hemma hos Lisa brinner hela tiden ett stearinljus. När stearinljuset slocknar tänder Lisa ett nytt. Ljusens respektive brinntid kan antas vara exponentialfördelade och oberoende. Lisa vill uppskatta hur många stearinljus som måste tändas per vecka i genomsnitt, l, och räknar därför hur många ljus, X i, som tänds varje vecka under n veckor. a) Vilken fördelning är lämplig att anta för X i? Motivera. [p] b) Visa att ML-skattningen av l är ˆl = x. [4p] Stina, som är latare än Lisa, tycker att räcker att räkna antal ljus under en vecka, och skattar l med l = x, dvs. antalet tända ljus under den första veckan. c) Visa att både ˆl och l är väntevärdesriktiga och avgör vilken skattning som är effektivast. [5p] 5. Fortsättning på fråga 4. Lisa tror att det i snitt måste tändas minst 36 ljus per vecka. a) Härled ett approximativt 95 % konfidensintervall för l baserat på ˆl. [7p] b) Härled ett test på nivån 5 % av hypoteserna H 0 : l = 36 H : l < 36 baserat på ˆl. [8p] 6. I en jämförande studie av förekomsten av vissa konnektiv (en typ av ord) i franska texter översatta till svenska och i texter på svenska i original räknades antal ändå, dock, i alla fall och emellertid i originaltexterna och i de översatta texterna. Resultatet återfinns i tabell. Testa på lämpligt sätt om det finns någon skillnad i förekomsten av antal ändå, dock, i alla fall och emellertid mellan de båda texterna. [0p] Lycka till! Skulle Lisa sova eller vara ute, så rycker hennes syster Stina in och tänder det åt henne.
ändå dock i alla fall emellertid övriga ord original 83 89 54 7 34667 översatta 6 5 6 347 TABELL : Observerat antal ord i texterna på svenska i original och i texterna översatta från franska. Källa: Mossberg, M., La relation de concession. Acta Wexionensia, No 99/006 3
Lösningar till tentamen den januari 008. a) ( ) 35 7 = 35! 7!(35 7)! = 67450 b) ( )( 7 35 7 ) ( 5 7 5 = 7 8 ) 5)( = 7! 8! 5!!!6! = 7938 c) Fem rätt: 7938/67450 = 0.0080 Sju rätt: /67450 = 0.000000487. C(X, Y ) = rx,y V (X )V (Y ) = 0.6 =. E(X ) = V (X ) + [E(X )] = 4 + 0 = 04 E(Y ) = V (Y ) + [E(Y )] = + = 5 E(XY ) = C(X, Y ) + E(X )E(Y ) =. + 0 =. a) E(U ) = E(X 5Y ) = E(X ) 5E(Y ) = 0 5 = 0 b) E(W ) = E(X + Y ) = E(X ) + E(Y ) = 0 + = c) V (U ) = V (X 5Y ) = V (X ) + 5 V (Y ) + 5C(X, Y ) = 4 + 5 5. = 7 d) V (W ) = V (X + Y ) = V (X ) + V (Y ) + C(X, Y ) = 4 4 + +. =.8 e) E(UW ) = E((X 5Y )(X + Y )) = E(X 9XY 5Y ) = E(X ) 9E(XY ) 5E(Y ) = 04 9. 5 5 = 7.8 C(U,W ) ru,w = V (U )V (W ) = = 7.8 0 7.8 = 7.8 9.50 = 0.405 3. a) X U (, ) F X (x) = x E(UW ) E(U )E(W ) V (U )V (W ) dy = [y]x = x x > x x 0 x < F Y (y) = P(Y y) = P( X y) = P(X y ) = P(X y ) = F X ( y ) = c) f Y (y) = df Y (y) dy = 0 y < y y = y > b) P(Y i > 3 4 ) = P(Y i 3 4 ) = F Y i ( 3 4 ) = ( 3/4 ) = ( 4 3 ) = + 4 3 = 3 0 y > y y 0 y < y dy = y d) E(Y ) = yf Y (y)dy = = log e log e = log e 0.693 e) E(Y ) = y f Y (y)dy = = { y y y dy = [log e y] y dy = [y] y V (Y ) = E(Y ) (E(Y )) = (log e ) 0.096 = = y > y y 0 y < f) F Y (y 0.5 ) = y 0.5 = y 0.5 = 3 y 0.5 = 3 g) F Z (z) = P(Z z) = P(Y z, Y z) = P(Y z)p(y z) = F Y (z)f Y (z) = (F Yi (z)) 4
{ f Z (z) = df Z (z) ( dz = (F Yi (z))f Yi (z) = z ) z z { ( ) = z z z h) P( 3 4 < Z < 7 8 ) = F Z( 7 8 ) F Z( 3 4 ) = ( F Yi ( 7 8 )) ( FYi ( 3 4 )) = ( 8 ( 7) 4 3) = 0.90 alternativt P( 3 4 < Z < 7 8 ) = 7/8 3/4 f Z i (z)dz = 7/8 3/4 = ( 4 8 7 + 8 7 + 4 4 3 4 9 ) = 0.90 4 dz = [ 4 z z 3 z + ] 7/8 z 3/4 4. a) X i Po(l), ty antal oberoende händelser och tiden mellan händelserna är exponentialfördelad b) L(l) = n i= f (x; l) = n i= lx i e l l(l) = log e (L(l)) = log e ( l x i! ni= x i e nl n i= x i! = log e (l) n i= x i ln log e ( n i= x i! ) dl = n i= x i dl l n i= x i ˆl n n = 0 ˆl = n i= x i n = x ni= = l x i e nl n i= x i! c) E(ˆl) = E( X ) = E(X ) = l, alltså vvr E( l) = E(X ) = l, alltså vvr V (ˆl) = V ( X ) = V (X ) n = l n V ( l) = V (X ) = l V (ˆl) = l n < l = V ( l) för n >. Om n > är ˆl effektivast, annars är de lika effektiva. 5. a) n i= X i Po(nl) N(nl, nl) ˆl = X N(l, l/n) P(a < ˆl < a ) = 0.95 P(a < X < a ) = 0.95 P(b < X l l/n < b ) = 0.95 approximativt P(.96 < X l <.96) = 0.95 l/n P( X.96 l/n < l < X +.96 l/n) = 0.95 P( X.96 l/n < l < X +.96 l/n) = 0.95 l skattas x, vilket ger konfidensintervallet x ±.96 x/n b) H 0 förkastas för små värden på ˆl a = P(ˆl < C l = 36) = 0.05 P( X < C l = 36) = 0.05 P( X l l/n < l/n C l l = 36) = 0.05 approximativt F( C 36 ) = 0.05 C 36 =.6449 36/n 36/n C = 36.6449 6 n 36 9.869 n 6. Homogenitetstest. H 0 : p i = p i för alla i H : p i p i för något i a = 5% U = 5 (O ij n jˆp i ) i= j= n jˆp i q ((5 )( )) ) 5
Kritiskt område: u > q 5% (4) = 9.488 Eftersom n = n = 35000, så får båda stickproven samma antal förväntade ord, n jˆp i där ˆp i = j= O ij j= n j ändå dock i alla fall emellertid övriga ord O i 83 89 54 7 34667 O i 6 5 6 347 n jˆp i 99.5 55.5 39.5 6.5 34689.0 u = (83 99.5) 99.5 + (89 55.5) 55.5 + + (347 34689) 34689 = 64.7588 > 9.488 H 0 förkastas. Det är statistiskt säkerställt att förekomsten av vissa konnektiv i svenska texter är olika beroende på om texten är översatt från franska eller skriven på svenska i original. 6