UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för tekniska fysiker, MSTA6, 4p Peter Anton Per Arnqvist LÖSNINGSFÖRSLAG TILL TENTAMEN 7-- LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK Statistik för tekniska fysiker, 4 poäng. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f ( ) k f.ö. a) Bestäm konstanten k så att f() blir en täthetsfunktion. Utnyttja att arean under en täthetsfunktion är : 8 f ( ) d k d k k 8 k Svar: k = /8 b) Vad blir väntevärdet och variansen för X? X ) X V ( X ) Svar: ) f ( ) d X f ( ) d ) 8 8 ( X )) E ( X ), V ( X ) d 4 d 4 8 4 8 48 4 c) Bestäm sannolikheten att slumpvariabeln X antar ett värde som är mindre än, dvs. bestäm P(X < ).
P ( X ) Svar: P(X<)=/8 f ( ) d d 8 8 8. Man är intresserad av hur alkohol påverkar reaktionsförmågan. Därför mäter man åtta personers reaktionsförmåga (enhet: sekund) före och efter alkoholförtäring. Resultatet blev: Person 4 6 7 8 Före.4.67..6.79.4.9.9 Efter.9..84.7.74.8.9.4 Gör ett 9 % konfidensintervall för den genomsnittliga skillnaden i reaktionstid före och efter alkoholintag. Lämpliga antaganden om oberoende och normalfördelning får göras. Går det med hjälp av intervallet att visa att någon skillnad? Motivera! Antag att differenserna är oberoende observationer från en normalfördelning. Därefter kan konfidensintervall/test göras med t-fördelning (eftersom variansen skattas och det är få observationer): Paired T-Test and CI: Efter; Före Paired T for Efter - Före N Mean StDev SE Mean Efter 8,8,87,76 Före 8,,8,8678 Difference 8,9,987,7776 9% CI for mean difference: (,684;,4786) T-Test of mean difference = (vs not = ): T-Value =,7 P- Value =,7 s Svar: Intervallet blir (,684;,4786) och det har beräknats enligt t ( / n ). n Eftersom nollan inte finns med och förändringen är positiv kan vi dra slutsatsen att alkohol påverkar reaktionsförmågan positivt, dvs. vi får i genomsnitt en längre reaktionstid efter intag av alkohol.. I ett storstadsområde påstås det att bland de småföretag som finns är / kvinnliga småföretagare. En grupp elever skall göra ett eamensarbete för att bl.a. ta reda på hur de kvinnliga företagsledarna upplever sin situation. De ringer därför upp 6 slumpmässigt utvalda företagsledare i området. Man observerar att av dessa 6 uppringda är kvinnor. Bestäm sannolikheten att observera eller fler kvinnliga företagsledare om det finns / kvinnliga företagsledare i populationen. Kan man med hjälp av detta resultat hävda att det är högre proportion än / kvinnliga företagsledare i storstadsområdet? Testa detta påstående och redogör för de antaganden som du gör.
Låt X = antal kvinnliga småföretagare bland 6 slumpmässigt utvalda. X ~ bin(6,.). Eftersom 6(.) = > och 6(.8) = >, är det ok med normalapproimation, dvs X ~ N(,.4) (approimativt). P(X ) = P(X ) Φ((-+.)/.) = Φ(.64) =.998 =.4. (.7 eller. utan halvkorrektion). Vi har räknat ut p-värdet för testet H : p = / mot H : p > /. Eftersom p-värdet är mindre än % förkastas hypotesen på den nivån (men ej på.%-nivån). Proportionen kvinnor bland företagsledarna är signifikant större än /. 4. Vid kvicksilverundersökning av gäddor i en insjö har man bestämt kvicksilverhalten i fångade gäddor. Resultat:.8.6.9.8..4.7... Antag att kvicksilverhalten i gäddorna är normalfördelad och att gäddorna har blivit slumpmässigt utvalda. a) Gör ett 9%-igt konfidensintervall för medelkvicksilverhalten,, bland gäddorna i insjön. Variable N Mean StDev SE Mean 9% CI Kvicksilver,97,,44 (,78;,6) b) Kan man på signifikansnivån % förkasta H : =. mot H :.? Eftersom det 9%-iga konfidensintervallet täcker över. kan vi inte förkasta H c) Anta nu att den sanna variansen i populationen är.. Om man vill att styrkan för kvicksilverhalten. (mg/kg) ska vara.99 och signifikansnivån ska vara., hur många observationer behövs? Enligt formelsamlingen: n = (.96 +.6) (.)/(.) = 8.7. Vi måste alltså ta minst 84 observationer.. På färjor är det viktigt att lasten inte blir för stor. På en viss färjelinje antar man att vikten hos personbilar inklusive last och passagerare är i genomsnitt, ton med standardavvikelsen, ton. Lastbilarnas vikter antas vara i medeltal ton med standardavvikelse ton. På en viss resa har personbilar och lastbilar bokat plats. Bestäm sannolikheten att den sammanlagda vikten för dessa överstiger 4 ton. Motivera användandet av eventuella approimationer. Låt X i = personbil nr i:s vikt och Y j = lastbil nr i:s vikt. Låt vidare och. Enligt CGS gäller då approimativt att V ~ N(., (.) ) och W ~ N(, ). Detta implicerar att även V +W ~ N(6 +,. + 88) (approimativt). Således får vi P(V +W > 4) = Φ((4-8)/7.) = - Φ(,87) =.9.
6. Vid en mindre fabrik tillverkas rektangulära spånplattor som skall ha sidorna 8 cm och 4 cm. Emellertid blir inte alla plattor eakt lika stora på grund av mätfel av sidorna. Betrakta längden och bredden (i cm) av sidorna som oberoende slumpvariabler, X och Y med X) = 8 och Y) = 4. Ur insamlat data uppskattas varianserna till V(X) =,64 och V(Y) =,6. Bestäm approimativt väntevärde och standardavvikelse för arean hos en på måfå vald spånplatta. Låt W = XY, en spånplattas area. Enligt Gauss approimationsformler (approimation efter Taylorutveckling) gäller: Vi får således standardavvikelsen för arean 7,7 7. Man är intresserad av att finna sambandet dels mellan nedfall av SO 4 och ph-halt och dels mellan NO och ph-halt i svenska städer. Man har tagit prover av SO 4 och NO (mg/l) samt av ph-halt (medelvärde av nivåerna i ett antal stilla stående vattendrag) i 4 svenska städer under 6. Man anpassades ph som en linjär funktion av mängd NO och som en linjär funktion av SO 4. Följande utskrifter erhölls. The regression equation is Ph = 6.9 -.77 NO Predictor Coef StDev T P Constant 6.989.9 48.6. NO -.879.887 -.6. S =.984 R-Sq = 66.4% R-Sq(adj) = 6.7% The regression equation is Ph = 6.96 -.6 SO4 Predictor Coef StDev T P Constant 6.966.987 4.46. SO4 -.666.46 -.. S =.6766 R-Sq = 8.% R-Sq(adj) = 8.% a) Prediktera hur stort Ph-värdet blir, först om mängden SO 4 =.7 och sedan när mängden NO =.7. b) Om du endast fick använda en av de förklarande variablerna för att prediktera ph så bra som möjligt, vilken skulle du välja med hänsyn tagen till den information du har från utskrifterna? Motivera ditt val.
Jag skulle välja SO 4, eftersom den har högre R och lägre s. c) Anta att du hade tillgång till de mätvärden som analysen ovan baserar sig på. Hur skulle du använda dem för att få bättre underlag till valet i b)? Motivera. Jag skulle göra residualanalys för att kontrollera modellernas tillämpbarhet, dvs histogram och normalfördelningsplot av residualerna för kontroll av om slumpfelen kan anses normalfördelade samt plot av residualerna mot (SO 4 respektive NO ) eller mot de anpassade värdena, för att upptäcka avvikelser från linjaritet eller inhomogen varians. 8. e-postbrev ankommer till Hilmas e-postadress enligt en Poisson-process med intensiteten brev per timme. Hilma sätter sig vid datorn kl.. a) Vad är sannolikheten att hon inte får något brev under den tid hon sitter vid datorn om hon sitter där till kl. 4.? Låt X = antal inkomna brev mellan. och 4.. X ~ Po(4). P(X = ) = =.8. b) Vad är sannolikheten att hon redan. har fått minst brev? Låt Y = antal inkomna brev mellan. och.. Y ~ Po(). P(Y > 4) = P(Y 4) =.996 =.4 (enligt tabellsamling). c) Vad är sannolikheten att tiden mellan det :a och :e brevets ankomst är mindre än minuter? Låt W = Tiden mellan :a och :e ankomst. W ~ Ep(.). P(W /) = = - = -. =.487.