Tentamenskrvnng: TMS45 - Grundkurs matematsk statstk och bonformatk, 7,5 hp. Td: Onsdag den 9 august 2009, kl 08:30-2:30 Väg och vatten Tesen korrgerad enlgt anvsngar under tentamenstllfället. Examnator: Olle Nerman, tel 7723565. Jour: Frank Erksson, tel 073-726305. Hjälpmedel: Egen handskrven formelsamlng (fyra A4-sdor) samt med skrvnngen utdelade tabellsdor. Maxpoäng: 32. För godkänt krävs mnst 5 poäng totalt och mnst 4 poäng på sannolkhetsteor- och statstk-delen vardera samt mnst 3 poäng på bonformatkdelen. För betyget 4 krävs 20 poäng och för betyget 5 25 poäng. Sannolkhetsteor. a Vad menas med medanen för en kontnuerlgt fördelad stokastsk varabel? b Vad är medanen för en exponentalfördelad stokastsk varabel med väntevärde 3? 2. a Beräkna sannolkheten vd kast av 3 vanlga tärnngar (med poängsdorna,2,3,4,5 eller 6) för händelsen A = summan av kasten blr exakt 5? b Vad är den betngade sannolkheten vd kast av 3 vanlga tärnngar för händelsen B= mnst en tärnng vsar poängen 3 gvet händelsen A= summan av kasten är exakt 5? Lednng: Räkna möjlga och gynnsamma fall
3. Ett vsst flygplan kan på grund av säkerhetsskäl, när det är fullsatt, ha en obalans mellan stolsraderna på vänster och högersdan som är maxmalt 250KG. På varje sda fnns 50 platser. En typsk passagerare har en vkt som har väntevärdet 80 Kg och standardavvkelsen 0 Kg. Antag oberoende mellan resenärernas vkt på resp. plats och att planet är fullsatt. Statstk a Vlket väntevärde har totala vktskllnaden (med tecken) mellan passagerarna tll höger och vänster ett fullsatt plan? b Vlken varans har totala vktskllnaden mellan passagerarna tll höger och vänster ett fullsatt plan? c Vad är approxmatvt sannolkheten för att obalansen överskrder gränsen 250 kg. 4. a Tag fram Maxmum Lkelhood-skattaren för θ ur ett stckprov från en Raylegh-fördelnng, dvs. en fördelnng med täthetsfunkton f(x) = θxe θx2 /2, x 0. b Ange två önskvärda egenskaper hos en punktskattare. 5. a Vlken är fördelen med att använda ntervallskattnng stället för punktskattnng? b Ge defntonen av p-värde. c Anatg att du har ett stckprov av storlek n från en normalfördelnng med väntevärde µ och varans σ 2 = 4. Du vll testa H 0 = µ = 0 mot H : µ < 0 på sgnfkansnvå 0.0. Du använder den vanlga teststatstkan, d.v.s. (X µ)/(σ/ n). Antag att det sanna väntevärdet är 9. Hur stor bör stckprovsstorleken n vara för att teststyrkan (power) blr mnst 90%? 2
6. Vkt X (pounds) och systolskt blodtryck Y (blodtryck vd hjärtats sammandragnng) hos 26 slumpmässgt utvalda (och oberoende) män åldrarna 25-30 vsas tabellen nedan. Patentnr Vkt Blodtryck Patentnr Vkt Blodtryck 65 30 4 72 53 2 67 33 5 59 28 3 80 50 6 68 32 4 55 28 7 74 49 5 22 5 8 83 58 6 75 46 9 25 50 7 90 50 20 95 63 8 20 40 2 80 56 9 200 48 22 43 24 0 49 25 23 240 70 58 33 24 235 65 2 69 35 25 92 60 3 70 50 26 87 59 Antag nu att vkt och blodtryck är bvarat normalfördelade. Från värdena ovan får v att x 2 = 880545 (x x) 2 532 x = 4743 y 2 = 555802 (y y) 2 4502 y = 3786 x y = 697076 (x x)(y y) 6422 3
En (något beskuren) utskrft från programmet R med datamänden ovan ger lm(formula = y ~ x) Coeffcents: Estmate Std. Error t value (Intercept) 69.0437 2.903 5.353 x 0.4942 0.0705 5.979 Resdual standard error: 8.68 on 24 degrees of freedom Multple R-squared: 0.5983, Adjusted R-squared: 0.585 F-statstc: 35.74 on and 24 DF, p-value: 3.59e-06 --- Analyss of Varance Table Response: y Df Sum Sq Mean Sq x 2693.58 2693.58 Resduals 24 808.57 75.36 a Ange uttrycket för en lnjär regressonsmodell med blodtryck som svarsvarabel baserad på nformatonen ovan (där alla koeffcenter samt regressonslnjens slutlga form anges). b Tolka koeffcenterna (uttryckt termer relaterade tll problemet). c Baserat på nformatonen ovan, fnns det ett statstskt säkerställt samband mellan vkt och blodtryck? Motvera! d Hur stor andel av varatonen männens blodtryck kan enlgt modellen förklaras av personernas varerande vkt? 4
Bonformatk 7. Sekvensbonformatk a The fgure below shows part of the score matrx for a local algnment of two sequences. T C A A 0? When usng the Smth-Waterman algorthm for parwse local algnment, explan how the score for cell (,j) of the score matrx, usually denoted F(, j), s calculated. Assumng a match score of 3, a msmatch score of -2 and a gap score of -3, explan how the value for the cell contanng a queston mark s calculated. What value wll be placed n that cell of the score matrx? (3p) b If we want to perform a local algnment of a query sequence wth the contents of a very large database of sequences, we could use the Smth- Waterman algorthm or we could use the BLAST program. Gve one advantage and one dsadvantage of usng BLAST. 8. Strukturbonformatk. a What s the purpose of the DSSP program? Descrbe how man chan hydrogen bonds are calculated by DSSP. b Descrbe the famly and superfamly levels n the Structural Classfcaton of Protens (SCOP). 5