Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Relevanta dokument
Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Tentamen TMS145 Grundkurs i matematisk statistik och bioinformatik, 7,5 hp, kl

(a) Beräkna sannolikhetsfunktionen p X (x). (2p) (b) Beräkna väntevärdet för X. (1p) (c) Beräkna standardavvikelsen för X. (1p)

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

1. a Vad menas med medianen för en kontinuerligt fördelad stokastisk variabel?

Tentamen i Matematisk statistik Kurskod S0001M

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TENTAMEN I MATEMATISK STATISTIK

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 12: Linjär regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

FACIT: Tentamen L9MA30, LGMA30

Tentamen i Matematisk statistik Kurskod S0001M

0 om x < 0, F X (x) = c x. 1 om x 2.

Uppgift 1. f(x) = 2x om 0 x 1

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

7.5 Experiment with a single factor having more than two levels

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen MVE301 Sannolikhet, statistik och risk

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Föreläsning 12: Regression

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

10.1 Enkel linjär regression

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen MVE302 Sannolikhet och statistik

SF1901: Medelfel, felfortplantning

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Tentamen i Matematisk statistik Kurskod S0001M

FACIT: Tentamen L9MA30, LGMA30

Laboration 3: Enkel linjär regression och korrelationsanalys

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

FÖRELÄSNING 8:

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Lycka till!

Multipel Regressionsmodellen

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Tentamen i Matematisk statistik Kurskod S0001M

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i Matematisk statistik Kurskod S0001M

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Uppgift a b c d e Vet inte Poäng

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

TMS136: Dataanalys och statistik Tentamen

Tentamen MVE300 Sannolikhet, statistik och risk

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Statistik för teknologer, 5 poäng Skrivtid:

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i matematisk statistik

Tentamentsskrivning: Matematisk statistik TMA Tentamentsskrivning i Matematisk statistik TMA321, 4.5 hp.

Lufttorkat trä Ugnstorkat trä

Tentamen i matematisk statistik

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Föreläsning 12: Repetition

Statistisk försöksplanering

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen MVE302 Sannolikhet och statistik

, för 0 < x < θ; Uppgift 2

Matematisk statistik TMS063 Tentamen

Avd. Matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen i Matematisk statistik Kurskod S0001M

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Statistisk försöksplanering

f(x) = 2 x2, 1 < x < 2.

Tentamen MVE300 Sannolikhet, statistik och risk

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp 23 maj 2013 kl. 9 14

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Transkript:

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik, 7,5 hp. Tid: Lördag den 18 april 2009, kl 14:00-18:00 Väg och vatten Examinator: Olle Nerman, tel 7723565. Jour: Frank Eriksson, tel 073-7263051. Hjälpmedel: Egen handskriven formelsamling (fyra A4-sidor) samt med skrivningen utdelade tabellsidor. Maxpoäng: 32. För godkänt krävs minst 15 poäng totalt och minst 4 poäng på sannolikhetsteori- och statistik-delen vardera samt minst 3 poäng på bioinformatikdelen. För betyget 4 krävs 20 poäng och för betyget 5 25 poäng. Sannolikhetsteori 1. Vad är sannolikheten för två oberoende händelser A och B med sannolikheterna P (A) = 0, 2 resp P (B) = 0, 9 att a de inträffar båda två? b inte någon inträffar? c inte någon av dem inträffar någon enda gång vid 3 oberoende upprepningar av försöket? 2. Avrundingsfelen vid en viss typ av vägningar kan antas vara likformigt fördelade i intervallet -0,005 och 0,005. Om verkliga vikterna varierar mycket mellan 100 olika enheter som vägs, så kan de 100 mätfelen dessutom betraktas som oberoende. a Vilket väntevärde har mätfelet för en enskild enhet? b Vilken varians har mätfelet för en enskild enhet? c Bestäm approximativt sannolikheten att absolutbeloppet av summan av mätfelen för de hundra enheterna är < 0, 02 1

3. Antag att du har en kontinuerligt fördelad stokastisk variabel X med frekvensfunktionen f(x) = (2x + 2)C på intervallet [ 1, 1] Statistik a Bestäm konstanten C. b Bestäm frekvensfunktionen för 10X c Bestäm fördelningsfunktionen för 10X 4. Låt x 1,..., x n vara ett stickprov från oberoende Gamma(k, θ)-fördelade variabler. X Gamma(k, θ) innebär att X har frekvensfunktion f X (s) = k 1 e x/θ x, x > 0, k > 0, θ > 0 samt E[X] = kθ. θ k Γ(k) a Härled maximum likelihoodskattaren för θ. b Är detta en väntevärdesriktig (unbiased) skattare? 5. En forskare hävdar att åtminstone 10% av alla hockeyhjälmar har ett visst tillverkningsfel som skulle kunna ge upphov till skador hos bäraren. Då man kontrollerar 400 hjälmar upptäcker man att 32 av dessa har det påtalade felet. a Ta reda på, med hjälp av ett lämpligt hypotestest på signifikansnivå 0, 01, om detta stödjer forskarens påstående. b Finn testets p-värde. c Vilken bredd skulle ett 99%-igt konfidensintervall baserat på informationen ovan ha? 2

6. För att undersöka hur temperaturen förändras ju längre norrut i Sverige som man kommer, så mättes årsmedeltemperaturen år 2004 i 11 svenska orter. De återges i följande tabell tillsammans med orternas latituder. Ort Latitud Medeltemperatur Jokkmokk 66,6-0,6 Umeå 63,5 4,0 Östersund 63,1 4,2 Gävle 60,4 5,8 Karlstad 59,2 7,0 Stockholm 59,3 7,6 Göteborg 57,8 7,7 Jönköping 57,4 6,0 Visby 57,6 7,6 Kalmar 56,7 7,5 Lund 55,7 8,5 Sambandet mellan årsmedeltemperatur och latitud kan sammanfattas med en regressionsmodell lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -1.6397-0.5078 0.3306 0.6731 1.3348 Coefficients: Estimate Std. Error (Intercept) 49.16360 5.72184 x -0.72341 0.09562 Residual standard error: 1.015 on 9 degrees of freedom --- Analysis of Variance Table Response: y Df Sum Sq Mean Sq x 1 59.025 59.025 Residuals 9 9.281 1.031 3

a Ange uttrycket (som en ekvation) för den linjära regressionsmodellen i exemplet ovan. Ange skattningarna av samtliga parametrar. Bioinformatik b Testa på signifikansnivå α = 0.01 hurivida årsmedeltemperaturen 2004 sjönk ju längre norrut man kom. c I en regressionsanalys arbetar man ofta med kvadratsummor. Beskriv de intressanta kvadratsummor som man tittar på och vilken information man kan få från dessa. 7. Sekvensbioinformatik a Assuming a match score of 2, a mismatch score of -1 and a gap score of -2, derive the score matrix for a global alignment of GTTA and GTCCA. In this case, what is the score of an optimal global alignment? How many alignments have this optimal score (remember: each path represents a different alignment)? What are these alignments? b The BLOSUM62 is shown below. Comment on the score between W and Y, and the score between L and D. c Calculate the score of the following multiple alignment using the BLO- SUM62 matrix and the sum of pairs method: Sequence 1: Sequence 2: Sequence 3: GAHV GATA GSSV 4

BLOSUM62 Matrix: A R N D C Q E G H I L K M F P S T W Y V A 4 R -1 5 N -2 0 6 D -2-2 1 6 C 0-3 -3-3 9 Q -1 1 0 0-3 5 E -1 0 0 2-4 2 5 G 0-2 0-1 -3-2 -2 6 H -2 0 1-1 -3 0 0-2 8 I -1-3 -3-3 -1-3 -3-4 -3 4 L -1-2 -3-4 -1-2 -3-4 -3 2 4 K -1 2 0-1 -3 1 1-2 -1-3 -2 5 M -1-1 -2-3 -1 0-2 -3-2 1 2-1 5 F -2-3 -3-3 -2-3 -3-3 -1 0 0-3 0 6 P -1-2 -2-1 -3-1 -1-2 -2-3 -3-1 -2-4 7 S 1-1 1 0-1 0 0 0-1 -2-2 0-1 -2-1 4 T 0-1 0-1 -1-1 -1-2 -2-1 -1-1 -1-2 -1 1 5 W -3-3 -4-4 -2-2 -3-2 -2-3 -2-3 -1 1-4 -3-2 11 Y -2-2 -2-3 -2-1 -2-3 2-1 -1-2 -1 3-3 -2-2 2 7 V 0-3 -3-3 -1-2 -2-3 -3 3 1-2 1-1 -2-2 0-3 -1 4 8. Strukturbioinformatik. a i Describe how an anti-parallel beta-sheet can be identified by the DSSP program. ii Explain whether a proline residue can be present in an anti-parallel beta-sheet. (3p) b Describe one of the planarity checks performed by PROCHECK. State which atoms are involved in this check. 5