Tentamentsskrivning: Matematisk Statistik TMA321 1

Relevanta dokument
Tentamentsskrivning: Matematisk statistik TMA Tentamentsskrivning i Matematisk statistik TMA321, 4.5 hp.

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TMS136: Dataanalys och statistik Tentamen

Matematisk statistik TMS064/TMS063 Tentamen

Tenta i Statistisk analys, 15 december 2004

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Tentamen MVE301 Sannolikhet, statistik och risk

0 om x < 0, F X (x) = c x. 1 om x 2.

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Matematisk statistik TMS063 Tentamen

, för 0 < x < θ; Uppgift 2

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 11: Mer om jämförelser och inferens

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Lycka till!

Repetitionsföreläsning

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk Statistik, 7.5 hp

F13 Regression och problemlösning

Tentamen L9MA30, LGMA30

Matematisk statistik KTH. Formelsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 12: Linjär regression

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE301 Sannolikhet, statistik och risk

Enkel och multipel linjär regression

Matematisk statistik för D, I, Π och Fysiker

Formel- och tabellsamling i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

SF1911: Statistik för bioteknik

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen MVE302 Sannolikhet och statistik

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Avd. Matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

TENTAMEN Datum: 14 feb 2011

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 7: Punktskattningar

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Matematisk statistik för B, K, N, BME och Kemister

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Grundläggande matematisk statistik

Demonstration av laboration 2, SF1901

Avd. Matematisk statistik

Föreläsning 7: Punktskattningar

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

FACIT: Tentamen L9MA30, LGMA30

TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 10/ KL

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kurssammanfattning MVE055

SF1901 Sannolikhetsteori och statistik I

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 12: Regression

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Tentamen för kursen. Linjära statistiska modeller. 22 februari

MVE051/MSG Föreläsning 14

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Föreläsning 7: Punktskattningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Lufttorkat trä Ugnstorkat trä

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

9. Konfidensintervall vid normalfördelning

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Tentamen MVE302 Sannolikhet och statistik

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 5, Matematisk statistik Π + E

Exempel på tentamensuppgifter

Tentamen i Matematisk statistik Kurskod S0001M

F9 Konfidensintervall

Föreläsning 12: Repetition

Transkript:

Tentamentsskrivning: Matematisk Statistik TMA Tentamentsskrivning i Matematisk Statistik TMA Tid: den augusti, 7 Hjälpmedel: Typgodkänd miniräknare, egenhändigt skriven formelsamling om två A4 fram och bak (dvs 4 sidor), samt utdelade tabeller Tentamen består av 8 frågor om sammanlagt 5 poäng Preliminära betygsgränser är satta till: betyg : till 9 poäng betyg 4 : till 9 poäng betyg 5 : 4 eller fler poäng OBS! Alla lösningar skall vara väl redovisade och motiverade Talen är ej ordnade efter svårighetsgrad Antag att (X, Y ) är likformigt fördelad på enhetsdisken dvs området {x + y } (a) Ange den gemensamma sannolikhetstätheten för (X, Y ) (b) Ange marginalfördelningarna för X och Y (c) Beräkna E [ X Y I(Y ) ] (a) Enhetscirkeln har area π och därmed gäller att { f(x, y) π om x + y annars (b) Vi har: f X (x) x x f X,Y (x, y)dy { x π om x annars På samma sätt: { y f Y (y) f X,Y (x, y)dx y y π om y annars

Tentamentsskrivning: Matematisk Statistik TMA (c) Vi får att E [ X Y I(Y ) ] π π π x x x x yi(y )dydx x ydydx π [ x x ( x )dx π x5 [ y x ] ] x π dx ( ) 5 5π Två kompisar, Kalle och Ada, står på ett hustak och kastar vattenballonger på förbipasserande Sannolikheten att Kalle träffar kallar vi för p K och sannolikheten att Ada träffar kallar vi för p A Vi antar också att sannolikheten för träff är oberoende mellan kasten De kastar varannan gång och Ada får börja (a) De bestämmer sig för att tävla mot varandra Tävlingen är slut så fort någon har träffat Vad är sannolikheten att Ada vinner? Kom ihåg att Ada börjar (b) Vid ett senare tillfälle kastar de tills först Ada träffar och sedan Kalle träffar omedelbart därefter (så om Ada träffar och Kalle sedan missar fortsätter de) Vad är sannolikheten att de behöver exakt k kast tillsammans? (c) Sista gången gör de på följande sätt Ada kastar tills första gången hon träffar, och Kalle kastar tills första gången han träffar Vad är sannolikheten att de behöver sammanlagt k kast? (a) Sannolikheten att Ada vinner i omgång l är p A ( p A ) l ( p K ) l Vi får att sannnolikheten att Ada vinner blir p A ( p A ) l ( p K ) l p A ( p A ) l ( p K ) l p A ( p A )( p K ) l (b) Låt X vara antalet kast de behöver och låt l vara omgången de vinner i Vi får att P(X l) p A p K ( p A p K ) l, där p A p K är sannolikheten att inte båda träffar i en fix omgång Vi får att { pa p P(X k) K ( p A p K ) k/ för k jämnt för alla andra k

Tentamentsskrivning: Matematisk Statistik TMA (c) För att de sammanlagt skall behöva k kast behöver Ada l och Kalle k l kast för något l,, k Vi summerar över de olika fallen och får k P(X k) P(X A l, X K k l) k p A ( p A ) l p K ( p K ) k l Låt T i Exp(λ i ) för i, (a) Beräkna mgf för T k p A p K ( p A )( p K ) ( p K) k ( p A ) l ( p K ) l p A p K ( p A )( p K ) ( p K) k p A p K ( p A )( p K ) ( p K) k k ( pa p K k ( pa l ) l k ( p A p K ( p K ) k pa p K l ( ) k pa p A p K ( p K ) k p K ( ) pa p K p A p K ( p K ) k ( p A ) k p A p K p K ) l ) l+ (b) Använd svaret i uppgift (a) för att bestämma E[T n ] för alla n (c) Låt X vara sådan att P(X ) P(X ) / och X är oberoende av T, T Beräkna mgf för Z där (a) Vi har att för t < λ, M T (t) E[e Tt ] Z XT + ( X)T e st λ e λs ds [ e λ e (t λ)s (t λ )s ds t λ ] λ λ t

Tentamentsskrivning: Matematisk Statistik TMA 4 (b) Det enklaste är att Taylorutvecka mgf:en ( ) k t t k k! M T (t), t/λ k! så vi kan avläsa koefficienterna till (c) Vi får att för t < min(λ, λ ) E[e Zt ] k λ E[T n ] M (n) T () k! λ k k E[e Zt X ]P(X ) + E[e Zt X ]P(X ) ( E[e T t ] + E[e Tt ] ) ( λ λ t + λ ) λ t 4 (a) Låt X,, X n vara iid med täthetsfunktion f(x) α sin(αx) för x π/α där α > är en okänd parameter Hitta MME (momentskattaren) för α (b) Låt Y,, Y n vara iid med täthetsfunktion f(x) β e eβx för x /β Hitta MLE (maximum likelihood skattaren) för β (a) Vi har att E[X] π/α λ k x α [ sin(αx) x cos(αx) ] π/α π/α + π ( cos(π)) + α α [sin(αx)]π/α π α Momentmetoden ger att vi skall lösa ekvationen (b) Likelihooden är n f(y k ) k n k X π ˆα ˆα π X β e eβy k I( Y k /β) cos(αx) dx β n n (e ) n eβ k Y k I( min(y,, Y n ))I(max(Y,, Y n /β))

Tentamentsskrivning: Matematisk Statistik TMA 5 Vi ser att växer då β växer medans β n n (e ) n eβ k Y k I( min(y,, Y n )) I(max(Y,, Y n /β)) blir om β / max(y,, Y n ) så att ˆβ max(y,, Y n ) 5 I en studie ville man jämföra två olika processer för tillverkning av formalin I studien ville man speciellt jämföra halten av toxiska biprodukter och fick därför följande två mätserier över det toxiska innehållet (angett i ppm): Metod nr (x) 4 5 585 4 84 59 8 45 44 75 48 5 Metod nr (y) 49 9 574 7 58 599 7 7 9 579 5 559 Vid alla mätningarna användes samma utrustning Vi har även att k (x k x) 7 k (y k ȳ) 555 (a) Sätt upp ett test för att se om det finns en systematisk skillnad mellan metoderna Välj signifikansnivån 5% Antag att alla data är oberoende och kommer från normalfördelningar (b) Upprepa proceduren i (a) men nu under antagandet att data ej kommer från en normalfördelning Hur skall du göra nu? Reflektera över din metod och ditt resultat Jämför med vad du fick i uppgift (a) (a) Vi har två stickprov som uppenbarligen inte är parade Då det är samma utrustning som används för båda mätserierna följer det att σ x σ y σ Vi får att så att X N ) (µ x, σ ( ) och Ȳ N µ y, σ, ( ) X Ȳ N µ x µ y, σ

Tentamentsskrivning: Matematisk Statistik TMA Därmed blir där X Ȳ (µ x µ y ) s p / t() s p ( )s X + ( )s Y + k (x k x) + k (y k ȳ) 59 Vi använder här att Om vi väljer signifikansnivå 5% får vi att 95 P( 74 T 74) ( P 74 X ) Ȳ (µ x µ y ) s p / 74 ( P X Ȳ 74 s p µ x µ y X Ȳ + 74 s ) p så att ett 95% KI blir I µx µ y x ȳ ± 74 s p [ 595, 4] Då I µx µ y kan vi därmed inte dra slutsatsen att det är en systematisk skillnad på signifikansnivån 5% (b) Vi får använda oss av normalapproximation, dvs centrala gränsvärdessatsen Detta är egentligen olämpligt då antalet mätdata är för få Men då det är vårt enda verktyg har vi inget val Vi bör dock vara noggranna med att påpeka att vårt resultat därmed kommer vara behäftad med en större grad av osäkerhet kring vilka slutsatser vi kan dra Den enda skillnaden rent räknemässigt blir att vi antar (på osäkra grunder) att X Ȳ (µ x µ y ) s p / N(, ) så att I µx µ y x ȳ ± 9 s p [ 547, 94] Då I µx µ y drar vi samma slutsats som innan Men, då detta grundar sig i ett tvivelaktigt användande av centrala gränsvärdessatsen bör vi förhålla oss skeptiska och rekommendera fortsatta studier Låt X,, X n vara iid exponentialfördelade slumpvariabler Betrakta hypoteserna H : λ och H : λ

Tentamentsskrivning: Matematisk Statistik TMA 7 (a) Bestäm den generaliserade likelihood ration Bestäm även motsvarande förkastningsregion (b) Vad förändras ifall vi byter ut H mot (a) Vi har att lik(λ) f(x,, X n λ) n n f(x k λ) k H : λ? k λe λx k Vi betraktar den generaliserade LR-kvoten Λ där ˆλ är MLE:n för λ Vi har att lik() max λ lik(λ) lik() lik(ˆλ), l(λ) log(lik(λ)) n log λ λ λ n e λ n k X k n k X k så att och därmed blir l (λ) n n λ X k ˆλ k n n k X k X ty l (λ) < Den sökta LR kvoten blir Λ lik() lik(ˆλ) e n k X k X n e X n k X k ( e Xe X ) n Vi ser att kvoten är liten om Xe X är liten Detta ger oss förkastningsregionen X [, c ] [c, ) där c, c är sådana att om vi vill ha signifikansnivån α P( X c ) P( X c ) α/,

Tentamentsskrivning: Matematisk Statistik TMA 8 (b) Istället får vi nu lik() lik() n e k X k n e n k X k ( n e k X k som är liten om n k X k är liten Vår förkastningsregion blir nu [, c] där α P( X c) 7 Karl-Johan vill undersöka viskositeten i en svampstuvning som funktion av mängden maizena han har i stuvningen Han fick följande data: Halt: 4 8 4 Viskositet: 4 9 74 8 7 4 54 858 Data kan sammanfattas med S xx 8, S yy 59588, och S xy 884 a Ansätt en linjär regressionsmodell och skatta β, β b Bestäm förklaringsgraden och beräkna residualerna Verkar modellen rimlig? Verkar data rimliga? ) n a Vi har att β S xy S xx 5, β ȳ β x b Vi får att förklaringsgraden blir R och vi beräknar residualerna till S xy S xx S yy 788, datapunkt nr: 4 5 7 8 residual: 9 7 84 7 97 Den låga förklaringsgraden och det märkliga utseendet på residualerna får en att misstänka att det snarare föreligger ett annat samband Kanske exponentiellt eller polynomiellt växande med en högre potens än ett Vid närmare betraktande verkar dessutom den första mätpunkten vara felaktig då viskositeten bör växa som funktion av mängden maizena 8 Låt X, X, X vara oberoende, alla med samma (okända) väntevärde µ Låt vidare varianserna av X, X, X vara σ, σ respektive σ där σ > Låt vidare ˆµ : X + X + X ˆµ : (X X ) /

Tentamentsskrivning: Matematisk Statistik TMA 9 och ˆµ : X + X + X vara tre skattningar av µ (a) Vilken eller vilka av dessa tre skattningarna är väntevärdesriktiga? (b) Vilken av de väntevärdesriktiga skattningarna i (a) har minst varians? (a) Vi har att [ ] X + X + X E[ˆµ ] E µ + µ + µ µ, medans [ E (X X ) /] [ E X / ] [ E där olikheten kommer sig av att X / < Var(X / ) E[X ] E[X / ], så att E[X / ] < E[X ] / Vidare har vi att [ X + E[ˆµ ] E X + X ] så ˆµ och ˆµ båda är väntevärdesriktiga (b) Vi beräknar nu varianserna Vi har att ] < E[X ] / E[X ] / E[X ] µ, µ + µ + µ µ, Var(ˆµ ) 9 (Var(X )+Var(X )+Var(X )) 9 (σ +σ +σ ) σ, medan Var(ˆµ ) (Var(X ) + 4 Var(X ) + 9 Var(X )) Vi ser att µ har minst varians (σ + σ + σ ) σ