Tentamentsskrivning: Matematisk Statistik TMA Tentamentsskrivning i Matematisk Statistik TMA Tid: den augusti, 7 Hjälpmedel: Typgodkänd miniräknare, egenhändigt skriven formelsamling om två A4 fram och bak (dvs 4 sidor), samt utdelade tabeller Tentamen består av 8 frågor om sammanlagt 5 poäng Preliminära betygsgränser är satta till: betyg : till 9 poäng betyg 4 : till 9 poäng betyg 5 : 4 eller fler poäng OBS! Alla lösningar skall vara väl redovisade och motiverade Talen är ej ordnade efter svårighetsgrad Antag att (X, Y ) är likformigt fördelad på enhetsdisken dvs området {x + y } (a) Ange den gemensamma sannolikhetstätheten för (X, Y ) (b) Ange marginalfördelningarna för X och Y (c) Beräkna E [ X Y I(Y ) ] (a) Enhetscirkeln har area π och därmed gäller att { f(x, y) π om x + y annars (b) Vi har: f X (x) x x f X,Y (x, y)dy { x π om x annars På samma sätt: { y f Y (y) f X,Y (x, y)dx y y π om y annars
Tentamentsskrivning: Matematisk Statistik TMA (c) Vi får att E [ X Y I(Y ) ] π π π x x x x yi(y )dydx x ydydx π [ x x ( x )dx π x5 [ y x ] ] x π dx ( ) 5 5π Två kompisar, Kalle och Ada, står på ett hustak och kastar vattenballonger på förbipasserande Sannolikheten att Kalle träffar kallar vi för p K och sannolikheten att Ada träffar kallar vi för p A Vi antar också att sannolikheten för träff är oberoende mellan kasten De kastar varannan gång och Ada får börja (a) De bestämmer sig för att tävla mot varandra Tävlingen är slut så fort någon har träffat Vad är sannolikheten att Ada vinner? Kom ihåg att Ada börjar (b) Vid ett senare tillfälle kastar de tills först Ada träffar och sedan Kalle träffar omedelbart därefter (så om Ada träffar och Kalle sedan missar fortsätter de) Vad är sannolikheten att de behöver exakt k kast tillsammans? (c) Sista gången gör de på följande sätt Ada kastar tills första gången hon träffar, och Kalle kastar tills första gången han träffar Vad är sannolikheten att de behöver sammanlagt k kast? (a) Sannolikheten att Ada vinner i omgång l är p A ( p A ) l ( p K ) l Vi får att sannnolikheten att Ada vinner blir p A ( p A ) l ( p K ) l p A ( p A ) l ( p K ) l p A ( p A )( p K ) l (b) Låt X vara antalet kast de behöver och låt l vara omgången de vinner i Vi får att P(X l) p A p K ( p A p K ) l, där p A p K är sannolikheten att inte båda träffar i en fix omgång Vi får att { pa p P(X k) K ( p A p K ) k/ för k jämnt för alla andra k
Tentamentsskrivning: Matematisk Statistik TMA (c) För att de sammanlagt skall behöva k kast behöver Ada l och Kalle k l kast för något l,, k Vi summerar över de olika fallen och får k P(X k) P(X A l, X K k l) k p A ( p A ) l p K ( p K ) k l Låt T i Exp(λ i ) för i, (a) Beräkna mgf för T k p A p K ( p A )( p K ) ( p K) k ( p A ) l ( p K ) l p A p K ( p A )( p K ) ( p K) k p A p K ( p A )( p K ) ( p K) k k ( pa p K k ( pa l ) l k ( p A p K ( p K ) k pa p K l ( ) k pa p A p K ( p K ) k p K ( ) pa p K p A p K ( p K ) k ( p A ) k p A p K p K ) l ) l+ (b) Använd svaret i uppgift (a) för att bestämma E[T n ] för alla n (c) Låt X vara sådan att P(X ) P(X ) / och X är oberoende av T, T Beräkna mgf för Z där (a) Vi har att för t < λ, M T (t) E[e Tt ] Z XT + ( X)T e st λ e λs ds [ e λ e (t λ)s (t λ )s ds t λ ] λ λ t
Tentamentsskrivning: Matematisk Statistik TMA 4 (b) Det enklaste är att Taylorutvecka mgf:en ( ) k t t k k! M T (t), t/λ k! så vi kan avläsa koefficienterna till (c) Vi får att för t < min(λ, λ ) E[e Zt ] k λ E[T n ] M (n) T () k! λ k k E[e Zt X ]P(X ) + E[e Zt X ]P(X ) ( E[e T t ] + E[e Tt ] ) ( λ λ t + λ ) λ t 4 (a) Låt X,, X n vara iid med täthetsfunktion f(x) α sin(αx) för x π/α där α > är en okänd parameter Hitta MME (momentskattaren) för α (b) Låt Y,, Y n vara iid med täthetsfunktion f(x) β e eβx för x /β Hitta MLE (maximum likelihood skattaren) för β (a) Vi har att E[X] π/α λ k x α [ sin(αx) x cos(αx) ] π/α π/α + π ( cos(π)) + α α [sin(αx)]π/α π α Momentmetoden ger att vi skall lösa ekvationen (b) Likelihooden är n f(y k ) k n k X π ˆα ˆα π X β e eβy k I( Y k /β) cos(αx) dx β n n (e ) n eβ k Y k I( min(y,, Y n ))I(max(Y,, Y n /β))
Tentamentsskrivning: Matematisk Statistik TMA 5 Vi ser att växer då β växer medans β n n (e ) n eβ k Y k I( min(y,, Y n )) I(max(Y,, Y n /β)) blir om β / max(y,, Y n ) så att ˆβ max(y,, Y n ) 5 I en studie ville man jämföra två olika processer för tillverkning av formalin I studien ville man speciellt jämföra halten av toxiska biprodukter och fick därför följande två mätserier över det toxiska innehållet (angett i ppm): Metod nr (x) 4 5 585 4 84 59 8 45 44 75 48 5 Metod nr (y) 49 9 574 7 58 599 7 7 9 579 5 559 Vid alla mätningarna användes samma utrustning Vi har även att k (x k x) 7 k (y k ȳ) 555 (a) Sätt upp ett test för att se om det finns en systematisk skillnad mellan metoderna Välj signifikansnivån 5% Antag att alla data är oberoende och kommer från normalfördelningar (b) Upprepa proceduren i (a) men nu under antagandet att data ej kommer från en normalfördelning Hur skall du göra nu? Reflektera över din metod och ditt resultat Jämför med vad du fick i uppgift (a) (a) Vi har två stickprov som uppenbarligen inte är parade Då det är samma utrustning som används för båda mätserierna följer det att σ x σ y σ Vi får att så att X N ) (µ x, σ ( ) och Ȳ N µ y, σ, ( ) X Ȳ N µ x µ y, σ
Tentamentsskrivning: Matematisk Statistik TMA Därmed blir där X Ȳ (µ x µ y ) s p / t() s p ( )s X + ( )s Y + k (x k x) + k (y k ȳ) 59 Vi använder här att Om vi väljer signifikansnivå 5% får vi att 95 P( 74 T 74) ( P 74 X ) Ȳ (µ x µ y ) s p / 74 ( P X Ȳ 74 s p µ x µ y X Ȳ + 74 s ) p så att ett 95% KI blir I µx µ y x ȳ ± 74 s p [ 595, 4] Då I µx µ y kan vi därmed inte dra slutsatsen att det är en systematisk skillnad på signifikansnivån 5% (b) Vi får använda oss av normalapproximation, dvs centrala gränsvärdessatsen Detta är egentligen olämpligt då antalet mätdata är för få Men då det är vårt enda verktyg har vi inget val Vi bör dock vara noggranna med att påpeka att vårt resultat därmed kommer vara behäftad med en större grad av osäkerhet kring vilka slutsatser vi kan dra Den enda skillnaden rent räknemässigt blir att vi antar (på osäkra grunder) att X Ȳ (µ x µ y ) s p / N(, ) så att I µx µ y x ȳ ± 9 s p [ 547, 94] Då I µx µ y drar vi samma slutsats som innan Men, då detta grundar sig i ett tvivelaktigt användande av centrala gränsvärdessatsen bör vi förhålla oss skeptiska och rekommendera fortsatta studier Låt X,, X n vara iid exponentialfördelade slumpvariabler Betrakta hypoteserna H : λ och H : λ
Tentamentsskrivning: Matematisk Statistik TMA 7 (a) Bestäm den generaliserade likelihood ration Bestäm även motsvarande förkastningsregion (b) Vad förändras ifall vi byter ut H mot (a) Vi har att lik(λ) f(x,, X n λ) n n f(x k λ) k H : λ? k λe λx k Vi betraktar den generaliserade LR-kvoten Λ där ˆλ är MLE:n för λ Vi har att lik() max λ lik(λ) lik() lik(ˆλ), l(λ) log(lik(λ)) n log λ λ λ n e λ n k X k n k X k så att och därmed blir l (λ) n n λ X k ˆλ k n n k X k X ty l (λ) < Den sökta LR kvoten blir Λ lik() lik(ˆλ) e n k X k X n e X n k X k ( e Xe X ) n Vi ser att kvoten är liten om Xe X är liten Detta ger oss förkastningsregionen X [, c ] [c, ) där c, c är sådana att om vi vill ha signifikansnivån α P( X c ) P( X c ) α/,
Tentamentsskrivning: Matematisk Statistik TMA 8 (b) Istället får vi nu lik() lik() n e k X k n e n k X k ( n e k X k som är liten om n k X k är liten Vår förkastningsregion blir nu [, c] där α P( X c) 7 Karl-Johan vill undersöka viskositeten i en svampstuvning som funktion av mängden maizena han har i stuvningen Han fick följande data: Halt: 4 8 4 Viskositet: 4 9 74 8 7 4 54 858 Data kan sammanfattas med S xx 8, S yy 59588, och S xy 884 a Ansätt en linjär regressionsmodell och skatta β, β b Bestäm förklaringsgraden och beräkna residualerna Verkar modellen rimlig? Verkar data rimliga? ) n a Vi har att β S xy S xx 5, β ȳ β x b Vi får att förklaringsgraden blir R och vi beräknar residualerna till S xy S xx S yy 788, datapunkt nr: 4 5 7 8 residual: 9 7 84 7 97 Den låga förklaringsgraden och det märkliga utseendet på residualerna får en att misstänka att det snarare föreligger ett annat samband Kanske exponentiellt eller polynomiellt växande med en högre potens än ett Vid närmare betraktande verkar dessutom den första mätpunkten vara felaktig då viskositeten bör växa som funktion av mängden maizena 8 Låt X, X, X vara oberoende, alla med samma (okända) väntevärde µ Låt vidare varianserna av X, X, X vara σ, σ respektive σ där σ > Låt vidare ˆµ : X + X + X ˆµ : (X X ) /
Tentamentsskrivning: Matematisk Statistik TMA 9 och ˆµ : X + X + X vara tre skattningar av µ (a) Vilken eller vilka av dessa tre skattningarna är väntevärdesriktiga? (b) Vilken av de väntevärdesriktiga skattningarna i (a) har minst varians? (a) Vi har att [ ] X + X + X E[ˆµ ] E µ + µ + µ µ, medans [ E (X X ) /] [ E X / ] [ E där olikheten kommer sig av att X / < Var(X / ) E[X ] E[X / ], så att E[X / ] < E[X ] / Vidare har vi att [ X + E[ˆµ ] E X + X ] så ˆµ och ˆµ båda är väntevärdesriktiga (b) Vi beräknar nu varianserna Vi har att ] < E[X ] / E[X ] / E[X ] µ, µ + µ + µ µ, Var(ˆµ ) 9 (Var(X )+Var(X )+Var(X )) 9 (σ +σ +σ ) σ, medan Var(ˆµ ) (Var(X ) + 4 Var(X ) + 9 Var(X )) Vi ser att µ har minst varians (σ + σ + σ ) σ