STOCKHOLMS UNIVERSITET MS 3150 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 29 maj 2007 Lösig till tetame för kurse Log-lijära statistiska modeller 29 maj 2007 Uppgift 1 a Modelle uta ågra samspelstermer iebär fullstädigt oberoede mella rad, kolum lager, vilket medför att cellsaolikhetera ka skrivas p ijk p i p j p k Eftersom p i beteckar saolikhete att hama i rad i blir ML-skattige ˆp i i / där. ML-skattigara för p j p k fås på likade sätt, vilket slutlige ger ˆp ijk ˆp i ˆp j ˆp k i j k 3 b I de här modelle är rad lager beroede, me eftersom kolum är fortfarade helt oberoede av både rad lager ka vi skriva p ijk p i k p j ML-skattige av p j blir därför samma som i a-uppgifte, meda ML-skattige av p i k ges av ˆp i k i k Sammataget ger detta att ˆp ijk ˆp i k ˆp j i k j 2 c Om vi skriver om modelle log(µ ijk {µ + β j } + {α i + (αβ ij } + {γ k + (βγ jk } ka vi betrakta de som e modell för e tvåvägs I K-tabell för e fix kolum j. Eftersom dea modell ite iehåller ågo samspelsterm mella rad lager betigat på kolum iebär detta att rad lager är betigat oberoede. Om vi låter x betecka rad, Y betecka kolum Z betecka lager ka vi skriva P(X i, Z k Y j P(X i Y jp(z k Y j P(X i, Y j P(Y j, Z k P(Y j P(Y j
Log-lijära statistiska modeller, 29 maj 2007 2 vilket ka skrivas ML-skattige av p ijk blir i detta fallet p ijk p j p ij p jk p 2 j ˆp ijk ˆp ij ˆp jk ij jk / 2 ˆp j j / ij jk j Uppgift 2 Vi börjar med att uttrycka p(x i som fuktio av α β eligt eα+βx i p(x i 1 + a Likelihoodfuktioe ka skrivas ( k Ni L(α, β p(x i i (1 p(x i i i vilket ger log-likelihoodfuktioe ( ( Ni l(α, β log + i log(p(x i + ( i log(1 p(x i i ( ( p(xi Ni i log + log(1 p(x i + log 1 p(x i i ( i (α + βx i log(1 + e α+βx Ni i + log i b Partiella derivator av l(α, β med avseede på α β blir l α i l β i x i 1 + e α+βx i i p(x i x i 1 + e α+βx i i x i x i p(x i Sätter vi dessa derivator till oll får vi likelihoodekvatioera { k i k p(x i k i x i k x i p(x i c Iformatiosmatrise defieieras som I(α, β ( α 2 α β α β β 2
Log-lijära statistiska modeller, 29 maj 2007 3 Vi beräkar först derivatora α p(x i α 1 + e α+βx eα+βxi (1 + e α+βxi e α+βxi e α+βxi i (1 + 2 1 1 + 1 + e α+βx p(x i(1 p(x i i β p(x i β 1 + e α+βx x ie α+βxi (1 + e α+βxi x i e α+βxi e α+βxi i (1 + 2 Adraderivata med avseede på α blir med avseede på β Slutlige får vi äve Uppgift 3 1 x i 1 + 1 + e α+βx x ip(x i i (1 p(x i α 2 α p(x i β 2 x i β p(x i α β α x ip(x i Data ka ställas upp i följade tabell p(x i (1 p(x i x 2 i p(x i (1 p(x i x i p(x i (1 p(x i Patieter Operatio Ej operatio Σ Kotroller Operatio 26 7 33 Ej operatio 15 37 52 Σ 41 44 85 Nollhypotese att operatio ite påverkar riske att utveckla Hodgkis sjukdom ka uttryckas som att p 1 p 1, det vill säga att saolikhete att det sjuka syskoet har geomgått operatio är samma som att det friska syskoet har gjort detta. Detta sambad ka också skrivas p 11 + p 12 p 11 + p 21, vilket ger att H 0 : p 12 p 21
Log-lijära statistiska modeller, 29 maj 2007 4 Vi har alltså två fria parametrar p 11 p 22 uder H 0. (Parametrara p 12 p 21 ges av H 0 kravet att p 11 + p 12 + p 21 + p 22 1. ML-skattigara av p 11 p 22 uder H 0 ges av ˆp (0 11 11 ˆp (0 22 22 ML-skattigara av p 12 p 21 måste vara lika uppfylla ˆp (0 11 + ˆp(0 12 + ˆp(0 21 + ˆp(0 22 1, vilket ger ˆp (0 12 ˆp(0 21 1 ˆp(0 2 Ett χ 2 -test av H 0 ka u skrivas X 2 j1 ( ij ˆµ (0 ij 2 ˆµ (0 ij 11 ˆp(0 22 j1 1 11/ 22 / 2 ( ij ˆp (0 ij 2 ˆp (0 ij 12 + 21 2 ( 11 11 2 + ( 12 ( 12 + 21 /2 2 + ( 21 ( 12 + 21 /2 2 + ( 22 22 2 11 ( 12 + 21 /2 ( 12 + 21 /2 22 ( 12 21 2 (7 152 12 + 21 7 + 15 64 22 2.91 Eftersom det i grudmodelle fis tre fria parametrar så blir atal frihetsgrader i χ 2 - fördelige lik med ett kritiska gräse på 10 %-ivå blir 2.71 så vi ka alltså förkasta H 0. Uppgift 4 Dessa data ka ställas upp i tabelle Aställd Ej aställd Σ Ma 0 3 3 Kvia 2 0 2 Uder ollhypotese att kö ite påverkar aställig blir saolikhete för de erhålla tabelle p 1 1! 2! 1! 2! 11! 12! 21! 22!! 3!2!2!3! 0!3!2!0!5! 1 10 Med fixa rad- kolumsummor fis två övriga möjliga tabeller
Log-lijära statistiska modeller, 29 maj 2007 5 Aställd Ej aställd Σ Ma 1 2 3 Kvia 1 1 2 Aställd Ej aställd Σ Ma 2 1 3 Kvia 0 2 2 Dessa tabeller har saolikheter p 2 3!2!2!3! 1!2!1!1!5! 6 10 p 3 3!2!2!3! 2!1!0!2!5! 3 10 De erhålla tabelle har alltså lägst saolikhet, vilket gör att p-värdet blir 10 %. Uppgift 5 a De logaritmiska fördelige ka skrivas på forme p(y i exp (y i log(p i log(y i log( log(1 p i E jämförelse med kompoete i de geeraliserade lijära modelle ger att θ i log(p i b(θ 1 log( log(1 p i log( log(1 e θ i φ 1 w i 1 c(y i, φ, w i log(y i b De kaoiska läkfuktioe defiieras som iverse av derivata av b(θ i med avseede på θ i, det vill säga g(µ i b 1 (µ i. Derivata av b(θ i blir b (θ i eθ i /(1 e θ i log(1 e θ i Kaoiska läke fås u som lösige av b (θ i µ i, vilket exempelvis ka uttryckas e θ i µ i (1 e θ i log(1 e θ i