Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Relevanta dokument
LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Exempel på tentamensuppgifter

1. Test av anpassning.

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Borel-Cantellis sats och stora talens lag

θx θ 1 om 0 x 1 f(x) = 0 annars

a) Beräkna E (W ). (2 p)

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

TMS136: Dataanalys och statistik Tentamen med lösningar

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Matematisk statistik TMS063 Tentamen

Introduktion till statistik för statsvetare

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Föreläsning 2: Punktskattningar

Avd. Matematisk statistik

Tentamen i Sannolikhetsteori III 13 januari 2000

TENTAMEN Datum: 16 okt 09

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Grundläggande matematisk statistik

Tentamen i matematisk statistik

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Datorövning 2 Fördelningar inom säkerhetsanalys

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Formelblad Sannolikhetsteori 1

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

TENTAMEN I MATEMATISK STATISTIK

Datorövning 2 Fördelningar inom säkerhetsanalys

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 1: Matematik 7.5 hp

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Föreläsning G04: Surveymetodik

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Genomsnittligt sökdjup i binära sökträd

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Jag läser kursen på. Halvfart Helfart

Tentamen i Krypteringsmetoder och Säkring av Datasystem 7.5 hp

Tentamen i Linjär Algebra, SF december, Del I. Kursexaminator: Sandra Di Rocco. Matematiska Institutionen KTH

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning 15: Faktorförsök

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

2. Konfidensintervall för skillnaden mellan två proportioner.

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Lösningsförslag

Föreläsning G70 Statistik A

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Matematisk statistik för D, I, Π och Fysiker

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 1: Matematik 7.5 hp

TAMS15: SS1 Markovprocesser

F12 Stickprovsteori, forts

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

4.2.3 Normalfördelningen

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Armin Halilovic: EXTRA ÖVNINGAR

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Formelsamling Tillämpad statistik, A5

Matematik. Definition 1 Mängdbeteckningar Tomma mängden Ω Hela utfallsrummet Unionen Snittet C Komplementet A Antalet element i A

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

Tentamen Metod C vid Uppsala universitet, , kl

INGENJÖRSMATEMATISK FORMELSAMLING

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

================================================

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

b 1 och har för olika värden på den reella konstanten a.

Transkript:

STOCKHOLMS UNIVERSITET MS 3150 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 29 maj 2007 Lösig till tetame för kurse Log-lijära statistiska modeller 29 maj 2007 Uppgift 1 a Modelle uta ågra samspelstermer iebär fullstädigt oberoede mella rad, kolum lager, vilket medför att cellsaolikhetera ka skrivas p ijk p i p j p k Eftersom p i beteckar saolikhete att hama i rad i blir ML-skattige ˆp i i / där. ML-skattigara för p j p k fås på likade sätt, vilket slutlige ger ˆp ijk ˆp i ˆp j ˆp k i j k 3 b I de här modelle är rad lager beroede, me eftersom kolum är fortfarade helt oberoede av både rad lager ka vi skriva p ijk p i k p j ML-skattige av p j blir därför samma som i a-uppgifte, meda ML-skattige av p i k ges av ˆp i k i k Sammataget ger detta att ˆp ijk ˆp i k ˆp j i k j 2 c Om vi skriver om modelle log(µ ijk {µ + β j } + {α i + (αβ ij } + {γ k + (βγ jk } ka vi betrakta de som e modell för e tvåvägs I K-tabell för e fix kolum j. Eftersom dea modell ite iehåller ågo samspelsterm mella rad lager betigat på kolum iebär detta att rad lager är betigat oberoede. Om vi låter x betecka rad, Y betecka kolum Z betecka lager ka vi skriva P(X i, Z k Y j P(X i Y jp(z k Y j P(X i, Y j P(Y j, Z k P(Y j P(Y j

Log-lijära statistiska modeller, 29 maj 2007 2 vilket ka skrivas ML-skattige av p ijk blir i detta fallet p ijk p j p ij p jk p 2 j ˆp ijk ˆp ij ˆp jk ij jk / 2 ˆp j j / ij jk j Uppgift 2 Vi börjar med att uttrycka p(x i som fuktio av α β eligt eα+βx i p(x i 1 + a Likelihoodfuktioe ka skrivas ( k Ni L(α, β p(x i i (1 p(x i i i vilket ger log-likelihoodfuktioe ( ( Ni l(α, β log + i log(p(x i + ( i log(1 p(x i i ( ( p(xi Ni i log + log(1 p(x i + log 1 p(x i i ( i (α + βx i log(1 + e α+βx Ni i + log i b Partiella derivator av l(α, β med avseede på α β blir l α i l β i x i 1 + e α+βx i i p(x i x i 1 + e α+βx i i x i x i p(x i Sätter vi dessa derivator till oll får vi likelihoodekvatioera { k i k p(x i k i x i k x i p(x i c Iformatiosmatrise defieieras som I(α, β ( α 2 α β α β β 2

Log-lijära statistiska modeller, 29 maj 2007 3 Vi beräkar först derivatora α p(x i α 1 + e α+βx eα+βxi (1 + e α+βxi e α+βxi e α+βxi i (1 + 2 1 1 + 1 + e α+βx p(x i(1 p(x i i β p(x i β 1 + e α+βx x ie α+βxi (1 + e α+βxi x i e α+βxi e α+βxi i (1 + 2 Adraderivata med avseede på α blir med avseede på β Slutlige får vi äve Uppgift 3 1 x i 1 + 1 + e α+βx x ip(x i i (1 p(x i α 2 α p(x i β 2 x i β p(x i α β α x ip(x i Data ka ställas upp i följade tabell p(x i (1 p(x i x 2 i p(x i (1 p(x i x i p(x i (1 p(x i Patieter Operatio Ej operatio Σ Kotroller Operatio 26 7 33 Ej operatio 15 37 52 Σ 41 44 85 Nollhypotese att operatio ite påverkar riske att utveckla Hodgkis sjukdom ka uttryckas som att p 1 p 1, det vill säga att saolikhete att det sjuka syskoet har geomgått operatio är samma som att det friska syskoet har gjort detta. Detta sambad ka också skrivas p 11 + p 12 p 11 + p 21, vilket ger att H 0 : p 12 p 21

Log-lijära statistiska modeller, 29 maj 2007 4 Vi har alltså två fria parametrar p 11 p 22 uder H 0. (Parametrara p 12 p 21 ges av H 0 kravet att p 11 + p 12 + p 21 + p 22 1. ML-skattigara av p 11 p 22 uder H 0 ges av ˆp (0 11 11 ˆp (0 22 22 ML-skattigara av p 12 p 21 måste vara lika uppfylla ˆp (0 11 + ˆp(0 12 + ˆp(0 21 + ˆp(0 22 1, vilket ger ˆp (0 12 ˆp(0 21 1 ˆp(0 2 Ett χ 2 -test av H 0 ka u skrivas X 2 j1 ( ij ˆµ (0 ij 2 ˆµ (0 ij 11 ˆp(0 22 j1 1 11/ 22 / 2 ( ij ˆp (0 ij 2 ˆp (0 ij 12 + 21 2 ( 11 11 2 + ( 12 ( 12 + 21 /2 2 + ( 21 ( 12 + 21 /2 2 + ( 22 22 2 11 ( 12 + 21 /2 ( 12 + 21 /2 22 ( 12 21 2 (7 152 12 + 21 7 + 15 64 22 2.91 Eftersom det i grudmodelle fis tre fria parametrar så blir atal frihetsgrader i χ 2 - fördelige lik med ett kritiska gräse på 10 %-ivå blir 2.71 så vi ka alltså förkasta H 0. Uppgift 4 Dessa data ka ställas upp i tabelle Aställd Ej aställd Σ Ma 0 3 3 Kvia 2 0 2 Uder ollhypotese att kö ite påverkar aställig blir saolikhete för de erhålla tabelle p 1 1! 2! 1! 2! 11! 12! 21! 22!! 3!2!2!3! 0!3!2!0!5! 1 10 Med fixa rad- kolumsummor fis två övriga möjliga tabeller

Log-lijära statistiska modeller, 29 maj 2007 5 Aställd Ej aställd Σ Ma 1 2 3 Kvia 1 1 2 Aställd Ej aställd Σ Ma 2 1 3 Kvia 0 2 2 Dessa tabeller har saolikheter p 2 3!2!2!3! 1!2!1!1!5! 6 10 p 3 3!2!2!3! 2!1!0!2!5! 3 10 De erhålla tabelle har alltså lägst saolikhet, vilket gör att p-värdet blir 10 %. Uppgift 5 a De logaritmiska fördelige ka skrivas på forme p(y i exp (y i log(p i log(y i log( log(1 p i E jämförelse med kompoete i de geeraliserade lijära modelle ger att θ i log(p i b(θ 1 log( log(1 p i log( log(1 e θ i φ 1 w i 1 c(y i, φ, w i log(y i b De kaoiska läkfuktioe defiieras som iverse av derivata av b(θ i med avseede på θ i, det vill säga g(µ i b 1 (µ i. Derivata av b(θ i blir b (θ i eθ i /(1 e θ i log(1 e θ i Kaoiska läke fås u som lösige av b (θ i µ i, vilket exempelvis ka uttryckas e θ i µ i (1 e θ i log(1 e θ i