Avd Matematisk statistik TENTAMEN I SF955 f d 5B555 DATORINTENSIVA METODER ONSDAGEN DEN AUGUSTI 008 KL 400 900 Examiator: Guar Eglud, tel 790746 Email: guare@mathkthse Tillåta hjälpmedel: Formel- och tabellsamlig i Matematisk statistik Räkare Iförda beteckigar skall förklaras och defiieras Resoemag och uträkigar skall vara så utförliga att de är lätta att följa Numeriska svar skall ages med mist två siffrors oggrahet Du får meddelade om resultatet via e-mail om du ager email-adress Lycka till! - - - - - - - - - - - - - - - - - - - - - - - - Uppgift Vi har oberoede likafördelade variabler X, X,, X vilkas empiriska fördeligsfuktio F ka skrivas som F t IX i t där a Beräka E F t och V F t IA { om A 0 aars b Visa att F t Ft PX t i saolikhet dvs att för alla ε > 0 P F t Ft > ε 0 då Uppgift För e parameter θ har vi e lijär plug-i-skattig θx, x,, x µ + αx i a Udersök om bootstrap-skattige av bias systematiskt fel är korrekt b Udersök om jackkife-skattige av bias systematiskt fel är korrekt Som bekat är jackkife-skattige av bias bias jack θ θ
forts tetame i SF955 08-08-0 där θ och θ i är skattige baserad på det i:te jackkife-stickprovet Uppgift 3 För e parameter θ har vi e plug-i skattig θx, x,, x som i Matlab beräkas med estimatex där data x, x,, x fis lagrade i vektorx Vi erhållerestimatex00 Vi gör bootstrap av dea med Matlab-kode bootbootstrp9999, estimate,x; sortedsortboot; θ i Vi erhåller sorted50070 och sorted95000 Beräka ett 90%-igt tvåsidigt kofidesitervall för θ a med de ekla percetilmetode b baserat på pivot-variabel θ/θ c baserat på pivot-variabel θ θ d Vi har tillgåg till e medelfelsskattig τx, x,, x för θ som beräkas med Matlabfuktioe errorestx Skriv Matlab-kod som beräkar kofidesitervallet baserat på pivot-variabel θ θ/ τ Uppgift 4 Vi har e kotiuerlig fördelig som är helt kocetrerad på itervallet [0, θ] och vi är itresserade av att skatta θ och har därför skaffat oss stickprovet x, x,, x som sorterat i storleksordig blir x, x,, x de s k ordigsvariablera Vi skattar θ med plugi-skattige θ x och gör seda bootstrap av dea a Härled de saa saolikhetsfördelige för bootstrapvariabel θ b Bias-korrigera skattige med hjälp av bootstrap och giv ett explicit uttryck i form av e serie för dea uttryckt i det erhålla stickprovet Låt parameter θ ha apriorifördelige Uppgift 5 f Θ θ för 0 < θ < och vi har modelle att X är Bi3,θ samt har gjort observatioe X Beräka aposteriorifördelige för Θ X, dvs bestäm f Θ X θ för 0 < θ <
forts tetame i SF955 08-08-0 3 Uppgift 6 Vid korsvaliderig är e skattig av prediktiosfelet för kvadratisk förlustfuktio Q CV y i ŷ i då ma har observatioer y, y,, y och där ŷ i är e prediktio av y i baserad på alla data utom y i Atag att y, y,, y är utfall av oberoede likafördelade variabler Y, Y,, Y som har EY i θ och V Y i σ Vi skattar θ med θ ȳ och prediktor ŷ i är alltså ȳ a Visa att Q CV y i ȳ b Vi studerar u situatioe med två oberoede stickprov vardera av lägd x, x,, x och z, z,, z där vi vill jämföra vätevärdea x,, x är utfall av de likafördelade variablera X,, X och z,, z är utfall av de likafördelade Z,, Z Alla variabler är oberoede med samma varias σ Vi vill alltså ställa följade två modeller mot varadra M : EX i θ och EZ i θ för i,,, M : EX i EZ i θ för i,,, I grudkursera visas att e lämplig teststorhet är där s är de poolade variase T x z s + s s x + s z x i x + z i z eftersom T är t -fördelad om M är sa och data är ormalfördelade Alltså förkastas M till förmå för M om T är stor Avsikte är att Du skall visa att e jämförelse mella de skattade prediktiosfele med korsvaliderig för de två modellera ger upphov till samma typ av test! Ta fram ett uttryck för Q CV, för modell M geom att utyttja resulatet frå a-dele Ta fram Q CV, för modell M där ma aturligtvis skattar θ med x + z/ Ledig: I ka ma ha glädje av formel x i x + z x i x x z + 4 3 Udersök vad villkoret Q CV, > Q CV, iebär och visa att det svarar mot T >kostat
Avd Matematisk statistik LÖSNING TENTAMEN I SF955 f d 5B555 DATORINTENSIVA METODER 0/8-008 Uppgift Eftersom X, X,, X är oberoede likafördelade är IX t, IX t,, IX t oberoede likafördelade stokastiska variabler med PIX i t Ft och PIX i t 0 Ft Detta ger att Alltså gäller att och EIX i t Ft och V IX t Ft Ft E F t V F t EIX i t EIX t Ft V IX i t V IX t b Eligt Tjebyshovs olikhet gäller att och med X vald som F t erhåller vi P X EX > ε V X ε Ft Ft P F t Ft > ε V F t ε Ft Ft ε 0 då Vi får och alltså är bias F 0 Uppgift bias F θ, θ E F θx, X,, X θ E F αx i αxdfx E F αx αxdfx 0 Vi får vidare för bootstrap-skattige bias boot bias boot E b F θx, X,, X θx, x,, x
forts tetame i SF955 08-08-0 E b F E bf αx αxi αx i αx i αx i αx i 0 vilket alltså iebär att systematiska felet är 0 och att äve bootstrap-skattige av det systematiska felet är 0, dvs att bootstrap-skattige är korrekt b Vi har de i:te jackkife-skattige där alltså observatioe x i stryks som ger θ θ i µ + θ i µ + j i j αx j µ + αx j j αx j αx i αx i µ + αx i Alltså ser vi att bias jack 0 vilket överesstämmer med saa värdet på det systematiska felet för θ Uppgift 3 a Itervallet blir 70, 0 eftersom de ekla percetil-itervalle helt ekelt tar 5%- respektive 95%-puktera i bootstrapfördelige b Om vi låter Gz P θx, X,, X /θ z och vi käde Gz skulle vi kua ta percetilera z 005 och z 095 sådaa att Gz 005 005 och Gz 095 095 och erhålla och kofidesitervallet skulle bli 090 Pz 005 θx,, X /θ z 095 P θx,, X /z 095 θ θx,, X /z 005 θx,, x /z 095, θx,, x /z 005 Vi käer ite Gz, dvs fördelige för θx,, X /θ, me vi ka simulera fördelige för bootstrap-motsvarighete θx,, X / θx,, x och vi ka ta 5%- och 95%-puktera z005 och z 095 i dea fördelig Vi erhåller med simulerige z005 70/00 och z 095 0/00 vilket ger kofidesitervallet 00 /0, 00 /70833, 4 c På motsvarade sätt som a-dele betraktar vi Gz P θx,, X θ z och simulerar fördelige för θx,, X θx,, x Vi erhåller på likade sätt som i b-dele att 090 Pz 005 θx,, X θ z 095 P θx,, X z 095 θ θx,, X z 005 och itervallet skulle bli θx,, x z 095, θx,, x z 005
forts tetame i SF955 08-08-0 3 För bootstrap-motsvarighete θx,, X θx,, x erhåller vi med simulerige percetilera z005 70 00 30 och z 095 0 00 0 och vi får itervallet 00 0, 00 3080, 30 d I aalogi med b- och c-delara studerar vi u fördelige för pivotstorhete, dvs θx,, X θ Gz P z τx,, X och kallar percetilera för z 005 respektive z 095 och erhåller 090 P z 005 θx,, X θ z 095 τx,, X P θx,, X z 095 τx,, X θ θx,, X z 005 τx,, X som alltså skulle ge ett exakt kofidesitervall θx,, x z 095 τx,, x, θx,, x z 005 τx,, x Vi får percetilera z005 och z095 geom simulerig av θx,, X θx,, x τx,, X Vi skriver e lite m-fil som ka avädas för att beräka pivot-storhete θ θ/τ med t ex fuctio [theta tau]bothx; thetaestimatex; tauerrorestx; För att erhålla kofidesitervallet ka vi aväda Matlab-kode där vi aväder / för koordiatvis divisio estestimatex ; [boot_theta boot_tau]bootstrp9999, both,x; boot_pivotboot_theta-est/boot_tau; sortedsortboot_pivot; z_lowsorted500; z_highsorted9500; lowerestimatex-z_high*errorestx upperestimatex-z_low*errorestx där itervallet erhålls som lower,upper
forts tetame i SF955 08-08-0 4 Uppgift 4 Vi har alltså skattige θx,, x x Vid bootstrap blir skattige θ X och vi får PX x i i eftersom för vart och ett av Xj :a är saolikhete i/ att de är midre ä x i och Xj :a är oberoede likafördelade Eftersom de bakomliggade fördelige var kotiuerlig förekommer iga oavgjorda Alltså får vi p i PX x i PX x i PX x i i i, i,,, b Vi skattar det systematiska felet med bias boot E θ θx,, x p i x i x och de biaskorrigerade skattige blir θ θx,, x bias boot x p i x i Vi får f Θ X θ p X Θθf Θ θ p X Uppgift 5 3 θ θ 3 0 θ θdθ θ θ θ θ, 0 < θ < θ3 3 θ4 4 0 aa Vi har ŷ i j i Uppgift 6 y j y j y i ȳ y i j och erhåller alltså Q CV y i ŷ i y i ȳ + y i b Vi får y i ȳ Q CV, x i x i + y i ȳ z i ẑ i el a-dele
forts tetame i SF955 08-08-0 5 x i x + z i z I modelle M ka vi betrakta data som beståede av e eda mätserie y, y,, y x,, x, z,, z där prediktorera alla är ȳ x + z/ och vi får alltså ur förra årets resultat med bytt mot att Me Detta ger y i ȳ Q CV, Q CV, x i y i ŷ i x + z + x i x + z i z i z + x i x + Vi ser att Q CV, > Q CV, om x z > x i x + Detta är ekvivalet med att dvs dvs x z x i x + z > i z x z s + T > > y i ȳ x + z Ledige x z z i z + x z z i z 4 3 + Alltså iebär modellval med hjälp av korsvaliderig att M väljs om T > + / och aars väljs M Dea beslutsregel är av samma typ som de traditioella metode som bygger på hypotesprövig