En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Relevanta dokument
Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

4.2.3 Normalfördelningen

Korrelationens betydelse vid GUM-analyser

Föreläsningsanteckningar till Linjär Regression

Sensorer, effektorer och fysik. Analys av mätdata

Sensorer och elektronik. Analys av mätdata

Något om beskrivande statistik

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

Formler och tabeller i statistik

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

Normalfördelningar (Blom Kapitel 8)

Lycka till och trevlig sommar!

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

F15 ENKEL LINJÄR REGRESSION (NCT )

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

Tentamen STA A15 delkurs 1 (10 poäng): Sannolikhetslära och statistisk slutledning 3 november, 2005 kl

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Introduktion till statistik för statsvetare

Fördelningen för populationen som stickprovet togs ifrån är känd så nära som på ett antal parametrar, t.ex: N med okända

Orderkvantiteter vid begränsningar av antal order per år

Flexibel konkursriskestimering med logistisk spline-regression

Variansberäkningar KPI

Fyra typer av förstärkare

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

Prisuppdateringar på elementär indexnivå - jämförelser mot ett superlativt index

REGRESSIONSANALYS S0001M

Repetition DMI, m.m. Några begrepp. egenskap d. egenskap1

Orderkvantiteter i kanbansystem

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Centrala gränsvärdessatsen

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Slumpvariabler (Stokastiska variabler)

Lösningsförslag till tentamen i 732G71 Statistik B,

F10 ESTIMATION (NCT )

Att testa normalitet och heteroskedasticitet i en linjär regressionsmodell

F7 PP kap 4.1, linjära överbestämda ekvationssystem

Test av anpassning, homogenitet och oberoende med χ 2 - metod

Kontingenstabell (Korstabell) 2. Oberoende-test. Stickprov beror av slumpen. Vad vi förvf. är r oberoende: kriterier är r oberoende: kriterier

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Tentamen i Sannolikhetsteori III 13 januari 2000

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Borel-Cantellis sats och stora talens lag

KONFIDENSINTERVALL FÖR MEDIANEN (=TECKENINTERVALL )

f(x i ) Vi söker arean av det gråfärgade området ovan. Området begränsas i x-led av de två x-värdena där kurvan y = x 2 2x skär y = 0, d.v.s.

4.2.3 Normalfördelningen

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Föreläsning 10: Kombinatorik

Föreläsning G70 Statistik A

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Grundläggande matematisk statistik

Datorövning 2 Fördelningar inom säkerhetsanalys

2. Konfidensintervall för skillnaden mellan två proportioner.

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

101. och sista termen 1

Medelvärde. Repetition. Median. Standardavvikelse. Frekvens. Normerat värde. z = x x

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Datorövning 2 Fördelningar inom säkerhetsanalys

Lösningar och kommentarer till uppgifter i 1.1

TENTAMEN I REALTIDSPROCESSER OCH REGLERING TTIT62

STOCKHOLMS UNIVERSITET

a) Beräkna E (W ). (2 p)

Kap. 1. Gaser Ideala gaser. Ideal gas: För en ideal gas gäller: Allmänna gaslagen. kraft yta

Genomsnittligt sökdjup i binära sökträd

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

EKVATIONER MED KOMPLEXA TAL A) Ekvationer som innehåller både ett obekant komplext tal z och dess konjugat z B) Binomiska ekvationer.

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 26, 9/2 2011: y + ay + by = h(x)

Centrala Gränsvärdessatsen:

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Lösning till TENTAMEN

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

1. Test av anpassning.

En kvalitetskontroll - Snustillverkaren Fiedler & Lundgren kvalitetstestas Av: Andreas Timglas

Linjär Algebra. Linjära ekvationssystem. Ax = b. Viktiga begrepp. Linjära ekvationssystem. Kolumnerna i A. Exempel. R (A) spänns upp av t.ex.

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Postadress: Internet: Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Sverige.

TENTAMEN I MATEMATISK STATISTIK

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Strukturell utveckling av arbetskostnad och priser i den svenska ekonomin

Informationsåtervinning på webben Sökmotorernas framtid

Handbok i materialstyrning - Del F Prognostisering

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Egna funktioner. Vad är sin? sin är namnet på en av många inbyggda funktioner i Ada (och den återfinns i paketet Ada.Numerics.Elementary_Functions)

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Tentamen i matematisk statistik

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Föreläsning G04: Surveymetodik

En jämförande studie av GLM, Jungs metod och Tweedie-modell för premiesättning av multiplikativ tariff.

Formelblad Sannolikhetsteori 1

Transkript:

utvärderg av två olka sätt att skatta fördelge tll stckprovsmedelvärde frå olkfördelade data - ormalapproxmato kotra resamplg av Adreas Holmström xamesarbete matematsk statstk Umeå uverstet, Hadledare: Sara Söstedt-de Lua

Abstract Ths report evaluates whether ormal approxmato or resamplg s to prefer for estmatg the dstrbuto of the sample mea ad fuctos of the sample mea. The evaluato reles o smulato studes. The observatos of the sample are allowed to be dfferetly dstrbuted. I the case of sample meas they are also allowed to be depedet. For sample meas the two approxmatos behaves very smlar. The most mportat compoet whether we have a good or a bad approxmato s how good the approxmatos catch the varace of the true dstrbuto. I ths case the ormal approxmato s to prefer, because t s easer to use. For fuctos of sample meas, t s possble that the dstrbuto s very skewed. I ths case resamplg performs better tha the ormal approxmato. Ths s maly due to the fact that resamplg, but ot the ormal approxmato, ca catch the skewess of the true dstrbuto. - -

Iehållsförteckg INLDNING... 5 MODLLANTAGANDN... 7 3 NORMALAPPROIMATION FÖR OBROND OBSRVATIONR... 9 3. CNTRALA GRÄNSVÄRDSSATSN... 9 3.. CGS är observatoera har samma vätevärde och varas... 9 3.. CGS är observatoera har samma vätevärde me olka varas... 3..3 CGS är observatoera har olka vätevärde och varas... 3..3. Dfferesmetode... 3. NORMALAPPROIMATION... 3.3 KONFIDNSINTRVALL... 3 RSAMPLING.... RSAMPLINGMTODN FÖR OBROND OCH LIKAFÖRDLAD OBSRVATIONR..... Approxmato av fördelgsfuktoe... 5.. Varasskattg... 5..3 Kofdestervall... 6. RSAMPLING FÖR MDLVÄRDT AV OBROND OBSRVATIONR... 6.. Drektresamplg... 7.. Resamplg av dffereser... 8..3 Kofdestervall... 9 5 SIMULRINGSSTUDI MD OBROND OBSRVATIONR... 5. ALLMÄNT OM SIMULRINGSFÖRFARAND... 5.. xempel : Lkafördelade observatoer... 5... Smulergsresultat... 3 5... Fördelgsfuktoer... 5...3 Slutsatser... 7 5.. xempel : Asymptotskt lka vätevärde... 7 5... Smulergsresultat... 8 5... Fördelgsfuktoer... 8 5...3 Slutsatser... 3 5..3 xempel 3: Lågsamt varerade vätevärde... 3 5..3. Smulergsresultat... 3 5..3. Fördelgsfuktoer... 3 5..3.3 Slutsatser... 35 6 FUNKTIONR AV MDLVÄRDT... 36 6. MPL : LIKAFÖRDLAD OBSRVATIONR... 37 6.. Smulergsresultat... 39 6.. Fördelgsfuktoer... 6..3 Slutsatser... 3 7 RSAMPLING FÖR M-BROND OBSRVATIONR... 7. BLOCKRSAMPLING... 7. DIFFRNSMTODN FÖR BLOCKRSAMPLING... 7 7.3 KONFIDNSINTRVALL... 8 8 SIMULRINGSSTUDI MD M-BROND OBSRVATIONR... 9 8. MPL 5: OBSRVATIONR MD SAMMA VÄNTVÄRD... 9 8.. Smulergsresulat... 9 8.. Fördelgsfuktoer... 5 8..3 Slutsatser... 5 8. MPL 6: LÅNGSAMT VARIRAND VÄNTVÄRDN... 5 8.. Smulergsresulat... 5 8.. Fördelgsfuktoer... 53 8..3 Slutsatser... 55-3 -

9 DISKUSSION OCH SLUTSATSR... 56 RFRNSLISTA... 57 APPNDI A. BVIS AV SATS 3.... 58 APPNDI B. BVIS AV SATS 3.... 6 APPNDI C. BVIS AV SATS.3... 6 APPNDI D. VARIANS OCH VARIANSSKATTNINGAR TILL MPL... 6 SANN VARIANS... 6 RSAMPLINGVARIANS... 6 NORMALAPPROIMATIONSVARIANS... 6 APPNDI. MARSAGLIAS... 66 APPNDI F. KÄLLKOD FÖR MPL... 68 APPNDI G. KÄLLKOD FÖR MPL 5... 7 - -

Iledg För att kostruera ett kofdestervall tll e okäd parameter, baserad på ett stckprov av observatoer, måste v ha e puktskattg som v käer fördelge tll. Oftast vet v dock te så mycket om observatoera, kaske är de olkfördelade, mölgtvs äve beroede ssemella. V måste därför de flesta fall, om mölgt approxmera fördelge tll puktskattge, så att v åtmstoe ka kostruera approxmatva kofdestervall. I detta examesarbete har ag tagt upp och ämfört två approxmatoer som går att aväda, om puktskattge är ett stckprovsmedelvärde, ämlge ormalapproxmato och resamplg. Ia ag ärmare går på detta täker ag böra med ett exempel, för att llustrera då v har olkfördelat data och är tresserad att skatta sttet av observatoeras vätevärde med ett stckprovsmedelvärde. I väderprogoser brukar de äma hur temperature v förvätas få uder morgodage förhåller sg tll ormal temperatur, t.ex. om de lgger över eller uder ormal. För att ta fram de temperatur som ases som ormal temperatur för Umeå på exempelvs ulafto, d.v.s. de december, aväds de observerade temperature de december Umeå uder e tdgare 3-års perod, ust u tror ag det är åre 96-99. Som ormal temperatur för ulafto aväds seda medeltemperature av dessa 3 observatoer. Dessa observatoer av temperature ka ses som observatoer av stokastska varabler, som påverkas av e mägd faktorer, t.ex. om det är låg- eller högtryck, hur molgt det är och om det söar eller te. I bakgrude fs det dock e förvätad temperatur som v skulle ha om v hade dealska förhållade, vlket v aldrg har. Detta ädras äve lte gra frå år tll år, bl.a. rör världsdelara på sg lte gra, vlket gör att sole kaske te är uppe lka läge år som fol på ulafto och såt påverkar vad de förvätade temperature är. Observatoera av temperature är därför trolgtvs olkfördelade, mölgtvs ka det också fs ett vsst beroede frå år tll år. De förvätade temperature lär vsserlge te vara allt för olk mella två på varadra fölade år, me skllade mella de förvätade temperature 96 ka skla e del frå de förvätade temperature 99. De medeltemperatur de kallar ormal temperatur ka ses som e puktskattg av sttet tll de förvätade medeltemperature de december Umeå uder perode 96-99. Tyvärr har puktskattgar ackdele att om dess varas är stor, ger de osäkra resultat. Kofdestervall är därför att föredra för att skatta e okäd parameter, d.v.s. ett tervall som täcker de saa parameter med e vss saolkhet. För äve om temperature för årets ulafto lgger över sttet av de 3 observatoera, är det te säkert att de verklge lgger över de förvätade temperature. För att kostruera dessa kofdestervall måste v veta puktskattges fördelg. I praktska stuatoer har v för det mesta bara ett stckprov med observatoer att tllgå, (,,..., ), där observatoera ka ha olka vätevärde och varaser. Dessutom ka det fas beroede mella observatoera. I avstt har ag kortfattat skrvt om observatoeras egeskaper, samt tagt upp ågra atagade och kovergessatser som aväds examesarbetet. Sälla vet v frå vlka fördelgar observatoera kommer. Äve om v vsste observatoeras fördelg blr det ofta svårt att ta fram puktskattges saa fördelg. Oftast måste v därför öa oss med approxmatva kofdestervall, som tas fram geom att först approxmera fördelge tll puktskattge på lämplgt sätt, för att seda kostruera ett kofdestervall tll de saa parameter utfrå approxmatoe. Två approxmatoer som går att aväda för detta ädamål är ormalapproxmato och resamplg. Jag har detta examesarbete ämfört dessa två metoder, är det gäller att approxmera fördelge tll stckprovsmedelvärdet och fuktoer av medelvärdet. - 5 -

I de första av dessa approxmatoer aväds e ormalfördelg för att approxmera puktskattges fördelg. Dea approxmato fugerar måga fall, ty medelvärdets fördelg går oftast mot e ormalfördelg. ftersom ormalfördelge bygger på de två varablera, vätevärde och varas, måste v tll dea metod, förutom puktskattge, äve ha e bra skattg tll de saa fördelges varas. Har v bra skattgar tll dessa två parametrar och vet att de saa fördelge går mot e ormalfördelg, är dea metod väldgt lätt att aväda. Avstt 3 hadlar om hur ormalapproxmato ka avädas då observatoera är oberoede och övrgt tllåts vara olkfördelade. Resamplg å s sda är e datortesv metod, som aväder smulergar för att skatta de saa fördelge. I avstt tas grudera för dea approxmato upp, då observatoera är oberoede och lkafördelade, meda det avstt 5 tas upp hur v ka gå tllväga då observatoera dessutom tllåts vara olkfördelade. I avstt 6 har smulergar aväts för att ämföra de två approxmatoera avstt 3-5. Hur fördelgar tll fuktoer av medelvärde approxmeras, med ormalapproxmato och resamplg, tas upp avstt 7. I samma avstt ämförs äve dessa approxmatoer med de saa fördelge, va smulergar. I avstt 8 beskrvs e metod för att aväda de två approxmatoera för att approxmera fördelge tll medelvärdet, då observatoera är m-beroede. Att de är m-beroede ebär att observatoer som lgger på ett avståd mdre eller lka med m ka vara beroede, meda de som lgger på lägre avståd är oberoede. Smulergar för m-beroede observatoer har tagts upp avstt 9. I Appedx återfs bevs tll olka satser, samt källkoder tll program, som aväts tll smulergara avstt 6, 7 och 9. De är skrva programspråket Pascal. - 6 -

Modellatagade Tll att böra med har ag täkt att gå geom lte egeskaper hos observatoera, samt atagade och kovergessatser som kommer att avädas seare examesarbetet. För att göra det atar v att v har ett stckprov,,..., av observatoer och vll skatta t.ex. vätevärde eller varas tll ågo fukto av dessa. xempel på e såda fukto ka vara stckprovets medelvärde. För att lättare kua studera observatoeras beteede, har ag valt att dela upp dem e determstsk och e stokastsk del på fölade sätt, där U,,,...,, (.) beteckar vätevärdet tll och σ och [ U U ] γ för,,,...,. [ ] U U är e slumpvarabel så att [ ], Dea rapport hadlar huvudsak om att med hälp av smulergar ämföra de två skattgsmetodera, ormalapproxmato och resamplg, som verktyg för att skatta fördelge tll, där ( ) (.)., Dels tar ag upp hur v ka gå tllväga då observatoera är oberoede, vlket ebär att γ om. Jag kommer äve att skrva om hur v ka gå tllväga då de är m-beroede, vlket ebär att γ om > m. I båda falle är dock vätevärdet tll (.):s fördelge, [ ( )] ( [ ] ) [ ] ( )/. Om observatoera är oberoede är fördelges varas, V [ ( )] V [ ] V [ ] / σ /. (.3) Är de däremot m-beroede, tllkommer det kovarastermer, så att varase är, V m h [ ( )] V [ ] σ / γ /. (.) h För att utreda är resamplg och ormalapproxmato fugerar har ag dessutom avädg av fölade atagade., h U - 7 -

A : [ ] c( δ ) < δ, för ågot δ >,,,,, där c (δ ) är ågo kostat som beror avδ. Dessutom aväds fölade kovergessatser. Defto.: föld D om,,,..., av slumpvarabler sägs kovergera fördelg mot, ( x) P( x) P då, för alla x-värde där det gäller att x) P( x) F ( är kotuerlg. tt alteratvt och ekvvalet sätt att defera koverges fördelg är att om det för vare kotuerlg begräsad fukto h gäller att [ h( )] [ h( )] då. D Defto.: föld P om,,...,, av slumpvarabler sägs kovergera saolkhet mot, ( > ε ) P då för alla ε >. Defto.3: Två földer,,..., och Y, Y,..., Y av slumpvarabler sägs kovergera wa svagt mot varadra, Y om det för vare kotuerlg och begräsad fukto h gäller att, [ h( Y )] [ h( )] då. - 8 -

3 Normalapproxmato för oberoede observatoer Iom ämet statstk är ormalapproxmato e valgt förekommade metod, för att approxmera fördelge tll olka statstkor. De är lätt att aväda och ger ofta bra skattgar av fördelgar, om stckprove är tllräcklgt stora. De har dock sa begräsgar. För kråglga statstkor ka det vara svårt att ta reda på vlke ormalfördelg de asymptotskt går mot och dessutom svårt att htta skattgar tll ormalfördelgsparametrara. Är v däremot tresserad av att skatta fördelge tll ekla statstkor, som exempelvs medelvärdet, är dea metod väldgt avädbar. aa ackdel med ormalapproxmato, är att fördelge v är tresserad av att skatta ka vara sedfördelad, äve om de asymptotskt går mot e ormalfördelg. För små stckprov ka dea sedfördelg vara väldgt påtaglg. Detta sys dock te på de symmetrska ormalapproxmatoe. 3. Cetrala gräsvärdessatse Atag att v har ett stckprov,,..., av oberoede observatoer. I allmähet går det då, med cetrala gräsvärdessatse (CGS), vsa att fördelge tll medelvärdet går mot e ormalfördelg, då (se Grmmett & Strzaker, 99, sda 75). Med hälp av dea sats ska ag förklara, utfrå hur vätevärde och varas beter sg, hur v ka gå tllväga för att skatta fördelge tll (.) med ormalapproxmato. V ka seda lätt med hälp av ormalapproxmato kostruera kofdestervall tll (se avstt 3.3). 3.. CGS är observatoera har samma vätevärde och varas V börar med det eklaste fallet, då observatoera är oberoede och lkafördelade. Det medför att observatoeras vätevärde och varas ka skrvas som respektve σ σ för,,...,. Varase tll (.):s fördelg är då, σ / σ / σ. (3.) Gäller det dessutom för observatoeras varas att σ <, säger cetrala gräsvärdessatse det här fallet att, där (, σ ) D ( ) N(, σ ), N är e ormalfördelg med vätevärdet oll och varase σ. Ur approxmatossypukt behöver v därför e skattg av σ, baserad på stckprovet. I det här fallet exstera det e vätevärdesrktg såda, ämlge s ( ). Beräkar v dess vätevärde får v, - 9 -

[ ] ( ) s ( ) ( V [ ] ( [ ]) ) V [ ] ( [ ]) σ σ σ. (3.) ( ) Av och (3.) föler det att [ s ] σ. Det går äve att vsa att s är e kosstet skattg av (.3) (se Belyaev & Söstedt, 997), vlket betyder att s σ P då. Medelvärdet är dessutom e vätevärdesrktg och kosstet skattg av (se Blom,98). ormalapproxmato tll (.), baserat på stckprovet är därför N (, s ). 3.. CGS är observatoera har samma vätevärde me olka varas Om stckprovets observatoer har samma vätevärde, me olka varas, behövs det starkare krav för att fördelge tll (.) ska gå mot e ormalfördelg. tt krav v ka ställa på observatoera stckprovet, är att de ska hålla för A (se Belyaev & Söstedt, 997). Är detta krav uppfyllt säger cetrala gräsvärdessatse att, D ( ) N, σ /. V behöver därför e bra skattg av (.3), baserad på stckprovet. Aväder v för detta ädamål s föler det av (3.) och, att det är e vätevärdesrktg skattg av (.3). Det går äve vsa att det är e kosstet skattg av (.3) (se Belyaev & Söstedt, 996). Dessutom är e vätevärdesrktg och kosstet skattg av. 3..3 CGS är observatoera har olka vätevärde och varas Har observatoera stckprovet olka vätevärde och varas, ka v komma tll samma stuato som avstt 3.., geom att dra bort vätevärdet frå vare observato. På det sättet får v ya observatoer med samma vätevärde, ämlge oll. Håller dessa ya observatoer dessutom för A, vet v att det elgt cetrala gräsvärdessatse gäller att D ( )/ ( ) N, σ /. För att skatta fördelge tll (.) med ormalapproxmato, behöver v därför e bra skattg av (.3), baserad på stckprovet. Tyvärr ger s ge vätevärdesrktg skattg av (.3), eftersom - -

( ) >. Detta ebär att s tederar att överskatta de saa varase. I vssa fall kovergerar dock dea summa mot oll, då. I sådaa fall går s mot e vätevärdesrktg skattg av (.3). Det går så fall vsa att s är e kosstet skattg tll de saa varase (se Belyaev & Söstedt, 997), aat fall måste v ta tll ett kep för att få e kosstet skattg av varase (.3). Däremot är e vätevärdesrktg och kosstet skattg av. 3..3. Dfferesmetode Orsake tll att s överskattar (.3) är att våra vätevärde,, skler sg allt för mycket frå varadra. På ågot sätt vll v utfrå stckprovet skapa slumpvarabler som har ugefär samma vätevärde, me för övrgt ugefär samma egeskaper som det urspruglga stckprovet. Låt oss för det ädamålet defera -beroede slumpvarabler som dffereser på fölade sätt, Y ( )/,,,,-. Låt dessutom, där ( Y Y ) s Y, Y Y. ( ) Skler sg två på varadra fölade observatoers vätevärde te allt för mycket frå varadra, har Y,,,,- ett vätevärde som är ära oll. Med hälp av fölade defto av ett Lpschtzvllkor, ka v seda sätta krav på stckprovets observatoer, så att vätevärdet tll s kovergerar saolkhet mot (.3). Y Defto 3.: Atag att det exsterar e vätevärdesfukto ( ), så det gäller att ( / ). Vätevärdesfuktoe sägs uppfylla ett Lpschtzvllkor av ordg γ, ( < γ ) om, ( x) ( y) c x y, γ för x, y [,] och ågo postv kostat c <. Lpschtzvllkor är e sorts begräsg av hur sabbt ärlggade observatoers vätevärde får varera. Märk väl att Lpschtzvllkor förutsätter att vätevärdesfuktoe är kotuerlg. T.ex. uppfyller alla derverbara fuktoer ett Lpschtzvllkor av ordg γ. - -

Sats 3.: Atag att v har e föld av oberoede slumpvarabler,,..., som håller för A. Atag vdare att det exsterar e vätevärdesfukto ( ), som håller för ett Lpschtzvllkor. Då gäller det att Bevs: Se Appedx A. [ ] [ s ] V ( ), då. Y Ädras observatoeras vätevärde tllräcklgt lågsamt, så att de håller för ett Lpschtzvllkor, kovergerar vätevärdet tll s Y mot (.3), uder de satse gva förutsättgara. I så fall går det äve vsa att s Y är e kosstet skattg av de saa varase (se Belyaev & Söstedt, 997). V behöver dock te rktgt så starka krav på observatoeras vätevärde, för att s Y ska kovergera mot (.3), vlket v ka se fölade sats. Sats 3.: Atag att v har e föld av oberoede slumpvarabler,,...,,,..., som håller för A. Låt dessutom. Atag vdare att det exsterar e vätevärdesfukto, ( / ),,,...,, ( / ),,,..., så att både ( ) och ( ) håller för ett Lpschtzvllkor. Gäller det dessutom att < så kommer d Bevs: Se Appedx B. [ ] [ s ] V ( ), då. Y Dea sats tllåter vätvärdesfuktoe att vara dskotuerlg e pukt, bara det går att dela upp de två delar, där var och e av dem håller för ett Lpschtzvllkor. Vätevärdet tll s Y kovergerar så fall mot (.3), uder de satse gva förutsättgara. Dessutom går det att vsa att det är e kosstet skattg av (.3) (se Söstedt-de Lua, ). 3. Normalapproxmato Uder förutsättg att krave för cetrala gräsvärdessatse är uppfyllda, ka v approxmera fördelge tll (.) med e ormalfördelg. Är stckprovsstorleke tllräcklgt stor, ger dea approxmato e bra skattg av de saa fördelge. Om observatoera är oberoede och har samma vätevärdet, går det att aväda N (, s ) som e skattg av (.):s fördelg. Dea approxmato fugerar eftersom s då är e vätevärdesrktg och kosstet skattg av (.3). Samma approxmato ka v äve aväda då observatoera har olka vätevärde, på ett sådat sätt att s är e kosstet skattg av de saa varase. Har observatoera däremot tllräcklgt olka vätevärde, så att s te är ågo kosstet skattg av (.3), ger dea ormalapproxmato e dålg - -

skattg av (.):s fördelg. V ka dock geom att ersätta s med s Y få e bra skattg av fördelge tll (.), om krave atge sats 3. eller 3. är uppfyllda. Som N, s. approxmato av fördelge tll (.) får v så fall ( ) 3.3 Kofdestervall V ka u utfrå vår ormalapproxmato av fördelge tll (.) kostruera kofdestervall tll. Låt λ α betecka α -kvatle tll e ormalfördelad stokastsk varabel med vätevärde oll och varas ett, d.v.s. P ( λ α ) α. Då gäller det om N (, s ) är e bra skattg av fördelge tll (.) att, α P( λ α s ( ) λα s ) Y ( λα s / λ s / ) α P, där α α α. Som ett approxmatvt ( α) % - gt kofdestervall tll aväds därför [ λα s /, λ s / ] det här fallet. α Måste v däremot aväda (, s Y ) N för att få e bra skattg av (.):s fördelg, får v på samma sätt ett approxmatvt ( α) % - gt kofdestervall tll som [ λ α sy /, λ sy / ]. α - 3 -

Resamplg Resamplg är e smulergsmetod som aväds för att skatta okäda parametrar, är v bara har ett stckprov att tllgå, gvet e skattg av parameter, baserad på stckprovet. I och med att v ka skatta parameter, ka v äve approxmera skattges fördelgsfukto (se avstt..) och skatta dess varas (se avstt..), samt kostruera kofdestervall tll de saa parameter (se avstt..3). Metode har vuxt populartet de seaste åre, eftersom de är lätt att aväda och med datoreras frammarsch har smulergstde mskat kraftgt. fördel med resamplgmetode är bl.a. att v te behöver ata ågot om observatoeras fördelg. Har v e väldgt kråglg statstka, ka resamplgmetode dessutom vara de eda framkomlga väge för att skatta fördelgar, baserat på ett eda stckprov. De går äve att aväda stuatoer, där v med hälp av ormalapproxmato lätt ka få e bra skattg av de saa fördelge. I avstt. tar ag upp grudera för resamplgmetode, där ag förutsätter att alla observatoer är oberoede och lkafördelade.. Resamplgmetode för oberoede och lkafördelade observatoer Atag att v har ett stckprov,,..., av oberoede och lkafördelade observatoer, med gemesam fördelgsfukto F. Atag vdare att v är tresserad av att få kuskap om e parameter θ (F), som beror av fördelgsfuktoe. Om F är käd ka v oftast teoretskt beräka θ, me om de bakomlggade fuktoe är okäd ka resamplg vara e bra metod för att skatta dea parameter. ˆ θ g,,..., av θ (F). För att få e V täker oss att det exsterar e skattg ( ) uppfattg om hur bra θˆ är som skattg av θ, vll v skatta dess fördelg och varas, för att kostruera exempelvs kofdestervall tll θ. För att göra detta börar v med att approxmera fördelgsfuktoe F med emprska fördelge tll vårt stckprov, Fˆ ( x) I( x), där I är e dkatorfukto så det gäller att, om x I( x). om > x De emprska fördelge kommer då elgt stora tales lag (se Blom, 98), att gå mot de saa fördelge då. Hade observatoera stckprovet däremot te vart oberoede och lkafördelade, hade v först vart tvuga att utreda om Fˆ är e bra skattg av F. I resamplgmetode atar v att de emprska fördelge Fˆ är de saa fördelge F och smulerar utfrå de ya stckprov av storlek. Detta kommer praktke ebär att vare observato det urspruglga stckprovet tlldelas saolkhete /. tt ekvvalet sätt att uttrycka detta är att v, för att smulera fram ett resamplgstckprov, med återläggg drar observatoer frå det urspruglga stckprovet. Sätter v seda det urspruglga stckprovet fuktoe g, får v e puktskattg θˆ av θ. Med resamplgmetode smuleras seda B stycke ya stckprov av storlek fram, - -

(,,..., ),,,,B, ˆ och θ g( ),,,,B ger då ya skattgar av θ. Dessa skattgar ka v seda aväda för att t.ex. skatta fördelgsfukto G och varase tll θˆ, samt kostruera kofdestervall för θ. Märk väl att observatoera resamplgstckprove dras oberoede av varadra. ftersom de också dras ur samma stckprov hela tde, är de äve lkafördelade. Därför är ˆ θ g( ),,..., oberoede och lkafördelade varabler, gvet det urspruglga stckprovet. Dea metod kallas drektresamplg... Approxmato av fördelgsfuktoe Hade v e mägd θˆ -skattgar av θ frå olka oberoede stckprov av storlek, vore de emprska fördelge tll dessa e aturlg skattg av fördelgsfuktoe G tll θˆ. Nu har v bara ett stckprov och e θˆ -skattg av θ, me om är tllräcklgt stort borde ˆ θ,,,...,b uppföra sg ugefär som oberoede θˆ -skattgar. V aväder därför stället de emprska fördelge tll ˆ θ,,,...,, ( ˆ x) B G ˆ ( x) I B θ, för att approxmera fördelgsfuktoe G. Dea fördelg har v seda avädg av är v vll skatta varase tll θˆ och kostruera kofdestervall tll θ... Varasskattg I vssa fall, som t.ex. är fuktoe g tll θˆ är, (, ) ˆ θ g,...,, ka v om observatoera är oberoede och lkafördelade skatta V [ θˆ ] drekt frå stckprovet. Då är ämlge s e vätevärdesrktg och kosstet skattg av de saa varase. Om g är e väldgt kråglg fukto ka det vara svårt, blad omölgt, att aalytskt skatta dess varas, äve om fördelgsfuktoe F är käd. Med resamplgmetode ka v allmähet, hur tllkråglad g ä är, skatta de uta att v behöver ata ågot om fördelge tll,,,...,. Vad v gör är att v utyttar vår approxmato Ĝ av fördelgsfuktoe G, beräkar dess varas där [ ˆ] B ˆ ˆ ˆ V θ θ θ B, B B ˆ θ ˆ θ / B, B - 5 -

och aväder de som skattg av V [ θˆ ]...3 Kofdestervall Med resamplgmetode går det äve att kostruera kofdestervall tll θ. tt lätt sätt att göra det är med kvatlmetode. För att aväda dea metod låter v z α betecka α kvatle tll G. Om fördelgsfuktoe G var käd kude v lösa ut z α och z α ur ekvatoera G ( zα ) α och G ( z α ) α, där α α α. tt approxmatvt ( ) % - gt z z. Nu vet v α, α α kofdestervall tll θ är då elgt kvatlmetode ( ) tyvärr te G, uta måste stället aväda skattgeĝ. För att kostruera ett kofdestervall tll θ med hälp av approxmatoe Ĝ av G vll v skatta z α och z α med z α respektve z α, geom att lösa ut dem ur ekvatoera ˆ z G ˆ z α. Tyvärr har dessa ekvatoer ga etydga lösgar, G ( α ) och ( α ) α eftersom Ĝ är e dskret fukto. Ser v exempelvs på de första ekvatoe har v att, G ˆ B ( zα ) α B ( ˆ I θ zα ) α B ˆ I θ zα B α ( ) ( ). ftersom summa av dkatorfuktoer ger ett heltal får v ge lösg om B ( α) te är ågot heltal. Är B ( α) ett heltal får v å adra sda oädlgt måga lösgar, ty låter v och k vara heltal så att ( ˆ G θ ) α och ˆk θ är de ärmast större skattge av θ, ämfört med ˆ k θ, då gäller det att z [ ) ˆ, ˆ α θ θ är lösgar tll ekvatoe. För att få etydga lösgar ka v låta a och b vara heltal tervalle B ( α ) < a B( α ) respektve B α b < Bα, samt z z { ˆ α,,,,..., B} α θ. Lösgara tll ekvatoera G ˆ ( z ) α a / B och G ˆ ( z ) b / B α är så fall etydga. Som ett approxmatvt ( α) % - gt kofdestervall tll θ får v då elgt kvatlmetode z z. Detta ebär praktke att v ragordar våra skattgar storleksordg ( ), α α och väler z α och α ˆ θ z som det a:te respektve b:te msta värdet av. Resamplg för medelvärdet av oberoede observatoer ˆ θ,,,...,. När det gäller resamplgmetode, bygger de tll stor del på att de emprska fördelge tll ett stckprov,,...,, ska gå mot de saa fördelge, då. Om observatoera är oberoede och lkafördelade, som de var tdgare, är det lätt att se att så är fallet. Det vsar sg dock att resamplgmetode äve fugerar vssa fall, då observatoera är olkfördelade. I detta avstt kommer ag ta upp hur v utfrå olka stuatoer ka aväda resamplgmetode för att approxmera fördelge tll (.). - 6 -

.. Drektresamplg För att approxmera fördelge tll (.) med resamplgmetode, vll v på ågot sätt skapa slumpvarabler som uppför sg ugefär som (.), baserat på stckprovet,,...,. ftersom stckprovsmedelvärdet är e vätevärdesrktg och kosstet skattg av, om <, är e aturlg skattg av. Låt oss u med hälp av resamplg ta fram slumpvarabler, som uppför sg ugefär som medelvärdet av ya rktga stckprov, fastä v bara har ett eda stckprov tllgäglgt. För att ta fram sådaa, smulerar v fram B stycke resamplgstckprov av storlek, (,,..., ),,,,B, geom att med återläggg dra observatoer frå vårt urspruglga stckprov. Deras medelvärde,,,,,b, borde, om är tllräcklgt stort, uppföra sg ugefär som medelvärdet av ya rktga stckprov. mprska fördelge tll ( ),,,,B borde därför vara e bra approxmato av fördelge tll (.). Låt och V betecka vätevärdet respektve varase, med avseede på resamplgfördelge, gvet,,...,. Av vätevärdets och varases defto föler det då att, respektve, [ ( )] ( [ ] ) / ( [ ] ) / V [ ( )] [ ] V V [ ] ( ) ( / ) s V Vätevärdet tll ( ),,,,B,,,,,B. (.),,,,B är alltså oll, som v vll att det ska vara. Om är e kosstet skattg av de saa varase, går äve varase tll resamplgfördelge mot (.3). I så fall ka v approxmera fördelge tll (.) geom att resampla stckprovets observatoer, s.k. drektresamplg. Sats.: Atag att v har ett stckprov (,..., ) håller för att A. Atag vdare att ( ) / av oberoede slumpvarabler som, då. Då gäller det saolkhet, s - 7 -

wa ( ( ) ) N, σ / Bevs: Se Belyaev & Söstedt, 997.. Dea sats säger att om alltfler vätevärde : blr lka då växer, går emprska fördelge tll ( ),,,...,, om förutsättgara satse är uppfyllda, mot fördelge tll (.). Varasskattge s blr då e kosstet skattg av (.3). Dea approxmato msslyckas dock om vätevärdea e blr alltmer lka. I vssa fall ka v dock, geom att ta tll ett kep, ädå skatta fördelge tll (.) med resamplg... Resamplg av dffereser Om s te är e kosstet skattg av (.3), ka v som lkade stuato ormalapproxmatosfallet blda -beroede slumpvarabler, på fölade sätt, Y ( )/,,...,-. Utfrå dessa Y : smulerar v fram B stycke resamplgstckprov av storlek, ( Y Y Y ), Y,...,,,...,B, geom att med återläggg dra observatoer frå Y,,,...,- och beräkar seda deras medelvärde, Y /( ) Y,,...,B. Approxmerar v fördelge tll (.) med de emprska fördelge tll ( Y Y ),,,...,B, gäller det för dea fördelg att vätevärdet och varase med avseede på resamplgfördelge blr, respektve, V [ ( Y Y )] ( [ Y ] Y ) [ ( Y Y )] V [ Y ] / ) s ( Y,,,,B,,,,,B. Vätevärdet med avseede på resamplgfördelge är alltså vätevärdesrktgt. Skler sg två på varadra fölade observatoers vätevärde te allt för mycket frå varadra, så att s Y ger e kosstet skattg av (.3), är äve varase tll de emprska fördelge för ( Y Y ),,,...,B kosstet. Om så är fallet borde därför dea approxmato vara e bra skattg av fördelge tll (.). - 8 -

Sats.: Atag att v har ett stckprov (,..., ), av oberoede slumpvarabler som håller för A. Atag vdare att v har e vätevärdesfukto ( / ) och att ( ) håller för ett Lpschtzvllkor. Då gäller saolkhet att, wa ( ( Y Y ) ) N, σ / Bevs: Se Belyaev & Söstedt, 997.. Dea sats säger att om observatoeras vätevärde håller för ett Lpschtzvllkor, är de emprska fördelge tll ( Y Y ),,,...,B e bra skattg av fördelge tll (.) om krave satse är uppfyllda. Lksom lkade stuato ormalapproxmatosfallet går det äve att mska på dessa krav och tllåta e dskotutet vätevärdesfuktoe. Sats.3: Atag att v har ett stckprov (,,...,, ),..., av oberoede slumpvarabler som håller för A och låt. Atag vdare att slumpvarablera har e vätevärdesfukto, ( / ),,,...,, ( / ),,,..., så att ( ) och ( ) håller för ett Lpschtzvllkor och att d <, då gäller saolkhet att, Bevs: Se Appedx C. wa ( ( Y Y ) ) N, σ /. Sats.3 säger att om v ka dela upp vätevärdesfuktoe två delar, där båda dessa delar håller för ett Lpschtzvllkor, ka v skatta fördelge tll (.) med resamplgmetode. mprska fördelge tll ( Y Y ),,,...,B ger så fall e bra approxmato tll (.)...3 Kofdestervall För att kostruera kofdestervall tll ka v u aväda de föregåede avstt beskrva kvatlmetode. Om s är e kosstet skattg av (.3), ger de emprska fördelge tll ( ),,,...,B e bra skattg av (.):s fördelg. Som e approxmato av kvatlera tll (.):s fördelg går det så fall aväda kvatlera z α och,,,...,b. Är s däremot ge z tll de emprska fördelge för ( ) α - 9 -

kosstet skattg av (.3), me vllkore för sats. eller 5.3 är uppfyllda, låter v z stället vara kvatlera tll de emprska fördelge för ( Y Y ) α,,...,b. z α och Beroede på vlke av ovaståede stuatoer som gäller, går fördelge v valt att ta kvatlera frå, d.v.s. fördelge tll ( ) eller ( Y Y ) mot (.):s fördelg, vlket ebär att det approxmatvt gäller att, P ( z ( ) z ) P( z / z / ) α, α α α α där α α α ( α) %-gt kofdestervall tll.. V aväder därför [ z /, z ] som ett approxmatvt α / α - -

5 Smulergsstude med oberoede observatoer För att ämföra resamplgmetode med ormalapproxmato har e smulergsstude geomförts. Utfrå de beskrva stuatoera avstt 3 och smulerades ett stckprov fram, frå e käd fördelg. Baserat på detta stckprov approxmerades seda fördelge tll (.), dels med resamplg och dels med e ormalfördelg, för att seda ämföras med de saa fördelge. Att ta fram de saa fördelge tll (.) aalytskt är oftast svårt, därför tas äve de fram va smulerg, geom att smulera fram flera rktga stckprov frå de saa fördelge. För vart och ett av stckprove beräkades seda (.). mprska fördelge tll dessa gav seda fördelge tll (.). 5. Allmät om smulergsförfarade Smulergara är gorda programspråket Pascal, med Marsaglas slumptalsgeerator (för källkod se Appedx ). Det är e slumptalsgeerator, som utfrå fyra startvärde, ger olka realsergar av slumptal frå e lkformg fördelg på tervallet [,]. För att approxmera fördelge tll (.) med resamplgmetode avädes B replkat. Lka måga replkat avädes äve för att rta ormalapproxmatoes och de saa fördelges fördelgsfuktoer. De ormalfördelade slumpvarablera har geererats fram med de polära metode (se Ross, 997), e metod som smulerar fram två oberoede N(,) -fördelade varabler, och Y, elgt fölade algortm. Algortm. Geerera U och U frå e lkformg fördelg på tervallet [,].. Sätt V U och V U. 3. Sätt S V V.. Om S > gå tll. l( S) 5. Sätt C. S 6. Sätt CV och Y CV. I smulergsstudera kostruerades 95%-ga kofdestervall, elgt de sätt som beskrvts avstt 3 och, geom att aväda α α. 5. 5.. xempel : Lkafördelade observatoer I det första exemplet smulerades ett stckprov av storlek frå e expoetalfördelg med vätevärdet ett, d.v.s. xp() -fördelade slumpvarabler. För dessa slumpvarabler gäller det att både vätevärdet och varase σ är lka med ett. Detta ebär att fördelge tll (.) har vätevärde oll och varase ett, det här fallet. xpoetalfördelge är e sedfördelg, vlket ebär att äve summa av expoetalfördelade slumpvarabler ger e sedfördelg, trots att de, för stora, går mot e symmetrsk ormalfördelg. Förhoppge är att resamplgmetode ska lyckas fåga dea sedfördelg, vlket te ormalapproxmatoe gör. För att smulera fram slumpvarabler frå e expoetalfördelg utyttades versmetode, som obbar med de versa fördelgsfuktoe. Låt xp() och - -

F ( ) vara dess fördelgsfukto. Då är Y F( ) e lkformgt fördelad stokastsk varabel på tervallet [,] och F ( Y ) är e expoetalfördelad varabel. V behöver därför bara ta fram ett slumptal frå e lkformg fördelg på tervallet [,], som v får med Maraglas slumptalsgeerator och sätta det F, för att få ett slumptal frå expoetalfördelge. För e expoetalfördelg med vätevärdet gäller det att, y F( x) e / x x l( y) F ( y) l( y). ftersom observatoera stckprovet är oberoede och lkafördelade avädes s som varasskattg ormalapproxmatosfallet, ty de ger e vätevärdesrktg och kosstet skattg av (.3). För att approxmera fördelge tll (.) med resamplg avädes drektresamplg, eftersom stckprovets observatoer håller för krave sats.. När det gäller kofdestervalle tll försöker v med approxmatoera efterlka sage så mycket som mölgt. Låt z α betecka α -kvatle tll (.):s fördelg. Då blr ( z ( ) ) α α α P α zα P( z α zα / ) α, / där α α α. tt ( α) %-gt kofdestervall tll är då, [ z, z ] α / / α. För exempel går det att beräka z α exakt. Utyttar v att summa av stycke oberoede xp( ) -fördelade slumpvarabler ger e Γ(, ) -fördelad slumpvarabel, gäller det att α P zα / y / y e ( ( ) zα ) P zα / dy ( Γ ) Löser v ut z. 5 och z. 975 ur dessa ekvatoer får v elgt kvatlmetode ett 95%-gt kofdestervall tll som [ z.975 /, z. 5 / ]. För stckprovsstorlekara, och fs dessa kofdestervall tabell 5.. Tabell 5. Aalytskt 95%-gt kofdestervall elgt kvatlmetode. KFIV.835,.389.3385,.8559.59,.8636 ( ) ( ) ( ). - -

Ser v på kofdestervalle blr de kortare och mer symmetrska krg medelvärdet, desto större stckprovsstorlek v har. ftersom är e kosstet skattg av och fördelge tll 5... Smulergsresultat går mot e de symmetrska ormalfördelge är det aturlgt. För var och e av de tre stckprovsstorlekara, och, geererades 6 oberoede stckprov (för källkod se Appedx F). För vare stckprov beräkades medelvärdet och s, samt smulerades resamplgfördelges varas. Dessutom kostruerades 95% - ga kofdestervall tll med resamplg och ormalapproxmato. Resultate för dessa smulergar vsas tabell 5.. Tabell 5. Resamplgvaras, s och samt 95%-ga kofdestervall för stckprov om, och. Observatoera är xp()-fördelade, där 6 oberoede realsergar vsas för vare stckprovsstorlek. Resamplg- s KFIV för KFIV för ormal- KFIV för sa fördelg varas resamplg Approxmato.536.887.96 (.6,.337) (.639,.78) (.5695,.8).868.75969.79656 (.396,.668) (.5,.73) (.336,.56).7998.5975.5883 (.33,.9393) (.633,.356) (.359,.889).9986.975.555 (.596,.7) (.5966,.356) (.363,.398).37575.3859.7939 (.663,.9953) (.68565,.6585) (.89,.7657).69.8968.976 (.3,.85657) (.5699,.89) (.7859,.65886).6.33.978 (.6879,.369) (.68957,.39567) (.7977,.38).35.76.838 (.76638,.3) (.786,.658) (.7965,.99).85.355.7 (.336,.8633) (.7337,.3563) (.765,.99).655.6.67 (.835,.8878) (.86,.889) (.8365,.59).995.593.668 (.7763,.95) (.789,.6) (.6667,.8).99353.753.7765 (.785,.556) (.79,.6657) (.6668,.79)..53.7335 (.99,.73) (.99895,.57) (.9967,.38837).36.76.737 (.837,.6857) (.8356,.76) (.79833,.8998).695.3.38 (.86663,.33397) (.883,.3567) (.966,.333).9.6.9689 (.853,.966) (.8939,.5) (.8663,.988).8866.533.53 (.73788,.8) (.789,.3) (.67737,.69).3.977.5 (.973,.3) (.937,.388) (.93773,.3938) Ser v på smulergsresultate tabell 5. får v allmähet ågot lägre varas för resamplgmetode, ämfört med ormalapproxmatoe. Skllade blr dock mdre u större stckprovsstorlek v har. ftersom vätevärdet tll s är σ och ( ) σ / för resamplgvarase (elgt (.)), borde det också vara e vss skllad för små stckprov, e skllad som vsserlge går mot oll, då. I fråga om hur medelvärdet och varasskattgara håller sg krg det saa vätevärdet respektve varase, lgger de ärmare det saa värdet desto större stckprov v har. ftersom och s är kossteta skattgar tll respektve σ är det också aturlgt. Approxmatoeras kofdestervall är stort sett lka låga för samma stckprov, me för resamplge ågot förskuta tll väster, ämfört med ormalapproxmatoes. Dea förskutg märker v äve på kofdestervalle för de saa fördelge. Förskutge tll väster avtar dock u större stckprovsstorlek v har. Detta ka förklaras med att resamplgfördelge går mot e de saa fördelge, som s tur går mot e - 3 -

ormalfördelg. Resamplgfördelge borde därför bl mer och mer lk e ormalfördelg, desto större stckprovsstorlek v har. I övrgt är kofdestervalle för resamplg väldgt lka de saa kofdestervalle, om approxmatoera ger bra varasskattgar. Det tressata med kofdestervalle är dock hur bra de täcker de saa parameter. För dea smulergsstude täcker samtlga, för ormalapproxmato och de saa fördelge, kostruerade 95%-ga kofdestervalle tll de saa parameter. Resamplgmetode msslyckas däremot att täcka de med ett kofdestervall. 5... Fördelgsfuktoer För att få e uppfattg av hur bra resamplgmetode och ormalapproxmatoe klarar av att skatta fördelge tll (.), ämfördes äve deras fördelgsfuktoer för ågra olka. Det vsar sg att deras varas har e väldgt stor verka på hur bra approxmatoera blr. Jag har därför huvudsak valt att fokusera mg på stckprov som lyckats fåga de saa varase rätt så bra, för att se hur de fågar forme hos de saa fördelge. Jag kommer äve att vsa ågra approxmatoer som lyckas sämre med att fåga de saa varase. Kumulatv procet 5-3 - - x 3 Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de första realserge tabell 5. då. Fgur 5. vsar approxmatoera av fördelge tll (.) för de första realserge tabell 5. är stckprovstorleke är. Approxmatoera uppför sg dea realserg väldgt lka, fast resamplgfördelge fågar lte av sedfördelge som ormalapproxmatoe e klarar av. sedfördelg som dock te är allt för påtaglg. - -

Kumulatv procet 5-5 x 5 Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de sätte realserge tabell 5. då. Fgur 5. vsar de sätte realserge, elgt tabell 5., är stckprovstorleke är. För dea realserg överskattas varase reält för båda approxmatoera. Resamplgfördelge börar dock betydlgt seare och fågar bättre sedfördelge. Dessutom lgger approxmatoera för resamplge ågot ärmare de saa fördelge ä ormalapproxmatoe. Vdare ser v att för små x-värde håller sg resamplge ågot edaför ormalapproxmatoe. Förhålladet mella approxmatoera är det motsatta för x-värde ära oll för att seda för stora x-värde vara väldgt ära varadra. Kumulatv procet 5 - -3 - - x 3 Fgur 5.3 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de färde realserge tabell 5. då. - 5 -

Fgur 5.3 vsar de färde realserge, elgt tabell 5., är stckprovstorleke är. De två approxmatoera är stort sett detska och mycket lk de saa fördelge. De klarar dock te rktgt sedfördelge hos de saa fördelge. Kumulatv procet 5 - x Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de femte realserge tabell 5. då. Fgur 5. vsar de femte realserge, elgt tabell 5., är stckprovstorleke är. Dea realserg uderskattar varase tll båda approxmatoera. Därför fågar de te de saa fördelge särsklt bra. De två approxmatoera är dock stort sett detska. Kumulatv procet 5-3 - - x 3 Fgur 5.5 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de färde realserge tabell 5. då. - 6 -

Fgur 5.5 vsar de färde realserge, elgt tabell 5., då stckprovstorleke. I prcp är det ge skllad mella approxmatoera och de saa fördelge. 5...3 Slutsatser V har sett att de saa fördelge tll (.), som är sedfördelad dea stude, fort blr väldgt symmetrsk. Resamplgmetode klarar vss må att fåga dea sedfördelge, som ormalapproxmatoe helt mssar. De vktgaste kompoete för att få e bra approxmato är dock huruvda approxmatoeras varasskattgara blr bra eller e. 5.. xempel : Asymptotskt lka vätevärde Detta exempel llustrerar sats., då observatoera är olkfördelade och har olka vätevärde, me s ädå ger e kosstet skattg av de saa varase. För detta ädamål avädes ett stckprov beståede av oberoede stokastska varabler, fördelade elgt fölade, där 3 / Y / /,,,...,, (6.) Y xp( / ),,,,. 3 / För dessa observatoer gäller det att [ ] / och V [ ] /,,,, vlket ebär att σ, och V 3 / 3 / [ ( )] V [ ]. (6.) 3 6 Vätevärdet 5.3. och varase (6.) för stckprovsstorlekara, och fs tabell Tabell 5.3 Vätevärde och varas (6.) för de olka stckprovsstorlekara, och. Vätevärde Varas.739.35875.83.359,55.33835 För att med ormalapproxmato skatta fördelge tll (.) avädes s som varasskattg, eftersom de ger e kosstet skattg av de saa varase. I resamplgfallet approxmerades fördelge tll (.) med drektresamplg, ty stckprovets observatoer håller för krave sats.. - 7 -

5... Smulergsresultat För var och e av de tre stckprovsstorlekara, och, gordes 6 oberoede realsergar. För vare smulerg beräkades stckprovets medelvärde och s samt resamplgfördelges varas. Dessutom 95% - ga kofdestervall för resamplg och ormalapproxmato. Resultate för dessa smulergar vsas tabell 5.. Tabell 5. Resamplgvaras, s och samt 95%-ga kofdestervall för stckprov om, och. Observatoera är fördelade elgt (6.), där 6 oberoede realsergar vsas för vare stckprovsstorlek. Resamplg- s KFIV för KFIV för ormalapproxmatoe Varas Resamplg -..936.9763 (-.578,.373) (-.69,.9).6.5.333 (-.5875,.59) (-.597,.5969).77.783.7 (-.66,.995) (-.66,.58).3679.56867.593 (-.955,.538) (-.,.57378).673.667.7356 (-.77,.7363) (-.5586,.93)..69539.779 (.95,.7379) (.7,.798).99.5.677 (-.6,.335) (-.7,.359).83.35.358 (-.653,.935) (-.5,.337).76.3759.38685 (-.8838,.8969) (-.859,.3).35..885 (-.399,.388) (-.7,.89).66.658.783 (-.659,.558) (-.5688,.7).68.668.893 (-.88,.79) (-.387,.93) -.7.965.93 (-.373,.383) (-.38,.7).33.8.799 (-.589,.667) (-.53,.6979).98.585.56938 (.356,.33638) (.9,.3387) -.66.867.9775 (-.967,.779) (-.9373,.859).9.3898.386 (-.56,.3773) (.56,.56) -.36.583.73 (-.9536,.837) (-.97,.856) Ser v på smulergsresultate tabell 5. lkar de resultatet v fck exempel, är det gäller hur resamplg uppför sg getemot ormalapproxmato. Det gäller t.ex. för små stckprov att resamplgmetode ger e ågot lägre varas, ä motsvarade skattg för ormalapproxmatoe. Kofdestervalle är ugefär lka låga, me ågot förskuta tll väster för resamplgmetode, ämfört med motsvarade kofdestervall för ormalapproxmatoe. Det seare ka förklaras med att v båda falle obbar med expoetalfördelade slumpvarabler. I två fall för vardera approxmato msslyckas deras kofdestervall att täcka vätevärdet. Approxmatoera har dessutom svårare att skatta de saa varase, ämfört med exempel. De förvätade överskattge (se (3.)) av de saa varase är därmed svår att urskla resultatet. 5... Fördelgsfuktoer Några smulergar har äve rtats upp för att se hur bra approxmatoera lyckas med att fåga de saa fördelge. Lksom exempel vsas huvudsak plottar på approxmatoer som har lyckats fåga de saa varase ågot så är, för att se hur bra de fågar forme av de saa fördelgsfuktoe. - 8 -

Kumulatv procet 5 - - x 3 Fgur 5.6 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de färde realserge tabell 5. då. Fgur 5.6 vsar de färde realserge, elgt tabell 5., är v har stckprovstorleke. I dea realserg överskattas de saa varase ågot. Forme på approxmatoera ser dock ut ugefär som samma approxmatoer exempel, vlket trolgtvs har att göra med att v båda falle har expoetalfördelade varabler. Kumulatv procet 5 - - x Fgur 5.7 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de adra realserge tabell 5. då. - 9 -

Fgur 5.7 vsar de adra realserge, elgt tabell 5., är v har stckprovstorleke. Här är approxmatoera ästa detska med de saa fördelge, förutom att ormalapproxmatoe börar och slutar tdgare ä de saa fördelge. Kumulatv procet 5 -.5 -. -.5 -. -.5. x.5..5..5 Fgur 5.8 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de femte realserge tabell 5. då. Fgur 5.8 vsar de femte realserge, elgt tabell 5., är v har stckprovstorleke. Här ser v ge större skllad mella resamplg och ormalapproxmato, förutom lägst ut svasara, där ormalapproxmatoe börar och slutar tdgare ä resamplgfördelge och de saa fördelge. 5...3 Slutsatser Förhålladet mella resamplg och ormalapproxmatoe lkar väldgt mycket föregåede exempel, vlket ka förklaras med att v båda falle smulerar frå e expoetalfördelg. Vad som har störst verka på huruvda v får e bra eller dålg skattg har mest att göra med hur bra approxmatoera lyckas fåga de saa varase. Approxmatoera har dock ågot svårare att fåga de saa varase, ämfört med exempel. 5..3 xempel 3: Lågsamt varerade vätevärde I detta avstt llustreras sats 3. och 5.3, då v har oberoede observatoer, med e vätevärdesfukto som håller för ett Lpschtzvllkor alla pukter utom e. Stckprove smulerades frå två olka fördelgstyper, dels frå betafördelge och dels frå gammafördelge elgt fölade, Beta(, ),,...,, (6.3) Γ(, / ),,...,( ) - 3 -

där /. För dea fördelg exsterar det e vätevärdesfukto [ ] ( / ) stckprovet, där ( x) x( 9I( x.5) ). I pukte. 5 tll x är dea vätevärdesfukto dskotuerlg. Delar v däremot upp vätevärdesfuktoe två delar får v för betafördelge, ( x ) och för gammafördelge, x ( x) x. Om v t.ex. sätter γ och c, ser v att var och e av dessa delar håller för ett Lpschtzvllkor. Beräkar v det saa vätevärdet och varase tll (.) blr de, respektve 33 9, 8 V [ ( )] V [ ] 3 8 3 6 7. ( ) För stckprovsstorlekara, och vsas vätevärdet och varase tll (.) tabell 5.5. Tabell 5.5 Vätevärde, och. och sa varas tll (.) för de olka stckprovsstorlekara Vätevärde varas.375 3.5.85 3.3.75.9559 För att smulera fram de gammafördelade slumpvarablera utyttas att summa av stycke xp( / ) -fördelade slumpvarabler ger e Γ(, / ) -fördelad slumpvarabel. De betafördelade slumpvarabler smulerades fram geom att utytta sambadet att det för de två slumpvarablera Γ(,) och Y Γ(,) gäller att Y /( Y ) Beta(, ). 5..3. Smulergsresultat För var och e av de tre stckprovsstorlekara, och, gordes 6 oberoede realsergar. Stckprovets medelvärde och s samt resamplgfördelges varas beräkades för vare smulerg, elgt avstt 5.. Dessutom kostruerades 95%-ga kofdestervall för resamplg och ormalapproxmato. Resultate för dessa smulergar vsas tabell 5.6. Y - 3 -

Tabell 5.6 Resamplgvaras, s Y och samt 95%-ga kofdestervall för stckprov om, och. Observatoera är fördelade elgt (6.3), där 6 oberoede realsergar vsas för vare stckprovsstorlek. Resamplg- s KFIV för Y KFIV för ormalapproxmatoe Varas Resamplg 5.3389 5.363 5.3389 (.3875,6.6) (.557,6.7).9785.83 3.65 (.68,5.778) (.667,5.793).58 3.6695 3.7975 (3.57388,5.733) (3.5657,5.5799) 3.556 3.537 3.77 (.753,.693) (.77,.35).8393.86787.887 (3.596,.836) (3.588,.7798) 3.677.555.58 (.7959,.3758) (.575,.3579) 3.9773.3569.988 (3.588,.3) (3.577,.77) 3.738 3.5683 3.988 (3.39,.37) (3.9,.333).8.63.737 (3.333,.673) (3.33783,.68777).96 3.86 3.8786 (3.533,.76) (3.597,.73975) 3.669.863.8758 (3.58,.777) (3.77,.935) 3.8556 3.657 3.5538 (3.79,.377) (3.7953,.367) 3.975.655.5737 (3.65533,.9) (3.656,.89).3958 3.36 3.937 (3.697,.398) (3.6736,.59) 3.98989.5988.5588 (3.5763,.39) (3.58555,.393) 3.87569 5.8 5.768 (3.3857,.397) (3.59,.369).3875.63.96 (3.75998,.3) (3.7558,.3).33 3.77 3.77 (3.6,.3786) (3.6535,.) När det gäller varasskattgara lkar dessa smulergsresultat, resultate tdgare exempel. Resamplgfördelge ger ämlge ågot lägre varas ä ormalapproxmatoe. Däremot är det ge större skllad mella de kostruerade kofdestervalle för ormalapproxmato och resamplg, vlket tyder på att de saa fördelge är väldgt symmetrsk. Samtlga kofdestervall täcker dessutom de saa parameter för båda approxmatoera. Jämfört med tdgare exempel håller sg dessutom medelvärdet och varase sg ärmare vätevärdet respektve varase (.3). 5..3. Fördelgsfuktoer Äve här har ågra fördelgsfuktoer tll olka realsergar rtats upp för att se hur bra approxmatoera lyckas med att fåga forme hos de saa fördelge. Lksom exempel vsas huvudsak plottar på approxmatoer som har lyckats med detta ågot så är, för att lättare kua ämföra approxmatoera med de saa fördelgsfuktoe. - 3 -

Kumulatv procet 5-5 x 5 Fgur 5.9 Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de färde realserge tabell 5.6 då. Fgur 5.9 vsar de färde realserge, elgt tabell 5.6, är v har stckprovstorleke. De saa fördelge är det här fallet väldgt symmetrsk och väldgt lk e ormalfördelg. Approxmatoera som det här fallet lyckas fåga de saa varase väldgt bra är dessutom stort sett detska med de saa fördelge. Kumulatv procet 5-8 -6 - - x 6 8 Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de första realserge tabell 5.6 då. - 33 -

Fgur 5. vsar de första realserge, elgt tabell 5.6, är v har stckprovstorleke. I dea realserg överskattas de saa varase. Mella approxmatoera märks dock ge större skllad. Dessutom verkar forme på dem vara väldgt lk de saa fördelge. Kumulatv procet 5-5 x 5 Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de sätte realserge tabell 5.6 då. Fgur 5. vsar de sätte realserge, elgt tabell 5.6, är v har stckprovstorleke. Här uderskattar approxmatoera de saa varase ågot, me utseedet på deras fördelgsfuktoer är äve här stort sett detska. Kumulatv procet 5-5 x 5 Fgur 5. Sa fördelg tll (.) (heldrage le), resamplgapproxmatoe (streckad le) samt ormalapproxmatoe (prckad le) för de första realserge tabell 5.6 då. - 3 -

Fgur 5. vsar de första realserge, elgt tabell 5.6, är v har stckprovstorleke. Här sammafaller approxmatoera väldgt bra med de saa fördelge. 5..3.3 Slutsatser När v har ett stckprov frå dea fördelg, är fördelge tll reda för små stckprov väldgt symmetrsk. Reda vd är approxmatoeras fördelgar stort sett detska. Vad som kommer att skla hur approxmatoera förhåller sg tll de saa fördelge är stort sett bara hur bra stckprove lyckas fåga de saa varase. - 35 -

6 Fuktoer av medelvärdet I tdgare exempel avstt 5, har v sett att medelvärdets fördelg sabbt blr väldgt symmetrsk. Äve om observatoera kommer frå e extrem sedfördelg som expoetalfördelge, behövs det te allt för stort, för att de saa fördelge ska bl väldgt lk e ormalfördelg. Reda vd märks ge större skllad. I dessa fall uppför sg resamplg och ormalapproxmatoe väldgt lka. Det fs dock stuatoer där både resamplg och ormalapproxmatoer fugerar, me resamplgmetode är betydlgt bättre för små stckprov. Sats 6.: Atag att, wa ( ) N, σ /. (6.) Låt g vara e kotuerlg derverbar fukto, där g ( ) wa ( g( ) g( )) N, g ( ) ( ) /. Då föler det att σ. (6.) Är dessutom vllkore för sats. uppfyllda gäller det saolkhet att, wa ( ( g( ) g( ) ) ( g( ) g( )) Bevsskss: Om v har e fukto g ( ) och Taylorutvecklar de krg får v, g ( ) g( ) ( ) g ( ) R, där R är e restterm. Dea restterm kovergerar saolkhet mot oll om P ( ), vlket är fallet uder de satse gva förutsättgara. V får då att g g g. Detta ebär att fördelge tll ( ( ) ( )) ( ) ( ) ( g( ) g( )) får vätevärdet, och varase, [ ( g( ) g( ))] g ( ) [ ] V [ ( g( ) g( ))] ( g ( )) V [ ] g ( ). ( ) σ /. Frå (6.) bör v då rmlge kua tro att (6.) håller. Geom att Taylorutveckla g( ) krg och ata att restterme är försumbar och därför sätta de tll oll, blr ( g( ) g( ) ( ) g ( ) och vätevärdet med avseede på resamplgfördelge, - 36 -