Felfortplantningsformlerna

Relevanta dokument
SF1901: Medelfel, felfortplantning

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

MVE051/MSG Föreläsning 7

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Grundläggande matematisk statistik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

F9 SAMPLINGFÖRDELNINGAR (NCT

Samplingfördelningar 1

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

4 Diskret stokastisk variabel

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 4: Konfidensintervall (forts.)

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik KTH. Formelsamling i matematisk statistik

Kurssammanfattning MVE055

Föreläsning 8, Matematisk statistik Π + E

SF1901 Sannolikhetsteori och statistik I

Några extra övningsuppgifter i Statistisk teori

Föreläsning 7: Punktskattningar

Demonstration av laboration 2, SF1901

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Transformer i sannolikhetsteori

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

0 om x < 0, F X (x) = c x. 1 om x 2.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Konvergens och Kontinuitet

SF1901 Sannolikhetsteori och statistik I

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsningsanteckningar till kapitel 8, del 2

TMS136. Föreläsning 4

Konvergens för iterativa metoder

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning 11: Mer om jämförelser och inferens

Kap 3: Diskreta fördelningar

Övning 1 Sannolikhetsteorins grunder

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

TAMS79: Föreläsning 6. Normalfördelning

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

9. Konfidensintervall vid normalfördelning

Föreläsning 7. Statistikens grunder.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Föreläsning 12: Regression

SF1911: Statistik för bioteknik

Tentamen LMA 200 Matematisk statistik,

MVE051/MSG Föreläsning 14

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik TMS064/TMS063 Tentamen

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen MVE301 Sannolikhet, statistik och risk

Härledning av Black-Littermans formel mha allmänna linjära modellen

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Bengt Ringnér. October 30, 2006

Föreläsning 8 för TNIU23 Integraler och statistik

Föreläsning 6, FMSF45 Linjärkombinationer

Formel- och tabellsamling i matematisk statistik

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Jörgen Säve-Söderbergh

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Föreläsning 7: Punktskattningar

Tentamen MVE301 Sannolikhet, statistik och risk

Kapitel 9 Egenskaper hos punktskattare

SF1625 Envariabelanalys Lösningsförslag till tentamen

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

F9 Konfidensintervall

TMS136. Föreläsning 7

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Lärmål Sannolikhet, statistik och risk 2015

Maclaurins och Taylors formler. Standardutvecklingar (fortsättning), entydighet, numerisk beräkning av vissa uttryck, beräkning

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

FACIT: Tentamen L9MA30, LGMA30

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Transkript:

Matematisk statistik Stockholms universitet Felfortplantningsformlerna Esbjörn Ohlsson Kompendium September 1993 Uppdaterat januari 2005

Postadress: Matematisk statistik Matematiska institutionen Stockholms universitet 106 91 Stockholm Sverige Internet: http://www.math.su.se/matstat

Matematisk statistik Stockholms universitet Kompendium 1997 http://www.math.su.se/matstat Felfortplantningsformlerna Esbjörn Ohlsson September 1993 Uppdaterat januari 2005 Förord Avsnitt 1-4 i detta kompendium är avsedda som en komplettering till kursboken Ross (2002) för grundkursen Sannolikhetsteori I. Det något mer teoretiska avsnitt 5 är skrivet för kursen Statistisk Inferensteori II. Första versionen av kompendiet skrevs 1993. I den uppdaterade versionen 2005 har referenserna förnyats och layouten förhoppningsvis förbättrats. Stockholm i januari 2005 Esbjörn Ohlsson Innehåll 1 Introduktion 2 2 Funktioner av en stokastisk variabel 3 3 Funktioner av flera stokastiska variabler 5 4 Approximation av fördelningen 6 5 Asymptotiska resultat 7 6 Övningar 11 7 Facit 13 E-post: esbj@math.su.se. Postadress: Matematisk Statistik, Stockholms Universitet, 106 91 Stockholm.

1 INTRODUKTION 2 1 Introduktion För många funktioner av stokastiska variabler kan det vara svårt att bestämma väntevärde och varians exakt. I sådana fall kan man dock ofta göra en approximativ beräkning med hjälp av de så kallade felfortplantningsformlerna, som presenteras på följande sidor. Vi inleder med ett exempel. Exempel 1.1 (Omsättning i livsmedelshandeln) En undersökning av den totala omsättningen i livsmedelshandeln 1987 baserad på ett slumpmässigt urval av butiker gav resultatet 74 mkr. När undersökningen upprepades 1988 (med ett nytt urval) blev resultatet 83 mkr. Dessa värden kan betraktas som utfall av oberoende stokastiska variabler X respektive Y. Låt µ 1 vara den verkliga omsättningen 1987 och µ 2 densamma 1988. Enligt uppgift förelåg inga systematiska fel i undersökningen, dvs E [X] = µ 1 och E [Y ] = µ 2. Vidare angavs standardavvikelsen till 2.8 mkr för X och 3.1 mkr för Y, dvs Var(X) = 2.8 2 och Var(Y ) = 3.1 2. Det är i denna typ av tillämpning vanligt att studera förändringen i omsättning (från 1987 till 1988). Den absoluta förändringen µ 2 µ 1 uppskattas naturligtvis med 83 74 = 9 mkr, som är en observation av Y X. Vad vet vi om det systematiska och slumpmässiga felet i denna uppskattning? Enligt våra räkneregler för väntevärde och varians för summor av stokastiska variabler (återgivna nedan som formel 3.2 och 3.3 ) gäller E [Y X] = E [Y ] E [X] = µ 2 µ 1 (1.1) Var(Y X) = Var(Y ) + Var(X) = 4.2 2 (1.2) Observera att vi här antagit att X och Y kan betraktas som oberoende (pga oberoende urval) så att Cov(X, Y ) = 0. Antag nu att vi i stället är intresserade av förändringen uttryckt som kvoten µ 2 /µ 1, vilket i praktiken är väl så vanligt som att studera den absoluta förändringen. Kvoten skattas med 83/74 = 1.12, som är en observation av Y/X. Vi skulle i detta fall, analogt till (1.1) och (1.2), vilja beräkna [ ] Y E X ( ) Y Var X (1.3) (1.4)

2 FUNKTIONER AV EN STOKASTISK VARIABEL 3 Hur kan vi klara detta? Dessvärre går det inte att skriva upp några allmänna formler som uttrycker väntevärde och varians för en kvot i termer av samma storheter för de enskilda variablerna. Därmed kan vi inte lösa problemen i (1.3) och (1.4) på samma enkla sätt som i (1.1) och (1.2). Det är naturligtvis mycket otillfredsställande att inte kunna beräkna väntevärde och varians för en så enkel funktion av två stokastiska variabler som en kvot. Tyvärr uppstår samma problem för nästan alla icke-linjära funktioner av stokastiska variabler. I många fall kan man dock lösa detta problem approximativt genom att använda de så kallade felfortplantningsformlerna, vilka presenteras nedan. Om vi hade känt sannolikhetsfördelningen för X och Y, kunde vi i princip ha klarat beräkningarna i (1.3) och (1.4) (hur?). Ibland kan dock sådana beräkningar bli ganska besvärliga; man kan även då ha nytta av de approximativa formlerna nedan. 2 Funktioner av en stokastisk variabel Låt g(x) vara en funktion av en stokastisk variabel X. Om g(x) är en linjär funktion av x, g(x) = ax+b för några konstanter a och b, så gäller (Ross, Corollary 5.1 sid 143 resp. formel på sidan 145) E [ax + b] = a E [X] + b (2.1) Var(aX + b) = a 2 Var(X) (2.2) Även när g(x) är icke-linjär kan det hända att den kan approximeras någorlunda väl med en linjär funktion, åtminstone i något intervall på x-axeln. Låt oss därför Taylor-utveckla g(x) kring µ = E [X] i ett intervall där X har (nästan) hela sin sannolikhetsmassa: g(x) = g(µ) + (x µ)g (µ) + R(x) där R(x) är resttermen. Antag nu att R(x) kan försummas för de aktuella x-värdena. Då får vi g(x) g(µ) + (X µ)g (µ) (2.3) med sannolikhet (nästan) 1. Ur denna formel får vi, med användande av formlerna (2.1) och (2.2), nu

2 FUNKTIONER AV EN STOKASTISK VARIABEL 4 Felfortplantningsformlerna för en funktion av en stokastisk variabel. Med µ = E [X] gäller E [g(x)] g(µ) (2.4) Var(g(X)) Var(X) [g (µ)] 2 (2.5) Dessa formler kallas ibland även Gauss approximationsformler. I avsnitt 3 skall vi antyda hur formlerna kan ges en mer strikt motivering med hjälp av ett asymptotiskt resultat. Vi nöjer oss här med att konstatera att från resonemanget kring (2.3) följer att approximationerna bör bli hyfsade om g(x) är ungefär linjär i ett intervall kring, dit (nästan) hela sannolikhetsfördelningen för X är koncentrerad. Figur 1 och nedanstående anmärkning antyder att approximationen bör bli bättre ju mer koncentrerad sannolikhetsfördelningen för X är kring µ. y y = g(x) f(x) Figur 1: Approximationen blir bra om fördelningen för X är koncentrerad till ett område där g(x) är ungefär linjär. x Anmärkning: Här följer ett exempel på en situation där vi kan ange en enkel uppskattning av felet i approximationen (2.4). Låt I vara ett intervall dit hela sannolikhetsmassan för X är koncentrerad (eventuellt är I hela reela axeln). Antag att funktionen g har kontinuerlig förstaoch andraderivata på I. Då har vi följande välkända utseende på resttermen: R(x) = (x µ) 2 g (z)/2, där z ligger mellan µ och x. Antag vidare att beloppet av g:s andraderivata, g, är begränsat av en konstant C på I. Då begränsas absolutbeloppet av felet i approximationen (2.4) av C Var(X)/2. Att g(x) är ungefär linjär betyder att C kan väljas liten. Om nu även Var(X) är liten, kommer approximationen att vara god.

3 FUNKTIONER AV FLERA STOKASTISKA VARIABLER 5 Exempel 2.1 Låt Y = 1/X. Då ger felfortplantningsformlerna E [Y ] 1 E [X] (2.6) Var(Y ) Var(X) (E [X]) 4 (2.7) Approximationen bör vara god om ligger långt ifrån 0 och Var(X) är liten relativt E [X]. Felfortplantningsformlerna måste tillämpas med stor försiktighet, vilket följande exempel understryker. Exempel 2.2 Låt g(x) = x 2. Då ger (2.3) E [ X 2] µ 2 = (E [X]) 2 varur vi felaktigt skulle kunna dra slutsatsen att Var(X) 0 för alla stokastiska variabler! 3 Funktioner av flera stokastiska variabler Låt g(x 1, X 2,..., X n ) vara en funktion av de n stokastiska variablerna X 1, X 2,..., X n. Antag först att g är linjär, dvs n g(x 1, X 2,..., X n ) = c i X i (3.1) för några konstanter c 1, c 2,..., c n. Då får vi, med hjälp av Ross formel (2.2) sid 307 och (3.1) sid 323, samt (2.1) och (2.2) ovan, de välkända räknereglerna [ n ] n E c i X i = c i E [X i ] (3.2) i=1 ( n ) Var c i X i = i=1 n c 2 i Var(X i ) + 2 i=1 i=1 i=1 i=1 j=i+1 n n c i c j Cov(X i, X j ) (3.3) Låt nu g vara en godtycklig funktion som är approximativt linjär i ett område där (X 1, X 2,..., X n ) lägger huvuddelen av sin sannolikhetsmassa. Med hjälp av en Taylor-utveckling kring vektorn av väntevärden µ = (µ 1, µ 2,..., µ n ) för X 1, X 2,..., X n och med samma typ av resonemang som i avsnitt 2 får vi

4 APPROXIMATION AV FÖRDELNINGEN 6 Felfortplantningsformlerna för en funktion av flera stokastiska variabler. E [g(x 1, X 2,..., X n )] g(µ 1, µ 2,..., µ n ) (3.4) n Var(g(X 1, X 2,..., X n )) Var(X i ) ( g i(µ) ) n n 2 + 2 Cov(X i, X j )g i(µ)g j(µ) i=1 i=1 j=i+1 (3.5) Här betyder g i(µ) den partiella förstaderivatan av g med avseende på argument i (dvs på x i ), evaluerad i punkten µ = (µ 1, µ 2,..., µ n ). Om X 1, X 2,..., X n är oberoende förenklas variansformeln (3.5) till n Var(g(X 1, X 2,..., X n )) Var(X i ) ( g i(µ) ) 2 (3.6) i=1 Exempel 3.1 (Omsättning i livsmedelshandeln, forts.) Vi kan nu använda formel (3.4) och (3.6) till att ge approximativa svar på frågorna i (1.3) och (1.4). Eftersom funktionen g(x, y) = y/x har partiella derivator y/x 2 respektive 1/x får vi [ ] Y E µ 2 (3.7) X µ 1 ( ) Y Var Var(X) µ2 2 + Var(Y ) 1 (3.8) X µ 4 1 µ 2 1 Ekvation (3.7) visar att vi (approximativt) inte har något systematiskt fel i vår uppskattning av den relativa omsättningsförändringen. Om vi gör den ytterligare approximationen att vi ersätter µ 1 och µ 2 med 74, respektive 83 i (3.8) kan vi uppskatta variansen till 0.060 2. 4 Approximation av fördelningen Låt oss återvända till formel (2.3). Från denna följer givetvis att g(x) är approximativt fördelad som det linjära uttrycket i högerledet. Ofta kan det vara betydligt enklare att härleda sannolikhetsfördelningen för högerledet än för g(x) direkt. Om till exempel X är normalfördelad, så är högerledet i (2.3) också det (Ross sid 201). Härav följer att g(x) är approximativt normalfördelad, med väntevärde och varians givna av (2.4) och (2.5). Även när X endast är approximativt normalfördelad, följer med samma resonemang som ovan att g(x) också är

5 ASYMPTOTISKA RESULTAT 7 det. Detta är ett mycket användbart resultat, bland annat inom statistikteorin där man ofta arbetar med (approximativt) normalfördelade storheter. Även detta resultat kan utvidgas till funktioner av flera stokastiska variabler. 5 Asymptotiska resultat Detta avsnitt förutsätter kunskaper i sannolikhetsteori på fortsättningsnivå, motsvarande Gut (1995). I bevisen kommer vi att behöva ett antal standardsatser om konvergens från sannolikhetsteorin. Dessa hämtar vi från Guts kapitel VI. Härledningen av (2.4), (2.5), (3.4) och (3.5) ovan var tämligen heuristisk. Kan dessa formler ges ett stringent rättfärdigande? En idé som ligger nära till hands är att söka användbara resttermsuppskattningar, såsom i anmärkningen på sidan 4. Detta är i praktiken ett svårlöst problem; vi kommer också att se i exempel 5.1 nedan att resttermen inte nödvändigtvis är det lämpligaste sättet att bedöma felfortplantningsformlernas tillämplighet. Den matematiska statistikens vanligaste metod för att motivera approximationer är asymptotiska resultat, såsom till exempel centrala gränsvärdessatsen. Vi följer här den vägen och börjar med det en-dimensionella fallet. Låt {X n ; n = 1, 2,... } vara en följd av stokastiska variabler som är asymptotiskt normalfördelad med asymptotiskt väntevärde µ och asymptotisk varians σ 2 /n, dvs n(xn µ) d N(0, σ 2 ) då n (5.1) Det kanske viktigaste exemplet på en sådan följd är när X n är medelvärdet X av n stycken oberoende likafördelade stokastiska variabler. Sats 5.1 Låt X n uppfylla (5.1). Låt g(x) vara en deriverbar funktion vars derivata är kontinuerlig i µ och skild från 0 där. Då gäller n (g(xn ) g(µ)) d N(0, [g (µ)] 2 σ 2 ) då n (5.2) Vår tolkning av (5.2) är att när n är stort är g(x n ) approximativt normalfördelad med väntevärde och varians som ges av felfortplantningsformlerna (2.4) och (2.5) och Var(X n ) σ 2 /n.

5 ASYMPTOTISKA RESULTAT 8 Bevis. Från den matematiska analysens medelvärdessats följer att vi, för varje x, hitta ett tal ξ sådant att ξ µ x µ och g(x) g(µ) = g (ξ)(x µ) (5.3) Således kan vi finna en stokastisk variabel Z n sådan att Z n µ X n µ och g(x n ) g(µ) = g (Z n )(X n µ) (5.4) Ur (5.1) och Slutsky s sats (Gut, Theorem 7.5 sid 180) följer att X n µ = 1 d n (Xn µ) 0 N(0, σ 2 ) = 0 (5.5) n p µ (Gut, Theorem 3.2). Eftersom Z n µ X n µ får vi också Z n varur X n g :s kontinuitet i µ ger nu (Gut, Theorem 7.7) g (Z n ) p µ. p g (µ) (5.6) Multiplicera nu båda leden i (5.4) med n och använd Slutsky s sats i kombination med (5.1) och (5.6) på högerledet. Resultatet blir (5.2). Exempel 5.1 Låt X 1, X 2,..., X n vara ett stickprov från en Poissonfördelning med väntevärde λ. Säg att vi vill skatta τ = g(λ) = 1/λ till exempel tiden mellan ankomster i en Poissonprocess). ML-skattningen av τ är ˆτ = 1/X. Vi söker dess asymptotiska fördelning, väntevärde och varians. Sats 5.1 ger att (detaljerna lämnas åt läsaren) d n (ˆτ 1/λ) N(0, 1/λ 3 ) då n (5.7) Egentligen är inte Sats 5.1 tillämpbar eftersom g(x) inte existerar i x = 0 och X antar värdet 0 med positiv sannolikhet. Den sistnämnda sannolikheten är dock endast e nλ och ne nλ 0 då n. Vi kan därför tillämpa vår sats på en modifiering av ˆτ som är satt till 0 så snart X är noll. (5.6) håller då trots allt. Slutsatsen är att ˆτ är asymptotiskt väntevärdesriktig (i ovanstående mening) med asymptotisk varians 1/(nλ 3 ). Det är å andra sidan uppenbart att E [ˆτ] = för alla n. Detta exempel illustrerar därmed finessen med att definiera asymptotiskt väntevärde som väntevärdet i den asymptotiska fördelningen snarare än som gränsvärdet av väntevärdena. Observera att resttermen i approximationen (2.4) här är oändlig.

5 ASYMPTOTISKA RESULTAT 9 Vid statistiska tillämpningar av Sats 5.1 uppstår vanligen problemet att den asymptotiska variansen beror på en eller flera okända parametrar θ. Följande sats anvisar en lösning i det en-parametriga fallet. För enkelhets skull inskränker vi oss till fallet när T n är en asymptotiskt väntevärdesriktig (följd av) skattning(ar) av θ och vi har d n (Tn θ) N(0, σ 2 (θ)) då n (5.8) Sats 5.2 Låt T n uppfylla (5.8). Låt g(x) vara en deriverbar funktion vars derivata är kontinuerlig i θ och skild från 0 där. Antag att även funktionen σ 2 (x) är kontinuerlig i θ. Då gäller n (g(tn ) g(θ)) d N(0, 1) då n (5.9) g (T n ) σ(t n ) Tolkningen av (5.9) är att vi för stora n kan räkna som om estimatorn g(t n ) av parametern g(θ) är normalfördelad med väntevärde och varians enligt felfortplantningsformeln där θ ersatts med T n i uttrycket för den asymptotiska variansen. Bevis. Enligt sats 5.1 har vi n (g(tn ) g(θ)) g (θ) σ(θ) d N(0, 1) då n (5.10) Av kontinuitetsantagandena och Slutsky s sats följer (Gut, Theorem 3.2, 7.5 och 7.7) g (T n ) σ(t n ) g (θ) σ(θ) p 1 (5.11) Genom att dividera (5.10) med (5.11) och ännu en gång använda Slutsky s sats får vi (5.9). Sats 5.1 och 5.2 kan generaliseras till det flerdimensionella fallet svarande mot avsnitt 3 ovan, där g är en funktion av en vektor av stokastiska variabler. Förutsättningarna är att g är deriverbar i alla argument och att den asymptotiska varians man får med felfortplantningsformlerna inte är 0. Den intresserade läsaren hänvisas till Rao (1973) sid 387, vari även ges en version med g vektorvärd. Ett exempel på normalfördelningsapproximation av en funktion av flera normalfördelade variabler ges i Sundberg (1997) sid 79 (kalibrering). Även i denna tillämpning saknar funktionen (ändligt) väntevärde. Observera att även med ett asymptotiskt resultat i ryggen blir det en bedömningsfråga att avgöra när approximationen kan användas i en konkret tillämpning. En diskussion om noggrannheten i approximationerna i konkreta fall ges i Ku (1966). Från denna rapport hämtar vi också vår avslutande kommentar.

The most important conclusion is that the classical propagation formula is much better than seems to be usually realized. Examples indicate that it is likely to suffice for most work. (John W. Tukey) Referenser [1] Gut, A.,(1995), An Intermediate Course in Probability Theory, Springer-Verlag [2] Ku, H. H.,(1966), Notes on the Use of Propagation of Error Formulas, Journal of Research of the National Bureau of Standards, Vol 70C, No. 4 [3] Ross, S.,(2002), A First Course in Probability, 6 Edition, Prentice Hall [4] Sundberg, R.,(1984), Kompendium i Tillämpad Matematisk Statistik, KTH En elementär framställning, som influerat avsnitt 1-3 ovan, ges i [5] Blom, G.,(1980), Sannolikhetsteori och statistikteori med tillämpningar (Bok C), Tredje upplagan, Studentlitteratur, Lund

6 ÖVNINGAR 11 6 Övningar Avsnitt 1-4 Låt oss först påminna om att standardavvikelsen är kvadratroten ur variansen. Uppgifter märkta (KTH) är hämtade ur någon av de problemsamlingar som förekommer vid KTH. F1. (KTH) En kemist beräknar volymen av sfäriska bubblor genom att mäta bubblornas diameter d på en fotografisk plåt och tillämpa formeln v = πd 3 /6. Mätningen av en diameter är behäftad med osäkerhet och kan betraktas som en observation av en stokastisk variabel med väntevärde d och standardavvikelse 0.02 mm. För en viss bubbla blev diametervärdet d = 1.80 mm varur v = 3.05 mm 3. Bestäm approximativt väntevärde och standardavvikelse för volymsbestämningen. F2. Om en lösning har vätejonkoncentration x, så definieras ph-värdet som 10 log(x). Antag att en viss vätska har ph-värdet p och att detta kan bestämmas med ett mätfel som har standardavvikelse σ. Ange approximativa formler för väntevärde och standardavvikelse för motsvarande bestämning av vätejonkoncentrationen. F3. a) Visa att (2.4) och (2.5) reduceras till (2.1) och (2.2) då g(x) = ax + b för några konstanter a och b. Följaktligen är approximationen exakt i detta fall. b) Visa att (3.4) och (3.5) reduceras till (3.2) och (3.3) då g är linjär, dvs (3.1) gäller. Slutsatsen blir även här att approximationen är exakt. F4. Den kontinuerliga stokastiska variabeln X är likformigt fördelad på intervallet (a, b), där a = 1 ɛ och b = 1 + ɛ för någon konstant ɛ, 0 < ɛ < 1. Sätt Y=1/X. a) Bestäm E [Y ], dels exakt, dels med felfortplantningsformeln. Hur stort blir det relativa felet i approximationen om ɛ är: 0.50, 0.25, 0.10 respektive 0.05? b) För ɛ = 0.10, bestäm Var(Y ) dels exakt, dels med felfortplantningsformeln och jämför resultaten. F5. Upprepa beräkningarna för Y X och Y/X i exempel 1.1 i texten, men nu under antagande att de båda undersökningarna byggde på delvis samma urval, så att Cov(X, Y ) = 3.0 (säg). F6. (KTH) I en serie försök uppmättes svängningstiden t för en pendel samt pendelns längd l. Mätningarna kan ses som observationer av stokastiska variabler med väntevärden lika

6 ÖVNINGAR 12 med de verkliga värdena på t och l. I ett försök uppmättes t = 2.0084 och l = 1.0031. Vidare vet man från lång erfarenhet att standardavvikelserna för dessa bestämningar är 2.0084 respektive 0.00043. Mätningarna kan betraktas som oberoende. Efter försöket beräknades en skattning av tyngdaccelerationen g enligt formeln g = 4π2 l t 2 Ge approximativa formler för väntevärde och standardavvikelse för bestämningen av g, uttryckt i t och l. Vad säger oss väntevärdesformeln? Ge också ett numeriskt närmevärde för standardavvikelsen. F7. Man kastar två symmetriska mynt. Låt X anta värdet 1 om det första myntet visar krona, 2 om det visar klave. Låt Y anta samma värden för det andra myntet. a) Beräkna E [Y/X] exakt och jämför med vad (3.4) ger. Upprepa beräkningen då värdena som variablerna antar är 11 och 12, samt när de är 1/2 och 1. Slutsats? b) Upprepa beräkningarna i a, men nu för Var(Y/X). F8. Variationskoefficienten R(X) för en stokastisk variabel X definieras som standardavvikelsen delat med väntevärdet. Använd felfortplantningsformlerna till att visa att om X och Y är oberoende och a) Z = X Y b) Z = X/Y Avsnitt 5 F9. (Från tentamen juni 1993.) Låt X 1, X 2,..., X n vara ett stickprov ("iid", sample") från en exponentialfördelning med väntevärde 1/λ där λ är en okänd parameter som är strikt positiv och n är stort. Man ville skatta γ = λ = 1 λ+1 1+1/λ. En naturligskattning av n i=1 e X i. γ är ˆγ 1 = 1. En alternativ, väntevärdesriktig, skattning ges av ˆγ 1+X 2 = 1 n Man kan nu fråga sig vilken av dessa båda skattningar som bör väljas. Eftersom det är besvärligt att bestämma väntevärde och varians för ˆγ 1 bestämde man sig för att avgöra frågan utifrån estimatorernas asymptotiska egenskaper. Visa att båda estimatorerna är asymptotiskt normalfördelade och är asymptotiskt väntevärdesriktiga. Bestäm den asymptotiska effektiviteten e av ˆγ 1 relativt ˆγ 2. Avgör vilken estimator som är att föredra i termer av e. Undersök estimatorvalets betydelse för effektiviteten för små respektive stora λ genom att se vad som händer med e när λ 0 respektive λ.

7 FACIT 13 7 Facit F1) σ 0.01πd 2 F2) E [X] 10 p σ X σ log(10) 10 p F4) (a) Exakt: E [Y ] = log((1+ɛ)/(1 ɛ)) 2ɛ Approx: E [Y ] = 1 F5) Det relativa felet blir ungefär 9.0% (ɛ = 0.50), 2.1% (ɛ = 0.25), 0.3% (ɛ = 0.10), respektive 0.1% (ɛ = 0.05). (b) Exakt: Var(Y ) 3.383 10 3 F6) E [g] 4π2 l t 2 Approx: Var(Y ) 3.333 10 3 E [Y X] = µ 2 µ 1 Var(Y X) = 11.45 E [Y/X] µ 2 µ 1 Var(Y/X) (7.84µ2 2 + 9.61µ 2 1 6µ 1 µ 2 ) µ 4 1 Var(g) Var(l) 16π4 t 4 + Var(t) 64π4 l 2 t 6 (σ g 19.64) F7) (a) Om X, Y antar värdena 1, 2: Exakt: E [Y/X] = 9/8 = 1.125 Approx: E [Y/X] 1 Om X, Y antar värdena 11, 12: Exakt: E [Y/X] = 529/528 1.0019 Approx: E [Y/X] 1 Om X, Y antar värdena 0.5, 1: Exakt: E [Y/X] = 9/8 = 1.125 Approx: E [Y/X] 1 (b) Om X, Y antar värdena 1, 2: Exakt: Var(Y/X) = 19/64 0.297 Approx: Var(Y/X) = 2/9 0.222 Om X, Y antar värdena 11,12: Exakt: Var(Y/X) 0.003799

7 FACIT 14 Approx: Var(Y/X) 0.003781 Om X, Y antar värdena 0.5, 1: Exakt: Var(Y/X) = 19/64 0.297 Approx: Var(Y/X) = 2/9 0.222 F9) e = 1+2/λ+1/λ2 1+2/λ > 1 ˆγ 1 är bättre. e { då λ 0 1 då λ