Id: statistik.tex :48:29Z joa

Relevanta dokument
Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Föreläsning 2: Punktskattningar

Grundläggande matematisk statistik

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Introduktion till statistik för statsvetare

Föreläsning G04: Surveymetodik

Datorövning 2 Fördelningar inom säkerhetsanalys

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

F10 ESTIMATION (NCT )

θx θ 1 om 0 x 1 f(x) = 0 annars

a) Beräkna E (W ). (2 p)

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

4.2.3 Normalfördelningen

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Datorövning 2 Fördelningar inom säkerhetsanalys

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

TMS136: Dataanalys och statistik Tentamen med lösningar

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

1. Test av anpassning.

2. Konfidensintervall för skillnaden mellan två proportioner.

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Formelblad Sannolikhetsteori 1

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

SAMMANFATTNING TAMS65

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Föreläsning G70 Statistik A

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Matematisk statistik TMS063 Tentamen

S0005M V18, Föreläsning 10

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR CDEFI, NANO OCH PI, MAS233, 2004 FMS 012, FMS 022, FMS 121 OCH MAS233

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Avd. Matematisk statistik

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Borel-Cantellis sats och stora talens lag

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

================================================

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

2 Intervallskattning Konfidensintervall för µ i normalfördelningen... 14

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

101. och sista termen 1

Matematisk statistik

Tentamen i matematisk statistik

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Tentamen i Sannolikhetsteori III 13 januari 2000

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

TENTAMEN I MATEMATISK STATISTIK

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Stokastiska variabler

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

b 1 och har för olika värden på den reella konstanten a.

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Lösningar och kommentarer till uppgifter i 1.1

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

TAMS15: SS1 Markovprocesser

Kompletterande kurslitteratur om serier

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Matematisk statistik KTH. Formelsamling i matematisk statistik

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Tentamen i Flervariabelanalys F/TM, MVE035

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Transkript:

UTDRAG UR FÖRELÄSNINGSANTECKNINGAR I STATISTIKTEORI PUNKT- OCH INTERVALLSKATTNINGAR SAMT HYPOTESTEST MATEMATISK STATISTIK AK FÖR F, E, D, I, C, È; FMS 012 JOAKIM LÜBECK, SEPTEMBER 2008 Iehåll 1 Puktskattigar och deras egeskaper 2 1.1 Grudläggade begrepp................................... 2 1.2 Modell för mätig med slumpmässigt fel.......................... 3 1.3 Egeskaper hos e skattig................................. 4 1.4 Maximum Likelihood-metode, ML............................ 5 1.5 ML-skattig vid ormalfördelade observatioer...................... 7 1.5.1 Skattigaras fördelig.............................. 8 1.6 Mista kvadrat-metode, MK................................ 10 1.7 Medelfel........................................... 11 1.8 Variasskattig vid flera ormalfördelade stickprov..................... 11 2 Itervallskattig 14 2.1 Kofidesitervall för Ñ i ormalfördelige........................ 14 2.1.1 käd........................................ 14 2.1.2 t-fördelige.................................... 15 2.1.3 okäd....................................... 16 2.1.4 Sammafattig kofidesitervall vid ormalfördelad skattig.......... 18 2.2 Jämförade modeller..................................... 19 2.2.1 Två ormalfördelade stickprov........................... 19 2.2.2 Stickprov i par.................................... 21 2.3 Normalapproximatio.................................... 22 2.4 Trasformatio av itervallskattigar............................ 25 2.5 Kofidesitervall för 2 i ormalfördelige....................... 26 2.6 Esidiga kofidesitervall................................. 27 3 Hypotestest 29 3.1 Direktmetode eller P-värde................................. 30 3.2 Testkvatitet och kritiskt område.............................. 30 3.3 Kofidesmetode...................................... 31 3.4 Hypotestest vid ormalfördelad skattig.......................... 32 3.5 Styrkefuktio........................................ 35 3.6 Normalapproximatio.................................... 37 Id: statistik.tex 20 2008-09-25 11:48:29Z joa

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER 1 Puktskattigar och deras egeskaper 1.1 Grudläggade begrepp I saolikhetsteori har vi arbetat med stokastiska variabler vars fördeligar och deras parametrar varit käda. I statistikteori har vi i stället e samlig mätvärde frå ågo fördelig vars parametrar i regel är okäda; vi vill aväda mätvärdea för att uppskatta de okäda parametrara på ågot bra sätt. Ett stickprov, x 1,..., x är e samlig observatioer av stokastiska variabler X 1,...,X frå ågo fördelig X i F(θ) där θ är e okäd parameter. Ofta ka observatioera atas vara oberoede av varadra. 0.7 Ett stickprov frå ågo fördelig 0.6 0.5 Täthet 0.4 0.3 0.2 0.1 0 2 3 4 5 6 7 8 Observatioer Figur 1.1: Ett stickprov ( ) som är observatioer frå ågo fördelig. De heldraga lijera är ågra möjlig kadidater till observatioeas rätta fördelig, me vi vet ite vilke det är. Vi ka ha e idé om att det t.ex rör sig om e ormalfördelig och vi ka aväda stickprovet för att skatta parametrara i dea fördelig. Nu vill vi aväda observatioera för att på ågot vis gissa parameter θ. E såda gissig kallas för e skattig eller puktskattig (eftersom det är ett tal vi skattar) och beteckas med θ för att markera att det är e gissig av θ (beteckige ˆθ är också valig). Eftersom vi aväder observatioera för att göra skattige ka vi äve se de som e fuktio av dessa, θ (x 1,..., x ). På samma sätt som vi betraktade stickprovet som observatioer av stokastiska variabler ka vi äve betrakta skattige θ (x 1,...,x ) som e observatio av de stokastiska variabel θ (X 1,..., X ), dvs samma fuktio me där vi stoppar i de stokastiska variablera i stället för observatioera. E skattig är alltså 1. E fuktio, dvs e regel som talar om vad vi skall göra med observatioera för att få fram (de två följade tolkigara av) skattige. 2. Ett tal, det vi får ut då vi stoppat i observatioera. 3. E stokastisk variabel, det vi får då vi stoppar i de stokastiska variabler som stickprovet är observatioer av. Ma brukar betecka skattige θ i alla tre falle, det framgår i regel av situatioe vilket som avses. Iblad aväds begreppet skattare för fuktiosforme. I e statistisk udersökig är målet det tal vi får som skattig och att dra ågra slutsatser krig detta, me om vi bara tittar på talet får vi ite ågo som helst iformatio om hurvida skattige är bra. Är det t.ex 2

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER troligt att de ligger ära det rätta värdet på θ? Det ka vi göra oss e uppfattig om geom att studera de som stokastisk variabel. 1.2 Modell för mätig med slumpmässigt fel Atag att vi vill mäta upp e fysikalisk storhet, kalla de Ñ. Vi mäter gåger och får mätvärdea x 1,..., x. Skulle u alla mätvärde bli samma så är väl allt frid och fröjd, vi har ett värde på vårt hittills okäda Ñ. Me det valiga är og ädå att de ite blir samma uta vi har e viss variatio som ofta ka modelleras som slumpmässiga avvikelser krig det saa värdet på Ñ. Vi ka då betrakta mätvärdea som observatioer av X i = Ñ + i = Det saa värdet + slumpmässigt mätfel. Har vi e vettig mätsituatio med kalibrerade mätistrumet är det ite orimligt att ata att avvikelsera i är oberoede och likafördelade stokastiska variabler med vätevärde oll, dvs i medeltal är mätfelet oll. I måga situatioer ka ma dessutom ata att de är ormalfördelade, i N (0, ). Detta medför att våra observatioer är (tal + ormalfördelad variabel) X i N (Ñ, ). Vi ser att vätevärdet i observatioeras fördelig är det okäda tal vi försöker mäta upp, vi vill alltså göra e skattig av Ñ. Ia vi ger oss i på lite mer ratioella metoder att ta fram skattigar ka vi ädå försöka skatta Ñ på ågot vettigt vis. Ispirerade av stora tales lag, som säger att fördelige för medelvärdet mella oberoede och likafördelade stokastiska variabler kocetreras mer och mer krig vätevärdet ju fler variabler som igår i medelvärdet, ka vi helt ekelt bilda medelvärdet mella observatioera och ta det som skattig av Ñ. Ñ = 1 x i = x. För att se vilka egeskaper som metode bilda medelvärdet mella observatioera för att skatta Ñ har betraktar vi Ñ som e observatio av de stokastiska variabel Ñ = 1 X i = X. Vi ka beräka vätevärde och varias för dea stokastiska variabel E(Ñ ) = E( 1 V (Ñ ) = V ( 1 X i ) = 1 X i ) = 1 2 E(X i ) = 1 Ñ = Ñ V (X i ) = 1 2 2 = 2. Dessutom är Ñ N (Ñ, / ) eftersom de är e lijär fuktio av ormalfördeligar. Vi ser att i medeltal, om vi alltså gör upprepade försök och skattar Ñ måga gåger, ger metode skattigar som varierar krig rätt värde på Ñ, eftersom E(Ñ ) = Ñ. Dessutom blir variatioe midre om ma baserar skattige på fler mätvärde då V (Ñ ) = 2 /, se figur 1.2. Exempel 1.1. Kalle och Nisse skall mäta e fysikalisk kostat på e fysiklaboratio. Kalle har ture att få det dyra mätistrumetet varpå ha ka läsa Mätfelet är N (0, 2) meda Nisse 3

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER 1.6 1.4 1.2 1 Täthet 0.8 0.6 0.4 0.2 0 2 3 4 5 6 7 8 x Figur 1.2: Om fördelig för observatioera x i är N (5, 1) ( ), blir fördelige för e skattig Ñ = x baserad på fem observatioer N (5, 1/ 5) (-.-) samt för Ñ = x baserad på femto observatioer N (5, 1/ 15) (- -). Vi ser att då stickprovsstorleke ökar har skattige av Ñ större chas att komma ära det rätta värdet Ñ = 5 eftersom skattiges varias miskar. får ta det gamla istrumetet som är märkt med mätfel som är N (0, 3). Kalle öjer sig med att mäta e gåg, meda Nisse väljer att mäta tre gåger och bilda medelvärdet mella dessa. Vem har störst chas att komma ärmast rätt värde av Kalle och Nisse? Lsg. De perso vars skattig har mist varias (eller stadardavvikelse) bör ha störst chas att komma ärmast rätt värde. För Kalles del så får has skattig, kalla de Ñ K, samma varias som has eda observatio, V (Ñ K ) = 22 = 4. För Nisses skattig blir variase V (Ñ N ) = 3 2 /3 = 3. Nisse bör alltså ha störst chas att komma ärmast rätt värde. 1.3 Egeskaper hos e skattig Vilka egeskaper bör då e bra skattig θ ha? Vi har reda varit ie på det och de är 1. De bör var vätevärdesriktig (vvr), E(θ ) = θ. 2. De bör var effektiv, V (θ ) ska vara lite. 3. De bör vara kosistet, löst uttryckt: de bör bli bättre, dess fördelig kocetreras mer krig rätt värde, då ma öka atalet observatioer skattige baseras på. För e vätevärdesriktig skattig hamar ma alltså i medeltal krig rätt värde vid upprepade skattigar. Har ma flera sätt att skatta e parameter på är de metod med mist varias de effektivaste. Då vi ite går på djupet med kovergesbegrepp i de här kurse öjer vi oss med de lite vaga defiitioe av kosistes me ma ka tillägga att om e skattig är vätevärdesriktig så är de äve kosistes om dess varias går mot oll då atalet mätvärde. I förra avsittet såg vi att medelvärdet mella likafördelade observatioer (de var förvisso ormalfördelade där me det räcker att de är likafördelade) är e vätevärdesriktig skattig av vätevärdet och att dess varias är 2 / där 2 är observatioeras varias. 4

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER Exempel 1.2. Emma siglade slat 100 gåger och fick kroa uppåt vid 54 av dessa tillfälle. Age e vettig skattig av p = P( Kroa upp ) och avgör om de är vätevärdesriktig samt bestäm dess varias. Lsg. E helt aturlig skattig av dea saolikhet är p = 54/100, me bara detta tal säger iget om skattiges egeskaper. Me vi ka här käa ige att X = atalet kroa upp i de hudra försöke är biomialfördelat, X Bi(, p) där = 100, p de sökta saolikhete och x = 54 är e observatio av X. Då blir vår skattig p = x = 54 100, som är e observatio av p = X. För X Bi(, p) vet vi att E(X ) = p och V (X ) = p(1 p) så skattige får vätevärde och varias eligt E(p ) = E( X ) = 1 E(X ) = 1 p = p V (p ) = V ( X ) = 1 2 V (X ) = 1 p(1 p) p(1 p) =. 2 Dea skattig är alltså vätevärdesriktig och dess varias blir midre (vi kommer alltså trolige ärmre rätt värde) ju fler slatsigligar ma gör. Naturligtvis är dea skattig avädbar varhelst ma stöter på e biomialfördelig, det behöver ite ödvädigtvis vara slatsiglig. 1.4 Maximum Likelihood-metode, ML Hittills har vi tagit våra skattigar mer eller midre ur lufte. Det fis lite mer ratioella sätt att ta fram skattigar för parametrar i olika fördeligar. E av dessa är maximum likelihood-metode och med de väljer ma som skattig det θ som maximerar likelihood-fuktioe, L(θ). Om vi har oberoede observatioer x 1,..., x av e variabel med täthetsfuktio f X (x) vid kotiuerlig fördelig respektive saolikhetsfuktioe p X (k) vid diskret fördelig och dea fördelig har e okäd parameter θ blir L(θ) = f X (x i ) = f X (x 1 ) f X (x 2 )... f X (x ), vid kotiuerlig fördelig p X (x i ) = p X (x 1 ) p X (x 2 )... p X (x ), vid diskret fördelig. Ma stoppar alltså i varje observatio i si täthets- eller saolikhetsfuktio och multiplicerar ihop dem. I det diskreta fallet iebär det att vi maximerar saolikhete att få just de observatioer vi fått, vilket väl käs som e bra idé. I det kotiuerliga fallet är det de -dimesioella täthetsfuktioe i de pukt som utgörs av stickprovet som maximeras. Iblad måste maximerige ske med ågo umerisk metod me i vissa fall går det bra att göra det aalytiskt. Produktforme på L(θ) gör att maximerige ka bli besvärlig så oftast söker ma i stället maximum till logaritme av de eftersom de har maximum på samma ställe som L(θ) me är eklare att hatera. ( ) l f X (x i ) = l L(θ) = ( ) l p X (x i ) = l f X (x i ) = l f X (x 1 ) + l f X (x 2 ) +... + l f X (x ) l p X (x i ) = l p X (x 1 ) + l p X (x 2 ) +... + l p X (x ). 5

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER Naturligtvis ka ma stoppa i L(θ) i vilke strägt växade fuktio som helst och maximera dea (eller strägt avtagade och miimera) me logaritme har ju de fördele att de gör om produkter till summor som blir eklare att t.ex derivera (och de aturliga logaritme är lite lättare att derivera ä alla adra logaritmer). Exempel 1.3. Rayleigh-fördelig. Atag att x 1,...,x är observatioer av e stokastisk variabel med täthetsfuktioe f X (x) = x x2 e 2b b2 2, x 0, b > 0. Härled maximum likelihood-skattige av parameter b. Lsg. ML-skattige av b, b ML ges av det b som maximerar likelihoodfuktioe L(b) = f X (x 1 )... f X (x ) = x 1 = b 2 x 1... x e 1 x 2 b 2 e 1 2b 2 2b 2 P x2 i,... x l L(b) = 2 l b + l x 1 +... + l x 1 2b 2 d l L(b) db 2b 2 = x 2 b 2 e 2b 2 = [samla ihop relaterade delar] [logaritmera] xi 2 [derivera och sätt = 0] = 2 b + 0 + 1 b 3 xi 2 = 0 [lös ut b] x 2 i b ML = 1 2 xi 2. [ta de positiva rote] Att detta värde maximerar L(b) ser ma om ma t.ex. sätter i skattige i adraderivata av l L(b) som då alltid är egativ. Observera att det är fuktiosforme av skattige vi är ute efter, skattare. Så äve om vi frå börja haft ett par uppmätta värde frå de giva fördelige hade det varit dumt att stoppa i dem i L(b) frå börja och seda maximera de. Då förlorar vi iformatioe om vad vi gör med observatioera för att få fram skattige och ka t.ex. ite ta reda på om de är vätevärdesriktig (samt att vi får göra om hela maximerigsarbetet ästa gåg vi stöter på dea fördelig). Exempel 1.4. Biomialfördelig. Beräka ML-skattige av p baserat på e observatio x av e biomialfördelig X Bi(, p). Lsg. Nu har vi e observatio av e diskret variabel så det blir bara e faktor i likelihoodfuktioe som alltså blir lika med saolikhetsfuktioe för X. Så vi maximerar L(p) map p L(p) = P(X = x) = ( l L(p) = l x d l L(p) dp ( ) p x (1 p) x x ) + x l p + ( x) l(1 p) = 0 + x p x 1 p = 0 = x(1 p) = ( x)p = p ML = x. 6

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER Vi ser att det är samma som de ituitiva skattig vi valde i exempel 1.2 där vi äve kostaterade att de var vätevärdesriktig samt beräkade dess varias. Exempel 1.5. Poissofördelig. Härled ML-skattige och beräka dess vätevärde och varias baserat på de oberoede observatioera x 1,..., x av X i Po(Ñ). Lsg. Poisso-fördeliges saolikhetsfuktio är p X (k) = P(X = k) = e Ñ Ñk, k = 0, 1, 2,.... k! Likelihood-fuktioe och maximerig av de blir L(Ñ) = P(X 1 = x 1,...,X = x ) = e Ñ Ñx 1 l L(Ñ) = Ñ l(x i!) + l(ñ) d l L(Ñ) = 0 + 1 x i = 0 = dñ Ñ Ñ ML = 1 x i = x. x i x 1! Ñ x... e Ñ x! = e Ñ 1 x 1!... 1 x! Ñ P x i Här ser ma ekelt att detta maximerar L(Ñ) eftersom adraderivata av l L(Ñ) är 1/Ñ 2 x i och alltid är egativ (alla x i är positiva heltal så summa är 0, utom i fallet att alla x i = 0, me det får väl betraktas som lite speciellt). För observatioera har vi E(X i ) = V (X i ) = Ñ så för skattige fås E(Ñ ) = E( 1 V (Ñ ) = V ( 1 X i ) = 1 X i ) = 1 2 E(X i ) = 1 Ñ = Ñ V (X i ) = 1 2 Ñ = Ñ. 1.5 ML-skattig vid ormalfördelade observatioer Om vi har observatioer x 1,...,x av e ormalfördelig X i N (Ñ, ) är valigtvis både Ñ och okäda och behöver skattas. Med maximum likelihood-metode blir likelihood-fuktioe e fuktio av två variabler att maximera de med avseede på, så det blir lite besvärligare ä om ma bara skattar e parameter (me vi behöver ju bara göra det e gåg för dea viktiga situatio och ka seda återaväda resultatet). Vi väljer att beräka skattigara av observatioeras vätevärde, Ñ, och deras varias, 2 (dvs ite ). Likelihood-fuktioe och dess logaritm blir L(Ñ, 2 ) = 1 e (x 1 Ñ)2 1 2 2... e (x Ñ)2 2 2 = 1 2Ô 2 2Ô 2 (2Ô) /2 l L(Ñ, 2 ) = 2 l(2ô) 2 l 2 1 2 2 (x i Ñ) 2. 7 1 1 P e 2 2/2 2 (x i Ñ) 2

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER Maximum av dea fuktio map Ñ och 2 fås geom att lösa ekvatiossystemet l L = 1 Ñ 2 (x i Ñ) = 0 l L 2 = 2 2 + 1 2 4 (x i Ñ) 2 = 0. Första ekvatioe ger (x i Ñ) = 0 = x i = Ñ = Ñ ML = 1 x i = x. Detta värde på Ñ isatt i adra ekvatioe ger 2 = (x i x) 2 = ( 2 ) ML = 1 (x i x) 2. Vad gäller skattige av Ñ har vi reda sett i avsitt 1.2 att de är vätevärdesriktig och att dess varias är 2 /, me för variasskattige har vi ( ) E[( 2 ) 1 ML] = E (X i X ) 2 =... = (1 1 ) 2. De är alltså ite vätevärdesriktig 1 uta har ett systematiskt fel som gör att ma i medeltal uderskattar variase med dea metod. Så aser ma att vätevärdesriktighet är ödvädigt ka ma korrigera si skattig (geom att här dela ( 2 ) ML med (1 1/)). I det här fallet får vi att ML-skattige av vätevärdet och e korrigerad ML-skattig av variase Ñ = 1 x i = x, ( 2 ) = 1 1 (x i x) 2 = s 2 som båda är vätevärdesriktiga. Dessa skattigar aväder ma med fördel för att skatta vätevärde och varias äve vid okäd fördelig. Vi iför äve beteckige s 2 för stickprovsvariase. Vill ma skatta observatioeras stadardavvikelse tar ma helt ekelt rote ur variasskattige dvs s. Dea skattig är dock ite vätevärdesriktig. Vid hadräkig ka ma ha ytta av att ma ka utveckla kvadrate i kvadratsumma och skriva s 2 som [ s 2 = 1 ] ( (x i x) 2 = 1 xi 2 x 2 = 1 ) 2 xi 2 1 x i (1.1) 1 1 1 där de seare variate är att föredra eftersom de är midre käslig för avrudigsfel då är stor. 1.5.1 Skattigaras fördelig Vi har tidigare sett att om vi har oberoede observatioer x 1,..., x av N (Ñ, ) och Ñ skattas med Ñ = x så är Ñ N (Ñ, D(Ñ )) = N (Ñ, ) 1 Om Ñ till ävetyrs skulle vara käd så är 1 P (xi Ñ)2 e vätevärdesriktig skattig observatioeras varias. 8

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER vilket vi kommer att stor avädig av i kommade avsitt. Uttrycket för stadardavvikelse kommer att ha olika former me grudpricipe är de att vi har e ormalfördelad skattig och kuskap om observatioera tillsammas med skattigsmetode (i det här fallet medelvärde mella ormalfördelade observatioer) gör att vi ka räka ut skattiges stadardavvikelse. Äve om det primära är att skatta Ñ kommer vi äve ha aledig att ta reda på vilke fördelig som är relaterad till variasskattige. I sats 6.6 i läroboke såg vi att e kvadratsumma av st N (0, 1)-variabler hade e så kallad Õ 2 ()-fördelig (chi-två). Detta ka geeraliseras till: Om X 1,..., X är oberoede (av varadra) och X i N (Ñ, ) så är 1 2 (X i Ñ) 2 Õ 2 () och 1 2 (X i X ) 2 Õ 2 ( 1). Det adra uttrycket är mest itressat för det påmier om stickprovsvariase ( 2 ) = s 2 = 1 1 (x i x) 2 som är e observatio av ( 2 ) = 1 1 där vi iför Q som summa av kvadratiska avvikelser krig medelvärdet. Så vi har alltså (X i X ) 2 = Q 1 Q 2 Õ2 ( 1) ( 1)( 2 ) 2 Õ 2 ( 1). Parameter i Õ 2 -fördelige ( 1 i det här fallet) kallas atalet frihetsgrader och är atalet oberoede kompoeter i kvadratsumma. Ma ka äve se de som atalet observatioer mius atalet skattade parametrar i kvadratsumma, X är ju ett skattat vätevärde, Ñ. Observera att det alltid är samma tal som ma delar med i variasskattige. Exempel 1.6. Om ma har åtta oberoede observatioer av N (Ñ, ) och skattar Ñ och 2 eligt ova, vad är då Lsg. 1. saolikhete att e observatio, X i, avviker med mer ä e stadardavvikelse frå det rätta värdet på Ñ? 2. saolikhete att skattige Ñ avviker med mer ä e (av observatioeras) stadardavvikelse frå det rätta värdet Ñ? 3. saolikhete att skattige ( 2 ) är mist dubbel så stor som det saa värdet 2? Aväd gära Matlab eller tabell 4 i läroboke bak å fram då Õ 2 -fördeliges fördeligsfuktio är besvärlig att hatera aalytiskt. 1. Vi har X i N (Ñ, ) och avvikelse frå observatioe till vätevärdet är X i Ñ så vi får saolikhete till P( X i Ñ > ) = 1 P( < X i Ñ < ) = [stadardisera] = = 1 P( < X i Ñ < ) = 1 ((1) ( 1)) = = [( x) = 1 (x)] = 2 2(1) 0.32. 2. Nu har vi i stället Ñ = X N (Ñ, / 8) så vi ka återaväda beräkigara ova (byt ut mot / 8 i stadardiserige) P( X Ñ > ) = 2 2( 8) 0.0047. 9

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER 3. Här aväder vi att ( 2 ) = Q/( 1) och att Q/ 2 Õ 2 (7) P(( 2 ) > 2 2 Q ) = P( 1 > 2 2 ) = P( Q 2 > 2( 1)) = P( Q 2 > 14). Om vi aväder tabelle över Õ 2 (7)-fördeliges kvatiler skall vi alltså leta efter de kvatil som är ugefär lika med 14. I tabell 4 ser vi att Õ 2 0.05 (7) = 14.1 så de sökta saolikhete är alltså ugefär 0.05. Aväder ma Matlab så fås svaret 0.0512 ur 1-chi2cdf(14,7). 1.6 Mista kvadrat-metode, MK Vid ML-skattig behöver vi iformatio om observatioeras fördelig (såär som på de parametrar vi skall skatta) vilket ite alltid är fallet att ma har. Med Mista kvadrat-metode räcker det att ha iformatio om hur observatioeras vätevärde beror av de/de parametrar som skall skattas. Om vi har observatioera x 1,..., x av X i med E(X i ) = Ñ i (θ) ges mista kvadrat-skattige av θ av det θ som miimerar förlustfuktioe Q(θ) = (x i Ñ i (θ)) 2. Vi miimerar alltså summa av kvadratiska avvikelser frå observatioera till deras vätevärde. Observera att dea fuktio reda är på summaform och att det därför ite blir till ågo hjälp att logaritmera de. Exempel 1.7. Expoetialfördelig. Beräka mista kvadrat-skattige av Ð baserad på observatioera x 1,...,x av X i Exp(Ð). Lsg. För expoetialfördelige (med Ð som parameter) har vi E(X i ) = 1/Ð. Så vi miimerar Q(Ð) = (x i 1 Ð )2 dq(ð) = 2 dð Ð 2 (x i 1 ) = 0 = x i = Ð Ð = Ð MK = x i = 1 x. På grud av de kvadratiska forme på Q(Ð) tror vi väl på att detta värde verklige är miimum. Mista kvadratmetode ka justeras lite för att ta olika mycket häsy till de olika observatioera vid skattige. Ma iför vikter w i som ager hur mycket häsy ma skall ta till mätvärde r i. Ma får e viktad mista kvadrat-skattig av θ geom att miimera Q(θ) = w i (x i Ñ i (θ)) 2. Speciellt om mätvärde r i har variase 2 i ka ma välja w i = 1/ 2 i och därmed kommer mätvärde med stor varias (och därmed stor osäkerhet) att påverka skattige i midre utsträckig ä de med lite varias. 10

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER 1.7 Medelfel Vi har tidigare beräkat variase för ågra skattigar och de är ju ett mått på osäkerhete i skattige och det kommer i kommade avsitt att vara ödvädigt att beräka de umeriskt, eller oftare rote ur de, dvs skattiges stadardavvikelse. Så ka vi för e skattig θ beräka dess stadardavvikelse D(θ ) är det bra, me ofta iehåller de okäda parametrar som måste skattas. Sättes dessa skattigar i i D(θ ) får vi skattiges medelfel som beteckas med d(θ ) (dvs d(θ ) = D(θ ) ). I fallet är vi skattade Ñ i ormalfördelige med Ñ = x (avsitt 1.2 och 1.5) hade vi V (Ñ ) = 2 = D(Ñ ) =. Om skulle vara käd ka vi få e siffra på D(Ñ ), me är de det ite skattade vi ju observatioeras stadardavvikelse med stickprovsstadardavvikelse = s så medelfelet blir d(ñ ) = s. När vi skattade p i e biomialfördelig (exempel 1.2 och 1.4) blev skattiges varias V (p ) = p(1 p) p(1 p) = D(p ) =. Här ka vi ite få fram e siffra eftersom skattiges stadardavvikelser iehåller p som ju är okäd (vi skulle ju ite behöva skatta de om de vore käd). Me vi ka stoppa i vår skattig p = x/ och medelfelet blir d(p ) = p (1 p ) x = (1 x ). I fallet med poissofördelige (exempel 1.5) hade vi Ñ = x och V (Ñ ) = Ñ/ så d(ñ ) = x/. 1.8 Variasskattig vid flera ormalfördelade stickprov Här betraktar vi k st oberoede ormalfördelade stickprov med samma me med olika vätevärde. De ka till exempel vara mätigar på olika saker med e och samma mätmetod och det huvudsakliga bidraget till variatioe kommer frå mätmetode. x 1,1, x 1,2,..., x 1,1 obs. av X 1,i N (Ñ 1, ) x 2,1, x 2,2,..., x 2,2 obs. av X 2,i N (Ñ 2, ). x k,1, x k,2,...,x k,k obs. av X k,i N (Ñ k, ). De k vätevärdea skattas som valigt med medelvärdet av motsvarade stickprov, me för att skatta de gemesamma variase 2 bör vi utyttja alla mätvärde. Ma kaske skulle kua frestas att betrakta alla observatioer som ett eda stickprov och ta de totala stickprovsvariase som skattig av 2 och det skulle kua fugera om alla Ñ i är ugefär lika stora, me ger aturligtvis e för stor skattig om de ite är det. Likaså ka ma ite heller bilda medelvärdet mella de eskilda stickprovsvariasera (om det ite 11

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER är lika måga observatioer i alla stickprov, då råkar det bli rätt). Uta vi gör e sammavägd (eg. pooled) skattig av variase eligt (det är e korrigerad ML-skattig) s 2 p = ( 1 1)s 2 1 + ( 2 1)s 2 2 + + ( k 1)s 2 k ( 1 1) + ( 2 1) + + ( k 1) = Q f där si 2 är stickprovsvariase för stickprov r i. Liksom i avsitt 1.5.1 är atalet frihetsgrader för dea skattig det tal som står i ämare, f = k 1 ( i 1), dvs totala atalet observatioer och mius ett för varje skattad parameter i täljare (ett skattat vätevärde i varje si 2 ). Äve här är skattige relaterad till Õ 2 -fördelige geom Q 2 Õ2 (f ). Exempel 1.8. Olle är itresserad av vikte på sitt marsvi Hugo (eller sarare om ha har gått upp i vikt, ha har varit lite mager på sista tide), så ha gör tre vägigar på e våg som har ett slumpmässigt och ormalfördelat mätfel i N (0, ). Resultat i gram x i : 792 799 793. Detta är då observatioer av X i N (Ñ x, ) där Ñ x är Hugos vikt vid detta tillfälle. E vecka seare är det dags för vägig ige och u blev resultatet y i : 799 802 804 799 som är observatioer av Y i N (Ñ y, ), vi atar här att det är samma som vid förra veckas vägig. 1. Skatta Hugos vikt vid de två tillfällea och beräka skattigaras medelfel. 2. Skatta Hugos viktuppgåg, Ñ = Ñ y Ñ x samt age vad de skattige har för fördelig och beräka medelfelet. Am. I ett seare kapitel ka vi kaske ta reda på om Hugos viktuppgåg är sigifikat. Lsg. 1. De två vätevärdea skattar vi med vardera medelvärdet Ñ x = 1 3 3 x i = 794.67 g, Ñ y = 1 4 4 y i = 801.00 g som är observatioer av Ñ x N (Ñ x, / 3) respektive Ñ y N (Ñ y, / 4). Variase 2 skattas med de sammavägda stickprovsvariase s 2 p s 2 x = 1 3 1 3 (x i x) 2 = 14.33 g 2, sy 2 = 1 4 1 4 (y i ȳ) 2 = 6.0 g 2 ( 2 ) = s 2 p = (3 1)s2 x + (4 1)s 2 y (3 1) + (4 1) = 9.33 g 2. Eftersom D(Ñ x ) = / 3 och motsvarade för Ñ y blir medelfele d(ñ x ) = s p 9.33 = = 1.76 g, d(ñ y ) = s p 9.33 = = 1.53 g. 3 3 4 4 12

1 PUNKTSKATTNINGAR OCH DERAS EGENSKAPER 2. Hugos viktuppgåg Ñ skattar vi helt aturligt med Ñ = Ñ y Ñ x = 801.00 794.67 = 6.33 g. Eftersom dea skattig är e lijär fuktio av två ormalfördeligar blir aturligtvis äve de ormalfördelad, vi behöver bara bestämma vätevärde och stadardavvikelse för att precisera fördelige E(Ñ ) = E(Ñ x Ñ y ) = E(Ñ x ) E(Ñ y ) = Ñ x Ñ y = Ñ V (Ñ ) = V (Ñ x Ñ y ) = [ober.] = V (Ñ x ) + ( 1)2 V (Ñ y ) = 2 3 + 2 4 ( 1 D(Ñ ) = 3 + 1 ) 1 = Ñ N Ñ, 4 3 + 1 4 och medelfelet d(ñ ) = s p 1 3 + 1 4 = 2.33 g. 13

2 INTERVALLSKATTNING 2 Itervallskattig I förra avsittet såg vi hur ma ka ta fram skattigar samt att det är viktigt att betrakta dem som fuktioer av stokastiska variabler för att kua aalysera deras egeskaper. Nu skall vi i stället skatta ett itervall och därmed få lite mer kvatitativ iformatio om osäkerhete i skattigara. Fokus kommer u och framöver att ligga på ormalfördelige me vi skall se att metodera kommer att vara tillämpbara äve då skattigara är approximativt ormalfördelade. Ett kofidesitervall med kofidesgrad 1 för e parameter θ är ett itervall som med saolikhete 1 täcker rätt värde på θ. Itervallet beteckas I θ. Har vi observatioera x 1,..., x skattas alltså två tal, a 1 och a 2 I θ = [a 1(x 1,...,x ), a 2(x 1,...,x )] som vi, liksom i fallet med puktskattigar, betraktar som observatioer av de stokastiska variablera I θ = [a 1 (X 1,...,X ), a 2 (X 1,..., X )] och de har egeskape P(a 1(X 1,..., X ) θ a 2(X 1,..., X )) = 1. Observera att det är itervallets gräser som är stokastiska, θ är ju bara ett okät tal. Skall itervallet ge ågo vettig iformatio om θ bör aturligtvis kofidesgrade 1 vara hög, hur hög de skall vara varierar med olika tillämpigar me vi aväder oftast 95% och i blad 99% eller 99.9%. Då är det gaska troligt (me ite helt säkert) att det itervall vi skattar verklige täcker θ. 2.1 Kofidesitervall för Ñ i ormalfördelige 2.1.1 käd För att göra ett kofidesitervall för Ñ då vi har oberoede observatioer x 1,...,x av X i N (Ñ, ) ka vi utgå frå ML-skattige av Ñ frå förra avsittet. Vi hade ju Ñ = 1 x i obs. av Ñ N (Ñ, ) Ñ Ñ / N (0, 1). Utifrå detta ka vi härleda ett kofidesitervall för Ñ. Observera att observatioeras stadardavvikelse måste vara käd för att ma skall kua räka ut itervallet. Normalfallet, att de ite är käd, tar vi upp seare. För e N (0, 1)-fördelig gäller, eftersom de är symmetrisk krig oll, att de ligger mella kvatilera Ð /2 och Ð /2 med saolikhete 1, se figur 2.1. I detta fall betyder det alltså att (vi skriver för ekelhets skull D(Ñ ) i stället för / ) ( ) P Ð /2 Ñ Ñ D(Ñ ) Ð /2 = 1. (2.1) Nu är målet att omforma detta itervall så att det ser ut som ett kofidesitervall; Ñ skall stå i mitte med 14

2 INTERVALLSKATTNING 0 λ α/2 λ α/2 Figur 2.1: Täthetsfuktio för N (0, 1)-fördelig. De två markerade areora är vardera /2 så area mella de två kvatilera är 1. två stokastiska gräser omkrig. Vi börjar med att förläga med D(θ ) P ( Ð /2 D(Ñ ) Ñ Ñ Ð /2 D(Ñ ) ) = 1 P ( Ñ Ð /2 D(Ñ ) Ñ Ñ + Ð /2 D(Ñ ) ) = 1 P ( Ñ + Ð /2 D(Ñ ) Ñ Ñ Ð /2 D(Ñ ) ) = 1 P ( Ñ Ð /2 D(Ñ ) Ñ Ñ + Ð /2 D(Ñ ) ) = 1 där vi i sista steget bara bytte plats på gräsera. Vi ser att det bara är ett tecke som skiljer de två gräsera åt så kofidesitervallet blir I Ñ = Ñ ± Ð /2 D(Ñ ) = x ± Ð /2 som är e observatio av ett itervall som med saolikhete 1 (kofidesgrade) täcker rätt värde på de okäda parameter Ñ. Vi ser att puktskattige av Ñ ligger mitt i itervallet och att itervallbredde är 2Ð /2 /. Itervallet blir alltså smalare ju midre observatioeras stadardavvikelse är eller ju större stickprovsstorleke är, meda det blir bredare om kofidesgrade 1 ökas (då miskar och Ð /2 blir större) vilket verkar aturligt(?!). Nu krävde vi som sagt att skulle vara käd för att ma skall kua räka ut detta itervall. Är de ite det har vi seda tidigare ett bra sätt att skatta de på. 2.1.2 t-fördelige I härledige av kofidesitervallet för Ñ då var käd utgick vi frå att skattige av Ñ var ormalfördelad (och därmed kude trasformeras till N (0, 1)). För att härleda itervallet då är okäd ka ma gå tillväga på motsvarede vis som vi yss gjort, me vi behöver först veta vilke fördelig Ñ Ñ / där = 1 1 (X i X ) 2 (2.2) har. Vi har alltså e ormalfördelad skattig i täljare och rote ur ågot som påmier om det som i avsitt 1.5.1 var Õ 2 -fördelat. Nu visar det sig (me det är överkurs att visa) att om X N (0, 1) är oberoede av Y Õ 2 (f ) så får vi e så kallad t-fördelig geom X Y /f t(f ). (2.3) 15

2 INTERVALLSKATTNING t-fördelige är liksom N (0, 1)-fördelige symmetrisk krig origo me är, som ma säger, mer tugsvasad, dvs har större del av si massa ute i katera och därmed är dess kvatiler större ä motsvarade kvatiler i N (0, 1). Se figur 2.2 för ågra exempel. 0.4 t fördelig med f = 1, 2, 4, 8, f = 0.2 f = 1 0 4 2 0 2 4 Figur 2.2: Täthetsfuktioer för t(f )-fördelig. De har N (0, 1)-fördelige som gräsfördelig då f. Så är då kvote i ekvatio 2.2 t-fördelad? Ja vi ka skriva om de som (dela upp täljare och ämare på lämpligt sätt och dela dessa med ) Ñ Ñ / = Ñ Ñ / 1 2 (X i X ) 2 /( 1) så ka ma käa ige e N (0, 1)-fördelig i täljare och uder rote i ämare e Õ 2 ( 1)-fördelig (eligt avsitt 1.5.1) delad med just 1, dvs samma form som i ekvatio 2.3. Återstår att visa att de dessutom är oberoede av varadra (det är ju samma X i som igår i både Ñ och i ämare, så det är ite självklart) me äve det är överkurs. Observera att parameter i t-fördelige är de samma som i Õ 2 -fördelige så de kallas fortfarade för atal frihetsgrader (som alltså var det vi delade med i variasskattige, och det var atalet oberoede kompoeter eller atalet observatioer mius atalet skattade parametrar i kvadratsumma som igår i variasskattige). 2.1.3 okäd Eftersom Ñ Ñ / t( 1) ka vi gå tillväga på samma sätt som vid kät. Med t( 1)-fördeliges /2-kvatil, t /2 ( 1) (tabell 3 i kursboke Blom et al. [1]) och d(ñ ) = s/ fås på samma sätt som i ekvatio 2.1 ( ) P t /2 ( 1) Ñ Ñ d(ñ t ) /2 ( 1) = 1. 16

2 INTERVALLSKATTNING Härledige blir precis desamma som i fallet med kät (byt ut Ð /2 mot t /2 ( 1) och D(Ñ ) mot d(ñ )) och resultatet blir I Ñ = Ñ ± t /2 (f )d(ñ s ) = x ± t /2 ( 1) som täcker rätt värde på Ñ med saolikhete 1. Exempel 2.1. Guiess. Ma har tio observatioer av alkoholhalte i ett fat med Guiess 2. Medelvärdet av mätvärdea blev x = 4.1 och stickprovsstadardavvikelse s = 0.4. Formulera e modell baserad på ormalfördelad variatio och gör ett 95% kofidesitervall (dvs kofidesgrade 1 = 0.95) för alkoholhalte i fatet. Lsg. Vi atar att de tio mätvärdea är observatioer av e och samma ormalfördelig, så modelle är x 1,..., x 10 är oberoede observatioer av X i N (Ñ, ), där Ñ är alkoholhalte i fatet. Ett kofidesitervall för dea situatio har vi yss härlett så vi ka aväda resultatet och får I Ñ = Ñ ± t /2 (f )d(ñ ) = [1 = 0.95 /2 = 0.025] = x ± t 0.025 ( 1) s = = [t 0.025 (9) = 2.26 frå tabell 3] = 4.1 ± 2.26 0.4 10 = [3.96, 4.24]. Detta itervall täcker med 95% saolikhet alkoholhalte i fatet. Exempel 2.2. Simulera 10 observatioer frå e N (3, 2)-fördelig och beräka ett 95% kofidesitervall för Ñ baserad på okät (vi vet ju att = 2 me ka ju skatta de ädå). Upprepa detta 100 gåger och plotta de 100 itervalle. Hur måga itervall träffar rätt värde? Lsg. I Matlab ka simulerige göras (kortare på bekostad av läsbarhet) eligt = 10; f = -1; N = 100; my = 3; sigma = 2; kofgrad = 0.95; alfa = 1-kofgrad; kvatil = tiv(1-alfa/2, f); % Markera rätt my med e grö lije plot([my my], [0 N], g ); hold o for k=1:n x = ormrd(my, sigma,, 1); % Ett stickprov m = mea(x); % Skattat vätevärde s = std(x); % Skattad stadardavvikelse kofit = [m-kvatil*s/sqrt(), m+kvatil*s/sqrt()]; if (kofit(1) < my && kofit(2) > my) plot(kofit, [k k], b ); % Blå lije för träffar else plot(kofit, [k k], r ); % och röd för missar ed ed 2 Teori för t-fördelige visades 1908 av kemiste och statistiker W. S. Gossett som arbetade på bryggeriet Arthur Guiess & So i Dubli. Ha skrev uder pseudoyme Studet, varav ma ofta kallar de Studets t-fördelig. 17

2 INTERVALLSKATTNING hold off title 100 kofidesitervall för \mu i N(3,2) xlabel \mu ylabel Itervall r Resultatet av e körig visas i figur 2.3. Varje itervall har 95% chas att träffa Ñ = 3 oberoede av varadra, så i låga loppet bör ugefär 95 av 100 itervall träffa rätt. (Om vi låter Y = Atalet itervall som träffar rätt så är ju Y Bi(100, 0.95) med E(Y ) = 95). 100 100 kofidesitervall för µ i N(3,2) 90 80 70 Itervall r 60 50 40 30 20 10 0 1 0 1 2 3 4 5 6 7 µ Figur 2.3: 100 stycke 95% kofidesitervall för Ñ baserade på vardera tio simulerade observatioer frå X i N (3, 2). Rätt värde Ñ = 3 är markerat med e lodrät lije och 94 av de 100 itervalle träffar de. 2.1.4 Sammafattig kofidesitervall vid ormalfördelad skattig Om vi har st. oberoede observatioer av X i N (Ñ, ) fås kofidesitervall för Ñ med kofidesgrade 1 ur käd: I Ñ = Ñ ± Ð /2 D(Ñ ) = x ± Ð /2 okäd: I Ñ = Ñ ± t /2 (f )d(ñ ) = x ± t /2 ( 1) s. Resultate visar sig dessutom vara avädbar i lågt mer ä dea situatio. Det primära är att vi har e ormalfördelad skattig, θ N (θ, D(θ )), och ka räka ut D(θ ) eller d(θ ) så kommer ett kofidesitervall för θ att ha forme D(θ ) käd: I θ = θ ± Ð /2 D(θ ) D(θ ) okäd: I θ = θ ± t /2 (f )d(θ ) där atalet frihetsgrader, f, i de adra och valigare situatioe fås ur skattige av som igår i d(θ ). Vi behöver alltså ite härleda kofidesitervall baserade på e ormalfördelad skattig ige, uta ka aväda detta som mall. 18

2 INTERVALLSKATTNING 2.2 Jämförade modeller Det är valigt att ma vill jämföra olika saker, t.ex om olika tillverkigs- eller mätmetoder skiljer sig åt, eller om det är ågo skillad före och efter e förädrig av ågot slag. Ma gör det geom att skatta just e skillad. Vi har två olika metoder att göra detta på och de passar olika bra i olika situatioer och försöksupplägg så det är viktigt att ma lär sig vilke av dem som är lämplig i e give situatio. (Det duger alltså ite att jämföra två olika kofidesitervall och dra olika statistiska slutsatser om de t.ex överlappar varadra eller ej, eller om t.ex e skattad parameter täcks av ett kofidesitervall för e aa parameter). 2.2.1 Två ormalfördelade stickprov Om vi har två ormalfördelade stickprov med oberoede observatioer eligt modelle x 1,...,x x obs. av X i N (Ñ x, ) y 1,..., y y obs. av Y i N (Ñ y, ) (som vi reda osat lite på i exempel 1.8) dvs samma för alla observatioera me vi har två olika vätevärde att jämföra med varadra. Vi ka utgå frå puktskattigara eligt tidigare Ñ x = x obs. av Ñ x = X N (Ñ x, x ) och motsvarade för Ñ y. Skillade skattas helt ekelt eligt (Ñ x Ñ y ) = Ñ x Ñ y (eller tvärt om om det skulle käas aturligare) som är e differes mella två ormalfördeligar, och därmed är äve differese ormalfördelad med parametrara E(Ñ x Ñ y ) = E(Ñ x ) E(Ñ y ) = Ñ x Ñ y V (Ñ x Ñ y ) = [ober.] = V (Ñ x ) + ( 1)2 V (Ñ y ) = 2 + 2 x y ( ) D(Ñ x Ñ 1 y ) = + 1 = Ñ x Ñ 1 y N Ñ x Ñ y, + 1 x y x y dvs e ormalfördelad skattig precis som tidigare (som i och försig består av två termer, me det spelar ige roll). Ett kofidesitervall för Ñ x Ñ y fås med hjälp av malle till I Ñx Ñ y = Ñ x Ñ y ± t /2 (f )d(ñ x Ñ 1 y ) = x ȳ ± t /2 (f ) s p + 1. x y De gemesamma variase 2 skattas som vi sett i avsitt 1.8 med s 2 p = ( x 1)s 2 x + ( y 1)s 2 y x 1 + y 1 = Q f, ( Q 2 Õ2 (f )) och f som igår i t-kvatile är som valigt det vi delar med i variasskattige. Skulle vara käd aväder ma de i stället för s p och då äve Ð- i stället för t-kvatil. Naturligtvis ka ma ha fler ä två stickprov att basera de gemesamma variasskattige på me för att jämföra dem mer ä parvis (för att t.ex se om ågot av vätevärdea skiljer sig frå de övriga) behövs begrepp som ite ryms i dea kurs. 19

2 INTERVALLSKATTNING Modelle vi u gått igeom är de valigaste och därmed viktigaste, me har ma aledig att tro att de två stickprove ite har samma, uta D(X i ) = x och D(Y i ) = y blir D(Ñ x Ñ y ) = 2 x + 2 y och därmed d(ñ x Ñ sx y ) = 2 + s2 y. x y x y De första ka avädas tillsammas med e Ð-kvatil om de två variasera är käda, aars skattas de och ma aväder medelfelet och t-kvatil. I det seare fallet (som ite es äms i kursboke, så det är väl lite överkurs) får vi dock ige exakt t-fördelig uta itervallet blir approximativt (eller har de approximativa kofidesgrade 1 ) och atalet frihetsgrader att aväda i t-kvatile ka ma slå upp vid behov. f = (s2 x / x + sy 2/ y) 2. (sx 2/x)2 + (s2 y / y) 2 x 1 y 1 Me är det hyfsat måga observatioer (totalt ågot 50-tal eller fler) ka ma kaske lika gära struta i t /2 (f ) och ta e Ð-kvatil, de blir ju mer och mer lika varadra då f ökas och itervallet är ädå approximativt. Exempel 2.3. E löpare aväder e portabel GPS-mottagare för att mäta lägde på sia löprudor. Efter att ha uppdaterat programvara i mottagare verkar det som om de visar högre värde för e give sträcka. Följade mätvärde i meter togs upp på e och samma sliga Gammal programvara 5509 5521 Ny programvara 5518 5556 5532 5542 5537 5556 Asätt e modell baserad på ormalfördelad variatio med lika stadardavvikelse och gör ett 95% kofidesitervall för skillade i sträcka mella de ya och gamla programvara. Lsg. Modell: Gammal programvara: x i, i = 1,..., x = 2 obs av X i N (Ñ x, ). Ny programvara: y i, i = 1,..., y = 6 obs av Y i N (Ñ y, ). Medelvärde och stickprovsstadardavvikelser för de två dataseriera blir x = 1 x x i = 5515.0, ȳ = 5540.2, s x = 1 x (x i x) x x 1 2 = 8.485, s y = 14.65. De gemesamma stadardavvikelse för X i och Y i skattas med ( x 1)sx 2 + ( y 1)sy 2 1 8.485 s p = = 2 + 5 14.65 2 x 1 + y 1 1 + 5 = 13.81. Eftersom Ñ y Ñ x = ȳ x är e observatio av N (Ñ y Ñ x, 1 + 1 x y ) blir kofidesitervallet I Ñy Ñx = Ñ y Ñ x ± t /2(f )d(ñ y Ñ x ) = ȳ x ± t 1 /2( x 1 + y 1)s p + 1 = x y = [t /2 ( x 1 + y 1) = t 0.025 (6) = 2.45] = 25.15 ± 2.45 13.81 = [ 2.48, 52.78]. 1 2 + 1 6 = 20

2 INTERVALLSKATTNING 2.2.2 Stickprov i par Atag att vi vill udersöka effekte av e blodtryckssäkade medici. Ma skulle kua täka sig följade två försöksupplägg 1. Låt e grupp om tio persoer få de blodtryckssäkade medicie och e aa grupp om tio persoer få placebo. 2. Mät blodtrycket före och efter behadlig med medicie på e grupp om tio persoer. I första fallet skulle vi kua tillämpa modelle i föregåede avsitt och göra ett kofidesitervall för skillade mella de två grupperas vätevärde. Problemet med dea metod är om det är stor skillad mella olika persoers blodtryck och e gaska lite skillad beroede på om ma får placebo eller medicie så kommer variatioe mella de olika persoera att domiera och det är svårt att se om medicie har ågo effekt; kofidesitervallet kommer att bli för brett. Med det adra försöksupplägget skulle ma kua göra sig av med variatioe mella persoera och i stället fokusera mer på variatioe orsakad av medicie. Me då behöver vi e y modell. Så om mätvärdea hör ihop parvis, t.ex att ma mäter två gåger på ett atal olika objekt uder två olika förutsättigar, aväder ma modelle stickprov i par Objekt i: 1 2 Obs. av x i x 1 x 2 x X i N (Ñ i, x ) y i y 1 y 2 y Y i N (Ñ i +, y ) Varje x i har alltså sitt eget vätevärde Ñ i och motsvarade y i har samma vätevärde plus e skillad som är desamma för alla i. Nu verkar situatioe lite hopplös med st okäda Ñ i, ett okät och två okäda stadardavvikelser att skatta med de 2 observatioera. Me det är skillade vi vill åt och det gör vi geom att bilda parvisa differeser mella observatioera Objekt i: 1 2 Obs. av x i x 1 x 2 x X i N (Ñ i, x ) y i y 1 y 2 y Y i N (Ñ i +, y ) z i = y i x i z 1 z 2 z Z i N (, ) Differesera bildar då ya observatioer z i vars vätevärde är de sökta differese som vi ka skatta på valigt vis med = z. Ett kofidesitervall för blir då är okäd I = ± t /2 (f )d( ) = z ± t /2 ( 1) s z. Skulle ma ase att x och y är käda skulle ma förstås få = 2 x + 2 y me det kräver att alla x i är oberoede av motsvarade y i vilket ite alltid är rimligt att ata (däremot bör alla x i vara oberoede av varadra och motsvarade för y i ). Exempel 2.4. Ma har två vågar, A och B, där ma misstäker att våg B har ett systematiskt fel så att de ger för högt utslag meda ma vet att våg A väger rätt i medeltal. Ma vägde 6 föremål på båda vågara och fick edaståede resultat: Föremål, i 1 2 3 4 5 6 våg A, x i 1.0 7.7 9.6 21.0 32.3 22.6 våg B, y i 3.1 8.8 12.0 19.5 35.5 32.5 21

2 INTERVALLSKATTNING Sätt upp e lämplig modell för data, baserad på ormalfördelig och gör ett 99% kofidesitervall för skillade mella vågara. Lsg. I det här fallet skulle det vara efaldigt att ata att vikte av de olika föremåle varierar krig ett gemesamt vätevärde, uta stickprov i par är lämpligast vilket ka ses i figur2.4. Så 40 30 Vikt 20 10 0 1 2 3 4 5 6 Föremål r. Figur 2.4: Upmätta vikter för de sex föremåle frå våg A ( ) och B ( ). Det är stor skillad mella de olika föremåle me lite skillad mella vågara varför stickprov i par är lämpligt. vi bildar differesera eligt modelle Föremål, i 1 2 3 4 5 6 Obs. av våg A, x i 1.0 7.7 9.6 21.0 32.3 22.6 X i N (Ñ i, 1 ) våg B, y i 3.1 8.8 12.0 19.5 35.5 32.5 Y i N (Ñ i +, 2 ) z i = y i x i 2.1 1.1 2.4-1.5 3.2 9.9 Z i N (, ) och eftersom = z är e observatio av N (, / ) blir puktskattigara och kofidesitervallet = z = 2.867, = s z = 1 (z i z) 1 2 = 3.81 I = ± t /2 (f )d( s ) = z ± t 0.005 (5) = 3.81 ± 4.03 1.556 = [ 3.4, 9.1]. 6 Observera att det ite måste röra sig om olika objekt. Modelle är avädbar om mätvärdea hör ihop parvis på ågot vis. 2.3 Normalapproximatio Vi har u tagit fram e metod för hur ma gör ett kofidesitervall för e parameter vars skattig är ormalfördelad. Har ma ågo aa fördelig får ma härleda kofidesitervallet frå dess defiitio, me det ka vara besvärligt och i fallet med e skattig med diskret fördelig ka ma i regel ite få e exakt kofidesgrad. Me i måga situatioer är e skattig approximativt ormalfördelad och vi ka aväda vår mall för ormalfördelig, me med e lite modifikatio. Har vi t.ex. observatioer av oberoede likafördelade variabler X i, med E(X i ) = Ñ och D(X i ) = och vi skattar Ñ med medelvärdet mella observatioera ka vi ju ta receptet direkt och få itervall med approximativ kofidesgrad 1 käd: I Ñ = Ñ ± Ð /2 D(Ñ ) = x ± Ð /2 okäd: I Ñ = Ñ ± t /2 (f )d(ñ ) = x ± t /2 ( 1) s 22

2 INTERVALLSKATTNING eftersom Ñ = X är, eligt cetrala gräsvärdessatse, approximativt ormalfördelad om atalet observatioer de är baserad på är hyfsat stort (mist ågot tjugotal vid ågorluda symmetriskt fördelade observatioer, fler aars). Ofta är det dock så att e parameter igår i variase för dess skattig och vi behöver då ite aväda ågo stickprovsstadardavvikelse (eller ka ite es räka ut e såda om vi bara har e observatio) och då har ma ite ågo aledig att blada i t-fördelige. Så vi tar följade recept för approximativt ormalfördelade skattigar. Om θ N (θ, D(θ )) fås ett kofidesitervall för θ med approximativ kofidesgrad 1 som D(θ ) käd: I θ = θ ± Ð /2 D(θ ) D(θ ) okäd: I θ = θ ± Ð /2 d(θ ) dvs alltid Ð-kvatil. Udataget är möjlige situatioe med Ñ = X ova eller likade. Har vi t.ex e situatio med e observatio x av X Bi(, p) har vi tidigare sett att p = x obs. av p = X. För X Bi(, p) gäller att de är approximativt ormalfördelad om p(1 p) > 10 (vilket vi iofs ite vet uta får öja oss med att p (1 p ) > 10). Om X är approximativt ormalfördelad gäller det aturligtvis äve för p = X/ (fördelige har samma form som för X me de atar värdea 0, 1/, 2/,..., 1 i stället för heltale 0 till ). Vätevärde och varias för p härleds ekelt (exempel 1.2) p(1 p) p N (p, ) och ett approximativt kofidesitervall för p blir om p (1 p ) > 10 I p = p ± Ð /2 d(p ) = p ± Ð /2 p (1 p ) = x x ± Ð (1 x ) /2. Exempel 2.5. För att bilda sig e uppfattig om folks EU-sympatier tillfrågades 100 slumpmässigt valda persoer Tycker du att Sverige skall vara med i EU och 45 av de tillfrågade svarade Ja. Gör ett approximativt 95% kofidesitervall för p = P( E slumpmässigt vald perso svarar Ja ), dvs adele EU-ahägare. Lsg. Vi käer ige att x = 45 är e observatio av X Bi(, p) (om urvalet skett på lämpligt sätt), där = 100. p skattas med p = 45/100 = 0.45 och ett approximativt 95% kofidesitervall för p blir p I p = p ± Ð /2 d(p ) = p ± (1 p ) Ð 0.025 = 0.45 ± 0.0975 = [0.35, 0.55] = 0.45 ± 1.96 0.45(1 0.45) 100 = dvs itervallet mella 35% och 55% täcker med ugefär 95% saolikhet adele EU-ahägare blad befolkige. Itervallet får väl betraktas som tämlige brett och vi vet ite es om det är majoritet eller ej. Så vill ma ha smalare itervall får ma fråga fler, se tabell 2.1 där halva bredde 0.0975 av vårt itervall återfis. 23

2 INTERVALLSKATTNING Felmargiale (%) Atal tillfrågade i e udersökig,. Stöd i %, p 100 300 500 700 1000 1500 2000 3000 5/95 4.3 2.5 1.9 1.6 1.4 1.1 1.0 0.8 10/90 5.9 3.4 2.6 2.2 1.9 1.5 1.3 1.1 15/85 7.0 4.0 3.1 2.6 2.2 1.8 1.6 1.3 20/80 7.8 4.5 3.5 3.0 2.5 2.0 1.8 1.4 25/75 8.5 4.9 3.8 3.2 2.7 2.2 1.9 1.5 30/70 9.0 5.2 4.0 3.4 2.8 2.3 2.0 1.6 35/65 9.3 5.4 4.2 3.5 3.0 2.4 2.1 1.7 40/60 9.6 5.5 4.3 3.6 3.0 2.5 2.1 1.8 45/55 9.8 5.6 4.4 3.7 3.1 2.5 2.2 1.8 50/50 9.8 5.7 4.4 3.7 3.1 2.5 2.2 1.8 Tabell 2.1: Tabell över Ð 0.025 d(p ) = Ð 0.025 p (1 p )/ för ett skattat p i Bi(, p). I sambad med e tveksam opiiosudersökig agåede malmöboras itresse av e bro över Öresud (ia de byggdes) publicerade Sydsveska e likade tabell. Ma ser att att felmargiale blir lite då atalet tillfrågade är stort och då stödet är lågt frå 50%. För ågra av värdea i övre västra höret är dock ite villkoret för ormalapproximatio uppfyllt. Exempel 2.6. Atalet jordskalv uder ett år i ett område ases vara poissofördelat med parameter Ñ, dvs om X i = atal jordskalv uder ett år gäller X i Po(Ñ). Uder e tioårsperiod registrerades vardera x i : 1 3 1 2 6 1 1 0 0 2 skalv som är observatioer av X i. Atag att atalet skalv frå år till år är oberoede av varadra och gör ett approximativt 95% kofidesitervall för Ñ. Utgå frå att ML-skattige av Ñ är Ñ = x (exempel 1.5). Lsg. Ñ skattas med Ñ = x = 1 x i = 17 10 = 1.7. För e poisso-fördelig X i Po(Ñ) gäller att de är approximativt ormalfördelad om Ñ > 15 så det ka ma ju kappast påstå att de är i det här fallet. Me det spelar ige roll eftersom det är skattiges fördelig vi är itresserade av. Nu är det tveksamt om ma i e allmä situatio ka hävisa till cetrala gräsvärdessatse för ett medelvärde mella 10 observatioer, me här vet vi ju att 10 X i Po(10Ñ) som är approximativt ormalfördelad eftersom 10Ñ = 17 > 15 och skattige är ju bara e omskalig av dea summa så äve de är approximativt ormalfördelad. Vi behöver bara bestämma vätevärde och stadardavvikelse för skattige för att precisera fördelige. Eftersom E(X i ) = V (X i ) = Ñ fås E(Ñ ) = E( 1 X i ) = 1 E(X i ) = 1 Ñ = Ñ V (Ñ ) = V ( 1 Itervallet blir Ñ N (Ñ, X i ) = 1 2 V (X i ) = 1 2 Ñ ), och d(ñ ) = Ñ = Ñ = Ñ x. I Ñ Ñ ± Ð /2 d(ñ ) = x ± Ð 0.025 x = 1.7 ± 1.96 1.7 10 = [0.90, 2.51]. Observera alltså att för att e skattig av Ñ i e poissofördelig skall vara approximtivt ormalfördelad räcker det med att summa av observatioera är mist femto. 24

2 INTERVALLSKATTNING 2.4 Trasformatio av itervallskattigar I blad har ma itresse i att trasformera sia itervall till ågo aa storhet, t.ex geom ett ehetsbyte. Har ma gjort e itervallskattig för e parameter θ och fått det till I θ = [g 1, g 2 ] och seda är itresserad av e fuktio av θ, f (θ), får ma helt aturligt ett kofidesitervall för f (θ) som I f (θ) = [f (g 1 ), f (g 2 )]. För att detta skall fugera måste fuktioe f vara mooto (dvs strägt växade eller strägt avtagade) i det område där θ är defiierad. I det fall då f är strägt avtagade byter ma plats på gräsera efter trasformatioe så att de mista kommer först. Exempel 2.7. E idustri släpper ut vatte som är föroreat av jär i ett vattedrag. För att udersöka hur järhalte späds i vattedraget har Aa mätt de på ett atal pukter edströms vattedraget. Ho har skattat ökige av järhalte per meter till = 0.0263 som är e observatio av N (, D( )). Skattige är baserad på = 10 observatioer och medelfelet blev d(θ ) = 0.0047 som är baserat på e variasskattig med f = 2 frihetsgrader. Hjälp Aa att göra ett 95% kofidesitervall för miskige av järhalte per 100 meter. Lsg. Vi börjar med att göra ett kofidesitervall för och ka seda trasformera detta till ett itervall för 100. Vi vet förvisso ite hur skattige är gjord (det kommer i avsittet om regressiosaalys) me de är ju ormalfördelad så vi ka aväda malle I = ± t /2 (f )d( ) = ± t 0.025 (8)d( ) = 0.0263 ± 2.31 0.0047 = = [ 0.0372, 0.0153]. Detta itervall ka vi trasformera till det sökta I 100 = 100I = [ 100 ( 0.0372), 100 ( 0.0153)] = [1.53, 3.72]. Exempel 2.8. Ma har följade 8 observatioer frå e logormalfördelig, X i Ä(Ñ, ) (dvs l X i N (Ñ, )). x i : 9.4 6.4 7.4 6.3 8.3 7.0 8.1 8.4 1. Gör ett 95% kofidesitervall för Ñ. 8 8 Räkehjälp: l x i = 16.221 och (l x i ) 2 = 33.031 Lsg. 2. Mediae i e logormalfördelig är x 0.5 = e Ñ. Gör ett 95% kofidesitervall för mediae. 1. Här behöver vi ite trasformera ågot itervall uta vi ka trasformera observatioera till y i = l x i eftersom dessa är observatioer av Y i N (Ñ, ). Med räkehjälpe och 25

2 INTERVALLSKATTNING räkeregel (1.1) för varias skattas Ñ och 2 eligt Ñ = ȳ = 1 y i = 1 8 16.221 obs. av Ñ N (Ñ, ) ( 2 ) = s 2 = 1 1 ( (y i ȳ) 2 = 1 ) 2 yi 2 1 y i = 1 = 1 7 (33.031 1 8 16.2212 ) = 0.020. Ett 95% kofidesitervall för Ñ fås till I Ñ = Ñ ± t /2 (f )d(ñ ) = ȳ ± t 0.025 (7) s = 2.0276 ± 2.36 = [1.91, 2.15]. 0.020 8 = 2. Itervallet I Ñ ka vi trasformera till ett 95% kofidesitervall för mediae x 0.50 = e Ñ I e Ñ = [e 1.91, e 2.15 ] = [6.8, 8.6]. 2.5 Kofidesitervall för 2 i ormalfördelige Vid ormalfördelade observatioer är det i regel vätevärdet ma är itresserad av att skatta, observatioeras varias behöver vi skatta för att de igår i variase för skattige av vätevärdet. Me ma ka äve göra kofidesitervall för observatioeras varias. Vi har sett att de variasskattigar vi gjort i sambad med ormalfördelig har varit relaterade till Õ 2 -fördelige geom Q 2 Õ2 (f ) där Q är kvadratsumma i variasskattige och 2 de okäda varias som skattas och f det tal ma χ2 1 α/2 (f) χ 2 α/2 (f) Figur 2.5: Täthetsfuktioe till e Õ 2 (4)-fördelig. Area mella de två kvatilera är 1. delar Q med för att få skattige av 2. Det gäller i båda formera av variasskattig vi stött på hittills ( 2 ) = s 2 = 1 1 (x i x) 2 = Q f eller ( 2 ) = s 2 p = ( 1 1)s 2 1 + ( 2 1)s 2 2 + + ( k 1)s 2 k ( 1 1) + ( 2 1) + + ( k 1) = Q f. 26