F12 Stickprovsteori, forts

Relevanta dokument
Grundläggande matematisk statistik

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Föreläsning 2: Punktskattningar

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

a) Beräkna E (W ). (2 p)

1. Test av anpassning.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

θx θ 1 om 0 x 1 f(x) = 0 annars

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Föreläsning G04: Surveymetodik

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

4.2.3 Normalfördelningen

TMS136: Dataanalys och statistik Tentamen med lösningar

S0005M V18, Föreläsning 10

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Föreläsning G70 Statistik A

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Formelblad Sannolikhetsteori 1

F10 ESTIMATION (NCT )

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Introduktion till statistik för statsvetare

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Matematisk statistik TMS063 Tentamen

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

SAMMANFATTNING TAMS65

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Datorövning 2 Fördelningar inom säkerhetsanalys

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

2. Konfidensintervall för skillnaden mellan två proportioner.

Tentamen i matematisk statistik

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Avd. Matematisk statistik

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Tentamen i Sannolikhetsteori III 13 januari 2000

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Datorövning 2 Fördelningar inom säkerhetsanalys

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Matematisk statistik

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Borel-Cantellis sats och stora talens lag

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Föreläsning G70 Statistik A

Id: statistik.tex :48:29Z joa

Tentamen i Matematisk statistik för V2 den 28 maj 2010

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Stokastiska variabler

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Genomsnittligt sökdjup i binära sökträd

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

101. och sista termen 1

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Jag läser kursen på. Halvfart Helfart

================================================

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

STATISTIK FÖR LÄKARSTUDENTER

TENTAMEN I MATEMATISK STATISTIK

b 1 och har för olika värden på den reella konstanten a.

Lösningar och kommentarer till uppgifter i 1.1

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR CDEFI, NANO OCH PI, MAS233, 2004 FMS 012, FMS 022, FMS 121 OCH MAS233

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Transkript:

F12 Stickprovsteori, forts 5.4 Cetrala gräsvärdessatse IsistaexempletvidF10hadeviefördelig fx i )=1/3, x i =1,2,3 Eobservatiofrådeakasessomettstickprovav storlek=1. Vi såg geom att studera alla möjliga kombiatioer av, exempelvisx 1,X 2 ochx 3 för=3,attfördelige föry kudeskrivassom y 3 4 5 6 7 8 9 PY =y)=fy) 1 3 6 7 6 3 1 27 27 27 27 27 27 27 Fördelige för Y för ågra olika värde på illustreras eda Seda defiierade vi Y som summa av stycke oberoede observatioerx 1,...,X fråfx). fy) 0,5 0,4 = 1 fy) 0,3 = 2 Y =X 1 +...+X 0,3 0,2 0,2 0,1 0,1 UtfallsrummetförY förolikablir 0,0 0 1 2 3 4 y 0,0 y 1 2 3 4 5 6 7 = 1:S={1,2,3} = 2:S={2,3,4,5,6} = 3:S={3,4,5,6,7,8,9}. = k:s={k,k+1,...,3k}. fy) 0,2 0,1 0,0 2 3 4 5 6 7 8 = 3 9 10 y fy) 0,2 0,1 0,0 3 4 5 6 7 8 9 10 11 = 4 12 13 y Vad häder om vi ökar på till säg = 10, eller 100 observatioer? Ataletmöjligautfallolikastickprov)blir3 10 =59049 resp3 100 5. 10 47. Vi defiierade ett slumpmässigt stickprov som e samlig oberoede observatioer frå samma fördelig iid). Vidare hade vi defiitioe av ett medelvärde iettstickprovavstorlekeligt X= 1 X i i=1 somjuisigsjälvtblireslumpvariabelesummaav sv) dvs e statistika Vi härledde att och ) E X =EX i )=µ Var X ) = VarX i) = σ2 Cetrala gräsvärdessatsecgs) sid 292: Om X är stickprovsmedelvärde i ett slumpmässigt stickprov X 1,X 2,...,X av storlek frå e fördelig med ädligt vätevärde µ och ädligt positiv varias σ 2 såärdeyastokastiskavariabledefiieradeligt W = X µ σ/ ormalfördelad med EW) = 0 och VarW) = 1 omvilåter.dvs W = X µ σ/ N0,1) då

Alltså, oavsett vad det är för fördelig fx) frå vilke de eskilda observatioera kommer ifrå, så ka vi approximera fördelige för stickprovets medelvärde som är e sv) med e ormalfördelig. Detta ka vi göra om följade villkor är uppfyllda: 1. Vätevärdet för X existerar; 2. Variase för X existerar och är positivt 3. Om stickprovet är tillräckligt stort. Approximerige blir bättre ju större stickprov vi har. Ex) Addera 48beloppsomvartochettavrudatstill hela kroor. Avrudigsfele X 1,...,X 48 ka betraktas som oberoede sv. Vidare ka vi ata att dessa är likformigt fördeladekotiuerligt) i itervallet 0.5,0.5).VidareärisåfallEX i )=0 ochvarx i )=1/12.Detgeomsittligaavrudigsfelet är X= X 1+X 2 +...+X 48 48 och eligt CGS blir fördelige för dea approximativt ormalfördelad med vätevärde ) E X =EX i )=0 och varias Var X ) = VarX i) dvs X N ) 0, 1 576. = 1/12 48 = 1 576 Äve det totala avrudigsfelet T blir eligt CGS approximativt ormalfördelad med vätevärde 0 och varias VarT)=VarX i )=48/12=4 dvst N0,4). 5.5 Approximatioer MedCGSkavimotiveraedelförekligarvidsaolikhetsberäkigar. Om exempelvis Y är biomialfördelad med parametrar ochpsåär EY)=p och VarY)=p1 p) ocheligtcgskaviskriva W = Y p p1 p) = X p p1 p)/ där X =Y/ ärstickprovsgeomsittet i esekves av oberoede Beroulli sv. W är eligt CGS approximativt ormalfördelat N0, 1) om är tillräckligt stort. Därför approximera geom att istället ata att alt Y N[p,p1 p)] Y/= X N [ p, p1 p) Sätt helt ekelt i vätevärde och varias för e biomialfördelig i i ormalfördelige. ] Hur stort ska vara? Olika tumregler förekommer i litterature, tex p1 p) 5el.10 När ma ska beräka saolikheter mha av dea approximerig, kommer vi ihåg sk halvkorrektio se exempel 5.5-1). Vi aväder då PrY =y) = Pry 0.5<Y <y+0.5) = PrY <y+0.5) PrY <y 0.5) = [approximativt el CGS] = Φ y+0.5 p p1 p) Φ y 0.5 p p1 p) där Φx) beteckar fördeligsfuktioecdf e) för en0,1)fördelig.

Täkpåattförediskretsvgälleratt PrX x) PrX<x) ärxärettheltal,meförekotiuerligsv. gäller PrX x)=prx<x) Ex)LåtX b50,0.5)ochvisökerpr20 X 30). Detta skrivs om som Pr20 X 30) = PrX 30) PrX 19) = [approximativt el CGS] = Φ 30+0.5 25 50/4 Φ 19+0.5 25 50/4 = Φ1.556) Φ 1.556) = 0.9401 0.0599=0.8802 vilket ka jämföras med exakta beräkigar: PrX 30) PrX 19) = 0.940540 0.059460 = 0.88108 5.3 t-fördelige Vi defierar stickprovsmedelvärdet eligt X= 1 X i i=1 och stickprovsvariase eligt S 2 = i=1 Xi X ) 2 1 = i=1 X 2 i X 2 1 CGS säger att fördelige för stickprovsmedelvärdet Xtederarattärmarsigeormalfördeligär. Krave var att vätevärde och varias i de uderliggade fördelige existerade. I övrigt spelar det ige roll vad det är för uderliggade fördelig. Dessutom hade vi E X ) =EX) och Var X ) = VarX) VadgälleromX i aärormalfördelade? AtagattX i N µ,σ 2) föri=1,2,...,.detär relativt ekelt att visa attteorem 5.3-1) Z= X µ σ/ N0,1) ochkaske ite lika ekelt) att visa att för stickprovsvariases 2 gällerattteorem5.3-3) U = 1)S2 σ 2 χ 2 1) DessutomkadetvisasattZ ochu äroberoede. Vi gåriteipåbeviseidetaljutaläserdettakursivt. Me vi ska kua resultate! Vi skapar följade statistikasid 287) T = X µ S/ = X µ σ/ 1)S 2 σ 2 / 1) där X ärmedelvärdeochsärstadardavvikelseiett stickprov av oberoede ormalfördelade variabler. JämförvimedZochUovaserviattdettakaskrivas som T = Z där r= 1 U/r dvskvotemellaeormalfördeladsvochroteure χ 2 -fördeladsv,somäroberoede. Deayasvsägs vara t-fördelad med r frihetsgrader och vi skriver T tr) OBS! Viktig förutsättig: de eskilda observatioera måste varaiidn µ,σ 2).

4.4 F-fördelige Atag att vi har två oberoede ormalfördelade sv, X 1 N µ 1,σ 2 ) 1 och X 2 N µ 2,σ 2 ) 2 dvskvotemellatvåoberoedeχ 2 -fördeladesv,justerat förr 1 respr 2. DeayasvsägsvaraF-fördeladmed r 1 ochr 2 frihetsgraderochviskriver F Fr 1,r 2 ) Atag att vi dessutom har två oberoede stickprov, ettfrå vardera fördelig, av storlek 1 resp 2. Vi beräkarrespektivestickprovsvariass 2 1 ochs2 2 ochvi vetfråovaatt och U = 1 1)S 2 1 σ 2 1 χ 2 1 1) V = 2 1)S2 2 σ 2 χ 2 2 1) 2 ObserveraattUochV äroberoedetydekommerfrå två oberoede stickprov. Vi defiierar följade statistikaexempel 4.4-5) F = U/r 1 V/r 2 där r 1 = 1 1, r 2 = 2 1 t-fördelige behöver vi ite kua me... fx)= Γ ) r+1 2 Γ 1 1 ) r rπ 2 1+ x 2 ) r+1)/2 r där <x< och r=1,2,3... pos. heltal) och och EX)=0, r>1 VarX)= r r 2, r>2 Jämförävemedfigur5.3-2,sid288. F-fördelige behöver vi ite kua me... fx)= Γ ) r1 +r 2 ) r1 /2 2 r1 x r 1 2)/2 där Γ r 1 2 ) Γ r22 ) r 2 1+ r 1 r 2 x ) r 1 +r 2 )/2 0 x< och r 1,r 2 =1,2,3... pos. heltal) och och VarX)=2 EX)= r 2 r 2 1, r 2>2 r2 r 2 2 Jämförävemedfigur4.4-5,sid236. ) 2r1 +r 2 2 r 1 r 2 4), r 2>4

4.7 Tjebysjevs olikhet och Stora tales lag Teorem 4.7-1 Tjebysjevs olikhet OmslumpvariableXharvätevärdeµochvariasσ 2 sågällerförvarjek 1att Pr X µ kσ) 1 k 2 Beviset är i och för sig itressat att följa, me vad betyder teoremet? Förstiserviattkomplemethädelsetill X µ kσär X µ <kσvilketkaskrivasomeligt Dvs,mist100 1 1/k 2) %avallsaolikhetligger i itervallet µ kσ, µ+kσ) Sättiågraolikavärdepåk: k = 1:Prµ σ<x<µ+σ)>0 k = 2:Prµ 2σ<X<µ+2σ)>0.75 k = 3:Prµ 3σ<X<µ+3σ)>0.888... k = 4:Prµ 4σ<X<µ+4σ)>0.9375 eller illustrerat i ett diagram >75% X µ <kσ µ kσ<x<µ+kσ µ - 2σ µ µ + 2σ ochdåmåstedetgällaatt Prµ kσ<x<µ+kσ)>1 1 k 2 Stora tales lagsvaga), sid 257-258:. Låt X 1,...,X vara iid sv, dvs ett stickprov, med vätevärdeex i )=µochvariasvarx i )=σ 2 <. Defiiera som valigt stickprovsmedelvärdet eligt X= i=1 X i /. Dågällerförvarjevalavε>0att lim Pr X µ <ε ) =1 Vad betyder detta? X µ avser ju avstådet mella X och vätevärdet µ. Vi skriver om saolikhete för hädelse eligt ) Pr µ ε< X<µ+ε Vad stora tales lag säger är att, saolikhete för att X ska ligga i itervallet µ ε, µ+ε) kagörasgodtyckligtäraett,hurlitetviäväljerε, bara vi tar ett tillräckligt stort stickprov. Vi säger att X kovergerar i saolikhet mot µ.

F13 Iferes och Puktskattig Först lite repetitio: Cetrala gräsvärdessatsecgs): Låt X vara stickprovsmedelvärdet i ett slumpmässigt stickprovx 1,X 2,...,X avstorlekfråefördelig med ädligt vätevärde µ och ädlig positiv variasσ 2. Då är de ya stokastiska variable defiierad eligt W = X µ σ/ ormalfördelad med EW) = 0 och VarW) = 1 omvilåter.dvs Alltså, oavsett vilke fördelig fx) frå vilke de eskilda observatioera kommer ifrå, så ka vi approximera fördelige för stickprovets medelvärde med e ormalfördelig. Detta ka vi göra om följade villkor är uppfyllda: 1. Vätevärdet för X existerar; 2. Variase för X existerar och är positivt 3. Om stickprovet är tillräckligt stort. Approximerige blir bättre ju större stickprov vi har. W N0,1) Tjebysjevs olikhet OmslumpvariableXharvätevärdeµochvariasσ 2 sågällerförvarjek 1att eller alterativt uttryckt Pr X µ kσ) 1 k 2 Prµ kσ<x<µ+kσ)>1 1 k 2 Dvs,mist100 1 1/k 2) %avallsaolikhetligger i itervallet µ kσ, µ+kσ). Tex för k = 2 får ma Prµ 2σ<X<µ+2σ)>0.75 eller illustrerat i ett diagram Stora tales lagsvaga): Låt X 1,...,X vara iid sv, dvs ett stickprov, med vätevärdeµochädligvariasσ 2.Defiierasomvaligtstickprovsmedelvärdeteligt X= 1 i=1 X i. Då gällerförvarjevalavε>0att lim Pr X µ <ε ) =1 Vad betyder detta? Jo, att saolikhete för att X ska ligga i itervallet µ ε, µ+ε) kagörasgodtyckligtäraett,hurlitetviäväljerε, bara vi tar ett tillräckligt stort stickprov. Vi säger att X kovergerar i saolikhet mot µ. >75% µ - 2σ µ µ + 2σ

6.2 Puktskattig Vi har itroducerat modeller, dvs olika saolikhetsfördeligar. Dessa fördeligar är exakta beskrivigar av de saolikheter som vi associerar med olika hädelser som ka iträffa efter ett utfört experimet, tex PrX=2)=f2) Dessa fördeligar har haft e bestämd fuktioell form, tex Possiofördelat. Fördelige har vi kuat variera med olika värdepåeellerfleraparametrar,texpoλ). Dessa parametrar har också haft ett bestämt defiitiosområde, tex λ > 0. I praktike är valet av modell/fördelig kaske ekelt attkommaframtillochäveförsvarasomebeskrivigavdeaktuellasituatioemevimåstedåockså bestämma parametervärde. Hur ska detta göras? Iferesproblemet ka ofta formuleras som e sökig efter lämpliga parametervärde baserat på observatioer i form av ett stickprov, dvs X 1,X 2,...,X E statistika defiieras som e fuktio av stickprovets observatioer, dvs T =gx 1,X 2,...,X ) Exempel är stickprovsmedelvärde, -variaser, eller - regressioskoefficieter etc etc. Stora fråga: Givet val av modell och modelles parametrar, och givet ett stickprov, vilke statistika skall jag välja som e skattig av värdet på mia parametrar? De statistika jag väljer kallas e skattig eg. estimator) för mi parameter, och det umeriska värde som jag får fram kallas e skattigeg. estimate) av parameter. Estimator är alltså e fuktio av stickprovet. ML-metode Ex) Vi har ett experimet som bäst beskrivs av Poissofördelige me med λ okät. Vi har ett stickprov avstorlek=3somgavobservatioera1,3och4. Nuvetjagattmöjligavärdepåλärettavföljade: λ=0.5, 3eller10 Vilket värde är det saa? Mest troliga? Vi ka först bestämma simultafördelige för stickprovet: fx 1,x 2,x 3 ) = fx 1 )fx 2 )fx 3 )= = 3 k=1 λ x kexp λ) x k! = λx 1exp λ) x 1! = λ x 2exp λ) λ x 3exp λ) x 2! x 3! 1 x 1!x 2!x 3! λx 1+x 2 +x3 exp 3λ) = 1 144 λ8 exp 3λ) Isättigavdeolikavärdeapåλger fx 1,x 2,x 3 ; λ=0.5) = 1 144 0.58 exp 1.5) 6.052 10 6 fx 1,x 2,x 3 ; λ=3) = 1 144 38 exp 9) 5.623 10 3 fx 1,x 2,x 3 ; λ=10) = 1 144 108 exp 30) 6.498 10 8 Vilket av dessa ger störst likelihood? Detta är maximum likelihoodmetodeml). dvs, vi prövar med de olika parametervärde som är tillåta och väljer de som ger störstmaximum) värde på de simultaa saolikhets/täthetsfuktioe. Det valda värdet är det mest troliga, givet stickprovet.

Lite otatio: Parameter i fokus θ atas tillhöra ett defiitiosområdeω,dvsθ Ω. Vibetraktarfuktioegivetstickprovet,dvsx k aär giva och därmed kostata ite lägre att betrakta somsv). Viskriverdådettasom Lθ)=Lθ; x 1,...,x )=fx 1,...,x ; θ) och kallar detta för likelihoodfuktioe eller bara likelihoode. Dessutom brukar det ofta vara lämpligt att logaritmera fuktioe i syfte att förekla de fortsatta beräkigara. Iblad skriver vi loglθ)=llθ)=lθ) och kallar detta loglikelihoode. När vi så har aalyserat likelihoodfuktioe och hittat det värde på parameter θ som maximerar likelihoode så väljs detta som ML-skattige till parameter och beteckasoftamedˆθ. Detta ka ofta uttryckas som e fuktio av stickprovets observatioer dvs tex ˆθ=hx 1,x 2,...,x ) ˆθ= x OBS! Trots att de ursprugliga fuktioe f är e pmf eller pdf så är de ite ödvädigtvis det är vi betraktar de som e fuktio av parameter θ, med stickprovet hållet kostat. Dvs,Lθ)ärite epmf/pdfföretäktsvθ. Därav av amet likelihood, vilket ka översättas till trolighet dvs det mest troliga värdet på θ. Maximum likelihood är kaske de viktigaste och kaske valigaste skattigmetode. Att förstå metode, att kuaförklaradeochattkuatillämpadeiågra ekla fall är ett miimikrav på kurse! Ex, Uppg 6.2-3) Vi utökar exemplet tidigare till att omfattaheladefiitiosområdetförλdvsλ>0.dessutom låter vi stickprovsstorleke vara obestämt. De simultaa pmf e för stickprovet ka skrivas 1 Lλ) = k=1 x! λx k exp λ) k 1 = x 1!x 2! x! λ k=1 x k exp λ) Givet de observerade värdea i stickprovet öskar vi u prövaallavärdepåλförattsedaväljadetsomger störst värde. Hur gör vi detta? Max- miproblem: alltså derivera och sätt derivata likamed0. Lλ) λ = = ) 1 λ x 1! x! λσx k exp λ) = 1 ) λ Σx k exp λ) x 1! x! λ 1 λ Σx k 1 }{{} x 1! x! }{{} >0 >0 Σx k λ) }{{}} exp λ) {{} >0 Avdessafyratermerärallagaraterat>0,utomde tredjeochviserattdeakavaraollomm k=1 x k =λ Maximum, miimum eller aat? Derivera ige för test med adraderivataadra ordiges villkor)! Alterativ: logaritmera först! = Lättare att derivera!

Atagattvi harefuktiogz)medettmaximum/miimumiz 0. Atag hu) är e y fuktio som är mootot växadeiu. Dåharhgz))ettmaximum/miimumiz 0. Om u Lθ) visar sig ha ett globalt maximum i ågopuktdåharävellθ)ettglobaltmaximumi sammapukttylu)ärmoototväxade. Exforts,Uppg. 6.2-3)Vihade 1 Lλ)= k=1 x! λx k exp λ) k Deriveramapλochsättlikamed0,ger llλ) k=1 x = k =0 λ λ k=1 x k = = x=ˆλ Derivera ige för test med adraderivata: 2 llλ) λ 2 = ) k=1 x k=1 k x k = λ λ λ 2 Sätti xiställetförλ.dettager k=1 x k x 2 = x x 2 = x <0 alltså ett maximum! Det fas e statioär pukt, detta visar sig vara ettglobalt) maximum! Logartimerig ger 1 llλ) = log x! λx k exp λ) k=1 k = logx k!) + x k logλ λ k=1 k=1 Uppg. 6.2-9) Vi har X Expθ), θ > 0 och ett stickprov av storlek. a) Hitta ML-esimator. Två alterativa sätt redovisas, aochb. 1a. Formulera likelihoodfuktioe 1 Lθ) = fx i )= i=i i=iθ exp x ) i θ = 1 ) i=1 x θ exp i θ = 1 θ exp x ) θ 1b. Formulera likelihoodfuktioe och logaritmera 1 llθ) = l θ exp x )) ) θ 1 = l θ +l exp x )) θ = lθ x θ 2a. Derivera likelihoode och sätt till oll för att hitta statioära pukter Lθ) 1 = θ θ θ exp x )) θ = θ +1exp x ) + x θ θ +2exp x ) θ = ) x θ+1+ θ +2 exp x ) =0 θ ) x θ+1+ θ +2 =0 x = = ˆθ= x θ+1 θ+2 2b. Derivera loglikelihoode och sätt till oll llθ) = lθ x ) θ θ θ = + x θ θ 2 =0 = ˆθ= x = x

3a. Kotroll att detta är ett maximum, derivera ige för test med adraderivata 2 Lθ) θ 2 = θ θ +1exp x ) + x θ θ +2exp x )) θ = θ +2 +1 2 x+1) ) + x2 θ θ 2 exp x θ Isättigavˆθ= xger x +2exp )<0 alltså ett maximum. 3b. Kotroll att detta är ett maximum, derivera ige för test med adraderivata 2 llθ) θ 2 = + x ) θ θ θ 2 = 2 2 x θ θ 3 = θ 2 1 2 x ) θ Isättigav xiställetförθger x 2 1 2 x x ) = x 2 <0 alltså ett maximum. Slutsats 1: ML-estimator till θ är ˆθ = x, dvs stickprovsgeomsittet. Slutsats 2: Ofta är det betydligt eklare att logaritmera likelihoode först. b)variaseförsv X äralltid käd: Var X ) ) X1 +...+X = Var = 1 2VarX 1+...+X ) = 1 2VarX 1)+...+VarX )) = 1 2 VarX i)) = V X) = θ2 c) Vi har = 5 och observatioera giva så isättig ger skattige ˆθ= x= 3.5+8.1+0.9+4.4+0.5 5 =3.48 E viktig aspekt är vätevärdesriktighet eg. ubiased)defiitio6.2-1. Dvs,viväljerågostatistikaˆθ someestimatorförvårparameterθochiaviobserverar stickprovet är ju statistika e slumpvariabel. Vadärvätevärdetförˆθ,dvs E ˆθ ) =? I våra exempel ova: Poisso: ML-estimatorvar ˆλ= X och E ˆλ ) =E X ) =EX)=λ alltså e vätevärdesriktigvvr) estimator. Expoetial: ML-estimatorvarˆθ= X och E ˆθ ) =E X ) =EX)=θ alltså e vvr-estimator. I måga fall är ju parameter θ som vi skattar just fördeligesvätevärde,dvsθ=ex). Typiskt blir just ML-estimator just stickprovsmedelvärdet, dvs X. Vad säger Stora Tales lag om stickprovsmedelvärdet, dvs X? Stora tales lag säger att X kovergerar i saolikhet motex). Dea egeskap kallas kosistes eg. cosistecy), och om dea egeskap är uppfylld säger vi att estimator är kosistet. Vi har beskrivit ML-metode. Fis det adra priciper/metoder för att hitta lämpliga skattigar? OBS! ML-estimatorer är ite garaterat vvr!

Ex) Gammafördelige och ett stickprov av storlek, ) 1 lα,θ)=l Γα)θ k=1 αxα 1 k e x k/θ = lγα)) αlθ+α 1) lx k x θ Derivata map θ lα,θ) θ Derivata map α där lα,θ) α = α θ + x θ 2 =0 = Psiα) lθ+ lx k =0 Psiα)= Γ α) Γα) Detta ger ekvatiossystemet { x=αθ lxk /=Psiα)+lθ Mometskattig För att hitta skattigar för säg k olika parametrar behöver vi k olika momet. Atag att vi har ett stickprov frå gammafördelige. Vibehöverdåtvåmomettex { EX)=αθ E X 2) =VarX)+EX) 2 =α1+α)θ 2 ErsättEX)ochE X 2) ovamedmotsvaradestatistikor, dvs 1 xk = x resp 1 x 2 k vilket ger { x=αθ 1 x 2 k =α1+α)θ 2 ochlössedautαochθ. somviskallhittalösigartill. Tyvärrgårdetiteatt fia explicita lösigar med ekla formler! Valigare är att aväda vätevärde= 1:a mometet) och variase= kombiatio av 1:a och 2:a momete) dvs { EX)=αθ VarX)=αθ 2 Ersätt vätevärde och variase med motsvarade statistikor Detta ger x och s 2 { { x= α θ α= x s 2 = α θ 2 = 2 /s 2 θ=s 2 / x Ex) För ormalfördelige gäller att { EX)=µ VarX)=σ 2 Ersätt med motsvarade statistikor, dvs stickprovsmedelvärde och stickprovsvarias, ger mometskattigara { x= µ s 2 = σ 2 Mista kvadratmetode Typiskt avädbart är vi skattar vätevärde. Ma vill miimera summa av kvadrerade avvikelser till vätevärdet Q= X i µ) 2 i=1 Eftersom vi vill hitta det värde på µ som miimerar ovaståede, så deriverar vi: Q = µ i=1 µ X i µ) 2 = 2X i +2µ) i=1 = 2 X i +2µ=0 i=1 i=1 X i = ˇµ= = X Detärekeltattverifieraattdettaärettmiimum. Observera att vi ite har gjort ågra atagade om fördeligar. MK-metode ska vi återkomma till i regressiosaalyse.

F14 Iferes och Kofidesitervall Repetitio ML-metode Viharettstickprovx 1,...,x beståedeavobservatioer frå iid sv X 1,...,X fördelade eligt fx i ). Viskaskattaeparameterθ. 1. Formulera likelihoodfuktioe Lθ)= fx i ) i=1 2. Logaritmera likelihoodfuktioeför att evetuellt uderlätta) lθ)=llθ) 3. Derivera med avseede på θ, och kom ihåg att x i aärkostata llθ) θ 4. Sättderivatalika med0ochlös utθ. Svaretär vår kadidat som estimator. ˆθ=... 5. Kotrollera att det är ett maximum med adraderivata, dvs derivera e gåg till 2 llθ) θ 2 och sätt i ˆθ frå 4. i uttrycket. Adraderivata skadåvaramidreäoll. Uder vissa allmäa villkor är ML-estimatorer kosisteta, dvs ˆθ kovergerar i saolikhet mot det saa värdet θ. De är asymptotiskt ormalfördelade, dvs är sågårfördeligeförˆθmoteormalfördeliguder vissa allmäa villkor och lite slarvigt uttryckt). De är ofta effektiva, dvs de har relativt lite varias. Me, de är ite ödvädigtvis vätevärdesriktiga och ite heller ödvädigtvis uikaka fias flera). 6.4-6.7 Itervallskattig, Kofidesitervall Puktskattigar avser metoder att bestämma okäda parametervärde och vi har tex ML-metode. Väge dit gick via atagadet att stickprovet var givet, likasåvalavmodell/fördelig. Estimatorˆθförparameter θ uttrycks seda som e fuktio av stickprovet ˆθ=hx 1,x 2,...,x ) Vibetraktarjuobservatioerax 1,...,x somerealiserigavoberoedeslumpvariablerx 1,...,X. Alltså är också per defiitio varje fuktio av stickprovetstokastisktochspecielltärˆθesv. Dvs det fis e osäkerhet associerad med det valda värdet dvs skattige) som beror på slumpmässighete i stickprovet = KofidesitervallKI) Geerelltharviepuktskattigˆθförågoparameterθ. Vi bestämmer kofidesgrade 1 α. E kofidesitervall bildas seda eligt PrL θ U)=1 α NoteraattdetärLochU somärslumpvariableroch iteθsomjuäreokäd)kostatstorhet. VidareärLochU defiieradesomfuktioeravstickprovetstatistikor)ochl U. Vi ka skriva om ovaståede som PrL θ, U θ)=1 α DetgällersedaattfialämpligafuktioerLochU som ger de agiva kofidesgrade. Vi utgårifråhur ˆθ är fördelad, helstexaktmeofta duger e approximativ fördelig, tex ormalfördelige.

6.4 KI för medelvärde Betrakta ett stickprov X 1, X 2,...,X frå e ormalfördelig N µ,σ 2) därσ 2 atasvarakätochµ atas vara okät. Hur ära vätevärdet µ ligger stickprovsmedelvärdet X? = Aväd fördelige för X boke error structur )förattskapaettitervall somkaavädassom mått på osäkerhete. Vivetuatt X N µ, σ2 ochattvibörkuahittatvåpukteraochbsådaa ) Pr a X b =1 α Normeraförst X såattfördeligeärn0,1)dvs ) X µ σ/ =Z N0,1) Seda ka vi bestämma gräser utifrå de på förhad bestämd kofidesgrade1 α) för dea ormerade sv: Pr z α/2 Z z α/2 ) =1 α ] dvs saolikhete att Z ligger i itervallet [ z α/2,z α/2 är1 α.gräsera,ellerkvatilera,±z α/2 fåsfrå tabeller för ormalfördelige. Flytta om termer eligtse sid 355-356) dvs 1 α = Pr z α/2 X µ ) σ/ z α/2 = Pr X z α/2 σ µ X+ z α/2 σ ) = Pr = Pr därl<u. X+ z α/2 σ µ X z α/2 σ ) ) σ σ X z α/2 µ X+z α/2 = PrL µ U) L och U är slumpvariabler och saolikhete för att itervallet som bestäms av dessa skall täcka i det okäda µärgiveav1 α. Notera att L och U är fuktioer dels av stickprovet geom X), dels av de käda och icke-slumpmässiga kostatera σ, och kofidesgrade 1001 α)% som vi bestämde iledigsvis. Nuär,σoch1 αkostaterejstokastiska)me X ärdet. AlltsåärLochU stokastiska. När vi observerar ett stickprov sätter vi i det observerade stickprovsmedelvärdet x i gräsera ova. Notera att mittpukte för itervallet då blir just x. Notera också att ju större stickprov desto midre itervall. Tolkig av KI och kofidesgrad: Om vi upprepar förfaradet och drar flera stickprov kommer ugefär 1001 α)% av itervalle iehålla vätevärdet µ. Itressat observatio på sid 357: Hädelse µ [L, U] ka atige iträffa, med saolikhet eller ite iträffa, med saolikhet. Om vi upprepar stickprovsdragige säg m gåger och räkarataletgågerx somdetiträffarsåärdetta atal X fördelat med parametrar

I exemplet atogs ormalfördelig med käd varias vilket ledde till att gräsera bestämdes mha ormalfördeligskvatilerz α/2.hurgörmaiadraläge? Sesid 358-360. Normalfördelat me variase σ 2 är okäd, aväd att X µ S/ t 1) Gräsera bestäms då istället av t-fördeliges kvatilert α/2 1). Ejormalfördelatfråbörjamevariaseσ 2 är käd,avädcgssomsägeratt X µ σ/ N0,1) och kostruera itervall med kofidesgrade approximativtlikamed1 α).gräserabestäms avormalfördeligeskvatilerz α/2 eligttabell. Kräverattärstort. Ejormalfördelatochvariaseσ 2 ärokädme stickprovet ka ases vara tillräckligt stort, aväd att X µ S/ approx t 1) och aväd t-fördeliges kvatiler t α/2 eligt tabell. Detta står i boke me aväd med eftertake!) Ejormalfördelatochvariaseσ 2 ärokädme stickprovet ka ases vara tillräckligt stort, aväd att X µ S/ approx N0,1) ochavädormalfördeligeskvatilerz α/2 eligt tabell. Hur bra approximatioera ova fugerar ka variera kraftigt beroede på de uderliggade fördelige och stickprovsstorlek, se boke. Esidiga kofidesitervall Typiskt är att ma förlägger osäkerhete på bägge sidor om puktskattige, dvs dubbelsidiga kofidesitervall. Dessutom förlades lika delar av α i svasara, α/2 till väster och α/2 till höger Detta är ite ödvädigt, i pricip ka vi fördela saolikheteαhurvivill,litetillväster,mertillhöger. Eller allt till högereller väster). Iblad är ma edast itresserad av e edre eller övre) gräs för osäkerhete krig parameter θ, tex eligtse sid 360) ) σ Pr X z α µ =1 α Det esidiga itervallet blir då ) σ X z α, och X z α σ blireedregräsförµ. 6.5 KI för differeser av medelvärde Två typer är aktuella: 1. Tvåoberoedestickprovavstorlek 1 resp 2 som gertvåoberoedestickprovsmedelvärde X 1 resp X 2. Vi är itresserade av skillade mella vätevärdeadvsµ 1 µ 2. Vi ka ata vidare att variasera är käda eller ite käda, att de uderliggade fördelige är ormal eller ite ormal. Normalfördelat och käda variaser x 1 x 2 ±z σ2 1 α/2 + σ2 2 1 2 Normalfördelatochokädavariaser,σ 2 1 =σ2 2 x 1 x 2 ±t 1+ 2 2) s2 p + s2 p α/2 1 2 där s 2 p är de sk poolade variasskattige, se sid 365-366.

Okäd fördelig, okäda variaser och stora stickprov x 1 x 2 ±z s2 p α/2 + s2 p 1 2 2. Två stickprov där observatioera ka paras ihop. Ex,vidrarettstickprovochmätervidetidpukt och upprepar mätige vid e seare tidpukt. Vihardåtvåobservatioerperidividochäritresserade av de förvätade skillade, dvs µ D =µ 1 µ 2 Stickprovet är i praktike e samlig observerade differeserd i fråvilketviberäkarmedelvärde d och varias s 2 d och iferese baseras således på de observerade geomsittliga differese d= x 1 x 2 Normalfördelat och beroede observatioer, okäd variasσ 2 D d±t 1) s d α/2 6.6 KI för variaser Vi är itresserade av att bedöma osäkerhete äve i skattigar av variaser, dels för e eskild variasskattigˆσ 2 meävevidjämförelsermellatvåvariaser σ 2 X ochσ2 Y VikommerihågattomXärormalfördeladsåärstickprovsvariase fördelad eligt 1)S 2 σ 2 χ 2 1) dvs chi-två-fördelad med 1) frihetsgrader. Ett 1001 α)%kiförσ 2 bildassåledesursesid373) där [ 1)s 2 b ], 1)s2 a a=χ 2 1 α/2 1) och b=χ2 α/2 1) vilka är χ 2 -fördeliges respektive kvatiler edre ochövre). Förattjämföratvåvariaserkaviiställetföratttitta pådiffereseσ 2 X σ2 Y hellretittapåkvoteσ2 X /σ2 Y. Atag två oberoede stickprov, ett frå vardera fördelig,avstorlek X resp Y. Vikommerihågattom X N µ X,σ 2 ) X och Y N µ Y,σ 2 ) Y och tittar på stickprovsvariasera och U = X 1)S 2 X σ 2 X χ 2 X 1) dvsef-fördelig. Ett1001 α)%kiförkvote σ 2 X /σ2 Y bildassåledeseligt där och c= [ c s2 X s 2 Y, d s2 ] X s 2 Y 1 F α/2 X 1, Y 1) d=f α/2 Y 1, X 1) V = Y 1)S 2 Y σ 2 Y χ 2 Y 1) och bildar kvote så är dea fördelad eligt F = U/ X 1) V/ Y 1) F X 1, Y 1)

6.7 KI för proportioer Två variater aktuella i boke. Vi vill bilda ett KI för p i e biomialfördelig. Vi observerar Y lyckade av möjliga. Detta ka approximeras med e ormalfördelig om är tillräckligt storteligtcgs.vifåreskattigförpeligt vilket ger ˆp±z α/2 ˆp=Y/ ˆp1 ˆp) PåmotsvaradesättkavibildaettKIfördifferese mellatvåsaolikheterp 1 ochp 2 fråtvåolikabiomialfördeligar. Dea differes approximeras också med e ormalfördeligse boke). 6.8 Stickprovsstorlek Givetkofidesgrad1 αocheöskadhögstabredd på itervallet ka vi istället beräka vilke stickprovsstorlek som krävs. Ex)Vihar1 αochvillattbreddeförettkofidesitervall för µ ite överstiger B. Atag ormalfördelig. Vi hade σ σ Pr X z α/2 µ X+z α/2 )=1 α vilket ger ) σ σ 2 zα/2 σ X+z α/2 ) X z α/2 = B Lösut 4 z α/2 σ2 2 B 2 ochviharfåttdetmistasomkrävs...

F15 Iferes och Hypotesprövig Iledade exempel E perso påstår sig vara klärvoajat, ha ka med förbuda ögo avgöra om det blir kroa eller klave vidkastmedmyt. Om persoe bara gissar borde ha i sitt bara få hälfterätt,dvsp=1/2. Om p = 1 så kommer persoe att svara rätt varje gåg. E ollhypotes, H 0, att börja med, är p = 1/2, dvs persoe i fråga gissar. Hur ska vi testa detta påståede? Vi geomför ettexperimetmed12 kastochlåter X betecka rätt atal gissade utfall. Vi atar vidare att detärlikastorsaolikhetförkroasomförklave. HurärX fördelad? 12 oberoede kast med saolikhet p för rätt svar i varjeeskiltkast,alltsåärx Bi12,p). De flesta mäiskor, som kaske sakar förmåga, borde hamarut6rätt. Omvifåreobservatioxsomärtillräckligtstortsäg x csåbordeviförkastahypotese. Hurstortskavi välja c? Gräse c väljs så att saolikhete är lite att förkasta H 0 omh 0 ärsa. Förkasta H 0 betyder alltså att p > 1/2, dvs vi tror på persoes påståede. Nollhypotese betyder i detta fall, att ha bara gissar. SaolikheteattförkastaH 0 ärh 0 ärsa,beteckasα. Dea på förhad valda saolikhet kallas felriske eller sigifikasivå. Typiska värde är 0.5%, 1%, 5%, 10%. Uder det giva experimetet och förutsatt att persoe gissar p = 1/2) beräkas saolikhetera för olikavalavgräsceligt 12 α=prx c)= x=c 12 x ) 1 2 ) 12 dvs saolikhete att persoe svarar rätt c eller fler gåger. Väljer vi c = 10 som gräs för testet riskerar vi att påstå att persoe är klärvoajat är ha i själva verket bara hade e väldig tur; saolikhete för 10 eller fler rättasvarärca2%. Väljervic=9somgräsiställetärriskestörre: saolikheteför9ellerfler,ärdrygt7%. Vi observerar också att det ite går att miimera felriskehurmycketsomhelst. Äveomviskullekräva alla12rättfiseriskattfattafelbeslut;omälite så ädå 0.02%. Sigifikasivå bestäms av er! Hur stor risk för ett felaktigtbeslutärivilligaattta? Någraolikavärdepåcgerföljadevärdepåα c 9 10 11 12 α=px c) 0.0730 0.0193 0.0032 0.0002

Hypotesprövig, statistiska test Hypotesprövig eligt Neyma-Pearso har som utgågspukt Poppers sk fallibilism. Vi ka ite bevisa e hypotes, vi ka bara få stöd för att förkasta eller acceptera) de. Ex)Jagharsomhypotesattdetbaraexisterarvitasvaar. De seaste tre veckora har jag edast observerat vita svaar. Jag ka fortsätta att observera vita svaar ifleraårmejagharädåigetabsolutbevisförmi hypotes äve om jag blir mer och mer övertygad om attjagharrätt. Me,såfortjagobserverareaa sorts sva är hypotese direkt och absolut motbevisad! Ex)Jagtrorattadelevitasvaarärmist99%. På samma sätt får jag stöd för mi hypotes me de är aldrigbevisadäveomjagjagobserverar987vitaoch 13 fläckiga svaar. Ska jag fortsätta tro på mi hypotes eller bör jag ädra uppfattig? 8.1-8.3 Test Nollhypotese H 0 är alltidformuleraditermerav ett olläge, tex att två medelvärde är lika eller att e statistisk modell passar perfekt till data. Nollhypotese ställs mot e alterativ hypotes, mothypoteseh 1.Deaärformuleradsommotsatsetill ollhypotese. Varje test har e teststatistika. Dea är ofta baserad på de statistika vi aväder som puktskattig för parameter i fokus. Vidareärdekostrueradsåattvivethurdeärfördelad uder ollhypotese. Vi bestämmer ett kritisk område, säg C, baserad på fördelige för teststatistika, säg Z, och sigifikasivå α. Viobserverarettvärdez obs påz. Omz obs liggeric förkastash 0. Omz obs iteliggeric,accepterash 0. Första variate av test berör edast e ekel parameter, tex därµ 0 ärågottal. H 0 :µ=µ 0 H 0 :µ 1 =µ 2 H 0 :µ 1 µ 2 =0 Teste ka vara ekelsidiga eller dubbelsidiga vilket brukar ages av mothypotese, tex H 1 :µ<µ 0, H 1 :µ>µ 0, H 1 :µ µ 0 Typiska parametrar är vätevärde µ, proportioer p, differeserdellervariaserσ 2. Teststatistikoraäratigeormal-,t-ellerχ 2 -fördelade. Fördetvåsistamåsteihållaredapåataletfrihetsgrader! Typiska parametrar är vätevärde µ och proportioer pochdåtestasomdifferese,ärskildfråoll. När vi ma jämför två variaser testas istället om kvote ärskildfråett,dvs H 0 : σ2 1 σ 2 =1 2 Teste är atige ekelsidiga eller dubbelsidiga. Teststatistikora är atige ormal-, t- eller F-fördelade. De adra variate av test är jämförelser av två parametrar som kommer frå två olika fördeligargrupper),tex Fördetvåsistamåsteihållaredapåataletfrihetsgrader!

För ett test fis alltid fyra möjligheter varav två leder till felaktiga slutsatser: FörkastaH 0 FörkastaejH 0 H 0 ejfalsk TypIfel ok H 0 falsk ok TypIIfel Ex)AtagattvitestarH 0 :µ=µ 0.motH 1 :µ µ 0 Säg att µ = µ a, dvs µ µ 0. Då är det e styrka hos testet om vi med stor saolikhet förkastar ollhypotese. Ett test med mycket styrka är alltså ett bra test. Saolikhete för Typ I fel beteckas α, vilket alltså är felriske. Saolikhete För Typ II fel beteckas β. Styrka är alltså de betigade saolikhete att förkasta givetattµ=µ a. FörkastaH 0 FörkastaejH 0 H 0 ejfalsk α 1 α H 0 falsk 1 β β där1 β)ärtestetsstyrkaeg. power). Observera att det är betigade saolikheter, tex PrFörkastaH 0 H 0 ejfalsk)=α Styrkaärsåledesefuktioav µ a. Ju lägre bort µ a befier sig frå µ 0 desto starkare borde styrka vara, och omvät, om det saa värdet µ a råkar var ära µ 0 ka vi ite hoppas på mycket styrka. Vadärstyrkaomµ a =µ 0 dvsomdetsaavärdet påµverkligeärµ 0? Redovsig av e hypotesprövig: 1. Förutsättigar: Ett stickprov av storlek = 36 fråeormalfördelig medkädvariasσ 2 = 9. 2. Nollypotes:H 0 :µ=5 3. Mothypotes:H 1 :µ 5 6. Fördelig: Uder de giva förutsättigara och uder atagadet att ollhypotese är sa, är teststatistika Z N0,1). Om speciella atagade behövs, ages dessa, tex eligt CGS så ärz approximativtn0,1). 7. Kritiskt värde/område: Defiiera uder vilka omstädigheter vi skulle förkasta H 0 ; tex om vi observerar z obs > 1.960 = z 0.025. Detta är ekvivalet med att vi observerar 4. Sigifikasivå/Felrisk:α=5% x> 3 6 1.960+5=5.98 5. Teststatistika: Z = X µ 0 σ/ = X 5 3/6 eller x< 3 6 1.960+5=4.02

Alterativ 1. 8. Beräkigar: Vi beräkar medelvärdet till 4.01. 9. Slutsats:ViförkastarH 0 ty x=4.01<4.02.det observerade medelvärdet är sigifikat skilt frå 5 på 5%-ivå. Data stöder ite påståedet att µ=5. Alterativ 2. 8. Beräkigar: Vi beräkar medelvärdet till x = 4.35. 9. Slutsats:Vi kaite förkastah 0 ty4.02< x< 5.98. Det observerade medelvärdet är ite sigifikat skilt frå 5 på 5%-ivå. Det fis ite tillräckligt stödidataförattförattförkastapåståedetatt µ=5. Tredje variat av test berör om e modell ka sägas vara rätt beskrivig av hur data har geererats. 8.5 Chi-två-test för goodess-of-fit Ett experimet med k stycke disjukta och uttömmadeutfalla i därkärettädligttal,utförs. Varje utfall har e viss saolikhet p i = PA i ) att iträffa. ViharalltsåattΣp i =1. Seda upprepas experimetet gåger. Räka atalet gåger som A i iträffar och betecka dettaatalmedy i. Detförvätade ataletgågerey i )somvibordese hädelsea i,givetp i och,äralltsåp i. EftersomΣp i =1harviattΣp i =.Dessutomär ΣY i =. DesimultaafördeligeförallaY k äralltsådesk multiomialfördelige, se sid 523: fy 1,...,y k )= ) y p 1 y 1,...,y 1 py 2 2 py k k k därallay i ärpositivaheltalmedvillkoret och y 1 +y 2 +...+y k 1 y 1 y 2... y k 1 =y k Utabevispåståsuatt k y Q= i p i ) 2 i=1 p i ärapproximativtχ 2 -fördeladmedk 1frihetsgrader. Om de kvadrerade skillade mella observerat och förvätat,dvsy i p i ) 2 iförhålladetillförvätade p i ärstor,tyderdettapåattatagadeauderollhypotese kaske ite håller. Då blir summa Q stor. Om alla skillader är små blir summa lite. = Vi haretttestattpröva omeuppsättigsaolikheter passar till data. Ex) Viatarattettdatamaterial om=100observatioerärpoissofördelatmedλ=3. Vi ataratt vi observerar följade: i y i p i p i 0 11 0.049787 4.9787 1 34 0.149361 14.9361 2 22 0.224042 22.4042 3 15 0.224042 22.4042 4 9 0.168031 16.8031 5 6 0.100819 10.0819 +6 3 0.083918 8.3918 Σ 100 1 100

Saolikhetera uder H 0 är agiva i tabelle ova uder p i, likaså det förvätade atalet observatioer perutfall,uderp i. Testet formuleras H 0 : dataärfråepo3) H 1 : dataärej fråepo3) Sigifikasivå väljs till α = 5%. Teststatistika är Q 6 = förv obs) 2 förv somärχ 2 -fördeladmed6frihetsgrader. Kritiskgräs ärχ 2 0.05 6)=12.59.Beräkigger Q 6 = 11 4.9787)2 4.9787 +...+ 3 8.3918)2 8.3918 =42.8094>12.59 och ollhypotese förkastas. Datamaterialet är sigifikat skilt frå e P o3)-fördelig. Ka det ädå vara Poissofördelat me med ett aat värdepåλ?skattaλförst! Vi observerar att medelvärdet är x = ˆλ = 2.07. Vi testar med detta värde istället. Testet formuleras H 0 : dataärfråepoissofördel. H 1 : dataärej fråepoissofördel. Ny tabell med ya saolikheter och förvätade atal blir Ny teststatistika blir i y i p i p i 0 11 0.126186 12.6186 1 34 0.261205 26.1205 2 22 0.270347 27.0347 3 15 0.186539 18.6539 4 9 0.096534 9.6534 +5 9 0.059190 5.9190 Σ 100 1 100 Q 4 = obs förv) 2 förv somärχ 2 -fördeladmed4frihetsgrader. Kritiskgräs ärχ 2 0.05 4)=9.488ochberäkigger Q 4 = 11 12.6186)2 12.6186 =5.886<9.488 +...+ 9 5.9190)2 5.9190 Nollhypotese ka ite förkastas, resultatet är ite sigifikat skilt frå e Poisso-fördelig. Allmät: Atalet frihetsgrader = k 1 atalet parametrar som skattas. Testetärkäsligtförklassermedettlitetataliförväta. E koservativ tumregel är att de förvätade ataleskavarastörreä5,dvs p i >5 el. 1 församtligaklasser. Omsåiteärfalletkamaslå ihop klasser. Om ma vill testa för e kotiuerlig fördelig måste utfalle klassidelas. Vilke klassidelig som väljs ka starkt påverka resultatet.

8.6 Oberoede i kotigestabeller Atag ett par av diskreta sv, X 1 och X 2, båda med ädligt utfallsrum. Saolikhetera ka skrivas upp i tabellform eligt 1 2 c Σ 1 p 11 p 12 p 1c p 1 2 p 21 p 22 p 2c p 2..... r p r1 p r2 p rc p r Σ p 1 p 2 p c 1 Omdessa äroberoede vetvi attdesimultaa saolikhetsfutioe är lika med produkte av margialera, dvs p ij =p i p j Omdessaäroberoede vetviattomvidrarettstickprovavstorlekärdetförvätadeataletavtypx,y) p ij =p i p j Detta skulle kua avädas för jämförelser mot det faktiskt observerade atalet i varje cell. Normalt är ju saolikhetera okäda. Låt y ij betecka atalet i cell i,j) och y i och y j betecka motsvarade margialer i stickprovet. Om oberoede gäller bör ma observera ˆp ij = y ij y i y j = ˆp i ˆp j Detta gäller uder atagadet om oberoedeoch att stickprovet är tillräckligt stort). Vi skriver där y ij y i y j 0 y ij ärobserveratatal och y i y j ärförvätatatal Om de kvadrerade skillade mella observerat och förvätat,dvsobs förv) 2 iförhålladetilltillförvätade förvätat värde är stor, tyder detta på att atagadea uder ollhypotese kaske ite håller. Då blirsummaqstor. Omskilladera ärallasmå blir summa lite. = Vi haretttestattpröva omeuppsättigsaolikheter passar till data. Test H 0 : X 1 ochx 2 oberoede H 1 : X 1 ochx 2 beroede Testfuktioeteststatistika) är Q= r obs förv) 2 c förv somärχ 2 -fördeladmedr 1)c 1)frihetsgrader. Kritiskgräsärχ 2 α r 1)c 1))därαärsigifikasivå ochdärrochcärataletraderrepkolumer. Ex)Viharkö2)ochpreferes3)ochudrarommä och kvior väljer likadat eller om valet är kösbudet. Vi observerar Test: Mä Kvior Σ A 46 54 100 B 78 72 150 C 143 107 250 Σ 267 233 =500 H 0 : Köochvaloberoede H 1 : Köochvalberoede Testfuktioeteststatistika) är Q 3 1)2 1) =Q 2 = r obs förv) 2 c förv som är χ 2 -fördelad med 2 frihetsgrader. Sigifikasivå5%gerdekritiskagräseχ 2 0.05 2)=5.991. FörkastaomQ 2 >5.991 Förvätat ataluder H 0 beräkastill Mä Kvior Σ A 53.4 46.6 100 B 80.1 69.9 150 C 133.5 116.5 250 Σ 267 233 =500 Vi har exempelvis för Kvior som väljer A det förvätade atalet ˆp =500 100 500 233 =100 233 1 ˆp 2 =46.6 500 500

Beräkigar ger. Q 2 = 46 53.4)2 53.4 +...+ 107 116.5)2 116.5 =3.7694<5.991 H 0 ka ej förkastas på 5% sig.ivå, hypotese om oberoede ka ej förkastas. Allmät: Testet är käsligt för celler med ett litet atal i förväta. E tumregel är att de förvätade atale skavarastörreä5,dvs y i y j >5 för samtliga celler i,j. Om så ite är fallet ka ma kollapsa dvs slå ihop kategorier...

F16 Iferes, sammafattig och kommetarer Puktskattigar Vihareparameterθsomvivillskattaochviharett stickprovx 1,x 2,...,x. Med ledig av ågo pricip kostueras e estimator ˆθ för parameter. Estimator är e fuktio av stickprovet ˆθ=hx 1,x 2,...,x ) Ia stickprovet har observerats betraktas de ju som e samlig iid slumpvariabler, och estimator är alltså e slumpvariabel ˆθ=hX 1,X 2,...,X ) som har e fördelig med vätevärde och varias, tex ˆθ N µ,σ 2 / ) och E ˆθ) =µ, Var ˆθ) =σ 2 / Egeskaper hos estimatorer. 1. Vätevärdesriktighet. Om vätevärdet för estimator är lika med parameter vi vill skatta, så är estimator vätevärdesriktigeg. ubiased) E ˆθ) =θ 2. Effektivitet.Vivillatteestimatorskahasålite varias som möjligt. Relativ effektivitet för jämförelsermellaestimatorer,texˆθ 1 ärkgågermer effektiväˆθ 2 om Var ˆθ2 ) Var ˆθ 1 )=k 3. Kosistes. E estimator är kosistet om saolikhete att hama ära det saa värdet θ ökar ju större stickprov vi har. Pr ˆθ θ >ε ) 0 är 4. Tillräcklighet.Eestimatorˆθärtillräckligomde iehåller all iformatio om parameter θ, som fis tillgäglig i stickprovet. Detta tas upp mer igåede på påbyggadskurse. Fis måga fler aspekter för att beskriva estimatorer, medetvåellertreförstaovaräckerförvårdel. Fis ästa iga restriktioer för hur e estimator ska kostrueras, i pricip är vad som helst tillåtet. Me, kom ihåg att vissa är bra och adra är dåliga med avseede på deras egeskaper, tex vätevärdes-riktighet och effektivitet. E pricip eller metod för att hitta estimatorer är MLmetode. Repetitio ML-metode Viharettstickprovx 1,...,x beståedeaviidobservatioer frå X 1,...,X fördelade eligt fx i ). Vi ska skatta e parameter θ. 1. Formulera likelihoodfuktioe Lθ)= fx i ) i=1 2. Logaritmera likelihoodfuktioeför att eve-tuellt uderlätta) lθ)=llθ) 3. Derivera med avseede på θ, och kom ihåg att x i aärkostata llθ) θ

4. Sättderivatalika med0ochlös utθ. Svaretär vår kadidat som estimator. ˆθ=hx 1,x 2,...,x ) 5. Kotrollera att det är ett maximum med adraderivata, dvs derivera e gåg till 2 llθ) θ 2 och sätt i ˆθ frå 4. i uttrycket. Adraderivata skadåvaramidreäoll. Uder vissa allmäa villkor är ML-estimatorer kosisteta, dvs ˆθ kovergerar i saolikhet mot det saa värdet θ. De är asymptotiskt ormalfördelade, dvs är sågårfördeligeförˆθmoteormalfördeliguder vissa allmäa villkor och lite slarvigt uttryckt). De är ofta effektiva, dvs de har relativt lite varias. Me, de är ite ödvädigtvis vätevärdesriktiga och ite heller ödvädigtvis uikaka fias flera). Ex) Beroulli/ Biomialfördelige Viobserverar4stettorfrå10stoberoedeBeroulliförsök. Vi vill skatta p. Vi ka välja att betrakta detta som e observatio frå e biomialfördelig dvs = 1, eller som = 10 oberoede observatioer frå e Beroullifördelig. Beroulli: Formulera likelihoode: 10 10 Lp) = fx i )= p x i1 p) 1 x i i=1 i=1 = p Σx i 1 p) 10 Σx i Logaritmera: = p 4 1 p) 6 llp)=4lp + 6l1 p) Derivera och sätt derivata lika med oll: llp) p = 4 p 6 1 p =0 Lösutp: ˆp= 4 10 Kotroll med adra ordiges villkor: 2 llp) p 2 = 4ˆp 6 2 p=ˆp 1 ˆp) 2 = alltså ett maximum. Biomial: Formulera likelihoode: = 4 6 ) 410 2 ) 1 4 2 = 125 3 <0 10 Lösutp: ˆp= 4 10 Kotroll med adra ordiges villkor: 2 llp) p 2 = 4ˆp 6 2 p=ˆp 1 ˆp) 2 = alltså ett maximum. = 4 6 ) 410 2 ) 1 4 2 10 = 125 3 <0 1 Lp) = fy i )= 10) p y 1 1 p) 10 y 1 i=1 y 1 = 10) p 4 1 p) 6 4 Logaritmera: llp)=l 10) + 4lp + 6l1 p) 4 Derivera och sätt derivata lika med oll: llp) p = 4 p 6 1 p =0

Kofidesitervall Nuharviepuktskattig,mehurbraärde? Det fis ju eosäkerhet då ju estimatet är e realiserig av e slumpvariabel. Vi vet oftast) hur estimator är fördelad. Håll bara reda på om det är ormalfördelat,exakt eller approximativteligtcgs),t-fördelat,χ 2 -ellerf-fördelat. Ex) Atag stickprovet är frå e ormalfördelig med kädvarias. Vivetsedatidigareatt X N µ,σ 2 / ). Dåkaviocksåhittatvåpukter xochxsådaaatt Pr x X x ) = Pr = 1 α µ z α/2 σ X µ+z α/2 σ ) där kvatilera, ±z α/2 fås frå tabeller för N0,1) fördelige. Detta illustreras eda µ - 1.96σ / µ + 1.96 σ / Area = 0.95 x x x µ x x 95% av alla stickprovsmedelvärde hamar här Fördelig för stick- provsmedelvärdet X x 2.5% av alla stickprovs- medelvärde hamar här 2.5% av alla stickprovsmedelvärde hamar här Eftersom avstådet mella µ och X är detsamma som avstådetmella X ochµkadettaskrivasomeligt sesid355) x Pr Pr Pr µ z α/2 σ < X <µ+z α/2 σ )=1 α X z α/2 σ < µ< X+z α/2 σ )=1 α Pr X+z α/2 σ >µ> X z α/2 σ )=1 α X z α/2 σ <µ< X+ z α/2 σ )=1 α ) X)) Pr L X <µ<u =1 α Stickprovsmedelvärde här ger KI som INTE täcker i µ x x - 1.96 σ / x x µ x x Stickprovsmedelvärde här ger KI som täcker i µ x x + 1.96 σ / x Stickprovsmedelvärde här ger KI som INTE täcker i µ Nuhar vi ågra olika observerade x att sätta i i uttrycket ova. Detta illustreras eda. Ekosekvessommaskaobserveraäratt ju större kofides desto bredare itervall dvs desto sämre precisio.

Lite kommetar agåede fråga om t -fördelige ochki Ugefärsåhärkamaläsaiedelböckerfrittkompilerat och översatt): Närhelst σ är okäd och fördelige för de eskilda observatioera ka atas vara ormal, så ska ma aväda t-fördelige med 1 frihetsgrader. Ofta är de uderliggade fördelige okäd eller det är kät att det ite är e ormalfördelig. Ettapproximativt1 α)100%kikadåkostrueras med t-fördelige ädå, om de uderliggade fördelige är symmetrisk, uimodal och kotiuerlig. I aat fall aväd ågo aa metod. Problemet är att bedöma hur sabbt CGS börjar få effekt. Ex)Vivillvetahurstortstickprovvibehöverförattfå ett95%kisomärhögst2ibredd,dvs x±1.vihar ocksåegaskabraidéomvadskommerattbli,säg σ 2 1.Precisioskravetskrivsdåsom t 1) 0.025 1 <1 Förågraolikavärdepåfårvi =5 t 1) 0.025 1 =1.243>1 =6 - - =1.049>1 =7 - - =0.926<1 =8 - - =0.834<1 alltså välj = 7. Alltså vi måste äve ta med hur atalet frihetsgrader förädras. Dessutom,ärdettabra? Kavivarasäkrapåatt Xär approx ormalfördelat? I slutäda kaske vi behöver ettsåstortstickprovattvimedgottsamvetekaavädaormalfördeligesz α direkt. Noteraocksåatt t r) α/2 z α/2 är r Hypotesprövig Nollhypotese H 0 är alltidformuleraditermerav ett olläge, tex att två medelvärde är lika eller att e statistisk modell passar perfekt till data. Nollhypotese ställs mot e alterativ hypotes, de sk mothypoteseh 1.Deaärformuleradsommotsatse till ollhypotese. Varje test har e teststatistika eller testfuktio. Dea är baserad på de statistika vi aväder som puktskattig för parameter i fokus. Vidareärdekostrueradsåattvivethurdeärfördelad uder ollhypotese. Vi bestämmer ett kritisk område, säg C, baserad på fördelige för teststatistika, säg Z, och sigifikasivå α. Viobserverarettvärdez obs påz. För ett test fis alltid fyra möjligheter varav två leder till felaktiga slutsatser: FörkastaH 0 FörkastaejH 0 H 0 ejfalsk TypIfel ok H 0 falsk ok TypIIfel Saolikhete för Typ I fel beteckas α, vilket alltså är felriske. Saolikhete För Typ II fel beteckas β. FörkastaH 0 FörkastaejH 0 H 0 ejfalsk α 1 α H 0 falsk 1 β β där1 β)ärtestetsstyrkaeg. power). Observera att det är betigade saolikheter, tex PrFörkastaH 0 H 0 ejfalsk)=α Omz obs liggeric förkastash 0. Omz obs iteliggeric,accepterash 0

Exempel med ekelsidigt test: AtagattvitestarH 0 :µ=µ 0 moth 1 :µ>µ 0. Kritisk gräs Om det är fallet att µ > µ 0, så är det estyrka hos testet om vi med stor saolikhet förkastar ollhypoteseetttestmed mycketstyrka äralltsåettbratest. Fördelig uder ollhypotese β Sa fördelig α Styrka är alltså saolikhete att förkasta givet att µ=µ a. Styrkefuktioe är således e fuktio av det saa värdet µ. µ 0 Acceptasområde C µ Förkastelseområde Julägrebortµbefiersigfråfråµ 0 destostarkare bordestyrkavara,ochomvät,omdetsaavärdetµ råkarvaräraµ 0 kaviitehoppaspåmycketstyrka. Styrka är i detta exempel) area uder de saa fördeligetillhöger omc,dvs1 β.olikavärde påµgerolikastoraareor. Vadärstyrkaomµ=µ 0? p-värde eller p-value Ex)VitäkerossettekelsidigttestH 0 :θ=θ 0 mot H 0 :θ>θ 0. Allmät om iferes Tre alterativa variater för iferes eligt de klassiska skola: Vi har e testfuktio säg Z. Vi har obeserverat stickprovet och beräkat testfuktioe till ett värde z. 1. Avädig av kofidesitervall. Vad är saolikhete att observera detta värde eller värreuderh 0?Dvsvadär PrZ>z) Dettaärdetskp-värdet. Täksåhär: Atag att det framräkade värdet z på testfuktioe Z sammafaller med de kritiska gräse C. Vad motsvarar detta för sigifikasivå α? Räka bakläges föratttaframettαsomgerjust z som kritisk gräs. Detta är vårt p-värde. 2. Test med fix riskivåsigifikasivå), de strikta variate eligt Neyma-Pearso. 3. Avädig av sk probability value, p-valuesaolikhetsvärde, sigificace probability), det som brukar redovisas i praktikefisher m fl). Valigasteäralt1och3. Koppligemellaalt1och2: seefteromparametervärdeteligth 0 liggeriki.kiiehållerallatäkbara värde på parameter som skulle accepteras som ollhypotes.

Alt 2 går formellt ut på att se hur saolikt utfallet av de valda teststatistika) är uder atagadet att ollhypotese är sa. Om saolikhete är lite tyder detta på att ollhypotese är falsk; ma får ett värde som ligger i riskeller förkastelseområdet. Detärviktigtatthållaredapåhurollhypoteseärformulerad, vad ma utgår ifrå. Ofta är de formulerad utifrå vad som är beräkigsbart, dvs ma väljer e ollhypotes varuder ma vet hur testfuktioe är fördelad. Exempel: Oberoedetestet tidigare, där ma vet hur Q är fördelad uder förutsättig att oberoede gäller. Om ma valde aorluda är det ite lägre uppebart hur testfuktioe ska kostrueras och hur de i så fall är fördelad. Exempel: Valigt test i regressiosaalyse är H 0 : β 1 =0 H 0 : β 1 0 där β 1 är regressioskoefficiete i de ekla lijära regressiosmodelle Y =β 0 +β 1 X+ε Här vet ma hur motsvarade testfuktio är fördelad uder ollhypotese och börjar således i de äda. OmmodellehållerbörsåledesH 0 förkastas. Eligt alt 3 fixerar ma ite sigifikasivå på förhad. Mageomföriställetsitttestochagersedaettpvärde vilket är saolikhete att få det faktiskt erhålla värdet på teststatistika eller ett mer extremt värde uder atagadet om e sa ollhypotes). Detta värde ager vid vilke sigifikasivå vi skulle överge ollhypotese. Ett p-värde på 0.07 motsvarar ett sigifikat resultat på 10%-ivå me ite på 5%-ivå. Det är upp till er att avgöra vad som är rimligt eller öskvärt. De flesta statistikprogramme Miitab, SPSS, SAS etc) brukar beräka p-värde vid olika test och aalyser. Är e ollhypotes ågosi sa i samhälls- och beteedeveteskapera? Ex)Atagattviäritresseradeav H 0 : IQärlikamellahögskolestuderadeochadra H 1 : IQärhögreförhögskolestuderade Omviobserverareskilladimellatvåstickprovpå 0.1 och att dea skillad är sigifikat, har detta ågo praktisk betydelse? Detekäd paradox attmaka ästa alltidfår ettsigifikatresultatdvsförkastah 0 )geomattta ett tillräckligt stort stickprov. Dvs,ökaochförellersearekommerviförmodlige attförkastah 0.

Hur hypotesprövig ka avädas/ missbrukas. Forskare A: Jämförelse mella två mediciska preparat, I och II. H 0 : µ I µ II =0 H 1 : µ I µ II >0 AtrorattpreparatIärbättreochvillfåstödfördetta. Me A har edast tillgåg till ett litet stickprov. Praxissedatidigare: α=5%. Aädrarriskivåtill 10%förattfåsigifikas,dvsförkastaH 0! Forskare B: Likade udersökig som A, me B håller fast vid α=5%. BtrorocksåvillocksåfåstödförtypI. Tar istället fler observatioer dvs ett större stickprov och ser till att de blir så måga att det blir ett sigifikat resultat! Forskare C: C är ekoom som tror på e stor och komplex atioalekoomisk modell. HärtrormapåH 0. H 0 : modellepassartilldata H 1 : modellepassaritetilldata Char lärtsig attommaharettlitetstickprovblir detsällasigifikatresultat! H 0 förkastasej) Forskare D: E sociolog vill ha e typ av faktoraalysmodell för e egeskap kallad alieatio. Dvill ite göra somcuta har ett stort stickprov. Då blir det sigifikat resultat och modelle förkastas. Då ädrar Dsimodell till ågotmerkomplext, med fler parametrar, och reducerar därmed atalet frihetsgrader. D har fått väldigt bra apassig till data me med få frihetsgrader. De mer komplexa modelle har kaske dessutom dåligt stöd i sociologisk teori. Forskare E: E tycker ite om idée med hypotesprövig och tycker ite att det fugerar särskilt bra. E blir Bayesia, dvs ho utgår frå e a prioriförhads-) uppfattig omdetsomärifokusochuppdaterarsiuppfattig baserat på observerade data. Forskare F: Vill ite som E sätta de ega subjektiva uppfattige i system och tror idémässigt på hypotesprövig. Istället resoerar ho att e modell alltid är e föreklig av verklighete och att ma aldrig ka förväta sig att e modell passar perfekt till data/verklighete. F ikluderar därför i si hypotesprövig, i H 0, möjlighete till avvikelser mella modell och data.