MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Relevanta dokument
MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Grundläggande matematisk statistik

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

1. Test av anpassning.

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Föreläsning 2: Punktskattningar

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Introduktion till statistik för statsvetare

Formelblad Sannolikhetsteori 1

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

TMS136: Dataanalys och statistik Tentamen med lösningar

F10 ESTIMATION (NCT )

θx θ 1 om 0 x 1 f(x) = 0 annars

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Matematisk statistik TMS063 Tentamen

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

4.2.3 Normalfördelningen

a) Beräkna E (W ). (2 p)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Föreläsning G04: Surveymetodik

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

S0005M V18, Föreläsning 10

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

2. Konfidensintervall för skillnaden mellan två proportioner.

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR CDEFI, NANO OCH PI, MAS233, 2004 FMS 012, FMS 022, FMS 121 OCH MAS233

Datorövning 2 Fördelningar inom säkerhetsanalys

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

b 1 och har för olika värden på den reella konstanten a.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

F12 Stickprovsteori, forts

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Föreläsning G70 Statistik A

SAMMANFATTNING TAMS65

Avd. Matematisk statistik

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Borel-Cantellis sats och stora talens lag

TENTAMEN I MATEMATISK STATISTIK

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Föreläsning G70 Statistik A

Tentamen i Sannolikhetsteori III 13 januari 2000

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Tentamen i matematisk statistik

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Datorövning 2 Fördelningar inom säkerhetsanalys

Matematisk statistik

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Id: statistik.tex :48:29Z joa

Genomsnittligt sökdjup i binära sökträd

STATISTIK FÖR LÄKARSTUDENTER

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

================================================

101. och sista termen 1

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 1: Matematik 7.5 hp

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Armin Halilovic: EXTRA ÖVNINGAR

TAMS15: SS1 Markovprocesser

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Transkript:

MS-A0509 Grudkurs i saolikhetskalkyl och statistik Sammafattig, del II G. Gripeberg Aalto-uiversitetet 14 februari 014 G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 1 / 3 1 Stickprov Estimerig 3 Kofidesitervall 4 Hypotesprövig 5 Korrelatio och regressio G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II / 3

Mätskalor Nomialskala: Olika grupper uta aturlig ordig. Ordialskala: Olika grupper med e aturlig ordig. Itervallskala: Numeriska värde, skillader meigsfulla, olla godtycklig. Kvotskala: Numeriska värde, aturligt ollvärde. Stickprov Målsättige är att få iformatio om slumpvariabel X som ite behöver vara reell. För att få iformatio gör ma tex. mätigar som ger resultate x 1, x,..., x och ma täker att x j är värdet av e slumpvariabel X j. Slumpvariablera X 1,..., X är ett stickprov av storleke och x 1, x,..., x är ett observerat stickprov av storleke. Vi atar valige och uta att säga det explicit) att X 1, X,..., X är oberoede och har samma fördelig, som är fördelige av de slumpvariabel vi är itresserade av. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 3 / 3 Obs! Atagadet att slumpvariablera X j i ett stickprov förutsätter att vi aväder dragig med återläggig, me detta villkor uppfylls sälla! Det fis dessutom måga adra större svårigheter är ma i praktike skall ta ett stickprov och detta är ett viktigt problem! Aritmetiskt medelvärde Om X j, j = 1,..., är ett stickprov av slumpvariabel X så är dess aritmetiska) medelvärde X = 1 X j och j=1 EX ) = EX ) och VarX ) = 1 VarX ). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 4 / 3

Stickprovsvarias Om X j, j = 1,..., är ett stickprov av slumpvariabel X så är dess stickprovsvarias S = 1 X j X ) 1 j=1 och vilket är motiverige för valet av 1 istället för i ämare) ES ) = VarX ). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 5 / 3 χ -fördelige Ifall X j N0, 1) är oberoede och Y = i=1 X i så säger vi att Y är χ -fördelad med frihetsgrader eller Y χ ). Då är EY ) = och VarY ) = och Y har täthetsfuktioe och f x) = 0 då x < 0. f x) = 1 ) x 1 e x, x 0. Γ Stickprovsvarias för ormalfördelige Om X j, j = 1,,..., är ett stickprov av e Nµ, σ ) fördelad slumpvariabel så gäller för stickprovsvariase 1 σ S χ 1). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 6 / 3

t-fördelige Ifall Z N0, 1) och Y χ m) är oberoede och W = Z 1 m Y så säger vi att W är t-fördelad med m frihetsgrader eller W tm). Då är EW ) = 0 om m > 1 och VarW ) = m m ) f x) = 1 Γ m+1 ) mπ Γ m om m > och täthetsfuktioe för W är 1 + x m ) m+1, x R. Stickprov av ormalfördelige Om X j, j = 1,,..., är ett stickprov av e Nµ, σ ) fördelad slumpvariabel så är X µ 1 S t 1). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 7 / 3 Puktestimat och estimator Atag att vi vet eller tror) att X är e slumpvariabel med frekves- eller täthetsfuktio f x, θ) där parameter θ som också ka vara e vektor) är okäd. Vad ka ma göra för att estimera eller skatta θ? Ta ett observerat stickprov x j, j = 1,..., Räka ut ett estimat ˆθ = gx 1, x,..., x ) där g är ågo fuktio. Observera att ˆθ är ett tal eller e vektor meda ˆΘ = gx 1, X,..., X ) är e slumpvariabel. Iblad är det fuktioe g som avses med ordet estimator och iblad slumpvariabel ˆΘ. Itervallestimat Istället för att bara räka ut ett tal eller e vektor) som estimat för e parameter ka ma också räka ut ett itervall. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 8 / 3

Mometmetode Om frekves- eller täthetsfuktioe f x, θ) för e saolikhetsfördelig är såda att θ ka skrivas som e fuktio av EX ), dvs. θ = hex )) där X har täthetsfuktioe f x, θ) så är mometestimator av θ ˆΘ = h 1 X j. Om parameter, eller parametrara ka skrivas som e fuktio hex ), EX )) blir estimator på motsvarade sätt ˆΘ = h j=1 X j, 1 ) j=1 X j. 1 j=1 G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 9 / 3 Maximum likelihood - metode Om f x, θ) är e frekves- eller täthetsfuktio för e saolikhetsfördelig så är Maximum likelihood -estimatet av θ talet θ sådat att L θ, x 1, x,..., x ) = max Lθ, x 1, x, x ), θ där Lθ, x 1, x, x ) = f x 1, θ) f x, θ)... f x, θ) är de sk. likelihood -fuktioe och x j, j = 1,..., är ett observerat stickprov av e slumpvariabel med frekves- eller täthetsfuktioe f x, θ). I det diskreta fallet är Lθ, x 1, x, x ) saolikhete för att ma då parameter är θ får det observerade stickprovet x j, j = 1,...,. I fallet med täthetsfuktio är h) Lθ, x 1,..., x ) för små positiva h ugefär saolikhete att få ett observerat stickprov y j, j = 1,..., så att y j x j < h för alla j. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 10 / 3

Kofidesitervall Ett kofidesitervall med kofidesgrade α för e parameter θ i e saolikhetsfördelig är e itervallestimator I X 1, X,..., X ) = [ax 1, X,..., X ), bx 1, X,..., X )] så att Pr θ I X 1, X,..., X ) ) = α. Oftast aväds också ordet kofidesitervall för itervallet I x 1, x,..., x ), dvs. värdet av slumpvariabel är ma fått ett observerat stickprov x j, j = 1,...,. Obs! Valige väljer ma kofidesitervallet symmetriskt så att Prθ < ax 1, X,..., X )) = Prθ > bx 1, X,..., X )) = 1 1 α). Oftast får ma öja sig med att villkore för kofidesitervallet gäller edast approximativt. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 11 / 3 Kofidesitervall för vätevärdet då X Nµ, σ ) Om X 1, X,..., X är ett stickprov med medelvärde X och stickprovsvarias S av e Nµ, σ ) fördelad slumpvariabel så är [ ) ) ] S 1 + α S X F 1 1 + α t 1), X + F 1 t 1), ett kofidesitervall för µ med kofidesgrade α. Kofidesitervall för p då X Beroullip) Om X 1, X,..., X är ett stickprov med medelvärde X av e Beroullip)-fördelad slumpvariabel så är X X 1 X ) F 1 N0,1) ) 1 + α, X + X 1 X ) F 1 N0,1) ett approximativt kofidesitervall för µ med kofidesgrade α. ) 1 + α G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 1 / 3

Obs! Ofta aväds beteckige t α = t α m) = F 1 tm) α), vilket alltså betyder att om X är e tm) fördelad slumpvariabel så är PrX t α ) = PrX t α ) = α och Pr X t α ) = α. Motsvarade beteckig för ormalfördelige N0, 1) är z α. Kofidesitervall för σ då X Nµ, σ ) Om X 1, X,..., X är ett stickprov med stickprovsvarias S av e Nµ, σ ) fördelad slumpvariabel så är [ ] 1)S 1)S ), ) F 1 χ 1) 1+α F 1 χ 1) 1 α ett kofidesitervall för σ med kofidesgrade α. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 13 / 3 Hypotesprövig Ma prövar om det fis skäl att förksasta e hypotes H 0, ollhypotese, och i stället acceptera dess alterativ H 1. För att kua göra ågra beräkigar måste ma som ollhypotes välja ett tillräckligt etydigt påståede, tex. θ = θ 0 och ite θ θ 0 som är för diffust. Oftast räcker det om ollhypotese har ett etydigt extremfall, tex. θ θ 0. I ollhypotese igår oftast måga adra atagade om fördeligar, oberoede osv. som ka ha stor betydelse för resultatet. När ma tagit ett stickprov räkar ma ut e testvariabel vars fördelig ma åtmistoe approximativt käer till. Med stöd av ollhypotese räkar ma ut saolikhete, det sk. p-värdet, för att testvariabel får ett mist lika extremt värde i förhållade till ollhypotese som det observerade stickprovet gav. Om p-värdet är midre ä e give sigifikasivå förkastar ma ollhypotese och accepterar de alterativa hypostese H 1. Sigifikasivå är alltså saolikhete för att ma förkastar ollhypotese trots att de gäller. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 14 / 3

Normalfördelig, H 0 : Vätevärde = µ 0 X j, j = 1,,..., atas vara ett stickprov av X där X Nµ, σ ). H 0 : µ = µ 0. Testvariabel: T = X µ 0 S t 1). p-värde: F t 1) x µ 0. s Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, t α, ) där t α = F 1 t 1) α ) = F 1 t 1) 1 α ). ) t α G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 15 / 3 Normalfördelig, H 0 : Vätevärde µ 0 eller µ 0 ) X j, j = 1,,..., atas vara ett stickprov av X där X Nµ, σ ). H 0 : µ µ 0 eller µ µ 0 ). Testvariabel: T = X µ 0 S t 1). )) p-värde: F t 1) x µ 0 x µ eller F t 1) 0. s s Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde t α, ) eller, t α )) där t α = F 1 1 t 1) α) = Ft 1) 1 α). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 16 / 3

Adel eller saolikhet, H 0 : p = p 0 X j, j = 1,,..., atas vara ett stickprov av X där X Beroullip). H 0 : p = p 0. Testvariabel: Z = X p 0 p 0 1 p 0 ) a N0, 1). Approximativt p-värde: F N0,1) x p 0 p 0 1 p 0 ) Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, z α ) z α, ) där z α = F 1 N0,1) α ) = F 1 N0,1) 1 α ). Alterativt exakt med p-värdet 1 F Bi,p) p 0 + x p 0 ) 1) + F Bi,p) p 0 x p 0 )). Likadaa modifikatioer för esidiga hypoteser som för vätevärdet av e ormalfördelad slumpvariabel. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 17 / 3 Normalapproximatio X j, j = 1,,..., atas vara ett stickprov av X med e fördelig så att f X 1,..., X ) a Nθ, σ ). H 0 : Ef X 1,..., X )) = θ 0. Testvariabel: Z = f X 1,..., X ) µ 0 σ estimat av σ är H 0 gäller. Approximativt p-värde: F N0,1) a N0, 1) där σ är ågot f X 1,...,X ) θ 0 σ Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, z α ) z α, ) där 1 = FN0,1) α ) = F 1 N0,1) 1 α ). z α ). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 18 / 3

Normalfördelig, två stickprov, samma varias, H 0 : Samma vätevärde X j, j = 1,,..., x och Y j, j = 1,,..., y atas vara stickprov av X Nµ x, σ ) och Y Nµ y, σ ) och alla slumpvariabler är oberoede. H 0 : µ x = µ y. X Y Testvariabel: T = t x + y ). x 1)Sx + y 1)Sy x + y 1 x + 1 y ) x y p-värde: F tx + y ) x 1)sx + y 1)sy x + y 1 x + 1 y ) Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, t α ) t α, ) där 1 = Ft x + y ) α ) = F 1 t x + y ) 1 α ). t α G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 19 / 3 Två adelar eller saolikheter X j, j = 1,,..., x och Y j, j = 1,..., y atas vara ett stickprov av X och Y där X Beroullip x ) och Y Beroullip y ). H 0 : p x = p y eller p x p y ). Testvariabel: Z = X Y ˆP1 ˆP) 1 x + 1 y ) a N0, 1) där ˆP = xx + y Y. x + y x y Approximativt p-värde: F N0,1) ˆp1 ˆp) 1 x + 1 y ) )) eller F N0,1) x y ˆp1 ˆp) 1 x + 1 y ) Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, z α ) z α, ) där 1 = FN0,1) α ) = F 1 N0,1) 1 α ) eller i mägde z α, )). z α G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 0 / 3.

Apassig eller Goodess-of-fit X j, j = 1,..., atas vara ett stickprov av e slumpvariabel med värdemägd m k=1 A k där mägdera A k är disjukta. H 0 : PrX A k ) = p k, k = 1,..., m. O k E k ) Testvariabel: C = m k=1 E k a χ m 1) där E k = p k och O k är atalet elemet i { j : X j A k }. p-värde: 1 F χ m 1)c) Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde F 1 1 α), ). χ m 1) Om p k = p k θ 1,..., θ j ) och dessa parametrar estimeras med stickprovet så gäller C a χ m j 1). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 1 / 3 Obs! Om X j, j = 1,..., är ett stickprov av e Beroullip)-fördelad ) slumpvariabel så är = 1 k=0 X p p1 p) O k E k ) E k där E 0 = 1 p), E 1 = p, O 0 = j=1 X j och O 1 = j=1 X j, dvs. de förvätade och observerade atale ollor och ettor. Oberoede X j, j = 1,..., atas vara ett stickprov av e slumpvariabel med värdemägd r i=1 c k=1 A i,k där mägdera A i,k är disjukta. H 0 : PrX A i,k ) = p i p k, i = 1,..., r och k = 1,..., c. O i,k E i,k ) E i,k Testvariabel: C = r c i=1 k=1 O i,k är atalet elemet i { j : X j A i,k } och E i,k = 1 c m=1 O i,m) r m=1 O m,k). p-värde: 1 F χ r 1)c 1))c) a χ r 1)c 1)) där Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde F 1 1 α), ). χ r 1)c 1)) G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II / 3

F-fördelige 1 Ifall Y χ m) och X χ ) så är m Y 1 Fm, ), dvs. följer X F-fördelige med parametrara eller firhetsgradera) m och. Täthetsfuktioe för dea fördelig är f Fm,) x) = 1 x B m, ) m x) m Γa)Γb) m x+) m+ där Ba, b) = Γa+b). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 3 / 3 Variaser X j, j = 1,,..., x och Y j, j = 1,,..., y atas vara stickprov av X Nµ x, σ x) och Y Nµ y, σ y ) och alla slumpvariabler är oberoede. H 0 : σ x = σ y. Testvariabel: F = S y Sx F y 1, x 1). ) s y p-värde: 1 F Fy 1, x 1) sx om s y 1 och sx ) s y F Fy 1, x 1) om s y 1. sx s x Hypotese förkastas på sigifikasivå α om p < α dvs. om testvariabel får ett värde i mägde, F 1 F y 1, x 1) α 1 )) FF y 1, x 1) 1 α ), ). I detta fall är atagadet beträffade ormalfördelig viktigt! G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 4 / 3

Korrelatio Korrelatioskoefficiete mella slumpvariablera X och Y är ρ XY = CorX, Y ) = CovX, Y ) VarX )VarY ), och om X j, Y j ), j = 1,..., är ett stickprov av slumpvariabel X, Y ) så är stickprovskorrelatioskoefficiete R XY = j=1 X j X )Y j Y ) j=1 X j X ) = j=1 Y j Y ) S xy, Sx Sy där och S x = 1 1 S xy = 1 1 j=1 X j X )Y j Y ), j=1 X j X ), S y = 1 1 Y j Y ). j=1 G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 5 / 3 Stickprovskorrelatioskoefficietes fördelig Ifall X j, Y j ), i = 1,..., är ett stickprov av e ormalfördelad slumpvariabel X, Y ) med korrelatioskoefficiet ρ xy = 0 och σ x > 0 och σ y > 0) så gäller R XY 1 R XY t ). Ifall X j, Y j ), i = 1,..., är ett stickprov av e ormalfördelad slumpvariabel X, Y ) med 1 < ρ xy < 1 och σx > 0 och σy > 0) så gäller ) ) 1 1 + l RXY 1 1 + a N 1 R l ρxy, XY 1 ρ XY ) 1 3 G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 6 / 3

Mista-kvadrat-metode då y b 0 + b 1 x Om ma atar att sambadet mella x och y är y b 0 + b 1 x, puktera x j, y j ), j = 1,..., är giva och ma vill bestämma a och b 1 så att j=1 y j b 0 b 1 x j ) miimeras så ka det av måga skäl vara bra att först räka ut x = 1 j=1 x j och y = 1 j=1 y j och seda istället miimera f b 0, b 1 ) = j=1 y j y) b 0 b 1 x j x)). Eftersom j=1 x j x) = j=1 y j y) = 0 är b f b0 0, b 1 ) = b 0 så optimerigsvillkoret b f b0 0, b 1 ) = 0 ger b 0 = 0. Nu är f b1 0, b 1 ) = j=1 b1 x j x) y j y) ) x j x) så att ekvatioe f b1 0, b 1 ) = 0 har lösige b 1 = j=1 x j x)y j y) j=1 x j x). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 7 / 3 Mista-kvadrat-metode, forts. Koefficiete b 0 i uttrycket y = b 0 + b 1 x blir då y b 0 = y b 1 x. Ett aat sätt att formulera samma räkig är att defiiera matrise M 1 x! med Mj, 1) = 1 och Mj, ) = x j, dvs. M =.., vektor Y med 1 x y 1 [ ] b0 Y j, 1) = y j, dvs. Y =. och vektor C =. Fuktioe som skall miimeras då ka skrivas som j=1 Y j, 1) k=1 Mj, k)ck, 1)) = Y MC. Miimipukte b 1 uppås därför då [ b0 b 1 ] = C = M T M) 1 M T Y G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 8 / 3

Regressio Slumpvariabel Y atas förutom slumpe bero på variabel x så att Y = β 0 + β 1 x + ε där ε är e slumpvariabel som atas vara oberoede av x. Ett stickprov av Y är därför av type x j, Y j ), j = 1,..., där ε j = Y j β 0 β 1 x j är oberoede slumpvariabler med samma fördelig, som valige atas vara N0, σ ). Med mista kvadratmetode som är föruftig precis då ε N0, σ )) får vi följade estimatorer för β 1, β 0 och σ : B 1 = S xy sx, B 0 = Y B 1 x, S = 1 Y j B 0 B 1 x j ), j=1 där S xy = 1 1 j=1 x j x)y j Y ). G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 9 / 3 Regressio, testvariabler Atag att ε j N0, σ ), j = 1,..., är oberoede och Y j = β 0 + β 1 x j + ε j, j = 1,...,. Då är 1 B 0 N β 0, σ + x )) 1)sx, σ ) B 1 N β 1, 1)sx, )S σ χ ). Som testvariabler ka ma aväda T 0 = B 0 β 0 S 1 + x 1)s x ) t ), T 1 = B 1 β 1 S t ). 1)s x G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 30 / 3

Sambad mella estimatorera Av defiitioera ova följer också att och S = 1 S y 1 R xy), B 1 S Sx R xy = B 1 Sy, 1)S x = R xy. 1 Rxy Det seare resultatet visar att test av ollhypotesera β 1 = 0 och ρ xy = 0 ger samma resulat då ma atar ormalfördelig). Talet r xy, dvs. värdet av slumpvariabel R xy sägs vara reggressiosmodelles förklarigsgrad. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 31 / 3 Extrapolerig Om ma har gjort mätigar av ågot slag och fått resultate x j, y j ), j = 1,..., så vill ma ofta veta vilket värde y skulle få om x = x 0. Ett sätt att räka ut ett rimligt svar är att ata att y b 0 + b 1 x, bestämma b 0 och b 1 och seda räka ut b 0 + b 1 x 0. Ett ekelt sätt att förutom att göra dea räkig också få e uppfattig om hur stort felet ka bli är att ersätta värdea x j, j = 1,..., med x j x 0 och seda i ormal ordig räka ut estimat och göra hypotesprövigar för β 0 i regressiosmodelle Y = β 0 + β 1 x + ε. G. Gripeberg Aalto-uiversitetet) MS-A0509 Grudkurs i saolikhetskalkyl och statistiksammafattig, 14 februari 014 del II 3 / 3