F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Relevanta dokument
Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

S0005M V18, Föreläsning 10

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Föreläsning G04: Surveymetodik

Grundläggande matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

F10 ESTIMATION (NCT )

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

1. Test av anpassning.

TMS136: Dataanalys och statistik Tentamen med lösningar

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Föreläsning G70 Statistik A

Introduktion till statistik för statsvetare

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Föreläsning G70 Statistik A

a) Beräkna E (W ). (2 p)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Föreläsning 2: Punktskattningar

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

4.2.3 Normalfördelningen

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

θx θ 1 om 0 x 1 f(x) = 0 annars

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

2. Konfidensintervall för skillnaden mellan två proportioner.

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Formelblad Sannolikhetsteori 1

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Datorövning 2 Fördelningar inom säkerhetsanalys

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

SAMMANFATTNING TAMS65

================================================

Borel-Cantellis sats och stora talens lag

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Avd. Matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Uppgifter 3: Talföljder och induktionsbevis

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Jag läser kursen på. Halvfart Helfart

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

F12 Stickprovsteori, forts

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

Datorövning 2 Fördelningar inom säkerhetsanalys

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Tentamen i Matematisk statistik för V2 den 28 maj 2010

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Stokastiska variabler

Tentamen i matematisk statistik

Tentamen i Sannolikhetsteori III 13 januari 2000

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Genomsnittligt sökdjup i binära sökträd

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

TENTAMEN I MATEMATISK STATISTIK

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Id: statistik.tex :48:29Z joa

Grundläggande matematisk statistik

Jag läser kursen på. Halvfart Helfart

a. Nej, eftersom alla utfall inte har samma sannolikhet. Förutsättningarna enligt första stycket på sida 12 är inte uppfyllda.

Transkript:

01-10-19 F6 Uppskattig Statistikes gruder dagtid HT 01 Vi skattar populatiosparametrar (modellparametrar med olika statistikor: E. stickprovs- -medelvärdet X skattar μ -variase S skattar -adele P skattar π Kallas för puktskattigar. Grekiskt-romerskt Ofta me ite alltid: Grekiska bokstäver aväds för parametrar E. μ,, π, τ Romerska versaler för stokastiska variabler, t.e. statistikor som skattar parametrar (etimatorer E. X, S, P, T Romerska gemeer för observerade värde E., s, p, t eteckigar, symboler, otatio Måga område är vaa vid sia sätt att betecka Det viktigaste är att alltid ta reda på vad som avses och hur de olika beteckigara defiieras. Väldigt valig beteckig för estimatorer är tak-symbole ^ E. μ skattas med μ ^ skattas med ^ ^ V(X skattas med V(X 1

01-10-19 Osäkerhet i skattigar Vätevärdesriktighet 1 E statistika som väljs för att skatta e parameter är e s.v. Om dea har e stor varias så är det större saolikhet att de ska hama lågt bort dvs. stor osäkerhet Om de har e lite varias så är saolikhete relativt sett midre att de ska hama lågt bort dvs. lite osäkerhet Jämför med Figur 16.1 sid 5 Eg. ubiased När vätevärdet för estimator (dvs. statistika är just de parameter vi skattar (estimerar Vi hade seda förut att alltså är X e vvr-skattig för μ Hur är det med S är de vvr? Vi defiierade C -1 S ( E( X μ ~ χ ( -1 Vätevärdesriktighet Kosistes Vi vet C ~ χ ( -1 E( C 1 E( C E( S E( S ( -1 ( -1 1 ( -1 alltså är S e vvr-skattig för E( S ( -1 Lite löst: När variase för estimator (dvs. statistika går mot oll är Osäkerhete miskar ju mer ifo vi har Vi hade reda att V(X = / alltså är X e kosistet skattig för μ Hur är det med S?

01-10-19 Överkurs? Skatta μ Vi vet C ~ χ ( -1 V( C ( -1 Vätevärdesriktig (eg. ubiased och osäkerhet V( C V( V( S 1 S ( ( -1 ( -1 1 4 V( S 4-1 ( -1 alltså är S e kosistet estimator för Skatta μ Osäkerhetsitervall Dra ett stickprov av storlek frå e ormalfördelad populatio med käd varias Vi aväder X som puktskattig för μ Vi vill uttala oss om osäkerhete krig puktskattige. X ~ N(μ, X -μ Z ~ N(0,1 Saolikhete att X hamar i itervallet μ 1,96 P(μ -1,96 P(-1,96 X μ 1,96 X -μ 1,96 0,95 yt plats på X och μ, dvs. låt gräsera för itervallet vara slumpmässiga P(μ -1,96 P( X 1,96 0,95 X μ 1,96 μ X 1,96 3

01-10-19 Saolikhete att ligga i ett itervall Stokastiska itervall Upprepade stickprov ger olika medelvärde 95 % saolikhet att X hamar i itervallet 95 % av alla möjliga itervall täcker μ Ma skattar ett itervall, ite bara e pukt Fördelig för stick- provsmedelvärdet X µ - 1.96 / µ + 1.96 / rea = 0.95 µ.5% av alla stickprovs- medelvärde hamar här.5% av alla stickprovsmedelvärde hamar här - 1.96 / µ + 1.96 / 95% av alla stickprovsmedelvärde hamar här Stickprovsmedelvärde här ger KI som INTE täcker i µ Stickprovsmedelvärde här ger KI som täcker i µ Stickprovsmedelvärde här ger KI som INTE täcker i µ Lägg itervallet rut det observerade istället! Jämför med Figur 16. sid 8 Eempel och övigar 1 Eempel och övigar I ett slumpmässigt stickprov med = 16 observatioer frå e ormalfördelig med stadardavvikelse s = 6 observerades = 5. Skatta μ och ge ett 95 % KI för skattige 16; 5; z 0,05 1,96 5 1,96 5,94 6 16 el. (,06, 7,94 Se stycke bilar av ett visst märke och årsmodell udersöktes map besiför-brukige. Ma observerade ett medel-värde = 19,48 och varias = 0,96 (US-mått! Skatta μ och ge ett 95 % KI för skattige 6; 19,48; s t (5 0,05,571 19,48,571 19,48 1,084 0,96 6 el. 0.96 (18,45, 0,51 4

01-10-19 Skatta e adel 1 Skatta e adel Ma vill skatta adele π av e populatio eller grupp som besitter e viss egeskap: Ska rösta på ett visst parti or i villa Vill ite vara med i udersökige Överlever ett eperimet dele gåger jag vier i poker Se det också som utfall frå e modell eller fördelig: eroulli-försök lyckas - misslyckas X i ~ eroulli(π, i = 1,,, Y = summa av X i Y ~ i(,π Vätevärde E(Y = π Varias V(Y = π(1- π Eligt CGS: Y N(π, π(1- π P Y X N(π, π(1-π Me vi vet ite vad π är så vad gör vi är vi ska beräka variase som ju behövs till KI? Formel: K.I. för π Eempel och övigar 4 5. Y ~ i(,π, biomialfördelad ( = atal observatioer och saolikhet π att ett objekt har egeskape vars adel i vill skatta y ( y/ (1- y/ z α/ p(1- p p zα/, p y Tabell väd det äst bästa, dvs. det observerade värdet p = 344 företag tillfrågades om deras policy för gåvor till iköpara frå leveratörer. Y = 83 företag hade e policy, 61 hade ige policy. Skatta adele företag som har e policy och ge ett 90 % KI för skattige 83 344; p 0,41; z0,05 1,645 344 0,41 1,645 0,41 0,038 0,41 0,759 344 el. (0,03, 0,79 alt. (0,3 %, 7,9 % 5

01-10-19 Ädliga populatioer 1 Ädliga populatioer När ma drar med återläggig påverkas ite ästa dragig av tidigare dragigar Oberoede När ma drar uta återläggig påverkas ästa dragig; om ett objekt reda dragits ka de ite observeras ige eroede Om vi låter N som är ett ädligt tal och urvalet sker uta återläggig (typiskt då kommer osäkerhete krig populatios-medelvärdet miska. äve adra populatiosparametrar När = N fis ju ige osäkerhet! Variase måste justeras Detta påverkar utfallsrummet av möjliga stickprov Ädliga populatioer 3 Kofidesitervall Varias om N eller om urvalet sker med återläggig: V( X Varias om N är ädligt och om urvalet sker uta återläggig V( X N - N -1 N - 0 är N N -1 Ädlig populatioskorrektio eg. fiite populatio correctio or fpc Notera att för givet värde på så bestäms itervallets lägd, dvs. felmargiale, av Kofidesgrade 95 % ger oss värdet 1,96 (Tabell Vilket värde skulle vi få vid 90 %? 99 %? Stickprovsstorleke eftersom V( X större stickprov mer iformatio 6

01-10-19 Dimesioera urvalsstlk Dimesioera urvalsstlk Om ma vill få bättre skattigar dvs. skattigar med midre osäkerhet dvs. smalare KI vad ska vi göra? Större stickprov! Hur stort? Nyquist avsitt 16.5 tag att vi ska skapa ett KI t.e. μ ^ ± felmargial me vi vill att felmargial < Eempelvis för ormalfördelig med käd varias Vi vill att zα/ Lös ut : z α/ E: atag att vi vill ha ett 95 % KI där = 10 och felmargiale får högst vara ±. Isättig ger 10 1,96 96,04 Sätt = 97 F7 Sammafattig Formel: K.I. för π Estimatorer (statistikor, s.v. skattar parametrar E estimatator har e fördelig; vätevärde & varias Det observerade värdet blir e puktskattig Osäkerhete formuleras som ett osäkerhetsitervall. Puktskattig ± felmargial Felmargiale bestäms av variase och kofidesgrade 5. Y ~ i(,π, biomialfördelad ( = atal observatioer och saolikhet π att ett objekt har egeskape vars adel i vill skatta CGS y ( y/ (1- y/ z α/ p(1- p p zα/, p y Tabell väd det äst bästa, dvs. det observerade värdet p 7

01-10-19 Ädliga populatioer Dimesioera urvalsstlk Varias om N eller om urvalet sker med återläggig: V( X Varias om N är ädligt och om urvalet sker uta återläggig V( X N - N -1 N - 0 är N N -1 Ädlig populatioskorrektio eg. fiite populatio correctio or fpc Eempelvis för ormalfördelig med käd varias Vi vill att zα/ Lös ut : z α/ vruda högerledet uppåt till ärmaste heltal Ka äve (se Nyqvist kombieras för fallet med ädlig populatio Eempel och övig Eempel och övig, forts Totalt 73 baktjästemä tillfrågades om de asåg att det förekom prais i deras brasch som de asåg vara oetisk varav 39 svarade ej. Skatta adele som aser att det ite förekommer oetisk verksamhet och ge ett 95 % KI för skattige. Lösig: Först, motivera val av metod. Ka vi aväda CGS? Är = 73 tillräckligt stort? Tumregel > 30 Vi atar att 73 är tillräckligt stort (om ite aat så för att geomföra övige och sätter vår tillit till CGS. Ställ upp igåede storheter, formel som aväds och utför beräkige: 39 73; p 0,534; z0,05 1,96 73 p(1- p p z α/ 0,534 1,96 0,534 (1-0,534 73 0,534 ± 0,114 el. (4,0 %, 64,8 % 8

01-10-19 Eempel och övig, forts Eempel och övig, forts Nu fick ma (i efterhad veta att det rörde sig om e eda (lite bak och att atalet aställda baktjästemä (som igår i populatioe är N = 184. Vi gör om beräkige: p z α/ Urvalsfraktioe är 73/184 = ca 40 % fpc = korrektio för ädlig populatio 0,534 (1-0,534 184-73 0,534 1,96 73 184-1 0,534 ± 0,0891 el. (44,5 %, 6,3 % tt jämföra med (4,0 %, 64,8 % Nu vill ma utöka studie till samtliga baker och baktjästemä. Vi atar u att N och aväder valiga formel. Hur stort stickprov krävs om vi vill ha e felmargial som är midre ä 0,05? Dvs. z α/ Sätt p = 0,5 (värsta fallet och ite heller orealistiskt med ledig av de första studie. Isättig ger p(1- p N - N -1 p(1- p 0,05 p(1- p 0,5 1,96 0,05 zα/ 384,16 Svar: Sätt stickprovsstorleke = 385 Slutsats av övige? Hypotesprövig I eemplet yss blev puktskattige för adele π lika med 53,4 %. Ka ma därmed påstå att fler ä hälfte aser att det ite råder oetisk prais i bakbrasche? Notera att KI i första fallet (oädlig pop blev (4,0 %, 64,8 % Detta itervall täcker 50 % Kaske slumpe (stickprovsdragige orsakade att det blev e lite majoritet? tt pröva påståede som dea med statistiska metoder. ehadlas i Nyqvist Kap 17. Formulera ett grudatagade, e s.k. ollhypotes som beteckas H 0 Pröva om data stöder detta atagade geom att jämföra mot e alterativ hypotes som beteckas H 1 eller H 9

01-10-19 Popper & falsifierbarhet Eempel Karl Popper och Thuré Kap 17 Jag har i hela mitt liv edast observerat vita svaar me jag har ädå iget absolut bevis för mi hypotes att alla svaar är vita. Me, så fort jag observerar e aa sorts sva är hypotese direkt och absolut motbevisad. Popper: ma ka aldrig verifiera e hypotes bara falsifiera de. E icke-falsifierad hypotes blir som bäst e provisorisk saig. Iga empiriska saigar är säkra! E perso påstår att ha med förbuda ögo ka avgöra om det blir kroa eller klave vid kast med myt. Hur ska vi testa detta påståede? Förslag: Geomför ett eperimet med 1 kast och låt X betecka rätt atal gissade utfall. Vi atar vidare att det är lika stor saolikhet för kroa som för klave. Hur är X fördelad? Eempel, forts. Eempel, forts. 1 oberoede kast med saolikhet p för rätt svar, alltså är X i(1,p. Om persoe bara gissar borde ha i sitt bara få hälfte rätt, dvs. p = ½ Om p = 1 så kommer persoe att svara rätt varje gåg. E ollhypotes att börja med är p = ½, dvs. persoe i fråga gissar. Vi är m.a.o. skeptiska, vi vill se tydliga bevis för att ha klarar detta ia vi överger ollhypotese! Uder atagadet att p = ½ borde de flesta hama rut p = 6 rätt. eslutsregel: E observatio som är tillräckligt stort, säg c, borde medföra att ma förkastar grudhypotese att ha bara gissar. Hur stort ska vi välja c? 10

01-10-19 Eempel, forts. Formulera hypoteser Vi kallar c e kritisk gräs. Observatiosområdet där ma förkastar ollhypotese (här c kallas allmät det kritiskt området. eräka saolikhetera för att observera X c för ågra olika c: c 5 6 7 8 P(X c 0,806 0,618 0,387 0,1938 c 9 10 11 1 P(X c 0,0730 0,0193 0,003 0,000 Två komplemetära påståede: tige accepterar vi de ea Eller så förkastar vi de (accepterar motsatse Nyqvists eempel sid 1-7 fis två möjligheter: μ = 00 eller μ = 0 Föregåede eempel fis två möjligheter: H 0 : Ha är ite sysk (p = 0,5 H : Ha är ite sysk (p > 0,5 Defiiera ett test 1 Defiiera ett test Varje test har e teststatistika (testvariabel. Dea är typiskt baserad på de statistika ma aväder som puktskattig för parameter i fokus, dvs. de parameter som ma vill testa. Typiskt vet ma hur de är fördelad uder ollhypotese. Uttrycket uder ollhypotese betyder att vi utgår ifrå att de är sa. E. Vi vill testa μ. X aväds som puktskattig ta att observatioera är iid ormalfördelade med käd varias ta att ollhypotese är H 0 : μ = μ 0 Uder ollhypotese gäller (μ, X -μ0 X ~ N 0 Z ~ N(0,1 11

01-10-19 Defiiera ett test 3 Feltyper Defiitioe av ett kritiska område som vi ka betecka C baseras på: teststatistikas fördelig mothypotese sigifikasivå α Hur? Va? Observatio: Z = z obs. Om z obs ite ligger i C, accepteras H 0 ligger i C, förkastas H 0 Sakeras tillståd ka vara e av två; atige är H 0 sa eller falsk. Vi ka fatta ett av två möjliga beslut; ma atige accepterar el. förkastar H 0 Kosekves Situatio eslut H 0 sa H 0 falsk cceptera H 0 Rätt beslut Typ II fel Förkasta H 0 Typ I fel Rätt beslut Sigifikasivå Sigifikas och styrka Sigifikasivå eller felrisk P(Feltyp I = P(förkasta H 0 H 0 sa = α vill ma ska vara lite, ära oll Testets styrka P(förkasta H 0 H 0 falsk = 1 β vill ma ska vara stor, ära ett P(Feltyp II = β Vi betigar på saige, de faktiska situtatioe: Saolikhet Faktisk situatio eslut H 0 sa H 0 falsk cceptera H 0 1 α β Förkasta H 0 α 1 β Lägg märke till att saolikhetera är betigade på de faktiska situatioe 1

01-10-19 Dubbel- och ekelsidiga Dubbelsidigt test Första variate av test berör edast e ekel parameter, t.e. H 0 : μ = μ 0 där μ₀ är ågot tal. Mothypotese avgör typ av test: Dubbelsidigt test H 1 : μ μ 0 Ekelsidiga test H 1 : μ < μ 0 el. H 1 : μ > μ 0 Nollhypotes och dubbelsidig mothypotes: H 0 : μ = μ 0 H 1 : μ μ 0 Testvariabel är de statistika som skattar μ: X ~ N(μ, 0 eller ormaliserad X -μ0 Z ~ N(0,1 tagade: Observatioera är iid ormalfördelade med käd varias Testvariabels fördelig Kritiskt område Nollhypotes och dubbelsidig mothypotes: H 0 : μ = μ 0 H 1 : μ μ 0 Testvariabel är de statistika som skattar μ: X ~ N(μ, 0 eller oftast stadardiserad X -μ0 Z ~ N(0,1 Givet att H 0 är sa, vad är saolikhete att observera X i itervallet -1,96, μ μ0 0 Uder H 0 är X ~ N(μ, hete är = 0,95. 1,96 0 så saolik- tag att ma bestämmer sig för att förkasta H 0 om ma observerar X utaför itervallet Saolikhete att förkasta H 0 givet att de är sa blir P(Feltyp I = 0,05 = α, dvs. sigifikasivå = 5% 13

01-10-19 Dubbelsidigt test, forts. F8 Mer hypotesprövig Om det observerade värdet på Z som vi för tydlighets skull beteckar z obs är tillräckligt lågt ifrå ollhypoteses värde μ 0, förkastas H 0 Kritisk edre gräs: -z α/ = -1,96 Fördelig uder H 0 : Z ~ N(0,1 1 α = 0,95 Kritisk övre gräs: z α/ = 1,96-4 -3 - -1 0 1 3 4 Sammafattig: Två komplemetära påståede Data ger stöd ( bevis för e av dem Vi behöver: Nollhypotes och mothypotes Sigifikasivå Testvariabel och dess fördelig Ur detta får vi det kritiska området. α/ = 0,05 Vätevärde uder H 0 : α/ = 0,05 E(Z = 0 Sigifikas och styrka rbetsgåge 1 Sigifikasivå eller felrisk P(Feltyp I = P(förkasta H 0 H 0 sa = α Testets styrka P(förkasta H 0 H 0 falsk = 1 β P(Feltyp II = β Saolikhet & kosekves Faktisk situatio eslut H 0 sa H 0 falsk cceptera H 0 Förkasta H 0 1 α rätt α Feltyp I β Feltyp II 1 β rätt 1. Förutsättigar / atagade: Ett stickprov av storlek = 36 frå e ormalfördelig med käd varias = 9. Nollhypotes: H 0 : μ = 5 3. Mothypotes: H 1 : μ 5 4. Sigifikasivå / felrisk: α = 5% 5. Teststatistika / testvariabel: X -μ0 Z 14

01-10-19 rbetsgåge rbetsgåge 3 6. Fördelig: Uder de giva förutsättigara och uder H 0 gäller att Z N(0,1. Om särskilda atagade behövs, ages dessa, t.e. "eligt CGS så är Z approimativt N(0,1. 7. Kritiskt värde/område: Vi förkastar H 0 om vi observerar z obs > 1.96 = z 0,05 Detta är ekvivalet med 51,96 36 51,96 36 9 9 4,0 5,98 lterativ 1. 8. eräkigar: = 4,01 9. Slutsats: Då = 4,01 < 4,0 förkastas H 0. Det observerade medelvärdet är sigifikat skilt frå 5 på 5%-ivå. Data stöder ite påståedet att μ = 5. lterativ. 8. eräkigar: = 4,03 9. Slutsats: Då 4.0 < < 5.98 ka H 0 ite förkastas. Det observerade medelvärdet är ite sigifikat skilt frå 5 på 5%-ivå. Det fis ite tillräckligt stöd i data för att för att förkasta påståedet att μ = 5. Medelvärde 1 Medelvärde Fall 1: 1. X i ~ N(μ,, käd. H 0 : μ = μ 0 Fall : 1. X i ~ N(μ,, okäd. H 0 : μ = μ 0 5,6. X -μ0 Z ~ N(0,1; X ~ N(μ0, 5,6. X μ T - 0 ~ t( -1 S 7. Kritiskt område: - ekelsidigt: z obs > z α (< -z α - dubbelsidigt: z obs > z α/ 7. Kritiskt område: ( 1 ( 1 - ekelsidigt: t obs > tα (< - tα ( 1 - dubbelsidigt: t obs > t α/ Då går T Z. E del författare föreslår att ma ka väla till Z om stickprovsstorleke är tillräckligt stor. 15

01-10-19 Medelvärde 3 Medelvärde 4 Fall 3: 1. X i ~, käd, stort (CGS. H 0 : μ = μ 0 Fall 4: 1. X i ~, okäd, stort (CGS. H 0 : μ = μ 0 5,6. X Z - μ0 ~ N(0,1; X ~ N(μ0, appro appro 5,6. X -μ0 Z ~ N(0,1 appro S 7. Kritiskt område: - ekelsidigt: z obs > z α (< -z α - dubbelsidigt: z obs > z α/ 7. Kritiskt område: - ekelsidigt: z obs > z α (< -z α - dubbelsidigt: z obs > z α/ Egetlige borde testvariabel beteckas med T efter-som vi aväder S isf me T Z då. Om ma vill vara koservativ aväder ma t-fördelige trots att de ite är helt teoretiskt berättigad. Proportio / adel Jämföra grupper 1 Fall 5: 1. Y ~ i(,π, stort. H 0 : μ = μ 0 5,6. Z Y/- π π (1- π / 0 0 ~ N appro 0 ( i Y X X (0,1 7. Kritiskt område: - ekelsidigt: z obs > z α (< -z α - dubbelsidigt: z obs > z α/ Notera att variase är käd uder H 0 och att ma sätter värdet på π till ollhypoteses värde π 0. Y appron ~ π, π (1- π ( 0 0 0 Ofta vill ma jämföra två grupper t.e. med avseede på medelvärde. ta att två grupper resp. och deras medelvärde μ resp. μ ska jämföras E typisk hypotesprövig är H 0 : μ = μ μ μ = 0 dvs. ige skillad mella och Mothypotese ka vara ekel eller dubbel: resp. H 1 : μ > μ μ μ > 0 H 1 : μ μ μ μ 0 16

01-10-19 Jämföra grupper Gruppjämförelse 1 Ma tar ett stickprov frå båda grupper, oberoede lika fördelade (iid observatioer iom respektive grupp. De två stickprove är oberoede sisemella. Detta medför dels att X ~ N(μ, X ~ N(μ, och dels att E( X X μ μ V( X X Fall 6: 1. X,i ~N(μ,, X,i ~N(μ, och käda. H 0 : μ μ = δ 0 5,6. Z X 7. Kritiskt område: - se fall 1 - X -δ 0 ~ N Valigast är og δ 0 = 0 (0,1 X X ~ N(μ μ, Gruppjämförelse Gruppjämförelse 3 Fall 7: 1. X,i ~, X,i ~ ;, okäda, stora (CGS. H 0 : μ μ = 0 Fall 8: 1. X,i ~N(μ,, X,i ~N(μ, = me okäda. H 0 : μ μ = 0 Viktigt att komma ihåg 5,6. Z S X - X - 0 ~ appro S N(0,1 5,6. X - X - 0 T ~ t( S 1 1 p - 7. Kritiskt område: - se fall 1 7. Kritiskt område: - se fall Äve här kaske betecka med T isf Z eftersom vi aväder S isf me T Z då. Om ma vill vara koservativ ka ma aväda t-fördelige trots att de ite är heller här är helt teoretiskt berättigad. 17

01-10-19 Poolad variasskattig Jämföra adelar Ma atar att variasera är lika i båda gruppera. E skattig för de variase ges av Fall 9: Y ~i(,π, Y ~i(,π oberoede stickprov Nollhypotes: H 0 : π π = 0 S p ( -1 S ( -1 S - Testvariabel: Z ( Y Y Y - (1- Y - 0 Y Y ( 1 1 ~ N(0,1 Ekelsidigt, dubbelsidigt och kritiska gräser, aalogt med tidigare sidor. Kom ihåg att det är CGS och Z-test. Testa behadligseffekter Parvisa differeser Ofta vill ma jämföra om t.e. e behadlig haft e effekt. Ma har ett iid stickprov av idivider som geomgått e behadlig säg. För varje idivid i stickprovet fis två mätigar: Före: X i,1 Efter: X i, De två mätigara är ite oberoede på idividivå. ilda differeser: Diff: D i = X i,1 X i, D i a är oberoede! Fall 10: 1. D i ~ N(μ D, D, D okäd. H 0 : μ D = 0 5,6. D - 0 T ~ t( -1 S D 7. Kritiskt område: - se fall Det går med adra värde ä 0 också Då går T Z. E del författare föreslår att ma ka väla till Z om stickprovsstorleke är tillräckligt stor. 18

01-10-19 Pust! p-värde ehöver i komma ihåg alla formler? Nej, de fis med på formelbladet Me vilka behövs eller ite beror på situatioe Det som ska läras i är är i behöver Z eller T och hur ma läser och tolkar formlera. Kritiska gräser ska i fastställa själva. Förstå strukture för test. tag att vi får e puktskattig för ågo parameter i fokus. tag att vi har e ollhypotes också. Me vi har ite bestämt ågo sigifikasivå α. tag u att de kritiska gräse likställs med puktskattige. Vad skulle det motsvara för sigifikasivå? Tar vi på mådag Övig 1 Övig 1, forts. Teta 010-10-7, uppgift. a 99 %-igt KI för adele π Låt Y = atalet av 1430 som svarar ja. Y ~ i(1430,π, biomialfördelad = 1430 ka ases tillräckligt stort för att motivera approimerig eligt CGS (tumregel > 30. Puktskattig p = 519/1430 = 0,36937 Ett 99 %-igt KI för π ges av p z 0,005 p(1- p 1430 (Tabell Isättig ger 519 519 911 1430 1430,5758 1430 0,363 ± 0,033 el. (33,0 %, 39,6 % b Hypotesprövig om π tagade reda agiva i förra deluppgifte. H 0 : π = 0,4 H 1 : π < 0,4 Sigifikasivå: Välj själva! Säg α = 0,05 1430 19

01-10-19 Övig 1, forts. Övig Testvariabel och dess fördelig: P - 0,4 Z ~ N(0,1 appro 0,4 0,58/1430 Kritiskt område: förkasta H 0 om z obs < -1,96 = z 0,95 z obs = 519-0,4 1430 0,4 0,58/1430 = - 4,37 < -1,96 Slutsats: Vi förkastar H 0, de observerade puktskattige är sigifikat skild frå 0,4 på 5 % ivå. Teta 010-10-7, uppgift 5. Hypotestest med parvisa differeser; två avdeligar jämförs där de får samma åtta ärede och hadläggigstid mäts. Låt X i,j betecka hadläggigstide för ärede i =,,H och avdelig j = 1, Låt D i = X i,1 X i, Vi atar att D i ~ N(μ D, D där D okäd H 0 : μ D = 0 H 1 : μ D 0 Sigifikasivå: α = 0,05 Övig, forts. Övig, forts. Testvariabel och dess fördelig: D T ~ t(7 S D Kritiskt område: förkasta H 0 om t obs > t 0,05 (7 =,365 eräkigar: Ärede C D E F G H Σ vd 1 10 18 9 7 8 10 8 1 vd 9 0 9 9 7 1 7 1 d i 1-0 - 1-1 0-3 d i 1 4 0 4 1 4 1 0 15 Data ger d = -3/8 = -0,375 s d d i -( di / 1,407886-1 Isättig i testvariabel ger - 0,375 t obs -0,7533 1,407886 8 Slutsats: H 0 ka ite förkastas, det fis ige sigifikat skillad på 5 % ivå. 0