Grundläggande matematisk statistik

Relevanta dokument
HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Grundläggande matematisk statistik

Grundläggande matematisk statistik

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Tillåtna hjälpmedel: Eget handskrivet formelblad (A4), utdelad tabellsamling, miniräknare med tömt minne Studenterna får behålla tentamensuppgifterna

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

KTH/ICT IX1501:F7 IX1305:F2 Göran Andersson Statistik: Skattningar

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Matematisk statistik KTH. Formelsamling i matematisk statistik

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

F10 ESTIMATION (NCT )

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Introduktion till statistik för statsvetare

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Reliabilitet och validitet

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Matematisk statistik för V2 den 28 maj 2010

INGENJÖRSMATEMATISK FORMELSAMLING

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

θx θ 1 om 0 x 1 f(x) = 0 annars

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Reliabilitet och validitet. Föreläsningsanteckningar till: F7 undersökningsdesign F8 konfidensintervall F9 hypotesprövning

APPROXIMATION AV SERIENS SUMMA MED EN DELSUMMA OCH EN INTEGRAL

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Föreläsning 2: Punktskattningar

a) Beräkna E (W ). (2 p)

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

TMS136: Dataanalys och statistik Tentamen med lösningar

Matematisk statistik TMS063 Tentamen

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Borel-Cantellis sats och stora talens lag

101. och sista termen 1

S0005M V18, Föreläsning 10

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Försöket med trängselskatt

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

4. Uppgifter från gamla tentor (inte ett officiellt urval) 6

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

TENTAMEN I MATEMATISK STATISTIK

4.2.3 Normalfördelningen

Genomsnittligt sökdjup i binära sökträd

Tentamen i Sannolikhetsteori III 13 januari 2000

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Sannolikhetslära. c 2015 Eric Järpe Högskolan i Halmstad

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Tentamen del 2 i kursen Elinstallation, begränsad behörighet ET

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Datorövning 2 Fördelningar inom säkerhetsanalys

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen del 2 i kursen Elinstallation, begränsad behörighet ET

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

(a) om vi kan välja helt fritt? (b) om vi vill ha minst en fisk av varje art? (c) om vi vill ha precis 3 olika arter?

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

2. Konfidensintervall för skillnaden mellan två proportioner.

Lösningar och kommentarer till uppgifter i 1.1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Uppgifter 3: Talföljder och induktionsbevis

Stokastiska variabler

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Kompletterande kurslitteratur om serier

Tentamen i matematisk statistik

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Föreläsning G70 Statistik A

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Föreläsning G70 Statistik A

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

ökar arbetslösheten i alla länder, men i USA sker tilbakagången snabbare

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Datorövning 2 Fördelningar inom säkerhetsanalys

Armin Halilovic: EXTRA ÖVNINGAR

Föreläsning G04: Surveymetodik

Avd. Matematisk statistik

Jag läser kursen på. Halvfart Helfart

F15 ENKEL LINJÄR REGRESSION (NCT )

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Transkript:

Grudläggade matematik tatitik Hypotetet I Uwe Mezel, 2018 uwe.mezel@lu.e; uwe.mezel@mattat.de www.mattat.de Syfte: Hypotetet o vi tetar på grudval av ett tickprov om e fördeligparameter (μ, σ, λ, ) har ett vit förmodad (hypotetikt) värde, dv. vi tetar e hypote, om valigtvi kalla ollhypote. o dea ollhypote täll mot e alterativ hypote (mothypote) o ollhypotee förkata om tickprovvärdea äger emot dea ollhypote och lutar ig till de alterativa hypotee Exempel för ollhypoteer och alterativa hypoteer om e parameter: o X ~ N μ, σ (det är käd att ormalfördelig föreligger) o ollhypote H 0 : μ = 20 (vätevärdet är 20) o alterativ hypote H a : μ 20 (vätevärdet är ite 20) o X ~ N μ, σ o ollhypote H 0 : μ = 20 (vätevärdet är 20) o alterativ hypote H a : μ > 20 (vätevärdet är törre ä 20) o X ~ N μ, σ o ollhypote H 0 : μ = 20 (vätevärdet är 20) o alterativ hypote H a : μ < 20 (vätevärdet är midre ä 20) o X ~ Bi, p o ollhypote: p = 1 Τ2 (aolikhete att lycka är 1 Τ2) o alterativ hypote H a : p > 1 Τ2 (lh. att lycka är törre ä Τ 1 2 1

Kritikt område Exempel: o ett bolag tillverkar färg och påtår: geomittlig torrtid = 20 miuter. o Koumetverket mitäkar att det tar lägre tid, tetar påtåedet: o målar 36 brädor ( = 36) o mäter torrtide (lumpvariabel X) = tickprov o തX ob = 1 Τ36 σ 36 i=1 X i (obervatio = geomittlig torrtid i tickprovet) o det ata att torrtidera är ormalfördelade: X ~ N μ, σ ; o ollhypote H 0 : μ = 20 ; alterativ hypote: H a : μ > 20 Val av kritikt värde / kritikt område: Koumetverket betämmer ig för att tillbakavia (förkata) påtåedet (ollhypotee) om ob > 20.75 (ett ådat reultat gyar H a ) acceptera hypotee förkata hypotee μ = 20 påtåedet, hypote 20.75 kritikt värde ob (geomittlig torrtid i tickprovet) Värdet 20.75 verkar vara godtyckligt! Vi ka eare e att det kritika värdet beräka på grudval av felrike. Feltyper Feltyper: är ett ådat kritikt värde fixera, är det oudvikligt att rikera två typer av fel: Fel typ I: det är möjligt att ob > 20.75 äve om hypotee μ = 20 tämmer: vi förkata hypotee, trot att de är a Fel typ II: det är möjligt att ob < 20.75 äve om hypotee μ = 20 är falk: vi acceptera hypotee, trot de är falk Dea fel ka förekomma för att vi fattar vara belut på grudval ett (eller fler) tickprov, om tyr av lumpe. acceptera H 0 förkata H 0 H 0 är a korrekt fel typ I H 0 är falk fel typ II korrekt H 0 = ollhypote 2

Saolikhete att göra ett fel typ I: Fel typ I: förkata ollhypotee, fatä de är a Låt o ata att σ är käd: σ = 2.4. Om hypotee är a: μ = 20 ( = 36) (är H 0 a) f തX quatile_plot.r μ = 20 20.75 3% rik att göra ett fel typ I Saolikhete att göra ett fel typ II: β Fel typ II: acceptera hypotee, fatä de är falk Atagade: σ = 2.4 (käd); hypotee är falk, t.ex. μ = 21 ; = 36 (är H 0 falk) f തX β 20.75 μ = 21 ca. 27% rik att göra ett fel typ II quatile_plot.r 3

Kompromi mella och β Saolikhete för fel typ II, β = 27%, verkar vara tor. Fråga: Varför ite förkjuta det kritika värdet till midre värde, t. ex. 20.5, för att förmika β? μ = 20 (H 0 tämmer) μ = 21 (H 0 tämmer ite) Svar: Om det kritika värdet förkjutit till midre värde å blir β midre, me blir törre vi måte kompromia mella och β, dv. mella rik för fel typ I och rik för fel typ II. β krit. värdet (20.75) Juterig av fel typ I () I praktike fattäll frå börja. Det kritika området beräka eda med hjälp av det hypotetika värdet för parameter (e ere). kalla iifikaivå. Ofta välj = 0.05 eller = 0.01. Att jutera β är däremot met vårt: i exemplet atog vi att μ = 21 om hypotee är falk. Detta ka vi dock ite veta efterom de aa fördeligparameter μ är ju okäd. Ma ka evetuellt beräka β för flera giade värde μ, eller e fuktio β(μ) för ett vit μ itervall: β β μ Om μ blir törre förkjut fördelige mot höger. Om amma kritika värdet bibehåll blir β midre: uwe.mezel@mattat.de μ β μ = 21 kritikt värde 4

ҧ 2018-10-10 Nollhypote (H 0 ), olika alterativa hypoteer (H a ) H 0 H a tet μ = μ 0 μ > μ 0 eidigt ω = kritikt värde förkata H 0 för x ob > ω H 0 H a tet μ = μ 0 μ < μ 0 eidigt förkata H 0 för x ob < ω H 0 H a tet μ = μ 0 μ μ 0 tvåidigt 2 2 förkata H 0 för x ob < ω Τ2 eller x ob > +ω Τ2 (för ymmetrik fördelig) Nollhypote, olika alterativa hypoteer Exempel, tvåidigt tet: E byggelemet måte ha diameter 30 cm, de får ite avvika till högre eller midre värde. Nollhypote (H 0 ): μ 0 = 30 ; förkata H 0 om x ob > 30.5 eller ob < 29.5 2 2 Exempel, eidigt tet: E gammal maki producerar geomittligt 2500 kompoeter per dag: μ 0 = 2500. Köpa e y, dyrare maki? bara om μ (för de ya makie) är högre! täller upp H a : μ > μ 0 köp de ya bara om H 0 ka förkata! μ 0 5

Val av igifikaivå I praktike fattäll frå börja. Det kritika området beräka eda med hjälp av det hypotetika värdet för parameter. Parameter kalla iifikaivå. Ofta välj = 0.05 eller = 0.01. = 0.05 betyder: i det låga loppet blir H 0 felaktigt förkatat i 1 av 20 tet = 0.01 betyder: i det låga loppet blir H 0 felaktigt förkatat i 1 av 100 tet Koekveera av valet för måte överväga oggrat: för exemplet torrtide : midre, t.ex. = 0.01 o = 0.01 det kritika värdet kifta t.ex. frå 20.75 till 21.5 o är bättre för tillverkare koumetverket förkatar ite å lätt dera påtåede (att torkigtide är 20 miuter) o me kake ämre för koumetera möjligtvi är torkigtide ite bättre ä kokurretera likvärdig produkt för met pegar Val av igifikaivå I praktike fattäll frå börja. Det kritika området beräka eda med hjälp av det hypotetika värdet för parameter. Parameter kalla iifikaivå. Ofta välj = 0.05 eller = 0.01. Midre betyder att ma ka vara mera äker att H 0 verklige är falk om de förkata, rike för ett fel typ I förmika ju. är = 2 förkata H 0 fört är ob avviker äu mer frå μ 0 μ 0 1 = 0.05 2 = 0.01 quatile_plot.r 6

Beräkig av det kritika värdet utav igifikaivå Om ollhypotee H 0 : μ = μ 0 gäller är X i ~ N(μ 0, σ) : തX ~ N μ 0, σ തX μ 0 σ ~ N(0, 1) Om σ måte katta med blir det: തX μ 0 ~ t( 1) Vi ka beräka det kritika värdet ω med hjälp av följade ekvatio (om H a μ > μ 0 ): P തX > ω H 0 a = Detta är lh.:e att göra ett fel typ I om vi förkata ollhypotee för tora värde av തX, dv. om de alterativa hypotee är H a : μ > μ 0. Vi måte ta fram ω ur dea ekvatio (kritikt värde). Beräkig av det kritika värdet P തX > ω H 0 a = H 0 : μ = μ 0 H a : μ > μ 0 P തX ω = 1 omforma i paratee (H 0 a kippat) här igår ollhypotee X P ത μ 0 ω μ 0 = 1 väter terme i paratee är t-fördelad X P ത μ 0 t 1 = 1 gäller allmät för t-fördelig. t = -kvatil Geom att jämföra de ita två ekvatioera ka vi dra lutate att: ω μ 0 = t 1 ω = μ 0 + t 1 7

Beräkig av det kritika värdet ω = μ 0 + t 1 kritikt värde ω ; för H a : μ > μ 0 Ω = kritikt område ω = kritikt värde, där Ω börjar μ 0 ω Ω H a : μ > μ 0 H 0 förkata om ob hamar i det kritika området, dv. om ob > ω ob > μ 0 + t 1 H 0 förkata Det kritika värdet för olika alterativhypote ω = μ 0 + t 1 förkata H 0 om ob > ω eidigt tet; H a : μ > μ 0 dv. om ob > μ 0 + t 1 ω = μ 0 t 1 förkata H 0 om ob < ω eidigt tet; H a : μ < μ 0 dv. om ob < μ 0 t 1 ω 2,1 = μ 0 ± t 1 2 tvåidigt tet; H a : μ μ 0 förkata H 0 om ob < ω 1 eller ob > ω 2 t ( 1) : kvatil för t-fördelige med 1 frihetgrader Om σ är käd: σ och t 1 λ 8

ҧ 2018-10-10 Sammafattig: Tetvariabelmetode 1. Defiiera ollhypote (H 0 ) och alterativ hypote (H a ) 2. Slå fat igifikaivå P fel typ I = 3. Betäm tetvariabel ( ob, ) och det kritika värdet för de 4. Beräka tetvariabel på grudval av tickprovet. 5. Avgör om ollhypotee förkata eller ite (om tetvariabel ligger i det kritika området) H 0 förkata ite om Sammahaget mella hypotetet och kofideitervall För det eidiga tetet H a : μ > μ 0 hade vi beräkat att vi förkata H 0 om ob > μ 0 + t 1 ҧ x ob < μ 0 + t 1 μ 0 > x ob t 1 alltå om Kom ihåg det eidiga kofideitervallet för μ (F9, itervallkattig): Detta betyder att vi accepterar H 0 : μ = μ 0 på igifikaivå om μ 0 ligger i repektive kofideitervall med kofidegrad 1. Detta gäller ockå för de adra variater av alterativa hypoteer. För att geomföra hypotetet ka ma alltå ockå aväda kofidemetode 9

Kofidemetode 1. Beräka ett kofideitervall (KI) med kofidegrad 1 för parameter θ om ka teta på grudval av tickprovet. 2. Acceptera H 0 : θ = θ 0 på igifikaivå om de hypotetika parameter θ 0 ligger i detta kofideitervall, dv. om θ 0 I θ. 3. Förkata H 0 på igifikaivå om de hypotetika parameter θ 0 ligger utaför detta kofideitervall, dv. om θ 0 I θ. förkata H 0 om θ 0 ligger utaför KI:et acceptera H 0 om θ 0 ligger i KI:et förkata H 0 om θ 0 ligger utaför KI:et Tetvariabelmetode och kofidemetode leder till amma lutater. Detta fugerar för eidiga och tvåidiga tet. Om θ 0 ligger i kofideitervallet betyder det ju att θ 0 fi blad de troliga värde för de aa parameter. E 3:e, kake de viktigate metode, är direktmetode Direktmetode Direktmetode aväd ofta i praktike. Ett å kallad p-värde beräka. Defiitio p-värdet ( p.value ): P-värdet = aolikhete för att erhålla ett utfall mit å extremt om det faktikt oberverade, givet att ollhypotee är a. Utfall ae om extrema om de ligger lägre bort frå ollhypotee, getemot de alterativa hypotee; de är midre aolika ä ob om H 0 är a. eidigt tet H 0 : μ = μ 0 H a : μ > μ 0 p Iget kritikt område defiera, p- värdet räka ut direkt. Om p-värdet är midre ä ett fattällt igifikaivå betyder det att det oberverade utfallet - och de äu mer extrema utfalle - är (mycket) oaolika om H 0 ata vara a. H 0 förkata därför. μ 0 xob ҧ 10

ҧ 2018-10-10 Direktmetode Direktmetode, exempel: (ur: Alm, Britto: Stokatik, Liber AB, Stockholm 2008) E pero påtår ig vara tillräckligt figerfärdig för att kua påverka vilke ida om kommer upp vid mytkat, å att ha får kroa oftare ä klave, dv. p = P kroa > 1 Τ2. Vi är keptika och tror att p = 1 Τ2. För att teta påtåedet får ha göra 10 kat och vi är beredda att tro hoom om ha får tillräckligt måga kroa vid föröket. H 0 : p = 1 Τ2 ; H a : p > 1 Τ2 (eidigt tet) X: atal kroa i 10 förök. X ~ Bi(10, 0.5) uder H 0. Vi vill teta på igifikaivå = 0.01 dv. vi tror hoom om p-värdet < 0.01. Föröket gav x = 8 kroa i 10 förök. obervatio äu mera extrema Facit: p > 0.01 H 0 förkata ite på igifikaivå 0.01. (De förkata ite e på igifikaivå 0.05) Vi tror ite att ha ka påverka latiglig (för att det är fortfarade gaka aolikt att ha katar 8 kroor äve om p = 1 Τ2 ). Direktmetode, exempel: Direktmetode Ytor av via elektroika kompoeter måte ha e kopparkikt om är 30 µm tjock. Skiktet får varke vara för tjock eller för tu. Ytora av = 10 kompoeter har mätt, med reultat x = 32.2 ; 32.0 ; 30.4 ; 31.0 ; 31.2 ; 31.2 ; 30.3 ; 29.6 ; 30.5 ; 30.8. x ob = 30.91 Av låg erfarehet vet ma att tjockleke är ormalfördelad med σ = 0.788 (vi kommer att räka med okäd σ eare ). Om H 0 är a gäller μ = μ 0 = 30, alltå: H 0 : μ = 30 ; H a : μ 30 (tvåidigt tet, efterom kiktet får varke vara för tjock eller för tu, avvikeler i båda riktigar ka ite tolerera ) 11

Direktmetode Direktmetode, exempel: H 0 : μ = 30 ; H a : μ 30 ob = 30.91 (tvåidigt tet) Vi ka utyttja ymmetri: båda markerade område är lika tora: H 0 29.09 μ 0 = 30 ob = 30.91 tvåidigt tet: båda markerade område extremare ä ob! p < : H 0 förkata. Stickprovet avlöjar på igifikaivå 0.0005 (!) att avvikelera är för tora. Sammafattig: Direktmetode 1. Defiiera ollhypote (H 0 ) och alterativ hypote (H a ) 2. Slå fat igifikaivå 3. Beräka tetvariabel på grudval av tickprovet 4. Beräka p-värdet. 5. Förkata H 0 på igifikaivå om p <, aar acceptera H 0 eidigt tet H 0 : μ = μ 0 H a : μ > μ 0 tvåidigt tet H 0 : μ = μ 0 H a : μ μ 0 p μ 0 xob ҧ 29.09 μ 0 = 30 ob = 30.91 12