Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Relevanta dokument
F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

S0005M V18, Föreläsning 10

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F10 ESTIMATION (NCT )

1. Test av anpassning.

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Föreläsning G04: Surveymetodik

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Föreläsning G70 Statistik A

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TMS136: Dataanalys och statistik Tentamen med lösningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Föreläsning G60 Statistiska metoder

Föreläsning G70 Statistik A

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Tentamen i Matematisk statistik för V2 den 28 maj 2010

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Grundläggande matematisk statistik

Borel-Cantellis sats och stora talens lag

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

2. Test av hypotes rörande medianen i en population.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

θx θ 1 om 0 x 1 f(x) = 0 annars

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Föreläsning 5. Kapitel 6, sid Inferens om en population

Jag läser kursen på. Halvfart Helfart

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

a) Beräkna E (W ). (2 p)

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

2. Konfidensintervall för skillnaden mellan två proportioner.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Introduktion till statistik för statsvetare

Föreläsning G60 Statistiska metoder

Avd. Matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

4.2.3 Normalfördelningen

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

F9 SAMPLINGFÖRDELNINGAR (NCT

Jag läser kursen på. Halvfart Helfart

z Teori z Hypotesgenerering z Observation (empirisk test) z Bara sanningen : Inga falska teser z Hela sanningen : Täcker alla sanna teser

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

================================================

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

TAMS65 - Föreläsning 6 Hypotesprövning

Datorövning 2 Fördelningar inom säkerhetsanalys

Statistik 1 för biologer, logopeder och psykologer

SAMMANFATTNING TAMS65

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Föreläsningsanteckningar till kapitel 9, del 2

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Lösningar och kommentarer till uppgifter i 1.1

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

TAMS65 - Föreläsning 6 Hypotesprövning

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

b 1 och har för olika värden på den reella konstanten a.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Hur man tolkar statistiska resultat

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Matematisk statistik TMS063 Tentamen

Datorövning 2 Fördelningar inom säkerhetsanalys

Föreläsning 2: Punktskattningar

Tentamen 19 mars, 8:00 12:00, Q22, Q26

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

Transkript:

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT 10.1-10.3) Ordlista till NCT Hypothesis testig Null hypothesis Alterative hypothesis Simple / composite Oe-sided /two-sided Reject Test statistic Type I (type II) error Sigificace level Power p-value Hypotesprövig Nollhypotes Mothypotes Ekel / sammasatt Esidig / tvåsidig Förkasta Testvariabel Typ I- (typ II-)fel Sigifikasivå Styrka p-värde 1

Nollhypotes och mothypotes Med hjälp av data frå ett stickprov vill vi pröva hypoteser om de populatio eller de saolikhetsfördelig som stickprovet kommer frå. Vi har e ollhypotes (H 0 ) som ställs mot e mothypotes (H 1 ). Fråga är: Ger stickprovsdata aledig att förkasta H 0 (till förmå för H 1 ) eller skall vi hålla fast vid H 0? Ex.: I e politisk partisympatiudersökig säger sig 14% av de utvalda persoera sympatisera med parti A. Vi vet att i seaste valet fick parti A 12% av röstera. Har adele A-sympatisörer i populatioe ökat seda valet? H 0 : Adele är oförädrad. H 1 : Adele har ökat. Skall vi förkasta H 0 eller ej? 2

Om vi aser att det höga värdet i stickprovet ka förklaras av slumpe (ifall H 0 är sa), så håller vi fast vid H 0. Om vi aser att adele i stickprovet är högre ä vad som rimlige ka förklaras av slumpe, så förkastar vi H 0. Vi ka aldrig vara 100% säkra på att fatta rätt beslut. Statistisk hypotesprövig iebär att vi aväder vissa beslutsregler för är vi skall förkasta H 0 (och är vi skall hålla fast vid H 0 ). Dessa beslutsregler är utformade så att vi har e viss kotroll över riske för felaktigt beslut. Det fis e asymmetri i behadlige av H 0 och H 1 i statistisk hypotesprövig. Som H 0 väljer vi de hypotes som vi i det lägsta håller fast vid. Vi kräver extra starkt stöd frå observerade data för att H 0 skall förkastas. Bevisbörda ligger hos de som förespråkar H 1. Ofta iebär H 0 ågot i stil med ige förädrig, ige effekt, ige skillad, meda H 1 kaske är de ur tillämpigssypukt djärvare och mer itressata hypotese. 3

Hypoteser avser oftast värde på populatiosparametrar. Exempel på hypoteser om populatiosmedelvärde: H 0 : µ = 50; H 1 : µ 50 (ekel ollhypotes; tvåsidig mothypotes) H 0 : µ 50; H 1 : µ > 50 (sammasatt ollhypotes; esidig mothypotes) Exempel på hypoteser om populatiosproportioer: H 0 : π = 0,1; H 1 : π 0,1 (ekel ollhypotes; tvåsidig mothypotes) H 0 : π = 0,12; H 1 : π > 0,12 (ekel ollhypotes; esidig mothypotes). 4

Klassisk hypotesprövig, allmät Det gäller att fatta ett beslut: Förkasta H 0 eller ej? Vi ka aldrig vara helt säkra på fatta rätt beslut. Det fis två typer av fel som vi ka göra: Verklighete: H 0 sa H 0 ite sa Beslut: Ej förkasta H 0 Riktigt beslut Felaktigt beslut (Typ II-fel) Förkasta H 0 Felaktigt beslut (Typ I-fel) Riktigt beslut Vid klassisk hypotesprövig håller ma slh för typ I-fel uder kotroll. Ma ser till att de får ett i förväg bestämt värde, α, som sätts lågt (ofta α = 0,01, 0,05 eller 0,10). α = testets sigifikasivå = P(Förkasta H 0 H 0 sa) Slh för typ II-fel försöker ma seda edbriga geom att välja stickprovet tillräckligt stort. Tillvägagågssättet vid klassisk hypotesprövig är i huvudsak följade: 5

1. Formulera hypoteser, H 0 och H 1. 2. Bestäm e sigifikasivå α = saolikhete (riske) att förkasta H 0, är H 0 är sa. Ofta väljs α = 0,01, 0,05 eller 0,10. 3. Age vilke testvariabel som skall avädas. Testvariabel = e storhet vars värde skall beräkas frå stickprovsdata. Detta värde skall seda ligga till grud för vårt beslut. 4. Age beslutsregel. Dvs. age förkastelsegräser, sådaa att H 0 skall förkastas om testvariabel atar ett värde utaför dessa gräser. (Gräsera skall alltså bestämmas så att testvariabel med just slh α kommer att ata ett värde utaför dessa, ifall H 0 är sa.) 5. Beräka testvariabels värde med avädig av erhålla stickprovsdata. 6. Slutsats. Om testvariabel atar ett värde utaför förkastelsegräsera, så förkastas H 0 och vi säger att vi har fått ett resultat som är sigifikat på sigifikasivå α. I aat fall säger vi att H 0 ite ka förkastas (ett icke-sigifikat resultat). 6

OBS Ett icke-sigifikat resultat iebär ite att vi ka dra slutsatse att H 0 är sa. Det iebär bara att H 1 ite är ågo stark kokurret till H 0. Det ka fias måga adra täkbara ollhypoteser som ite heller skulle ha förkastats. Att icke-förkasta H 0 är alltså ite detsamma som att uta vidare acceptera H 0. Kursbokes författare säger: For good reasos may statisticias prefer ot to say, accept the ull hypothesis, istead they say, fail to reject the ull hypothesis. (sid. 332) We use the term reject ad failure to reject for possible decisios about a ull hypothesis i formal summaries of the outcomes of a test. (sid. 335) 7

Hypotesprövig för ett medelvärde Atag först att vi har ett stickprov av storlek frå e ormalfördelad populatio med okät medelvärde µ, me med käd varias σ 2. Vi vill pröva H 0 : µ = µ 0 H 1 : µ µ 0 Sigifikasivå: α = 0,05. Stadardtestet går till så här: Testvariabel: Z = x µ 0 σ Beslutsregel: H 0 förkastas, om Z obs > 1,96 (dvs. om Z obs > 1,96, eller Z obs < -1,96). Med sigifikasivå α = 0,01 förkastas H 0 ifall Z obs > 2,576. Med sigifikasivå α = 0,10 förkastas H 0 ifall Z obs > 1,645. 8

Motiverig: E rimlig utgågspukt är att H 0 skall förkastas ifall vi får ett värde på x som ligger lågt ifrå det uder H 0 förvätade värdet µ 0. Att x ligger lågt ifrå µ 0 är detsamma som att testvariabel Z atar ett värde lågt ifrå värdet 0 (atige åt det positiva eller det egativa hållet). H 0 skall alltså förkastas ifall vi får ett osaolikt högt eller osaolikt lågt värde på Z. Vi skall med adra ord förkasta H 0, ifall vi får ett värde på Z, som ligger utaför gräsera ±c, där c är e positiv kostat. Bestäm u c så att sigifikasivå blir de öskade (α = 0,05), dvs. bestäm c så att P( Z > c H 0 sa) = 0,05 Vi vet att om H 0 är sa, så har testvariabel Z e stadardiserad ormalfördelig, N(0; 1). Då är P( Z > 1,96 H 0 sa) = 0,05 Sätt alltså c = 1,96. Beslutsregel blir: förkasta H 0, om vi får ett Z-värde utaför gräsera ±1,96. 9

Grudpricipe vid statistisk hypotesprövig är: Om vi får ett värde på testvariabel, som skulle vara mycket osaolikt ifall H 0 vore sa, så väljer vi att i stället tro på H 1. Hur gör ma vid esidig mothypotes? T.ex. H 0 : µ = µ 0 H 1 : µ > µ 0 Samma testvariabel, me e aa förkastelsegräs. H 0 förkastas (på sigifikasivå 0,05) ifall Z obs > 1,645. Det är ju höga värde på x, dvs. höga värde på Z, som ger aledig att förkasta H 0 till förmå för H 1. Om mothypotese i stället är H 1 : µ < µ 0 så förkastas H 0 (på sigifikasivå 0,05) ifall Z obs < -1,645. Hur gör ma är populatiosvariase σ 2 ite är käd, eller är stickprovet är litet? 10

Testvariabler vid test av hypotes om µ: 30 (oavsett om populatioe är ormalfördelad eller ej) < 30 Populatioe ormalfördelad. σ 2 käd: σ 2 okäd: σ 2 käd: σ 2 okäd: Z = x µ 0 σ x µ s 0 Z = Z = x µ 0 σ x µ s 0 t = När H 0 är sa, så har testvariabel Z e stadardiserad ormalfördelig (exakt eller approximativt), och testvariabel t har e t-fördelig med -1 frihetsgrader. Kritiskt område bestäms med hjälp av Tabell 8 i kursboke, och med häsy till om mothypotese är e- eller tvåsidig. Exempel följer. 11

Ex.: Stickprov på = 16 observatioer frå ormalfördelig med käd stadardavvikelse = 16. Stickprovets medelvärde = 743. Hypoteser: H 0 : µ = 750 H 1 : µ 750 Sig.-ivå: α = 0,05 Testvariabel: Z = x µ 0 σ Beslutsregel: H 0 förkastas om Z obs > 1,96. 743 750 Resultat: Z obs = = 1, 75 16 16 Slutsats: H 0 ka ite förkastas på 5% sigifikasivå. 12

Ex.: Stickprov på = 70 observatioer frå populatio med okäd fördelig och med okäd stadardavvikelse. Stickprovets medelvärde: x = 14 100 Stickprovets stadardavvikelse: s = 1 900 Hypoteser: H 0 : µ = 13 500 H 1 : µ > 13 500 (Esidig mothyp.) Sig.-ivå: α = 0,05 Testvariabel: = x µ s Z 0 Beslutsregel: H 0 förkastas om Z obs > 1,64. 14100 13500 Resultat: Z obs = = 2,64 > 1, 64 1900 70 Slutsats: H 0 förkastas på 5% sigifikasivå. 13

Ex.: Stickprov på = 15 observatioer frå ormalfördelig med okäd stadardavvikelse. Stickprovets medelvärde x = 24,1 Stickprovets stadardavvikelse s = 2 Hypoteser: H 0 : µ 25 (Sätt µ 0 = 25) H 1 : µ < 25 Sig.-ivå: α = 0,01 Testvariabel: x µ s 0 t = Frihetsgrader: -1 = 14 Beslutsregel: H 0 förkastas om t obs < -2,624 24,1 25 Resultat: t obs = = 1, 743 2 15 Slutsats: H 0 ka ite förkastas på 1% sigifikasivå. 14