HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

Relevanta dokument
Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Grundläggande matematisk statistik

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Tillåtna hjälpmedel: Eget handskrivet formelblad (A4), utdelad tabellsamling, miniräknare med tömt minne Studenterna får behålla tentamensuppgifterna

Matematisk statistik KTH. Formelsamling i matematisk statistik

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Reliabilitet och validitet

KTH/ICT IX1501:F7 IX1305:F2 Göran Andersson Statistik: Skattningar

Reliabilitet och validitet. Föreläsningsanteckningar till: F7 undersökningsdesign F8 konfidensintervall F9 hypotesprövning

F10 ESTIMATION (NCT )

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Grundläggande matematisk statistik

APPROXIMATION AV SERIENS SUMMA MED EN DELSUMMA OCH EN INTEGRAL

Formelsamling för Finansiell Statistik

Föreläsning G70 Statistik A

Föreläsning G04: Surveymetodik

Grundläggande matematisk statistik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Tentamen del 2 i kursen Elinstallation, begränsad behörighet ET

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

4.2.3 Normalfördelningen

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

1. Test av anpassning.

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Försöket med trängselskatt

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

S0005M V18, Föreläsning 10

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Tentamen del 2 i kursen Elinstallation, begränsad behörighet ET

Borel-Cantellis sats och stora talens lag

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

2. Konfidensintervall för skillnaden mellan två proportioner.

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Digital signalbehandling Alternativa sätt att se på faltning

θx θ 1 om 0 x 1 f(x) = 0 annars

F15 ENKEL LINJÄR REGRESSION (NCT )

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Föreläsning G70 Statistik A

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Datorövning 2 Fördelningar inom säkerhetsanalys

TMS136: Dataanalys och statistik Tentamen med lösningar

Formelblad Sannolikhetsteori 1

a) Beräkna E (W ). (2 p)

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Introduktion till statistik för statsvetare

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Genomsnittligt sökdjup i binära sökträd

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Lösningar och kommentarer till uppgifter i 1.1

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

================================================

TAMS15: SS1 Markovprocesser

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Datorövning 2 Fördelningar inom säkerhetsanalys

Föreläsning 2: Punktskattningar

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Jag läser kursen på. Halvfart Helfart

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

INGENJÖRSMATEMATISK FORMELSAMLING

Avd. Matematisk statistik

Matematisk statistik TMS063 Tentamen

Lycka till! I(X i t) 1 om A 0 annars I(A) =

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Stokastiska variabler

Mätbar vetskap om nuläget och tydliga målbilder om framtiden. Genomför en INDICATOR självvärdering och nulägesanalys inom tre veckor

Färgscheman Bengal [by Jez]

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Jag läser kursen på. Halvfart Helfart

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Tentamen Metod C vid Uppsala universitet, , kl

Transkript:

HPOTESPRÖVNING De tatitika metodera om aväd för att fatta dea typ av belut baera på två komplemetära atagade om populatioe. Partiet produkter har atige de utlovade kvalitete eller å har de de ite. Atige fugerar tillverkigprocee om plaerat eller å gör de det ite. Atige har behadlige effekt på patietera eller å har de det ite. Dea atagade kalla valige hypoteer och metodera att fatta belut av det lag vi har exemplifierat ova, baerade på obervatioer frå ett urval, kalla hypoteprövig. Vi kommer att dikuterar metoder för att pröva hypoteer om populatioparametrar. Nollhypote och mothypote Med hjälp av data frå ett tickprov vill vi pröva hypoteer om de populatio eller de aolikhetfördelig om tickprovet kommer frå. Vi har e ollhypote (H 0 ) om täll mot e mothypote (H 1 ). Fråga är: Ger tickprovdata aledig att förkata H 0 (till förmå för H 1 ) eller kall vi hålla fat vid H 0? Ex.: I e politik partiympatiuderökig äger ig 14% av de utvalda peroera ympatiera med parti A. Vi vet att i eate valet fick parti A 1% av rötera. Har adele A-ympatiörer i populatioe ökat eda valet? H 0 : Adele är oförädrad. H 1 : Adele har ökat. Skall vi förkata H 0 eller ej? Om vi aer att det höga värdet i tickprovet ka förklara av lumpe (ifall H 0 är a), å håller vi fat vid H 0. Om vi aer att adele i tickprovet är högre ä vad om rimlige ka förklara av lumpe, å förkatar vi H 0. Statitik hypoteprövig iebär att vi aväder via belutregler för är vi kall förkata H 0 (och är vi kall hålla fat vid H 0 ). Dea belutregler är utformade å att vi har e vi kotroll över rike för felaktigt belut. Det fi e aymmetri i behadlige av H 0 och H 1 i tatitik hypoteprövig. Som H 0 väljer vi de hypote om vi i det lägta håller fat vid. Vi kräver extra tarkt töd frå oberverade data för att H 0 kall förkata. Bevibörda ligger ho de om förepråkar H 1. Ofta iebär H 0 ågot i til med ige förädrig, ige effekt, ige killad, meda H 1 kake är de ur tillämpigypukt djärvare och mer itreata hypotee. 1

Hypoteer aver oftat värde på populatioparametrar. Exempel på hypoteer om populatiomedelvärde: H 0 : = 50 mot H 1 : 50 (ekel ollhypote; tvåidig mothypote) H 0 : 50 mot H 1 : > 50 (ammaatt ollhypote; eidig mothypote) Exempel på hypoteer om populatioproportioer: H 0 : = 0,1 mot H 1 : 0,1 (ekel ollhypote; tvåidig mothypote) H 0 : = 0,1 mot H 1 : > 0,1 (ekel ollhypote; eidig mothypote). Hypoteprövig (allmät) Det gäller att fatta ett belut: Förkata H 0 eller ej? Vi ka aldrig vara helt äkra på fatta rätt belut. Det fi två typer av fel om vi ka göra: Verklighete: H 0 a H 0 ite a Belut: Ej förkata H 0 Riktigt belut Felaktigt belut (Typ II-fel) Förkata H 0 Felaktigt belut (Typ I-fel) Riktigt belut Vid klaik hypoteprövig håller ma aolikhete för typ I-fel uder kotroll. Ma er till att de får ett i förväg betämt värde,, om ätt lågt (ofta = 0,01, 0,05 eller 0,10). = tetet igifikaivå = P(Förkata H 0 H 0 a) Tillvägagågättet vid klaik hypoteprövig är i huvudak följade: 1. Formulera hypoteer, H 0 och H 1.. Betäm e igifikaivå = aolikhete (rike) att förkata H 0, är H 0 är a. Ofta välj = 0,01; 0,05 eller 0,10. 3. Age vilke tetvariabel om kall aväda. Tetvariabel = e torhet var värde kall beräka frå tickprovdata. Detta värde kall eda ligga till grud för vårt belut. 4. Age belutregel. Dv age förkatelegräer, ådaa att H 0 kall förkata om tetvariabel atar ett värde utaför dea gräer. (Gräera kall alltå betämma å att tetvariabel med jut aolikhete kommer att ata ett värde utaför dea, ifall H 0 är a.) 5. Beräka tetvariabel värde med avädig av erhålla tickprovdata. 6. Slutat. Om tetvariabel atar ett värde utaför förkatelegräera, å förkata H 0 och vi äger att vi har fått ett reultat om är igifikat på igifikaivå. I aat fall äger vi att H 0 ite ka förkata (ett icke-igifikat reultat).

OBS! Ett icke-igifikat reultat iebär ite att vi ka dra lutate att H 0 är a. Det iebär bara att H 1 ite är ågo tark kokurret till H 0. Det ka fia måga adra täkbara ollhypoteer om ite heller kulle ha förkatat. Att icke-förkata H 0 är alltå ite detamma om att uta vidare acceptera H 0. Kurboke författare äger: 1. Hypoteprövig för ett medelvärde Atag fört att vi har ett tickprov av torlek frå e ormalfördelad populatio med okät medel-värde, me med käd varia. Vi vill pröva H 0 : = 0 H 1 : 0 Sigifikaivå: = 0,05. x Tetvariabel: Z 0 Belutregel: H 0 förkata, om Z ob > 1,96 (dv. om Z ob > 1,96, eller Z ob < -1,96). Med igifikaivå = 0,01 förkata H 0 ifall Z ob >,576. Med igifikaivå = 0,10 förkata H 0 ifall Z ob > 1,645. Motiverig: E rimlig utgågpukt är att H 0 kall förkata ifall vi får ett värde på x om ligger lågt ifrå det uder H 0 förvätade värdet 0. Att x ligger lågt ifrå 0 är detamma om att tetvariabel Z atar ett värde lågt ifrå värdet 0 (atige åt det poitiva eller det egativa hållet). H 0 kall alltå förkata ifall vi får ett oaolikt högt eller oaolikt lågt värde på Z. Vi kall med adra ord förkata H 0, ifall vi får ett värde på Z, om ligger utaför gräera c, där c är e poitiv kotat. Betäm u c å att igifikaivå blir de ökade ( = 0,05), dv. betäm c å att P( Z > c H 0 a) = 0,05 Vi vet att om H 0 är a, å har tetvariabel Z e tadardierad ormalfördelig, N(0; 1). Då är P( Z > 1,96 H 0 a) = 0,05 Sätt alltå c = 1,96. Belutregel blir: förkata H 0, om vi får ett Z-värde utaför gräera 1,96. Grudpricipe vid tatitik hypoteprövig är: Om vi får ett värde på tetvariabel, om kulle vara mycket oaolikt ifall H 0 vore a, å väljer vi att i tället tro på H 1. 3

Hur gör ma vid eidig mothypote? T.ex. H 0 : = 0 H 1 : > 0 Samma tetvariabel, me e aa förkatelegrä. H 0 förkata (på igifikaivå 0,05) ifall Z ob > 1,645. Det är ju höga värde på x, dv. höga värde på Z, om ger aledig att förkata H 0 till förmå för H 1. Om mothypotee i tället är H 1 : < 0, å förkata H 0 (på igifikaivå 0,05) ifall Z ob < -1,645. Hur gör ma är populatiovariae ite är käd, eller är tickprovet är litet? Tetvariabler vid tet av hypote om : 30 (oavett om populatioe är ormalfördelad eller ej) käd: Z x 0 < 30 Populatioe ormalfördelad. okäd: käd: Z Z x 0 x 0 okäd: t x 0 När H 0 är a, å har tetvariabel Z e tadar-dierad ormalfördelig (exakt eller approxima-tivt), och tetvariabel t har e t-fördelig med -1 frihetgrader. 4

Exempel 1: 16 mjölkpaket välj lumpmäigt blad dem om fyllt på efter juterige och ma beräkar tickprovmedelvärdet till 1,008 liter. Stadardavvikele ata ite ha påverkat av juterige uta ma utgår frå att σ=0.0. Hypoteer: H 0 : = 1 H 1 : 1 Sig.-ivå: = 0,05 x Tetvariabel: Z 0 Belutregel: H 0 förkata om Z ob > 1,96. 1,008 1 Reultat: Zob 1, 60 0,0 16 Slutat: H 0 ka ite förkata på 5% igifikaivå. Exempel : Stickprov på = 70 obervatioer frå populatio med okäd fördelig och med okäd tadardavvikele. Stickprovet medelvärde: x = 14 100 Stickprovet tadardavvikele: = 1 900 Hypoteer: H 0 : = 13 500 H 1 : > 13 500 (Eidig mothypote) Sig.-ivå: = 0,05 x Tetvariabel: Z 0 Belutregel: H 0 förkata om Z ob > 1,64. 14 100 13 500 Reultat: Zob,64 1, 64 1 900 70 Slutat: H 0 förkata på 5% igifikaivå. Exempel 3: Atag att vi vill pröva hypotee att Marti Martii retid till arbetet är 30 miuter. Stadardavvikele i Marti Martii retid är okäd. Ett urval om 0 obervatioer dra. I urvalet uppkatta tadardavvikele till, tickprovet medelvärde x = 6,5. Hypoteer: H 0 : = 30 (Sätt 0 = 30) H 1 : 30 Sig.-ivå: = 0,05 5

Tetvariabel: t x 0 Frihetgrader: -1 = 19 Belutregel: H 0 förkata om t ob >,093 6,5 30 Reultat: t ob = 0, 94 0 Slutat: H 0 ka ite förkata på 5% igifikaivå. Exempel 4: E cigarettillverkare hävdar i i reklam att de cigaretter de tillverkar iehåller midre ä 5 mg ikoti i geomitt. Ett urval om 36 cigaretter gav medelvärdet 4,5 mg och tadardavvikele 3 mg. Vi prövar u cigarettillverkare påtåede geom att pröva hypoteer: Sig.-ivå: = 0,05 x Tetvariabel: Z 0 Belutregel: H 0 förkata om Z ob < -1,64. H 0 : = 5 H 1 : < 5 (Eidig mothyp.) 4,5 5 Reultat: Zob 1 1, 64 3 36 Slutat: H 0 förkata ej på 5% igifikaivå.. Hypoteprövig för e differe mella två medelvärde Medelvärde Varia Populatio 1 X X Populatio Vi är itreerade av differee X -. Stickprov frå pop. 1 Stickprov frå pop. Atal ob. i tickpr. Medelvärde Varia X x X y 6

Oberoede ata mella de båda tickprove. Hypoteer: där D 0 är ett tal. H 0 : X - = D 0 H 1 : X - D 0 (eller ekelidig mothyp.) Ofta är D 0 = 0, dv. vi prövar ollhypotee: H 0 : X = 0 Vi vill med adra ord pröva om båda populatioer-a ka täka ha amma medelvärde. Vi vet att x y är e vätevärderiktig kattig av X -. Fråga vid hypoteprövige är de valiga: Ligger det oberverade värdet på lågt ifrå talet D 0, att vi fier aledig att förkata H 0? Här kräv att båda tickprove kommer frå populatioer om är ormalfördelade. Tetvariabel är populatiovariaera är käda: x y å Z ( x y) D0 ~ 0 X X H N(0; 1) När populatiovariaera är okäda kräv deutom att dea är lika tora. (käer ite till det umerika värdet på.) Tetvariabel: t ( x y) D p 1 ( X 0 1 ) H0 ~ t( X + ) S ( P 1) X X ( 1) X 7

Om obervatioera är oberoede, X >30, >30 (tora tickprov) me med okäd fördelig får vi lita till cetrala grävärdeate. Tetvariabel är populatiovariaera är käda: Z ( x y) D X X 0 Tetvariabel är populatiovariaera är okäda: Z ( x y) D X X 0 Tetvariablera Z ova är approximativt ormal-fördelade, N(0; 1), är H 0 är a. Exempel. Vid e idutri fi e maki A om producerar via eheter. Ma fuderar över att köpa e y maki, B, om vierlige har e högra produktiohatighet är de fugerar om de ka, me ockå ett tötte atal drifttopp. Ma belutar att köpa maki B om de geomittproduktio är högre ä maki A: geomittproduktio. Båda makiera pröva uder 100 dyg och ma erhåller Maki A Maki B Atal obervatioer 100 100 Medelproduktio 1305 1338 Stadardavvikele 5 100 Hypoteera formulera om H 0 : μ A μ B = 0 H 1 : μ A μ B < 0 Om maki B geomittligt ett är bättre ä A blir differee μ A μ B egativ, vilket age i mothypotee, om på grud av frågetällige är eidig. (1305 1338) 0 33 33 Z OBS 3, 5 100 106,5 10,308 100 100 Z OBS < -1,64 H 0 förkata på 5% ig.-ivå, dv maki B är bättre. 8

3. Prövig av hypoteer om proportioer Att pröva e hypote om proportioer bygger på att biomialfördelige ka approximera med ormalfördelige. Atag t ex att adele idivider med e vi egekap i e tor populatio är π. Låt X vara atalet idivider med de egekape i ett urval om idivider. X ~Bi(; π). E[X] = π och V[X] = π(1 π). Låt proportioe av idivider i urvalet med de tuderade egekape vara Pˆ. Pˆ = X / ( 1 ) E[ Pˆ ] = π och V[ Pˆ ] =. Om urvalet är tort Z Pˆ ~ N(0;1) (1 ) / approx Exempel. För e tor populatio av kvior i e vi ålder gäller vid e vi tidpukt att 64 % är körkortiehavare, vilket ma fattällt geom e totaluderökig. Vid ett eare tillfälle vill ma uderöka om adele körkortiehavera i de aktuella ålder är oförädrad. Ma drar därför ett urval om 00 idivider, varav 160 viar ig vara körkortiehavare. Vi vill u pröva på igifikaivå 5 % om adele körkortiehavare i populatioe har ädrat. Hypoteera blir H 0 : π = 0,64 H A : π 0,64 Nollhypotee ager här att adele körkortiehavare är oförädrad meda mothypotee äger att e förädrig har ägt rum. Alterativhypotee är ålede tvåidig. E förädrig ka ju atige betå i att adele har mikat eller att de har ökat. Om H 0 är a Z ˆ H P 0 ~ N(0;1) (1 ) / approx Z OBS 0,8 0,64 0,64(1 0,64) / 00 0,16 0,034 4,71 Belutregel: Z OBS > 1,96 förkata H 0 på igifikaivå 5%. Z OBS =4,71>1,96, dv hypotee om ige förädrig förkata på igifikaivå 5%. 9