Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Föreläsning 5. Kapitel 6, sid Inferens om en population

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsningsanteckningar till kapitel 9, del 2

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Konfidensintervall, Hypotestest

TAMS65 - Föreläsning 6 Hypotesprövning

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Om statistisk hypotesprövning

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Hur man tolkar statistiska resultat

TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 11

Laboration 4: Hypotesprövning och styrkefunktion

Föreläsning 5: Hypotesprövningar

Föreläsning G60 Statistiska metoder

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 10

FÖRELÄSNING 8:

F3 Introduktion Stickprov

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

2. Test av hypotes rörande medianen i en population.

7.3.3 Nonparametric Mann-Whitney test

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

8 Inferens om väntevärdet (och variansen) av en fördelning

TMS136. Föreläsning 13

Hur skriver man statistikavsnittet i en ansökan?

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

a) Facit till räkneseminarium 3

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Laboration 3 Inferens fo r andelar och korstabeller

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Analytisk statistik. Tony Pansell, optiker Universitetslektor

F9 Konfidensintervall

Föreläsning 5 och 6.

σ 12 = 3.81± σ n = 0.12 n = = 0.12

, s a. , s b. personer från Alingsås och n b

Thomas Önskog 28/

Föreläsning 12: Regression

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 12: Repetition

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Medicinsk statistik II

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Kapitel 10 Hypotesprövning

Stockholms Universitet Statistiska institutionen Termeh Shafie

Matematisk statistik för D, I, Π och Fysiker

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Föreläsningsanteckningar till kapitel 8, del 2

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Statistisk utvärdering av antagningen till Polishögskolan

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

TENTAMEN I STATISTIKENS GRUNDER 2

F22, Icke-parametriska metoder.

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Avd. Matematisk statistik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

1 10 e 1 10 x dx = e 1 10 T = p = P(ξ < 3) = 1 e P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Matematisk statistik TMS064/TMS063 Tentamen

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Avd. Matematisk statistik

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

9. Konfidensintervall vid normalfördelning

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 4: Konfidensintervall (forts.)

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Industriell matematik och statistik, LMA /14

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

Uwe Menzel, 2017 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Syfte: o statistiska test om parametrar för en fördelning o förkasta eller acceptera hypotesen hypotes: = 20 (väntevärdet är 20) hypotes: = (sannolikhet att lyckas ) Hypotesen prövas med hjälp av ett stickprov: Exempel: o ett bolag tillverkar färg, påstår: genomsnittlig torrtid = 20 minuter. o Konsumentverket vill testa påståendet (hypotesen) o målar 36 brädor (n=36) o mäter torrtiden o = 36) o Normalfördelning antas, hypotesen är alltså = 20 ;,

Val av kritiskt värde / kritiskt område: Konsumentverket bestämmer sig för att tillbakavisa (förkasta) påståendet (hypotesen) om > 20.75 acceptera hypotesen förkasta hypotesen = 20 påståendet, hypotes 20.75 kritiskt värde (genomsnittlig torrtid i stickprovet) Vi ska senare se att det kritiska värdet beräknas på grundval av felrisken. Feltyper: när ett sådant kritiskt värde fixeras, är det oundvikligt att riskera två typer av fel: Fel typ I: det är möjligt att > 20.75 även om hypotesen = 20 stämmer: förkasta hypotesen, fastän den är sann Fel typ II: det är möjligt att < 20.75 även om hypotesen = 20 är falsk: acceptera hypotesen, fastän den är falsk Dessa fel kan förekomma för att vi fattar vara beslut på grundval ett (eller fler) stickprov, som styrs av slumpen. acceptera H förkasta H H är sann korrekt fel typ I H är falsk fel typ II korrekt

Fel typ I: förkasta hypotesen, fastän den är sann antar att är känd: = 2.4 Om hypotesen är sann: = 20 = 36 (när H sann) quantile_plots.r = 20 20.75 3% risk att göra ett fel typ I Fel typ II: acceptera hypotesen, fastän den är falsk antar att är känd: = 2.4 hypotesen är falsk, t.ex. = 21 = 36 (när H falsk) quantile_plots.r 20.75 = 21 26% risk att göra ett fel typ II

= 27% verkar vara mycket. Varför inte förskjuta det kritiska värdet till mindre värden, t. ex. 20.5? 20.75 20.5 = 21 20.75 20.5 felrisk typ II = blir mindre felrisk typ I = blir större I praktiken justeras som kan beräknas med hjälp av det hypotetiska värdet för parametern. kallas sinifikansnivå. Ofta väljs = 0.05 eller = 0.01. Att justera är däremot mest svårt: i exemplet antog vi att = 21 om hypotesen är falsk. Detta kan vi dock inte veta eftersom den sanna fördelningsparametern är ju okänd. Man kan eventuellt beräkna för flera förväntade värden, eller en funktion ( ) för ett visst intervall: Om blir större förskjuts fördelningen mot höger. Om samma kritiska värdet bibehålls blir mindre:

I praktiken är målet ofta att förkasta hypotesen: o vill visa att en ny stålsort har större hållfastighet än den gamla = 0 o vill visa att en fjärilart har längre vingar än en andra = 0 o vill visa att parti A har större andel sympatisörer på landsbygden än i storstäder ställer upp hypotesen att båda andelar är lika: = 0 försöker att förkasta denna hypotes Hypotesen säger alltså ofta att skillnaden är noll. Därför brukar den kallas nollhypotesen ( ). För att genomföra testet ställs nollhypotesen mot en mothypotes, eller alternativ hypotes ( ). Det finns olika möjligheter att formulera den alternativa hypotesen: test = > ensidigt förkasta > för = kritiskt värde test = < ensidigt förkasta < för test = tvåsidigt förkasta för < eller >

Exempel, tvåsidigt test: En byggelement måste ha diametern 30 cm, den får inte avvika till högre eller mindre värden. Nollhypotes ( ): = 30 ; förkasta om > 30.5 eller < 29.5 Exempel, ensidigt test: En gammal maskin producerar genomsnittligt 2500 komponenter per dag: = 2500. (för den nya maskinen) är högre! : > kan förkastas! 1. Definiera nollhypotes ( ) och alternativ hypotes ( ) 2. Slå fast signifikansnivån = 3. Bestäm testvariabeln (, ) och det kritiska värdet för den 4. Beräkna testvariabeln på grundval av stickprovet. 5. Avgör om nollhypotesen förkastas eller inte. Step 2: I praktiken sätter man alltså, och bestämmer sedan det kritiska värdet, inte tvärtom (som i exemplet torrtiden ). Mindre betyder att man kan vara mera säker att verkligen är falsk om den förkastas, risken för ett fel typ I förminskas ju. när = förkastas först när avviker ännu mer från quantile_plots.r = 0.05 = 0.01

= 0.05 betyder: i det långa loppet blir felaktigt förkastat i 1 av 20 test = 0.01 betyder: i det långa loppet blir felaktigt förkastat i 1 av 100 test Konsekvenserna av valet för måste övervägas noggrant: för exemplet torrtiden : mindre, t.ex. = 0.01 o är bättre för tillverkaren konsumentverket förkastar inte så lätt deras påstående (att torkningstiden är kortare än konkurrenternas) o men kanske sämre för konsumenterna möjligtvis är torkningstiden inte bättre än konkurrenternas likvärdig produkt för mest pengar Steg 2: I praktiken sätter man alltså, och bestämmer sedan det kritiska värdet... = 0.05 ensidigt test; : > under = kritiskt område ( förkastas om hamnar i det kritiska området) = kritiskt värde, början av vi vet att

kritiskt värde, känd ; ensidigt test; : > förkasta om > dvs. om kritiskt värde, känd ; ensidigt test; : < förkasta om < dvs. om kritiska värden, känd ; tvåsidigt test; : förkasta om < eller > okänd: ( 1) och (se föreläsning Intervallskattning ) förkasta om > dvs. om kritiskt värde, okänd ; ensidigt test; : > förkastas inte om alltså om Kom ihåg det ensidiga konfidensintervallet för (föreläsning intervallskattning): Detta betyder att vi accepterar : = på signifikansnivå om ligger i respektive konfidensintervall med konfidensgrad 1.

1. Beräkna ett konfidensintervall med konfidensgrad 1 för parametern som ska testas på grundval av stickprovet. 2. Acceptera : = på signifikansnivå om ligger i detta konfidensintervall, dvs. om. 3. Förkasta på signifikansnivå om ligger utanför detta konfidensintervall, dvs. om. Testvariabelmetoden och konfidensmetoden leder till samma slutsatser. Detta fungerar för ensidiga och tvåsidiga test. Om ligger i konfidensintervallet betyder det ju att finns bland de troliga värden för sanna parametern. En 3:e, kanske den viktigaste metoden, är direktmetoden o används mest i praktiken o p-värdet beräknas ( p-value ) Definition p-värdet: P-värdet = sannolikheten för att erhålla ett utfall minst så extrem som det faktiskt observerade, givet att nollhypotesen är sann. Utfall anses som extrema om de ligger längre bort från nollhypotesen, gentemot den alternativa hypotesen; de är mindre sannolik än om är sann. ensidigt test : = : > p Inget kritiskt område defineras, p- värdet räknas ut direkt. Om p-värdet är (mycket) litet betyder det att det observerade utfallet - och de ännu mer extrema utfallen - är (mycket) osannolika om antas vara sann. förkastas därför.

1. Definiera nollhypotes ( ) och alternativ hypotes ( ) 2. Slå fast signifikansnivån 3. Beräkna testvariabeln på grundval av stickprovet 4. Beräkna p-värdet. 5. Förkasta på signifikansnivå om <, annars acceptera ensidigt test : = : > p Direktmetoden, exempel: (ur: Alm, Britton:, Liber AB, Stockholm 2008) En person påstår sig vara tillräckligt fingerfärdig för att kunna påverka vilken sida som kommer upp vid myntkast, så att han får krona oftare än klave, dvs. = >. Vi är skeptiska och tror att =. För att testa påståendet får han göra 10 kast och vi är beredda att tro honom om han får tillräckligt många krona vid försöket. : = ; : > (ensidigt test) : antal krona i 10 försök. ~ (10, 0.5) under. Vi vill testa på signifikansnivå = 0.01 dvs. vi tror honom om < 0.01. Försöket gav = 8 krona i 10 försök. Facit: > 0.01 förkastas inte på signifikansnivå 0.01. (Den förkastas inte ens på signifikansnivå 0.05) inte att han kan påverka slantsingling.

Direktmetoden, exempel: tjock. Ytorna av 10 komponenter har mätts, med resultat = 32.2 ; 32.0 ; 30.4 ; 31.0 ; 31.2 ; 31.2 ; 30.3 ; 29.6 ; 30.5 ; 30.8. = 30.91 Av lång erfarenhet vet man att tjockleken är normalfördelad med = 0.788 (vi kommer att räkna med okänd senare ). : = 30 ; : 30 (tvåsidigt test) om är sann Direktmetoden, exempel: = 30.91 : = 30 ; : 30 (tvåsidigt test) under Vi kan utnyttja symmetrin: båda markerade områden är lika stora: 29.09 = 30 = 30.91 tvåsidigt test: båda markerade områden extremare än! < : förkastas. Stickprovet avslöjar på signifikansnivån 0.0005 (!) att avvikelserna är för stora! Det finns en statistiskt signifikant differens mellan det observerade och det hypotetiska värdet.