7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Relevanta dokument
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

7.3.3 Nonparametric Mann-Whitney test

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

7.5 Experiment with a single factor having more than two levels

FÖRELÄSNING 8:

Styr- och kontrolldiagram ( )

Introduktion och laboration : Minitab

Metod och teori. Statistik för naturvetare Umeå universitet

Hur man tolkar statistiska resultat

Statistik för teknologer, 5 poäng Skrivtid:

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TAMS65 - Föreläsning 6 Hypotesprövning

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

TAMS65 - Föreläsning 6 Hypotesprövning

7.5 Experiment with a single factor having more than two levels

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

3.1 Beskrivande statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Gamla tentor (forts) ( x. x ) ) 2 x1

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

, s a. , s b. personer från Alingsås och n b

Hur skriver man statistikavsnittet i en ansökan?

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i matematisk statistik

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 5. Kapitel 6, sid Inferens om en population

8 Inferens om väntevärdet (och variansen) av en fördelning

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

TMS136. Föreläsning 11

Tentamen i matematisk statistik

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning G60 Statistiska metoder

Tentamen i matematisk statistik

Examinationsuppgifter del 2

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsningsanteckningar till kapitel 9, del 2

2. Test av hypotes rörande medianen i en population.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i matematisk statistik

F3 Introduktion Stickprov

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Matematisk statistik för B, K, N, BME och Kemister

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Medicinsk statistik II

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Följande resultat erhålls (enhet: 1000psi):

Lösningar till SPSS-övning: Analytisk statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Kapitel 10 Hypotesprövning

Medicinsk statistik II

Parade och oparade test

Föreläsning 6, Repetition Sannolikhetslära

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

2.1 Minitab-introduktion

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Laboration med Minitab

TAMS28 DATORÖVNING VT1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

DATORÖVNING 3: MER OM STATISTISK INFERENS.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

OBS! Vi har nya rutiner.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Matematisk statistik för B, K, N, BME och Kemister

Lektionsanteckningar 11-12: Normalfördelningen

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Avd. Matematisk statistik

TMS136. Föreläsning 13

Uppgift a b c d e Vet inte Poäng

Tentamen i matematisk statistik

Introduktion till statistik för statsvetare

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Hypotestestning och repetition

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Laboration 3 Inferens fo r andelar och korstabeller

Transkript:

Betrakta motstånden märkta 3.9 kohm med tolerans 1%. Anta att vi innan mätningarna gjordes misstänkte att motståndens förväntade värde µ är mindre än det utlovade 3.9 kohm. Med observationernas hjälp vill vi påvisa att den förväntade resistansen är mindre än 3.9 kohm. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Descriptive Statistics: Uppmätt resistans_b Total Variable Count Mean SE Mean StDev Variance Uppmätt resistans 40 3,8801 0,000472 0,00299 0,000009 Med normalitetstest kan vi inte påvisa att observationerna inte är normalfördelade (p-värde = 0.172). Låt oss anta att de är normalfördelade.

Kan vi påstå att det observerade medelvärdet 3.8801 är tillräckligt mycket mindre än 3.9 för att kunna säga att nollhypotesen är falsk? För att kunna göra ett sådant påstående måste vi ta hänsyn till hur osäkert medelvärdet är som skattning av det förväntade värdet.

Från Kapitel 4.3: Om våra slumpvariabler X 1, X 2,, X n är oberoende och normalfördelade slumpvariabler har vi att X 2 σ är N( µ, ) n Även om observationerna inte är normalfördelade kommer medelvärdet att vara ungefär normalfördelat (CGS, n=40). Om nollhypotesen är sann bör medelvärdena ungefär vara N(3.9, 0.000009/40), dvs N(3.9, 0.000472 2 ). SE Mean i kvadrat

Cumulative Distribution Function Normal with mean = 3,9 and standard deviation = 0,000472 x P( X <= x ) 3,8801 0 ( fantastiskt nära noll )

Sannolikheten är näst intill noll att få ett medelvärde som är minst lika extremt som det vi observerade om nollhypotesen är sann. Denna sannolikhet kallas p-värde. p-värdet = P(minst lika extremt utfall som vi har fått givet att H 0 är sann)

Testförfarande: förkasta nollhypotesen till förmån för den alternativa hypotesen om p-värdet är mindre än den i förväg valda signifikansnivån α. Vanligtvis är α = 0.05. Tolkning av signifikansnivå: Den risk som man är villig att ta i att göra fel, dvs att förkasta nollhypotesen fast den kan vara sann.

H 0 representerar det som alltid gällt, ett fixt tal, lika med nånting. H 1 representerar det vi vill påvisa, skiljt ifrån, större än, mindre än. Med hjälp av data kan vi antingen förkasta H 0 till förmån för H 1, eller inte förkasta H 0. Obs! Vi accepterar aldrig H 0 som sann! Nollhypotes: H 0 : µ = µ 0 Alternativa hypoteser: H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0

Med vårt sannolikhetsresonemang finns det två typer av fel som vi kan göra. Typ-I fel: Förkasta H 0 då H 0 är sann Typ-II fel: Inte förkasta H 0 då H 0 är falsk P(Typ-I fel) = signifikansnivån α P(Typ-II fel) beror på stickprovsstorleken och det sanna µ-värdet

Vilket är det största värdet på medelvärdet som samtidigt medför att H 0 förkastas på signifikansnivån α=0.05? Inverse Cumulative Distribution Function Normal with mean = 3.9 and standard deviation = 0.000472 P( X <= x ) x 0.05 3.89922 Ett medelvärde mindre än 3.89922 medför att nollhypotesen förkastas på 5%- nivån.

A normal distribution (fig 1) The shaded area equals the probability of obtaining a value less than or equal to the stated x-value (P(X <= x)) x = 3.89922 P(X <= x) = 0.05 * * * * Theoretical input mu-value: sigma-value: x-value: P(X <=3.89922 ) P(X > 3.89922): Expected value (mu): Standard dev. (sigma): 3.900 0.000 3.899 0.05 0.95 3.900 0.000 3.898 3.899 3.900 Values of the variable X 3.901 3.902 Simulation: Theoretical: * calculated from the theoretical input: P(X <= x): see formula in the text P(X > x) = 1 - P(X <= x) Expected value = mu Standard dev. = sigma Uppward triangle: mu-value [Calc]>[Random Data]>[Normal...] [Calc]>[Probability Distributions]>[Normal...] (c) Ing-Stat, www.ing-stat.nu (Npdfcdf.mac). See also "A collection of diagrams" and %NormArea, %Nhist, %Ndata, %MultDist, %CLT 2007-09-20 16:08:44

Exempel: Antal felaktiga fakturor. Vi misstänker att antalet felaktiga fakturor per dag är mer än 10%. För att undersöka denna misstanke kontrollerades alla fakturor under en dag och man fann att 27 var felaktiga bland 200 (15%). Antalet felaktiga bland 200 är då binomialfördelat med parametrar 200 och p = P(godtycklig faktura är felaktig), dvs Bin(200,p).

p-värdet = P(minst lika extremt utfall som vi har fått givet att H 0 är sann) = P(antalet felaktiga är 27 eller flera givet att p = 0.1) = 1 - P(antalet felaktiga är 26 eller färre givet att p = 0.1) = 1 0.932775 = 0.067225 Cumulative Distribution Function Binomial with n = 200 and p = 0.1 x P( X <= x ) 26 0.932775

Eftersom p-värdet inte är mindre än signifikansnivån α = 0.05 kan vi inte förkasta nollhypotesen. Att vi fick 27 stycken just denna gång kan bero på slumpen! Hur många felaktiga fakturor behöver vi hitta för att förkasta nollhypotesen när p 10%?

Binomial with n = 200 and p = 0,1 Binomial with n = 200 and p = 0,1 x P( X <= x ) P( X > x) 26 0,932775 1 0,932775 = 0,0672247 27 0,956572 0,0434285 28 0,972908 0,0270922 Alltså: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre

Beslutsregel: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre Anta nu att en förändring i rutinerna medfört att p=0.07 Vad är då sannolikheten att förkasta nollhypotesen?

Binomial with n = 200 and p = 0.07 x P( X <= x ) 27 0.999626 Sannolikheten att förkasta blir 1-0.999626 = 0.000374 Anta att p = 0.14 x P( X <= x ) 27 0.469125 Sannolikheten att förkasta blir 1-0.469125 = 0.530875

Beslutsregel: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre Vi kan bilda en s.k. Styrkefunktion genom att beräkna sannolikheten att förkasta nollhypotesen som en funktion av p 1.0 Power curve 0.8 Power 0.6 0.4 0.2 0.0 0.0 0.1 0.2 0.3 Proportion nonconforming 0.4 0.5 (Minitab)

7.2.1 z-test Redan i 7.1 gjorde vi ett s k z-test! Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9. Anta att data är normalfördelade med den kända standardavvikelsen 0.003 Observerat medelvärde av våra 40 observationer var 3.8801. (Minitab)

7.2.1 z-test One-Sample Z: Resistans Test of mu = 3.9 vs < 3.9 The assumed standard deviation = 0.003 95% Upper Variable N Mean StDev SE Mean Bound Z P Resistans 40 3.88010 0.00299 0.00047 3.88088-41.95 0.000 (Minitab)

7.2.1 z-test Ofta är mothypotesen tvåsidig Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ 3.9. Anta att data är normalfördelade med den kända standardavvikelsen 0.003 Observerat medelvärde på våra 40 observationer var 3.8801. (Minitab)

7.2.1 z-test One-Sample Z: Resistans Test of mu = 3.9 vs not = 3.9 The assumed standard deviation = 0.003 Variable N Mean StDev SE Mean 95% CI Z P Resistans 40 3.88010 0.00299 0.00047 (3.87917;3.88103) -41.95 0.000 (Minitab)

7.2.1 z-test Under våra antaganden förkastar vi nollhypotesen! Vi observerar att 95% CI (konfidensintervallet med konfidensgrad 95%) inte innehåller nollhypotesens värde på µ = 3.9 Detta är ett alternativt sätt att testa en nollhypotes på 5% signifikansnivå! (Minitab)