Betrakta motstånden märkta 3.9 kohm med tolerans 1%. Anta att vi innan mätningarna gjordes misstänkte att motståndens förväntade värde µ är mindre än det utlovade 3.9 kohm. Med observationernas hjälp vill vi påvisa att den förväntade resistansen är mindre än 3.9 kohm. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.
Descriptive Statistics: Uppmätt resistans_b Total Variable Count Mean SE Mean StDev Variance Uppmätt resistans 40 3,8801 0,000472 0,00299 0,000009 Med normalitetstest kan vi inte påvisa att observationerna inte är normalfördelade (p-värde = 0.172). Låt oss anta att de är normalfördelade.
Kan vi påstå att det observerade medelvärdet 3.8801 är tillräckligt mycket mindre än 3.9 för att kunna säga att nollhypotesen är falsk? För att kunna göra ett sådant påstående måste vi ta hänsyn till hur osäkert medelvärdet är som skattning av det förväntade värdet.
Från Kapitel 4.3: Om våra slumpvariabler X 1, X 2,, X n är oberoende och normalfördelade slumpvariabler har vi att X 2 σ är N( µ, ) n Även om observationerna inte är normalfördelade kommer medelvärdet att vara ungefär normalfördelat (CGS, n=40). Om nollhypotesen är sann bör medelvärdena ungefär vara N(3.9, 0.000009/40), dvs N(3.9, 0.000472 2 ). SE Mean i kvadrat
Cumulative Distribution Function Normal with mean = 3,9 and standard deviation = 0,000472 x P( X <= x ) 3,8801 0 ( fantastiskt nära noll )
Sannolikheten är näst intill noll att få ett medelvärde som är minst lika extremt som det vi observerade om nollhypotesen är sann. Denna sannolikhet kallas p-värde. p-värdet = P(minst lika extremt utfall som vi har fått givet att H 0 är sann)
Testförfarande: förkasta nollhypotesen till förmån för den alternativa hypotesen om p-värdet är mindre än den i förväg valda signifikansnivån α. Vanligtvis är α = 0.05. Tolkning av signifikansnivå: Den risk som man är villig att ta i att göra fel, dvs att förkasta nollhypotesen fast den kan vara sann.
H 0 representerar det som alltid gällt, ett fixt tal, lika med nånting. H 1 representerar det vi vill påvisa, skiljt ifrån, större än, mindre än. Med hjälp av data kan vi antingen förkasta H 0 till förmån för H 1, eller inte förkasta H 0. Obs! Vi accepterar aldrig H 0 som sann! Nollhypotes: H 0 : µ = µ 0 Alternativa hypoteser: H 1 : µ > µ 0, H 1 : µ < µ 0, H 1 : µ µ 0
Med vårt sannolikhetsresonemang finns det två typer av fel som vi kan göra. Typ-I fel: Förkasta H 0 då H 0 är sann Typ-II fel: Inte förkasta H 0 då H 0 är falsk P(Typ-I fel) = signifikansnivån α P(Typ-II fel) beror på stickprovsstorleken och det sanna µ-värdet
Vilket är det största värdet på medelvärdet som samtidigt medför att H 0 förkastas på signifikansnivån α=0.05? Inverse Cumulative Distribution Function Normal with mean = 3.9 and standard deviation = 0.000472 P( X <= x ) x 0.05 3.89922 Ett medelvärde mindre än 3.89922 medför att nollhypotesen förkastas på 5%- nivån.
A normal distribution (fig 1) The shaded area equals the probability of obtaining a value less than or equal to the stated x-value (P(X <= x)) x = 3.89922 P(X <= x) = 0.05 * * * * Theoretical input mu-value: sigma-value: x-value: P(X <=3.89922 ) P(X > 3.89922): Expected value (mu): Standard dev. (sigma): 3.900 0.000 3.899 0.05 0.95 3.900 0.000 3.898 3.899 3.900 Values of the variable X 3.901 3.902 Simulation: Theoretical: * calculated from the theoretical input: P(X <= x): see formula in the text P(X > x) = 1 - P(X <= x) Expected value = mu Standard dev. = sigma Uppward triangle: mu-value [Calc]>[Random Data]>[Normal...] [Calc]>[Probability Distributions]>[Normal...] (c) Ing-Stat, www.ing-stat.nu (Npdfcdf.mac). See also "A collection of diagrams" and %NormArea, %Nhist, %Ndata, %MultDist, %CLT 2007-09-20 16:08:44
Exempel: Antal felaktiga fakturor. Vi misstänker att antalet felaktiga fakturor per dag är mer än 10%. För att undersöka denna misstanke kontrollerades alla fakturor under en dag och man fann att 27 var felaktiga bland 200 (15%). Antalet felaktiga bland 200 är då binomialfördelat med parametrar 200 och p = P(godtycklig faktura är felaktig), dvs Bin(200,p).
p-värdet = P(minst lika extremt utfall som vi har fått givet att H 0 är sann) = P(antalet felaktiga är 27 eller flera givet att p = 0.1) = 1 - P(antalet felaktiga är 26 eller färre givet att p = 0.1) = 1 0.932775 = 0.067225 Cumulative Distribution Function Binomial with n = 200 and p = 0.1 x P( X <= x ) 26 0.932775
Eftersom p-värdet inte är mindre än signifikansnivån α = 0.05 kan vi inte förkasta nollhypotesen. Att vi fick 27 stycken just denna gång kan bero på slumpen! Hur många felaktiga fakturor behöver vi hitta för att förkasta nollhypotesen när p 10%?
Binomial with n = 200 and p = 0,1 Binomial with n = 200 and p = 0,1 x P( X <= x ) P( X > x) 26 0,932775 1 0,932775 = 0,0672247 27 0,956572 0,0434285 28 0,972908 0,0270922 Alltså: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre
Beslutsregel: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre Anta nu att en förändring i rutinerna medfört att p=0.07 Vad är då sannolikheten att förkasta nollhypotesen?
Binomial with n = 200 and p = 0.07 x P( X <= x ) 27 0.999626 Sannolikheten att förkasta blir 1-0.999626 = 0.000374 Anta att p = 0.14 x P( X <= x ) 27 0.469125 Sannolikheten att förkasta blir 1-0.469125 = 0.530875
Beslutsregel: Förkasta om antalet felaktiga är fler än 27 Förkasta inte om antalet är 27 eller färre Vi kan bilda en s.k. Styrkefunktion genom att beräkna sannolikheten att förkasta nollhypotesen som en funktion av p 1.0 Power curve 0.8 Power 0.6 0.4 0.2 0.0 0.0 0.1 0.2 0.3 Proportion nonconforming 0.4 0.5 (Minitab)
7.2.1 z-test Redan i 7.1 gjorde vi ett s k z-test! Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9. Anta att data är normalfördelade med den kända standardavvikelsen 0.003 Observerat medelvärde av våra 40 observationer var 3.8801. (Minitab)
7.2.1 z-test One-Sample Z: Resistans Test of mu = 3.9 vs < 3.9 The assumed standard deviation = 0.003 95% Upper Variable N Mean StDev SE Mean Bound Z P Resistans 40 3.88010 0.00299 0.00047 3.88088-41.95 0.000 (Minitab)
7.2.1 z-test Ofta är mothypotesen tvåsidig Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ 3.9. Anta att data är normalfördelade med den kända standardavvikelsen 0.003 Observerat medelvärde på våra 40 observationer var 3.8801. (Minitab)
7.2.1 z-test One-Sample Z: Resistans Test of mu = 3.9 vs not = 3.9 The assumed standard deviation = 0.003 Variable N Mean StDev SE Mean 95% CI Z P Resistans 40 3.88010 0.00299 0.00047 (3.87917;3.88103) -41.95 0.000 (Minitab)
7.2.1 z-test Under våra antaganden förkastar vi nollhypotesen! Vi observerar att 95% CI (konfidensintervallet med konfidensgrad 95%) inte innehåller nollhypotesens värde på µ = 3.9 Detta är ett alternativt sätt att testa en nollhypotes på 5% signifikansnivå! (Minitab)