Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Föreläsning 12, FMSF45 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 5: Hypotesprövningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 7. Statistikens grunder.

Matematisk statistik för B, K, N, BME och Kemister

F3 Introduktion Stickprov

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 8:

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 11: Mer om jämförelser och inferens

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F9 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 5. Kapitel 6, sid Inferens om en population

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Matematisk statistik för B, K, N, BME och Kemister

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Laboration 4: Hypotesprövning och styrkefunktion

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Thomas Önskog 28/

TMS136. Föreläsning 11

Kapitel 10 Hypotesprövning

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Formel- och tabellsamling i matematisk statistik

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Hur man tolkar statistiska resultat

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

8 Inferens om väntevärdet (och variansen) av en fördelning

TMS136. Föreläsning 13

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Matematisk statistik för D, I, Π och Fysiker

Repetitionsföreläsning

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 11, FMSF45 Konfidensintervall

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 12: Repetition

10. Konfidensintervall vid två oberoende stickprov

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

9. Konfidensintervall vid normalfördelning

F22, Icke-parametriska metoder.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 3. Sannolikhetsfördelningar

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

F13 Regression och problemlösning

Mer om konfidensintervall + repetition

2. Test av hypotes rörande medianen i en population.

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 11, Matematisk statistik Π + E

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Om statistisk hypotesprövning

TMS136. Föreläsning 10

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 12: Regression

Matematisk statistik TMS064/TMS063 Tentamen

FÖRELÄSNING 7:

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Hur skriver man statistikavsnittet i en ansökan?

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Konfidensintervall, Hypotestest

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F10 Problemlösning och mer om konfidensintervall

, s a. , s b. personer från Alingsås och n b

Föreläsning 4: Konfidensintervall (forts.)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsningsanteckningar till kapitel 8, del 2

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Repetition 2, inför tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Transkript:

Föreläsning 2. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik 1MS026 vt 2014

ML-metoden: Standardfördelningar ML-skattning av parametrar i följande standardfördelningar: Poissonfördelning, exponentialfördelning, normalfördelning. [Tavlan] Läs på egen hand Exempel 7.14 (om likformig fördelning) och gör sedan Övning 7.2.12, taxiproblemet.

Minstakvadratmetoden Låt x 1,..., x n vara ett slumpmässigt stickprov från slumpvariabeln X med E[X ] = m(θ) där m är en känd funktion. Låt vidare Q(θ) = n (x i m(θ)) 2. i=1 Det värde θ Θ som mimimerar Q(θ) kallas minstakvadratskattningen av θ. Används flitigt i regressionsanalys.

Statistisk inferens Hittills: Metodik för punktskattning av parametrar. Nu följer: Metodik för statistisk inferens kring parametrarna; statistisk hypotesprövning. Dels allmänna begrepp, dels beräkningar för vissa viktiga specialfall.

Några exempel Krav: För medelnivån µ för utsläpp av en viss förorening skall gälla µ 3 (enhet: ppm, parts per million). Analytiker vid EPA granskar ett företag. Baserat på dagliga mätningar, kan man avgöra om företaget uppfyller kraven? EPA (United States Environmental Protection Agency)

Några exempel Kretskort till mobiltelefoner anländer till en tillverkare i paket om 10 000. Underleverantören hävdar att högst 1% är felaktiga. Att testa samtliga är för tids- och kostnadskrävande, man tar därför ut stickprov om 100 stycken. Om antalet Y av felaktiga i stickprovet är tillräckligt stort skickas paketet åter till underleverantören.

Parametrisk inferens Från grundkursen: Antag n st. ober., normalfördelade obs. från N(µ, σ 2 ). Med hjälp av följande resultat för fördelningar kan konfidensintervall konstrueras och hypotestest genomföras: X µ σ/ n N(0, 1), X µ S/ t(n 1) n där S 2 = 1 n 1 n (X i X ) 2 i=1 I grundkursen: oftast inferens kring parametern µ.

Täthetsfunktioner, t-fördelningen 0.4 0.35 df=1 df=5 N(0,1) 0.3 0.25 0.2 0.15 0.1 0.05 0 5 0 5

Gosset: Mannen bakom t-fördelningen William S. Gosset, 1876-1937. Brittisk statistiker. Verksam vid bryggeriet Guinness.

Konfidensintervall för medelvärde resp. proportion Exempel: 95% konfidensintervall, n oberoende obs. Medelvärde Exakt intervall: x ± t 0.025 (n 1) d där medelfelet d = s/ n. Stora stickprov (asymptotiskt): x ± λ 0.025 d. Proportion Asymptotiskt (härlett under normalapproximation): ˆp ± λ 0.025 d där medelfelet d = ˆp(1 ˆp)/n. (Avsevärt bättre intervall finns framtagna: Wilsonintervall, Agresti Coull.)

Statistisk hypotesprövning Statistisk hypotesprövning: Jerzy Neyman (1894-1981), Egon S. Pearson (1895-1980). Epokgörande artiklar 1928-1934.

Statistisk hypotesprövning: vetenskaplig dispyt Citat från W.E. Deming, 1930-tal: Karl Pearson and R A Fisher disagree almost to the point of taking up arms on some questions in statistics. K Pearson has no use for Student, either. Student and R A Fisher stand together. Fisher can say nothing good of Neyman and Pearson. I have heard from all sources that Egon Pearson is really a prince of a fellow.

Några begrepp inom hypotesprövning Utgångspunkt: Stickprov x = (x 1,..., x n ) från X med fördelningen F (x; θ). Nollhypotes: H 0 : θ = θ 0 Alternativhypotesen H 1 kan vara enkel, H 1 : θ = θ 1, eller sammansatt, t.ex. H 1 : θ > θ 0. En hypotes av typen H 1 : θ > θ 0 eller H 1 : θ < θ 0 är ensidig, medan H 1 : θ θ 0 är tvåsidig. Definition. Med signifikansnivån eller felrisken α menas α = P H0 (Förkasta H 0 ). Önskvärt: liten felrisk (vanliga val: α = 0.05 α = 0.01, α = 0.001).

Exempel: Krav vid mätning av föroreningar Ett exempel på test för problemet i fråga: H 0 : µ = 3 med sammansatt, ensidig mothypotes H 1 : µ > 3 Fortsatt frågeställning: Hur kan data användas för att beräkna felrisker? Hur kan t.ex. medelvärdet x utnyttjas?

Diskussion! Ange lämpliga hypoteser (H 0 och H 1 ) i följande situationer: (a) Andelen rökare i en viss grupp undersöktes för ett år sedan och befanns vara 10%. Man vill nu undersöka effekten av en genomförd antirökkampanj. (b) Man vill undersöka om det är någon skillnad i rökbenägenhet mellan två grupper, A och B. (c) Blir det någon skillnad i (b) om man observerat andelarna 11% för A och 9% för B? (d) Man vill undersöka effekten (µ, som bör vara hög) hos en ny medicin jämfört med en befintlig med effekten µ 0. (e) En domstol ska avgöra om en person är skyldig eller inte i ett indiciemål. [Övn. 7.4.2.]

Testvariabelmetoden Hitta en testvariabel T (x) baserad på stickprovet och till den ett kritiskt område C. Test: Om T C förkastas H 0 och ett signifikant resultat säges föreligga. Om T / C förkastas inte H 0 och resultatet är ej signifikant. Det kritiska området väljs så att felrisken α blir den önskade.

Tolkning (prof. Gunnar Blom, Lund) Observation av ett djur, förslag till nollhypotes och test. Testvariabel: Kritiskt område: H 0 : Djuret är en häst. T = Antal ben C = {0, 1, 2, 3, 5, 6,...}. Test: Om T 3 eller T 5 förkasta H 0 ; om T = 4, förkasta inte H 0. Om T = 4 förkastas inte H 0, men H 0 kan därför inte godkännas det kan ju röra sig om ett annat fyrfotadjur än en häst.

Viktigt exempel: väntevärde i normalfördelning Antag att man vill testa µ = 3 och ställer upp med mothypotesen H 0 : µ = 3 H 1 : µ > 3. Tillgängligt: Stickprovet x 1,..., x n från en normalfördelning med okänd varians σ 2 vilken skattas med s. Lämplig testvariabel (visas senare): T = x 3 s/ n Kritiskt område: {T > t α/2 (n 1)}.

Beslutsproblem: felrisker vid test Två fel kan inträffa vid hypotesprövning. Fel av första slaget (typ I): Förkasta H 0 av misstag (då alltså H 0 är sann). Fel av andra slaget (typ II): Förkasta inte H 0 trots att H 1 är sann. Ett tests så kallade styrka kan beräknas med hjälp av styrkefunktionen: h(θ) = P θ (Förkasta H 0 ).

Feltyper

Feltyper

Beslutsproblem: felrisker vid test Exemplet med granskning av utsläpp: H 0 sann H 1 sann Kraven uppfylls (acceptera H 0 ) Korrekt beslut Fel av typ II Kraven uppfylls inte (förkasta H 0 ) Fel av typ I Korrekt beslut Fel av typ I: Företaget oskyldigt dömt av EPA, trots att föreskrifterna följts. Fel av typ II: Missas av EPA, trots att föreskrifterna ej följts.

Konsekvenser, fel? Vilken feltyp är allvarligast? EPAs synvinkel: Typ I. En falsk anklagelse som senare uppdagas kan innebära dyra rättegångskostnader och försämrad goodwill. Boende nära industrin: Typ II. EPA missar att företagets nivåer är otillåtna, miljön förstörs.

Exempel: Uppgradering av programvara Ett företag har just utvecklat en uppgradering av en programvara. Man tror att det går att sälja denna till över 20% av de nuvarande kunderna. Tio kunder valdes ut slumpmässigt, och av dessa menade fyra att de tänkte köpa programmet. Baserat på detta stickprov, finns det tillräckliga bevis för att mer än 20% av kunderna kommer att köpa uppgraderingen?

Exempel: Uppgradering av programvara Beteckna med p den sanna andelen blivande köpare. Hypoteser: H 0 : p = 0.2 H 1 : p > 0.2 Inför slumpvariabeln Y Bin(10, p). Stora värden på Y stöder mothypotesen. Vad är lämpligt kritiskt område? Antag att vi i förväg valt Y 4. Testvariabel: T = y, kritiskt område: y 4. För stickprovet i fråga fann man y = 4, alltså förkastas H 0. Företaget har rätt i sin uppfattning.

Exempel: Uppgradering av programvara Fel av typ I (röd färg): α = P(Y 4 p = 0.2) = 1 P(Y 3 p = 0.2) = 0.121. R-kod: 1-pbinom(3,10,0.2)

Exempel: Uppgradering av programvara Fel av typ II (röd färg). Vad är sannolikheten att inte förkasta H 0 : p = 0.2 när i själva verket p = 0.6? β = P(Y 3 p = 0.6) = 0.055.

Exempel: Uppgradering av programvara Styrkefunktion (1 β) som funktion av p: R-kod: pv <- seq(0,1,by=0.01); plot(pv,1-pbinom(3,10,pv))

Styrkefunktion: Rökdetektor

Styrkefunktion: EPA-exempel

Metoder för hypotesprövning Flera metoder har utarbetats för hypotesprövning. 1. Användning av teststorhet (referensvariabel). För översikt, se kursboken, kap. 7.6. Normalapproximation för inferens i binomial- och Poissonfördelningarna. 2. Konfidensmetoden (användning av konfidensintervall) 3. Direktmetoden (att föredra vid diskreta fördelningar) 4. Likelihoodkvottest

Procedur vid hypotestest Hypotestest (av väntevärde i normalfördelning) 1. Förutsättningar och antaganden. Kvantitativ variabel, innebörd av väntevärde Oberoende obs. Fördelningen approximativt normal 2. Formulera nollhypotes och mothypotes (en- eller tvåsidig); Exempel: H 0 : µ = µ 0, H 1 : µ µ 0. 3. Formulera testvariabel: t = x µ 0 s/ n 4. Beräkna p-värde (tabell eller dator). 5. Slutsats: Förkasta H 0 om p-värdet mindre än eller lika med signifikansnivån (t.ex. 0.05). Relatera resultatet till det aktuella problemet.

Definition, p-värde Sannolikheten att få ett lika stort (eller extremare, i riktning av mothypotesen) som det observerade, under antagandet att H 0 är sann. Ett lågt p-värde utgör ett starkt skäl mot nollhypotesen H 0. En del forskare fiskar frenetiskt efter låga p-värden!

Exempel (väntevärde i normalfördelning) Från EPA vill man testa om väntevärdet µ = 3 ppm och har 15 observationer i ett slumpmässigt stickprov. Mätningarna gav som resultat x = 3.10 ppm. (a) Antag att standardavvikelsen vid denna typ av mätningar anses vara 0.20. Utför ett hypotestest (α = 0.05). (b) Man har ingen uppfattning om standardavvikelsen utan skattar denna från stickprovet: ˆσ = s = 0.17. Utför ett hypotestest (α = 0.05.) [Tavlan]

Exempel (forts), styrkefunktion Utgå från situationen (a) ovan och beräkna styrkefunktionen för hypotesprövningsproblemet H 0 : µ = 3 med mothypotesen H 1 : µ > 3. [Tavlan]

Styrkefunktion, normalfördelning Blå kurva: n = 15. Röd kurva: n = 40. Styrkan växer för värden i riktning av mothypotesen. Styrkan växer med ökad stickprovsstorlek.