SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Thomas Önskog 28/

SF1901 Sannolikhetsteori och statistik I

9. Konfidensintervall vid normalfördelning

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 11, Matematisk statistik Π + E

F9 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TMS136. Föreläsning 10

Matematisk statistik för B, K, N, BME och Kemister

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Mer om konfidensintervall + repetition

10. Konfidensintervall vid två oberoende stickprov

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 12, FMSF45 Hypotesprövning

Formel- och tabellsamling i matematisk statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

FÖRELÄSNING 7:

Föreläsning 4: Konfidensintervall (forts.)

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Stickprovsvariabeln har en fördelning / sprindning

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

TMS136. Föreläsning 13

Lufttorkat trä Ugnstorkat trä

FÖRELÄSNING 8:

Matematisk statistik KTH. Formelsamling i matematisk statistik

Extrauppgifter - Statistik

Föreläsningsanteckningar till kapitel 9, del 2

Avd. Matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsning 3: Konfidensintervall

TMS136. Föreläsning 11

Avd. Matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 7. Statistikens grunder.

Grundläggande matematisk statistik

F10 Problemlösning och mer om konfidensintervall

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12: Linjär regression

Extrauppgifter i matematisk statistik

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Avd. Matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Avd. Matematisk statistik

Uppgift 1. f(x) = 2x om 0 x 1

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Föreläsning 7: Punktskattningar

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Avd. Matematisk statistik

Föreläsning 7: Punktskattningar

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Avd. Matematisk statistik

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

FACIT: Tentamen L9MA30, LGMA30

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

SF1901 Sannolikhetsteori och statistik I

F13 Regression och problemlösning

SF1901 Sannolikhetsteori och statistik I

Tentamen i Matematisk Statistik, 7.5 hp

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

SF1901: Medelfel, felfortplantning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Avd. Matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

Tentamen MVE301 Sannolikhet, statistik och risk

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Transkript:

SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 11 INTERVALLSKATTNING. Tatjana Pavlenko 24 april 2018

PLAN FÖR DAGENS FÖRELÄSNING Vad är en intervallskattning? (rep.) Den allmänna metoden för att konstruera ett konfidensintervall (rep. ) Tillämpning på normalfördelning: Intervallskattning för σ i N(µ, σ). Mer om situationer med normalfördelade data: två stickprov. Konfidensintervall för differens mellan olika väntevärden. Stickprov i par. (Kap. 12-3 (d))

VAD ÄR EN INTERVALLSKATTNING? (REP.) Ett alternativt (till punktskattning) sätt att redovisa skattningen är att bestämma ett intervall som innehåller det sanna (verkliga) parametervärdet med t ex sannolikheten 0.95. Några exempel: Livslängden hos en bil ligger mellan 12 och 15 år med sannolikheten 0.95. Andelen väljare som röstar på socialdemokraterna är mellan 35% och 39% med sannolikheten 0.90. Antalet samtal till telefonväxel är mellan 15 och 18 per minut med sannolikheten 0.99. Standardavvikelsen för en viss laboratoriemättning är mellan 1.5 och 2 mg med sannolikheten 0.95.

INTERVALLSKATTNING (REP. ) Förra föreläsningen definierades ett konfidensintervall en okänd parameter θ: Def: Låt x = (x 1,..., x n ) vara utfall av ett slumpmässigt stickprov X = (X 1,..., X n ) vars fördelning beror av en okänd parameter θ och låt 0 < α < 1. Ett intervall, I θ = (a 1 (x), a 2 (x)) kallas ett konfidensintervall för θ med konfidensgrad 1 α om den innehåller θ med sannolikhet 1 α, dvs P (a 1 (X ) < θ < a 2 (X )) = 1 α. Konfidensgränserna, a 1 (x) och a 2 (x) är observationer av stickprovsvariabler, a 1 (X ) och a 2 (X ). Ett konfidensintervall I θ = (a 1 (x), a 2 (x)) kan alltså betraktas som en observation av ett intervall med stokastiska gränser.

KONSTRUKTION AV KONFIDENSINTERVALL (REP.) Den allmäna metoden för att konstruera ett konfidensintervall för en okänd parameter θ kan beskrivas i följande steg: 1. Skriv upp parameter att skatta (θ) och hitta punktskattare θ. 2. Bestäm punktskattares fördelning. 3. Transformera punktskattare till en ny stokastisk variabel, T (X ) vars fördelning inte beror på några okända parametrar, i.e. en pivot. 4. Stäng in den transformerade s.v. T (X ) mellan kvantilerna t α i dess kända fördelning: 1 α = P(t 1 α/2 < T (X ) < t α/2 ) 5. Skriv om i olikheten så att θ blir instängd i stället. Då ar I θ = (a 1 (x), a 2 (x)) ett konfidensintervall för θ med konfidensgrad 1 α.

TILLÄMPNING PÅ NORMALFÖRDELNING (REP.) Konfidensintervall för µ i N(µ, σ): sammanfattning av λ- och t-metoden. Låt x 1,..., x n vara ett slumpmässigt stickprov från N(µ, σ) där µ är okänd. Då om σ är känd: I µ = ( x ± λ α/2 D(µ )) = ( x ± λ α/2 σ n ), om σ är okänd: I µ = ( x ± t α/2 (n 1)d(µ )) = ( x ± t α/2 (n 1) s ), n där kvantilerna ges av λα/2 är N(0, 1)-fördelnings α/2-kvantil (se Tabell 2) tα/2 (n 1) är t-fördelnings α/2-kvantil (se Tabell 3) Man kan också göra konfidensintervall för σ och σ 2 i N(µ, σ). För detta behöver vi en ny fördelning.

STICKPROVSFÖRDELNINGAR. I samband med stickprov från N(µ, σ) uppträder några (nya) fördelningar som vi behöver för att kunna hantera konfidensintervall. Sats: Låt X 1,..., X n vara ett slumpmässigt stickprov från N(µ, σ). Då gäller följande: µ = X N(µ, D), D = σ n, n 1 σ 2 (X i X ) 2 = i=1 samt X och S är oberoende. (n 1)S2 σ 2 χ 2 (n 1), Sats: Låt X N(0, 1) och Y χ 2 (f ) vara oberoende s.v. Då gäller följande: X Y / f t(f ).

STICKPROVSFÖRDELNINGAR (FORTS.) Nästa sats ger samband mellan N(µ, σ), χ 2 och t-fördelningar: Sats: Om X 1,..., X n är oberoende N(µ, σ)-fördelare s.v. så gäller att X µ S/ t(n 1). n Båda χ 2 och t-fördelningar förekommer som fördelningar för pivotvariabler vid stickprov från normalfördelningar.

χ 2 -FÖRDELNING. FIGUR: Exempel på täthetsfunktionen för χ 2 -fördelning med olika antal frihetsgrader k = n 1.

t-fördelning. FIGUR: Exempel på täthetsfunktionen för t-fördelning med olika antal frihetsgrader ν = n 1. Den har N(0, 1)-fördelningen som gränsfördelning då ν.

t-fördelning (FORTS.) FIGUR: Teorin av t-fördelningen presenterades först 1908 av kemisten och statistikern W. S. Gosset som var anställd på bryggeriet Arthur Guinness & Sons i Dublin. Han publicerade sin forskning under pseudonymen Student, därför man ofta kallar den Students t-fördelning.

KONFIDENSINTERVALL FÖR σ. Exempel: konfidensintervall för σ i N(µ, σ), steg 1-3 på tavlan. 4. ( n 1 P S χ 2 < σ < S α/2 (n 1) 5. Med detta erhålls I σ i följande χ 2 1 α/2 ) n 1 = 1 α. (n 1) Sats: Låt x 1,..., x n vara utfall av ett slumpmässigt stickprov fråm N(µ, σ). Då ges konfidensintervall för σ med konfidensgraden 1 α av I σ = (sk 1, sk 2 ), där k 1 = n 1 χ 2 α/2 (n 1), k n 1 2 = χ 2. 1 α/2 (n 1)

TVÅ OBEROENDE STICKPROV: KONFIDENSINTERVALL FÖR µ 1 µ 2. I många praktiska situationer är det viktigt att kunna jämföra väntevärden i två olika grupper. Några exempel: Är två stållegeringar lika? Är en viss ny medicin bättre än den gamla? Är nätverk A mer effektivt än nätverk B? Följande modell är användbar för sådana jämförelser: vi antar att x 1,..., x n1 är oberoende observationer av s.v med N(µ 1, σ 1 )-fördelning och y 1,..., y n2 är oberoende observationer av s.v med N(µ 2, σ 2 )-fördelning. Vi vill härleda konfidensintervall för µ 1 µ 2 med konfidensgrad 1 α, och delar upp analysen i två olika fall: 1. σ 1 och σ 2 är kända. 2. σ 1 = σ 2 = σ är okänd.

TVÅ OBEROENDE STICKPROV: KONFIDENSINTERVALL FÖR µ 1 µ 2 (FORTS.) För båda fall går vi tillväga enligt steg 1-5: (talan). De erhållna intevallen sammanfattas i förljande Sats: (sats 12.3) Låt x 1,..., x n1 och y 1,..., y n2 vara slumpmässiga, av varandras oberoende stickprov från N(µ 1, σ 1 ) respektive N(µ 2, σ 2 ). Om σ1 och σ 2 är kända erhålls ett tvåsidigt 1 α konfidensintervall för µ 1 µ 2 med I µ1 µ 2 = ( x ȳ ± λ α/2 D), D = σ1 2/n 1 + σ2 2/n 2. Om σ1 = σ 2 = σ och är okänd så är I µ1 µ 2 = ( x ȳ ± t α/2 (f )d), d = s 1/n 1 + 1/n 2, Q s = 1 + Q 2 (n 1 1) + (n 2 1). Q 1 och Q 2 är kvadratsummorna kring respektive stickprovsmedelväraden och f = (n 1 1) + (n 2 1).

STICKPROV I PAR. Man vill undersöka effekten av blodtryckssänkande medicin. Diskutera två möjliga försöksupplägg.

STICKPROV I PAR. Idé: Man vill undersöka effekten av blodtryckssänkande medicin. Två möjliga försöksupplägg är följande: 1. En grupp om 10 personer får medicinen och en annan grupp om 10 personer får placebo. Man kan använda I µ1 µ 2 för två oberoende stickprov. Problem: Stora skillnader mellan personernas blodtryck och liten skillnad beroende på om man har placebo eller medicin! Variationen mellan olika individer kommer att dominera och det blir svårt att se om medicinen har någon effekt. I µ1 µ 2 kommer att bli för brett. 2. Mät blodtrycket före och efter behandling på en grupp om 10 pers. Man kan göra sig av variationen mellan individer och istället fokusera på variation som orsakas av medicin! Slutsats: Om mätvärdena hör ihop parvis använder man modellen stickprov i par!

STICKPROV I PAR (FORTS.). Ex: Två vågar, A och B. Man misstänker att B har systematiskt fel så att det ger förhögt värde, medan A har rätt i medeltal. Modell. Våg A: X i N(µ i, σ 1 ). Våg B: Y i N(µ i +, σ 2 ), i = 1,..., n. Man vägde 6 föremål på båda vågarna för att bestämma I.

STICKPROV I PAR. Figur: Uppmätta vikter för A(o) och B(x). Stor skillnad mellan de olika observationer men liten skillnad mellan A och B varför stickprov i par är lämpligt. Objekt, i 1 2 3 4 5 6 Obs. av A, x i 1.0 7.7 9.6 21.0 32.3 22.6 X i N(µ i, σ 1 ) B, y i 3.1 8.8 12.0 19.5 35.5 35.5 Y i N(µ i +, σ 2 ) z i = y i x i 2.1 1.1 2.4-1.5 3.2 9.9 Z i N(, σ) Konfidensintervall för på tavlan!