EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Relevanta dokument
EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Thomas Önskog 28/

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 12, FMSF45 Hypotesprövning

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

F9 Konfidensintervall

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

SF1901 Sannolikhetsteori och statistik I

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsningsanteckningar till kapitel 8, del 2

9. Konfidensintervall vid normalfördelning

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11, FMSF45 Konfidensintervall

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Avd. Matematisk statistik

Föreläsning 7. Statistikens grunder.

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Föreläsning 11, Matematisk statistik Π + E

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för B, K, N, BME och Kemister

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

10. Konfidensintervall vid två oberoende stickprov

, s a. , s b. personer från Alingsås och n b

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Formel- och tabellsamling i matematisk statistik

Föreläsning 5. Kapitel 6, sid Inferens om en population

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

F3 Introduktion Stickprov

TMS136. Föreläsning 13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

oberoende av varandra så observationerna är

Avd. Matematisk statistik

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 7: Punktskattningar

FÖRELÄSNING 8:

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Mer om konfidensintervall + repetition

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 12: Regression

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Industriell matematik och statistik, LMA /14

FÖRELÄSNING 7:

Föreläsning G60 Statistiska metoder

Grundläggande matematisk statistik

FACIT: Tentamen L9MA30, LGMA30

Föreläsningsanteckningar till kapitel 9, del 2

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsning 7: Punktskattningar

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Föreläsning 8: Konfidensintervall

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Laboration 2: Styrkefunktion samt Regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

BERÄKNING AV KARAKTERISTISKA VÄRDEN laster, hållfasthet, öden (frekvensanalys)

Föreläsning G60 Statistiska metoder

Laboration 4: Intervallskattning och hypotesprövning

Tentamen i Matematisk statistik Kurskod S0001M

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

FACIT: Tentamen L9MA30, LGMA30

Föreläsning 4. Kapitel 5, sid Stickprovsteori

F13 Regression och problemlösning

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Avd. Matematisk statistik

FACIT: Tentamen L9MA30, LGMA30

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Transkript:

Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 2018-09-19 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN): VAD ÄR FÖRVÄNTAT VÄRDE? Kvicksilverhalten hos gäddor med ungefär samma storlek varierar från gädda till gädda. De uppmätta halterna kan ses som observationer av N(µ, σ). För 10 gäddor fångade i en sjö erhöll man halterna (enhet: mg/kg): 0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1 Vad kan man säga om förväntad kvicksilverhalt hos gädda i denna sjö? Hur kan man uppskatta (skatta) µ och σ i modellen? Intressant är att få så mycket information som möjligt om µ. Kan man göra mer än en skattning? FRÅGESTÄLLNINGAR (FORTS): ÄR GRÄNSVÄRDET, g, ÖVERSKRIDET? EXEMPEL: Det hygeniska gränsvärdet för asbest är g ber/ml. Mätningar av asbest på en byggarbetsplats med asbestsanering anses vara normalfördelade med väntevärde µ. Två typer av gränsvärden är tänkbara: gränsvärde för µ, d.v.s. gränsvärdet är överskridet om µ >g gränsvärde för kvantil, t.e.x. gränsvärdet är överskridet om 2%-kvantilen > g

FRÅGESTÄLLNINGAR (FORTS): HAR EN STATISTISKT SÄKERSTÄLLD (SIGNIFIKANT) FÖR- ÄNDRING SKETT? EXEMPEL: Antalet jordskalv per år i ett område anses Poissonfördelat med väntevärde λ. Den seismologiska aktiviteten har under en längre tid varit konstant med ett λ som anses vara 1.6. Under perioden 1990-1999 uppmäts emellertid 25 jordskalv i området. Tyder detta på att området blivit seismologiskt oroligt så att λ ökat? FRÅGESTÄLLNINGAR (FORTS): FINNS DET EN SIGNIFIKANT SKILLNAD MELLAN ME- TODER? EXEMPEL: Avloppsvattnet från en industri innehåller små men mätbara mängder av koppar. Mätningar av Cu-halten (µg/l) i avloppsvattnet gjordes före och efter att en ny reningsteknik införts. Mätningar före åtgärden: 2.84 3.14 3.38 0.09 2.14 4.18 0.07 0.52 3.62 4.56 Mätningar efter åtgärden: 3.97 3.22 1.41 1.60 4.11 0.63 4.95 4.42 0.95 INOM DEN STATISTISKA FELMARGINALEN? EXEMPEL: Ett parti ck 25% av rösterna vid senaste valet. Vid första opinionsundersökningen efter valet tillfrågades 1000 personer och 275 sa att de nu skulle rösta på partiet. Har partiet ökat antalet sympatisörer eller är resultatet inom den statistiska felmarginalen?

Vad är skillnaden mellan SANNOLIKHETSTEORI och STATISTIKTEORI? Tidigare SANNOLIKHETSTEORI: EX: X=Hg-halten (mg/kg) hos en slumpmässigt vald gädda N(1, 0.3). Vad är sannolikheten att Hg-halt överstiger 1.5 mg/kg, d.v.s. P (X > 1.5) sökes. EX: P (översvämning ett år)=0.05 (20-årsod). Vad är sannolikheten att vi får minst en översvämning på 30 år? Om X=antal översvämningar på de 30 åren, ska vi beräkna P (X 1). FÖRDELNINGARNA ÄR HELT KÄNDA (Vi känner värdet på alla parametrar) Nu STATISTIKTEORI (STATISTISK INFERENS): EX: X=Hg-halten (mg/kg) hos en slumpmässigt vald gädda N(µ, σ). Vi mäter på n gäddor och får x 1,..., x n. Kan vi nu säga något om µ och σ? EX: P (översvämning ett år)=p (okänt). Under 100 år har det varit 8 översvämningsår. Vad kan vi nu säga om p? FÖRDELNINGARNA INNEHÅLLER OKÄNDA PA- RAMETRAR Vi använder data (mätningar) för att dra slutsatser om parametrarna.

VI ARBETAR MED DESSA METODER I STATISTIK- TEORIN: SKATTNINGAR: Hur ska vi skatta µ och σ i gäddexemplet? Hur nära ligger våra skattningar de sanna (okända) värdena på µ och σ? KONFIDENSINTERVALL: Hur skaa ett intervall I µ = (a, b) sådant att vi med en viss säkerhet (t.ex. 95%) kan säga att det täcker över µ - förväntad kvicksilverhalt hos en gädda? HYPOTESTEST: Gäller det att förväntad asbesthalt på arbetsplatsen, µ, överskrider gränsvärdet g? Ställ upp hypoteser: H 0 : µ g H 1 : µ > g Undersök med ett test om H 0 kan förkastas till förmån för H 1. Både kondensintervall och hypotestest baseras på skattningar och sannolikhetsteoretiska beräkningar kring skattningar.

SKATTNINGAR Exempel: X= Hg-halt hos gädda; X N(µ, σ) Vi har mätningar x 1,..., x 10 µ obs σobs betecknar en skattning (tal) av µ betecknar en skattning (tal) av σ Vi väljer: µ obs = x = 1 10 10 i=1 x i σobs = s = 1 10 i=1 (x i x) 2 10 1 I det aktuella stickprovet visade sig x = 0.97 och s = 0.33. Hade vi tagit ett nytt stickprov om 10 andra gäddor hade x (och s) förmodligen fått andra värden. Hur mycket kan x variera? Enligt tidigare: X N(µ, σ n ) = N(µ, σ 10 )

SAMMA SAK I FIGURER: Fördelningen för en kvicksilvermätning, N(µ, σ) µ Ett antal personer gör skattningar av µ baserade på vardera 10 mätningar: stickprov µ obs = x 1 0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1 0.97 2 0.9 1.2 0.8 1.7 1.0 1.0 1.3 1.0 1.0 0.7 1.07 3 0.9 1.2 1.2 1.2 1.4 1.2 1.4 0.6 1.0 1.0 1.11 4 0.5 1.1 0.7 1.4 0.8 1.2 1.1 0.7 0.3 1.0 0.87 5 0.7 1.2 1.2 1.5 1.2 0.8 1.1 0.7 1.0 1.0 1.03............... Fördelningen för skattningarna, d.v.s. medelvärdet av σ 10 Hg-mätningar, N(µ, 10 ) µ

NÅGRA INTRESSANTA FRÅGOR: Hur mycket kommer skattningen som mest att avvika från det sanna värdet µ? Hur kan vi förbättra skattningen? MAN VILL ATT SKATTNINGAR SKA vara unbiased (väntevärdesriktiga) - d.v.s. ska i genomsnitt verkligen skatta rätt värde. EX: Det förväntade värdet för µ = X är µ, d.v.s E(µ ) = µ. BRA! ha en så liten spridning som möjligt - d.v.s. skattningens standardavvikelse ska vara låg. EX: D(µ ) = D(X) = σ n. Ju större n desto mindre standardavvikelse (desto eektivare är skattningen).

NU VILL VI FÖRDJUPA ANALYSEN GENOM ATT GÖRA KONFIDENSINTERVALL: Gäddor igen: Kvicksilverhalten hos gäddor med ungefär samma storlek varierar från gädda till gädda. De uppmätta halterna kan ses som observationer av N(µ, σ). För 10 gäddor fångade i en sjö erhöll man halterna (enhet: mg/kg): 0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1 (a) Gör ett 95 % intervall för µ, förväntad Hg-halt hos en gädda. Antag att σ = 0.5. (b) Gör ett 99 % intervall för µ, förväntad Hg-halt hos en gädda. Antag att σ = 0.5. (c) Gör ett 99.9 % intervall för µ, förväntad Hg-halt hos en gädda. Antag att σ = 0.5. (d) Är det troligt att µ = 0.6 mg/kg? (e) Är det troligt att µ = 0.7 mg/kg? (f) Är det troligt att µ = 0.8 mg/kg? (g) Antag att σ inte är känd. Hur gör vi intervallen då?