EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Relevanta dokument
EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Thomas Önskog 28/

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

F9 Konfidensintervall

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Föreläsning 12, FMSF45 Hypotesprövning

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsningsanteckningar till kapitel 8, del 2

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

oberoende av varandra så observationerna är

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Mer om konfidensintervall + repetition

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 11, Matematisk statistik Π + E

Tentamen i Matematisk statistik Kurskod S0001M

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning 7. Statistikens grunder.

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

F3 Introduktion Stickprov

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

9. Konfidensintervall vid normalfördelning

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

FÖRELÄSNING 7:

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

10. Konfidensintervall vid två oberoende stickprov

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

, s a. , s b. personer från Alingsås och n b

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Matematisk statistik för B, K, N, BME och Kemister

Lektionsanteckningar 11-12: Normalfördelningen

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Avd. Matematisk statistik

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 7: Punktskattningar

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Matematisk statistik Kurskod S0001M

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

σ 12 = 3.81± σ n = 0.12 n = = 0.12

FÖRELÄSNING 8:

Föreläsning 12: Linjär regression

Föreläsning 12: Regression

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

F13 Regression och problemlösning

Tentamen i Matematisk statistik Kurskod S0001M

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsningsanteckningar till kapitel 9, del 2

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Avd. Matematisk statistik

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Tentamen i Matematisk statistik Kurskod S0001M

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Föreläsning 7: Punktskattningar

F10 Problemlösning och mer om konfidensintervall

Föreläsning 7: Punktskattningar

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i Matematisk statistik Kurskod S0001M

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

SF1901: Medelfel, felfortplantning

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Grundläggande matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Lufttorkat trä Ugnstorkat trä

Matematisk statistik för D, I, Π och Fysiker

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Transkript:

Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN): VAD ÄR FÖRVÄNTAT VÄRDE? Hastigheten i vilken en bilförare passerar en korsning varierar från förare till förare. De uppmätta hastigheterna hos ostörda fordon en viss tidsperiod kan ses som observationer av N(µ, σ). För 5 fordon mätte man hastigheterna (enhet: km/h): 51.3 40.5 48.0 53.9 47.3 Vad är genomsnittlig hastighet hos dessa 5 fordon? Vad kan man säga om µ, d.v.s. förväntad (genomsnittlig) hastighet hos fordon i allmänhet i denna korsning? Antag att µ skattas med medelvärdet av de 5 hastigheterna. Hur bra är denna skattning, d.v.s. hur nära ligger den det (okända) µ?

FRÅGESTÄLLNINGAR (FORTS): HAR EN STATISTISKT SÄKERSTÄLLD (SIGNIFIKANT) FÖRÄNDRING SKETT? EXEMPEL: Antalet jordskalv per år i ett område anses poissonfördelat med väntevärde λ. Den seismologiska aktiviteten har under en längre tid varit konstant med ett λ som anses vara 1.6. Under perioden 1990-1999 uppmäts emellertid 25 jordskalv i området. Tyder detta på att området blivit seismologiskt oroligt så att λ ökat? FRÅGESTÄLLNINGAR (FORTS): FINNS DET EN SIGNIFIKANT SKILLNAD MELLAN ME- TODER? EXEMPEL: I den tidigare beskrivna korsningen infördes en rondell. Innebar det en signikant minskning av hastigheten? Mätningar före åtgärden (korsning): 46.3 40.5 48.0 53.9 47.3 56.4 59.9 Medelvärde av mätningarna i korsning: x = 50.33 km/h Mätningar efter åtgärden (rondell): 43.2 40.8 38.0 37.9 40.2 46.8 49.2 39.4 Medelvärde av mätningarna i rondell: ȳ = 41.94 km/h Kan skillnaden mellan x och ȳ förklaras med slumpmässiga variationer eller kan vi med någon säkerhet säga att det nns en skillnad mellan µ korsning =förväntad hastighet i korsning och µ rondell =förväntad hastighet i rondell?

Vad är skillnaden mellan SANNOLIKHETSTEORI och STA- TISTIKTEORI? EX: ξ=hastigheten (km/h) hos en slumpmässigt vald bil N(52, 6). Vad är sannolikheten att hastigheten överstiger 65 km/h, d.v.s. P (ξ > 65) sökes. EX: P (översvämning ett år)=0.05 (20-årsod). Vad är sannolikheten att vi får minst en översvämning på 30 år? Om ξ=antal översvämningar på de 30 åren, ska vi beräkna P (ξ 1). FÖRDELNINGARNA ÄR HELT KÄNDA (Vi känner värdet på alla parametrar) Nu STATISTIKTEORI (STATISTISK INFERENS): EX: ξ=hastigheten (km/h) hos en slumpmässigt vald bil N(µ, σ). Vi mäter på n fordon och får x 1,..., x n. Kan vi nu säga något om µ och σ? EX: P (översvämning ett år)=p (okänt). Under 100 år har det varit 8 översvämningsår. Vad kan vi nu säga om p? FÖRDELNINGARNA INNEHÅLLER OKÄNDA PARAMET- RAR Vi använder data (mätningar) för att dra slutsatser om parametrarna.

VI ARBETAR MED DESSA METODER I STATISTIKTEO- RIN: SKATTNINGAR: Hur ska vi skatta µ och σ i hastighetsexemplet? Hur nära ligger vår skattningar de sanna (okända) värdena på µ och σ? KONFIDENSINTERVALL: Hur skaa ett intervall I µ = (a, b) sådant att vi med en viss säkerhet (t.ex. 95%) kan säga att det täcker över µ - förväntad hastighet hos ett fordon? HYPOTESTEST: Gäller det att förväntat antal jordskalv per år ökat? Ställ upp hypoteser: H 0 : λ 1.6 H 1 : λ > 1.6 Undersök med ett test om H 0 kan förkastas till förmån för H 1. Både kondensintervall och hypotestest baseras på skattningar och sannolikhetsteoretiska beräkningar kring skattningar.

SKATTNINGAR Exempel: ξ= hastigheten (km/h) hos en bil; ξ N(µ, σ) Vi har mätningar (hastigheter) x 1,..., x 5 µ obs σobs betecknar en skattning (tal) av µ betecknar en skattning (tal) av σ Vi väljer: µ obs = x = 1 5 5 i=1 x i σobs = s = 1 5 i=1 (x i x) 2 5 1 I det aktuella stickprovet visade sig x = 48.2 och s = 5.06. 51.3 40.5 48.0 53.9 47.3 Hade vi tagit ett nytt stickprov om 5 andra bilar hade x (och s) förmodligen fått andra värden. Hur mycket kan x variera? Enligt tidigare: ξ N(µ, σ n ) = N(µ, σ 5 ) fördelning för skattningen av µ N(µ,σ/sqrt(5)) fördelning för hastigheten N(µ,σ) µ

BEGREPPET SKATTNING: Med en skattning av µ menar vi en av följande: µ obs ett tal (t.ex. medelvärdet) µ en s.v. med en fördelning När vi ser skattningen µ som en s.v. med en fördelning kan vi studera E(µ ), d.v.s. förväntat värde på skattningen D(µ ), d.v.s. hur mycket skattningen kan variera mellan stickproven MAN VILL ATT SKATTNINGAR SKA vara unbiased (väntevärdesriktiga) - d.v.s. ska i genomsnitt verkligen skatta rätt värde. Med andra ord E(µ ) = µ. EX: Det förväntade värdet för µ = ξ är µ, d.v.s E(µ ) = µ. BRA! ha en så liten spridning som möjligt - d.v.s. skattningens standardavvikelse ska vara låg. EX: D(µ ) = D( ξ) = σ n. Ju större n desto mindre standardavvikelse (desto eektivare är skattningen).

FRÅN EN MÄTSERIE SKA VI RÄKNA UT TVÅ VIKTIGA SAKER: Värdet på skattningen, d.v.s. µ obs Ett mått på hur bra denna skattning är, d.v.s D(µ ) (skattningens standardavvikelse) Om D(µ ) innehåller något okänt skattar vi det okända och får då d(µ ) (skattningens medelfel). EXEMPEL: På 5 bilar mätte vi hastigheterna µ obs = x=48.2 (km/h) D(µ ) = σ 5, innehåller okänt σ skatta σ med σobs = s = 1 5 5 1 i=1 (x i x) 2 =5.06 medelfelet för µ är då d(µ ) = s 5 = 5.06 5 =2.26 (km/h) NU SÖKER VI ETT INTERVALL (a, b) SOM MED VISS SÄ- KERHET INNEHÅLLER µ: Om vi kan hitta a och b (båda funktioner av µ ) så att P (a(µ ) µ b(µ )) = 1 α är motsvarande intervall I µ = (a(µ obs ), b(µ obs )) ett KONFIDENSINTERVALL för µ med KONFIDENSGRAD 1 α Vi väljer kondensgraden själv! Vanliga värden är 95% kondensgrad, d.v.s. α =0.05 99% kondensgrad, d.v.s. α =0.01 99.9% kondensgrad, d.v.s. α =0.001

EXEMPEL: En konstruktion är dimensionerad att vila på 100 stolpar. Sju provstolpar drevs ner vid slumpmässigt valda platser i marken till de knäcktes. Resultatet (ton): 82 75 95 90 88 92 78 Modell: De 7 mätningarna, x 1,..., x 7, är ett slumpmässigt stickprov från ξ N(µ, σ) där µ tolkas som förväntad stolpkapacitet hos stolpar av denna typ. Vi skattade µ: µ obs = x = 85.7143 (a) Gör ett kondensintervall för µ med kondensgrad 95% då σ antas känd, σ = 7.5 (b) Utgående från intervallet i (a), är det troligt att µ är 75 ton? (c) Utgående från intervallet i (a), är det rimligt att µ är 84 ton? (d) Gör ett kondensintervall för µ med kondensgrad 99% då σ antas känd, σ = 7.5 (e) Gör ett kondensintervall för µ med kondensgrad 95% då σ är okänd men skattas med σobs = s = 1 7 7 1 i=1 (x i x) 2 = 7.4992