Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN): VAD ÄR FÖRVÄNTAT VÄRDE? Hastigheten i vilken en bilförare passerar en korsning varierar från förare till förare. De uppmätta hastigheterna hos ostörda fordon en viss tidsperiod kan ses som observationer av N(µ, σ). För 5 fordon mätte man hastigheterna (enhet: km/h): 51.3 40.5 48.0 53.9 47.3 Vad är genomsnittlig hastighet hos dessa 5 fordon? Vad kan man säga om µ, d.v.s. förväntad (genomsnittlig) hastighet hos fordon i allmänhet i denna korsning? Antag att µ skattas med medelvärdet av de 5 hastigheterna. Hur bra är denna skattning, d.v.s. hur nära ligger den det (okända) µ?
FRÅGESTÄLLNINGAR (FORTS): HAR EN STATISTISKT SÄKERSTÄLLD (SIGNIFIKANT) FÖRÄNDRING SKETT? EXEMPEL: Antalet jordskalv per år i ett område anses poissonfördelat med väntevärde λ. Den seismologiska aktiviteten har under en längre tid varit konstant med ett λ som anses vara 1.6. Under perioden 1990-1999 uppmäts emellertid 25 jordskalv i området. Tyder detta på att området blivit seismologiskt oroligt så att λ ökat? FRÅGESTÄLLNINGAR (FORTS): FINNS DET EN SIGNIFIKANT SKILLNAD MELLAN ME- TODER? EXEMPEL: I den tidigare beskrivna korsningen infördes en rondell. Innebar det en signikant minskning av hastigheten? Mätningar före åtgärden (korsning): 46.3 40.5 48.0 53.9 47.3 56.4 59.9 Medelvärde av mätningarna i korsning: x = 50.33 km/h Mätningar efter åtgärden (rondell): 43.2 40.8 38.0 37.9 40.2 46.8 49.2 39.4 Medelvärde av mätningarna i rondell: ȳ = 41.94 km/h Kan skillnaden mellan x och ȳ förklaras med slumpmässiga variationer eller kan vi med någon säkerhet säga att det nns en skillnad mellan µ korsning =förväntad hastighet i korsning och µ rondell =förväntad hastighet i rondell?
Vad är skillnaden mellan SANNOLIKHETSTEORI och STA- TISTIKTEORI? EX: ξ=hastigheten (km/h) hos en slumpmässigt vald bil N(52, 6). Vad är sannolikheten att hastigheten överstiger 65 km/h, d.v.s. P (ξ > 65) sökes. EX: P (översvämning ett år)=0.05 (20-årsod). Vad är sannolikheten att vi får minst en översvämning på 30 år? Om ξ=antal översvämningar på de 30 åren, ska vi beräkna P (ξ 1). FÖRDELNINGARNA ÄR HELT KÄNDA (Vi känner värdet på alla parametrar) Nu STATISTIKTEORI (STATISTISK INFERENS): EX: ξ=hastigheten (km/h) hos en slumpmässigt vald bil N(µ, σ). Vi mäter på n fordon och får x 1,..., x n. Kan vi nu säga något om µ och σ? EX: P (översvämning ett år)=p (okänt). Under 100 år har det varit 8 översvämningsår. Vad kan vi nu säga om p? FÖRDELNINGARNA INNEHÅLLER OKÄNDA PARAMET- RAR Vi använder data (mätningar) för att dra slutsatser om parametrarna.
VI ARBETAR MED DESSA METODER I STATISTIKTEO- RIN: SKATTNINGAR: Hur ska vi skatta µ och σ i hastighetsexemplet? Hur nära ligger vår skattningar de sanna (okända) värdena på µ och σ? KONFIDENSINTERVALL: Hur skaa ett intervall I µ = (a, b) sådant att vi med en viss säkerhet (t.ex. 95%) kan säga att det täcker över µ - förväntad hastighet hos ett fordon? HYPOTESTEST: Gäller det att förväntat antal jordskalv per år ökat? Ställ upp hypoteser: H 0 : λ 1.6 H 1 : λ > 1.6 Undersök med ett test om H 0 kan förkastas till förmån för H 1. Både kondensintervall och hypotestest baseras på skattningar och sannolikhetsteoretiska beräkningar kring skattningar.
SKATTNINGAR Exempel: ξ= hastigheten (km/h) hos en bil; ξ N(µ, σ) Vi har mätningar (hastigheter) x 1,..., x 5 µ obs σobs betecknar en skattning (tal) av µ betecknar en skattning (tal) av σ Vi väljer: µ obs = x = 1 5 5 i=1 x i σobs = s = 1 5 i=1 (x i x) 2 5 1 I det aktuella stickprovet visade sig x = 48.2 och s = 5.06. 51.3 40.5 48.0 53.9 47.3 Hade vi tagit ett nytt stickprov om 5 andra bilar hade x (och s) förmodligen fått andra värden. Hur mycket kan x variera? Enligt tidigare: ξ N(µ, σ n ) = N(µ, σ 5 ) fördelning för skattningen av µ N(µ,σ/sqrt(5)) fördelning för hastigheten N(µ,σ) µ
BEGREPPET SKATTNING: Med en skattning av µ menar vi en av följande: µ obs ett tal (t.ex. medelvärdet) µ en s.v. med en fördelning När vi ser skattningen µ som en s.v. med en fördelning kan vi studera E(µ ), d.v.s. förväntat värde på skattningen D(µ ), d.v.s. hur mycket skattningen kan variera mellan stickproven MAN VILL ATT SKATTNINGAR SKA vara unbiased (väntevärdesriktiga) - d.v.s. ska i genomsnitt verkligen skatta rätt värde. Med andra ord E(µ ) = µ. EX: Det förväntade värdet för µ = ξ är µ, d.v.s E(µ ) = µ. BRA! ha en så liten spridning som möjligt - d.v.s. skattningens standardavvikelse ska vara låg. EX: D(µ ) = D( ξ) = σ n. Ju större n desto mindre standardavvikelse (desto eektivare är skattningen).
FRÅN EN MÄTSERIE SKA VI RÄKNA UT TVÅ VIKTIGA SAKER: Värdet på skattningen, d.v.s. µ obs Ett mått på hur bra denna skattning är, d.v.s D(µ ) (skattningens standardavvikelse) Om D(µ ) innehåller något okänt skattar vi det okända och får då d(µ ) (skattningens medelfel). EXEMPEL: På 5 bilar mätte vi hastigheterna µ obs = x=48.2 (km/h) D(µ ) = σ 5, innehåller okänt σ skatta σ med σobs = s = 1 5 5 1 i=1 (x i x) 2 =5.06 medelfelet för µ är då d(µ ) = s 5 = 5.06 5 =2.26 (km/h) NU SÖKER VI ETT INTERVALL (a, b) SOM MED VISS SÄ- KERHET INNEHÅLLER µ: Om vi kan hitta a och b (båda funktioner av µ ) så att P (a(µ ) µ b(µ )) = 1 α är motsvarande intervall I µ = (a(µ obs ), b(µ obs )) ett KONFIDENSINTERVALL för µ med KONFIDENSGRAD 1 α Vi väljer kondensgraden själv! Vanliga värden är 95% kondensgrad, d.v.s. α =0.05 99% kondensgrad, d.v.s. α =0.01 99.9% kondensgrad, d.v.s. α =0.001
EXEMPEL: En konstruktion är dimensionerad att vila på 100 stolpar. Sju provstolpar drevs ner vid slumpmässigt valda platser i marken till de knäcktes. Resultatet (ton): 82 75 95 90 88 92 78 Modell: De 7 mätningarna, x 1,..., x 7, är ett slumpmässigt stickprov från ξ N(µ, σ) där µ tolkas som förväntad stolpkapacitet hos stolpar av denna typ. Vi skattade µ: µ obs = x = 85.7143 (a) Gör ett kondensintervall för µ med kondensgrad 95% då σ antas känd, σ = 7.5 (b) Utgående från intervallet i (a), är det troligt att µ är 75 ton? (c) Utgående från intervallet i (a), är det rimligt att µ är 84 ton? (d) Gör ett kondensintervall för µ med kondensgrad 99% då σ antas känd, σ = 7.5 (e) Gör ett kondensintervall för µ med kondensgrad 95% då σ är okänd men skattas med σobs = s = 1 7 7 1 i=1 (x i x) 2 = 7.4992