Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Relevanta dokument
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

F10 ESTIMATION (NCT )

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Föreläsning G70 Statistik A

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Föreläsning G04: Surveymetodik

4.2.3 Normalfördelningen

Grundläggande matematisk statistik

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Formelblad Sannolikhetsteori 1

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

S0005M V18, Föreläsning 10

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

θx θ 1 om 0 x 1 f(x) = 0 annars

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Datorövning 2 Fördelningar inom säkerhetsanalys

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

2. Konfidensintervall för skillnaden mellan två proportioner.

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Datorövning 2 Fördelningar inom säkerhetsanalys

Borel-Cantellis sats och stora talens lag

Föreläsning 2: Punktskattningar

1. Test av anpassning.

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Introduktion till statistik för statsvetare

a) Beräkna E (W ). (2 p)

SAMMANFATTNING TAMS65

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

================================================

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Avd. Matematisk statistik

Matematisk statistik TMS063 Tentamen

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Lösningsförslag

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Tentamen i matematisk statistik

F9 SAMPLINGFÖRDELNINGAR (NCT

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Tentamen i Matematisk statistik för V2 den 28 maj 2010

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

TENTAMEN I MATEMATISK STATISTIK

Tentamen i Sannolikhetsteori III 13 januari 2000

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

a. Nej, eftersom alla utfall inte har samma sannolikhet. Förutsättningarna enligt första stycket på sida 12 är inte uppfyllda.

Jag läser kursen på. Halvfart Helfart

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

TMS136: Dataanalys och statistik Tentamen med lösningar

TENTAMEN Datum: 16 okt 09

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Föreläsning G70 Statistik A

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Statistik för ingenjörer 1MS008

TAMS15: SS1 Markovprocesser

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Id: statistik.tex :48:29Z joa

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Tentamen Metod C vid Uppsala universitet, , kl

Transkript:

Fiasiell Statistik (GN, 7,5 hp,, HT 008) Föreläsig 4 (del 1) Sampligfördeligar (LLL Kap 8) Departmet of Statistics (Gebreegus Ghilagaber, PhD, Associate Professor) Fiacial Statistics (Basic-level course, 7,5 ECTS, Autum 008) 1 Sampligfördeligar Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?)

Sampligfördelige för ett stickprovs-medelvärde Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?) Sampligfördelige för ett stickprovs-medelvärde Ata att vi har ett populatio Populatiosstorlek: N4 Stokastisk variabel,, är idivides ålder Varde på : 18, 0,, 4 (år) A B C D

Sampligfördelige för ett stickprovs-medelvärde Beskrivade mått för Populatiosfördelige: P() i N.5 18 + 0 + + 4 1 4 (i N ).36 0 18 0 4 A B C D Likformigfördelig Sampligfördelige för ett stickprovs-medelvärde Alla möjliga stickprov med storlek : 1 :a :a Observatio Obs 18 0 4 18 18,18 18,0 18, 18,4 0 0,18 0,0 0, 0,4,18,0,,4 4 4,18 4,0 4, 4,4 16 möjliga stickprov med storlek (med återläggig) 16 Stickprovsmedelvärde 1:a :a Observatio Obs 18 0 4 18 18 19 0 1 0 19 0 1 0 1 3 4 1 3 4

Sampligfördelige för ett stickprovsmedelvärde 16 Stickprovsmedelvärde 1:a :a Observatio Obs 18 0 4 18 18 19 0 1 0 19 0 1 0 1 3 4 1 3 4 P().3..1 0 _ Fördelige av Stickprovsmedelvärde 18 19 0 1 3 4 (ite lägre likformig) _ Sampligfördelige för ett stickprovsmedelvärde Beskrivade mått för stickprovsfördelige: : 18 + 19 + 1+ + 4 E() L 1 16 N i (i ) N (18-1) + (19-1) + L+ (4-1) 16 1.58

P().3. Sampligfördelige för ett stickprovsmedelvärde Populatio N 4 1.36 P().3. _ 1 1.58 Stickprov.36.1.1 0 18 0 4 A B C D 0 18 19 0 1 3 4 _ Vätevärde & Stadardfel för stickprovsmedelvärde Låt 1,,... vara ett slumpmässigt urval frå ett populatio: Stickprovsmedelvärde av dessa observatioer defiieras eligt Olika stickprov med samma storlek ka ge olika stickprovsmedelvärde Medelvärde (vätevärde) av stickprovsmedelvärde är dock samma som populatiosmedevärde: Spridige av stickprovsmedelvärde mätts av stickprovsmedelvärdes stadardavvikelse och kallas för stadard fel: Vad häder till stadard felet är blir större? Vad iebär det? 1 i 1 i

Om Stadardfel för stickprovsmedelvärde: korrektio för ädlig populatio urval är uta återläggig (e idivid ka ite vara med mer ä e gåg) stickprovsstorleke är stor i förhållade till populatios storleke ( är större ä 5% av N) då tillämpar vi korrektio för ädlig populatio och justerar stadard felet för stickprovsmedelvärde eligt N N Var( ) N 1 N 1 Prova med eemplet på ålder (N 4, ) uta återläggig Z-värde för stickprovetsfördelig Z-värdet för är ( ) ( Z ) eller Z ( ) ( ) N N 1 där: stickprovsmedelvärde populatiosmedelvärde populatios stadardavvikelse stickprovsstorlek N populatiosstorlek

Sampligfördelige: egeeskaper Populatioe ormalfördelad (dvs. Stickprovsmedelvärde är vätevärderiktigt) ormalfördelad (med samma medelvärde me midre varias) Sampligfördelige: egeeskaper är ökar, större Stickprovsstorlek miskar midre stickprovsstorlek

När Populatio är ite Normal Då ka ma aväda Cetrala gräsvärdesatse Cetrala gräsvärdesatse: Stickprovsmedelvärdet,, ka betraktas som e approimativt ormalfördelad stokastisk variabel, är är tillräckligt stort, oavsett vad populatioe har för fördelig. ~ N ( µ, ) Z ( ) ~ N (0, 1) Vad meas med tillräckligt stort? Valig tumregel: 30. På grud av cetrala gräsvärdessatse blir ormalfördelige e viktig fördelig i måga olika sammahag. Cetrala gräsvärdesatse är ökar blir stickprovsfördelige för medelvärdet approimativt ormal oavsett populatiosfördelige.

När Populatio är ite Normal Sampligfördelige: Populatiosfördelige Lägesmått Spridigsmått Stickprovsfördelige (går mot ormal är ökar) midre större Eempel Slumpmässigt stickprov av storlek 36 frå e populatio med medelvärde µ 8 och varias σ 9. Vad är saolikhete att få ett stickprovsmedelvärde som är mella 7.8 och 8.?

Eempel (forts.) Äve om populatioe ite är ormalfördelad ka vi aväda CGS eftersom 36 > 30 det betyder att sampligfördelige för är approimativt ormal med medelvärde 8 och stadardavvikelse 3 36 0.5 Eempel (forts..) P(7.8 < < 8.) 7.8 P 3 P(-0.5-8 < 36 < Z < - 8 8. - 8 < 3 36 0.5) 0.3830 Stickprovsfördelige Populatiosfördelige???????????? Stickprov Stadard Normal fördelig Stadardisera 7.8 8. -0.5 0.5 8 8 0 z.1915 +.1915 Z

Sampligfördelige för ett stickprovsproportio Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?) Populatio Proportio, P P proportio (adel) i populatioe med ågo egeskap Stickprovsproportio ( ) ger ett skattig av P: 0 1 # i stickprovet med egeskape stickprovsstorleke # i stickprovet med egeskape (# success) har biomialfördelig, me ka approimeras med ormalfördelige är P(1 P) > 9

Sampligfördelige för P Normal approimatio: Läges- och spridigsmått: P( P) ˆ.3..1 0 Stickprovsfördelige 0..4.6 8 1 ˆ och p Var ( ) Var E( P) ^ P(1 P) (där P populatio proportio) Z-Värde för Proportio Stadardisera till ett Z-värde geom: P Z P P(1 P)

Eempel Om det saa proportio av väljare som är för valsedel A är P 0.4, vad är saolikhete att ett stickprov på 00 ger ett stickprovsproportio mella 0.40 och 0.45? dvs: om P.4 och 00, vad är P(.40.45)? Eempel (forts..) om P.4 och 00, vad är P(.40.45)? P(1 P).4(1.4) 00 P ˆ.03464 Kovertera till stadard ormal:.40.40.45.40 P(.40 P ˆ.45) P Z.03464.03464 P(0 Z 1.44)

Eempel (forts..) om P.4 och 00, vad är P(.40.45)? Aväd tabelle för stadard ormal: P(0 Z 1.44).451 Sampligfördelige Stadardiserade Normalfördelige.451 stadardisera.40.45 0 1.44 Z Sampligfördelige för ett stickprovsvarias Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?)

Stickprovsvarias Låt 1,,..., vara ett slumpmässigt urval frå e populatio. Stickprovsvariase defiieras eligt s 1 1 i 1 Stickprovs stadardavvikelse är s s ( ) Stickprovsvariase ka variera mella olika stickprov av samma storlek frå samma populatio i 1 ( i 1 i 1 ) Sampligfördelige för varias Sampligfördelige för s har medelvärde σ E(s ) om populatioe är ormal är sampligfördeliges varias 4 σ Var(s ) 1 om populatioe är ormal, gäller det att σ (-1)s σ har ett χ (Chi-två) fördelig med 1 frihetsgrader

χ fördelige (Chi-square distributio) Chi-två fördelige tillhör ett familj av fördeligar som styrs av frihetsgrader: Frihetsgrader (d.f.) 1 0 4 8 1 16 0 4 8 χ 0 4 8 1 16 0 4 8 χ 0 4 8 1 16 0 4 8 χ d.f. 1 d.f. 5 d.f. 15 Frihetsgrade (d. f.) Idé: # observatioer som är fria att variera efter stickprovsmedevärdet är beräkat. Eempel: medelvärde av 3 siffror är 8.0 Låt 1 7 och 8. Vad blir 3? Om medelvärdet skall vara 8 måste 3 vara lika med 9 (dvs, 3 är ite fri att variera) Därför är frihetsgrade ( 3, frihetsgrade 1 3 1 ) Detta betyder att av siffrora ka ata vilke värde som helst me de tredje är ite fri att variera om medelvärdet måste vara ett givet värde (här 8)

Chi-square: Eempel Ett kylskåp måste hålla valt temperatur med litet variatio. Specifikatioer kräver för ett stadardavvikelse ite större ä 4 grader (varias på 16 grader ). Ett stickprov på 14 kylskåp ska testas Om stadardavvikelse för populatioe är 4, vad är övre gräse (K) för stickprovsvariase så att saolikhete att överstiga dea gräs, är midre ä 0.05? Chi-square: Eempel (forts.) ( 1)s σ är chi-två fördelad med ( 1) 13 frihetsgrader Aväd tabelle för chi-två fördelige (Tabell A5, LLL) med yta på 0.05 i övre svase: χ 13.36 (α.05 och 14 1 13 d.f.) saolikhet α.05 χ 13.36 χ

Chi-square: Eempel (forts.) χ 13.36 (α.05 med 14 1 13 d.f.) Därför: P(s ( 1)s > K) P 16 > 13 ( 1)K eller.36 16 (.36)(16) så att K 7.5 (14 1) 0.05 (där 14) Om s frå ett stickprov på 14 observatioer är större ä 7.5, fis det stark bevis att påstå att populatiosvariase överstiger 16.