Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Relevanta dokument
F10 ESTIMATION (NCT )

HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

Grundläggande matematisk statistik

Tillåtna hjälpmedel: Eget handskrivet formelblad (A4), utdelad tabellsamling, miniräknare med tömt minne Studenterna får behålla tentamensuppgifterna

KTH/ICT IX1501:F7 IX1305:F2 Göran Andersson Statistik: Skattningar

Matematisk statistik KTH. Formelsamling i matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Grundläggande matematisk statistik

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Föreläsning G70 Statistik A

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Reliabilitet och validitet

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Föreläsning G04: Surveymetodik

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Formelsamling för Finansiell Statistik

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Reliabilitet och validitet. Föreläsningsanteckningar till: F7 undersökningsdesign F8 konfidensintervall F9 hypotesprövning

4.2.3 Normalfördelningen

Introduktion till statistik för statsvetare

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

θx θ 1 om 0 x 1 f(x) = 0 annars

S0005M V18, Föreläsning 10

APPROXIMATION AV SERIENS SUMMA MED EN DELSUMMA OCH EN INTEGRAL

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Borel-Cantellis sats och stora talens lag

Formelblad Sannolikhetsteori 1

================================================

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

a) Beräkna E (W ). (2 p)

F15 ENKEL LINJÄR REGRESSION (NCT )

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning G70 Statistik A

1. Test av anpassning.

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Datorövning 2 Fördelningar inom säkerhetsanalys

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

2. Konfidensintervall för skillnaden mellan två proportioner.

101. och sista termen 1

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

1. BERÄKNING AV GRÄNSVÄRDEN ( då x 0 ) MED HJÄLP AV MACLAURINUTVECKLING. n x

Tentamen i Matematisk statistik för V2 den 28 maj 2010

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Datorövning 2 Fördelningar inom säkerhetsanalys

Försöket med trängselskatt

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Föreläsning 2: Punktskattningar

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Matematisk statistik TMS063 Tentamen

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Lösningar och kommentarer till uppgifter i 1.1

Grundläggande matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

TAMS15: SS1 Markovprocesser

Stokastiska variabler

Avd. Matematisk statistik

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

UPPSKATTNING AV INTEGRALER MED HJÄLP AV TVÅ RIEMANNSUMMOR. Med andra ord: Vi kan approximera integralen från båda sidor

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Uppgifter 3: Talföljder och induktionsbevis

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Räkning med potensserier

Kapitel , 4102, 4103, 4104 Exempel som löses i boken. = = = = a) n a1 + a a a = = = = a a a

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Tentamen del 2 i kursen Elinstallation, begränsad behörighet ET

INGENJÖRSMATEMATISK FORMELSAMLING

Tentamenskrivning, , kl SF1625, Envariabelanalys för CINTE1(IT) och CMIEL1(ME ) (7,5hp)

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Transkript:

Stat. teori gk, vt 2006, JW F10 ESTIMATION (NCT 8.1-8.3) Ordlita till NCT Iferece Slutledig, ifere Parameter Parameter Saolikhetlära tatitik ifere Hittill har vi ylat med aolikhetlära. Problem av type: Hur tor är lh att det och det kall iträffa? Ex.: Vi kall dra ett lumpmäigt tickprov på 100 peroer frå e populatio på 1 000, av vilka vi vet att 30 procet är bilägare. Hur tor är lh att tickprovet kall iehålla 50 eller fler bilägare? Etimator Etimate Ubiaed Bia Efficiecy Cofidece iterval Cofidece level (Studet ) t ditributio Etimator, kattig Etimat, kattig Vätevärderiktig Bia, ytematikt fel, kevhet Effektivitet Kofideitervall Kofideivå t-fördelig Nu övergår vi till området tatitik ifere (= lutledig). Problemet är här det omväda: Vi har data frå ett tickprov. Vilka lutater ka vi dra om de populatio tickprovet kommer frå? Ex.: Populatio med 1 000 peroer, varav e okäd adel är bilägare. Vi drar ett lumpmäigt tickprov på 100 peroer och fier att 40 är bilägare. Vad kall vi tro om adele bilägare i populatioe? 1 2 Allmät om kattig av e populatioparameter På grudval av tickprovdata vill vi uppkatta värdet på e okäd parameter i de populatio om tickprovet kommer ifrå. Exempel på populatioparametrar är: Medelvärde, µ Proportiotal (aolikhet), π Varia, 2 Vi täker o att vi vill katta e vi populatioparameter θ (om ka vara t.ex. ett populatiomedelvärde, eller e populatioproportio, eller vad om helt). Säg att X 1, X 2,, X är ett tickprov av oberoede obervatioer frå populatioe. På grudval av dea oberverade tickprovvärde beräkar vi e kattig, θˆ, av de okäda populatioparameter θ. Efterom lumpe betämmer vilka våra obervatioer kommer att bli, å ka vi äga att kattige θˆ är e tokatik variabel. De har e aolikhetfördelig, e.k. ampligfördelig, om bekriver hur värdet på θˆ ka variera frå tickprov till tickprov. Vår förhoppig är aturligtvi att vi kall få ett värde på θˆ, om ligger å ära det aa (okäda) värdet på θ om möjligt. Hur bra är det att aväda θˆ om kattig av θ? Vi ka aldrig komma ifrå att kattige har e vi oäkerhet. E kattig egekaper brukar bekriva i termer av de vätevärde och varia, alltå E(θˆ) och Var(θˆ). Ökvärda egekaper ho e kattig är: Att de är vätevärderiktig, dv. att E(θˆ) = θ. Att de har lite varia, dv. att Var(θˆ) är lite. 3 4

Varför dea ökemål? Vi täker o hypotetikt e låg erie upprepade tickprov frå amma populatio. Då ka vi tolka egekapera vätevärderiktighet och lite varia på följade ätt: E vätevärderiktig kattig kommer i det låga loppet att i geomitt träffa rätt. (OBS ite varje gåg, me i geomitt.) E vätevärderiktig kattig har iget ytematikt fel. Variae är ett mått på kattige oäkerhet. Ju midre varia e vätevärderiktig kattig har, deto oftare kommer de att träffa i ärhete av det aa parametervärdet. E kattig om ite är vätevärderiktig har e bia: Bia(θˆ) = E(θˆ) θ (Om θˆ är vätevärderiktig, å är Bia(θˆ) = 0.) Om θˆ1 och θˆ2 är två vätevärderiktiga kattigar av parameter θ, och om Var(θˆ1) < Var(θˆ2), å äger vi att θˆ1 är mer effektiv ä θˆ2. Skattig av ett populatiomedelvärde Säg att X 1, X 2,, X är ett lumpmäigt tickprov av oberoede obervatioer frå e populatio med medelvärde µ och varia 2. Ett populatiomedelvärde, µ, brukar vid lumpmäigt tickprov katta med tickprovmedelvärdet, X. Vi vet reda att: E( X ) = µ, dv. vätevärderiktig kattig 2 Var( X ) = Skattig av e populatioproportio E populatioproportio, π, brukar vid lumpmäigt tickprov katta med motvarade tickprovproportio, p. E(p) = π, dv. vätevärderiktig kattig π ( 1 π ) Var(p) = 5 6 Skattig av e populatiovaria E populatiovaria, 2, brukar vid lumpmäigt tickprov katta med tickprovvariae, 2. Vi vet reda att E( 2 ) = 2, dv. vätevärderiktig kattig (Me är ite ågo vätevärderiktig kattig av.) Kofideitervall för ett populatiomedelvärde Kofideitervall: Puktkattig ± felmargial Med ett kofideitervall för populatiomedelvärdet µ med kofideivå 95% mea ett itervall ådat att: ädpuktera beräka frå tickprovdata, itervallet kommer med lh 0,95 att iehålla det aa värdet på µ. [Amärkig om termiologi: Av bekvämlighet aväder vi terme kattig för både etimator och etimat. Egetlige är: Etimator = kattige betraktad om tokatik variabel, alltå ia vi oberverat ågra data Etimat = det värde om kattige atar efter att data erhållit.] Saolikhetuttaladet gör ia vi dragit tickprovet. Atag att vi har ett tickprov av torlek frå e ormalfördelad populatio med käd varia 2. Ädpuktera för ett 95% kofideitervall för µ beräka då åom: x ± 1,96 7 8

Motiverig: Ia tickprovet dra vet vi att de tokatika variabel X är N(µ; 2 /). Därför är X µ P(-1,96 1,96) = 0,95 123 / Z Olikhete ka kriva om (via!), å att vi får P( X 1,96 µ X + 1,96 ) = 0,95 14243 14243 edre ädpukt övre ädpukt Tolkig av kofideitervallet: Ia vi dragit tickprovet: Med lh 0,95 kommer vi att få ett itervall om iehåller det aa värdet på µ. Efter att vi dragit ett tickprov och beräkat ett itervall: Vi vet ite om det faktikt erhålla itervallet iehåller µ eller ite. Me vi vet att detta itervall har beräkat eligt e metod om i det låga loppet kulle producera itervall om i 95% av falle iehåller µ. Vi käer därför e gaka tor tillförikt ( cofidece ) att det jut erhålla itervallet iehåller µ. Ädpuktera är lumpmäiga. Ka variera frå tickprov till tickprov. Me med lh 0,95 kommer de att ligga på vari ida av µ, vilket iebär att itervallet mella dea två ädpukter med lh 0,95 kommer att fåga upp det aa, okäda värdet på µ. 9 10 I reoemaget y hade vi valt kofideivå 95%. Adra valiga val av kofideivå är 90% och 99%. Med godtycklig kofideivå kulle kofideitervallet ädpukter bli: där z tår för e kotat om betäm av vilke kofideivå om öka. Värdet på z ka erhålla frå Tabell 8 i kurboke (ita rade). Några exempel: Ökad kofideivå z-värde 90% 1,645 (1,64) 95% 1,960 (1,96) 99% 2,576 (2,58) Ex.: Stickprov ( = 25) frå ormalfördelad populatio med käd tadardavvikele = 15. Stickprovet medelvärde är x = 102. Ett 95% k.i. för µ får ädpuktera: dv. x ± 1,96 102 ± 1,96 102 ± 5,88 15 25 Ett 95% k.i. för µ blir alltå (96,12; 107,88). Högre kofideivå törre tillförikt, me till priet av lägre itervall (givet ). Större tickprov kortare itervall (give kofideivå). 11 12

När populatioe är ormalfördelad, N(µ; 2 ), med käd varia beräka alltå ädpuktera till ett kofideitervall för µ åom Me om populatioe varia är okäd? Eller om populatioe ite är ormalfördelad? Hur gör vi då? När tickprovet är tort beräka k.i. eligt formel ova, oavett om populatioe är ormalfördelad eller ej (CGS). Och om populatiovariae är okäd ätter vi i tickprovet tadardavvikele i tället för, alltå: eller beroede på om är käd eller ej. Tumregel för tort tickprov: 30. När tickprovet är litet (dv. < 30) blir det bevärligare. För att vi kall kua beräka ett k.i. måte populatioe vara ormalfördelad. Om det är e populatio med käd varia, beräkar vi kofideitervallet åom Om det är e populatio med okäd varia, beräkar vi kofideitervallet åom x ± t där kotate t hämta frå Tabell 8 över t- fördelige. Värdet på t betäm av kofideivå och atalet frihetgrader = -1. K.i. beräkade med t-fördelige blir ågot lägre ä om 2 hade varit käd. Återpeglar ökad oäkerhet p.g.a. att populatiovariae är okäd. Om < 30 och populatioe ite är ormalfördelad, ka vi ite beräka k.i. för µ. 13 14 Lite om t-fördelige: t-fördelige är e aolikhetfördelig, om likar de tadardierade ormalfördelige, me om har lite tjockare vaar. Uteedet betäm av atalet frihetgrader. När atalet frihetgrader ökar, å blir t-fördelige mer och mer lik N(0; 1). För 30 brukar ma aväda N(0; 1) i tället för t-fördelige. Att t-fördelige kommer i i detta ammahag beror på att: Ett exempel på hur e t-fördelig ka e ut (amt, om jämförele, e tadardierad ormalfördelig): Täthetfuktio för t-förd. med 3 fg och för N(0; 1) f(t) och f(z) 0,4 0,3 0,2 0,1 0,0-5 -4-3 -2-1 0 1 2 t, z 3 4 Variable t-förd. N(0;1) Vid lumpmäigt tickprov frå e ormalfördelig gäller att de tokatika variabel X µ / har e t-fördelig med -1 frihetgrader. 15 16

Beräkig av kofideitervall för µ, ammafattig: Är tickprovet tort eller ej? Är populatioe ormalfördelad eller ej? Är populatiovariae käd eller ej? 30 (oavett om populatioe är ormalfördelad eller ej) < 30. Populatioe ormalfördelad. 2 käd: 2 okäd: 2 käd: Ex.: Slumpmäigt tickprov med 120 familjer frå e populatio av familjer. Atal bar i varje utvald familj oberverade, och ma erhöll x = 1,28 ; = 1,10 Beräka ett 99% k.i. för µ = medelatalet bar per familj i populatioe. Vi vet att tickprovet dragit geom OSU, och att populatioe iehåller c:a 5000 familjer. Ett 99% k.i. för µ får ädpuktera: dv. x ± 2, 58 2 okäd: x ± t 1,28 ± 2,58 1,10 120 < 30. Populatioe ite ormalfördelad. Kofideitervall ka ite beräka. 1,28 ± 0,26 (1,02; 1,54) 17 18 Ex.: I ett laboratorium gör mätigar på e variabel om ae vara ormalfördelad. Vid ett tillfälle gör 12 mätigar, varvid ma erhåller x = 9,60 och = 1,89 Beräka ett 95% k.i. för de tuderade variabel vätevärde µ. Ett 95% k.i. för µ får gräera: x ± t (-1 = 11 f.g. ger t = 2,201) 1,89 9,60 ± 2,201 12 9,60 ± 1,20 (8,40; 10,80) 19