Föreläsning G70 Statistik A

Relevanta dokument
Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Föreläsning G04: Surveymetodik

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

F10 ESTIMATION (NCT )

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

4.2.3 Normalfördelningen

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Grundläggande matematisk statistik

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Föreläsning G70 Statistik A

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

θx θ 1 om 0 x 1 f(x) = 0 annars

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Datorövning 2 Fördelningar inom säkerhetsanalys

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

S0005M V18, Föreläsning 10

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

TMS136: Dataanalys och statistik Tentamen med lösningar

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

1. Test av anpassning.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Introduktion till statistik för statsvetare

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Datorövning 2 Fördelningar inom säkerhetsanalys

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Tentamen i Matematisk statistik för V2 den 28 maj 2010

================================================

Formelblad Sannolikhetsteori 1

a) Beräkna E (W ). (2 p)

Avd. Matematisk statistik

Föreläsning 2: Punktskattningar

Borel-Cantellis sats och stora talens lag

TENTAMEN I MATEMATISK STATISTIK

2. Konfidensintervall för skillnaden mellan två proportioner.

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Statistik för ingenjörer 1MS008

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

b 1 och har för olika värden på den reella konstanten a.

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

SAMMANFATTNING TAMS65

F12 Stickprovsteori, forts

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Matematisk statistik TMS063 Tentamen

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Några grundläggande begrepp och termer i statistikteorin

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Matematisk statistik

Id: statistik.tex :48:29Z joa

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

101. och sista termen 1

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

a. Nej, eftersom alla utfall inte har samma sannolikhet. Förutsättningarna enligt första stycket på sida 12 är inte uppfyllda.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Några grundläggande begrepp och termer i statistikteorin

Tentamen i Sannolikhetsteori III 13 januari 2000

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Transkript:

Föreläsig 5 732G70 Statistik A

Egeskaper hos stickprovsstatistikora Stickprovsmedelvärde Stickprovssumma Stickprovsadel Lägesmått Spridig Medelfel EX VarX 2 2 E X Var X E P Var P X X 1 1 P Eftersom respektive i allmähet är okäda skattas de med s respektive p. Exempel stickprovssumma: Flygbolag räkar med att medelvikte på e passagerare är 80 kg med e stadardavvikelse om 5 kg. E viss flygplastyp rymmer 290 passagerare. Totalvikte blad dessa 290 passagerare är exempel på e stickprovssumma. 2

De stora tales lag Ju större stickprov vi drar, desto mer lika blir stickprovsstatistikora populatiosparametrara 3

Percet Sampligfördelig Hur ofta kommer vårt stickprovsmedelvärde att överesstämma med populatiosmedelvärdet, om vi skulle dra måga OSU ur samma populatio? Exempel: Vi studerar ett företag med 100 aställda, och vi är itresserade av medelikomste blad de aställda. Företagets aställda utgör alltså vår populatio, och med hjälp av företagets ekoomiavdelig ka vi faktiskt plocka fram löeivå för samtliga 100 aställda vid e viss tidpukt. Vi åskådliggör löefördelige vid företaget i ett histogram: 35 30 25 Ur löestatistike bestäms medellöe vid företaget till = 24265 kr 20 15 Histogrammet visar tydligt att populatioe lö för de aställda vid företaget ite ka betraktas som ormalfördelad! 10 5 0 10 20 30 40 Ikomst (tkr) 50 60 Vilke medellö skulle ett stickprov ge? 4

Sampligfördelig (forts) Låt oss u göra ett teoretiskt experimet: vi drar 50 oberoede stickprov om storleke = 10, beräkar de 50 stickprovsmedelvärdea och åskådliggör stickprovsmedelvärdea i ett histogram. Följade resultat erhålles. x 24381 kr Notera beteckige för medelvärde av medelvärde 19.5 21.0 22.5 24.0 25.5 27.0 Medelvärde Ikomst i stickprovet (tkr) (tkr) 28.5 30.0 5

Sampligfördelig (forts) Experimetet upprepas för 50 oberoede stickprov om storleke = 20: x 24324 kr 22 23 24 Medelvärde Ikomst i stickprovet (tkr) (tkr) 25 26 6

Sampligfördelig (forts) Slutlige upprepas experimetet för 50 oberoede stickprov om storleke = 30: x 24299 kr 21.6 22.8 24.0 25.2 Medelvärde Ikomst i stickprovet (tkr) (tkr) 26.4 7

Sampligfördelig (forts) Fördelige för stickprovsmedelvärdea kallas för e urvalsfördelig. Urvalsfördelige är alltså e förteckig över vilka värde vi ka förväta oss få i vårt urval, och hur ofta de ka förvätas förekomma. Vi ka betrakta urvalsfördelige som e uppskattig av de fördelig som skulle fås om vi åskådliggjorde stickprovsmedelvärdea för samtliga möjliga stickprov av e viss storlek ur populatioe, vilket kallas för e sampligfördelig. 8

Cetrala gräsvärdessatse sampligfördelige blir mer och mer lik e ormalfördelig (trots att populatioe som stickprove drogs ur ite alls var ormalfördelad!) är stickprovsstorleke ökar sampligfördeliges medelvärde hamar allt ärmare populatiosmedelvärdet är stickprovsstorleke ökar Cetrala gräsvärdessatse säger Sampligfördelige för summor eller medelvärde av oberoede slumpvariabler med samma fördelig är approximativt ormalfördelad om är tillräckligt stort Valig tumregel: 30 9

Fördelig för lijära variabeltrasformatioer Lijära variabeltrasformatioer av ormalfördelade slumpvariabler är också ormalfördelade Iebörde i detta är att sampligfördelige för medelvärde, summor och adelar beräkade på observatioer som följer ormalfördelige, geom att de dragits ur e populatio som är ormalfördelad, också är ormalfördelade, och detta oavsett stickprovets storlek. 10

Stickprovsstatistikors fördelig Om 30 gäller, tack vare cetrala gräsvärdessatse oavsett vilke fördelig populatioe som stickprovet dragits ur har, att Stickprovsmedelvärdet X N ; X X Stickprovssumma X N X ; X Om < 30 krävs att populatioe som stickprovet dragits ur är ormalfördelad. Då gäller fortfarade ovaståede formler eftersom lijära variabeltrasformatioer av ormalfördelade slumpvariabler också är ormalfördelade. 11

Stickprovsstatistikors fördelig (forts) För e stickprovsadel där X = atalet eheter i stickprovet med studerad egeskap gäller, givet att p(1-p) > 5, att P N P ; P 1 P Detta motiveras eligt följade: X beteckar atalet eheter i stickprovet med studerad egeskap, eller med adra ord atalet lyckade delförsök blad de totalt delförsök som stickprovet utgör. Givet att populatioe som stickprovet har dragits ur är tillräckligt stor gäller då att X är biomialfördelad. Frå kapitel 4 käer vi att biomialfördelige kovergerar mot ormalfördelige är är tillräckligt stor, och att ormalfördeligsapproximatio av biomialfördelige är möjlig om 1 5 Vi skattar de okäda populatiosadele med P, och sätter alltså som tumregel att sampligfördelige för e stickprovsadel går att betrakta som approximativt ormalfördelad om p 1 p 5 X 12

Exempel E grossist importerar 500-grams påsar med ris i partier om 10000 påsar. Grossiste kotrollerar de leveraser om 10000 påsar ma mottar geom att kotrollväga ett slumpmässigt urval om 50 påsar ur varje parti. Vid e viss leveras uppmäts geomsittsvikte till 496.7 gram blad 50 slumpmässigt utvalda påsar. Beräka saolikhete att få e geomsittsvikt blad 50 slumpmässigt valda påsar som är 496.7 gram eller lägre, givet att det är sat att geomsittsvikte per påse i hela partiet är 500 gram och stadardavvikelse mella påsar är 10.0 gram, vilket leveratöre hävdar. Vad är saolikhete för att de sammalagda vikte blad de 50 slumpmässigt valda påsara överstiger 25.2 kg, givet att det är sat att geomsittsvikte per påse i hela partiet är 500 gram och stadardavvikelse mella påsar är 10.0 gram? 13

Kapitel 6 Iferes om e populatio Sid 151-185

Puktskattig och itervallskattig Statistisk iferes om populatiosmedelvärde Puktskattig: att aväda e stickprovsstatistika som e uppskattig av motsvarade populatiosparameter Dock: stickprovsstatistikor är slumpvariabler och atar olika värde för varje stickprov. Hur ska vi hatera de osäkerhete? Vi börjar med att göra två atagade: 1. stickprovet är draget som ett OSU. Detta garaterar oberoede mella observatioera, vilket är de egeskap vi eftersöker här. 2. sampligfördelige för stickprovsmedelvärdet ka betraktas som ormalfördelad Om stickprovet är stort (eligt tumregel beståede av mist 30 eheter) ka vi tillämpa cetrala gräsvärdessatse (kapitel 5), vilke säger att sampligfördelige för summor eller medelvärde av oberoede slumpvariabler med samma fördelig är approximativt ormalfördelad om är tillräckligt stort. Om stickprovet är litet, eligt tumregel färre ä 30 eheter, krävs att populatioe som stickprovet dragits ur ka betraktas som ormalfördelad. Ett OSU draget ur e ormalfördelad populatio ger, som vi har lärt oss i kapitel 5, att sampligfördelige för stickprovsmedelvärdet också blir ormalfördelad, och detta oavsett stickprovets storlek. 15

Puktskattig och itervallskattig Statistisk iferes om populatiosmedelvärde Om krave är uppfyllda ka vi bilda ett kofidesitervall för populatiosmedelvärdet: vi lägger ett osäkerhetsitervall krig puktskattige vilket tillåter oss att med e viss säkerhet säga att de okäda populatiosparameter täcks av itervallet. 16

Dubbelsidigt kofidesitervall för populatiosmedelvärde är σ är okäd Givet att stickprovet är draget som ett OSU sampligfördelige för stickprovsstatistika ka betraktas som ormalfördelad bildas ett dubbelsidigt kofidesitervall för populatiosmedelvärdet µ eligt x t 1;1 / 2 s där värdet på t hämtas ur t-fördelige (Appedix B) 17

t-fördelige t-fördelige aväds för att lösa likade typer av problem som ormalfördelige, me lämpar sig är stickprovet är relativt litet och populatiosstadardavvikelse är okäd. t-fördelige är precis som ormalfördelige symmetrisk. t-fördelige defiieras av atalet frihetsgrader, eller eklare uttryckt atalet oberoede bitar av iformatio. Atalet frihetsgrader bestäms av hur mycket data ma har och hur måga bitar av iformatio som de statistiska metodik ma aväder sig av kräver. E viktig egeskap hos t-fördelige är att de ärmar sig (kovergerar mot) ormalfördelige är atalet frihetsgrader ökar. E valig tumregel är att betrakta t-fördelige som approximativt ormalfördelad om stickprovet består av 30 eheter eller fler. Frihetsgrader 5 50 5000 18-5 -4-3 -2-1 0 1 2 3 4 5

Exempel Ett slumpmässigt urval om 40 studeter vid Liköpigs uiversitet ger medelålder 21.2 år och stadardavvikelse 4.4 år. Bestäm ett itervall som med 95 procets säkerhet täcker de saa medelålder blad studerade vid Liköpigs uiversitet. 19

Ekelsidiga kofidesitervall för populatiosmedelvärde är är okäd Nedåt begräsat kofidesitervall: Uppåt begräsat kofidesitervall: 1 x t 1; 1 x t 1; Exempel: Styrelse i e bostadsrättsföreig får i klagomål på att golvvärme i badrumme är för låg. Ma drar ett OSU om 30 badrum blad de omkrig 400 badrum som fis i föreiges fastigheter och mäter golvvärme där. Medeltemperature beräkas till 21 grader och stadardavvikelse till 1.6 grader. Eergimydighete rekommederar att golvvärme ska ligga på mist 20 grader för att ma ska udkomma problem med fuktskador. Föreligger risk för fuktskador i föreiges badrum? s s 20

Kofidesitervall för populatiosadel Givet att 1. stickprovet är draget som ett OSU 2. det gäller att p(1-p) > 5 bildas dubbelsidigt kofidesitervall för populatiosadele π eligt p 1 p p z1 / 2 där värdet på z hämtas ur ormalfördeligstabelle (Appedix B) Nedåt begräsat kofidesitervall: p1 p p z1 Uppåt begräsat kofidesitervall: p z 1 p 1 p 21

Exempel I e hälsoekät tillfrågades 100 slumpmässigt utvalda aställda vid ett stort företag om huruvida ma regelbudet motioerar eller ej. Svar erhölls frå 84 aställda och av dessa svarade 65 ja. Bestäm ett 95-procetigt kofidesitervall för adele av de aställda vid det stora företaget som regelbudet motioerar. 22