TMS136: Dataanalys och statistik Tentamen 2013-10-26 med lösningar



Relevanta dokument
Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

1. Test av anpassning.

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Föreläsning G04: Surveymetodik

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

θx θ 1 om 0 x 1 f(x) = 0 annars

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

S0005M V18, Föreläsning 10

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Borel-Cantellis sats och stora talens lag

Lycka till! I(X i t) 1 om A 0 annars I(A) =

a) Beräkna E (W ). (2 p)

Matematisk statistik TMS063 Tentamen

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Introduktion till statistik för statsvetare

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Tentamen i matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Jag läser kursen på. Halvfart Helfart

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i matematisk statistik

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Datorövning 2 Fördelningar inom säkerhetsanalys

Föreläsning G70 Statistik A

2. Konfidensintervall för skillnaden mellan två proportioner.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Grundläggande matematisk statistik

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

TENTAMEN I MATEMATISK STATISTIK

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Föreläsning G70 Statistik A

F10 ESTIMATION (NCT )

TMS136: Dataanalys och statistik Tentamen

Föreläsning 2: Punktskattningar

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

================================================

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Datorövning 2 Fördelningar inom säkerhetsanalys

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Avd. Matematisk statistik

4.2.3 Normalfördelningen

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Tentamen Metod C vid Uppsala universitet, , kl

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Matematisk statistik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Jag läser kursen på. Halvfart Helfart

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

TENTAMEN Datum: 16 okt 09

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

Genomsnittligt sökdjup i binära sökträd

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Formelblad Sannolikhetsteori 1

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

Handbok i materialstyrning - Del F Prognostisering

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Tentamen i Sannolikhetsteori III 13 januari 2000

Transkript:

TMS36: Dataaalys och statistik Tetame 03-0-6 med lösigar Examiator och jour: Mattias Sude, tel. 0730 79 9 79 Hjälpmedel: Chalmersgodkäd räkare och formelsamlig formelsamlig delas ut med teta). Betygsgräser: För betyg 3 krävs 4 poäg, för 4 krävs 0 poäg och för betyg 5 krävs 7 poäg. Totalt fis 35 poäg. Om du vill att jag skall mejla dig resultatet är jag rättat klart di teta ka du skriva di mejladress på det sista pappret du lämar i. Skriv i så fall gära läsligt. Observera att teta i detta fall kaske ite blir aoym, så struta i det om det käs viktigt. Fullstädiga och välmotiverade lösigar skall ges till varje uppgift!. Defiiera följade begrepp: a) Bias. p) Lösig: Om ˆθ är e skattare ) ite skattig) för parameter θ ges skattares bias av E ˆθ θ. Bias är alltså ett mått hur stor e evetuell systematisk avvikelse är i medeltal. b) Styrka. p) Lösig: Saolikhete att förkasta e falsk ollhypotes. Ett mått på ett hypotestests förmåga att upptäcka avvikelser frå ollhypotese. c) Typ I-fel. p) Lösig: Att förkasta e sa ollhypotes. d) Kofidesgrad för ett tvåsidigt kofidesitervall. p) Lösig: Om ett tvåsidigt kofidesitervall har kofidesgrade α)00% kommer upprepade observatioer kofidesitervallet täcka de aktuella populatiosparameter i α)00% av falle.. I e mörk garderob ligger olika par skor huller om buller. Du sträcker i hade och tar två skor på måfå. Lös följade både för fixt och då : a) Saolikhete att få ett sammahörade par? p)

Lösig: Att välja två skor blad skor ka göras på ) sätt så det fis ) möjliga utfall. Det fis precis sammahörade par så ett sammahaörade par ka väljas på precis sätt. Alltså är atalet gysamma utfall. Det följer att saolikhete för att få ett sammahörade par är ) )!! )! ) 0, 0. Så för ett fixt är saolikhete då växer. och saolikhete går mot 0 b) Saolikhete att få e högersko och e västersko? p) Det fis västerskor och högerskor så atalet möjligheter att välja e av varje är. Det fis alltså gysamma utfall. Det följer att de sökta saolikhete är ) )!! )! ), 0. Så för ett fixt är saolikhete då växer. och saolikhete går mot 3. Före e opiiosudersökig krig hur ma skulle rösta om det vore val idag förmodar ma att 36% skulle rösta på Socialdemokratera, 5% skulle rösta på Moderatera, % skulle rösta på Folkpartiet och resterade skulle rösta på de midre partiera eller blakt. Det visade sig blad 0000 tillfrågade att 377 persoer skulle rösta på Socialdemokratera, 48 skulle rösta på Moderatera, 3 skulle rösta på Folkpartiet och att resterade skulle rösta på de midre partiera eller blakt. Fis det aledig att ädra de förmodade fördelige? 4p) Lösig: Här är det lämpligt att göra ett Goodess-of-fit-test då det hadlar om hur måga eheter som hamar i olika kategorier. Då det är 0000 som till frågats följer att de förvätade frekvesera är 3600, 500, 00 och 700 för Socialdemokratera, Moderatera, Folkpartiet respektive övriga partier eller blakt. Vi får då att de observerade testfuktioe O E) E 377 3600) 48 500) 3 00) 63 700) + + + 9.3. 3600 500 00 700 Eftersom vi ite skattat ågra parametrar är atalet frihetsgrader 3. Eligt chi-två-tabell är det kritsiska värdet på 0.05-ivå 7.85 så på de ivå skulle vi förkasta ollhypotese om att de förmade fördelige stämmer och har således skäl att ädra de förmodade fördelige. Skulle vi exemplevis välja att göra testet på sigifikasivå 0.0 skulle det kritiska värdet vara.345 och då skulle ma ite förkasta ollhypotese.

4. När ma överför iformatio i form av ettor och ollor på e brusig kaal häder iblad att skickade ollor tas emot som ettor och skickade ettor tas emot som ollor. Saolikhete att e skickad olla tas emot som e etta är δ och saolikhete att e skickad etta tas emot som e olla är ǫ. Ma skickar ugefär lika måga ollor som ettor. Låt X vara det som säds och Y vara det som tas emot. a) Bestäm massfuktioe för Y 3p) Lösig: Ur texte fås PY X 0) δ, PY 0 X ) ǫ och PX ) PX 0). Eligt defiitioe av betigad saolikhet följer att PY ) PY X 0)PX 0)+PY X )PX ) Vi får då att δ + ǫ) ǫ + δ. PY 0) PY ) δ + ǫ, och det följer att massfuktioe för Y är ) y ǫ + δ δ + ǫ fy) b) Bestäm korrelatioe mella X och Y 3p) Lösig: Korrelatioe mella X och Y ges av EXY ) EX)EY ) V X)V Y ). ) y Vi har att EXY ) PX,Y ) PY X )PX ) ǫ, och att EX), EY ) ǫ + δ, V X) E X ) EX)) 4 4 V Y ) E Y ) EY )) ǫ + δ Det följer att korrelatioe mella X och Y är ǫ ǫ+δ ǫ+δ 4 ǫ+δ ) ǫ + δ. ) ) ǫ δ ǫ δ) 3

5. Tidera mella kuders akomster till kassa 8 på ICA Maxi är oberoede och expoetialfördelade med vätevärde 45 sekuder. Atag att e kud just kom till kassa. Vad är saolikhete att det uder uder ästkommade fyra timmar kommer åtmistoe 330 kuder till kassa? 4p) Lösig: Att tidera mella kuderas akomster är oberoede och expoetialfördelade med vätevärde 45 sekuder betyder att atalet kuder som kommer till kassa uder 45 sekuder är Poissofördelade med vätevärde λ. Det följer att atalet kuder som kommer till kassa uder fyra timmar är Poissofördelat med vätevärde λ 4 3600/45 30. Vi har då med hjälp av CGS, om X är atalet kuder uder fyra timmar, att ) 330 30 PX 330) P Z Φ0.56) 0.9. 30 Saolikhete att åtmistoe 330 kuder kommer till kassa uder fyra timmar är alltså ugefär 9 procet. 6. Frå två oberoede grupper av bilar har bräsleförbrukige i liter per mil mätts upp med följade stickprovsresultat a) 0.9,.0, 0.86, 0.95,.03,., 0.9, 0.86 b) 0.7, 0.67, 0.7, 0.63, 0.58, 0.65, 0.59, 0.7, 0.57 Är detta tillräckligt för att på sigifikasivå 0.05 och uder atagade om lika populatiosvariaser säga att de ormalfördelade gruppb) har lägre förvätad bräsleförbrukig ä de ormalfördelade gruppa)? 4p) Lösig: Vi låter idexet betecka gruppe frå vilke stickprovet av storlek 8 kommer och betecka gruppe frå vilke stickprovet av storlek 9 kommer. Vi ska testa hypotesera H 0 : µ µ 0 H : µ µ > 0. Då vi ka ata att populatiosvariasera är lika aväder vi testfuktioe X X 0, S p + där X är medelvärdet för stickrpovet frå grupp, X är medelvärdet för stickrpovet frå grupp, 0 är ollhypoteses värde på skillade i populatiosmedelvärde µ µ och S p är de poolade stickprovsstadardavvikelse som ges av S p ) S + ) S. + Vi observerar x 0.96, x 0.65, s 0.008 och s 0.0035 så 7 0.008 + 8 0.0035 s p 0.075, 5 4

vilket, med 0 0 ger de observerade testfuktioe 0.96 0.65 0.075 8 + 9 8.50 De kritiska värdet är t 0.05,5.753 så vi ka förkasta ollhypotese. Så bilgruppe varifrå stickprovet av storlek io kommer har alltså e sigifikat lägre medelförbrukig ä bilgruppe varifrå stickprovet av storlek åtta kommer. 7. I VLE-uppgiftera har vi sett att ma givet ett stickprov X,...,X frå e likformig fördelig på itervallet [0,b] ka skatta ett okät b med exempelvis ML-skattare maxx,...,x ) eller mometskattare X. Fi ett argumet som talar för att aväda mometskattare över ML-skattare. Fi mist två argumet som talar för att aväda ML-skattare över mometskattare. Argumete måste motiveras väl. 5p) Lösig: Mometskattare är ubiased eftersom E X ) E X) E X i ) b b. i ML-skattare är ite ubiased eftersom E maxx,...,x )) b b x b + där vi fått täthete, fx) x b för 0 < x < b och 0 aars, för MLskattare som derivata m.a.p. x av dess fördeligsfuktio Fx) PmaxX,...,X ) x) PX x,...,x x) PX i x)) x ),0 < x < b b och Fx) 0 aars. Så ur biassypukt är mometskattare bättre ä ML-skattare. ML-skattare är bättre ä mometskattre eftersom som de aldrig ka ge de orimliga skattige att b skulle vara midre ä e av stickprovsmedlemmara. ML-skattare är bättre ä mometskattare eftersom MSE för ML-skattare är E maxx,...,x ) b) ) E maxx,...,x )) ) b b + + b, där E maxx,...,x )) ) b b så MSE för ML-skattare blir 0 0 x b +, b + b + + b b + ) + ), meda MSE för mometskattare är ) ) ) E X b 4E X) be X ) + b 5

4V X) + 4 E X)) b + b 4 b + 4b 4 b b 3 så kvote av MSE för ML-skattare och MSE för mometskattare blir 6,,,... + ) + ) med likhet för, och olikhet för > så i alla praktiskt relevata situatioer har ML-skattare lägre MSE ä mometskattare. 8. Låt X,...,X vara ett stickprov frå e fördelig med täthetsfuktioe fx) x θ e x /θ), x 0, θ > 0. a) Bestäm ML-skattare för θ. p) Lösig: Likelihood-fuktioe ges av Lθ) x i θ e x i i /θ) i x i θ e θ P i x i. Det är behädigare att maximera log-likelikelihood-fuktioe istället så vi tar fram de; lθ) llθ) lx i l θ θ i Vi deriverar lθ) och får ekvatioe θ + θ x i 0, i och det följer att ML-skattare är ˆθ i X i. och V X i) 4 π θ. Vad blir ML- b) Ma ka visa att EX i ) skattares bias? p) Lösig: Vi har att E i X i ) θπ x i. i i V X i ) + E X i )) ) så ML-skattare är ubiased. Lycka till! E Xi ) E Xi ) 4 π θ + θπ ) θ, 6