Relevanta dokument
27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

(a) Anta att Danmarksprojektet inte lyckas hålla budgeten. Vad är då sannolikheten att Sverigeprojektet inte heller lyckas hålla budgeten? Motivera!

TENTAMEN I STATISTIKENS GRUNDER 2

Föreläsning 12: Regression

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

, s a. , s b. personer från Alingsås och n b

F3 Introduktion Stickprov

TENTAMEN I STATISTIKENS GRUNDER 2

F22, Icke-parametriska metoder.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

FÖRELÄSNING 8:

Föreläsning 5. Kapitel 6, sid Inferens om en population

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

TMS136. Föreläsning 11

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Föreläsning 12: Linjär regression

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TMS136: Dataanalys och statistik Tentamen

2. Test av hypotes rörande medianen i en population.

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

TMS136. Föreläsning 13

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Uppgift a b c d e Vet inte Poäng

Matematisk statistik för D, I, Π och Fysiker

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 11: Mer om jämförelser och inferens

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Samplingfördelningar 1

Grundläggande matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Hur man tolkar statistiska resultat

Tentamen i Matematisk statistik Kurskod S0001M

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Lösningsförslag till Matematisk statistik LKT325 Tentamen

0 om x < 0, F X (x) = c x. 1 om x 2.

Föreläsning 4: Konfidensintervall (forts.)

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Stockholms Universitet Statistiska institutionen Termeh Shafie

Grundläggande matematisk statistik

Avd. Matematisk statistik

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i Matematisk statistik Kurskod S0001M

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Stockholms Universitet Statistiska institutionen Termeh Shafie

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i Matematisk statistik Kurskod S0001M

TMS136. Föreläsning 10

Statistik och epidemiologi T5

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Avd. Matematisk statistik

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

10. Konfidensintervall vid två oberoende stickprov

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning G60 Statistiska metoder

Lycka till!

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Transkript:

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson (examinator) VT2017 TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2017-04-20 LÖSNINGSFÖRSLAG Första version, med reservation för tryck- och slarvfel / 2017-04-20 MC Sammanfattning SVARSBILAGA Uppgifter 1-5 Utförliga beräkningar ges på efterföljande sidor Uppgift 1 a) b) A B C D E Uppgift 2 a) b) c) Uppgift 3 a) b) c) Uppgift 4 a) b) Uppgift 5 a) b)

Uppgift 1 a) Rätt svar: E A. Beräkna (100 + 1) 0,50 = 50,5; medianen definieras alltså som mittpunkten mellan 50:e och 51:a observationen; summera frekvenserna från vänster så inses att båda dessa observationer ligger i intervallet 40,00 49,99. Sant påstående. B. PP(pppppppp < 80) = summera frekvenserna upp till och med 70,00 79,99 så har man 95 av 100; PP(pppppppp > 40) = summera frekvenserna från 40,00 49,99 så har man 75 av hundra. Sant påstående. C. Beräkna (100 + 1) 0,75 = 75,75; resonera på samma sätt som i A så inses att tredje kvartilen ligger i intervallet 60,00 69,99. Sant påstående. D. Variationsvidden (range) definieras som MMMMMM MMMMMM; maxvärdet kan inte vara större än 89,99 och minimivärdet kan inte vara mindre än 20; max range är alltså 89,99 20 = 69,99. Sant påstående. E. Fördelningen är inte vänstersned (skewed-left) eftersom högersvansen är mer utdragen jämfört med vänstersidan; den är högersned; se t.ex. NCT sid 45. FALSKT påstående. Se kurslitteraturen och föreläsningsanteckningar. b) Rätt svar: C xx = 268 5 = 53,6 ss xx 2 = nn ii=1 (xx ii xx ) 2 nn 1 (1) cccc(xx) = 100 ss xx xx = 100 22,799 53,6 yy = 183 5 = 36,6 ss yy 2 = nn ii=1 (yy ii yy ) 2 nn 1 ss xxxx = CCCCCC(xx, yy) = nn ii=1 xx iiyy ii nnxx yy = nn 1 = 2079,2 4 = 4444, 55% = 959,2 4 = 519,8 ss xx = 22,799 = 239,8 ss yy = 15,485 8621 5 53,6 36,6 4 (2) rr xxxx = CCCCCCCC(xx, yy) = ss xxxx 296,95 = = 00, 888888 ss xx ss yy 22,799 15,485 = 1187,8 4 = 296,95 Uppgift 2 Givet: PP(MM) = 0,10 PP(MM ) = 0,90 PP(FF MM) = 0,75 PP(FF MM ) = 0,50 a) Rätt svar: B Sökt: PP(MM FF) = [multiplikationssatsen] = PP(FF MM) PP(MM) = 0,75 0,10 = 00, 000000 b) Rätt svar: E Sökt: PP(FF) = [satsen om total sannolikhet] = PP(FF MM) PP(MM) + PP(FF MM ) PP(MM ) = 0,75 0,10 + 0,50 0,90 = 00, 555555 2

c) Rätt svar: A Variansen ges av σσ 2 XX = xx SS (xx μμ XX ) 2 xx PP(xx) = xx SS xx 2 xx PP(xx) μμ 2 XX. Beräkna först sannolikheterna för alla xx i utfallsrummet {1,2,3,4,5}, sedan beräknas (xx μμ XX ) 2 = (xx 3) 2 (eller xx 2 om man föredrar det) för alla xx, multiplicera parvis och summera: xx 1 2 3 4 5 Summa PP(xx) 9/25 3/25 1/25 3/25 9/25 1 (xx 3) 2 4 1 0 1 4 PP(xx) (xx 3) 2 36/25 3/25 0 3/25 36/25 78/25 = 33, 1122 Uppgift 3 a) Rätt svar: D A. PP(XX > 20) = PP ZZ > 20 20 = PP(ZZ > 0) = 0,5; 5 PP(YY < 20) = PP ZZ < 20 20 = PP(ZZ < 0) = 0,5; de är lika; inte ett korrekt påstående. 10 B. PP(XX YY > 0) = [linjärkombination] = PP ZZ > (20 20) 0 = PP(ZZ > 0) = 0,5; 25+100 sannolikheten är lika med 0,5; inte ett korrekt påstående. C. PP(XX > 5) = PP ZZ > 5 20 = PP(ZZ > 3) 5 PP(YY > 10) = PP ZZ > 10 20 = PP(ZZ > 1); de är inte lika; inte ett korrekt påstående. 10 D. PP(XX 20 > 5) = PP(XX > 25) = PP ZZ > 25 20 = PP(ZZ > 1) PP(YY 20 > 10) = PP(YY > 30) = PP(ZZ > 30 20 10 de är lika; SANT påstående. 5 = PP(ZZ > 1); E. Eftersom D är ett korrekt påstående gäller att E inte är ett korrekt påstående. b) Rätt svar: A Givet att XX~BBBBBB(16; 0,8). Eftersom tabellen inte innehåller värden för PP > 0,5 definierar vi istället 16 XX = YY~BBBBBB(16; 0,2). Sökt: PP(XX 12) = PP(nn XX nn 12) = PP(YY 4) = [enligt Tabell 7] = 00, 7777777777 Man kan se lösningen genom att lista utfallen för XX och motsvarande utfall för YY och ringa in de gynnsamma utfallen: XX: 10 11 12 13 14 15 16 16 XX = YY: 6 5 4 3 2 1 0 3

c) Rätt svar: C A. WW är summan av nn oberoende 0-1 variabler var och en med sannolikhet P att få utfallet 1; detta är definitionen av binomialfördelad slumpvariabel. Sant påstående. B. pp är definierad som medelvärdet av nn stycken iid slumpvariabler; enligt CGS är denna då approximativt normalfördelad om stickprovet är tillräckligt stort. Sant påstående. C. Variansen för pp kan beräknas enligt VVVVVV(YY/nn) = (1/nn 2 ) VVVVVV(YY) = (1/nn 2 ) nnnn(1 PP) = PP(1 PP)/nn Standardavvikelsen är kvadratroten ur detta. FALSKT påstående. D. Väntevärdet kan beräknas EE(pp ) = EE(YY/nn) = (1/nn)EE(YY) = (1/nn)nnnn = PP, alltså en väntevärdesriktig skattning av PP. Sant påstående. E. Eftersom WW = nnpp och pp är approximativt normalfördelad enligt CGS så gäller detsamma för WW. Sant påstående. Se kurslitteraturen och föreläsningsanteckningar. Uppgift 4 Notera att det är samma nn = 9 komponenter som man prövar de två förpackningsmetoderna på, alltså är det ett parvist beroende. Låt DD = XX YY. Eftersom XX och YY båda är (iid) normalfördelade är DD garanterat normalfördelad. Beteckna den genomsnittliga differensen i populationen med μμ DD, skattas med dd = 1,8/9 = 0,2. Variansen betecknas med σσ DD 2 och är okänd och skattas med ss 2 dd = nn ii=1 dd ii 2 nndd 2 nn 1 = 0,6 9 0,22 8 = 0,03 Hypoteserna är HH 0 : μμ DD = 0,1 mot HH 1 : μμ DD > 0,1 och under dessa förutsättningar är testvariabeln a) Rätt svar: C tt = dd 0,1 0,03/9 ~ tt-fördelad med nn 1 = 8 frihetsgrader Kritisk gräns för det enkelsidiga testet är tt kkkkkkkk = tt 8;0,05 = 11, 888888 om αα = 0,05 används b) Rätt svar: A Enkelsidigt test till höger medför att man förkastar HH 0 om tt oooooo > tt kkkkkkkk. Insättning ger 0,2 0,1 tt oooooo = 0,03/9 = 1,732 < 1,860 HH 0 kan inte förkastas 4

Uppgift 5 a) Rätt svar: D Oberoende test, ett χχ 2 -test. Man utgår ifrån hypoteserna HH 0 : variablerna är oberoende mot HH 1 : variablerna är beroende Man har rr = cc = 2 rader och kolumner vilket ger att testvariabeln är χχ 2 -fördelad med (rr 1)(cc 1) = 1 frihetgrad. Testvariabeln är rr cc χ 2 = (OO iiii EE iiii ) 2 ii=1 jj=1 där OO iiii är de observerade frekvenserna och EE iiii = RR ii CC jj /nn är de förväntade frekvenserna under HH 0. Beslutsregel är att man förkastar HH 0 om Beräkningar ger: EE iiii där 2 2 2 χχ obs > χχ krit = χχ 1;0,01 = [enligt Tabell 4] = 66, 666666 OO iiii = observerat EE iiii = förväntat (OO iiii EE iiii ) 2 /EE iiii Ofta Sällan Totalt Ofta Sällan Totalt Ofta Sällan Sv. 24 36 60 30 30 60 1,2 1,2 Utl. 21 9 30 15 15 30 2,4 2,4 Totalt 45 45 90 45 45 90 2 χχ obs = ΣΣ = 7,2 2 2 Slutsats: χχ obs = 7,20 > χχ krit = 6,635 och HH 0 förkastas på 1 % signifikansnivå. b) Rätt svar: B A. Man kan skatta trenden i en serie med glidande medelvärdesmetoden. Sant. B. Man kan skatta trenden i en serie med regressionsanalys med tiden som beroende variabel. FALSKT, man använder tiden som oberoende variabel, dvs. förklaringsvariabel C. Säsongsvariationen kan modelleras med dummyvariabler i en regressionsmodell. Sant. D. Med en multiplikativ modell säsongsrensar man genom att dela det observerade värdet med den skattade säsongsfaktorn. Sant. E. Med en additiv modell säsongsrensar man genom att subtrahera säsongsfaktorn från det observerade värdet. Sant. Se kurslitteraturen och föreläsningsanteckningar. 5

Uppgift 6 a) En boxplot visar grafiskt läget för fem-siffer-sammanfattningen (five-number-summary): minimum, första kvartilen, medianen, tredje kvartilen. Samtliga dessa värden är givna. Eftersom det är olika skalor kan det vara lämpligt med två olika diagram. Kan göras stående eller liggande. Notera att för XX-variabeln sammanfaller mmmmmm och QQ 1 pga. att antalet med noll publiceringspoäng är stort (faktiskt sex stycken, se spridningsdiagrammet i uppgift 7). 0 5 10 15 Publiceringspoäng (X) 0 1 2 3 4 5 Relativ löneförhöjning i % (Y) b) Antaganden: alla YY ii är normalfördelade med samma väntevärde μμ YY och varians σσ YY 2 och samtliga observationer är oberoende av varandra (iid). Vidare är σσ YY 2 okänd så den måste skattas med ss yy 2 och vi måste använda tt-fördelningen. Formel: ett 95 % konfidensintervall (α = 0,05) för μμ YY ges av: där tt nn 1; α/2 = tt 11; 0,025 = [enligt Tabell 3] = 2,201 yy ± tt nn 1; α/2 ss yy nn Insättning ger 2,381 ± 2,201 0,7904 12 = 22, 333333 ± 00, 555522 eller (11, 888888 ; 22, 888888) Slutsats/tolkning: Med 95 % konfidens (ej sannolikhet) ligger den sanna genomsnittliga relativa löneökningen μμ YY i konfidensintervallet. Tolkningen av konfidensgraden är att vid upprepade stickprovsdragningar kommer det sanna värdet μμ YY ligga i 95 % av konfidensintervall man kan få, allt annat lika. c) Om man vill genomföra ett dubbelsidigt hypotestest, dvs. HH 0 : μμ YY = μμ 0 mot HH 1 : μμ YY μμ 0 för något tal μμ 0 på signifikansnivå α, så räcker det att se om detta tal ligger i motsvarande 100(1 αα) % konfidensintervall. Konfidensintervallet kan sägas innehålla alla de värden som skulle medföra att vi inte kan förkasta nollhypotesen. I detta fall är μμ 0 = 2,5 och detta värde ligger i intervallet och vi skulle alltså inte förkasta HH 0. 6

Uppgift 7 a) Ej klart, fullständig lösning kommer inom kort. Skattningarna blir: Intercept (konstant): bb 0 = 2,471 Lutningkoefficient: bb 1 = 0,03599 b) Ej klart, fullständig lösning kommer inom kort, men lite kortfattat: Eftersom testet är enkelsidigt till höger så är den kritiska gränsen positiv, tt krit = tt nn 2; α och man förkastar HH 0 om man ligger till höger om den punkten, dvs. om tt obs > tt krit och man förkastar inte om man ligger till vänster, dvs. om tt obs < tt krit. För detta enkelsidiga test beräknas pp-värdet som den del av arean under tt-klockan som ligger till höger om det observerade värdet på testvariabeln, tt obs = bb jj /ss bbjj. Men om skattningen bb 1 är negativ så måste även testvariabeln tt obs, bli negativ. Detta medför dels att man alltid kommer att förkasta detta test och dels att arean till höger om tt obs och under klockan, dvs. pp-värdet minst måste vara 0,5. Bild kommer c) Ej klart, fullständig lösning kommer inom kort. Punkterna/observationerna är: Den som ligger högst upp i mitten av spridningsdiagrammer, den ger en stor residual. Den som ligger längst till höger, ger stort inflytande på parameterskattningarna. 7