Tentamen Tillämpad statistik A5 (15hp)

Relevanta dokument
Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

TENTAMEN I STATISTIK B,

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Regressions- och Tidsserieanalys - F1

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F1

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Läs noggrant informationen nedan innan du börjar skriva tentamen

10.1 Enkel linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Läs noggrant informationen nedan innan du börjar skriva tentamen

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Statistik B Regressions- och tidsserieanalys Föreläsning 1

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

TENTAMEN I MATEMATISK STATISTIK

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Skrivning i ekonometri torsdagen den 8 februari 2007

Metod och teori. Statistik för naturvetare Umeå universitet

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Regressions- och Tidsserieanalys - F3

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F3

TENTAMEN I MATEMATISK STATISTIK

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Exempel 1 på multipelregression

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk undersökningsmetodik (Pol. kand.)

Räkneövning 3 Variansanalys

Statistisk försöksplanering

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik

Examinationsuppgifter del 2

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

F11. Kvantitativa prognostekniker

Lycka till!

Vad Betyder måtten MAPE, MAD och MSD?

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F3

Statistisk försöksplanering

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Läs noggrant informationen nedan innan du börjar skriva tentamen

Statistik för teknologer, 5 poäng Skrivtid:

Skrivning i ekonometri lördagen den 29 mars 2008

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Multipel Regressionsmodellen

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Regressions- och Tidsserieanalys - F5

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling samt A5 Kompletterande Tabell- och formelsamling. Inga anteckningar är tillåtna i formelsamlingarna. B. Skrivtid: 8 00-13 00 Skrivningen omfattar 6 uppgifter om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren (besök, alternativt telefon). E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna. Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt). Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid hypotestest måste Du utöver vad som sägs i punkt B ovan ange H 0, H 1, signifikansnivå, testfunktion (inklusive antal frihetsgrader), förkastelseområde, resultat och verbal slutsats. E. Vid variansanalys måste Du utöver vad som sägs ovan ange modell.

Uppgift 1 (26) A. För nedanstående fem observationspar beräkna a och b i regressionslinjen Y = a + bx med minsta-kvadratmetoden. B. Beräkna residualerna och residualkvadratsumman (SSE). C. Beräkna den totala variationen i Y (SST). D. Beräkna förklaringsgraden. E. Beräkna standardfelet för skattningen b och ange förutsättningarna för detta. F. Om du i nedanstående material utesluter observation ett eller observation fem eller båda dessa kommer du att få samma regressionslinje som du får om du använder alla fem observationerna. Varför? Data Display X Y X X Y Y (X X )(Y Y ) (X X ) 2 X*Y X 2 1 6-2 -2 4 4 6 1 2 9-1 1-1 1 18 4 3 4 0-4 0 0 12 9 4 11 1 3 3 1 44 16 5 10 2 2 4 4 50 25 15 40 0 0 10 10 130 55 Uppgift 2 (12) Nedan presenteras tre skattade modeller för att förklara variationen i en given uppsättning av observationer på en och samma Y-variabel tillsammans med tre antaganden. Skattad modell 1: Y i = a + bx 1i + e 1i. Skattad modell 2: Y i = a 2 + b 12 X 1i + b 22 X 2i + e 2i. Skattad modell 3: Y i = a 3 + b 13 X 1i + b 33 X 3i + e 3i. Antagande 1: X 2 är starkt korrelerad med X 1 och okorrelerad med e 1. Antagande 2: X 3 är okorrelerad med X 1 och har en korrelation = 0,71 med e 1. Antagande 3: Förklaringsgraden är 50% vid skattning av modell 1. A. Givet ovanstående hur stor blir förklaringsgraden vid skattning av modell 2. Hur blir skattningen av variansen för b 12 jämfört med skattningen av variansen för b? B. Givet ovanstående hur blir förklaringsgraden vid skattning av Modell 3 jämfört med skattningen av Modell 1? Hur blir skattningen av variansen för b 13 jämfört med skattningen av variansen för b?

Uppgift 3 (14) Denna uppgift baseras på kvartalsdata för andel av antal sysselsatta i Sverige som utgörs av kvinnor 1994:1 t o m 2011:4. Fram till och med första kvartalet 2005 omfattar antal sysselsatta åldersgruppen 16-64 år, därefter åldersgruppen 15-74 år. A. Finns någon anledning att tro att effekten av definitionsförändringen är olika för män och för kvinnor? Specificera den använda regressionsmodellen och genomför ett formellt test av frågeställningen på 5%-nivån med hjälp av nedanstående regressionsutskrift. B. Är förutsättningarna för testet i A-uppgiften uppfyllda. Kommentera kortfattat. Variabeldefinitioner: Andel sysselsatta är andel av antal sysselsatta i Sverige som utgörs av kvinnor 1994:1 t o m 2011:4. tid: 1, 2, 3,,72 Dummy(15-74) = 0 t o m första kvartalet 2005, = 1 från och med andra kvartalet 2005 Variablerna Kv2, Kv3 och Kv4 är säsongdummies. Regression Analysis: Andel sysselsatta versus tid; Dummy(15-74); Kv2; Kv3; Kv4 The regression equation is Andel sysselsatta = 0,483-0,000052 tid - 0,00542 Dummy(15-74) - 0,000902 Kv2-0,00196 Kv3-0,00142 Kv4 Predictor Coef SE Coef T P Constant 0,483222 0,000787 614,38 0,000 tid -0,00005167 0,00002371-2,18 0,033 Dummy(15-74) -0,005417 0,001018-5,32 0,000 Kv2-0,0009015 0,0007587-1,19 0,239 Kv3-0,0019606 0,0007584-2,59 0,012 Kv4-0,0014167 0,0007587-1,87 0,066 S = 0,00227325 R-Sq = 74,0% R-Sq(adj) = 72,1% Analysis of Variance Source DF SS MS F P Regression 5 0,00097243 0,00019449 37,64 0,000 Residual Error 66 0,00034107 0,00000517 Total 71 0,00131350 Durbin-Watson statistic = 0,326024

Andel/Stak Uppgift 4 (13) Denna uppgift baseras på säsongrensade kvartalsdata för andel av antal sysselsatta i Sverige som utgörs av kvinnor 1994:1 t o m 2011:4, åldersgrupp 16-64 år. Den studerade variabeln kallas Andel/Stak = Y t. 0,4900 0,4875 0,4850 Smoothing Plot for Andel/Stak Double Exponential Method Variable Actual Fits Smoothing Constants Alpha (level) 0,969919 Gamma (trend) 0,025261 0,4825 0,4800 Accuracy Measures MAPE 0,214762 MAD 0,001029 MSD 0,000002 0,4775 0,4750 1 7 14 21 28 35 42 Index 49 56 63 70 Data Display Andel/Stak = Säsongrensad andel sysselsatta som är kvinnor av totala antalet sysselsatta. 16-64 år. Row År Kvartal Y t S t T t 1 1994 1 0,488327 0,488269-0,0028687 2 1994 2 0,486309 0,486281-0,0000763 3 1994 3 0,485266 0,485295-0,0001838 4 1994 4 0,486106 0,486076-0,0001594 5 1995 1 0,486016 0,486013-0,0001570 -------------------------------------------------------------------------------------------- 67 2010 3 0,475823 0,475810-0,0001383 68 2010 4 0,474043 0,474092-0,0001782 69 2011 1 0,475659 0,475606-0,0001354 70 2011 2 0,476278 0,476254-0,0001157 71 2011 3 0,477373 0,477336-0,0000854 72 2011 4 0,477453 0,477447-0,0000805 A. Demonstrera hur S 72 och T 72 beräknats och gör prognoser för den säsongrensade tidsserien (Y t ) en, två och tre tidpunkter framåt. B. Som du märker är utjämningskonstanten α nästan lika med ett. Vilken är tolkningen av att α =1?

Uppgift 5 (15) Bärgningsfirman i en region noterar för ett antal incidenter under vinterhalvåret om de förolyckade bilarna haft dubbdäck, friktionsdäck eller sommardäck. För varje incident har också väglaget noterats, enligt A: isgata, B: snömodd eller C: gott skick. A B C Dubbdäck 38 30 34 Friktionsdäck 31 26 28 Sommardäck 31 10 8 Finns det något samband mellan typ av däck på det förolyckade fordonet och väglag? Besvara frågan med hjälp av ett hypotestest med 5% signifikansnivå. Uppgift 6 (20) A. Antag att vi önskar skatta ett medelvärde i en population med hjälp av ett OSU från en ändlig population (dragning utan återläggning). Populationsstorleken är N = 2000 och den kända standardavvikelsen är σ = 30 enheter. Hur stor ska stickprovsstorleken, n, vara om medelfelet, V(X ), får vara högst 5 enheter? B. Energimyndigheten önskar uppskatta medelvärdet per hushåll av den energiåtgång i watt (W) som TV-apparater i ett distrikt drar på en vecka. För att undersöka detta måste ett urval av hushåll väljas vilka sedan erhåller en dosa som mäter energiåtgången för enbart TV-apparater. Hushållen i distriktet kan naturligt indelas i tre stycken strata som är tätorterna A, B och C. Energimyndigheten genomför ett stratifierat urval med lika allokering (n j = 200) med OSU från respektive stratum. Resultatet från undersökningen är följande: Stratum Populationsstorlek N j Medelvärde (W) x Standardavvikelse s A 1510 1100 140 B 987 950 222 C 2543 1200 123 a) Skatta medelvärdet per hushåll av energiåtgången i watt (W) som TV-apparater i det aktuella distriktet drar på en vecka. b) Beräkna medelfelet för skattningen i uppgift a). c) Beräkna ett 95% konfidensintervall för den aktuella genomsnittliga energiåtgången per hushåll i distriktet. Tolka intervallet! Var noga med att ange förutsättningar.