Tentamen Tillämpad statistik A5 (15hp)

Relevanta dokument
Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I STATISTIK B,

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Regressions- och Tidsserieanalys - F3

Tentamen i matematisk statistik

10.1 Enkel linjär regression

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F3

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F1

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Metod och teori. Statistik för naturvetare Umeå universitet

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Tentamen i matematisk statistik

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Räkneövning 3 Variansanalys

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Regressions- och Tidsserieanalys - F7

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tentamen i Matematisk statistik Kurskod S0001M

Exempel 1 på multipelregression

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Examinationsuppgifter del 2

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen i Matematisk statistik Kurskod S0001M

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Statistik för teknologer, 5 poäng Skrivtid:

Läs noggrant informationen nedan innan du börjar skriva tentamen

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Tentamen i Matematisk statistik Kurskod S0001M

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Skrivning i ekonometri lördagen den 29 mars 2008

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Läs noggrant informationen nedan innan du börjar skriva tentamen

Föreläsning G60 Statistiska metoder

Tentamen i Matematisk statistik Kurskod S0001M

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

TENTAMEN I MATEMATISK STATISTIK

Skrivning i ekonometri torsdagen den 8 februari 2007

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Statistisk försöksplanering

Tentamen i matematisk statistik

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Exempel 1 på multipelregression

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Transkript:

Uppsala universitet Statistiska institutionen A5 2015-08-25 Tentamen Tillämpad statistik A5 (15hp) 2015-08-25 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling samt A5 Kompletterande Tabell- och formelsamling. Inga anteckningar är tillåtna i formelsamlingarna. B. Skrivtid: 8 00-13 00 Skrivningen omfattar 5 uppgifter om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren (besök, alternativt telefon). E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna. Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt). Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid hypotestest måste Du utöver vad som sägs i punkt B ovan ange H 0, H 1, signifikansnivå, testfunktion (inklusive antal frihetsgrader), förkastelseområde, resultat och verbal slutsats. E. Vid variansanalys måste Du utöver vad som sägs ovan ange modell.

Uppgift 1(24 poäng) Följande data är hämtade från ett grossistföretags årsredogörelse. Tidsserierna utgörs av kvartalsdata och är angivna i miljoner kronor. Row t Order Order-1 Order-2 Order-3 1 1 125 102 * * * 2 2 120 110 102 * * 3 3 122 105 110 102 * 4 4 131 92 105 110 102 5 5 110 104 92 105 110 6 6 124 102 104 92 105 7 7 118 100 102 104 92 8 8 118 96 100 102 104 9 9 118 88 96 100 102 10 10 109 91 88 96 100 11 11 111 72 91 88 96 12 12 93 72 91 88 A. Ange för minsta kvadratmetoden parameterskattningarna i en modell där försäljningen beror linjärt av orderingången ett halvår tidigare. Ange observationsparen och den skattade modellen. För resultat, se regressionsutskrifter på nästa sida. B. Beräkna ett % prognosintervall för försäljningen vid tidpunkt t =13 med hjälp av resultaten för modellen i uppgift A. C. Studera nedanstående figurer och avgör huruvida den i A-uppgiften valda modellen är den "bästa". Om ditt svar är nej upprepa uppgift A och B med en som Du anser bättre modell av de skattade. Varför blir prognosintervallet kortare i C-uppgiften än i B-uppgiften? Scatterplot of vs Order Scatterplot of vs Order-1 70 80 Order 70 80 Order-1 Scatterplot of vs Order-2 Scatterplot of vs Order-3 95 Order-2 1 05 95 Order-3 1 05

Regression Analysis: versus Order 10,5946 7,89% 0,00% 0,00% Constant 88,,6 2,87 0,017 Order 0,293 0,317 0,93 0,376 1,00 = 88,1 + 0,293 Order Regression Analysis: versus Order-1 3,71062 89,10% 87,89% 81,26% Constant 23,2 10,8 2,14 0,061 Order-1 0,957 0,112 8,58 0,000 1,00 = 23,2 + 0,957 Order-1 Regression Analysis: versus Order-2 9,79185 31,20% 22,60% 0,00% Constant 27,5 46,1 0,60 0,568 Order-2 0,885 0,465 1, 0,093 1,00 = 27,5 + 0,885 Order-2 Regression Analysis: versus Order-3 10,4104 28,57% 18,36% 0,00% Constant 24,2 54,0 0,45 0,667 Order-3 0,2 0,539 1,67 0,138 1,00 = 24,2 + 0,2 Order-3

Uppgift 2 (16 poäng) Med användande av samma data som i uppgift 1 skattades modellen Försäljn t =α+β 1 Order-1 + β 2 Order-2 + β 3 Order-3 + ε t med följande resultat: Regression Analysis: versus Order-1; Order-2; Order-3 Method Rows unused 3 Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 3 1000,67 333,557 27,19 0,002 Order-1 1 558,42 558,422 45,53 0,001 Order-2 1 0,55 0,548 0,04 0,841 Order-3 1 1,21 1,208 0,10 0,766 Error 5 61,33 12,266 Total 8 1062,00 3,50223 94,23%,76% 73,45% Constant 5,,9 0,24 0,817 Order-1 1,041 0,154 6,75 0,001 1,66 Order-2 0,043 0,202 0,21 0,841 1,45 Order-3 0,067 0,215 0,31 0,766 1,41 = 5,1 + 1,041 Order-1 + 0,043 Order-2 + 0,067 Order-3. A. Har denna modell något förklaringsvärde vad avser försäljning? Genomför ett formellt test på 5% signifikansnivå. B. Ange två skäl till varför den enligt uppgift 1 bästa modellen kan vara att föredra framför modellen i denna uppgift. För poäng på deluppgiften krävs att ditt svar enbart innehåller två skäl och en mening per skäl.

Uppgift 3 (20 poäng) Till en tidsserie bestående av 56 kvartalsvisa observationer på hotellrumsbeläggning för en viss hotellkedja har nedanstående modeller anpassats Modell 1: RoomAverQ t = + 1 t + 2 D 2t + 3 D 3t + 4 D 4t + t Modell 2: lnroomaverq t = + 1 t + 2 D 2t + 3 D 3t + 4 D 4t + t där t = 1, 2,3,, 56 och D jt ( j = 2, 3, 4) är dummyvariabler som antar värdet 1 vid kvartal j och 0 vid övriga kvartal. ln är den naturliga logaritmen. Grafiska illustrationer presenteras på nästa sida och regressionsutskrifter nedan. A. Tolka skattningarna av 1 och 2 i de båda modellerna. B. Gör prognoser för hotellrumsbeläggningen med den skattade modellen 1 för varje kvartal nästa år (t=57, 58, 59 och 60). C. Hur kommer dessa prognoser att slå med tanke på tidsseriens mönster. Regression Analysis: RoomAverQ versus tid, D2t, D3t, D4t The regression equation is RoomAverQ = 1396 + 17.6 tid + 299 D2t + 670 D3t + 108 D4t Predictor Coef SE Coef T P Constant 1396.50 16.21 86.13 0.000 tid 17.5503 0.3855 45.52 0.000 D2t 299.38 17.59 17.02 0.000 D3t 670.26 17.60 38.08 0.000 D4t 108.35 17.62 6.15 0.000 S = 46.52 R-Sq = 98.7% R-Sq(adj) = 98.6% Regression Analysis: lnroomaverq versus tid, D2t, D3t, D4t The regression equation is lnroomaverq = 7.30 + 0.00818 tid + 0.150 D2t + 0.303 D3t + 0.0567 D4t Predictor Coef SE Coef T P Constant 7.30441 0.00539 1356.05 0.000 tid 0.0081819 0.0001281 63.89 0.000 D2t 0.149671 0.005842 25.62 0.000 D3t 0.302949 0.005846 51.82 0.000 D4t 0.056696 0.005854 9.69 0.000 S = 0.01545 R-Sq = 99.3% R-Sq(adj) = 99.3%

Uppgift 4 (16 poäng) Sociologer i USA undersöker ofta sambandet mellan socioekonomisk status och college performance. Socioekonomisk status delas i allmänhet in i tre grupper: lower class, middle class och upper class. Grade point averages (GPAs) för slumpmässigt utvalda stickprov om sju college freshmen från vardera av de tre socioekonomiska grupperna plockades fram i slutet av det akademiska läsåret och redovisas nedan. Grade point average for three socioeconomic groups Lower class Middle class Upper class 1,80 2,78 1,36 2,16 2,97 2,25 2,16 3,01 2,44 2,51 3,23 2,54 2,87 3,45 2,81 3,01 3,53 3,13 3,14 3,77 3,27 Undersök om de tre socioekonomiska grupperna har samma GPAs. Normalfördelning kan inte förutsättas. Använd 5% signifikansnivå.

Uppgift 5 (24 poäng) En kommun ville få en uppfattning om antalet parkerade bilar i en stad vid en viss tidpunkt. För att undersöka detta genomfördes ett systematiskt urval genom att lägga ett rutnät bestående av 400 rutor över kommunkartan. Sedan valdes systematiskt, med slumpmässig startruta, var 10:e ruta. Antalet parkerade bilar (x) i de valda rutorna var: 8 12 13 16 12 9 6 8 10 12 12 3 5 8 9 13 12 3 13 14 7 7 15 8 12 9 10 9 10 11 8 11 9 5 13 11 12 15 12 6 Σx = 398, Σx 2 = 4356 A. Ge en punktskattning för antalet parkerade bilar i staden. B. Beräkna ett -procentigt konfidensintervall för antalet parkerade bilar i staden. Tolka intervallet! Var noga med förutsättningar! C. Grannkommunen önskar genomföra en motsvarande undersökning. Staden är av ungefär samma storlek och rutnätet består därför av samma antal rutor. Om vi antar att spridningen vad gäller antalet parkerade bilar är samma i båda städerna, hur många rutor ska kommunen då välja om felmarginalen för det totala antalet bilar får vara högst 200 bilar. Illustration av ett rutnät