Uppsala universitet Statistiska institutionen A5 2013-01-14 Tentamen Tillämpad statistik A5 (15hp) 2013-01-14 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling samt A5 Kompletterande Tabell- och formelsamling. Inga anteckningar tillåtna i formelsamlingarna. B. Skrivtid: 8 00-13 00 Skrivningen omfattar 4 uppgifter om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren (besök, alternativt telefon). E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna. Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt). Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid hypotestest måste Du utöver vad som sägs i punkt B ovan ange H 0, H 1, signifikansnivå, testfunktion (inklusive antal frihetsgrader), förkastelseområde, resultat och verbal slutsats. E. Vid variansanalys måste Du utöver vad som sägs ovan ange modell.
Uppgift 1 (40). Bakgrund: Consider a study designed to examine the role of television viewing in the lives of a selected group of people over 65 years of age. The purpose of the study was to provide guidelines for developing television programming that would adequately meet the special needs of this audience. A sample of n = 20 senior citizens was selected and from each senior citizen the following data were obtained: Y = Genomsnittlig tv-tittartid per dag X1 = civilstånd. (X1=1 om sammanboende, X1=0 om inte) X2= Ålder X3= Utbildning (År) TVTID CIVILSTÅND ÅLDER UTBILDNING(År) 0,5 1 73 14 0,5 1 66 16 0,7 0 65 15 0,8 0 65 16 0,8 1 68 9 0,9 1 69 10 1,1 1 82 12 1,6 1 83 12 1,6 1 81 12 2,0 0 72 10 2,5 1 69 8 2,8 0 71 16 2,8 0 71 12 3,0 0 80 9 3,0 0 73 6 3,0 0 75 6 3,2 0 76 10 3,2 0 78 6 3,3 1 79 6 3,3 0 79 4 Modell 1: Modell 2: Residualkvadratsumman vid skattningen av Modell 1 blir 16,1374. En regressionsutskrift från skattningen av modell 2 presenteras på nästa sida. A. (10) Skatta modell 1 med minsta kvadratmetoden och tolka parameterskattningen av α. B. (12) Uppskatta med 95% konfidens den genomsnittliga TV-tittartiden för de som inte är sammanboende (X1=0) genom att använda Dig av skattningsresultat för Modell 1. C. (6) I Uppgift B har Du möjlighet att använda stickprovsmedelvärdet för TV-tittartid för de som inte är sammanboende (X1=0) som estimator i stället och inte alls bry Dig om svaren från den andra gruppen (X1=1). Vilken blir skillnaden jämfört med lösningen i uppgift B? Kommentera kortfattat. D. (12) Är modell 2 att föredra framför modell 1. Genomför ett test med 1% signifikansnivå.
Regression Analysis: TVTID versus CIVILSTÅND; ÅLDER; UTBILDNING(År) The regression equation is TVTID = - 0,13-1,03 CIVILSTÅND + 0,0555 ÅLDER - 0,140 UTBILDNING(År) Predictor Coef SE Coef T P VIF Constant -0,133 2,279-0,06 0,954 CIVILSTÅND -1,0350 0,2866-3,61 0,002 1,058 ÅLDER 0,05550 0,02788 1,99 0,064 1,286 UTBILDNING(År) -0,14016 0,04315-3,25 0,005 1,294 S = 0,619840 R-Sq = 72,3% R-Sq(adj) = 67,1% Analysis of Variance Source DF SS MS F P Regression 3 16,0348 5,3449 13,91 0,000 Residual Error 16 6,1472 0,3842 Total 19 22,1820 Source DF Seq SS CIVILSTÅND 1 6,0446 ÅLDER 1 5,9375 UTBILDNING(År) 1 4,0527
Uppgift 2 (20) Nedanstående tidsserie består av tre års tertialvisa (ett tertial är fyra månader) observationer. I Tabell 1 ges delresultat från säsongrensning medelst dekomposition av tidsserien. År t Tertial Yt 1 1 1 88 1 2 2 102 1 3 3 125 2 4 1 106 2 5 2 114 2 6 3 140 3 7 1 121 3 8 2 129 3 9 3 155 Tabell 1. Årsvisa säsongskattningar År Tertial 1 Tertial 2 Tertial 3 1 * -3 14 2-9 -6 15 3 A. (8) Komplettera Tabell 1 med värden för år 3. B. (8) Beräkna medelsäsonger och tolka den för tertial 3. C. (4) Säsongrensa det sista årets observationer.
Uppgift 3 (16) I en sociologisk undersökning jämfördes fyra yrkesgrupper med avseende på ett flertal variabler. Ur var och en av de fyra grupperna uttogs genom OSU ett stickprov omfattande fem personer. Nedan redovisas resultatet för en av variablerna. Denna variabel kan anses vara normalfördelad i de fyra populationerna. Observation Yrkesgrupp 1 2 3 4 5 A 15,63 17,02 22,33 18,54 19,88 B 29,60 21,09 25,89 19,73 21,21 C 21,00 14,25 19,26 15,81 22,05 D 22,95 21,83 25,55 20,53 21,97 Skiljer sig minst ett av de fyra yrkesgruppernas medelvärden för den redovisade variabeln från de övriga? Undersök med 5 % signifikansnivå. Gör inga egna beräkningar utan använd en av de tre MINITAB-utskrifterna nedan. Motivera valet av MINITAB-utskrift. 1 One-way ANOVA: x versus Observation Source DF SS MS F Observation 4 72,8 18,2 1,49 Error 15 182,8 12,2 Total 19 255,5 S = 3,491 R-Sq = 28,47% R-Sq(adj) = 9,40% Pooled StDev = 3,491 2 One-way ANOVA: x versus Yrkesgrupp Source DF SS MS F Yrkesgrupp 3 101,67 33,89 3,52 Error 16 153,85 9,62 Total 19 255,52 S = 3,101 R-Sq = 39,79% R-Sq(adj) = 28,50% Pooled StDev = 3,101 3 Two-way ANOVA: x versus Observation; Yrkesgrupp Source DF SS MS F Observation 4 72,751 18,1877 2,69 Yrkesgrupp 3 101,675 33,8915 5,02 Error 12 81,096 6,7580 Total 19 255,521 S = 2,600 R-Sq = 68,26% R-Sq(adj) = 49,75%
Uppgift 4 (24) Uppgiften är inspirerad av artikeln Många läkare jobbar sjukt mycket övertid (DN, 2009-03-25, www.dn.se/nyheter/sverige/manga-lakare-jobbar-sjukt-mycket-overtid). Notera att alla skattningar är fingerade. Arbetstidslagen medger 200 timmars övertid under ett år och frågan som vi vill ha svar på är huruvida läkare i Sverige arbetar för mycket övertid. Eftersom Stockholms läns landsting i artikeln menade att det inte finns någon samlad bild av övertider genomför vi en enkätundersökning. Antag att det finns ett register över alla verksamma läkare i Sverige och deras arbetsplatser. Baserat på detta bestämde vi oss för att genomföra ett stratifierat urval. Uppgifter över strata finns presenterade i Tabell 1 nedan. Frågan som ställdes i enkäten var Har du under föregående år (20XX) arbetat mer än 200 timmar övertid?. För enkelhets skull antar vi att det inte finns något svarsbortfall. Fördelningen av de inkomna svaren finns presenterade i Tabell 2. A. (6) Hur stor andel i populationen läkare har arbetat mer än 200 timmar övertid? Gör en punktskattning. Bestäm även den statistiska felmarginalen för punktskattningen. B. (10) Intervallskatta antalet läkare i Sverige som arbetat för mycket övertid. Tolkningen av intervallet görs i uppgift C. C. (4) Gör en tolkning av intervallet i uppgift B. D. (4) Vad är sannolikheten att ditt framräknade konfidensintervall i uppgift B täcker antalet läkare i Sverige som arbetat mer än 200 timmar övertid? Motivera ditt svar med text och/eller figurer. Använd i både uppgift A) och uppgift B) konfidensgraden 95 procent. Tabell 1. Läkarkårens fördelning 2009 N Vid sjukhus, vårdcentral 25 200 Privatläkare 2 000 Företagsläkare 500 Övrigt (Undervisning, forskning, läkemedelsindustri 2 500 m.m. Källa: Läkarfakta 2010 (Sveriges läkarförbund) Tabell 2. Har du under föregående år (20XX) arbetat mer än 200h övertid? Ja Nej Vid sjukhus, vårdcentral 450 1 050 Privatläkare 82 302 Företagsläkare 44 66 Övrigt (Undervisning, forskning, läkemedelsindustri m.m.) 30 220