Skriftlig tentamen Grundläggande statistik (ST100G), 15 högskolepoäng. Datum: Lördag 2015-12-12. Ansvarig Lärare: Nicklas Pettersson Antal frågor: 5 Maxpoäng: 40 Godkänd: 20-29 (inklusive eventuella poäng från duggan) Väl Godkänd: 30 (inklusive eventuella poäng från duggan) Tillåtna hjälpmedel 1. Miniräknare 2. Formelsamling 3. Ett A4-blad med handskrivna anteckningar på båda sidorna Anvisningar Redovisa dina lösningar i en form som gör det lätt att följa tankegången. Motivera alla väsentliga steg i lösningen. Ange alla antaganden och förutsättningar som du utnyttjar. Skriv endast på en sida av arket. Börja varje ny uppgift på nytt ark. Lycka Till! 1
Fråga 1 (5poäng) Beteckna lönen hos de tidigare anställda på ett mindre men expanderande företag som ett utfall på en variabel X, dvs den observerad lönen hos den först anställde anges som x 1, andre som x 2 etc. Företaget avser nu att anställa fyra personer, och ge samtliga en ingångslön som motsvarar 82% av väntevärdet av X. Följande figur över lön och anställningstid finns vid tidpunkten för de tidigare anställda i företaget. (a) (2 poäng) Beräkna medianlönen (avrundat till kkr) efter expansionen. (b) (3 poäng) Vad är stickprovskorrelationen mellan lön och anställningstid för samtliga anställda efter expansionen? Om du ej lyckats räkna fram lönen för de nyanställda, kan du utan poängavdrag anta att den är 25kkr. 2
Fråga 2 (12poäng) En student ämnar skriva två tentamina i slutet av höstterminen. Betygsskalorna är U, G och VG. På tentamen i december är sannolikheten för VG 20% (och för G 40%). Om studenten då får ett VG blir studenten övermodig och har bara 10% sannolikhet att få VG (och 40% att få U) på tentamen i januari. I övriga fall är sannolikheterna samma i januari som de var i december. (a) (2 poäng) Givet att studenten fått VG i december, vad är sannolikheten att få G i januari? (b) (2 poäng) Är händelserna att bli underkänd i december respektive underkänd i januari oberoende händelser? Motivera! Antag att var och en av samtliga 125 studenter som skriver tentamen i december har samma sannolikhet att få betyget G (40%). (c) (4poäng) Vad är sannolikheten att färre än hälften av studenterna fick betyget G? (d) (2poäng) I ett kompisgäng om sex studenter, vad är sannolikheten att högst en fick betyget G? (e) (2poäng) Antag att två i kompisgänget fick betyget G. En lärare stöter ihop med gänget och drar två av dem slumpmässigt (utan återläggning) för att fråga om tentamen. Vad är sannolikheten att de två som fick betyget G blev dragna? Fråga 3 (6poäng) En sociolog som hade noterat att det fanns många små hushåll i Sverige, funderade på om det var någon skillnad mellan Sverige och Norge i detta avseende. För att ta reda på om så var fallet, drog han ett slumpmässigt urval om 90 hushåll i vardera landet. De fick besvara en enkät som bland annat innehöll en fråga om hur många personer som fanns i hushållet. Han fick följande procentuella fördelning: Hushållsstorlek Sverige Norge 1-2 pers. 70 60 >2 pers. 30 40 Sociologen kommer efter några dagar tillbaka till dig, eftersom han har hittat populationsdata (data från en totalundersökning) vad det gäller Sverige. Det visade sig att 71% av de svenska hushållen bestod av 1-2 personer. Han ber dig nu att med hjälp av den norska delen av urvalsundersökningen testa om andelen Norska hushåll med 1-2 personer skiljer sig åt jämfört mot den i Sverige. Utför lämpligt test och var noga med att motivera ditt val av test och eventuella antaganden du gör. 3
Fråga 4 (9poäng) En miljömedveten villaägare försöker minska sin klimatpåverkan. Hon är väl insatt i solenergi och kan få rabatt på installationskostnaderna ifall tillräckligt många villaägare i hennes lilla stad är villiga att byta till solenergi. För att undersöka hur många av de totalt 5000 villaägarna i staden som kunde tänkas vara intresserade av att gå över till solel gjorde hon på följande sätt. I början av mars 2014 skickades en enkät till 900 slumpmässigt valda villaägare med följande fråga: "Kommer Du att gå över till solel om Du får 20 % rabatt på installationskostnaden?" Av de 900 utskickade enkäterna fick man in 610 enkätsvar. Av dessa svarade 312 Ja och resten Nej på frågan. (a) (5poäng) En tjänsteman i kommunen gör följande beräkningar: 312/610=0.51. Därefter sammanfattar han beräkningarna på följande sätt: "Med 95% sannolikhet är andelen hushåll som kommer att gå över till solel om man får 20% rabatt på installationen, större än 49%." Vad tycker Du om dessa beräkningar och slutsatser? Kommentera och ge vid behov förslag på förbättringar. (b) (4poäng) Vilken är den maximala, respektive minimala, skattningen av andelen hushåll i villaområdet som kommer att gå över till solel om man får 20% rabatt på installationskostnaden? Tips: Tänk på de som inte svarat, som utgör bortfallet. Fråga 5 (8poäng) Örebro kommun planerar att renovera ett antal skolor, alla byggda inom samma tidsperiod. För att kunna göra en rimlig budget, behöver man uppskatta kostnaderna för renoveringarna. Data har därför samlats in från liknande renoveringar av skolor och har räknats om till aktuellt penningvärde med hjälp av index: Antal rum (x1) Antal våningar (x2) Kostnad (y) miljoner kr 43 4 5.44 24 2 2.07 14 1 0.85 44 3 6.12 26 3 2.64 60 5 7.23 30 3 2.65 40 2 4.63 18 2 2.10 36 4 4.98 36 3 3.92 26 1 2.07 Tre olika modeller har anpassats med resultaten (se nästkommande sidor): 4
UTDATASAMMANFATTNING M odell 1 Regressionsstatistik Multipel-R 0,97 R kvadrat 0,94 Justerad R- kvadrat 0,92 standardfel 0,54 Observationer 12 A NOVA p-vbrde f g KvS MKv F förf Regression 2 39,51 19,75 68,33 0,00 Residua l 9 2,60 0,29 Totalt 11 42,11 Koeffictente Stondordfe. Nedre övre r l t-kvot e:_ värde 95~ 95~ Konst ant 1,2218 0,4511-2,7086 0,0241-2,2421 0,2014 x1 0,1319 0,0211 6,2483 0,0001 0,0842 0,1797 x2 0,2117 0,2217 0,9549 0,3646-0,2898 0,7131 UTDATASAMMANFATINING Modell 2 Regressionsstatistik Multipel-R 0,965 R-kvadrat 0,932 Justerad R kvadrat 0,925 standardfel 0,535 Observationer 12 ANOVA p-värde f g KvS MKv F förf Regression l 39,2458 39,2458 136,9503 0,0000 Residua l lo 2,8657 0,2866 Totalt 11 42,1115 Nedre Övre Koefficienter Stondordfel t-kvot p-värde 95% 95% Konstant 1,1724 0,44bl.l,6281 0,0252 2,1664 0,1784 x l 0,1480 0,0126 11,7026 0,0000 0,1198 0,1762 5
(a) (5poäng) Utifrån analysresultaten välj lämplig modell och ange dina kriterier vid valet. (b) (3poäng) En skola med 32 rum och 3 våningar ska renoveras. I budgeten vill man använda en uppskattning av den förväntade kostnaden för renoveringen av en sådan byggnad. Ange en punktskattning av den förväntade kostnaden utifrån den modell du valde i (a). 6
Tentamen - del 2 - rättning Grundläggande statistik (ST100G), 15hp, ht2015 Nicklas Pettersson Örebro Universitet 2015-12-12 Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 1 / 8
Fråga 1 (5poäng) Observation (i) 1 2 3 4 5 6 7 8 9 Lön (x i ) 40 33 38 28 26 0.82 x i 5 0.82 x i 5 0.82 x i 5 0.82 x i 5 Anst.tid (y i ) 4 3.5 2 1 1 0 0 0 0 (a) (b) (2 poäng) Beräkna medianlönen (avrundat till kkr) efter expansionen. -1p: Skattat 0.82 E(X) fel, 0.82 x i 5 =0.82 40+33+38+28+26 5 =0.82 33=27.06 27. -1p: Skattat medianen på felaktigt sätt: n=9, p=0.5, median är (n + 1)p=5:te ordnade observation, (med 0.82 x i 5 =27 blir median=27). (3 poäng) Vad är stickprovskorrelationen mellan lön och anställningstid för samtliga anställda efter expansionen? Om du ej lyckats räkna fram lönen för de nyanställda, kan du utan poängavdrag anta att den är 25kkr. -3p: ˆρ< 1 eller ˆρ>1 utan kommentar. -2p: 1 < ˆρ < 0 utan kommentar. -1p:Räknat korrelation istället för stickprovskorrelation -1p:Ej räknat på 9 anställda. s XY =7.083, s 2 X =2.444, s2 Y =28.5, r = 7.083 2.444 28.5 =0.849 0.85 s XY =8.361, s 2 X =2.444, s2 7.083 Y =36.277, r = 2.44 28.5 =0.888 0.89 Där:s XY = (xi x)(y i ȳ) n 1, s 2 X = (xi x) 2 n 1,s 2 Y = (yi ȳ) 2 n 1,ȳ = 11.5 9 1.27,n=9. Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 2 / 8
Fråga 2a-b (4/12poäng) En student ämnar skriva två tentamina i slutet av höstterminen. Betygsskalorna är U, G och VG. På tentamen i december är sannolikheten för VG 20% (och för G 40%). Om studenten då får ett VG blir studenten övermodig och har bara 10% sannolikhet att få VG (och 40% att få U) på tentamen i januari. I övriga fall är sannolikheterna samma i januari som de var i december. (a) (b) (2 poäng) Givet att studenten fått VG i december, vad är sannolikheten att få G i januari? Vi vet att j P (J =j D =vg)=1. Vi har då att: 1=P (J =u D =vg) + P (J =g D =vg) + P (J =vg D =vg)= = 0.4 + P (J =g D=vg) + 0.1 P (J =g D=vg)=0.5 (2 poäng) Är händelserna att bli underkänd i december respektive underkänd i januari oberoende händelser? Motivera! Underkänd=U. December kommer först, naturligt tänka om Januari påverkas av december (kasualitet i tid). Ja, oberoende då P (J =u D =u)=p (J =u) (alt. P (D =u)p (J =u)=p (D =u J =u)). P (J =u)=0.4 och P (J =u D =u)=0.4. Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 3 / 8
Fråga 2c-e (8/12poäng) Antag att var och en av samtliga 125 studenter som skriver tentamen i december har samma sannolikhet att få betyget G (40%). (c) (4poäng) Vad är sannolikheten att färre än hälften av studenterna fick betyget G? X bin(n=125, p=0.4), den exakta men tunga lösningen ges av P (X <125/2)= 62 ( 125 ) i=0 i p i (1 p) 125 i =0.9881965. Då n p (1 p)=30>5 rimligt använda normalapproximation, dvs P (X <125/2)=P ( X 125 0.4 125/2 125 0.4 125 0.4 0.6 < 125 0.4 0.6 )=P (Z < 62.5 50 30 ) P (Z <2.28)=0.988 enligt z-tabellen. -1p: Ej angett/kollat approximation, fel z-värde, orimligt värde, fel i formel, etc. (d) (2poäng) I ett kompisgäng om sex studenter, vad är sannolikheten att ( högst en fick betyget G? P (X 1)=P (X =0) + P (X =1)= 6 0) 0.4 0 0.6 6 + ( 6 1) 0.4 1 0.6 5 =0.046656 + 0.186624=0.23328. (e) (2poäng) Antag att två i kompisgänget fick betyget G. En lärare stöter ihop med gänget och drar två av dem slumpmässigt (utan återläggning) för att fråga om tentamen. Vad är sannolikheten att de två som fick betyget G blev dragna? ( 2 2) ( 4 0) ( 6 2) = 1 2 1 2 1 2 3 4 1 2 3 4 1 2 3 4 5 6 1 2 1 2 3 4 = 1 1 30 = 1 15 =0.06. 2 Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 4 / 8
Fråga 3 (6poäng), 1p vardera för korrekt angivelse av punkterna nedan, dock max 6p En sociolog som hade noterat att det fanns många små hushåll i Sverige, funderade på om det var någon skillnad mellan Sverige och Norge i detta avseende. För att ta reda på om så var fallet, drog han ett slumpmässigt urval om 90 hushåll i vardera landet. De fick besvara en enkät som bland annat innehöll en fråga om hur många personer som fanns i hushållet. fick procentuella fördelning: Hushållsstorlek Sverige Norge 1-2 pers. 70 60 >2 pers. 30 40 Hypoteserna: H 0 :p 0 =0.71, H 1 :p 0 0.71 Teststatistika: Z = ˆp p0 p 0 (1 p 0 ) n eftersom n ˆp (1 ˆp)=18.531>5. Observerat värde: z obs = 0.60 0.71.29 0.71 = 0.11 0.0478 2.30 90 Signifikansnivå&kritisk värde: α=0.05&z α/2 =1.96, α=0.01&z α/2 =2.58 Beslutsregel: Förkasta H 0 om z obs >z α/2. Beslut: z obs >z α/2 =1.96 förkasta H 0. z obs <z α/2 =2.58 förkasta ej H 0. Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 5 / 8
Fråga 4 (9poäng)...enkät till 900 slumpmässigt valda villaägare med följande fråga: "Kommer Du..." Av de 900 utskickade enkäterna fick man in 610 enkätsvar. Av dessa svarade 312 Ja och resten Nej på frågan. (a) (b) (5poäng) En tjänsteman i kommunen gör följande beräkningar: 312/610=0.51. Därefter sammanfattar han beräkningarna på följande sätt: Med 95% sannolikhet är andelen hushåll som kommer att gå över till solel om man får 20% rabatt på installationen, större än 49%." Vad tycker Du om dessa beräkningar och slutsatser? Kommentera och ge vid behov förslag på förbättringar. Med 95% säkerhet finns sanna proportionen i intervallet ˆp ± z α/2 ˆp(1 ˆp) n +2p: kommentera fel i texten. +2p: kommentar om att anta bortfall slumpmässigt. +1p: föreslå/bilda konfidensintervall. N n N 1. (4poäng) Vilken är den maximala, respektive minimala, skattningen av andelen hushåll i villaområdet som kommer att gå över till solel om man får 20% rabatt på installationskostnaden? Tips: Tänk på de som inte svarat, som utgör bortfallet. Skattning vi fått om alla svaret är i intervallet: +2p: ˆp min = 312 900 =0.346. +2p: ˆp max = 312+(900 610) 900 =0.668. Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 6 / 8
Fråga 5a (5/8poäng) 1p vardera för korrekt användning av punkterna nedan, max 5p Örebro kommun planerar att renovera ett antal skolor, alla byggda inom samma tidsperiod. För att kunna göra en rimlig budget, behöver man uppskatta kostnaderna för renoveringarna. Data har därför samlats in från liknande renoveringar av skolor och har räknats om till aktuellt penningvärde med hjälp av index: (a) (5poäng) Utifrån analysresultaten välj lämplig modell och ange dina kriterier vid valet. Valt mest rimlig modell, i detta fall modell 2. hög justerad R 2 (.92.925.637) lågt standardfel (.54.535 1.179) p-värde(lågt) alt. konf.int(täcker ej 0) för x1 & x2. (gäller x2 i modell 1) riktning (ev. storlek) på koefficienter stämmer med tänkt modell (alla rimliga) vid ungefär likvärdiga modeller, välj den enklaste (Occam s razor, modell2 före modell1) Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 7 / 8
Fråga 5b (3/8poäng) (b) (3poäng) En skola med 32 rum och 3 våningar ska renoveras. I budgeten vill man använda en uppskattning av den förväntade kostnaden för renoveringen av en sådan byggnad. Ange en punktskattning av den förväntade kostnaden utifrån den modell du valde i (a). Givet modell 1 är svaret: ŷ = 1.2218 +.1319 32 +.2117 3 3.63mkr Givet modell 2 är svaret: ŷ = 1.1724 +.1480 32 3.56mkr Givet modell 3 är svaret: ŷ =0.101 + 1.318 3 4.06mkr -1p: Räknat på annan modell än den vald i (a). -1p: Forumulerat ekvationen fel. -1p: Ej angett värde på punktskattning. -1p: Underlåtit kommentera ett felaktigt orimligt värde. -1p: Felaktig tolkning/användning av punktskattning. Nicklas Pettersson (Örebro Universitet) Tentamen - del 2 - rättning 2015-12-12 8 / 8