Tentamensadministration på institution Sida l av l Tentamenskvitto Institution/School Handelshögskolan vid Örebro universitet Kurs/Cou rse Grundläggande statistik (ST100G) Pr.ov/Examination Skriftlig tentamen (0100) Datum/Date 2015-11-06 Tid/Time 0815-1115 Tentamenskod/Examination Code Personnummer/Civic Registration Nu m ber Detta kvitto är ditt bevis pij att du lämnat in din tentamen. I studentforum under fliken Mina kurser 1 Rättade tentamen visas din inskannade tentamen efter rättning. Skanning av din rättade salstentamen sker efter att du delgivits ditt betyg. Din rättade och skannade salstentamen sparas i studentforum i tv.j.jr och gallras sedan. Din inskannade tentamen är originalet och papperstentan gallras efter en m.jnad. This receipt is your proof that you have submitted your examination. Your corrected written examination is displayed in studentforum under the ta b My courses l Corrected examinations. Your corrected written examination will be seanned once it has been graded. Your corrected and seanned written examination will be sa ved and kept in studentforum for a period of two years and then be sorted out. Your seanned examination is the original and paper examination will be sorted out after a month. Antal inlämnade ark/number of sheets you hand in Skrivvakt/Examination Supervisor https://kakapo.oru.se/iadm2/printkvitto?tentam=0020342 2015-11-03
HANDELSHÖGSKOLAN Skriftlig tentamen Grundläggande statistik (ST100G), 15 högskolepoäng. Datum: Fredag 2015-11-06. Ansvarig Lärare: Nicklas Pettersson Antal frågor: 5 Maxpoäng: 40 Godkänd: 20 (inklusive eventuella poäng från duggan) Väl Godkänd: 2::30 (inklusive eventuella poäng från duggan) Tillåtna hjälpmedel l. Miniräknare 2. Formelsamling 3. Ett A4-blad med handskrivna anteckningar på båda sidorna Anvisningar Redovisa dina lösningar i en form som gör det lätt att följa tankegången. Motivera alla väsentliga steg i lösningen. Ange alla antaganden och förutsättningar som du utnyttjar. Skriv endast på en sida av arket. Börja varje ny uppgift på nytt ark. Lycka Till! l
Fråga l ( 6poäng) En sociolog som hade noterat att det fanns många små hushåll i Sverige, funderade på om det var någon skillnad mellan Sverige och Norge i detta avseende. För att ta reda på om så var fallet, drog han ett slumpmässigt urval om 90 hushåll i vardera landet. De fick besvara en enkät som bland annat innehöll en fråga om hur många personer som fanns i hushållet. Han fick följande procentuella fördelning: Hushållsstor lek Sverige Norge 1-2 pers. 70 60 >2 pers. 30 40 Han ber nu dig om hjälp medatt testa om det är någon skillnad mellan Norge och Sverige vad det gäller hushållsstorlek Sociologen vill att du använder signifikansnivån 5%. Utför lämpligt test och var noga med att motivera ditt val av test och eventuella antaganden du gör. Fråga 2 (8poäng) En miljömedveten villaägare försöker minska sin klimatpåverkan. Hon är väl insatt i solenergi och kan få rabatt på installationskostnaderna ifall tillräckligt många villaägare i hennes lilla stad är villiga att byta till solenergi. För att undersöka hur många av de totalt 5000 villaägarna i staden som kunde tänkas vara intresserade av att gå över till solenergi gjorde hon på följande sätt. I början av mars 2014 skickades en enkät till 900 slumpmässigt valda villaägare med följande fråga: "Kommer Du att gå över till solel om Du får 20 % rabatt på installationskostnaden? 11 Av de 900 utskickade enkäterna svarade 402 Ja och resten Nej på frågan. (a) (5poäng) Uppskatta andelen villaägare i staden som är intresserade av att byta till solenergi och presentera resultatet i form av ett 95%igt konfidensintervall. Motivera dina beslut och eventuella antaganden du gör. (b) (3poäng) Idag brottas många som gör statistiska undersökningar med bortfall, vilket kan vara förödande för undersökningar. Förklara kortfattat vad som är det allvarligaste problemet med bortfall i statistiska undersökningar. 2
Fråga 3 (7poäng) Din chef rusar in med ett papper i handen med en skiss med ett påbörjat histogram för en skattad sannolikhetsfördelning för en variabel X. Chefen vill att du skall fundera över en sannolikhetsmodell som kan stämma överens med den givna skattade fördelningen, och skriver snabbt ned två förslag som denne redan funderat på: l. X rv Binomial(n = 2,p = 0.3) 2. X rv Geometrisk(p = 0.45) Du hinner precis snappa upp att värdmängden är större än den som täcks av histogrammets två staplar, dvs det krävs fler staplar för att representera hela fördelningen, innan chefen rusar iväg för att hinna med det nya flyget till Köpenhamn. Enligt skissen anser du det rimligt att anta att den första stapeln omfattar värden från och med O men mindre än l, och att den andra omfattar värden från l men mindre än 2. \ _0.5 ~0.25 0.0 0-0.9 1-1.9 (a) (4poäng) Räkna fram sannolikheterna P(O.::; X< l) och P(l.::; X< 2) för chefens två förslag, och jämför med med den del av histogrammet du fick av chefen. (b) ( 3poäng) Du får senare reda på att den sanna fördelningen för X är Normal (p = 0.54, (} =.84). Hur skall histogrammet se ut på värdemängden (-1, 2..lt_)? (dvs hur höga skulle staplarna närmast till vänster respektive till höger om de i skissen ovan vara?) 3
Fråga 4 (lopoäng) En fotbollsspelare (som gillar slantsingling men ogillar talen 3 och 4) och en brädspelare (som gillar höga tal) försöker enas om ett spel. Spelet innefattar att kasta en tärning och singla en slant och sedan räkna antal poäng som en funktion av utfallet av tärningskastet och slantsinglingen. Båda händelserna sker oberoende av varandra. Antag därför att vi har följande variabler: Y = antalet ögon vid kast med en sexsidig tärning Z = antalet krona vid singling av en slant Brädspelaren föreslår följande poängsystem, (dvs poängen ges av variabeln X 1 ): om {färre än tre ögon på tärningen} U {slanten visar klave} om {fler än fyra ögon på tärningen} n {slanten visar krona} i eventuella övriga fall Till slut enas de dock om ett annat poängsystem (X 2 ) som definieras på följande sätt x = {(y z)iy > 4 2 O ly::; 4 där y och z är utfallen på Y och Z (a) (3poäng) Vad är marginalfördelningarna för Y och X 1? Tips, en marginalfördelning för en variabel W med minsta respektive högsta utfall a och b ställs upp som w a b P(W =w) Il P(W =a) P(W =b) För att hitta marginalfördelningen för X 1 kan ni gå tillväga på följande sätt. Börja med att skriva upp simultanfördelningen för Y och Z, dvs y l 6 l P(Z =z) z o P(Y =l n Z= O) P(Y = 6 n Z= O) P(Z =O) l P(Y =l n Z= l) P(Y = 6 n Z= l) P(Z =l) P(Y =l) P(Y =l) P(Y = 6) l Eftersom Y och Z är oberoende vet vi att alla sannolikheter P(Y = y n Z = z) i denna tabell är lika stora. Sätt därför istället in i tabellen vad utfallet på X 1 är, t.ex. i övre vänstra hörnet vad X 1 blir om Y= l och Z= O. Marginalfördelningen för X 1 ges då av den relativa frekvensen för utfallen på X 1 i den nu framtagna tabellen. (b) (3poäng) Vad är väntevärdet av X 2? Tips räkna fram marginalfördelningen för X 2 på samma sätt som i frågan innan. Om ni ej lyckas få fram marginalfördelningen för x2) använd följande fördelning: X2 Il o l 3 5 P(X2 = x2) Il 0.5 0.3 0.1 0.1 4
(c) (4poäng) Beräkna kovariansen och korrelationen mellan X 1 och X 2 och förklara vad denna säger om variablernas samband. Tips, för att ta fram simultanfördelningen mellan X 1 och X 2, utgå från de två tabellerna för Y och Z som användes för att räkna fram marginalfördelningarna för X 1 respektive X 2. Om ni inte lyckas med detta, använd istället följande simultanfördelning. Il o l 3 X1 o 0.5 o o o 0.5 l o 0.3 o o 0.3 3 o o o 0.1 0.1 5 o o 0.1 o 0.1 P(X2 = x2) 0.5 0.3 0.1 0.1 l 5
Fråga 5 (9poäng) I ett medicinskt forskningsprojekt vill man studera hur effektiv en viss medicin är för att sänka kolesterolvärdena hos patienter med en viss sjukdom. I en inledande fas av projektet har man mätt 25 patienters kolesterolvärden (mg/100 ml plasma) samt vägt dem (kg). Ur journalerna har de tagit fram patienternas ålder (år). Resultatet framgår av tabellen nedan. x1 Y = Kolesterol = Vikt 181 67 190 73 209 27 220 60 220 82 244 63 254 75 263 70 274 85 288 63 290 89 302 69 303 55 308 75 311 59 346 65 354 84 365 75 374 79 385 72 395 59 402 79 405 65 434 69 451 76 x2 =Ålder 23 20 24 34 34 30 23 30 37 28 31 25 40 50 46 52 46 44 51 36 60 57 52 48 57 I studien vill man bland annat studera om kolesterolvärde kan förklaras av variablerna vikt och ålder. Man har därför utfört tre linjära regressionsanalyser, en med endast vikt som förklarande variabel, en med endast ålder och slutligen en med både vikt och ålder. Resultaten ser du på följande sidor. (a) (2poäng) Vilken av de två förklaringsvariablerna anser du vara viktigast för att förklara kolesterolvärde? Motivera med hjälp av spridningsdiagrammen på nästa sida. (b) (3pGäng) Vilken modell anser du vara den bästa av de tre och varför? (c) ( 4poäng) Vilka krav ställs på residualerna då man gör en linjär regressionsanalys? Är dessa uppfyllda för den modell du valde i b). (Figurerna. (Residual) hör till närmast föregående analys.) Ange vilken figur du bedömer, genom att t.ex. ange "första modellen, övre vänstra figuren". 6
y 500 4'50 400 350 300 250 200 150 :wo 50 o n '"' x l 20 40 60 80 1DO y 500 400 300 200 100 o x2 c~ 10 20 30 40 50 70 70 60 50 40 30 20 10 x2 o o 20 40 60 100 7
fv!odell 'l Regression Analys!s The regression equation is Kolesterol = 214 + 1.40 Vikt MultipäR R-kvadrat Justerad R-k.vadrat standardfel Observatlo n er 0,225544291 o, 05(}.8 70227 0,009003715 71..45452437 25 AN OVA Regression Res l dual Totalt f g 1 23 24 KvS M K v F -värde förf 73'95,36306 7395,363 1,232724 0,278351 137981,6769 599'3,203 14.5377,04 Konstant vikt Koefficienter standardfel t-kvot p-värrje Vedre 95% Ovre 95% r 213,6224563 88)31450002 2,405266 0,024602 29,89566 397,3492 1,399100053 1,260131345 1,110281 0,27&351-1.,20768 4,00588 Residua! Model Diagnostics - -.~ lo''- r:::::::::::::::::::::~~~~= -1 o 1 N:x-mal Srore -~ «.::1..-2,32-4 "".----.---.----.----r----r-' o =- 10 1:: =.o Ol:.e.er.ab Nu m ter 6'4 J:: " ~,;> o-~ Qj A G: 1,...-- - - f-- f-- f-- - ~ ~---------------------, ~ ~ o +-----------~~~~---; QJ e: -1 C -1..5-1 o -o.:; 0(1 o:. 1 o t:. :;so:;:e: =.'10 ::::a: ;;:so 3)0.3.1 o~ 33::,3..$) Re:.nua! Frt 8
0 L The regression equation is Kolesterol = 103 + 5:32 Ålder Multipel-R R-kvadrat Justerad R-kvadrat. standardfel observationer 0,837353384 0,70116069 0,68lH67677 43A6131428 25 A NOVA :Regression ire~idual 'Totalt J g 1 23 24 KVS MKv F -vdnje för f 101932,6657 101932,7 53,96444 1,7'3E-07 43444,:n429 188&,&86 145377,04 Konstant ålder Koe[ficleJ:ter swndrudfel t-kvot p-värde Ved re 95% övre 95% 1 102,5751412 29,63757132 3,400983 0,002:11 41,16515 163,8851 5,320676n4 O, 7242S08S9 7,340049 1, 79-07 3,822367 6,llJ89&6 Residua! M odel Diagnostics.-.... r:===========-11:1-.. -:.,r-::: l!! :::; "O m l?! ; o -i ~ '.... -1 o..... - t-bma! S:oore -3 C :S 10 1 :S :=.o :=5 Ol:Eena:tloa Nurn ter 6 -... ~- o.. Hl -1 :S i C' <':S OQ 05 to t:s :;;:c1 Reskl'ta..l ~ "O m o w E.. -i 9
dell3 g re ss ;on im is The regression equation is Kolesterol= 67.5 + 0.558 Vikt+ 5.23 Ålder Multipel-R R-kvadrat Justerad R-kvadrat Standardiel Obsenrationer Re2ressions.statistik 0,&42M5352 o, 709Q403 74 0,682589499 43..84.&31766 25 A NOVA Regn~~~lon Residua! Totalt f g KvS MKv F -varde fi;ir F 2 103078,1908 51539,1 26,80593 1,27E-06 22 42298,84916 1922.. 675 24 145377,04 Kon~ant vikt a ide r Koefficienter Storrdotdfel t-kvot p-vdräe t.;edte 95% övre 95% 1 67,51733328 54,37796842 1,24163 0,227448-45,2557 180,2903 0,558277244 G, 723270165 0,771879 0,448399 0,94169 2,058248 5,22643727 0,740869432 7,054465 4,46E-07 3,689968 6,762906 Residua! Mode! Diagnostir:s "...,. r... -::: -;;: -1 c 1 tlbrmal Soore -.3; "T----..-~-----,.-----r---r-' o ; -t:i ;; ;;.c 2:. Oi::sens:tkm Nu rn ter -:.:::s~-: r:.. ;;; -1,.-------,..------,..--1 3CO Rt lo
2015-11-09 Tentamen grundläggande statistik A del 2 151106 2015-11-09 1 Lösningförslag Fråga 1 2015-11-09 2 1
2015-11-09 2015-11-09 3 Lösningsförslag Fråga 2 2015-11-09 4 2
2015-11-09 Lösningsförslag Fråga 2 2015-11-09 5 Lösningsförslag Fråga 3 a) 2015-11-09 6 3
2015-11-09 2015-11-09 7 Lösningsförslag Fråga 4 2015-11-09 8 4
2015-11-09 2015-11-09 9 2015-11-09 10 5
2015-11-09 2015-11-09 11 2015-11-09 12 6
2015-11-09 Lösningsförslag Fråga 5 2015-11-09 13 2015-11-09 14 7
2015-11-09 2015-11-09 15 8