Karlstads universitet Institutionen för informationsteknologi vdelningen för statistik Tentamen i Statistik, ST 10 och ST 13 (9 poäng) Onsdag 5 augusti 004, Kl 08.15-13.15 Tillåtna hjälpmedel: ifogad formelsamling (med approximationsschema) och tabellsamling (dessa skall returneras). Egen miniräknare. nsvarig lärare: Hannah Hall, telefon 00 46 - (0)54-700 11 3 Övrigt: För att få maximala 10 poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 40 poäng, för betyget Väl Godkänd krävs minst 60 poäng. Uppgift 1 Nedanstående datamaterialet visar kroppslängd (y) och ålder (x) för tio barn. arn C D E F G H I J X: Ålder (år) 1 1 3 3 3 4 5 6 6 Y: Längd (cm) 68 65 91 100 105 108 11 10 10 17 a) Illustrera materialet med en lämplig graf. Kommentera din graf och förklara varför det är lämpligt att anpassa en regressionsmodell till datamaterialet. b) npassa en regressionsmodell y=a+bx till datamaterialet. Tolka regressionskoefficienterna a och b. c) nge vad man skulle kunna betrakta som normallängd för ett nyfött barn respektive en 5-åring.
Uppgift Mia har tre påsar med olika frösorter. Påse innehåller 100 morotsfrön, påse 00 rödbetsfrön och påse C 00 salladsfrön. Sannolikheten att ett morotsfrö skall gro och ge upphov till en morot är 0,70. För rödbetorna är motsvarande sannolikhet 0,80 och för salladsfröna, 0,60. Mia häller i ett obevakat ögonblick alla fröna i en påse och blandar dem väl. Hon väljer sedan ett enda frö slumpmässigt och planterar detta. a) eräkna sannolikheten att detta frö gror. b) eräkna sannolikheten att det blir en morot om man vet att fröet gror. Uppgift 3 Vid en lektion i statistik utför läraren ett antal kast med en symmetrisk tärning som är numrerad på vanligt sätt. Efter sex kast har läraren fått värdet 5 i samtliga kast. a) eräkna sannolikheten att få värdet 5 i samtliga kast. b) Läraren frågar studenterna vad som kommer att ske om hon fortsätter kasta tärningen. En student resonerar på följande sätt: I det långa loppet skall samtliga värden förekomma lika ofta. Eftersom värdet 5 redan har erhållits i sex kast måste sannolikheten för detta värde i det sjunde kastet nu vara betydligt mindre än 1/6. Kommentera resonemanget. Uppgift 4 En firma tillverkar disketter. ntal fel, X, på en diskett har följande sannolikhetsfördelning: x x) 0 0,75 1 0,15 0,10 a) eräkna väntevärde och standardavvikelsen för antal fel på en diskett. b) eskriv fördelningen för det genomsnittliga antalet fel per diskett i ett urval av 400 disketter; använd gärna ett diagram. eräkna väntevärdet och standardavvikelsen för denna fördelning. c) eräkna sannolikheten att det genomsnittliga antalet fel per diskett i ett urval av 400 disketter är mindre än 0,3.
Uppgift 5 Ett konditori anställer två bagare. ntal kanelbullar som respektive bagare bakar under en dag kan betraktas som oberoende normalfördelade slumpvariabler. I snitt bakar bagare 600 kanelbullar under en dag, standardavvikelsen är 5. Motsvarande siffror för bagare är 500 respektive 60. a) Med vilken säkerhet kan konditoriet ge en garanti till kunderna att de bakar minst 1 000 kanelbullar på konditoriet under en viss dag? b) Vad är sannolikheten att bagare en viss dag bakar fler bullar än bagare? Uppgift 6 Ett välkänt undersökningsföretag i Sverige genomför regelbundet mätningar av allmänhetens inställning till ett svenskt medlemskap i EMU, bland annat ställer de följande fråga: "Om det var folkomröstning idag om EMU, skulle du då rösta ja eller nej till att Sverige inför euron som valuta?" Den 5 augusti 004 genomfördes en telefonundersökning av det svenska folket med 1 000 slumpmässigt valda individer. Resultatet blev: 39% svarade ja, 55% nej och 6% vet ej. a) Varför är det viktigt att urvalet genomfördes på ett slumpmässigt sätt? b) Hur kan man bedöma hur bra denna undersökning beskriver allmänhetens inställning till euron? c) eräkna ett konfidensintervall med 95% konfidensgrad för den proportion av det svenska folket som skulle rösta ja till euron om det var folkomröstning idag. Motivera alla eventuella antaganden du behöver göra. Vad kan man dra för slutsats?
Uppgift 7 För att uppskatta hyressituationen av lägenheter i Stockholm har ett fastighetsföretag undersökt ett slumpmässigt urval av 100 hyreslägenheter i området. Procentförändringen i hyran över ett år visas i nedanstående tabell: Procentuell -4-0 + +4 +6 förändring Frekvens 5 5 5 30 5 10 a) eräkna ett 95% konfidensintervall för den genomsnittliga procentuella hyresförändringen. b) Vilka förutsättningar måste vara uppfyllda för att kunna ta fram konfidensintervallet? c) Är konfidensgraden för ditt konfidensintervall exakt eller approximativt 95%? Motivera noga ditt svar! d) Kommentera om du tycker att hyreskostnaderna i Stockholm har ändrats det senaste året. Uppgift 8 I denna uppgift ska du beskriva hur du kan använda ett hypotestest för att testa om ett mynt är symmetriskt eller skevt mot krona. Följ nedanstående steg och beskriv din metod så tydligt som möjligt. a) Sätt upp hypoteserna för testet (H 0 och H 1 ). b) Hur ska du genomföra testet? nge din testvariabel. Vilken fördelning har testvariabeln? c) Förklara dels i allmänna termer och dels i termer av ditt test vad typ-i-fel och typ-ii-fel är. d) Formulera din beslutsregel, dvs. för vilka värden på din testvariabel tycker du det är rimligt att kunna säga att myntet inte är symmetriskt? Motivera på ett statistisk sätt genom att sätta typ-i-felet till 5%. e) nta myntet i själva verket är skevt mot krona, med sannolikhet 0,8 att få krona. eräkna under denna förutsättning testets styrka. f) Hur skulle du kunna förbättra ditt test?
ST 10/13 tentamen 04085; Lösningar Uppgift 1 Y: kroppslängd X: ålder 140 10 Kroppslängd (cm) 100 80 60 40 0 0 0 4 6 8 Ålder (år) a) Scatterplot. nvänd ord: positiv korrelation, starkt, linjärt. Sambandet är linjärt då är det lämpligt att anpassa en regressionsmodel. b) Regressionsmodell y=a+bx xy = 3784 x = 146 x = 34 y = 1016 n = 10 b=[13-5]=10,84 a=[13-6]=64,74 y=64,74+10,84x Tolkning av b: 10,84 visar att den genomsnittliga ökningen i längden vid en ökning av barnen med 1 år är 10,84cm. Tolkning av a: 64,74 visar den genomsnittliga längden enligt regressionslinjen om ålder =0 (Det är orealistiskt att tolka, dvs. det skulle bli längden av ett nyfött barn). c) Ett nyfött barn Extrapolering utanför datamaterialet, x=0 y=64cm det är omöjligt. Man tolkar alltid regressionslinjen i det område där data insamlats. En 5-åring x=5 y=64,74+10,84(5)=118,94cm
Uppgift = Påse = 100 morotsfrön = Påse = 00 rödbetsfrön C = Påse C = 00 salladsfrön G = Fröet gror G ) = 0,7 G ) = 0,8 G C) = 0,6 Läses givet Lösningsalternativ med en korstabell: G ~G Summan 70 100 160 00 C 10 00 Summan 350 500 a. 350 av 500 fröer gror. Om man välja ett enda frö slumpmässigt och planterar detta, sannolikheten att det gror är G) = 350/500 = 0,7. b. 70 av de 350 fröer som gror är morotsfrön. Om man välja ett enda frö slumpmässigt och planterar detta, och det gror, då är sannolikheten att det blir en morot G) = 70/350 = 0,. Uppgift 3 a) X = ntal 5:or vid 6 kast av en symmetrisk tärning. 1 x in(6, ) 6 X=6) = {1/6 är inte med i tabellsamling, vi använder formeln [6-3]} 6 0 6 1 5 1 P ( X = 6) = 6 C6 = = 0,000 6 6 6 Det är väldigt osannolik att få 6 5:or vid 6 kast av en tärning, är tärningen faktisk symmetriskt?, b) Läraren frågar studenterna vad som kommer att ske om hon fortsätter kasta tärningen. En student resonerar på följande sätt: I det långa loppet skall samtliga värden förekomma lika ofta. Eftersom värdet 5 redan har erhållits i sex kast måste sannolikheten för detta värde i det sjunde kastet nu vara betydligt mindre än 1/6. Egna kommentarer.
Uppgift 4 X = ntal fel på en diskett x x) 0 0,75 1 0,15 0,10 a) E ( X ) = x x) = 0(0,75) + 1(0,15) + (0,10) = 0, 35 σ = Var ( X ) = x x) µ = 0,55 0,15 = 0,475 σ = 0,475 = 0,6538 = 0 (0,75) + 1 (0,15) + (0,10) (0,35) b) Normalfördelad. x1 + x +... + x400 x = är det genomsnittliga antalet fel per diskett I ett urval av 400 400 disketter. Enligt CGS är x approximativt normalfördelad om n är stor, det spelar igen roll att fördelningen för de enskilda x - variablerna är skev. I detta exempel är X en diskret variabel, och fördelningen av de enskilda x variablerna skev mot 0, och mycket olik normalfördelningen. För att approximationen ska fungera bra behövs ett stort n, vi har n=400 och antar att det är tillräckligt stort (n>30 uppfyllda med ganska bred marginal). σ x 0,6538 µ x = µ x = 0,35 σ x = = = 0, 037 n 400 x N(0,35;0,03) x µ x 0,3 0,35 c) Vi söker: x 0,3) = ) = Z 1,53) = { tabell} = 0, 0630 σ x 0,037 nvänd gärna ett diagram för att illustrera det du vill ta fram.
Uppgift 5 N( µ = 600; σ = 5) N( µ = 500; σ = 60) a) Vi söker: P ( + 1000) + är också normalfördelad + N( µ + = 600 + 500 = 1100; σ + σ = 5 + 60 = 45 σ + = 65) ( + ) µ + 1000 1100 P ( + 1000) = ) σ + 65 100 P ( Z = 1,54) = 1 Z 1,54) = { tabell} = 1 0,0618 = 0,938 65 Konditoriet är kan vara 94% säker att de kan producera minst 1 000 bullar en viss dag. b) Vi söker: P ( > ) P ( > ) = > 0) N( µ = 500 600 = 100; σ + σ = 60 + 5 ( ) µ 0 ( 100) P ( > 0) = ) σ 65 100 P ( Z = 1,54) = Z 1,54) = { tabell} = 0,0618 65 = 45 σ = 65) nvänd gärna ett diagram för att illustrera det du vill ta fram.
Uppgift 6 a) Slumpmässigt representativ: Man kan dra slutsatser till populationen och beräkna urvalsfelet dvs. Vilka variation det finns i skattningarna. b) Diskussion kring: stickprovsstorleken, medelfel, andra felkällor. c) 95% konfidensintervall för en proportion. P = proportion som planera rösta ja, p, 0,39 från stickprovet är vår bästa skattning av P ( vad kan man säga om de som svarade vet ej till frågan?) x 390 p = = = 0,39 n 1000 x in(1000;0,39) åda np och n(1-p) >5 vi kan approximera x normalfördelning, och då följer det att p är också normalfördelningen. pˆ(1 pˆ) 0,39(0,61) I π : pˆ ± z = 0,39 ± 1,96 = 0,39 ± 0,03 = (0,36;0,41) n 1000 Resultatet av undersökningen speglar nära till det vi skulle få vid en totalundersökning. Om det var röstning idag, vi kan säga att ja röstarna kommer att bli en minoritet. Uppgift 7 a) x =[3-6]=+1,9% s = [ 4 8] = 6,5 =,5 95% konfidensintervall för medelvärdet: s,5 I µ : x ± z = 1,9 ± 1,96 = 1,9 ± 0,49 = (1,41;,39) n 100 Med 95% säkerhet ligger den genomsnittliga procentuella hyresförändringen mellan +1,41% och +,39%. b) Vi antar att x är normalfördelad, enligt CGS. I detta exempel är stickprovsstorleket stort, n=100. Eftersom σ är okänd ska vi använda oss av t-fördelningen, men eftersom stickprovsstorleket är stort vi kan använda z=1,96. c) Det är approximativt 95%, men det är en bra approximation eftersom stickprovsstorlek är stort. Populationen är inte normalfördelad, men enligt CGS är x approx. normalfördelad. d) Egna kommentarer.
Uppgift 8 Hypotestest: Testa om ett mynt är symmetriskt eller skevt mot krona. a) π : ndelen krona H 0 : π = 0, 5 Myntet är symmetriskt. H 1 : π > 0, 5Myntet är skev mot krona. b) Hypotestest: Jag ska kasta ett mynt ett antal gånger och räknar antal kronor, om jag får väldigt många kronor då misstänker jag att myntet är skev mot krona. Jag kan jämföra det som jag fick från mitt försök med det teoretisk sannolikhet att få ett sånt värde. Testvariabel: X = ntal kronor vid 10 kast av myntet. x in( n = 10, π = 0,5) c) Typ-I-fel : Förkasta H0 H0 sann) = α. Sannolikheten att man fatta ett beslut som säger att myntet är skev mot krona, men i verkligheten den är balanserad. Typ-II-fel : Inte förkasta H0 H1 sann) = β. Sannolikheten att man fatta ett beslut som säger att myntet är balanserad, emellertid det är skev. d) Om jag får ett orimligt antal kronor, x, för vad fördelningen in(10;0,5) säger dvs. ett extremt värde, då ska jag förkasta H0 Vi söker: P ( X x in(10;0,5)) 0, 05 P ( X 8) = 1 X 7) = { tabell} = 1 0,9453 = 0,0547 P ( X 9) = 1 X 8) = { tabell} = 1 0,9893 = 0,0107 eslutsregel: Om jag får 8 eller flera kronor vid 10 kast av myntet då ska jag förkasta H0. e) π = 0, 8 β = X 7 in(10;0,8)) = { tabell} = 0,3 Testets styrka = 1 β = 1 0,3 = 0, 6888 Det är sannolikhet att man upptäcker fusket. f) Öka antal upprepningar, n. Minska α men då höjas den kritiskagränsen som ökar chansen för Typ fel). Och motsatsen att minska β ökar Typ 1 fel). Man måste hitta en balans.