Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14 är ordinalskala, vi kan rangordna svaren men inte mäta avståndet mellan dem 1 är kvotskala, 0 betyder att man inte har några anställda skillnaden mellan 5 anställda och tre anställda är exakt två anställda. är nominalskala då svaren inte ens kan rangordnas 1 b Här använder iv svaren på fråga 14 och 1. Eftersom vi ska testa sambandet blir det korrelation. Eftersom den ena variabeln är mätt på ordinalskala kan vi inte använda Pearsons utan får använda oss av spermans rangkorrelation. Noolhypotesen är att korrelationskoefficienten är lika med 0 mothypotesen att den skiljer sig från noll. Testet baseras på rangtal och vi testar om det är så att de som har svarat ett högt värde på första variabeln har ett högre eller lägre värde på den andra variabeln jämfört med dem som svarat ett lågt värde på första variabeln. a och c är symmetriska, b är positivt skev och d är negativt skev. 3 a) Median 5 000 b) Medelvärde 6 483 c) Standardavvikelse 3 604 d) Variationsvidd 9 800

4 5 a) Sannolikhetsfördelning som uppstår när vi räknar antalet med en viss egenskap och sannolikheten att ha den egenskapen inte förändras mellan dragningarna. b) Sannolikhetsfördelning som uppstår när vi drar ett urval ur en population utan återläggning och räknar antalet som har en viss egenskap. c) Sannolikheten att en viss parameters sanna värde ligger inom den statistiska felmarginalen. d) Den största sannolikheten att ha fel som vi kan acceptera när vi förkastar en nollhypotes. x m = 87 x k = 89 n m = 1 n k = 31 s m = 10 s k = 5 a) Hypoteser: H 0 : σ m = σ k H 1 : σ m σ k Teststatistika: F = s 1 s Frihetsgrader täljare: 0 Frihetsgrader nämnare:30 Kritiskt värde: ca,55 (använd tabellen för 1 % signifikansnivå, vid dubbelsidigt test används tabellen för halva signifikansnivån.) Beslutsregel: Nollhypotesen förkastas om teststatistikans värde överstiger,55 Beräkna teststatistikan, ta alltid den större variansen i täljaren. F = 10 5 = 100 5 = 4 Nollhypotesen förkastas då teststatistikans värde överstiger det kritiska värdet. Slutsats. Män och kvinnor har inte samma varians. Det är mer skillnader mellan olika män än mellan olika kvinnor med avseende på hur fort de kör. b) Hypoteser: H 0 : μ m = μ k H 1 : μ m μ k Teststatistika: t = X 1 X df = (10 1 +5 31 ) ( 10 1 ) ( 5 31 ) + 0 30 s 1 n1 + s n = 6,83 Kritiskt värde:,771 t = 87 89 10 1 +5 31 = 0,798 = 0,847 Eftersom teststatistikans värde är högre än det negativa kritiska värdet kan vi inte förkasta nollhypotesen. Vi kan därmed inte dra några slutsatser från undersökningen. (Obs påhittade siffror)

6 A) Använd komplementregeln: 1 0,07 0,4 = 0,69 Sannolikheten att Maria får rött vid exakt ett av ljusen är 0,69 B) Enligt multiplikationsregeln kan vi räkna ut sannolikheten för att få grönt vid båda ljusen som x 0,8 = 0,4 x = 0,4 0,8 = 0,3 Svar: Sannolikheten att Maria får grönt vid första är 0,3 C) 0,3 0, = 0,06 (multiplikationsregeln) Svar: Sannolikheten att Maria får grönt ljus vid första och rött ljus vid andra är 0,06 D) 0,7 0,9 = 0,63 (multiplikationsregeln) Svar: Sannolikheten att Maria får rött ljus vid första och grönt ljus vid andra är 0,63 (Vi kan kontrollera att vi räknat rätt genom att se att 0,06 + 0,63 = 0,69 Svaren på c och d måste summera till svaret på a eftersom det är de enda två sätten att få exakt ett rött ljus) (Alternativ lösning, rita upp ett sannolikhetsträd, avsluta med att baklänges beräkna sannolikheterna vid första förgreningen.) 7 a) X μ 19 0 z = = = 1 σ 1 P(X < 19) = P(z < 1) = P(z > 1) = 0,5 P(0 < z < 1) = 0,5 0,3413 = 0,1587 sannolikheten att en slumpmässigt vald kokosboll väger mindre än 19 gram är 0,159 b) Frågan är ekvivalent med att medelvärdet ska vara mindre än 19,5 gram (487,5/5). σ x = σ n = 1 5 = 1 5 = 0, X μ 19,5 0 z = = =,5 σ 0, P(X < 19) = P(z <,5) = P(z >,5) = 0,5 P(0 < z <,5) = 0,5 0,4938 = 0,006 sannolikheten att en förpackning med 5 kokosbollar väger mindre än 487,5 gram är 0,006 8 a) 109,13 b) 107,14

9 a) Modell 1: Interceptet tolkas inte, förmodligen finns det inga basketspelare som är noll åt gamla Koefficienten för guard är signifikant eftersom p-värdet, 0,003 är lägre än 0,05. Koefficienten tolkas som att guards gör,38 poäng mer än centrar givet oförändrade värden på övriga oberoende variabler. Koefficienten för forward är inte signifikant eftersom p-värdet, 0,071 är högre än 0,05. Koefficienten för marr är inte signifikant eftersom p-värdet, 0,088 är högre än 0,05. Koefficienten för age är signifikant eftersom p-värdet, 0,000 är lägre än 0,05. Koefficienten tolkas som att spelarna gör 1,19 poäng mindre för varje år de blir äldre, givet oförändrade värden på övriga oberoende variabler. Koefficienten för exper är signifikant eftersom p-värdet, 0,000 är lägre än 0,05. Koefficienten tolkas som att spelarna gör 1,41 poäng mer om de har ytterligare ett års erfarenhet av proffesionell basket, givet oförändrade värden på övriga oberoende variabler. Modell : Interceptet tolkas inte, förmodligen finns det inga basketspelare som är noll åt gamla Koefficienten för guard är signifikant eftersom p-värdet, 0,030 är lägre än 0,05. Koefficienten tolkas som att guards gör,13 poäng mer än centrar givet oförändrade värden på övriga oberoende variabler. Koefficienten för forward är inte signifikant eftersom p-värdet, 0,119 är högre än 0,05. Koefficienten för marr är inte signifikant eftersom p-värdet, 0,141 är högre än 0,05. Koefficienten för age är signifikant eftersom p-värdet, 0,000 är lägre än 0,05. Koefficienten tolkas som att spelarna gör 1,11 poäng mindre för varje år de blir äldre, givet oförändrade värden på övriga oberoende variabler. Koefficienterna för exper och expersq är signifikanta eftersom p-värdena, 0,000 resp 0,013 är lägre än 0,05. Eftersom den icke kvadrerade variabelns koefficient är positivt ger en ökad

erfarenhet att man gör mer poäng. Att den kvadrerade koefficienten är negativ innebär dock att denna effekt minskar ju mer erfarenhet man får. Efter riktigt många års erfarenhet skulle den rent av kunna bli negativ, om någon skulle spela så länge. b) guards gör flest poäng, de gör lite mer än poäng fler än centrar och vi kunde inte visa att forwards gör fler poäng än centrar. c) R adj = 1 SSE n k 1 SST n 1 = 1 819,5 63 973,8 = 1 0,900 = 0,10 68 Den justerade förklaringsgraden är 0,10 d) modell 1 klarar av att förklara 10 procent av variansen i antal poäng, modell förklarar 1 procent av variansen i antal poäng. Modell är således lite bättre på att förklara varför olika basketspelare gör olika många poäng men båda modellerna harr relativt låg förklaringsgrad. Det är förmodligen många andra faktorer som förklarar mer av skillnaderna mellan spelarna. e) Eftersom n - 1 är lika med 68 måste n vara lika med 69 69 spelare ingick i urvalet. f) points = 30,1 +,1 guard + 1,5 forward + 1,1 marr 1,11 age +,11 exper 0,06 expersq points = 30,1 +,1 0 + 1,5 1 + 1,1 1 1,11 5 +,11 3 0,06 9 = 10,7