MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 23 e mars 2017 Ten 1, 9 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar. Numrera bladen och sortera dem i ordning.
1. (1 poäng) Vilken av följande fördelningar är mest lik en exponentialfördelning a) b) c) d) 2. (1 poäng) Vilken av följande fördelningar är diskret a) b) c) d) 3. (1 poäng) Antag att du slumpar fram 10 elever från en skola utan återläggning och räknar antalet tjejer. Antalet tjejer blir då en slumpvariabel. Vad kallas den fördelning som denna slumpvariabel har? a) Normalfördelning. b) Binomialfördelning. c) Hypergeometrisk fördelning. d) Uniform fördelning.
4. (1 poäng) På vilken skala mäts variabeln temperatur mätt som grader Celsius? a) kvotskala b) intervallskala c) ordinal skala d) nominal skala 5. (1 poäng) Vilket av följande påståenden är falskt? a) Histogram är lämpligt för en variabel mätta på kvotskala b) Man kan beräkna medelvärdet på en kvalitativ variabel. c) Variabler mätta på nominalskala kan inte användas som beroende variabel i en enkel linjär regressionsanalys d) Genom att konstruera dummyvariabler kan man använda variabler mätta på nominalskala som oberoende variabler i en enkel linjär regressionsanalys. 6. (1 Poäng) Vilket av följande påståenden är falskt? a) Histogram kan inte användas för variabler mätta på kvotskala. b) Kvalitativa variabler kan mätas på nominalskala eller ordinalskala. c) Binomialfördelningen är ett exempel på en diskret sannolikhetsfördelning. d) Längden på ett konfidensinterval minskar om man gör ett större urval. 7. (4 poäng) Ett urval av 7 stycken fotbollstränare har följande åldrar: 29, 33, 36, 37, 42, 47, 51 Beräkna följande mått: a) Första kvartilen b) Medelvärde c) Standardavvikelse a) Pearson measure of skewness
8. (6 poäng) Nedan visas ett urval av frågorna i SOM undersökningen från 2013. Utifrån fråga 59 skapas variabeln F59, de som svarat Vet ej kodas som missing. Utifrån fråga 61 skapas tre variabler: F61 har tre utfall beroende på vilken av de tre rutorna som respondenten kryssat i F61_km har siffran för antal km som utfall F61_min har siffran för minuter som utfall F66 har två utfall beroende på vilken ruta som kryssats i F67 har 4 utfall beroende på vilken ruta som kryssats i. a) Ange och motivera skaltyp för var och en av de 6 variablerna. b) Antag att man vill undersöka om civilståndet påverkar hur lång resväg man har till jobbet. Föreslå en lämplig test och motivera varför det är lämpligt. Formulera hypoteserna, ange vilka variabler som används och förklara kort hur testen går till. c) Antag att man vill undersöka om föräldrar upplever en större risk att bli arbetslös än personer som inte har barn. Föreslå en lämplig test och motivera varför det är lämpligt. Formulera hypoteserna, ange vilka variabler som används och förklara kort hur testen går till.
9. (6 poäng) Nedanstående enkätfrågor kommer från SOM undersökningen 2013. Nedan visas ett mindre urval av svaren på frågan ovan. (Siffrorna är dock påhittade så det är inga riktiga svar) Spelat Druckit kön motionerat på tips alkohol 6 6 1 1 2 2 2 2 7 6 7 2 1 1 4 1 5 5 3 1 7 1 6 2 6 1 1 1 6 1 5 2 7 4 6 1 6 5 4 2 7 7 1 2 6 7 4 2 1 1 1 2 6 1 5 2 Antag att man vill ta reda på om svenskarna dricker alkohol lika ofta som de tränar. Föreslå och motivera två lämpliga testmetoder och formulera lämpliga hypoteser. Beräkna de båda tester du föreslår. Använd 5% signifikansnivå.
10. (5 poäng) Antag följande sannolikheter: P(A) = 0,8 P(B) = 0,5 P(C) = 0,6 Och följande betingade sannolikheter: P(A B) = 0,8 P(A C) = 0,8 P(B A) = 0,5 P(B C) = 0,33 P(C A) = 0,6 P(C B) = 0,4 a) Är A och B beroende händelser? Motivera ditt svar b) Är B och C beroende händelser? Motivera ditt svar c) Beräkna sannolikheten att båda A och C inträffar, d.v.s. P(A och C). d) Beräkna sannolikheten att åtminstone en av A och C inträffar, d.v.s. P(A eller C). e) Beräkna sannolikheten att C inte inträffar 11 (3 poäng) Prisökningarna på konsumtionsvaror i ett litet land var enligt följande tabell. 2001 2 % 2002 2,5 % 2003 3,5 % 2004-0,5 % 2005 3 % a) Beräkna ett kedjeindex med 2000 som basår b) Metallarbetarna i det här landet tjänade år 2000 i genomsnitt 22 000 per månad. År 2005 tjänade de i genomsnitt 28 000 per månad, hur stor var reallöneökningen i 2000 år penningvärde?
12. (10 poäng) Den här uppgiften är baserad på data över Sveriges kommuner från SCB. Variabelförteckning: A_03 Folkmängd, antal personer A_04 Folkökning, antal personer A_08 Antal invånare per kvadratkilometer D_02 Öppen arbetslöshet, procent av arbetskraften D_10 Totalt antal arbetslösa, procent av arbetskraften F_01 medelinkomst, tkr (Inkomst av tjänst) F_01kv medelinkomst, tkr (Inkomst av tjänst) upphöjt till 2 Baserat på denna data har jag gjort två olika regressionsmodeller som försöker förklara arbetslösheten i de svenska kommunerna. Båda modellerna har samma oberoende variabler men använder olika arbetslöshetsmått som beroende variabel. Besvara frågorna nedan med hjälp av datautskrifterna på nästa sida. a) (5p) Rapportera och tolka regressionskoefficienterna och deras p-värden från båda modellerna. Använd 5 % signifikansnivå. b) (1p) Diskutera om någon av de oberoende variablerna kan vara beroende på arbetslösheten. Hur skulle det i så fall påverka tolkningarna du gjorde i a-uppgiften? c) (1p) Tolka den justerade förklaringsgraden i båda modellerna d) (2p) Beräkna ett 95 % konfidensintervall för regressionskoefficienten till A_08 i model 1 och tolka innebörden av intervallet. e) (1p) Beräkna det predikterade värdet för den öppna arbetslösheten i en kommun där folkmängden är 120 000, folkökningen 3 000, där det bor 120 personer per kvadratmeter och medelinkomsten är 195 000 kr.
Modell 1 Modell 2
Svarsblanket för multiple choice frågor (Riv av denna sida och lämna in tillsammans med dina lösningar) Fråga nr a b c d 1 2 3 4 5 6