MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 10 e januari 2017 Ten 1, 9 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar. Numrera bladen och sortera dem i ordning.
1. (1 poäng) Vilken av följande fördelningar är en uniform fördelning a) b) c) d) 2. (1 poäng) Vilket påstående är sant om följande fördelning a) Fördelningen är diskret och medianen är större än medelvärdet b) Fördelningen är kontinuerlig och medianen är större än medelvärdet c) Fördelningen är diskret och medianen är mindre än medelvärdet d) Fördelningen är kontinuerlig och medianen är mindre än medelvärdet 3. (1 poäng) Antag att du kastar en tärning 10 gånger och räknar antalet sexor. Antalet sexor blir då en slumpvariabel. Vad kallas den fördelning som denna slumpvariabel har? a) Normalfördelning. b) Hypergeometrisk fördelning. c) Binomialfördelning. d) Uniform fördelning.
4. (1 poäng) Antag att du drar 5 kort ur en kortlek och räknar antalet hjärter. Antalet hjärter blir då en slumpvariabel. Vad kallas den fördelning som denna slumpvariabel har? a) Normalfördelning. b) Hypergeometrisk fördelning. c) Binomialfördelning. d) Uniform fördelning. 5. (1 poäng) Vilket av följande påståenden är falskt? a) Histogram är lämpligt för en variabel mätta på kvotskala b) Man kan inte beräkna medelvärdet på en kvalitativ variabel. c) Variabler mätta på nominalskala kan användas som beroende variabel i en enkel linjär regressionsanalys d) Genom att konstruera dummyvariabler kan man använda variabler mätta på nominalskala som oberoende variabler i en enkel linjär regressionsanalys. 6. (4 poäng) Ett urval av 7 stycken fotbollstränare har följande åldrar: 23, 29, 33, 34, 37, 45, 51 Beräkna följande mått: a) Första kvartilen b) Medelvärde c) Standardavvikelse d) Varians 7. (3 poäng) Antag att innehållet i en 5 kg förpackning med potatis är en kontinuerlig slumpvariabel som är uniformt fördelad mellan 4,95 och 5,11 kg. Vad är medelvärdet för förpackningarnas vikt? Vad är standardavvikelsen för vikten? Vad är sannolikheten att en slumpvist vald potatispåse väger mindre än 5 kilo?
8. (6 poäng) Nedan visas ett urval av frågorna i en enkätundersökning om vad människor önskar/söker hos en partner. Källa: Abusagr, Leila & Božić, Milica, Kommande C-uppsats vid Mälardalens högskola. Utifrån enkätfrågorna ovan skapas följande variabler: Kön Ålder Relationsstatus Ekonomi vikt_attraktivitet vikt_snäll vikt_ekonomi. a) Ange för var och en av variablerna vilken skala den mäts på. b) Antag att man vill undersöka skillnader mellan kvinnor och män i hur pass viktig de anser att partnerns fysiska attraktivitet är. Föreslå en lämplig test. Formulera hypoteserna, ange vilka variabler som används och förklara kort hur testen går till. c) Antag att man vill undersöka vilka av aspekterna fysisk attraktivitet och snällhet som människor anser är viktigast hos en partner. Föreslå en lämplig test. Formulera hypoteserna, ange vilka variabler som används och förklara kort hur testen går till.
9. (10 poäng) I en urvalsundersökning baserad på 250 stycken personer tillfrågades respondenterna bl a om kön och i vilket mobiltelefonsmärke de använde. Baserat på dessa båda frågor skapades följande korstabell.(obs siffrorna är påhittade) Män Kvinnor Totalt Iphone 32 50 82 Samsung 43 35 78 Huawei 20 8 28 Annan 33 29 62 Totalt 128 122 250 a) Beräkna tre olika korstabeller med relativa frekvenser.(2p) b) Beräkna sannolikheten att en slumpvist utvald person från detta urval är en kvinna som har en Iphone. (1p) c) Beräkna och tolka ett 95 % konfidensintervall för andelen som använder Huawei i hela populationen svenska mobiltelefonsanvändare. (2p) d) Finns det ett samband mellan kön och vilket telefonmärke man använder, i hela populationen svenska mobiltelefonsanvändare? Utför en lämplig statistisk test. Använd 5 % signifikansnivå. Ange nollhypotes och mothypotes. Ange teststatistika och beräkna den. Vad är det kritiska värdet? Kan du dra någon slutsats från testen? Förklara i så fall vilken. (5p) 10. (2 poäng) Tabellen nedan anger pris och kvantitet för tre olika produkter vid två olika år. År 1 År 2 Pris (kr/kg) Kvantitet (ton) Pris (kr/kg) Kvantitet (ton) Äpplen 19 45 24 37 Apelsiner 23 21 25 16 Bananer 28 35 22 40 a) Beräkna Laspeyres pris index b) Beräkna Paasches pris index
11. (10 poäng) Den här uppgiften är baserad på data över Sveriges kommuner från SCB och brottsförebyggande rådet. Variabelförteckning: A_06 B_08 E_01p F_01 Antal personer boende i kommunen som är födda utomlands per 1000 invånare Genomsnittlig bostadsarea per person, kvadratmeter Procentuell andel av befolkningen med minst tre års eftergymnasial utbildning medelinkomst, tkr (Inkomst av tjänst) Log i slutet av variabelnamnet betyder att variabeln är loggad (10 logaritm) Kv i slutet av variabelnamnet betyder att variabeln är upphöjd i två. Besvara frågorna nedan med hjälp av datautskrifterna på nästa sida. a) (5p) Rapportera och tolka regressionskoefficienterna och deras p-värden från båda modellerna. Använd 5 % signifikansnivå. b) (1p) Tolka den justerade förklaringsgraden i båda modellerna c) (2p) Beräkna ett 95 % konfidensintervall för regressionskoefficienten till A_06log och tolka innebörden av intervallet. d) (1p) Beräkna det predikterade värdet enligt modell 1 för boytan i kvadratmeter per person i en kommun där 15 personer per tusen invånare är utrikes födda, 23 procent av invånarna har minst tre års eftergymnasial utbildning och medelinkomsten är 245 tusen. e) (1p) Diskutera fördelar och nackdelar med de båda modellerna.
Modell 1 Modell 2
Svarsblanket för multiple choice frågor (Riv av denna sida och lämna in tillsammans med dina lösningar) Fråga nr a B c d 1 2 3 4 5