MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 12 e januari 2016 Ten 1, 9 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar. Numrera bladen och sortera dem i ordning.
Nedan visas ett urval av frågorna i en enkätundersökning om ungdomars erfarenhet av våld. källa: Alnehill, Inger: Jag söker inte hjälp, mina kompisar slåss för mig, C-uppsats, Socionomprogrammet, Göteborgs universitet.
1. 6 poäng Använd enkätfrågorna på föregående sida för att besvara följande frågor: a) Ange och motivera skaltyp för var och en av variablerna som kommer att skapas från svaren till frågorna 1-6. (2p) b) Antag att man vill undersöka ifall ungdomarna i hela populationen känner sig tryggare i skolan än på fritiden. Föreslå en lämplig testmetod. Ange vilka variabler som används och hur hypoteserna bör formuleras. Förklara kort hur testet utförs. (2 p) c) Antag att man vill undersöka om det finns något samband mellan ungdomarnas ålder och hur trygga de känner sig i skolan. Föreslå en lämplig testmetod. Ange vilka variabler som används och hur hypoteserna bör formuleras. Förklara kort hur testet utförs. (2 p) 2. 2 poäng a) b) c) d) a) Vilken av ovanstående fördelningar är en uniform fördelning. b) Vilken av ovanstående fördelningar är en diskret fördelning. 3. 3 poäng Ett urval av 17 stycken gymnasielärare har följande månadslöner. 22 300 28 200 31 200 23 200 29 500 31 300 24 300 29 700 32 000 25 600 30 100 33 500 27 500 30 500 35 000 28 100 31 000 a) Beräkna kvartilerna. b) Beräkna kvartilavståndet.
4 3 poäng Förklara följande begrepp: 1) Statistisk felmarginal 2) Deflatera 3) Signifikansnivå 5 6 poäng 10 % av kunderna vid en viss hamburgerrestaurang beställer morötter. Man väljer slumpmässigt ut 20 kunder och räknar antalet av dessa kunder som beställt morötter. Låt oss definiera slumpvariabeln X som antalet kunder i detta urval som beställt morötter. a) Vad kalls den fördelning som slumpvariabeln X har? b) Beräkna medelvärde och standardavvikelse för X. c) Beräkna sannolikheten att exakt 3 av de 20 kunderna beställt morötter. d) Beräkna sannolikheten att ingen av 20 kunderna beställt morötter. 6 3 poäng Tabellen nedan anger storleken på bidragsdelen i studiemedlen samt Sveriges inflationstakt under perioden 2007 till 2011. År Studiemedlens bidragsdel Inflationstakt 2007 25 280 2,21 % 2008 25 720 3,48 % 2009 26 840-0,32 % 2010 26 960 1,27 % 2011 27 200 2,63 % Källa: Studiemedlens bidragsdel; SCN, Inflationstakten, SCB. a) Beräkna KPI som en kedjeindex med 2007 som basår. b) Beräkna studiemedlets bidragsdel 2011, i 2007 års penningvärde. c) Beräkna den reala förändringen av studiemedlens bidragsdel från 2007 till 2011 och ange om det är en ökning eller minskning.
7 6 poäng De två närbelägna städerna Öreås och Västerbro tvistar om i vilken stad som invånarna är bäst på att lösa korsord. Man drar ett slumpmässigt urval om 30 personer från vardera staden som fick lösa ett identiskt korsord och mätte hur lång tid det tog. I urvalet från Öreås hade de 30 personerna ett medelvärde av 20 minuter med standardavvikelsen 2 minuter. I Västerbro var medelvärdet 19 minuter med standardavvikelsen 5 minuter. Gör en lämplig hypotestest för att testa om den genomsnittliga tiden det tar att lösa detta korsord är lika eller skiljer sig åt mellan de två städerna. Ange nollhypotes och mothypotes, ange vilken teststatistika du använder och vad den har för kritiskt värde i det här fallet. Beräkna värdet på teststatistikan och redogör för vilka slutsatser vi kan dra från denna test. Använd 5 % signifikansnivå. 8 2 poäng Nedan visas ett utdrag ur en enkätundersökning Deskriptiv statistik från frågorna A och H visas nedan: Nedan visas en annan utskrift från en statistisk test utförd i R Commander. Förklara vilka slutsatser vi kan dra från dessa datautskrifter.
9. 10 poäng I Örebro höjer den politiska majoriteten skatten med motiveringen att den kraftiga befolkningstillväxten ger så stora kostnader för nyinvesteringar i infrastruktur. Oppositionen tycker att argumentet är märkligt eftersom glesbygdskommuner med minskande befolkning och därmed minskande skatteunderlag brukar ha utflyttningen som argument för skattehöjningar. Hur påverkas svenska kommuners kostnader av befolkningstillväxten? För att försöka undersöka det gjorde jag 2 regressionsmodeller baserade på data om svenska kommuner från SCB s statistikdatabas. På nästa sida visas utskrifter från R Commander på dessa båda regressioner. Besvara följande frågor baserat på regressionsresultaten. a) (5p) Rapportera och tolka regressionskoefficienterna och deras p-värden från båda modellerna. Använd 5 % signifikansnivå. b) (1p) Förklara skillnaden mellan modellerna och diskutera vilken av modellerna som är bäst lämpad för att besvara frågeställningen om inflyttning och kommunernas kostnader. c) (1p) Tolka den justerade förklaringsgraden i båda modellerna d) (1p) Beräkna ett 95 % konfidensintervall för medianinkomstens påverkan på kostnad per person e) (2p) Beräkna det predikterade värdet på kostnad per person i en kommun med 35 000 invånare, 10 nyinflyttade per tusen invånare, 5 % öppen arbetslöshet och en medianinkomst på 220 000 kr.
Variabelförteckning: G_06tot G_06pcap A_03 A_04 A_04ptus D_01 D_02 F_01 Kommunens totala kostnader i tusen kr. Kommunens kostnader per invånare kr. Folkmängd, antal personer Folkökning, antal personer Folkökning, antal personer per tusen invånare Antal arbetslösa arbetslöshet, procent av arbetskraften. medianinkomst, tkr