MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 HP Ten1 9 HP 19 e augusti 2015 Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar. Numrera bladen och sortera dem i ordning.
1. 7 poäng Nedan visas ett utdrag ur en enkätundersökning om träningsvanor. 1. Vilket är din huvudsakliga sysselsättning: Student Arbetar Arbetslös Övrigt 2. Ålder År 3. Kön Man Kvinna 4. Hur ofta tränar du styrketräning? 5. Hur ofta tränar du löpning? Mycket ofta (1) Mycket sällan/aldrig (7) 1 2 3 4 5 6 7 Mycket ofta (1) Mycket sällan/aldrig (7) 1 2 3 4 5 6 7 Utifrån svaren skapas 5 variabler: F1(Sysselsättning), F2 (Ålder), F3 (Kön), F4 styrketräning), F5 (löpträning). Fråga 1 kodas genom att numrera svarsalternativen från 1 till 4 (uppifrån och ned), fråga 3 med 1 för man och 2 för kvinna och fråga 4 och 5 med svarsalternativen från 1 till 7. a) (2p) Ange på vilken skala var och en av variablerna mäts. Motivera varför. b) (2p) Antag att man vill undersöka om män styrketränar oftare än kvinnor. Föreslå en lämplig statistisk test, ange nollhypotes och mothypotes samt beskriv kort hur testet utförs. Ange vilka variabler du använder. c) (2p) Antag att man vill undersöka vilken av träningsformerna löpning och styrketräning som befolkningen oftast utövar. Föreslå en lämplig statistisk test, ange nollhypotes och mothypotes samt beskriv kort hur testet utförs. Ange vilka variabler du använder. d) (1p) Diskutera en alternativ utformning av fråga 4 och 5 som skulle göra det möjligt att använda andra typer av statistiska test. 2. (3 Poäng) Ett urval av 7 stycken fotbollstränare har följande åldrar: 25, 27, 33, 34, 37, 40, 51 Beräkna följande mått: a) Median b) Medelvärde c) Standardavvikelse
3. (3 Poäng) Figuren nedan beskriver den totala arbetslösheten i Sveriges kommuner som procent av arbetskraften i kommunen. a) Vad kallas diagramtypen? b) Hur stort är kvartilavståndet ungefär? c) Ange ett ungefärligt värde för den första kvartilen. d) Kan man avläsa medelvärdet från den här grafen? Hur stort är det i så fall? e) Kan man avläsa medianen från den här grafen? Hur stor är den i så fall? f) Ge ett exempel på ett annat diagram som kunde ha använts för att visa arbetslöshetens fördelning. 4. (4 poäng) En urna innehåller 11 kulor. Av dessa är 5 vita och 6 svarta. Du drar slumpmässigt 4 kulor ur urnan. a) Vad är sannolikheten att exakt 2 av kulorna är vita om du lägger tillbaka kulorna mellan varje dragning? b) Vad är sannolikheten att exakt 2 av kulorna är vita om du inte lägger tillbaka dem mellan varje dragning?
5. (2 poäng) Tabellen nedan anger skörden av höstvete i Sverige i antal ton. 2010 2011 2012 2013 2014 Höstvete 1 873 100 1 965 800 1 933 800 1 319 000 2 750 800 Beräkna en indexserie över höstveteskörden med 2010 som basår. 6. (5 poäng) Svenska kvinnor ägnar i genomsnitt 4 timmar per dag åt hemarbete. Pelle tror att kvinnor på landsbygden ägnar mer än 4 timmar per dag åt hemarbete. Han gör därför en urvalsundersökning där han frågar 25 slumpvis utvalda kvinnor boende på landsbygden om hur många timmar per dag de ägnar åt hemarbete. Medelvärdet i hans urval blev 4,25 timmar med standardavvikelsen 1 timme. Pelle använder 5 % signifikansnivå och drar slutsatsen att även kvinnor på landsbygden ägnar 4 timmar åt hemarbete. Utför hypotestesten och ange om det finns skäl att kritisera Pelles slutsats. 7. (3 poäng) Ett företag som tillverkar äppeljuice använder en maskin som automatiskt fyller flaskor som ska innehålla 7,5 dl. Det är dock viss variation i mängden äppeljuice i flaskorna. Mängden äppeljuice är normalfördelad med medelvärdet 7,55 dl och standardavvikelsen 0,1 dl. a) Vad är sannolikheten att en slumpmässigt vald flaska innehåller mindre än 7,5 dl äppeljuice? b) Vad är sannolikheten att ett slumpmässigt urval om 5 flaskor har ett medelvärde som understiger 7,5 dl? 8. (3 poäng) Förklara följande begrepp a. Obundet slumpmässigt urval b. Stratifierat slumpmässigt urval c. Bekvämlighetsurval
9. 10 poäng Vilka faktorer påverkar antalet våldsbrott I svenska kommuner? För att besvara den frågan samlades data in från samtliga svenska kommuner. Samtliga variabler avser 2014 Variabelförteckning: Våldsbrott per tusen invånare Total arbetslöshet % Arbetslösa i åtgärder % Utrikes födda per tusen invånare Folkmängd 1000 personer Antal anmälda våldsbrott per tusen invånare i kommunen. Summan av öppet arbetslösa samt arbetslösa i åtgärder som procent av arbetskraften i kommunen. Arbetslösa i arbetsmarknadspolitiska åtgärder som procent av arbetskraften i kommunen. Antal personer som inte är födda i Sverige per tusen invånare I kommunen Kommunens folkmängd i tusental Källor: Arbetslöshet: Arbetsförmedlingen Våldsbrott: Brottsförebyggande rådet Övrigt: SCB På följande sida finns resultat från SPSS från två olika regressionsmodeller baserade på ovanstående data. Besvara följande frågor med hjälp av regressionsresultaten. a) (4p) Tolka regressionskoefficienterna och deras p-värden från bägge modellerna. Använd 5 % signifikansnivå. b) (1p) Hur kommer det sig att regressionskoefficienten för arbetslösa i åtgärder får olika tecken i de båda modellerna? c) (1p) Finns det några skäl att misstänka att det kan finnas kausala samband från den beroende variabeln till någon eller några av de oberoende variablerna? Hur påverkar det i så fall dina tolkningar av regressionskoefficienten? d) (1p) Beräkna ett 95 % konfidensintervall för den totala arbetslöshetens påverkan på antalet våldsbrott enligt modell 2. e) (1p) Hur många kommuner finns det i datamaterialet? f) (2p) Beräkna det predikterade värdet för antalet våldsbrott enligt modell 1 i en kommun med 100 000 invånare varav 2 500 är utrikes födda och där 3 % av arbetskraften är arbetslösa i åtgärder.
Modell 1
Modell 2