1a) F1 och F3 nominalskala, enbart olika saker F kvotskala, Riktiga siffror, 0 betyder att man inte finns och avståndet mellan två värden är exakt definierat F4 och F5 ordinalskala, vi kan ordna svaren i ordning men inte fastställa avståndet mellan dem. 1b) Eftersom styrketräning är ordinalskala kan vi inte använda t-testen. Wilcoxons rangsummetest är lämplig eftersom vi jämför två grupper. Nollhypotesen är att män tränar lika mycket som kvinnor och mothypotesen att det skiljer sig åt. (alternativt använder man en nollhypotes om att kön och styrketräning är oberoende variabler och en mothypotes om att de är beroende. Om styrketräning beror av kön måste män och kvinnor träna olika mycket). All värden görs om till rangtal för gruppen som helhet. Därefter sorterar vi rangtalen efter män och kvinnor och beräknar rangsumman i ena gruppen. En z-fördelad teststatistika kan sedan beräknas enligt: z = W n 1(n1+n+1) n 1n (n 1+n+1) 1 Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c) Eftersom vi ska jämföra viken variabel som är störst av två variabler mätta på ordinalskala använder vi Wilcoxons teckenrangtest. Nollhypotesen är att befolkningen styrketränar lika ofta som de löptränar, mothypotesen att de skiljer sig åt. Vi beräknar skillnaden mellan F4 och F5 för varje individ och rangordnar sedan dessa skillnader. Rangtalen sorteras efter om skillnaden är positiv eller negativ. Rangsumman beräknas dels för de positiva differenserna och dels för de negativa. Den minsta rangsumman används som teststatistika och nollhypotesen förkastas om teststatistikan är lägre än det kritiska värdet. 1d) Om vi specificerat svaren som antal gånger per vecka skulle vi fått kvotskala och kunnat använda t- test. Då skulle frågan också varit tydligare för respondenterna. Nu kan det vara svårt att avtöra vad som menas med ofta. Median:34 Medelvärde: 35,3 Standardavvikelse: 8,69 3 a) Boxplot b) 3-4 procentenheter c) Strax under 6% d) Nej e) Ja mellan 7% och 8% f) Histogram eller frekvenspolygon.
4 a) x x nx 1 n C x 4 C 0,4545 0,5455 60,066 0,975 0, 3688 4 b) x S Cx N S Cnx C N n 5C 6C C 11 4 10 15 0,4545 330 5 år ton index 010 1 873 100 100,0 011 1 965 800 104,9 01 1 933 800 103, 013 1 319 000 70,4 014 750 800 146,9 6 H 0 : μ 4 H 1 : μ > 4 t = X μ s n Beslutsregel: förkasta H 0 om teststatistikan är större än det kritiska värdet 1,711 t = 4,5 4 = 0,5 = 1,5 0, 1 5 Eftersom 1,15 är mindre än 1,711 kan vi inte förkasta H 0 och kan därför inte dra några slutsatser. Felet som elle gör är således att han drar slutsatsen att medelvärdet är 4 vilket han inte kan göra.
7a z = 7,5 7,55 0,1 = 0,5 (X <7,5) = (z < -0,5) = (z > 0,5) = 0,5 - (0 < z < 0,5) = 0,5-0,1915 = 0,3085 Sannolikheten är 0,3 att få en flaska som innehåller mindre än 7,5 dl 7b σ x = σ n = 0,1 5 0,0447 z = 7,5 7,55 0,0447 = 1,118 (X <7,5) = (z < -1,1) = (z > 1,1) = 0,5 - (0 < z < 1,1) = 0,5-0,3686 = 0,1314 Sannolikheten att fem slumpmässigt valda flaskor har ett medelvärde som understiger 7,5 är 0,13. 8 se kurslitteraturen
9 a Modell 1 Samtliga regressionskoefficienter är signifikanta eftersom alla p värden är under 0,05 Internetet tolkas inte eftersom folkmängden aldrig är noll. Koefficienten 0,597 för arbetslösa i åtgärder tolkas som att om antalet arbetslösa i åtgärder ökar med en procentenhet ökar antalet våldsbrott med 0,597 brott per tusen invånare, givet oförändrade värden Koefficienten 0,03 för utrikes födda tolkas som att om antalet utrikes födda ökar med en person per tusen invånare ökar antalet våldsbrott med 0,03 brott per tusen invånare, givet oförändrade värden Koefficienten 0,008 för folkmängd tolkas som att om folkmängden ökar med en tusen personer ökar antalet våldsbrott med 0,008 brott per tusen invånare, givet oförändrade värden på övriga oberoende variabler. Modell Samtliga regressionskoefficienter är signifikanta eftersom alla p värden är under 0,05 Internetet tolkas inte eftersom folkmängden aldrig är noll. Koefficienten 1,407 för total arbetslöshet tolkas som att om antalet arbetslösa ökar med en procentenhet ökar antalet våldsbrott med 1,407 brott per tusen invånare, givet oförändrade värden Koefficienten 0,011 för utrikes födda tolkas som att om antalet utrikes födda ökar med en person per tusen invånare ökar antalet våldsbrott med 0,011 brott per tusen invånare, givet oförändrade värden Koefficienten -1,371 för arbetslösa i åtgärder tolkas som att om antalet arbetslösa i åtgärder ökar med en procentenhet minskar antalet våldsbrott med 1,371 brott per tusen invånare, givet oförändrade värden Koefficienten 0,007 för folkmängd tolkas som att om folkmängden ökar med en tusen personer ökar antalet våldsbrott med 0,007 brott per tusen invånare, givet oförändrade värden på övriga oberoende variabler. 9b I modell ett finns inte total arbetslöshet med. Förmodligen finns det många arbetslösa i åtgärder i kommuner med hög total arbetslöshet, så denna regressionskoefficient talar om för oss att antalet våldsbrott är högre i kommuner med hög arbetslöshet. I modell två när total arbetslöshet finns med säger regressionskoefficienten att givet oförändrad total arbetslöshet så sjunker antalet våldsbrott om fler av de arbetslösa har en arbetsmarknadspolitisk åtgärd. Denna koefficient ska ju tolkas givet oförändrade värden på övriga oberoende variabler och därmed också givet en oförändrad total arbetslöshet.
9c Exempel på vad som kan diskuteras här: Om det är så att antalet våldsbrott påverkar viljan att för företag att investera och skapa arbetstillfällen kan antalet våldsbrott påverka arbetslösheten. Om det är mindre attraktivt att bo i områden med hög brottslighet kanske rika människors som har möjlighet att flytta därifrån söker sig till andra områden. Om utrikes födda generellt har lägre inkomster kanske det är de som blir kvar i områden med hög arbetslöshet. 9d b ± t s b 1,407 ± 1,96 0,34 1,407 ± 0,45864 Regressionskoefficienten ligger med 95 % säkerhet i intervallet 0,95 till 1,87 9e 90 (eftersom n-1 är 89) 9f Y = 3,10 + 0,597 3 + 0,03 5 + 0,008 100 = 6,0 6 våldsbrott per 100 invånare vilket innebär 600 våldsbrott eftersom kommunen har 100 000 invånare.