Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841 33-6 39,5641 36-3 10,8241 37-2 5,2441 42 3 7,3441 47 8 59,4441 51 12 137,1241 39,29 60,90 s = 60,90 = 7,80 sk = 3(X Median) s = 3(39,29 37) 7,80 = 1,07
8 A) F59, ordinalskala, kvalitativ variabel där utfallen har en ordningsföljd F61 nominalskala då det är en kvalitativ variabel som inte kan rangordnas. Men om man anser att den som inte arbetar eller studerar har en kortare resväg än den som arbetar i hemkommun kan man möjligen argumentera för ordinalskala och rangordna utifrån resvägens längd. F61_km kvotskala, här har vi riktiga siffror. Vi vet den exakta skillnaden mellan två respondenters svar och 0 km betyder att man inte reser. F61_min kvotskala, här har vi riktiga siffror. Vi vet den exakta skillnaden mellan två respondenters svar och 0 minuter betyder att man inte reser. F66 nominalskala då det är en kvalitativ variabel som inte kan rangordnas. F67 nominalskala då det är en kvalitativ variabel som inte kan rangordnas. B) Här handlar det om att jämföra 4 grupper och variabeln vi jämför har kvotskala. En hypotestest skulle då vara Anova testen med följande hypoteser: H 0 : Alla fyra grupperna har samma medelvärde på resväg i km. H 1 : Minst en av grupperna har ett medelvärde som avviker. Om p-värdet är lägre än signifikansnivån förkastas nollhypotesen och slutsatsen blir att minst ett medelvärde avviker Testen bör kombineras med konfidensintervall för vart och ett av medelvärdena fr att se vilket som avviker. C) Här ska vi jämföra två grupper och variabeln vi ska jämföra har ordinalskala Wilcoxons rangsummetest H 0 : föräldrar upplever lika stor risk att bli arbetslös som personer utan barn upplever. H 1 : föräldrar upplever inte lika stor risk att bli arbetslös som personer utan barn upplever. Utfallen på variabeln räknas om till rangtal. För varje grupp beräknas en rangsumma, rangsumman för ena gruppen stoppas in i formeln för Wilcoxons rangsummetest och z beräknas. Om z är större än det positiva kritiska värdet eller mindre än det negativa kritiska värdet förkastas nollhypotesen. Slutsatsen blir då att den upplevda risken skiljer sig åt mellan grupperna. Medianerna avgör vilken grupp som upplever störst risk och vilken slutsats vi drar.
9 Wilcoxons teckenrangtest: H 0 : Svenskarna dricker alkohol lika ofta som de motionerar H 1 : Svenskarna dricker inte alkohol lika ofta som de motionerar Kritiskt värde: 10 Beslutsregel: förkasta H0 om teststatistikans värde är lägre än 10 Ta bort alla som är lika beräkna där efter följande tabell: Druckit alkohol abs diff rang + - 6 1 5 5 9,5 9,5 1 4-3 3 8 8 5 3 2 2 6 6 7 6 1 1 2,5 2,5 6 1 5 5 9,5 9,5 6 5 1 1 2,5 2,5 7 6 1 1 2,5 2,5 6 4 2 2 6 6 7 1 6 6 11 11 6 4 2 2 6 6 6 5 1 1 2,5 2,5 motionerat Teststatistikans värde är 8 Eftersom 8<10 kan vi förkasta nollhypotesen. Vi drar slutsatsen att svenskarna motionerar oftare än vad de dricker alkohol. 58 8 Teckentest: H 0 : Andelen som tränar oftare än de dricker alkohol är lika med 0,5 H 1 : Andelen som tränar oftare än de dricker alkohol är inte lika med 0,5 Kritiskt värde:1,96 Beslutsregel: förkasta H0 om teststatistikans värde överstiger 1,96 eller är lägre än minus 1,96 z = (X±0.50) 0.50n 0.50 n = (1+0.50) 0.5 11 0.50 11 = 2,41 alt: z = (X±0.50) 0.50n 0.50 n = (10 0.50) 0.5 11 0.50 11 = 2,41 Eftersom 2,41 > 1,96 förkastar vi nollhypotesen. Vi drar slutsatsen att svenskarna motionerar oftare än vad de dricker alkohol.
10 a) A och B är oberoende eftersom sannolikheten för A inte ändras om B inträffar och vice versa P(A) = P(A B) och P(A) = P(B A) b) B och C är beroende eftersom sannolikheten för B ändras om C inträffar och vice versa P(B) P(B C) och P(C) P(C B) c) P(A och C) = P(A) P(C A) = 0,8 0,6 = 0,48 d) P(A eller C) = P(A) + P(C) P(A och C) = 0,8 + 0,6 0,48 = 0,92 e) 1 0,6 = 0,4 11 År inflation KPI 2000 100,0 2001 2,0% 102,0 2002 2,5% 104,6 2003 3,5% 108,2 2004-0,5% 107,7 2005 3,0% 110,9 Reallön 2005 = 28 000 110,9 100 = 25 248 Real löneökning = 25 248 22 000 = 3 248
12 a) Modell 1 Interceptet tolkas ej då det inte finns någon kommun som har noll på alla oberoende variabler. Koefficienterna för folkmängd och folkökning är inte signifikanta då p-värdena överstiger 5 % Koefficienten för antal invånare per kvadratmeter är signifikant eftersom p-värdet 0,002 är mindre än 5 %. Koefficienten för antal invånare per kvadratmeter är 0,000496. Tolkas som att om antal invånare ökar med en person per kvadratmeter ökar den öppna arbetslösheten med 0,000496 procentenheter givet oförändrade värden på övriga oberoende variabler. Vi har ett icke linjärt samband mellan medelinkomst och öppna arbetslösheten. Y = 0,0919 + 0,00028X X När medelinkomsten är låg bidrar en ökning av inkomsten att den öppna arbetslösheten minskar, men allteftersom inkomsterna stiger blir den effekten mindre och mindre vid riktigt höga inkomster kommer en ökad inkomst att ge en ökad arbetslöshet. Modell 2 Interceptet tolkas ej då det inte finns någon kommun som har noll på alla oberoende variabler. Koefficienten för folkmängd är signifikant eftersom p-värdet 0,018 är mindre än 5 %. Koefficienten för folkmängd är 0,000023. Tolkas som att om folkmängden ökar med en person ökar den totala arbetslösheten med 0,000023 procentenheter givet oförändrade värden på övriga oberoende variabler. Koefficienterna för folkökning och invånare per kvadratkilometer är inte signifikanta då p-värdena överstiger 5 %. Vi har ett icke linjärt samband mellan medelinkomst och öppna arbetslösheten. Y = 0,21 + 0,00059X X När medelinkomsten är låg bidrar en ökning av inkomsten att den öppna arbetslösheten minskar, men allteftersom inkomsterna stiger blir den effekten mindre och mindre vid riktigt höga inkomster kommer en ökad inkomst att ge en ökad arbetslöshet. b) Man kan diskutera sådant som att om folk flyttar till kommuner med låg arbetslöshet kan folkmängd, folkökning och invånare per kvadratkilometer påverkas av arbetslösheten. Om arbetslösheten stiger bör medelinkomsten sjunka.
c) modell 1 förklarar 32 procent av variansen i öppen arbetslöshet modell 2 förklarar 38 procent av variansen i total arbetslöshet d) b ± t s b 0,000496 ± 1,96 0,000162 0,000496 ± 0,00032 0,00018 < β < 0,00082 Med 95 % säkerhets är koefficientens sanna värde i intervallet mellan 0,00018 och 0,00082. Om antalet personer per kvadratmeter ökar med en person per kvadratmeter kommer således ökningen av arbetslösheten att ligga mellan 0,00018 och 0,00082 procentenheter. e) 15,95 + 0,0000034 120 000 0,000029 3000 + 0,000496 120 0,092 195 + 0,00014 195 2 = 3,87 Svar i en sådan kommun skulle det predikterade värdet för arbetslösheten vara 3,87 procent. Det var ett tryckfel i frågan. Meningen var att det skulle stå 120 personer per kvadratkilometer. 120 personer per kvadratmeter skulle vara alldeles orealistiskt. Då måste kommunen i princip bestå av en enda skyskrapa om ca 1 000 våningar. Pga av detta tryckfel måste vi dock ge rätt även åt arbetslöshetssiffran 60 000 % vilken givetvis är fullständigt orealistisk.