1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen entydig ordningsföljd, svårt att avgöra vilket som är bäst och sämst av de tre första alternativen som alla leder till att idén genomförs) F3 Ordinalskala (entydig ordningsföljd) F4 Nominalskala (ingen speciell ordningsföljd) b) Öppna frågor ger större möjlighet för respondenten att helt få fram sina åsikter, och kan ge tankar som forskaren själv inte tänkt på, slutna frågor är enklare att analysera med kvantitativa metoder. 2. a) 27 800 b) 24 800 c) 5 200 (30 000-24 800) d) 52 000 (75 000-23 000) 3. a) utfallet på den ena variabeln påverkar inte sannolikheten för de olika utfallen på den andra. (De betingade sannolikheterna är då lika med de obetingade sannolikheterna) b) En variabel där utfallen är en siffra. Enbart vissa värden är möjliga, det vanliga är att den inte kan anta decimaltal utan enbart heltal. c) En sannolikhetsfördelning som uppkommer om man gör ett urval ur en population och räknar antalet i urvalet som har en viss egenskap. 4. 2009 2010 2011 2012 import totalt, mkr 911 300 1 069 200 1 147 900 1 109 400 index 85,23 100,00 107,36 103,76 (Dividera alla siffror med 1 069 200 och multiplicera med hundra)
5. a) z = 500 505 = 2,5 2 P(X < 500) = P(z < 2,5) = P(z > 2,5) = 0,5 P(0 < z < 2,5) = 0,5 0,4938 = 0,0062 b) Medelvärdets sannolikhetsfördelning har samma medelvärde som ursprungspopulationen men standardavvikelsen är lika med: σ x = σ n = 2 5 = 0,8944 500 505 z = 0,8944 = 5,59 P(X < 500) = P(z < 5,59) = P(z > 5,59) Sannolikheten att z är större än 5,59 är så liten att vi inte ens kan hitta den i tabellen. 6. Ja A och B är beroende. Sannolikheten att A inträffar är lägre om vi vet att B har inträffat. Den betingade sannolikheten för A givet B är bara 0,2 medan den obetingade sannolikheten för A är 0,3. Sannolikheten för A påverkas av om B inträffar. Nej A och C är oberoende. Sannolikheten för A är samma oavsett om C inträffar eller ej. (Och sannolikheten för C är samma oavsett om A inträffar eller ej. P(A och B) = P(A) P(B A) = 0,3 0,2 = 0,06 P(A eller B) = P(A) + P(B) P(A och B) = 0,3 + 0,3 0,06 = 0,54
7. a) Hypotestest av medelvärden från två olika populationer för att se om medelvärdet för ökningen i hjärtfrekvens avviker mellan de två grupperna. Detta test behöver ni inte utföra men skulle man göra det så blir det enligt följande: H 0 : μ 1 = μ 2 H 1 : μ 1 μ 2 Teststatistika: t = X 1 X 2 Frihetsgrader: df = s 1 2 n1 + s 2 2 n2 ( s 1 2 n1 + s 2 2 n2 ) 2 ( s 1 2 2 n1 ) s 2 2 ( n1 1 + n2 ) n2 1 2 = (92 40 +102 40 ) ( 92 2 40 ) 10 ( 2 2 40 1 + 40 ) 40 1 = (81 40 +100 40 )2 = (4,525)2 ( 81 40 )2 100 39 +( 40 )2 (2,025) 2 + (2,5)2 39 39 39 Kritiskt värde1,991 (dubbelsidigt test 5 % signifikansnivå) t = 7 17 4,525 = 10 2,13 = 4,7 = 20,47 0,105+0,160 = 20,47 0,265 = 77,14 Eftersom t är mindre än det negativa kritiska värdet förkastas H 0. Intag av salt påverkar ökningen av hjärtfrekvensen. 8. b) Hypotestest av medelvärdeför en population, testa om medelvärdet i gruppen som ätit salt är större än noll. (Eller egentligen ett paired t-test, ursprungsdatan här var hjärtfrekvens före och efter landning men differenserna är redan beräknade) c) H 0 : μ 0 H 1 : μ > 0 Teststatistika: t = X μ s n Frihetsgrader : 39 (40-1) Kritiskt värde: 1,685 (enkelsidigt text 5 % signifikansnivå) t = 7 0 = 4,91 9 40 Eftersom 4,91 >1,685 kan nollhypotesen förkastas. Vi kan dra slutsatsen att hjärtfrekvensen ökar även om man äter salt. a) H 0: Män och kvinnor lägger ner lika mycket tid på sina elabonnemang. H 1: Män lägger mer eller mindre tid på sina elabonnemang än vad kvinnor gör. b) Eftersom p värdet är lägre än 5% kan vi förkasta nollhypotesen. Män och kvinnor skiljer sig åt. Eftersom män hr högre medelrangtal lägger männen ner mer tid på sina elabonnemang. c) Teckenrangtesten använder vi för att jämföra två variabler och se vilken som är störst. Här har vi en variabel som vi jämför i två olika grupper.
9. a) modell 1 interceptet tolkas ej då inga kommuner har noll i folkmängd, medelålder eller invånare per kvadratkilometer, (och förmodligen inte på de andra båda heller) folkmängd 2010 är inte signifikant eftersom pvärdet (0,461) överstiger signifikansnivån och tolkas därför ej. Medelålder 2010 är signifikant eftersom pvärdet (0,000) är lägre än signifikansnivån signifikansnivån, koefficientens värde -0,971 tolkas som att inflyttningen är lägre till kommuner med högre medelålder. Om medelåldern ökas med ett år minskar nettoinflyttningen med 0,97 personer per tusen invånare givet oförändrade värden på övriga oberoende variabler. Invånare per kvadratkilometer 2010 är inte signifikant eftersom pvärdet (0,079) överstiger Antal studenter per 100 invånare 2010 är inte signifikant eftersom pvärdet (0,405) överstiger Genomsnittlig andel arbetslösa 2010 är inte signifikant eftersom pvärdet (0,127) överstiger Modell 2 interceptet tolkas ej då inga kommuner har noll i folkmängd, medelålder eller invånare per kvadratkilometer, (och förmodligen inte på de andra båda heller) folkmängd 2010 är signifikant såväl i sin grundform som kvadrerad eftersom pvärdena (0,003 och 0,004) är lägre än signifikansnivån. Den vanliga variabeln är positiv och säger att nettoinflyttnignen ökar när folkmängden ökar, den kvadrerade är negativ och säger att ökningen av netttoinflyttningen minskar om kommunen blir större. För de riktigt stora kommunerna minskar nettoinflyttningen om folkmängden blir större.(man kan visa att nettoinflyttningen är störst i kommuner med drygt 400 000 invånare) Medelålder 2010 är signifikant eftersom pvärdet (0,000) är lägre än signifikansnivån, koefficientens värde -0,797 tolkas som att inflyttningen är lägre till kommuner med högre medelålder. Om medelåldern ökas med ett år minskar nettoinflyttningen med 0,8 personer per tusen invånare givet oförändrade värden på övriga oberoende variabler.
Invånare per kvadratkilometer 2010 är signifikant eftersom pvärdet (0,013) är lägre än signifikansnivån, koefficientens värde 0,002 tolkas som att inflyttningen är lägre till kommuner med fler invånare per kvadratkilometer. Om invånare per kvadratkilometer ökar med en person per kvadratkilometer ökar nettoinflyttningen med 0,002 personer per tusen invånare givet oförändrade värden på övriga oberoende variabler. Antal studenter per 100 invånare 2010 är inte signifikant eftersom pvärdet (0,443) överstiger Genomsnittlig andel arbetslösa 2010 är signifikant eftersom pvärdet (0,032) är lägre än signifikansnivån, koefficientens värde -0,406 tolkas som att inflyttningen är lägre till kommuner med hög arbetslöshet. Om arbetslösheten ökar med en procentenhet minskar nettoinflyttningen med 0,406 personer per tusen invånare givet oförändrade värden på övriga oberoende variabler. b) Om inflyttningen är hög ökar befolkningen i storlek. Om i första hand yngre personer flyttar kommer medelåldern att påverkas av nettoinflyttningen, i kommuner med positivnettoinflyttning sjunker medelåldern. I kommuner med negativ nettoinflyttning ökar medelåldern. Om man har en positiv nettoinflyttning kommer invånare per kvadratkilometer att öka. Om studenter utgör en stor del av de som flyttar påverkas antalet studenter av nettoinflyttningen Om de som flyttar är mer eller mindre attraktiva på arbetsmarknaden än de som inte flyttar finns en påverkan på arbetslösheten från nettoinflyttningen. Så här kan vi nog ha problem med endogenitet på i stort sett alla variabler. Så vi kan nog inte tolka koefficienterna som kausala samband på det sätt vi gjorde i a) utan enbart som en samvariation. c) Modell 1 antar enbart linjära samband medan modell 2 antar ett icke linjärt samband mellan folkmängd och nettoinflyttning. Eftersom folkmängd i kvadrat är signifikant har vi nog ett ickelinjärt samband mellan folkmängd och nettoinflyttning, om städer blir för stora blir de kanske mindre attraktiva att bo i alternativt det blir svårare att få tag i bostad där. Detta talar för modell 2. Intressant här är att en rad andra variabler blir signifikanta först när vi modeller sambandet mellan folkmängd och nettoinflyttning som icke linjärt, i det här fallet har valet av modell därför ovanligt stor betydelse. Om vi antar att folk vill flytta till Stockholm för att det är lätt att få jobb där men tvekar pga att Stockholm blivit för stort och att det därmed är svårt att få bostad, kan det förklara varför arbetslösheten enbart blir signifikant i modell 2 där vi tar hänsyn till att nettoinflyttningen minskar i riktigt stora städer givet en viss nivå på arbetslösheten. d) b ± t s b 0,406 ± 1,96 0,189 0,406 ± 0,37 0,78 < β < 0,04