ÖVNINGSUPPGIFTER KAPITEL 3 SAMBAND 1. Nedan ges beskrivningar av tre olika datamaterial. a. I kyrkbänkarna har snittåldern stigit betänkligt under de senaste decennierna, men är unga människor verkligen mindre religiösa än äldre, eller är det bara formatet som ogillas? I World Values Survey samlar man in data gällande personers värderingar i olika delar av världen. I figuren nedan har vi använt data för Finland år 25, n = 11. Finns det ett samband mellan ålder och religiositet? Motivera kortfattat. b. Du samplar ett hundratal äkta makar och mäter hustruns och mannens åldrar. Förväntar du dig att se ett samband mellan makarnas åldrar? Hur ser sambandet i så fall ut (positivt eller negativt)? Motivera kortfattat. c. Du samplar ett hundratal unga män och mäter antalet timmar de går på gymmet per vecka och antalet timmar de spelar dataspel per vecka. Hur förväntar du dig att sambandet mellan variablerna ser ut (inget samband/positivt/negativt)? Motivera kortfattat. Andel som anser sig vara mycket religiösa (%) 37 9 12 16 18 21 24 17-26 27-36 37-46 47-56 57-66 67-76 77-87 Åldersgrupp PEARSONS KORRELATIONSKOEFFICIENT 2. Vilket eller vilka av följande påståenden är korrekta: a. En korrelation på,6 betyder att sambandet mellan variablerna är starkare än om korrelationen var -,6. b. Det är inte möjligt att få en korrelation på 1,4.
c. Om sambandet mellan två variabler beskrivs av en kurva (se nedan) så har Pearsons korrelationskoefficient värdet. 3. Se spridningsdiagrammen nedan (A, B, C och D). I ett diagram är korrelationen,4; i ett annat ; i ett tredje -,5 och i ett fjärde,7. Para ihop rätt korrelationskoefficient med rätt spridningsdiagram. 4. Tabellen nedan visar arbetserfarenhet och lön för åtta personer. Arbetserfarenheten mäts i antal år och lönen i euro per månad. Den genomsnittliga arbetserfarenheten är 5 år; den genomsnittliga lönen är 272 euro; variansen för arbetserfarenheten är 3,6 och lönevariansen är 792 486.
id Arbetserfarenhet Lön 1 31 2 1 2 3 1 25 4 2 175 5 4 3 6 6 22 7 1 261 8 16 46 a. Beräkna korrelationen mellan arbetserfarenhet och lön. b. Hur stor hade korrelationen blivit om lönen istället mättes i tusentals euro? 5. I tabellen nedan visas data för tre variabler: kön, och y. id kön y 1 Man 5 2 Man 1 4 3 Man 1 7 4 Man 2 6 5 Man 2 8 6 kvinna 3 7 kvinna 3 2 8 kvinna 4 2 9 kvinna 4 4 1 kvinna 5 3 a. Beräkna korrelationen mellan och y för männen. Bland männen är kovariansen mellan och y,75; variansen för är,7 och variansen för y är 2,5. b. Beräkna korrelationen mellan och y för kvinnorna. Bland kvinnorna är kovariansen mellan och y,8; variansen för är,7 och variansen för y är 2,2. c. Beräkna nu korrelationen mellan och y i hela samplet. I hela samplet är kovariansen mellan och y är -2,56; variansen för är 2,5 och variansen för y är 6,1. d. Jämför svaren på a-c: Det här fenomenet kallas för Simpson s parado. Paradoen består i att korrelationen för både männen och kvinnorna är positiv, medan korrelationen för hela samplet är negativ. Hur kan det komma sig? För att se lösningen rita upp observationerna i ett spridningsdiagram:
1 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 6. Gapminder.com har sammanställt data för världens länder. På deras sida kan man rita upp spridningsdiagram för sambandet mellan olika variabler, samt välja vilken skala man vill använda på - och y-alarna (linjär eller loggad). a. Här ser du sambandet mellan antal barn per kvinna och genomsnittligt antal utbildningsår per kvinna (tyvärr är länkarna lite tröga, men håll ut ). Testa dig fram: Vilken skala (linjär/loggad) passar bäst för respektive ael? Du kan ändra mellan linjärt och loggat på ikonen lin. Obs. På de här frågorna behöver det inte finnas enbart ett svar som är givet korrekt. Idén är snarast att se eempel på hur sambandet förändras beroende på valet av skala. b. Här ser du sambandet mellan rökning och lungcancer bland män. Vilken skala (linjär/loggad) passar bäst för respektive ael? c. Här ser du sambandet mellan kalorimängd per person och andelen underviktiga barn (%). Vilken skala (linjär/loggad) passar bäst för respektive ael? d. Här ser du sambandet mellan inkomst per person och barnadödlighet. Vilken skala (linjär/loggad) passar bäst för respektive ael? 7. Nedan ser du se spridningsdiagram (A, B, C, D, E och F). Para ihop ett spridningsdiagram i den vänstra kolumnen (A, B och C) med motsvarande spridningsdiagram i den högra kolumnen (D, E och F). I den vänstra kolumnen beskrivs sambandet mellan och y då bägge mäts på den vanliga skalan. I den högra kolumnen visas motsvarande samband men då eller y logaritmerats.
y y y ln(y) y ln(y) A D B E C F ln() BINÄRA DATA 8. Är kvinnor mer skeptiska till sehandel? Enligt jämställdhetsbarometern för år 28 så anser 59 procent av de utfrågade finska männen och 32 procent av kvinnorna att seköp är acceptabelt.
a. Hur stort är oddset för att en kvinna anser att seköp är acceptabelt? b. Hur stort är oddset för att en man anser att seköp är acceptabelt? c. Beräkna oddskvoten, dvs. oddset för kvinnorna i förhållande till det för männen. 9. Du mäter sambandet mellan kön (man/kvinna) och ögonfärg (brun/blå). Korrelationen blir noll. Hur stor är då oddskvoten? Välj ett av alternativen: a. Oddskvoten är 1. b. Oddskvoten är. c. Vi har inte tillräckligt med information för att avgöra oddskvotens storlek. 1. På nästa sida hittar du en sammanfattning av en artikel ( Correlation between maternal weight and insulin resistence in second half of pregnancy ). Ge en tolkning av det som är understruket i rött: Vad anger oddskvoten i detta fall?
SPEARMANS RANGKORRELATION 11. Hitta på ett datamaterial som består av åtta observationer, och där... a.... spearmans rangkorrelation har ett positivt värde. b.... spearmans rangkorrelation har värdet -1, medan pearsons korrelationskoefficient inte har det. 12. Se spridningsdiagrammen nedan (A, B, C, D och E). a. I tre av diagrammen har Spearmans rangkorrelation värdet 1. Vilka tre? b. I två av diagrammen är Spearmans rangkorrelation större än Pearsons. Vilka två? c. I två av diagrammen är Spearmans och Pearsons korrelationskoefficienter lika stora. Vilka två? d. I ett av diagrammen är Pearsons korrelationskoefficient större än Spearmans. Vilket?
13. Nedan ser du en tabell klippt ur artikeln Income inequality, perceived happiness, and self-rated health: Evidence from nationwide surveys in Japan. Här har författarna bland annat mätt sambandet mellan hälsa och lycka med Spearmans rangkorrelation. Data täcker tiotusentals japaner. a. I det här fallet är det lämpligare att använda Spearmans rangkorrelation än Pearsons. Förklara kortfattat varför. b. Nämn ett annat korrelationsmått som också kunde användas i detta fall.