ÖVNINGSUPPGIFTER KAPITEL 13 KORSTABELLER 1. Nedan visas tre korstabeller utifrån tre olika dataset (A, B och C). Korstabellerna beskriver sambandet mellan kön och vilken hand man skriver med (vänster, höger eller både och). a. I ett av dataseten finns det inget samband mellan kön och vilken hand man skriver med. Vilket? b. I ett av dataseten är sambandet mellan kön och vilken hand man skriver med signifikant. Vilket? A. VÄNSTER HÖGER BÅDE OCH KVINNOR 135 378 27 MÄN 65 182 13 B. VÄNSTER HÖGER BÅDE OCH KVINNOR 3 45 2 MÄN 10 38 2 C. VÄNSTER HÖGER BÅDE OCH KVINNOR 15 225 10 MÄN 50 190 10 CHI2-TESTET 2. Den här uppgiften är inspirerad av ett experiment som gjordes på 70-talet. Vi låter 500 barn i förskoleåldern genomgå följande test. En försöksledare ger barnet en marshmallow, med löftet om att denna ska få ytterligare en marshmallow om hon eller han väntar med att äta upp den första tills försöksledaren kommer tillbaka. Därefter går försöksledaren ut ur rummet och återvänder 15 minuter senare. 40 procent av barnen orkade vänta. I korstabellen nedan kallas dessa tålmodiga. Därefter mäter vi hur många av barnen som slutligen började studera på ett universitet. Visa att det finns en signifikant skillnad i benägenheten att studera på universitet beroende på om man är tålmodig eller otålig. De kritiska värdena på 5- och 1-procentsnivån är 3,84 och 6,64.
EJ UNIVERSITET UNIVERSITET OTÅLIG 240 60 TÅLMODIG 120 80 3. Finns det ett samband mellan uppväxtförhållande och brottslighet? Vi har samlat in ett datamaterial för 1000 tonårspojkar. Korstabellen nedan beskriver sambandet mellan hemförhållande (kärnfamilj eller splittrad familj) och antalet kontakter med polisen (inga, en gång eller flera). Är sambandet signifikant? I så fall, på vilken nivå? Det kritiska värdet på 5-procentsnivån är 5,99 och på 1- procentsnivån 9,21. INGA EN GÅNG FLERA KÄRNFAMILJ 596 40 24 SPLITTRAD FAMILJ 284 40 16 4. Hur mycket av vår smakupplevelse är psykologi? Vi låter 200 personer genomgå följande test. De bjuds på en middag på en fin restaurang och ska sedan bedöma hur bra rätten smakade på en skala mellan 1 och 4 (högre vitsord = bättre). 100 personer lottas ut och dessa får veta att rätten vanligtvis kostar 44 euro. De övriga 100 får veta att rätten vanligtvis kostar 16 euro. (Alla äter dock exakt samma rätt.) Stapeldiagrammet nedan beskriver hur de två grupperna bedömt rätten. Finns det signifikanta skillnader i bedömning beroende på om man fått höra att rätten är dyr eller billig? De kritiska värdena på 5- och 1-procentsnivån är 7,82 och 11,30. Antalet personer som bedömt rätten med en 1:a, 2:a, 3:a respektive 4:a 44 30 37 32 14 21 19 Billig (16 ) Dyr (44 ) 3 1 2 3 4 Bedömning 5. Nedan visas en tabell klippt ur artikeln Financial literacy and stock market participation. I den här studien har man låtit ~1500 personer besvara några frågor om finans och sparande. Tabellen nedan visar hur stor procent som
svarade korrekt på frågorna, och hur detta varierat beroende på hur man ställt frågan. Sammanfatta resultatet med egna ord: Är sambanden signifikanta? I så fall vilka samband? Och på vilken signifikansnivå? CHI2-TESTET FÖR ATT TESTA FÖRDELNINGSFORM 6. Du vill göra en studie om pensionärernas ekonomi och hälsa. Du samplar slumpmässigt 200 pensionärer som får besvara en enkät. Det visar sig dock att enbart 60 procent av de samplade personerna svarar. Kan samplet fortfarande betraktas som slumpmässigt draget? Tabellen nere till vänster visar pensionärernas åldersfördelning enligt folkbokföringen. Till höger ges ditt datamaterial. Är skillnaden signifikant? Det kritiska värdet på 5-procentsnivån är 7,82.
Folkbokföringen Ålder Procent 50-59 35 60-69 28 70-79 21 80+ 16 Totalt 100 Samplet Ålder Frekvens 50-59 48 60-69 42 70-79 19 80+ 11 Totalt 120 LOGISTISK REGRESSION (LOGIT) 7. Vi har samlat in data för 1865 amerikaner som ansökt om banklån. Korstabellen nedan visar deras etnicitet (svarta/vita) och om låneansökan blev godkänd eller inte. EJ GODKÄND GODKÄND SVARTA 64 131 VITA 154 1516 a. Hur stort är oddset för att lånet blir godkänt för svarta? För vita? Hur stor är oddskvoten, dvs. oddset för svarta i förhållande till oddset för vita? b. I tabellen nedan visas resultatet från en logistisk regression där vi dessutom kontrollerat för kön (dummyn male; antar värdet 1 för män och 0 för kvinnor) och om personen är egenföretagare eller inte (dummyn selfemployed; antar värdet 1 för egenföretagare och värdet 0 för övriga). Tolka oddskvoterna för variablerna male och self-employed. c. Konstanten visar oddset för att få ett lån för en viss sorts individer. Vilken? d. Vilken eller vilka effekter är signifikanta? Besvara genom att räkna upp de relevanta oberoende variablerna. Ange också om effekten ifråga är signifikant på 5- eller 1-procentsnivån.
Table: Logit regression (Outcome: loan approved) (1) VARIABLES Odds ratio Black 0.206*** (0.0362) Male 1.060 (0.197) Self-employed 0.666** (0.134) Constant 9.992*** (1.754) Observations 1,865 Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 8. Tabellen nedan visar hur många som överlevde och dog i Titanic beroende på om de reste i första, andra eller tredje klass. ÖVERLEVDE INTE ÖVERLEVDE FÖRSTA KLASS 123 200 ANDRA KLASS 158 119 TREDJE KLASS 528 181 a. Beskriv oddset för att överleva för personer i första klass och för personer i andra respektive tredje klass. b. Beskriv oddskvoterna för de olika klasserna då tredje klass används som referens. Kommentera vilket mönster ser du i data? 9. Ökar risken för att hoppa av gymnasiet om föräldrarna skiljer sig? I regressionsutskriften nedan så är skilsmässa en dummy som antar värdet 1 om föräldrarna skilde sig och annars värdet 0. Vi har också kontrollerat för avgångsbetyget från högstadiet (betyg). Utfallsvariabeln är hoppa_av (en binär variabel som antar värdet 1 om personen hoppade av gymnasiet och annars värdet 0.)
a. Tolka oddskvoten för skilsmässa. Är effekten signifikant? I så fall, på vilken signifikansnivå? b. Tolka oddskvoten för betyg. Är effekten signifikant? I så fall, på vilken signifikansnivå? c. För att få en bättre känsla för hur chansen att hoppa av varierar med betyg fyll i tabellen nedan. Tabellen nedan ska visa oddset och sannolikheten för att hoppa av och hur denna varierar med betyg (7, 8 och 9) för en person vars föräldrar inte skilde sig. Betyg Oddset Sannolikheten 7 8 9 10. Här hittar du en länk till artikeln Deliberate self harm in adolescents: self report survey in schools in England. Se tabell 3. a. Se samplet för männen: Välj ut en av dummy-variablerna. Tolka oddskvoten, konfidensintervallet och ange om effekten är signifikant eller inte, och i så fall på vilken nivå. b. Se samplet för kvinnorna: Välj ut en av variablerna depression, anxiety, impulsivity eller self esteem. Tolka oddskvoten, konfidensintervallet och ange om effekten är signifikant eller inte, och i så fall på vilken nivå.