ÖVNINGSUPPGIFTER KAPITEL 13

Relevanta dokument
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

ÖVNINGSUPPGIFTER KAPITEL 12

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

ÖVNINGSUPPGIFTER KAPITEL 3

ÖVNINGSUPPGIFTER KAPITEL 8

ÖVNINGSUPPGIFTER KAPITEL 4

ÖVNINGSUPPGIFTER KAPITEL 10

InStat Exempel 4 Korrelation och Regression

ÖVNINGSUPPGIFTER KAPITEL 10

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 10

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Uppgift 1. Produktmomentkorrelationskoefficienten

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Föreläsning G60 Statistiska metoder

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

OBS! Vi har nya rutiner.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Bilaga 2. Metod logistisk regression

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Tentamen Metod C vid Uppsala universitet, , kl

HYPOTESPRÖVNING sysselsättning

OBS! Vi har nya rutiner.

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Samhällsvetenskaplig metod, 7,5 hp

Statistik 1 för biologer, logopeder och psykologer

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

Tentamen i Metod C-kurs

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Växelvis boende och barns upplevelse av stress

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Sänkningen av parasitnivåerna i blodet

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Sjukfrånvaro bland privatanställda tjänstemän

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Analys av proportioner

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Är skilsmässobarn mindre utbildade?

Laboration 3 Inferens fo r andelar och korstabeller

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Studentnöjdhet vid LTU 2009

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Regressions- och Tidsserieanalys - F3

Tentamen MVE302 Sannolikhet och statistik

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

ÖVNINGSUPPGIFTER KAPITEL 9

OBS! Vi har nya rutiner.

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Analys av korstabeller

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

MSG830 Statistisk analys och experimentplanering - Lösningar

Lösningar till SPSS-övning: Analytisk statistik

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Regressions- och Tidsserieanalys - F3

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Statistik 1 för biologer, logopeder och psykologer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Uppgift a b c d e Vet inte Poäng

Föreläsning G60 Statistiska metoder

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Aerobics, gym eller idrottsförening Vad prioriterar högstadie- och gymnasieelever?

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Genetik, etik och samhälle Genetiska tester och vad händer sen?

Tentamen i Matematisk statistik Kurskod S0001M

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

JMG. En introduktion till logistisk regressionsanalys. Arbetsrapport nr 62. Johannes Bjerling Jonas Ohlsson

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Transkript:

ÖVNINGSUPPGIFTER KAPITEL 13 KORSTABELLER 1. Nedan visas tre korstabeller utifrån tre olika dataset (A, B och C). Korstabellerna beskriver sambandet mellan kön och vilken hand man skriver med (vänster, höger eller både och). a. I ett av dataseten finns det inget samband mellan kön och vilken hand man skriver med. Vilket? b. I ett av dataseten är sambandet mellan kön och vilken hand man skriver med signifikant. Vilket? A. VÄNSTER HÖGER BÅDE OCH KVINNOR 135 378 27 MÄN 65 182 13 B. VÄNSTER HÖGER BÅDE OCH KVINNOR 3 45 2 MÄN 10 38 2 C. VÄNSTER HÖGER BÅDE OCH KVINNOR 15 225 10 MÄN 50 190 10 CHI2-TESTET 2. Den här uppgiften är inspirerad av ett experiment som gjordes på 70-talet. Vi låter 500 barn i förskoleåldern genomgå följande test. En försöksledare ger barnet en marshmallow, med löftet om att denna ska få ytterligare en marshmallow om hon eller han väntar med att äta upp den första tills försöksledaren kommer tillbaka. Därefter går försöksledaren ut ur rummet och återvänder 15 minuter senare. 40 procent av barnen orkade vänta. I korstabellen nedan kallas dessa tålmodiga. Därefter mäter vi hur många av barnen som slutligen började studera på ett universitet. Visa att det finns en signifikant skillnad i benägenheten att studera på universitet beroende på om man är tålmodig eller otålig. De kritiska värdena på 5- och 1-procentsnivån är 3,84 och 6,64.

EJ UNIVERSITET UNIVERSITET OTÅLIG 240 60 TÅLMODIG 120 80 3. Finns det ett samband mellan uppväxtförhållande och brottslighet? Vi har samlat in ett datamaterial för 1000 tonårspojkar. Korstabellen nedan beskriver sambandet mellan hemförhållande (kärnfamilj eller splittrad familj) och antalet kontakter med polisen (inga, en gång eller flera). Är sambandet signifikant? I så fall, på vilken nivå? Det kritiska värdet på 5-procentsnivån är 5,99 och på 1- procentsnivån 9,21. INGA EN GÅNG FLERA KÄRNFAMILJ 596 40 24 SPLITTRAD FAMILJ 284 40 16 4. Hur mycket av vår smakupplevelse är psykologi? Vi låter 200 personer genomgå följande test. De bjuds på en middag på en fin restaurang och ska sedan bedöma hur bra rätten smakade på en skala mellan 1 och 4 (högre vitsord = bättre). 100 personer lottas ut och dessa får veta att rätten vanligtvis kostar 44 euro. De övriga 100 får veta att rätten vanligtvis kostar 16 euro. (Alla äter dock exakt samma rätt.) Stapeldiagrammet nedan beskriver hur de två grupperna bedömt rätten. Finns det signifikanta skillnader i bedömning beroende på om man fått höra att rätten är dyr eller billig? De kritiska värdena på 5- och 1-procentsnivån är 7,82 och 11,30. Antalet personer som bedömt rätten med en 1:a, 2:a, 3:a respektive 4:a 44 30 37 32 14 21 19 Billig (16 ) Dyr (44 ) 3 1 2 3 4 Bedömning 5. Nedan visas en tabell klippt ur artikeln Financial literacy and stock market participation. I den här studien har man låtit ~1500 personer besvara några frågor om finans och sparande. Tabellen nedan visar hur stor procent som

svarade korrekt på frågorna, och hur detta varierat beroende på hur man ställt frågan. Sammanfatta resultatet med egna ord: Är sambanden signifikanta? I så fall vilka samband? Och på vilken signifikansnivå? CHI2-TESTET FÖR ATT TESTA FÖRDELNINGSFORM 6. Du vill göra en studie om pensionärernas ekonomi och hälsa. Du samplar slumpmässigt 200 pensionärer som får besvara en enkät. Det visar sig dock att enbart 60 procent av de samplade personerna svarar. Kan samplet fortfarande betraktas som slumpmässigt draget? Tabellen nere till vänster visar pensionärernas åldersfördelning enligt folkbokföringen. Till höger ges ditt datamaterial. Är skillnaden signifikant? Det kritiska värdet på 5-procentsnivån är 7,82.

Folkbokföringen Ålder Procent 50-59 35 60-69 28 70-79 21 80+ 16 Totalt 100 Samplet Ålder Frekvens 50-59 48 60-69 42 70-79 19 80+ 11 Totalt 120 LOGISTISK REGRESSION (LOGIT) 7. Vi har samlat in data för 1865 amerikaner som ansökt om banklån. Korstabellen nedan visar deras etnicitet (svarta/vita) och om låneansökan blev godkänd eller inte. EJ GODKÄND GODKÄND SVARTA 64 131 VITA 154 1516 a. Hur stort är oddset för att lånet blir godkänt för svarta? För vita? Hur stor är oddskvoten, dvs. oddset för svarta i förhållande till oddset för vita? b. I tabellen nedan visas resultatet från en logistisk regression där vi dessutom kontrollerat för kön (dummyn male; antar värdet 1 för män och 0 för kvinnor) och om personen är egenföretagare eller inte (dummyn selfemployed; antar värdet 1 för egenföretagare och värdet 0 för övriga). Tolka oddskvoterna för variablerna male och self-employed. c. Konstanten visar oddset för att få ett lån för en viss sorts individer. Vilken? d. Vilken eller vilka effekter är signifikanta? Besvara genom att räkna upp de relevanta oberoende variablerna. Ange också om effekten ifråga är signifikant på 5- eller 1-procentsnivån.

Table: Logit regression (Outcome: loan approved) (1) VARIABLES Odds ratio Black 0.206*** (0.0362) Male 1.060 (0.197) Self-employed 0.666** (0.134) Constant 9.992*** (1.754) Observations 1,865 Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 8. Tabellen nedan visar hur många som överlevde och dog i Titanic beroende på om de reste i första, andra eller tredje klass. ÖVERLEVDE INTE ÖVERLEVDE FÖRSTA KLASS 123 200 ANDRA KLASS 158 119 TREDJE KLASS 528 181 a. Beskriv oddset för att överleva för personer i första klass och för personer i andra respektive tredje klass. b. Beskriv oddskvoterna för de olika klasserna då tredje klass används som referens. Kommentera vilket mönster ser du i data? 9. Ökar risken för att hoppa av gymnasiet om föräldrarna skiljer sig? I regressionsutskriften nedan så är skilsmässa en dummy som antar värdet 1 om föräldrarna skilde sig och annars värdet 0. Vi har också kontrollerat för avgångsbetyget från högstadiet (betyg). Utfallsvariabeln är hoppa_av (en binär variabel som antar värdet 1 om personen hoppade av gymnasiet och annars värdet 0.)

a. Tolka oddskvoten för skilsmässa. Är effekten signifikant? I så fall, på vilken signifikansnivå? b. Tolka oddskvoten för betyg. Är effekten signifikant? I så fall, på vilken signifikansnivå? c. För att få en bättre känsla för hur chansen att hoppa av varierar med betyg fyll i tabellen nedan. Tabellen nedan ska visa oddset och sannolikheten för att hoppa av och hur denna varierar med betyg (7, 8 och 9) för en person vars föräldrar inte skilde sig. Betyg Oddset Sannolikheten 7 8 9 10. Här hittar du en länk till artikeln Deliberate self harm in adolescents: self report survey in schools in England. Se tabell 3. a. Se samplet för männen: Välj ut en av dummy-variablerna. Tolka oddskvoten, konfidensintervallet och ange om effekten är signifikant eller inte, och i så fall på vilken nivå. b. Se samplet för kvinnorna: Välj ut en av variablerna depression, anxiety, impulsivity eller self esteem. Tolka oddskvoten, konfidensintervallet och ange om effekten är signifikant eller inte, och i så fall på vilken nivå.