ÖVNINGSUPPGIFTER KAPITEL 3

Relevanta dokument
ÖVNINGSUPPGIFTER KAPITEL 4

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

ÖVNINGSUPPGIFTER KAPITEL 6

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

ÖVNINGSUPPGIFTER KAPITEL 12

ÖVNINGSUPPGIFTER KAPITEL 13

ÖVNINGSUPPGIFTER KAPITEL 8

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Statistik 1 för biologer, logopeder och psykologer

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 9

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

InStat Exempel 4 Korrelation och Regression

ÖVNINGSUPPGIFTER KAPITEL 2

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

INNEHÅLL DEL II: STATISTISK INFERENS SLUMPMÄSSIGA SAMPEL

ÖVNINGSUPPGIFTER KAPITEL 9

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Sänkningen av parasitnivåerna i blodet

ÖVNINGSUPPGIFTER KAPITEL 7

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Datorövning 1 Enkel linjär regressionsanalys

HYPOTESPRÖVNING sysselsättning

Föreläsning G60 Statistiska metoder

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Laboration 4 R-versionen

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Att välja statistisk metod

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Blandade problem från elektro- och datateknik

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Skrivning i ekonometri torsdagen den 8 februari 2007

OBS! Vi har nya rutiner.

Mata in data i Excel och bearbeta i SPSS

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

ÖVNINGSUPPGIFTER KAPITEL 9

2 Dataanalys och beskrivande statistik

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Statistisk undersökningsmetodik (Pol. kand.)

Laboration 4 Regressionsanalys

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

2.1 Minitab-introduktion

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Medicinsk statistik II

En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart:

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

10.1 Enkel linjär regression

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Introduktion till SPSS

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Statistiska samband: regression och korrelation

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

OBS! Vi har nya rutiner.

Uppgift 1. Produktmomentkorrelationskoefficienten

Höftledsdysplasi hos dansk-svensk gårdshund

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

10 Beräkning av dubbelintegraler

Sannolikhet och statistik XI

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 4. Regressionsanalys

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Anders Lunander, Handelshögskolan vid Örebro universitet (huvudansvarig) Sofia Lundberg, Handelshögskolan vid Umeå universitet

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Matteläxa v.6. Hundratal Tiotal Ental

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F7

Föreläsning G60 Statistiska metoder

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Transkript:

ÖVNINGSUPPGIFTER KAPITEL 3 SAMBAND 1. Nedan ges beskrivningar av tre olika datamaterial. a. I kyrkbänkarna har snittåldern stigit betänkligt under de senaste decennierna, men är unga människor verkligen mindre religiösa än äldre, eller är det bara formatet som ogillas? I World Values Survey samlar man in data gällande personers värderingar i olika delar av världen. I figuren nedan har vi använt data för Finland år 25, n = 11. Finns det ett samband mellan ålder och religiositet? Motivera kortfattat. b. Du samplar ett hundratal äkta makar och mäter hustruns och mannens åldrar. Förväntar du dig att se ett samband mellan makarnas åldrar? Hur ser sambandet i så fall ut (positivt eller negativt)? Motivera kortfattat. c. Du samplar ett hundratal unga män och mäter antalet timmar de går på gymmet per vecka och antalet timmar de spelar dataspel per vecka. Hur förväntar du dig att sambandet mellan variablerna ser ut (inget samband/positivt/negativt)? Motivera kortfattat. Andel som anser sig vara mycket religiösa (%) 37 9 12 16 18 21 24 17-26 27-36 37-46 47-56 57-66 67-76 77-87 Åldersgrupp PEARSONS KORRELATIONSKOEFFICIENT 2. Vilket eller vilka av följande påståenden är korrekta: a. En korrelation på,6 betyder att sambandet mellan variablerna är starkare än om korrelationen var -,6. b. Det är inte möjligt att få en korrelation på 1,4.

c. Om sambandet mellan två variabler beskrivs av en kurva (se nedan) så har Pearsons korrelationskoefficient värdet. 3. Se spridningsdiagrammen nedan (A, B, C och D). I ett diagram är korrelationen,4; i ett annat ; i ett tredje -,5 och i ett fjärde,7. Para ihop rätt korrelationskoefficient med rätt spridningsdiagram. 4. Tabellen nedan visar arbetserfarenhet och lön för åtta personer. Arbetserfarenheten mäts i antal år och lönen i euro per månad. Den genomsnittliga arbetserfarenheten är 5 år; den genomsnittliga lönen är 272 euro; variansen för arbetserfarenheten är 3,6 och lönevariansen är 792 486.

id Arbetserfarenhet Lön 1 31 2 1 2 3 1 25 4 2 175 5 4 3 6 6 22 7 1 261 8 16 46 a. Beräkna korrelationen mellan arbetserfarenhet och lön. b. Hur stor hade korrelationen blivit om lönen istället mättes i tusentals euro? 5. I tabellen nedan visas data för tre variabler: kön, och y. id kön y 1 Man 5 2 Man 1 4 3 Man 1 7 4 Man 2 6 5 Man 2 8 6 kvinna 3 7 kvinna 3 2 8 kvinna 4 2 9 kvinna 4 4 1 kvinna 5 3 a. Beräkna korrelationen mellan och y för männen. Bland männen är kovariansen mellan och y,75; variansen för är,7 och variansen för y är 2,5. b. Beräkna korrelationen mellan och y för kvinnorna. Bland kvinnorna är kovariansen mellan och y,8; variansen för är,7 och variansen för y är 2,2. c. Beräkna nu korrelationen mellan och y i hela samplet. I hela samplet är kovariansen mellan och y är -2,56; variansen för är 2,5 och variansen för y är 6,1. d. Jämför svaren på a-c: Det här fenomenet kallas för Simpson s parado. Paradoen består i att korrelationen för både männen och kvinnorna är positiv, medan korrelationen för hela samplet är negativ. Hur kan det komma sig? För att se lösningen rita upp observationerna i ett spridningsdiagram:

1 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 6. Gapminder.com har sammanställt data för världens länder. På deras sida kan man rita upp spridningsdiagram för sambandet mellan olika variabler, samt välja vilken skala man vill använda på - och y-alarna (linjär eller loggad). a. Här ser du sambandet mellan antal barn per kvinna och genomsnittligt antal utbildningsår per kvinna (tyvärr är länkarna lite tröga, men håll ut ). Testa dig fram: Vilken skala (linjär/loggad) passar bäst för respektive ael? Du kan ändra mellan linjärt och loggat på ikonen lin. Obs. På de här frågorna behöver det inte finnas enbart ett svar som är givet korrekt. Idén är snarast att se eempel på hur sambandet förändras beroende på valet av skala. b. Här ser du sambandet mellan rökning och lungcancer bland män. Vilken skala (linjär/loggad) passar bäst för respektive ael? c. Här ser du sambandet mellan kalorimängd per person och andelen underviktiga barn (%). Vilken skala (linjär/loggad) passar bäst för respektive ael? d. Här ser du sambandet mellan inkomst per person och barnadödlighet. Vilken skala (linjär/loggad) passar bäst för respektive ael? 7. Nedan ser du se spridningsdiagram (A, B, C, D, E och F). Para ihop ett spridningsdiagram i den vänstra kolumnen (A, B och C) med motsvarande spridningsdiagram i den högra kolumnen (D, E och F). I den vänstra kolumnen beskrivs sambandet mellan och y då bägge mäts på den vanliga skalan. I den högra kolumnen visas motsvarande samband men då eller y logaritmerats.

y y y ln(y) y ln(y) A D B E C F ln() BINÄRA DATA 8. Är kvinnor mer skeptiska till sehandel? Enligt jämställdhetsbarometern för år 28 så anser 59 procent av de utfrågade finska männen och 32 procent av kvinnorna att seköp är acceptabelt.

a. Hur stort är oddset för att en kvinna anser att seköp är acceptabelt? b. Hur stort är oddset för att en man anser att seköp är acceptabelt? c. Beräkna oddskvoten, dvs. oddset för kvinnorna i förhållande till det för männen. 9. Du mäter sambandet mellan kön (man/kvinna) och ögonfärg (brun/blå). Korrelationen blir noll. Hur stor är då oddskvoten? Välj ett av alternativen: a. Oddskvoten är 1. b. Oddskvoten är. c. Vi har inte tillräckligt med information för att avgöra oddskvotens storlek. 1. På nästa sida hittar du en sammanfattning av en artikel ( Correlation between maternal weight and insulin resistence in second half of pregnancy ). Ge en tolkning av det som är understruket i rött: Vad anger oddskvoten i detta fall?

SPEARMANS RANGKORRELATION 11. Hitta på ett datamaterial som består av åtta observationer, och där... a.... spearmans rangkorrelation har ett positivt värde. b.... spearmans rangkorrelation har värdet -1, medan pearsons korrelationskoefficient inte har det. 12. Se spridningsdiagrammen nedan (A, B, C, D och E). a. I tre av diagrammen har Spearmans rangkorrelation värdet 1. Vilka tre? b. I två av diagrammen är Spearmans rangkorrelation större än Pearsons. Vilka två? c. I två av diagrammen är Spearmans och Pearsons korrelationskoefficienter lika stora. Vilka två? d. I ett av diagrammen är Pearsons korrelationskoefficient större än Spearmans. Vilket?

13. Nedan ser du en tabell klippt ur artikeln Income inequality, perceived happiness, and self-rated health: Evidence from nationwide surveys in Japan. Här har författarna bland annat mätt sambandet mellan hälsa och lycka med Spearmans rangkorrelation. Data täcker tiotusentals japaner. a. I det här fallet är det lämpligare att använda Spearmans rangkorrelation än Pearsons. Förklara kortfattat varför. b. Nämn ett annat korrelationsmått som också kunde användas i detta fall.