ÖVNINGSUPPGIFTER KAPITEL 4



Relevanta dokument
ÖVNINGSUPPGIFTER KAPITEL 6

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

ÖVNINGSUPPGIFTER KAPITEL 7

ÖVNINGSUPPGIFTER KAPITEL 3

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

ÖVNINGSUPPGIFTER KAPITEL 12

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

ÖVNINGSUPPGIFTER KAPITEL 8

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 9

HYPOTESPRÖVNING sysselsättning

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 9

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Statistik 1 för biologer, logopeder och psykologer

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Sänkningen av parasitnivåerna i blodet

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

InStat Exempel 4 Korrelation och Regression

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Linjär regressionsanalys. Wieland Wermke

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

ÖVNINGSUPPGIFTER KAPITEL 9

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

ÖVNINGSUPPGIFTER KAPITEL 13

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Statistiska samband: regression och korrelation

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Multipel Regressionsmodellen

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

INNEHÅLL DEL II: STATISTISK INFERENS SLUMPMÄSSIGA SAMPEL

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Medicinsk statistik II

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Läs noggrant informationen nedan innan du börjar skriva tentamen

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

Statistik och epidemiologi T5

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Fråga nr a b c d 2 D

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning G60 Statistiska metoder

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Dekomponering av löneskillnader

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

REGRESSIONSANALYS. Exempel från F6. Statistiska institutionen, Stockholms universitet 1/11

Höftledsdysplasi hos dansk-svensk gårdshund

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Laboration 4 R-versionen

Resursfördelningsmodellen

Föreläsning 12: Regression

Kommunal tillväxt. 31 januari

MSG830 Statistisk analys och experimentplanering

Uppgift 1. Deskripitiv statistik. Lön

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

10.1 Enkel linjär regression

Tentamen Metod C vid Uppsala universitet, , kl

Modell för löneökningar

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 4. Kap 5,1-5,3

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Läs noggrant informationen nedan innan du börjar skriva tentamen

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

LABORATION 3 - Regressionsanalys

Läs noggrant informationen nedan innan du börjar skriva tentamen

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

16. Max 2/0/ Max 3/0/0

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Repetitionsprov inför provet Statistik

TVM-Matematik Adam Jonsson

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Transkript:

ÖVNINGSUPPGIFTER KAPITEL 4 REGRESSIONSLINJEN: NIVÅ OCH LUTNING 1. En av regressionslinjerna nedan beskrivs av ekvationen y = 20 + 2x; en annan av ekvationen y = 80 x; en tredje av ekvationen y = 20 + 3x och en fjärde av ekvationen y = 20 + 0x. Para ihop rätt regressionslinje med rätt diagram (A, B, C och D). 2. Nedan beskrivs fyra olika samband. Vilken variabel är beroende och vilken är oberoende i respektive fall? a. Är erfarna lärare bättre? Vi samplar slumpmässigt ett hundratal skolklasser i årskurs nio. Vi mäter mattelärarens erfarenhet i antal år (variabeln erfarenhet) och skolklassens genomsnittliga resultat på ett nationellt matteprov (variabeln matteprov). b. Har långa basketspelare högre lön är korta? För att besvara denna fråga samlar vi in data för ett hundratal professionella basketspelare, deras längd (variabeln längd) och lön (variabeln lön).

c. Ledde Tjernobylkatastrofen år 1986 till fler cancerpatienter? Vi samlar in data över radioaktivt nedfall (variabeln nedfall) för ~50 städer i Ukraina år 1986, där vissa städer drabbades hårdare än andra. För varje stad mäter vi andelen cancerpatienter (variabeln cancer) bland ungdomar som var i fosterstadiet år 1986. d. Du samlar in ett datamaterial för ett hundratal barn i syfte att mäta sambandet mellan barnets längd (variabeln längd) och föräldrarnas genomsnittliga längd (variabeln förlängd). 3. Arbetslösheten i Europa har länge legat på en högre nivå än den i USA. Många skyller detta på en tungrodd offentlig sektor och högt skattetryck. Kan det ligga någonting i detta? Spridningsdiagrammet nedan visar sambandet mellan skatteprocent och arbetslöshet i olika länder. Variabeln skatteprocent mäter skatteintäkterna som en procent av hela ekonomin; arbetslöheten mäter arbetslöshetsgraden i procent. Kovariansen mellan variablerna är 8,9061; genomsnittlig arbetslöshet är 8,4733 procent och den genomsnittliga skatteprocenten är 16,4505; standardavvikelsen för skatteprocenten är 6,1648 och standardavvikelsen för arbetslöshetsgraden är 5,5243. a. Beskriv regressionslinjen med en regressionsekvation. Ge också en tolkning av koefficienten b i den här regressionen. b. Se fråga a: I Finland ligger skatten på 19,83 procent. Hur stor predikteras arbetslösheten vara i Finland? 4. Är resultaten sämre i stora skolklasser än i små? För att ta reda på detta har vi samplat 80 skolklasser och mätt antalet elever på klassen (variabeln elevantal) och klassens genomsnittliga betyg (variabeln betyg). Korrelationen mellan variablerna är -0,25; i snitt går det 20 elever på en klass och genomsnittligt

betyg är 7,5; standardavvikelsen för antalet elever på klassen är 2,5 och standardavvikelsen för variabeln betyg är 0,3. a. Beskriv regressionslinjen, dvs. vilka värden har a och b i ekvationen: betyg = a + b elevantal? b. Tolka koefficienten för elevantal. c. Rita upp regressionslinjen i diagrammet nedan. (Notera att axlarna inte börjar vid origo.) Skriv också ut variablernas namn på y- respektive x-axeln. 8 7.8 7.6 7.4 7.2 7 10 12 14 16 18 20 22 24 26 28 30 5. Hur stiger VD:ns lön med antalet år på posten? För att besvara denna fråga använder vi ett sampel för 177 amerikanska företag år 1990. I regressionen nedan mäter variabeln lön VD:ns lön i tusentals dollar; erfarenhet mäter antalet år på posten. lön = 772,43 + 11,75erfarenhet a. Hur mycket högre predikteras lönen vara för en VD med 20 års erfarenhet i jämförelse med en purfärsk VD (dvs. 0 års erfarenhet)?

b. Tolka koefficienten för erfarenhet. c. Hur mycket ökar lönen i snitt då erfarenheten ökar med tio år? Femton år? d. Hur mycket ska arbetserfarenheten öka för att lönen ska stiga med hundratusen dollar? e. Som du ser från spridningsdiagrammet ovan så finns det en VD med en extra hög lön (5 299 000 dollar). Den här personen har 13 års erfarenhet. Hur stor är residualen för denna VD? f. En annan VD i samplet har två års erfarenhet och en lön på 471 000 dollar. Hur stor är residualen för denna VD? REGRESSIONER MED DUMMYVARIABLER 6. Tar man ut mindre sjukskrivningar inom privat sektor? För enkelhetens skull tänker vi oss här att vi samplat 13 sjuksköterskor varav 6 jobbar inom offentlig sektor och 7 inom privat. För varje person har vi mätt antalet sjukskrivningsdagar under det senaste året. Data visas i datamatrisen nedan, där privat är en dummy som antar värdet 1 för personer som är anställda inom det privata och 0 annars; variabeln sjukskrivning mäter antalet sjukskrivningsdagar. id privat sjukskrivning 1 0 15 2 0 5 3 0 24 4 0 0 5 0 5 6 0 2 7 1 0 8 1 5 9 1 10 10 1 3 11 1 0 12 1 20 13 1 11 Vilka värden har a och b i regressionen: sjukskrivning = a + b privat 7. I en amerikansk studie jämförde man löner bland 534 arbetare varav 96 tillhörde facket. Data är för år 1985. Regressionslinjen ges av: lön = 8,64 + 2,16 facket där variabeln lön mäter arbetarens timlön; facket är en dummy som antar värdet 1 för fackanslutna och 0 för övriga. Hur stor är den genomsnittliga timlönen

bland de fackanslutna? Bland dem som inte tillhör facket? Vad mäter koefficienten för facket? 8. På nästa sida hittar du en sammanfattning av en artikel. Läs sammanfattningen och ge en tolkning av det som är understruket i rött: a. Vad anger koefficienterna för x i dessa fall? (I artikeln betecknar man koefficienten för x med β.) b. Vilken eller vilka av de tre x-variablerna är dummy-variabler? ( Hypertension heter högt blodtryck på svenska.) FÖRKLARINGSGRADEN 9. Se uppgift 4: Hur stor är förklaringsgraden? Beskriv också vad förklaringsgraden anger i det här sammanhanget. 10. Se uppgift 5: Här blir förklaringsgraden 0,020. Vilket eller vilka av följande påståenden är sanna? a. Korrelationen mellan VD:ns lön och antalet år på posten är ~0,14. b. 2 procent av observationerna ligger på regressionslinjen. c. 2 procent av variationen i VD-löner kan förklaras av antalet år på posten.

LOGARITMERING 11. Det föds allt färre barn. En möjlig orsak är att kvinnor skjuter upp äktenskap och barnafödande och satsar på utbildning och karriär. Spridningsdiagrammet nedan visar sambandet mellan åldern då kvinnor gifter sig och antalet barn per kvinna för 175 länder. Variabeln ålder mäter den genomsnittliga åldern då kvinnor i landet gifter sig; antal barn mäter genomsnittligt antal barn per kvinna. Regressionslinjen ges av: ln (antal barn) = 2,97 0,082 ålder. Tolka koefficienten för ålder. 12. Vi har mätt risken för att åka fast samt brottsligheten i 89 amerikanska orter. Brottsligheten mäts som antalet brott per invånare; risken för att åka fast är andelen av alla brott som leder till ett arresterande. Sambandet kan beskrivas genom regressionen: ln(brottslighet) = 4,18 0,50 ln (risk att åka fast). Vilken eller vilka av följande tre tolkningar är korrekt? a. Då risken för att åka fast ökar med en procent så minskar antalet brott per invånare i snitt med 0,5 procent. b. Då risken för att åka fast ökar med en procentenhet så minskar antalet brott per invånare i snitt med 0,5 procent. c. Då risken för att åka fast ökar med 10 procent så minskar antalet brott per invånare med 0,5 procent. d. Då risken för att åka fast ökar med 1 procent så minskar antalet brott per invånare med 5 procent.

BMI 13. Spridningsdiagrammet nedan visar sambandet mellan genomsnittlig BMI och inkomst per person i olika länder. (BMI mäter relationen mellan vikt och längd. Högre värden betyder att man väger mer relativt sin längd. BMI-värden på 18,5-25 räknas som normalviktig ; lägre värden som underviktig och högre som överviktig.) x-variabeln är inkomst per person i landet. En regressionslinje som beskriver sambandet ges av: BMI = 12,55 + 1,43 ln (inkomst) 35 30 25 20 15 0 20000 40000 60000 80000 Inkomst per person a. Den 10:e inkomstpercentilen är 1078 dollar per person. Prediktera BMI för ett land med denna inkomstnivå. b. Den 90:e inkomstpercentilen är 35 247 dollar per person. Prediktera BMI för ett land med denna inkomstnivå. c. I Finland är inkomsten 33 162 dollar per person. Hur hög predikteras genomsnittlig BMI vara i Finland? d. Se fråga c: Genomsnittlig BMI i Finland är 26,73. Hur stor är Finlands residual? e. Tolka koefficienten för ln(inkomst).