STOCKHOLMS UNIVERSITET VT 2011 Statistiska institutionen Peter Claësson och Linda Wänström KURSBESKRIVNING REGRESSIONSANALYS OCH UNDERSÖKNINGSMETODIK, 15 HÖGSKOLEPOÄNG Kursen består av fyra moment som läses parallellt: 1. Regressionsanalys och tidsserieanalys, 4,5 högskolepoäng (R) 2. Inlämningsuppgift i regressionsanalys och tidsserieanalys, 3 högskolepoäng (Inlupp R) 3. Undersökningsmetodik, 4,5 högskolepoäng (U) 4. Inlämningsuppgift i undersökningsmetodik, 3 högskolepoäng (Inlupp U) och ingår i kandidatprogrammet i nationalekonomi och statistik, men kan även läsas som fristående kurs. SAMMANFATTNING AV KURSEN Undersökningsmetodik ger kunskaper om hur man planerar och genomför olika slag av statistiska undersökningar. Politiker, myndigheter, allmänheten vill veta egenskaper, attityder och åsikter hos grupper av individer och företag i samhället. I många fall görs detta genom att man drar ett urval från en avgränsad population för att sedan med hjälp av statistisk teori försöker dra slutsatser från detta urval till vad som kan gälla i populationen. Detta kräver dock vissa förutsättningar för att man också ska kunna mäta osäkerheten i dessa slutsatser. Att välja en lämplig urvalsmetod är därvid avgörande för storleken på denna felkälla. Vidare måste man vara medveten om och planera för hur övriga fel i undersökningen såsom bortfallsfel och mätfel, kan undvikas och minimeras. Det är därför mycket viktigt hur data samlas in t ex via en postenkät eller en telefonintervju och hur frågorna i ett frågeformulär konstrueras. Samtidigt måste man försöka utnyttja all den information som redan finns, såsom information från olika källor och register, och även kunna kritiskt värdera denna information i den aktuella undersökningen. Regressionsanalys är en statistisk teknik som kan användas för att beskriva och analysera samband mellan variabler. Funktionsformen för sambandet kan vara linjärt eller icke-linjärt. Tyngdpunkten under regressionsanalys och tidsserieanalys ligger på linjär regression. Teorin för punktskattning, intervallskattning och hypotesprövning tillämpas på regressionsmodeller. Ett viktigt inslag i modellarbetet är att studera hur avvikelser från modellens grundläggande antaganden påverkar den statistiska analysen. Därvid introduceras ett antal tekniker för modellkontroll. Tidsserieanalys baseras på data som har insamlats i kronologisk följd. Under kursen introduceras tidsseriemodeller. Praktisk tillämpning är en viktig del av kursen och tillämpning av regressionsanalys i samband med statistiska undersökningar diskuteras och exemplifieras. LÄRANDEMÅL Efter att ha genomgått momenten i undersökningsmetodik (U och Inlupp U) förväntas studenten kunna: - Planera en statistisk undersökning inklusive konstruera frågeformulär, - Argumentera för och genomföra olika slumpmässiga urval, - Lösa elementära problem inom urvals- och skattningsteori, - Redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska undersökningar. Efter att ha genomgått momenten i regressionsanalys och tidsserieanalys (R och Inlupp R) förväntas studenten kunna: - Tillämpa multipel linjär regressionsanalys och enklare tidsserieanalys, med tillhörande statistisk inferens och modellutvärdering, - Redogöra för mer avancerade regressions- och tidsseriemodeller, t ex logistisk regression, och avgöra när dessa modeller är lämpliga, samt tolka resultaten från studier där dessa modeller har använts.
LITTERATUR Följande litteratur examineras under undersökningsmetodik (U och Inlupp U): - Dahmström, K. (2011). Från datainsamling till rapport. 5:e uppl. Studentlitteratur, Lund. ( KD ). - Statistiska centralbyrån (SCB). Fråga rätt! Som pdf på SCB:s hemsida (www.scb.se). Följande litteratur examineras under regressionsanalys och tidsserieanalys (R och Inlupp R): - Kleinbaum, D., Kupper, L., Nizam, A. & Muller, K. (2008). Applied Regression Analysis and Other Multivariable Methods. Fjärde upplagan. Duxbury. Thomson Higher Education, Belmont, USA. ( KKM ) - Extra material om tidsserier. Tillhandahålles genom Statistiska institutionen, SU. Utdelas av lärare under kursens gång. UNDERVISNING Undervisningen på kursen består av totalt 22 föreläsningar (F), där elva behandlar undersökningsmetodik (U) och elva regressionsanalys och tidsserieanalys (R). Vidare ges 16 övningar (Ö) - sju avseende U, sju avseende R och två gemensamma R / U - samt även fem datorövningar (D) vilka alla fem berör såväl undersökningsmetodik som regressionsanalys och tidsserieanalys, dvs R / U. Vid övnings- och datorövningstillfällena är studenterna indelade i större undervisningsgrupper - i schemat kallade A, B, C respektive D - inom vilka studenterna ska bilda mindre arbetsgrupper bestående av tre eller fyra studenter vardera. Denna arbetsgruppindelningen kommer att äga rum vid det första övningstillfället på kursen (se nedan)! Observera att flera av lektionstillfällena är obligatoriska (markerade med X nedan!). Om du av någon anledning inte kan närvaro vid någon av dessa är det viktigt att du meddelar gruppläraren detta innan övningen. Frånvaro vid obligatoriska tillfällen kan medföra att en (eller flera) restuppgifter utdelas! Nedan ges en preliminär disposition över lektionsinnehållet. Angående lokaler och klockslag hänvisas dock till kursschema - observera att om en föreläsning och en övning ges samma dag kan dessa infalla vid olika tider olika dagar bland annat beroende på grupptillhörighet, varför schemat måste studeras och avläsas mycket noggrant!!! Dag Datum Lektion R / U Oblig Innehåll Att läsa / Att räkna Ti 22 / 3 F 1 U X Intro - Undersökningsmetodik. Formalia. KD kap 1-3. Fr 25 / 3 F 2 U Datainsamlingsmetoder. KD kap 5. Ö 1 U X Inlupp U. Intro och arbetsgruppindelning. Ti 29 / 3 F 3 U Mätinstrument. KD kap 7-8. Fr 1 / 4 F 4 U Total- och urvalsundersökningar. KD kap 4. Ö 2 U X Inlupp U. Utkast till frågeställn och metod. Må 4 / 4 F 1 R Intro - Regressions- och tidsserieanalys. Formalia. KKM kap 4, 5.1-5.5 Ti 5 / 4 F 5 U Urvalsmetoder (I). KD kap 11. To 7 / 4 F 2 R Enkel linjär regressionsanalys. KKM kap 5.6-5.11
Fr 8 / 4 F 6 U Urvalsmetoder (II). KD kap 11. Ö 3 U Inlupp U. Utkast till frågeformulär. KD uppg 11.1-11.6 Må 11 / 4 F 3 R Korrelationskoefficienten. ANOVA-tabell. KKM kap 6.1-6.2, 6.4-6.6, 7. Ti 12 / 4 F 7 U Urvalsmetoder (III). KD kap 11. Ö 4 U Inlupp U. Respons på frågeformulär. KD uppg 11.9-11.11, 11.13-11.14 To 14 / 4 F 4 R Multipel regressionsanalys. KKM kap 8 Fr 15 / 4 F 8 U Statistisk kvalitet. Feltyper. KD kap 12. Ö 5 U Inlupp U. Slutgiltigt frågeformulär. KD uppg 11.15-11.16, 11.25-11.27 Må 18 / 4 F 5 R Hypotestest vid multipel regressionsanalys. KKM kap 9.1-9.3.1, 9.3.2 kursivt, 9.3.3-9.3.4 Ö 1 R X Inlupp R. Intro och arbetsindelning. Enkel linjär regression. ÖH* 1, KKM 5.2 a,b Ti 19 / 4 F 9 U Allmän översikt. KD kap 6, 9, (10), 13-17. Ö 6 U X Inlupp U. Pilotstudie genomförs. KD uppgift Ti 26 / 4 D 1 R / U X Inmatning av data från pilotstudie. Beskrivande statistik. On 27 / 4 F 6 R Korrelationsanalys. Confounding. KKM kap 10.1-10.3, 11.1- Interaktion. 11.3.3, 11.3.5, 11.4-11.5 Ö 2 R Korrelation. Multipel regression. ÖH 2, 3, KKM 6.2, 8.2 To 28 / 4 D 2 R / U X Enkel linjär regression. Forts. beskrivande statistik. Fr 29 / 4 F 10 U Repetition. Ö 7 U Inlupp U. Handledning. KD uppg 11.20-11.22, 12.1-12.4 Må 2 / 5 F 7 R Forts. F6. Dummyvariabler. KKM kap 12.1-12.5, 12.8-12.8.2, 12.10 Ö 3 R Hypotestest. Korrelation. ÖH 4, 5, 6, 7 Ti 3 / 5 D 3 R / U X Multipel regression. On 4 / 5 F 11 U Genomgång av övningstentamen. To 5 / 5 F 8 R Modellkontroll. Residualanalys. KKM kap 14 Ö 4 R Interaktion. Confounding. Dummyvariabler. KKM 11.1, 11.8, 12.8 a-c (ej test för coincident lines ), ÖH 9
On 11 / 5 D 4 R / U X Modellkontroll. Residualanalys. To 12 / 5 F 9 R Icke-linjär regressionsanalys. KKM kap 15.1-15.3, 22.1-22.2 Ö 5 R Handledning eget arbete (Inlupp R/U). Ickelinjär regression. ÖH 11, 12. Må 16 / 5 F 10 R Introduktion till tidsserier. Extra material (Anderson, Jorner, Ågren) Ö 6 R Genomgång av övningstentamen. Tidsserier. ÖH 13, Tenta 101130 Ti 17 / 5 D 5 R / U X Eget arbete (Inlupp R). To 19 / 5 F 11 R Tidsserier forts. Ö 7 R Genomgång av övningstentamen. Tenta 101216 On 25 / 5 Ö 8 R / U Handledning och genomgång inför Ö 9. Fr 27 / 5 Inlämn R / U Inlämn av rapporter (R och U) senast kl 15. Svarta lådan, plan 7 hus B. On 1 / 6 Ö 9 R / U X Muntlig redovisning - Inlupp R och Inlupp U. Fr 10 / 6 Inlämn R / U Inlämn av ev. restuppgifter senast kl 15. Svarta lådan, plan 7 hus B. *ÖH = övningssamling (finns på hemsida) Angående de tentamenstillfällen som ges på moment U och moment R innevarande termin: se kursschema!
EXAMINATION OCH BETYGSKRITERIER Undersökningsmetodik (U) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 20 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall själv kunna välja lämplig ansats för lösningen och på ett klart och tydligt sätt argumentera för detta val. Studenten skall vidare på ett klart och uttömmande sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver minst 18 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 16-17,75 poäng. C (bra): Studenten skall på ett korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 14-15,75 poäng. D (tillfredsställande): Studenten skall på ett i huvudsak korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 12-13,75 poäng. E (tillräckligt): Studenten skall på ett till största delen korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 10-11,75 poäng. Fx (otillräckligt): Motsvarar 5-9,75 poäng. Omtentamen erfordras! F (helt otillräckligt): Motsvarar 0-4,75 poäng. Omtentamen erfordras! Undersökningsmetodik (Inlupp U) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp U) skall redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad och muntligt redovisad rapport. Rapporten lämnas in senast fredag 27/5 kl. 15.00 i den svarta brevlådan på plan 7 i B-huset. Den av gruppläraren rättade rapporten återfås på slutet av det sista övningstillfället då den muntliga redovisningen äger rum. Eventuellt begärda restuppgifter/kompletteringar lämnas in senast fredag 10/6 kl. 15.00 i den svarta brevlådan, vilka sedan återfås rättade av gruppläraren fredag 17/6.
Regressionsanalys och tidsserieanalys (R) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 50 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver minst 45 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 40-44 poäng. C (bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett bra sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 35-39 poäng. D (tillfredsställande): Studenten skall på ett korrekt sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett nöjaktigt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 30-34 poäng. E (tillräcklig): Studenten skall på ett huvudsakligen korrekt sätt kunna tillämpa regressions- och tidsserieanalys som direkt behandlas i kursmaterialet. Studenten skall vidare på ett huvudsakligen korrekt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 25-29 poäng. Fx (otillräcklig): Motsvarar 20-24 poäng. Omtentamen erfordras! F (helt otillräcklig): Motsvarar 0-19 poäng. Omtentamen erfordras! Regressionsanalys och tidsserieanalys (Inlupp R) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp R) skall redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad och muntligt redovisad rapport. Rapporten lämnas in senast fredag 27/5 kl. 15.00 i den svarta brevlådan på plan 7 i B-huset. Den av gruppläraren rättade rapporten återfås på slutet av det sista övningstillfället då den muntliga redovisningen äger rum. Eventuellt begärda restuppgifter/kompletteringar lämnas in senast fredag 10/6 kl. 15.00 i den svarta brevlådan, vilka sedan återfås rättade av gruppläraren fredag 17/6.
GODKÄNT BETYG PÅ HEL KURS, 15 HÖGSKOLEPOÄNG För att få godkänt betyg på hela kursen omfattande 15 hp krävs lägst betyg E (=tillräcklig) på moment 1 och 3 samt betyg G på moment 2 och 4, enligt: Betyg på moment 1 och 3 (oberoende av ordning) A+A, A+B A+C, B+B, B+C B+D, C+C, A+D, C+D, A+E, B+E C+E, D+D, D+E E+E givet betyg G på såväl moment 2 som 4. Betyg på hel kurs A B C D E ÖVERGÅNGSBESTÄMMELSER Om kursen upphör, ges möjlighet att examineras på kursen vid tre tillfällen under en tvåårsperiod efter det att kursen upphör. LÄRARE Peter Claësson Föreläsare och examinator (Mom 3 och 4) Rum X 327 Tfn 16 4843 Mottagn må kl 11-12 Linda Wänström Föreläsare och examinator (Mom 1 och 2) Rum B 792 Tfn 16 2971 Mottagn må kl 13-14 Bertil Wegmann Grupplärare (Grupp A) Rum B 784 Tfn 16 2974 Mottagn må kl 13-14 Anna Andersdotter Grupplärare (Grupp B och C) Rum B758 Tfn 16 1323 Mottagn ti kl 12-13 Termeh Shafie Grupplärare (Grupp D) Rum B 795 Tfn 16 2975 Mottagn må kl 13-14 Anita Normark Jourlärare Rum B 782 Tfn 16 2992 Mottagn enligt anslag HEMSIDA Kursens hemsida kan nås genom att gå till Statistiska institutionens hemsida www.statistics.su.se och klicka på kurshemsidor och därefter på regressionsanalys och undersökningsmetodik. På hemsidan finns bland annat schema, kursbeskrivning samt övningshäfte. Här kommer även formelblad mm läggas upp under kursens gång. Eventuella förändringar av schema meddelas likaså via hemsidan!