STOCKHOLMS UNIVERSITET HT 2011 Statistiska institutionen Göran Rundqvist KURSBESKRIVNING REGRESSIONSANALYS OCH UNDERSÖKNINGSMETODIK, 15 HÖGSKOLEPOÄNG. Kursen består av fyra moment som läses parallellt: 1. Regressionsanalys och tidsserieanalys, 4,5 högskolepoäng (R) 2. Inlämningsuppgift i regressionsanalys och tidsserieanalys, 3 högskolepoäng (Inlupp R) 3. Undersökningsmetodik, 4,5 högskolepoäng (U) 4. Inlämningsuppgift i undersökningsmetodik, 3 högskolepoäng (Inlupp U) och ingår i kandidatprogrammet i nationalekonomi och statistik, men kan även läsas som fristående kurs. SAMMANFATTNING AV KURSEN Undersökningsmetodik ger kunskaper om hur man planerar och genomför olika slag av statistiska undersökningar. Politiker, myndigheter, allmänheten vill veta egenskaper, attityder och åsikter hos grupper av individer och företag i samhället. I många fall görs detta genom att man drar ett urval från en avgränsad population för att sedan med hjälp av statistisk teori försöker dra slutsatser från detta urval till vad som kan gälla i populationen. Detta kräver dock vissa förutsättningar för att man också ska kunna mäta osäkerheten i dessa slutsatser. Att välja en lämplig urvalsmetod är därvid avgörande för storleken på denna felkälla. Vidare måste man vara medveten om och planera för hur övriga fel i undersökningen såsom bortfallsfel och mätfel, kan undvikas och minimeras. Det är därför mycket viktigt hur data samlas in t ex via en postenkät eller en telefonintervju och hur frågorna i ett frågeformulär konstrueras. Samtidigt måste man försöka utnyttja all den information som redan finns, såsom information från olika källor och register, och även kunna kritiskt värdera denna information i den aktuella undersökningen. Regressionsanalys är en statistisk teknik som kan användas för att beskriva och analysera samband mellan variabler. Funktionsformen för sambandet kan vara linjärt eller icke-linjärt. Tyngdpunkten under regressionsanalys och tidsserieanalys ligger på linjär regression. Teorin för punktskattning, intervallskattning och hypotesprövning tillämpas på regressionsmodeller. Ett viktigt inslag i modellarbetet är att studera hur avvikelser från modellens grundläggande antaganden påverkar den statistiska analysen. Därvid introduceras ett antal tekniker för modellkontroll. Tidsserieanalys baseras på data som har insamlats i kronologisk följd. Under kursen introduceras tidsseriemodeller. Praktisk tillämpning är en viktig del av kursen och tillämpning av regressionsanalys i samband med statistiska undersökningar diskuteras och exemplifieras. LÄRANDEMÅL Efter att ha genomgått undersökningsmetodik (U och Inlupp U) förväntas studenten kunna: - Planera en statistisk undersökning inklusive konstruera frågeformulär, - Argumentera för och genomföra olika slumpmässiga urval, - Lösa elementära problem inom urvals- och skattningsteori, - Redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska undersökningar. Efter att ha genomgått regressionsanalys och tidsserieanalys (R och Inlupp R) förväntas studenten kunna: - Tillämpa multipel linjär regressionsanalys och enklare tidsserieanalys, med tillhörande statistisk inferens och modellutvärdering, - Redogöra för mer avancerade regressions- och tidsseriemodeller, t ex logistisk regression, och avgöra när dessa modeller är lämpliga, samt tolka resultaten från studier där dessa modeller har använts.
LITTERATUR Följande litteratur examineras under undersökningsmetodik (U och Inlupp U): - Dahmström, K. (2011). Från datainsamling till rapport. 5:e uppl. Studentlitteratur, Lund. ( KD ). - Statistiska centralbyrån (SCB). Fråga rätt! Som pdf på SCB:s hemsida (www.scb.se). Följande litteratur examineras under regressionsanalys och tidsserieanalys (R och Inlupp R): - Kleinbaum, D., Kupper, L., Nizam, A. & Muller, K. (2008). Applied Regression Analysis and Other Multivariable Methods. Fjärde upplagan. Duxbury. Thomson Higher Education, Belmont, USA. ( KKM ) - Extra material om tidsserier. Tillhandahålles genom Statistiska institutionen, SU. Utdelas av lärare under kursens gång. UNDERVISNING Undervisningen på kursen består av totalt 22 föreläsningar (F), där elva behandlar undersökningsmetodik (U) och elva regressionsanalys och tidsserieanalys (R). Vidare ges 16 övningar (Ö) - sju avseende U, sju avseende R och två gemensamma R / U - samt även fem datorövningar (D) vilka alla fem berör såväl undersökningsmetodik som regressionsanalys och tidsserieanalys, dvs R / U. Vid övnings- och datorövningstillfällena är studenterna indelade i större undervisningsgrupper - i schemat kallade A, B, C respektive D - inom vilka studenterna ska bilda mindre arbetsgrupper bestående av tre eller fyra studenter vardera. Denna arbetsgruppindelningen kommer att äga rum vid det första övningstillfället Ö1 (se nedan)! Observera att flera av lektionstillfällena är obligatoriska. Om du av någon anledning inte kan närvaro vid någon av dessa är det viktigt att du meddelar gruppläraren detta innan övningen. Frånvaro vid obligatoriska tillfällen kan medföra att en (eller flera) restuppgifter utdelas! Nedan ges en preliminär disposition över lektionsinnehållet. Angående lokaler och klockslag hänvisas dock till kursschema - observera att om en föreläsning och en övning ges samma dag kan dessa infalla vid olika tider olika dagar bland annat beroende på grupptillhörighet, varför schemat måste studeras och avläsas mycket noggrant!!! Dag Datum Lektion R / U Oblig Innehåll Att läsa / Att räkna Ti 1/ 11 F1 U X Intro - Undersökningsmetodik. Formalia. KD kap 1-3. On 2/ 11 F2 U Datainsamlingsmetoder. KD kap 5. Ö 1 U X Inlupp U. Intro och arbetsgruppindelning. KD uppgift 3.1-3.2 To 3/ 11 F3 U Mätinstrument. KD kap 7-8. Må 7/ 11 F 4 U Total- och urvalsundersökningar. KD kap 4. Ö 2 U Inlupp U. Utkast till frågeställn och metod. KD uppgift 3.3-3.5 Ti 8 / 11 F 5 R Intro Regressions- och tidsserieanalys. Formalia. KKM kap 4, 5.1-5.5 To 10 /11 F 6 U Urvalsmetoder (I) KD kap 11. Må 14 /11 F 7 R Enkel linjär regressionsanalys KKM kap 5.6-5.11
Ti 15 /11 F 8 U Urvalsmetoder (II) KD kap 11. Ö 3 U Inlupp U. Ev. inl av.utkast till frågeformulär. KD uppgift 11.1-11.6 To 17 /11 F 9 R Korrelationskoefficienten. ANOVA-tabell. KKM kap 6.1-6.2, 6.4-6.6, 7. Må 21 /11 F 10 U Urvalsmetoder (III) KD kap 11. Ö 4 U Inlupp U. Feedback på frågeformulär. KD uppgift 11.9-11.11 11.13-11.14 Ti 22 / 11 F 11 R Multipel regressionsanalys KKM kap 8 On 23/11 D1 R/U Allmän handledning. Inmatning av data som exempel på beskrivande statistik. To 24 /11 F 12 U Statistisk kvalitet. Feltyper. KD kap 12. Ö 5 U Inlupp U. Inl. av slutgiltigt frågeformulär. KD uppgift 11.5-11.6 11.25-11.27 Må 28 /11 F 13 R Hypotestest vid multipel regressionsanalys KKM kap 9.1-9.3.1, 9.3.2 kursivt, 9.3.3-9.3.4 Ö 6 R Introduktion till inlupp R. ÖH* 1, KKM 5.2 a,b Ti 29 /11 F 14 U Allmän översikt. KD kap 6, 9, (10), 13-17. Ö 7 U X Pilotstudie. OBS: Medtag frågeformulär!. KD uppgifter som är kvar. On 30/11 D2 R/U Enkel linjär regression. Forts. beskrivande Statistik. To 1 /12 F 15 R Korrelationsanalys. Confounding. KKM kap 10.1-10.3, 11.1- Interaktion. 11.3.3, 11.3.5, 11.4-11.5 Ö 8 R Korrelation. Multipel regression. ÖH 2, 3, KKM 6.2, 8.2 Fr 2/12 D3 R Multipel regression. Må 5 /12 F 16 U Repetition. Ö 9 U Inlupp U. Ev. handledning. KD uppgift 11.20-11.22 12.1-12.4 Ti 6/12 F 17 R Forts. F15. Dummyvariabler KKM kap 12.1-12.5, 12.8-12.8.2, 12.10 Ö 10 R Hypotestest. Korrelation. ÖH 4, 5, 6, 7 On 7/12 F 18 U Genomgång av övningstentamen. To 8/12 F 19 R Modellkontroll. Residualanalys. KKM kap 14
To 8/12 Ö 11 R Interaktion.Confounding.Dummyvariabler. KKM 11.1, 11.8, 12.8 a-c (ej test för coincident lines ), ÖH 9 Fr 9/ 12 D 4 R / U Modellkontroll. Residualanalys Ti 13/12 D5 R/U Eget arbete med inlupp R/U. On 14 / 12 F 20 R Icke-linjär regressionsanalys KKM kap 15.1-15.3, 22.1-22.2 Ö 12 R Handledning eget arbete (inlupp R/U) ÖH 11, 12. To 15/ 12 F 21 R Introduktion till tidsserier Extra material (Anderson, Jorner, Ågren) Ö 13 R Genomgång av övningstentamen ÖH 13, Tenta 101130 Fr 16 / 12 F 22 R Tidsserier forts. Ö 14 R Övningstentamen. Ev. handledning. Tenta 101216 Må 19/ 12 Ö 15 R / U X Handledning och genomgång inför Ö 16 Må 19 / 12 Inlämn R / U Inlämn av rapporter (R och U) senast kl 15. Svarta lådan, plan 7 hus B. Ti 20/12 Ö 16 R / U X Muntlig redovisning OBS Inlupp R och Inlupp U hämtas om de måste kompletteras i rum B788 kl 12-14 torsdag 22 december. Till de som måste komplettera skickas ett e-mail. Även de som ev fått restuppgifter pga frånvaro från Ö15 och/eller Ö16, måste hämta dessa samma tid. Mail skickas även till dem. Ti 10 / 1 Inlämn R / U Inlämn av kompletteringar och restuppgifter senast kl 15.00 i Svarta lådan plan 7 hus B.. *ÖH = övningssamling (finns på hemsida) Angående de tentamenstillfällen som ges på moment U och moment R innevarande termin: se kursschema!
EXAMINATION OCH BETYGSKRITERIER Undersökningsmetodik (U) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 20 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall själv kunna välja lämplig ansats för lösningen och på ett klart och tydligt sätt argumentera för detta val. Studenten skall vidare på ett klart och uttömmande sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver minst 18 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 16-17,75 poäng. C (bra): Studenten skall på ett korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 14-15,75 poäng. D (tillfredsställande): Studenten skall på ett i huvudsak korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 12-13,75 poäng. E (tillräckligt): Studenten skall på ett till största delen korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 10-11,75 poäng. Fx (otillräckligt): Motsvarar 5-9,75 poäng. Omtentamen erfordras! F (helt otillräckligt): Motsvarar 0-4,75 poäng. Omtentamen erfordras! Undersökningsmetodik (Inlupp U) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp U) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport. Rapporten lämnas in senast måndag 19/12 kl. 15.00 i den svarta brevlådan på plan 7 i B-huset. Den av gruppläraren rättade rapporten återfås på slutet av det sista övningstillfället då den muntliga redovisningen äger rum. Eventuellt begärda restuppgifter/kompletteringar lämnas in senast tisdag 3/1 kl. 15.00 i den svarta brevlådan, vilka sedan återfås rättade av gruppläraren tisdag 10/1. (Dessa datum ändras ev.)
Regressionsanalys och tidsserieanalys (R) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 50 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver minst 45 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 40-44 poäng. C (bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett bra sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 35-39 poäng. D (tillfredsställande): Studenten skall på ett korrekt sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett nöjaktigt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 30-34 poäng. E (tillräcklig): Studenten skall på ett huvudsakligen korrekt sätt kunna tillämpa regressions- och tidsserieanalys som direkt behandlas i kursmaterialet. Studenten skall vidare på ett huvudsakligen korrekt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 25-29 poäng. Fx (otillräcklig): Motsvarar 20-24 poäng. Omtentamen erfordras! F (helt otillräcklig): Motsvarar 0-19 poäng. Omtentamen erfordras! Regressionsanalys och tidsserieanalys (Inlupp R) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp R) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport. Rapporten lämnas in senast måndag 19/12 kl. 15.00 i den svarta brevlådan på plan 7 i B-huset. Den av gruppläraren rättade rapporten återfås på slutet av det sista övningstillfället då den muntliga redovisningen äger rum. Eventuellt begärda restuppgifter/kompletteringar lämnas in senast tisdag 3/1 kl. 15.00 i den svarta brevlådan, vilka sedan återfås rättade av gruppläraren tisdag 10/1. (Dessa datum ändras ev.)
SLUTBETYG PÅ KURSEN För att få godkänt slutbetyg på hel kurs krävs lägst betyg E på moment 1 och 3 samt godkänt på moment 2 och 4. Betyg på momenten 1 och 3 (oberoende av ordning) A+A, A+B A+C, B+B, B+C B+D, C+C, A+D, C+D, A+E, B+E C+E, D+D, D+E E+E Slutbetyg på hela kursen A B C D E Sammanvägt betyg F erhålls alltid då studenten har betyget F på moment 1 och/eller 3. För student som fått betyget F finns inga restriktioner på hur många gånger studenten får genomföra skriftlig tentamen och inlämningsuppgift för att uppnå lägst betyget E. ÖVERGÅNGSBESTÄMMELSER Om kursen upphör, ges möjlighet att examineras på kursen vid tre tillfällen under en tvåårsperiod efter det att kursen upphör. LÄRARE Göran Rundqvist Föreläsare och examinator (Mom 1-4) Rum B788 Tfn 16 2990 Mott Må kl 12-13 Karl Hellström Grupplärare (Grupp A och C) Rum B 795 Tfn 16 2980 Mott Må kl 15-16 Lukas Ryan Grupplärare (Grupp B) Rum B 736 Tfn 16 2578 Mott Må kl 10-11 Olivia Hellberg Grupplärare (Grupp D) Rum B 753 Tfn 16 2972 Mott Fred 10-11 Anita Normark Jourlärare Rum B 782 Tfn 16 2992 Mott Enligt anslag HEMSIDA Kursens hemsida är http://gauss.stat.su.se/gu/ra.shtml och kan nås genom att gå till http://www.statistics.su.se/ och klicka på kurshemsidor och sedan på regressionsanalys På hemsidan finns bland annat schema, kursbeskrivning samt övningshäfte. Här kommer även gamla tentor samt formelblad läggas upp under kursens gång. Eventuella förändringar av schema mm meddelas likaså via hemsidan!