STOCKHOLMS UNIVERSITET HT 2013 Statistiska institutionen Göran Rundqvist, KURSBESKRIVNING REGRESSIONSANALYS OCH UNDERSÖKNINGSMETODIK, 15 HÖGSKOLEPOÄNG. Kursen består av fyra moment som delvis läses parallellt: 1. Regressionsanalys och tidsserieanalys, 4,5 högskolepoäng (R) 2. Inlämningsuppgift i regressionsanalys och tidsserieanalys, 3 högskolepoäng (Inlupp R) 3. Undersökningsmetodik, 4,5 högskolepoäng (U) 4. Inlämningsuppgift i undersökningsmetodik, 3 högskolepoäng (Inlupp U) och ingår i kandidatprogrammet i nationalekonomi och statistik, men kan även läsas som fristående kurs. SAMMANFATTNING AV KURSEN Undersökningsmetodik ger kunskaper om hur man planerar och genomför olika slag av statistiska undersökningar. Politiker, myndigheter, allmänheten vill veta egenskaper, attityder och åsikter hos grupper av individer och företag i samhället. I många fall görs detta genom att man drar ett urval från en avgränsad population för att sedan med hjälp av statistisk teori försöker dra slutsatser från detta urval till vad som kan gälla i populationen. Detta kräver dock vissa förutsättningar för att man också ska kunna mäta osäkerheten i dessa slutsatser. Att välja en lämplig urvalsmetod är därvid avgörande för storleken på denna felkälla. Vidare måste man vara medveten om och planera för hur övriga fel i undersökningen såsom bortfallsfel och mätfel, kan undvikas och minimeras. Det är därför mycket viktigt hur data samlas in t ex via en postenkät eller en telefonintervju och hur frågorna i ett frågeformulär konstrueras. Samtidigt måste man försöka utnyttja all den information som redan finns, såsom information från olika källor och register, och även kunna kritiskt värdera denna information i den aktuella undersökningen. Regressionsanalys är en statistisk teknik som kan användas för att beskriva och analysera samband mellan variabler. Funktionsformen för sambandet kan vara linjärt eller icke-linjärt. Tyngdpunkten under regressionsanalys och tidsserieanalys ligger på linjär regression. Teorin för punktskattning, intervallskattning och hypotesprövning tillämpas på regressionsmodeller. Ett viktigt inslag i modellarbetet är att studera hur avvikelser från modellens grundläggande antaganden påverkar den statistiska analysen. Därvid introduceras ett antal tekniker för modellkontroll. Tidsserieanalys baseras på data som har insamlats i kronologisk följd. Under kursen introduceras tidsseriemodeller. Praktisk tillämpning är en viktig del av kursen och tillämpning av regressionsanalys i samband med statistiska undersökningar diskuteras och exemplifieras. LÄRANDEMÅL Efter att ha genomgått undersökningsmetodik (U och Inlupp U) förväntas studenten kunna: - Planera en statistisk undersökning inklusive konstruera frågeformulär, - Argumentera för och genomföra olika slumpmässiga urval, - Lösa elementära problem inom urvals- och skattningsteori, - Redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska undersökningar. Efter att ha genomgått regressionsanalys och tidsserieanalys (R och Inlupp R) förväntas studenten kunna: - Tillämpa multipel linjär regressionsanalys och enklare tidsserieanalys, med tillhörande statistisk inferens och modellutvärdering, - Redogöra för mer avancerade regressions- och tidsseriemodeller, t ex logistisk regression, och avgöra när dessa modeller är lämpliga, samt tolka resultaten från studier där dessa modeller har använts.
LITTERATUR Följande litteratur examineras under undersökningsmetodik (U och Inlupp U): - Dahmström, K. (2011). Från datainsamling till rapport. 5:e uppl. Studentlitteratur, Lund. ( KD ). - Statistiska centralbyrån (SCB). Fråga rätt! Som pdf på SCB:s hemsida (www.scb.se). Följande litteratur examineras under regressionsanalys och tidsserieanalys (R och Inlupp R): - Kleinbaum, D., Kupper, L., Nizam, A. & Muller, K. (2008). Applied Regression Analysis and Other Multivariable Methods. Fjärde upplagan. Duxbury. Thomson Higher Education, Belmont, USA. ( KKM ) - Extra material om tidsserier. Tillhandahålles genom Statistiska institutionen, SU. Utdelas av lärare under kursens gång. UNDERVISNING Undervisningen på kursen består av totalt 24 föreläsningar (F), där tolv behandlar undersökningsmetodik (U) och tolv regressionsanalys och tidsserieanalys (R). Vidare ges 13 övningar (Ö) - sju avseende U, sex avseende R och samt även fyra datorövningar (D) vilka alla fyra berör såväl undersökningsmetodik som regressionsanalys och tidsserieanalys, dvs R / U. Vid övnings- och datorövningstillfällena är studenterna indelade i större undervisningsgrupper - i schemat kallade A, B, C respektive D - inom vilka studenterna ska bilda mindre arbetsgrupper bestående av tre eller fyra studenter vardera. Denna arbetsgruppindelningen kommer att äga rum vid det första övningstillfället Ö1 (se nedan)! Observera att en del av lektionstillfällena är obligatoriska. Om du av någon anledning inte kan närvaro vid någon av dessa är det viktigt att du meddelar gruppläraren detta innan övningen. Frånvaro vid obligatoriska tillfällen kan medföra att en (eller flera) restuppgifter utdelas! Nedan ges en preliminär disposition över lektionsinnehållet. Angående lokaler och klockslag hänvisas dock till kursschema - observera att om en föreläsning och en övning ges samma dag kan dessa infalla vid olika tider olika dagar bland annat beroende på grupptillhörighet, varför schemat måste studeras och avläsas mycket noggrant!!! Lektion Oblig Innehåll Att läsa / Att räkna F 1 x Enkel linjär regressionsanalys KKM kap 5.6-5.11 F 2 Multipel regressionsanalys KKM kap 8 F3 Repetition. F4 Korrelationskoefficienten. ANOVA-tabell. KKM kap 6.1-6.2, 6.4-6.6, 7. F 5 Hypotestest vid multipel regressionsanalys KKM kap 9.1-9.3.1, 9.3.2 kursivt, 9.3.3-9.3.4 F6 Korrelationsanalys. Confounding. Interaktion. KKM kap 10.1-10.3, 11.1-11.3.3, 11.3.5, 11.4-11.5 F 7 Forts. F15. Dummyvariabler KKM kap 12.1-12.5, 12.8-12.8.2, 12.10 KD 12.3-12.4 ÖH 3
F 8 Modellkontroll. Residualanalys. KKM kap 14 F9 Icke-linjär regressionsanalys KKM kap 15.1-15.3, 22.1-22.2 F10 Introduktion till tidsserier Extra material (Anderson, Jorner, Ågren) ÖH 9, 11 F 11 Repetition F12 Genomgång av gamla tentamensuppgifter Föreläsningar undersökningsmetodik Lektion Innehåll Att läsa / räkna F1 Intro. Olika slag av undersökningar och variabler. KD kap 1-3 F2 Olika slag av undersökningar och variabler forts. KD kap 1-3 F3 Planering av en undersökning och datainsamlingsmetoder. KD kap 4-6 F4 Frågeformulärskonstruktion och kodning av svar. KD kap 7-10 F5 Urvalsmetoder KD kap11 F6 Urvalsmetoder KD kap 11 F7 Urvalsmetoder KD kap 11 F8 Statistisk kvalitet. Feltyper. KD kap 12 F9 Allmän översikt. KD kap 13-17 F10 Repetition. F11 Repetition F12 Genomgång av gamla tentamensuppgifter. EXAMINATION OCH BETYGSKRITERIER Undersökningsmetodik (U) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 40 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller preliminärt. A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall själv kunna välja lämplig ansats för lösningen och på ett klart och tydligt sätt argumentera för detta val. Studenten skall vidare på ett klart och uttömmande sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver minst 36 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 32-35 poäng. C (bra): Studenten skall på ett korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare i stort sett uttömmande kunna redogöra
för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 28-31 poäng. D (tillfredsställande): Studenten skall på ett i huvudsak korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 24-27 poäng. E (tillräckligt): Studenten skall på ett till största delen korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet. Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar. Kräver 20-23 poäng. Fx (otillräckligt): Motsvarar 10-19 poäng. Omtentamen erfordras! F (helt otillräckligt): Motsvarar 0-9 poäng. Omtentamen erfordras! Undersökningsmetodik (Inlupp U) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp U) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport.
Regressionsanalys och tidsserieanalys (R) examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 50 poäng. Skrivtiden är fem timmar. Betygssättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst. För underkänt finns betygen F och Fx, där F är lägre än Fx. Följande betygskriterier och poängskala på tentamen gäller preliminärt: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver minst 45 poäng. B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 40-44 poäng. C (bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett bra sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 35-39 poäng. D (tillfredsställande): Studenten skall på ett korrekt sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet. Studenten skall vidare på ett nöjaktigt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 30-34 poäng. E (tillräcklig): Studenten skall på ett huvudsakligen korrekt sätt kunna tillämpa regressions- och tidsserieanalys som direkt behandlas i kursmaterialet. Studenten skall vidare på ett huvudsakligen korrekt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen. Kräver 25-29 poäng. Fx (otillräcklig): Motsvarar 20-24 poäng. Omtentamen erfordras! F (helt otillräcklig): Motsvarar 0-19 poäng. Omtentamen erfordras! Regressionsanalys och tidsserieanalys (Inlupp R) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp R) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp. Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och U=underkänd. För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport.
SLUTBETYG PÅ KURSEN För att få godkänt slutbetyg på hel kurs krävs lägst betyg E på moment 1 och 3 samt godkänt på moment 2 och 4. Betyg på momenten 1 och 3 (oberoende av ordning) A+A, A+B A+C, B+B, B+C B+D, C+C, A+D, C+D, A+E, B+E C+E, D+D, D+E E+E Slutbetyg på hela kursen A B C D E Sammanvägt betyg F erhålls alltid då studenten har betyget F på moment 1 och/eller 3. För student som fått betyget F finns inga restriktioner på hur många gånger studenten får genomföra skriftlig tentamen och inlämningsuppgift för att uppnå lägst betyget E. ÖVERGÅNGSBESTÄMMELSER Om kursen upphör, ges möjlighet att examineras på kursen vid tre tillfällen under en tvåårsperiod efter det att kursen upphör. LÄRARE. (Mottagningstiderna bestäms vid kursens början.) Göran Rundqvist Föreläsare och examinator regressionsanalys. Rum B788 Tfn 16 2990 Mottagningstid: Göran Rundqvist Föreläsare och examinator undersökningsmetodik. Rum B788 Tfn 16 2990 Mottagningstid: Karl Hellström Grupplärare (Grupp A och C) Rum B 780 Tfn 16 2980 Mottagningstid: Mikael Havasi (Regressionsanalys.) Grupplärare (Grupp B + D Rum B 708 Tfn 16 2578 Mottagningstid: Olivia Ståhl (Undersökningsmetodik.) Grupplärare (Grupp B+D) Rum B 753 Tfn 16 2857 Mottagningstid: