STOCKHOLMS NIVESITET VT 2012 Statistiska institutionen Göran undqvist KSBESKIVNING EGESSIONSANALYS OCH NDESÖKNINGSMETODIK, 15 HÖGSKOLEPOÄNG Kursen består av fyra moment som läses parallellt: 1 egressionsanalys och tidsserieanalys, 4,5 högskolepoäng () 2 Inlämningsuppgift i regressionsanalys och tidsserieanalys, 3 högskolepoäng (Inlupp ) 3 ndersökningsmetodik, 4,5 högskolepoäng () 4 Inlämningsuppgift i undersökningsmetodik, 3 högskolepoäng (Inlupp ) och ingår i kandidatprogrammet i nationalekonomi och statistik, men kan även läsas som fristående kurs SAMMANFATTNING AV KSEN ndersökningsmetodik ger kunskaper om hur man planerar och genomför olika slag av statistiska undersökningar Politiker, myndigheter, allmänheten vill veta egenskaper, attityder och åsikter hos grupper av individer och företag i samhället I många fall görs detta genom att man drar ett urval från en avgränsad population för att sedan med hjälp av statistisk teori försöker dra slutsatser från detta urval till vad som kan gälla i populationen Detta kräver dock vissa förutsättningar för att man också ska kunna mäta osäkerheten i dessa slutsatser Att välja en lämplig urvalsmetod är därvid avgörande för storleken på denna felkälla Vidare måste man vara medveten om och planera för hur övriga fel i undersökningen såsom bortfallsfel och mätfel, kan undvikas och minimeras Det är därför mycket viktigt hur data samlas in t ex via en postenkät eller en telefonintervju och hur frågorna i ett frågeformulär konstrueras Samtidigt måste man försöka utnyttja all den information som redan finns, såsom information från olika källor och register, och även kunna kritiskt värdera denna information i den aktuella undersökningen egressionsanalys är en statistisk teknik som kan användas för att beskriva och analysera samband mellan variabler Funktionsformen för sambandet kan vara linjärt eller icke-linjärt Tyngdpunkten under regressionsanalys och tidsserieanalys ligger på linjär regression Teorin för punktskattning, intervallskattning och hypotesprövning tillämpas på regressionsmodeller Ett viktigt inslag i modellarbetet är att studera hur avvikelser från modellens grundläggande antaganden påverkar den statistiska analysen Därvid introduceras ett antal tekniker för modellkontroll Tidsserieanalys baseras på data som har insamlats i kronologisk följd nder kursen introduceras tidsseriemodeller Praktisk tillämpning är en viktig del av kursen och tillämpning av regressionsanalys i samband med statistiska undersökningar diskuteras och exemplifieras LÄANDEMÅL Efter att ha genomgått undersökningsmetodik ( och Inlupp ) förväntas studenten kunna: - Planera en statistisk undersökning inklusive konstruera frågeformulär, - Argumentera för och genomföra olika slumpmässiga urval, - Lösa elementära problem inom urvals- och skattningsteori, - edogöra för begrepp, metoder och teori som används vid genomförandet av statistiska undersökningar Efter att ha genomgått regressionsanalys och tidsserieanalys ( och Inlupp ) förväntas studenten kunna: - Tillämpa multipel linjär regressionsanalys och enklare tidsserieanalys, med tillhörande statistisk inferens och modellutvärdering, - edogöra för mer avancerade regressions- och tidsseriemodeller, t ex logistisk regression, och avgöra när dessa modeller är lämpliga, samt tolka resultaten från studier där dessa modeller har använts
LITTEAT Följande litteratur examineras under undersökningsmetodik ( och Inlupp ): - Dahmström, K (2011) Från datainsamling till rapport 5:e uppl Studentlitteratur, Lund ( KD ) - Statistiska centralbyrån (SCB) Fråga rätt! Som pdf på SCB:s hemsida (wwwscbse) Följande litteratur examineras under regressionsanalys och tidsserieanalys ( och Inlupp ): - Kleinbaum, D, Kupper, L, Nizam, A & Muller, K (2008) Applied egression Analysis and Other Multivariable Methods Fjärde upplagan Duxbury Thomson Higher Education, Belmont, SA ( KKM ) - Extra material om tidsserier Tillhandahålles genom Statistiska institutionen, S tdelas av lärare under kursens gång NDEVISNING ndervisningen på kursen består av totalt 22 föreläsningar (F), där elva behandlar undersökningsmetodik () och elva regressionsanalys och tidsserieanalys () Vidare ges 16 övningar (Ö) - sju avseende, sju avseende och två gemensamma / - samt även fem datorövningar (D) vilka alla fem berör såväl undersökningsmetodik som regressionsanalys och tidsserieanalys, dvs / Vid övnings- och datorövningstillfällena är studenterna indelade i större undervisningsgrupper - i schemat kallade A, B, C respektive D - inom vilka studenterna ska bilda mindre arbetsgrupper bestående av tre eller fyra studenter vardera Denna arbetsgruppindelningen kommer att äga rum vid det första övningstillfället Ö1 (se nedan)! Observera att flera av lektionstillfällena är obligatoriska Om du av någon anledning inte kan närvaro vid någon av dessa är det viktigt att du meddelar gruppläraren detta innan övningen Frånvaro vid obligatoriska tillfällen kan medföra att en (eller flera) restuppgifter utdelas! Nedan ges en preliminär disposition över lektionsinnehållet Angående lokaler och klockslag hänvisas dock till kursschema - observera att om en föreläsning och en övning ges samma dag kan dessa infalla vid olika tider olika dagar bland annat beroende på grupptillhörighet, varför schemat måste studeras och avläsas mycket noggrant!!! Dag Datum Lektion / Oblig Innehåll Att läsa / Att räkna Må 19/3 F1 X Intro - ndersökningsmetodik Formalia KD kap 1-3 To 22/3 F2 Datainsamlingsmetoder KD kap 5 Ö 1 X Inlupp Intro och arbetsgruppindelning KD uppgift 31 Ti 27/3 F3 Mätinstrument KD kap 7-8 On 28/3 Studiebesök på SCB KD kap 4 To 29/3 F 4 Intro egressions- och tidsserieanalys KKM kap 4, 51-55 Formalia Ö2 Inlupp tkast till frågeställn och metod KD ppgift 32-34 Ti 10 /4 F 5 rvalsmetoder (I) KD kap 11 On 11/4 F 6 Enkel linjär regressionsanalys KKM kap 56-511
To 12/4 F 7 rvalsmetoder (II) KD kap 11 Fr 13 /4 F8 Ö3 Korrelationskoefficienten ANOVA-tabell Inlupp Ev inl avutkast till frågeformulär KKM kap 61-62, 64-66, 7 KD uppgift 35, 111-112 Må 16 /4 F 9 rvalsmetoder (III) KD kap 11 Ti 17/ 4 F 10 Multipel regressionsanalys KKM kap 8 On 18/4 Ö4 F11 Inlupp Feedback på frågeformulär epetition KD uppgift 113-116 To 19/4 F 12 Statistisk kvalitet Feltyper KD kap 12 Ö 5 Inlupp Inl av slutgiltigt frågeformulär KD uppgift 119-1111 Fr 20/4 Ö6 X Introduktion till inlupp KD 1113-1116 Må 23/4 F 13 Hypotestest vid multipel regressionsanalys KKM kap 91-931, 932 kursivt, 933-934 Ti 24/4 F 14 Allmän översikt KD kap 6, 9, (10), 13-17 On 25/4 Ö 7 D1 / X Pilotstudie OBS: Medtag frågeformulär! Allmän handledning Inmatning av data som exempel på beskrivande statistik KD 1125-1126 1136c 1129 To 26/4 Ö8 Korrelation Multipel regression ÖH 1-2, KKM 52, a b On 2/5 F15 Korrelationsanalys Confounding Interaktion KKM kap 101-103, 111-1133, 1135, 114-115 To 3/5 D2 / Enkel linjär regression Forts beskrivande statistik Fr 4/5 F 16 epetition Ö 9 Inlupp Ev handledning KD 1120-1122 121-122 Må 7/5 F 17 Forts F15 Dummyvariabler KKM kap 121-125, 128-1282, 1210 Ö 10 Hypotestest Korrelation KD 123-124 ÖH 3
Ti 8/5 D3 Multipel regression On 9/5 F 18 Ö11 Genomgång av övningstentamen InteraktionConfoundingDummyvariabler KKM 62 82 ÖH 4,5 To 10/5 F 19 Modellkontroll esidualanalys KKM kap 14 Ö12 Handledning eget arbete (inlupp /) ÖH 6,7 KKM 111 Fr 11/ 5 D 4 / Modellkontroll esidualanalys Ti 15/5 F20 Icke-linjär regressionsanalys KKM kap 151-153, 221-222 Ö13 Genomgång av övningstentamen KKM 118 128 a-c (ej coincident lines) On 16/5 F21 Introduktion till tidsserier Extra material (Anderson, Jorner, Ågren) Ö14 Övningstentamen Ev handledning ÖH 9, 11 Må 21/5 D5 / Eget arbete med inlupp / Ti 22 / 5 F 22 Tidsserier forts Ö 15 Handledning och genomgång inför Ö 16 ÖH 12, 13 TI 22/ 5 Inlämn / Inlämn av rapporter ( och ) senast Kl 1600 i Svarta Lådan hus B plan 7 On 23/5 Ö 16 / X Muntlig redovisning OBS Inlupp och Inlupp hämtas om de måste kompletteras i rum B788 kl 12-14 Ti 29/5 Till de som måste komplettera skickas ett e-mail Även de som ev fått restuppgifter pga frånvaro från Ö16, måste hämta dessa samma tid Mail skickas även till dem Må 4/ 6 Inlämn / Inlämn av kompletteringar och restuppgifter senast kl 1600 i Svarta lådan plan 7 hus B *ÖH = övningssamling (finns på hemsida) Angående de tentamenstillfällen som ges på moment och moment innevarande termin: se kursschema!
EXAMINATION OCH BETYGSKITEIE ndersökningsmetodik () examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 20 poäng Skrivtiden är fem timmar Betygssättning sker enligt en sjugradig målrelaterad betygsskala För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst För underkänt finns betygen F och Fx, där F är lägre än Fx Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som inte nödvändigtvis direkt behandlas i kursmaterialet Studenten skall själv kunna välja lämplig ansats för lösningen och på ett klart och tydligt sätt argumentera för detta val Studenten skall vidare på ett klart och uttömmande sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar Kräver minst 18 poäng B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa elementära problem inom urvalsoch skattningsteori som direkt behandlas i kursmaterialet Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar Kräver 16-17,75 poäng C (bra): Studenten skall på ett korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet Studenten skall vidare i stort sett uttömmande kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar Kräver 14-15,75 poäng D (tillfredsställande): Studenten skall på ett i huvudsak korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar Kräver 12-13,75 poäng E (tillräckligt): Studenten skall på ett till största delen korrekt sätt kunna lösa elementära problem inom urvals- och skattningsteori som direkt behandlas i kursmaterialet Studenten skall vidare nöjaktigt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av statistiska urvalsundersökningar Kräver 10-11,75 poäng Fx (otillräckligt): Motsvarar 5-9,75 poäng Omtentamen erfordras! F (helt otillräckligt): Motsvarar 0-4,75 poäng Omtentamen erfordras! ndersökningsmetodik (Inlupp ) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp ) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och =underkänd För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport apporten lämnas in senast tisdag 22/5 kl 1600 i den svarta brevlådan på plan 7 i B-huset
egressionsanalys och tidsserieanalys () examineras med en individuell skriftlig tentamen Skrivningen ger maximalt 50 poäng Skrivtiden är fem timmar Betygssättning sker enligt en sjugradig målrelaterad betygsskala För godkänt resultat finns betygen A, B, C, D och E där A är högst och E är lägst För underkänt finns betygen F och Fx, där F är lägre än Fx Följande betygskriterier och poängskala på tentamen gäller: A (utmärkt): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som inte nödvändigtvis direkt behandlas i kursmaterialet Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen Kräver minst 45 poäng B (mycket bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet Studenten skall vidare klart och tydligt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen Kräver 40-44 poäng C (bra): Studenten skall på ett korrekt och välstrukturerat sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet Studenten skall vidare på ett bra sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen Kräver 35-39 poäng D (tillfredsställande): Studenten skall på ett korrekt sätt kunna tillämpa regressions- och tidsserieanalys med tillhörande statistisk inferens och modellutvärdering som direkt behandlas i kursmaterialet Studenten skall vidare på ett nöjaktigt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen Kräver 30-34 poäng E (tillräcklig): Studenten skall på ett huvudsakligen korrekt sätt kunna tillämpa regressions- och tidsserieanalys som direkt behandlas i kursmaterialet Studenten skall vidare på ett huvudsakligen korrekt sätt kunna redogöra för begrepp, metoder och teori som används vid genomförandet av regressionsanalysen Kräver 25-29 poäng Fx (otillräcklig): Motsvarar 20-24 poäng Omtentamen erfordras! F (helt otillräcklig): Motsvarar 0-19 poäng Omtentamen erfordras! egressionsanalys och tidsserieanalys (Inlupp ) examineras i form av en inlämningsuppgift Inlämningsuppgiften (Inlupp ) ska redovisas såväl skriftligt som muntligt och görs som ett grupparbete med tre-fyra studerande i varje grupp Betygssättningen sker enligt en tvågradig målrelaterad betygsskala, där G=godkänd och =underkänd För att bli godkänd krävs aktiv närvaro vid de undervisningstillfällen där närvaro är obligatorisk och en enligt de separata instruktionerna nöjaktigt författad rapport apporten lämnas in senast tisdag 22/5 kl 1600 i den svarta brevlådan på plan 7 i B-huset
SLTBETYG PÅ KSEN För att få godkänt slutbetyg på hel kurs krävs lägst betyg E på moment 1 och 3 samt godkänt på moment 2 och 4 Betyg på momenten 1 och 3 (oberoende av ordning) A+A, A+B A+C, B+B, B+C B+D, C+C, A+D, C+D, A+E, B+E C+E, D+D, D+E E+E Slutbetyg på hela kursen A B C D E Sammanvägt betyg F erhålls alltid då studenten har betyget F på moment 1 och/eller 3 För student som fått betyget F finns inga restriktioner på hur många gånger studenten får genomföra skriftlig tentamen och inlämningsuppgift för att uppnå lägst betyget E ÖVEGÅNGSBESTÄMMELSE Om kursen upphör, ges möjlighet att examineras på kursen vid tre tillfällen under en tvåårsperiod efter det att kursen upphör LÄAE Göran undqvist Föreläsare och examinator (Mom 1-4) um B788 Tfn 16 2990 Mott Må kl 12-13 Karl Hellström Grupplärare (Grupp A och C) um B 795 Tfn 16 2980 Mott Må kl 15-16 Lukas yan Grupplärare (Grupp B) um B 736 Tfn 16 2578 Mott Må kl 13-14 Olivia Ståhl Grupplärare (Grupp D) um B 753 Tfn 16 2972 Mott Må 13-14 Anita Normark Jourlärare um B 782 Tfn 16 2992 Mott Enligt anslag HEMSIDA Kursens hemsida är http://gaussstatsuse/gu/rashtml och kan nås genom att gå till http://wwwstatisticssuse/ och klicka på kurshemsidor och sedan på regressionsanalys På hemsidan finns bland annat schema, kursbeskrivning samt övningshäfte Här kommer även gamla tentor samt formelblad läggas upp under kursens gång Eventuella förändringar av schema mm meddelas likaså via hemsidan!