STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-08-29 MC Beskrivning av och preliminära läsanvisningar till Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng. KURSBESKRIVNING Momentet bygger på grundkursens andra moment, statistisk teori, och de begrepp som introducerades där kommer att fördjupas och vidareutvecklas och därmed mycket nytt att introduceras. Momentet kan delas in i tre block; vi kommer att behandla olika begrepp dels inom statistisk teori, och dels inom regressionsanalys. För att helt kunna tillgodogöra sig dessa nya kunskaper krävs dock en viss förståelse av och förmåga att använda grundläggande matematiska begrepp och verktyg. Därför inleds kursen med en introduktion i matematisk analys. En kortfattad beskrivning av kursens innehåll och de begrepp som kommer att behandlas inom respektive block ges nedan. 1. Matematik (6 föreläsningar och 4 räkneövningar) Allmänt om funktioner. Gränsvärdesbegreppet. Derivering och partiella derivator. Max-min problem. Exponential- och logaritmfunktioner. Integration. 2. Sannolikhetslära och Inferensteori (10 föreläsningar, 6 räkneövningar samt 2 datorövningar) Sannolikhetslära, Bayes sats. Stokastiska variabler och sannolikhetsfördelningar. Väntevärden. Multivariata fördelningar, marginal- och betingade fördelningar. Stickprovsteori, stora talens lag, centrala gränsvärdessatsen. Skattningsmetoder, minsta kvadrat- (MK) och maximumlikelihoodmetoden (ML). Egenskaper hos skattningar. Intervallskattning och hypotesprövning. 3. Regressionsanalys (8 föreläsningar, 3 räkneövningar samt 2 datorövningar) Enkel och multipel regression. Konfidens- och prediktionsintervall. Hypotesprövning. Samspelseffekter och confounding. Modelldiagnostik och residualanalys. Stegvis regression och val av bästa modell. Korrelation. Dummyvariabler och introduktion till variansanalys. Polynomregression. Logistisk regression. Även om tillämpningsexempel kommer att behandlas är det värt att notera att momentets tyngdpunkt ligger på de teoretiska aspekterna. En grundläggande förståelse av de bakomliggande teorierna och statistiska modellerna är nödvändig när data skall analyseras, oavsett tillämpningsområde. Utan dessa blir det svårt, för att inte säga omöjligt, att avgöra en modells hållbarhet och att göra korrekta tolkningar av resultat från en statistisk analys. Det är främst blocken 2-3 som kommer att examineras i tentamen, men observera att det kommer att krävas att ni kan använda er av matematiken i block 1 för att fullständigt klara samtliga uppgifter. UNDERVISNING Undervisningen består av 24 föreläsningar (F), 13 räkneövningar (Ö) samt 4 datorövningar (D). En preliminär plan över undervisningens innehåll och övningsuppgifter ges på följande sidor. Uppgifter och instruktioner för datorövningarna delas ut i samband med undervisningen. Det rekommenderas starkt att ni försöker lösa övningsuppgifterna innan räkneövningarna, gärna i grupp. Ni bör dessutom försöka lösa andra övningsuppgifter utöver de nedan angivna. Matematik och även statistik är något av ett hantverk och förståelsen underlättas betydligt med ökad erfarenhet av problemlösning; ''Learning how to solve problems is best done by solving a lot of problems''.
LITTERATUR (S) Sydsæter K., Matematisk Analys för Ekonomer, med en inledning till matrisräkning, Stockholm: SHL Statistisk analys AB, (1991), används under block 1. (H) Hogg, R.V., och Tanis E.A., Probability and Statistical Inference, 7.e upplagan, Prentice Hall, (2001), används under block 2. (Obs!. Denna bok är även kurslitteratur på påbyggnadskursens första moment, Statistisk Teori.) (K) Kleinbaum, D.G., Kupper, L.L., Muller, K.E. & Nizzam, A. Applied Regression Analysis and Other Multivariate Methods, 3.e upplagan, Pacific Grove, Duxbury Press, (1998), används under block 3. Tabeller över statistiska fördelningar, Lund, Studentlitteratur, 1994 samt eventuellt utdelat material. Föreläsnings-OH mm, se nedan. LÄRARE Michael Carlson, rum B774, tel.: 16 29 20, mottagning: måndagar 13.00-14.00 alternativt 14.30-15.30 beroende på schemat. E-post: Michael.Carlson@stat.su.se Jourlärare är Anita Normark, rum B782. Hos henne kan ni få hjälp med uppgifter ni fastnat på. Mottagnings- och telefontider meddelas på institutionens anslagstavlor och hemsida (se nedan). EXAMINATION Examination sker genom två separata skriftliga hemtentor som vardera motsvarar 5 poäng. Tentamen 1, Sannolikhetslära och Inferensteori, hemtentamen som lämnas ut i samband med föreläsning F16, måndag 21 februari och lämnas in vid F17 fredag 25 februari. Återlämning och tentamensgenomgång sker onsdag 9 mars kl. 10.00 i B705. Omtentamen 1, lämnas ut vid tentamensgenomgången onsdag 9 mars kl. 10.00 i B705 och lämnas in vid F23 måndag 14 mars. Återlämning och tentamensgenomgång sker måndag 21 mars kl. 9.00 i B705. Tentamen 2, Regressionanalys, hemtentamen som lämnas ut i samband med sista föreläsningen F24, torsdag 17 mars och lämnas in måndag 21 mars kl. 9.00 på studentexpeditionen. Återlämning och tentamensgenomgång sker onsdag 30 mars kl. 9.00 i B705. Omtentamen 2, lämnas ut vid tentamensgenomgången onsdag 30 mars kl. 9.00 i B705 och lämnas in måndag 4 april kl. 9.00 på studentexpeditionen. Återlämning och tentamensgenomgång sker onsdag 13 april kl. 9.00 i B705. Examinator är Michael Carlson. Under respektive tentamensperioder finns Michael Carlson tillgänglig för frågor enligt tidpunkter angivna på tentamen och schemat. Om man har genomfört och fått godkänt på de frivilliga inlämningsuppgifterna (se nedan) får man tillgodoräkna sig poäng vid respektive tentamen. Statistik FK mom 1, Statistisk Teori, HT 2004 MC
INLÄMNINGSUPPGIFTER Under kursen kommer ett antal inlämningsuppgifter att delas ut. Uppgifterna är frivilliga men de studenter som väljer att genomföra dessa kommer att få tillgodoräkna sig extrapoäng på respektive tentamen förutsatt ett nöjaktigt resultat. Observera att dessa inlämningsuppgifter inte kan tillgodoräknas kommande terminer. 1. Inlämningsuppgifterna under del 2, Sannolikhetslära och Inferensteori, består av övningsuppgifter, främst ur kurslitteraturen, som skall lösas och redovisas skriftligt. Därefter ska ni rätta och kommentera någon annans lösningar. 2. Inlämningsuppgiften under del 3, Regressionsanalys, består av en skriftlig redovisning av datorövningarna D3-D4. Därefter ska ni i gruppen rätta och kommentera någon annan grupps redovisning. Särskilda anvisningar delas ut senare i samband med undervisningen. INFORMATION PÅ INSTITUTIONENS HEMSIDA Allmän information om institutionen (expeditionstider, telefonnummer, schema etc.) finns utlagd på institutionens hemsida, www.statistics.su.se. Föreläsnings-OH, övningstentor, instruktioner till datorövningarna m.m. i PDF-format kommer att finnas tillgängligt på hemsidan via > Grundutbildning > Fortsättningskurs.
FÖRELÄSNINGAR Pass Kapitel Innehåll 1. Matematik (se not 1 nedan) F1 S 2 (ej sid 75-78) Introduktion, funktioner F2 S 3, 4.5 Derivator, gränsvärden F3 S 4.6, 5.1-5.2, 5.6 Derivator, forts., tillämpningar, kontinuerliga funktioner, maxmin problem F4 S 6.1-6.3, 6.6, 7.1-7.2 Exponential- och logaritmfunktionen, inversa funktioner, funktioner av flera variabler, aritmetiska och geometriska talserier F5 S 7.3, 9.1, 10.1-10.3 Funktioner av flera variabler forts., integration F6 S 10.5-10.7, 11.5 Integration, forts., något om dubbelintegraler 2. Statistisk teori (se not 2 nedan) F7 H 1.1-1.6 Sannolikheter, kombinatorik, betingade sannolikheter, oberoende händelser, Bayes sats F8 H 2.1-2.4, 2.6 Diskreta slumpvariabler och deras sannolikhetsfördelningar, väntevärden F9 H 3.1-3.4, 5.2, 4.1 Kontinuerliga slumpvariabler, täthetsfunktioner, väntevärdesberäkning mm, inledning till multivariatafördelningar F10 H 4.2-4.3, 5.6, 4.5-4.6 Multivariata sannolikhetsfördelningar, korrelation, betingade fördelningar, stickprovsteori, summor av oberoende slumpvariabler F11 H 5.1, delar av 5.3, 5.4-5.5, 4.7 F11 Reserv Centrala gränsvärdessatsen, approximationer till diskreta fördelningar, t- och F-fördelningarna, Tjebysjevs olikhet, stora talens lag F13 H (6.1) 6.2 Punktskattning, maximum likelihood- (ML), minsta-kvadrat- (MK) och momentskattningar F14 H 6.4-6.8 Konfidensintervall, stickprovsstorlek F15 H8.1-8.3, 8.5-8.6 Hypotesprövning F16 Reserv / Repetition 3. Regressionsanalys F17 K 4-5 Introduktion till regressionsanalys, enkel linjär regressionsanalys F18 K 6-7 Korrelation och enkel linjär regressionsanalys, ANOVA-tablåer F19 K 8-9 Multipel regressionsanalys, hypotesprövning F20 K 11-12 Forts hypotesprövning, confounding, samspel, modelldiagnostik F21 K 12, 16 Forts modelldiagnostik, val av bästa modell, kriterier för modellval, stegvis regression F22 K 13, 14, 17 Polynomregression, dummyvariabler, variansanalys F23 K 23 + stencil Logistisk regression, odds, oddskvoter F24 Reserv / Repetition Not 1: Rekommenderad läsning i Sydsæter, hela kapitel 1 samt Appendix A och B1-2. Not 2: De delar i Hogg & Tanis som ej behandlas här ingår istället i påbyggnadskursens moment 1, Statistisk teori, 5p. Statistik FK mom 1, Statistisk Teori, HT 2004 MC
ÖVNINGAR Pass Kapitel Övningsuppgifter som övningsläraren väljer bland 1. Matematik Ö1 S kap 2-3 2.2: 1, 10, 14; 2.3: 1, 4; 2.4: 1; 2.5: 1, 3; 2.6: 1, 6; 2.8: 1, 6; 3.4: 1, 4c-f Ö2 S kap 3-4 3.5: 1, 3, 6; 3.6: 1, 3, 9b-c; 3.7: 1, 3; 3.8: 1; 4.5: 1, 5; 4.6: 1, 7 Ö3 S kap 5-7 5.1: 1, 2; 5.2: 1, 6; 5.6: 3, 9; 6.1: 1, 2, 6; 6.2: 1, 5; 6.3: 1, 2, 9; 6.6: 3, 5; 7.1: 7; 7.3: 1 Ö4 S kap 9-11 9.1: 1, 2; 10.1: 1, 2; 10.2: 1, 2; 10.3: 1, 3; 10.5: 1, 2; 10.6: 1, 4; 10.7: 1, 2; 11.5: 1, 2 2. Statistisk teori Ö5 H kap 1 1.2-2, 4, 13, 15; 1.3-1, 2, 5; 1.4-1, 4, 5, 6, 9, 17; 1.5-1, 3, 5, 17; Ö6 H kap 1-2 1.6-1, 9; 2.1-1, 3, 5; 2.2-3, 5; 2.3-3; 2.4-3, 5, 9, 18; 2.6-1, 4, 8; Ö7 H kap 3-5 3.1-3; 3.2-1, 9; 3.3-5; 3.4-2, 13a; 5.2-1, 9, 11; 4.1-1, 9, 11; 4.2-1, 7; Ö8 H kap 4-5 4.3-1, 13; 5.6-1, 5; 4.5-1, 3, 9; 4.6-1, 7b-c, 17a-c; 5.4-1, 5, 9; Ö9 H kap 5-6 5.5-1, 7, 9, 14; 6.2-1, 3, 13, 17; 6.4-1, 5, 7, 12; 6.5-1, 9; 6.6-1; Ö10 H kap 6, 8 6.7-1a-b+d, 13; 6.8-1, 5; 8.1-1, 2, 7, 13, 20; 8.2-1, 6, 11; 8.3-10; 8.5-7, 9; 8.6-14 3. Regressionanalys Ö11 K kap 5-6 5: 2; 6: 1, 2, 3 Ö12 K kap 7-9 7: 1, 5; 8: 1; 9: 1, 3 Ö13 K kap 17, 23 17: 1a-e; 23: 1; DATORÖVNINGAR Instruktioner för datorövningarna delas ut i samband med undervisningen. Pass Övningsuppgift D1 D2 Sannolikhetsteori, centrala gränsvärdessatsen Statistisk inferens, jämförelser av estimatorer D3 Regressionsanalys 1 (inlämningsuppgift 2) D4 Regressionsanalys 2 (inlämningsuppgift 2)