Stockholms Universitet Statistiska Institutionen VT-2009 Kursbeskrivning Statistisk Teori I, grundnivå, 15 högskolepoäng Allmänt Kursen består av två moment: Moment 1. Grundläggande statistisk teori, 12hp. Moment 2. Inlämningsuppgift i grundläggande statistisk teori, 3hp. Kursen ges i lp 3-4 och omfattar 48 timmar föreläsning (F1-F24), 12 timmar plenara räkneövningar (PÖ1- PÖ6), 12 timmar räkneövningar i grupp (Ö1-Ö6) samt 8 timmar datorövning (D1-D4) enligt schema på institutionens hemsida, www.statistics. su.se. Hemsida Kursens hemsida nns på http://www.statistics.su.se/grundutbildning/gk2.shtml och updateras löpande. Studentexpedition Expeditionsansvariga, Hanna Berggren och Hedda Werner Åström sitter i rum B724 i hus B, plan 7, tel. 08-16 2995, e-post Expedition@stat.su.se. Mottagningstid under Måndag Tisdag Torsdag terminstid: 9-10 9-10 * 13-14 13-14 14-16 Kvällsmottagning torsdagar efter överenskommelse. Tentamensresultat anslås i institutionens anslgstavla på plan 3, hus B. Föreläsningar, räkne- och datorövningar Föreläsare/ansvarig lärare och examinator är Tatjana Pavlenko, rum B758, hus B, plan 7, tel. 08-16 25 78, e-post: tatjana.pavlenko@stat.su.se Grupp- och datorövningsledare är Gösta Hägglund, rum B739, e-post: gosta.hagglund@stat.su.se och Robert Standar, rum B780, e-post: Robert.Standar@stat.su.se. Du kan även få hjälp av "jourhavande lärare", Anita Normark, rum B782, tel. 08-16 29 92. Gruppövningar ges i B:419, se gruppindelning vid kursensschema. Föreläsningar och plenara övningar ges i B:4 t o m F2 och i B:3 därefter. Gruppövningar ges i B:419, se gruppindelning i kursschema. Fyra obligatoriska datorövningar ges i B:319, se gruppindelning vid kursens schema. Vid de schemalagda datorövningarna behandlas delar av inlänmimgsuppgiften. Data till inlämningsuppgiften delas ut vid D2. Obs! Följande tillfällen har obligatorisk närvaro: F1, Ö1, Ö6, och D1-D4. Kurslitteratur Newbold, P., Carlson, W.L. och Thorne, B. Statistics for Business and Economics. Sixth Edition, Prentice Hall (Pearson Education, Inc), Upper Saddle River, NJ, 2007. (=NCT) Stenciler Kursprogram (detta blad). Delas på första föreläsnigen, nns i facket på institutionen samt på kursens hemsidan. Föreläsningsanteckningar. Finns bara på kursens hemsida. Läggs ut senast två dagar innan resp. föreläsning. Inlämningsuppgift i grundläggande statistisk teori. Delas ut vid Ö1 och sedan nns tillgänglig på kursens hemsida. MINITAB kompendium. Introduktion till SAS Enterprise Guide 4. Finns på institutionens hemsida. Formelsamling i Statistik. Vidhäftas till den skriftliga tentan. 1
Kursens innehåll Kursen ger en orientering om grunderna i sannolikhetslära och en översikt över metoder för punktskattning, kon densintervall och hypotesprövning i ett antal elementära och vanligt förekommande fall. De begrepp som behandlas mer utförligt är: grundläggande sannolikhetslära, slumpvariabler och deras fördelningar. allmänna principer för statistisk planering och slutledning, punktskattning och intevallskattning, hypotesprövning, parametriska och icke-parametriska metoder, anpassningtest och oberoendetest, enkel och multipel linjär regression, datahantering och statistisk programvara. Kursens innnehåll ger kunskaper av stor nytta vid tillämpningar av statistiska metoder inom era område. Lärandemål Efter att ha genomgått kursen förväntas studenterna kunna: lösa och tolka elementära problem inom sannolikhetslära identi era, lösa och tolka enkla problem vid punktskattning, kon densintervall och hypotesprövning i ett antal elementära och vanligt förekommande fall genomföra en regressionanalys samt illustrera vissa statistiska teoribegrepp med hjälp av statistisk programvara. Examination Kursens två moment examineras enligt följande: Moment 1 (12 högskolepoäng) examineras genom en individuell skriftlig salstentamen bestående av 6 uppgifter, och som kan ge maximalt 24 poäng. Betygsättning sker enligt en sjugradig målrelaterad betygsskala. För godkänt resultat krävs något av betygen A,B,C,D eller E, där A är högst och E är lägst. Underkänt resulat ger någon av betygen F eller Fx, där F är lägre än Fx. Moment 2 (3 högskolepoäng) examineras genom en obligatorisk inlämningsuppgift vilken görs som grupparbete med 2-3 personer i varje grupp, och består av ett antal deluppgifter som skall lösas och redovisas skriftligt. Betygsättning sker enligt en tvågradig målrelaterad betygskala med betygen Godkänd och Underkänd. För godkänt resultat på inlämningsuppgiften som helhet krävs att samtliga deluppgifter är nöjaktigt behandlade. Den som inte godkännas på hela inlämningsuppgiften under kursens gång kan inte tillgodoräkna sig eventuellt avklarade deluppgifter kommande terminer. För att få godkänt slutbetyg på hela kursen krävs 1. lägst betyget E på skriftlig tentamen (Moment 1) och 2. godkänt resultat på inlämningsuppgiften (Moment 2). Betyget på Moment 1 blir slutbetyget på hela kursen. Bedömning För respektive kursmoment gäller följande betygskriterier: Moment 1. Betyg Betygskriterium Tentamenresultat A (Utmärkt) Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa och tolka elementära sannolikhetsteoretiska och statistika problem som inte nödvändigtvis direkt behandlas i kursmaterialet. Studenten skall kunna identi era vilka metoder och modeller som är lämpliga att använda vid problemlösning samt på ett klart, tydligt och fullständigt sätt argumentera för detta val. Studenten skall dessutom visa en mycket god förmåga att föra logiska resonemang med korrekt och lämpligt statistiskt språk. 23-24 poäng 2
Betyg Betygskriterium Tentamensresultat B (Mycket bra) Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa och 20-22 poäng tolka elementära sannolikhetsteoretiska och statistika problem som direkt behandlas i kursmaterialet. Studenten skall kunna identi era vilka metoder och modeller som är lämpliga att använda vid problemlösning samt på ett klart och tydligt sätt argumentera för detta val. Studenten skall dessutom visa en god förmåga att föra logiska resonemang med korrekt och lämpligt statistiskt språk. C (Bra) Studenten skall på ett korrekt och välstrukturerat sätt kunna lösa och 16-19 poäng tolka elementära sannolikhetsteoretiska och statistika problem som direkt behandlas i kursmaterialet. Studenten skall dessutom visa nöjaktigt förmåga att föra logiska resomenang med korrekt och lämpligt statistiskt språk. D (Tillfredsställandenolikhetsteoretiska Studenten skall på ett korrekt sätt kunna lösa och tolka elementära san- 13-15 poäng och statistika problem som direkt behandlas i kurs- materialet. Studenten skall visa en grundläggande förmåga att föra logiska resonemang med acceptabelt statistiskt språk. E (Tillräckligt) Studenten skall visa en grundläggande förmåga att lösa och tolka elementära 11-12 poäng sannolikhetsteoretiska och statistika problem som direkt be- handlas i kursmaterialet. Studenten skall visa en grundläggande förmåga att föra logiska resonemang även om det statistiska språket är torftigt. Fx (Otillräckligtmentära Studenten uppvisar allvarliga brister i sin förmåga att lösa och tolka ele- 7-10 poäng problem inom sannolikhetslära och statistik samt i sin förmåga F (Helt otillräckligt) att föra logiska resonemang. Studenten kan inte lösa elementära sannolikhetsteoretiska och statistika problem som direkt behandlas i kursmaterialet. 0-6 poäng Moment 2. Betyg Betygskriterium Examinationsresultat Godkänd Studenten skall visa tillräcklig förmåga att genomföra regressionanalys, kunna illustrera grundläggande statistiska teoribegrepp med hjälp av statistisk programvara samt redovisningen skall vara lätt att följa och förstå. Inlämningsuppgift bedöms som godkänd. Ej godkänd Studenten visar otillräcklig förmåga att genomföra regressionanalys eller saknar förmåga att illustrera grundläggande statistiska teoribegrepp med hjälp av statistisk programvara eller redovisningen är omöjligt att följa och förstå. Inlämningsuppgift bedöms som underkänd. Tentamen Skriftlig tentamen, 5 timmar. Ordinarie tentamen ges torsdag 4 juni kl. 14.00-19.00, Värtasalen. Tentamensgenomgång ges tisdag 16 juni, kl. 16.00, B:419. Omtentamen ges tisdag 18 augusti kl. 10.00-15.00, Laduvikssalen. Tentamensgenomgång meddelas senare. Tillåtna hjälpmedel: Formelsamling, Statistiska tabeller, miniräknare. Obs! Tentamensanmälan måste göras senast en vecka före tentamensdatum (anmälan krävs för både ordinarie tentamenstilfälle och omtentamen). Anmälan görs via www.mitt.su.se, eller på anmälningslista i pärmen utanför studentexpeditionen i hus B, plan 7. Tentamensresultat anslås i institutionens anslgstavla på plan 3, hus B. Kursprogram. Vidare ges ett preliminärt program för kursen 3
Kursavsnitt: Sannolikhetslära F/PÖ/Ö/D Ämne Läs Repetera V.1 F1 Introduktion. Slumpens lagar - om olika sätt att beskriva variation. Enkel beskrivande statistik - repetition. Kombinatorik. Kap. 3, kap. 4: Appendix F2 Sannolikhetslära, slumförsök, utfallsrum, händelse, sannolikhet, klassisk sannolikhetsde nition. Räknereglar för sannolikheter. Kap. 4.1-4.2 Den som inte gått mom. 1: kap.2.4-2.5 samt kap 3. Mängdlära. F3 Betingad sannolikhet, multiplikationssatsen, oberoende Kap. 4.3-4.4 3, 4 händelser, satsen om total sannolikhet. F4 Bayes' sats. Några blandade sannolikhetsproblem. Kap. 4.5 3, 4 V.2 F5 Stokastiska variabler. Sannolikhetsfördelning för en Kap. 5.1-5.3, Kap.3.1 diskret stokastisk variabel. Sannolikhetsfunktion och del av 5.4 fördelningsfunktion. Väntevärde, varians och standardavvikelse. Räkneregler. Bernullifördelningen. F6 Binomialfördelningen, hypergeometriska fördelningen, Poissonfördelningen. Approximation till binomialfördelningen. PÖ1 4.28, 4.42, 4.84, 5.6, 5.10, 5.12. 5.14 F7 Simultant fördelade stokastiska variabler. Oberoende stokastiska variabler. Kovarians och korrelation för observerade data (repetition). KorrelationskoeYcient. Väntevärde och varians för summor. Ö1 4.2, 4.6, 4.8, 4.12, 4.14, 4.22 V.3 F8 Kontinuerliga stokastiska variabler och sannolikhetsfördelningar. Täthetsfunktion och fördelningsfunktion. Väntevärde och varians för en kontinuerlig stokastisk variabel. Normalfördelningen, beräkning av sannolikheter för standard och godtycklig normalfördelning. Summor av normalfördelade stokastiska variabler. Approximation med normalfördelningen. F9 Sampling och samplingsfördelningar. Samplingsfördelningen för ett stickprovsmedelvärde. Centrala gränsvärdessatsen. Samplingfördelningen för stickprovsproportion, stickprovsmedelvärde och stickprovsvarians. χ 2 -fördelning. PÖ2 7.2, 7.4, 7.6, 7.15, 7.24, 7.30 Kap.5.4-5.6 Appendix: Permutations and Combinations, p.131 Kap. 5.7. Kap. 2.5, 3.4 Kap. 6.1-6.4, 6.6 Kap. 5.4, 5.7. Kap. 7.1-7.4 Kap. 3.2-3.4, 6.3 Kursavsnitt: Statistisk inferens F10 Punktskattning i allmänhet. Skattning av populationsmedelvärde, populationsproportion och populationsvarians. Intervallskattning i allmänhet. Intervallskattningar för normalfördelningen. Kon densintervall för ett populationsmedelvärde, t-fördelningen. Ö2 5.24, 5.26, 5.36, 5.40, 5.50, 5.52 D1: Grp A-C Kap. 8.1-8.3 Kap. 3.2, kap.6.3, kap. 7.2 4
F/PÖ/Ö/D Ämne Läs Repetera V.4 D1: Grp D-E F11 F12 Kon densintervall för en proportion. Kon densintervall för variansen i en normalfördelad population. Hur stort stickprov? Kon densintervall för diverensen mellan två populationsmedelvärde. Kon densintervall för diverensen mellan två populationsproportioner. Parvisa observationer. PÖ3 8.4, 8.6, 8.14, 8.18, 8.26, 8.27 F13 Hypotesprövning i allmänhet. Hypotesprövning för normalfördelning. Hypotesprövning för ett medelvärde. Ö3 6.2, 6.8, 6.9, 6.10, 6.12, 6.16, 6.32 D2: Grp A-C V.5 D2: Grp D-E F14 F15 Hypotesprövning för en proportion och en varians. Hypotesprövning med p-värde. Hypotesprövning - kon densintervall: samband. Styrkan hos en test. Regressionsanalys. Enkel linjär regression. Skattning av korrelation. Anpassning av rätt linje till stickprovsdata-regressionsmodell. Residualer, kvadratsummor, ANOVA-tablå, MINITAB-utskrift. Punktskattning av modellparametrarna. PÖ4 9.27, 9.28, 9.34, 9.40, 9.46, 9.50 F16 Multipel regressionsanalys. Minsta-kvadratmetoden och anpassning av linjär funktion till givna data. DeterminationskoeYcienten. Ö4 8.32, 8.40, 8.48, 8.52, 9.6, 9.16 D3: Grp A-C V.6 D3: Grp D-E F17 F18 Regressionsanalys, forts. Kon densintervall och hypotesprövning för β 1. Prediktion av y för ett nytt x-värde och skattning av förväntat y för ett nytt x-värde. Genomgång av MINITAB-exempel. Multipel regressionsanalys, forts. Modell för multipel linjär regression. Statistisk inferens om modell parametrarna. Genomgång av MINITAB-exempel. Dummyvariabler. Korrelationsanalys. PÖ5 10.11, 10.25, 10.35, 10.43, 11.4, 11.18, 11.28, 11.40, 11.48 F19 Hypotesprövning för en diverens mellan två medelvärden och två proportioner. Parvisa observationer. Ö5 10.6, 10.18, 10.21, 10.28, 10.34, 10.40 Kap. 8.4, 9.4-9.5 Kap. 9.1-9.3 Kap. 3.2, χ 2 - fördelning, kap.7.4. Kap.7.3-7.4 Kap. 10.1-10.3 Kap.7.3-7.4, kap. 8.3 Kap. 10.2, Kap. 7.3-7.4 10.4-10.5, 11.5 Kap. 12.1-12.4 Kap. 3.4-3.5, kap.8.1. Kap. 13.1-13.3, 13.9 Kap. 12.5-12.7 Kap. 12.1, 13.1-13.6,13.8-13.9 Kap. 11.1-11.2 Kap. 3.4-3.5, kap. 6.3-6.4 Kap.7.2-7.3 5
F/PÖ/Ö/D Ämne Läs Repetera V.7 F20 Icke-parametriska metoder. Teckentest. Stort stickprov Kap. 15.1, Kap. 6.3-6.4, och normalapproximation. Mann-Whitneys U-test. 15.3-15.4 kap.7.2 F21 χ 2 -test. Test av anpassning: fördelning med skattade Kap. 16.1-16.2 parametrar. PÖ6 12.45, 12.47, 12.55, 13.14, 13.25, 13.35, 13.37 D4: Grp A-E F22 χ 2 -test, forts. Test av oberoende i korstabell. Genom- Kap. 16.3 Kap. 7.4 gång av MINITAB-exempel. V.8 F23-25 Repetition och genomgång av gamla tentor. V.9 PÖ7 15.1. 15.6, 15.8, 15.11, 15.15, 15.22 PÖ8 16.1, 16.3, 16.6, 16.12, 16,18, 16.28, 16.34 Ö6 Återlämning och genomgång av inlämningsuppgift. 6