Institutionen för teknik och naturvetenskap Michael Hörnquist, 1 februari 2013 TNIU66: Statistik och sannolikhetslära Kursinformation 2013 Mål och innehåll Kursens mål och förväntade läranderesultat enligt kursplanen Kursens mål är att ge en introduktion till matematisk modellering av slumpmässiga försök och till statistiska metoder och begrepp. Den skall även visa på tillämpningar relevanta för de program för vilken den ges. Efter genomförd kurs skall du kunna: 1. använda datorstöd för alla beräkningar där det är relevant. 2. analysera fördelningen hos en datamängd avseende centralvärde och spridning, såsom medelvärde och median samt standardavvikelse, samt visualisera detta. 3. redogöra för olika synsätt på begreppet sannolikhet. 4. beräkna sannolikheter för händelser, med användning av begrepp och verktyg som oberoende, betingning, oförenlighet, komplementhändelse, union, snitt, kombinatorik, träddiagram. 5. formulera en sannolikhetsmodell med hjälp av stokastiska variabler, även med centrala gränsvärdessatsen, och använda den för att bestämma egenskaper hos dess fördelning samt beräkna sannolikheter. 6. beräkna punktskattningar av väntevärde, varians, standardavvikelse, sannolikhet och intensitet samt bedöma deras lämplighet. 7. beräkna konfidensintervall för väntevärde (med och utan känd standardavvikelse), sannolikhet och intensitet samt tolka resultatet. 8. formulera och genomföra en hypotesprövning, och däri kunna tolka begreppen styrkefunktion och p-värde. 9. genomföra en korrelationsanalys och tolka resultatet. 10. ställa upp och tolka en linjär regressionsmodell med två variabler, avgöra om en linjär modell är tillämpbar, samt bedöma tillförlitligheten hos skattningar av såväl väntevärden som enskilda observationer. Dessa tio punkter kopplar direkt till kursmomenten och till examinationen, enligt nedan. 1
Kursinnehåll enligt kursplanen Sannolikhetslära: Sannolikhetsbergreppen. Utfallsrum och händelse. Mängdlära och kombinatorik. Betingade sannolikheter, med Bayes sats, och begreppet oberoende händelser. Diskreta och kontinuerliga stokastiska variabler med fördelningsmått såsom väntevärde, varians/standardavvikelse, kovarians och korrelation. De vanligaste sannolikhetsmodellerna, inkluderande likformig-, binomial-, poisson-, exponential- och normalfördelningsmodellen. Centrala gränsvärdessatsen. Statistik: Deskriptiv statistik med begreppen medelvärde, median och standardavvikelse samt visualiseringar. Punkt- och intervallskattningar av väntevärde (med och utan känd standardavvikelse), sannolikhet och intensitet. Punktskattning av varians och standardavvikelse. Hypotesprövning, inklusive P-värde och styrkefunktion. Korrelation. Linjär regression för två variabler med kontroll av förutsättningar samt konfidens- och prediktionsintervall. Förkunskaper En högskolekurs inom matematik, exempelvis matematisk grundkurs för högskoleingjörsstudenter eller matematik för SL och FTL. Gymnasiematematik, åtminstone kurserna MaA MaC. I den mån repetition är nödvändig, är det ditt ansvar att se till detta (givetvis får du dock fortfarande fråga dina lärare). Litteratur, programvara och miniräknare Som kurslitteratur används boken Statistik metoder och tillämpningar, av Gunnar G. Løvås och utgiven av Liber AB, Malmö, 2006. Boken har inte använts vid LiU tidigare, såvitt jag känner till, och det kan därmed nog dessvärre vara svårt att få tag i begagnade exemplar. Bokakademin är meddelad om detta och att ni är 123 studenter som har anmält er till kursen. Eftersom jag kommer att utgå från att du läser boken aktivt, och den även är tillåtet hjälpmedel vid tentamen, rekommenderar jag att om du planerar att läsa kursen seriöst skaffar dig den och börjar läsa redan före första föreläsningen. En gedigen bok i statistik är också något som bör finnas i varje akademiskt utbildad persons bokhylla för framtida bruk; vi kommer inte att täcka mer än de sju första (av tio) kapitlen i den, och när framtida tillämpningar kräver mer statistikkunskaper av dig än kursen tillhandahåller är det bra att ha en lättillgänglig referens som du redan är välbekant med. Det program som kommer att användas för laborationerna är Excel. Det är också nytt för kursen för i år, och orsaken till valet är att jag vill att du skall ha lätt att göra statistiska analyser även efter avslutad kurs. Excel är ett program som du med stor sannolikhet alltid kommer att ha tillgång till. Det är inte idealt för statistik, även om det är helt funktionellt, men specialdesignade program (såsom Minitab, som tidigare har använts i kursen, eller SPSS) är inte lika spridda. I kursen behövs en miniräknare. En modern, grafritande sådan är att föredra, då den oftast innehåller även de vanligaste fördelningsfunktionerna (framför allt normalfördelningen och student t-fördelningen), samt stöd för enklare statistiska beräkningar. Man klarar sig dock också med en mycket enkel räknare med i princip enbart de fyra räknesätten, men måste då vara beredd på att 2
även kunna använda de tabeller som finns längs bak i kurslitteraturen. Du förväntas själv ta reda på hur just din miniräknare fungerar och vilka funktioner den har. Kursplatsen Kursens webbsida ligger under It s learning och kallas Kursplatsen, den kan nås via Studentportalen. Där kan du hitta allt som hör till kursen (i pdf-format), bl.a. denna kursinformation, alla bilder som visas på föreläsningarna samt laborationerna. Inlämning av laborationerna kommer också att skötas via Kursplatsen, liksom återkopplingen. Endast redovisningar inlämnade via detta system kommer att beaktas. Lärare och kontaktytor Samtliga lärare inblandade i kursen träffas säkrast i samband med undervisningen. Enklare frågor av administrativ natur kan även ställas till kursansvarig via e-post michael.hornquist@liu.se eller telefon 011-36 33 81. Examinator, kursansvarig och föreläsare Lektioner och laborationer SL1 Lektioner och laborationer BI1a och FTL1a Lektioner och laborationer BI1b, FTL1b och FTL2 Michael Hörnquist Peter Holgersson Michael Hörnquist Ulf Sannemo Organisation av undervisningen Inlärningen är som vanligt ditt eget ansvar, men som hjälp finns undervisning. Den är upplagd i form av föreläsningar, lektioner, laborationer (lektioner i datorsal med inlämningsuppgifer) samt tentamen, där delarna tydliggörs nedan i avsnittet Generellt om undervisningsmomenten. Kursen är uppdelad i fem moduler av varierande storlek. Dessa syftar direkt till några av lärandemålen, i förhoppningen att det skall bli enklare för dig att se vad du skall kunna efter varje modul. Modul 1: Deskriptiv statistik och datorstöd Denna modul svarar mot lärandemålen 1 och 2. Vi går genom grunderna i deskriptiv (=beskrivande) statistik och inför (eller repeterar) begreppen medelvärde, median och standardavvikelse. Vid laborationen får du beräkna dessa med datorstöd samt träna dig på att visualisera fördelningar. Modulen omfattar Løvås kap. 1, 2.1 5 samt 2.8, och du bör skumma dessa avsnitt före första 3
föreläsningen. 1 Efter föreläsningen förväntas du noga läsa och följa upp ovan angivna avsnitt. Vid den följande lektionen och laborationen är det meningen att begreppen ytterligare skall befästas. Upppgifterna: 2.2, 2.3, 2.5, 2.7, 2.8, 2.9, 2,16, 2.17 Finns på Kursplatsen (inlämnas senast 28 januari 2013). Modul 2: Sannolikhetslära Denna modul svarar mot lärandemålen 1, 3, 4 och 5. Det här är den mest teoretiska delen av kursen, och ger många av de verktyg som behövs för den mer tillämpade statistikdelen. Första föreläsningen behandlar kapitel 3, Sannolikhetsberäkningar, vilket du bör ha tittat lite på i förväg. Uppdelningen av stoff (och uppgifter) i modulen för övrigt därefter meddelas under föreläsningarna. Modulen omfattar de avsnitt som anges nedan under föreläsningsplaneringen. Föreläsningar: Skumma gärna genom nedan angivna avsnitt före respektive föreläsning. Fö a. Løvås: kap. 3.1 6 Fö b. Løvås: kap. 4.1 3 Fö c. Løvås: kap. 5.1 2, 5.5 7 Fö d. Løvås: kap. 4.4, 5.8 Efter varje föreläsning förutsätts du noga läsa och följa upp ovan angivna avsnitt. Vid den följande lektionen och laborationen är det meningen att begreppen ytterligare skall befästas. Lektioner: Le a. Upppgifterna: 3.1, 3.6, 3.7, 3.14, 3.16, 3.21, 3.26, 3.29 Le b. Upppgifterna: 4.1, 4.2, 4.8, 4.12, 4.14 Le c. Upppgifterna: 5.1, 5.4, 5.18, 5.19, 5.26, 5.27 Le d. Upppgifterna: 4.11, 4.15, 4.21, 5.28, 5.29 Modul 3: Punkt- och intervallskattningar Denna modul svarar mot lärandemålen 1, 6 och 7. Normalfördelningen och centrala gränsvärdessatsen är väsentliga förkunskaper för den här modulen. Modulen omfattar Løvås kap. 5.9.2, 6.1, 6.2.1 5, 6.3.1 3, 6.3.5 6, och du bör skumma dessa avsnitt före föreläsningen. Efter föreläsningen förväntas du noga läsa och följa upp ovan angivna 1 På sidan 27 har författaren (eller översättaren) lyckats kalla intervallet < 70 för öppet. Sant, men du som har läst matematik på högskolenivå inser (väl?) att bekymret här är att det är obegränsat. 4
avsnitt. Vid den följande lektionen och laborationen är det meningen att begreppen ytterligare skall befästas. Upppgifterna: 6.10, 6.11, 6.12, 6.14 Finns på Kursplatsen (inlämnas senast 25 februari 2013). Modul 4: Hypotesprövning Denna modul svarar mot lärandemålen 1 och 8. Hypotesprövning är nära relaterat med intervallskattning, och modul 3 och 4 hänger tätt samman. Modulen omfattar kap. 6.4 5, och du bör skumma dessa avsnitt före föreläsningen. Efter föreläsningen förväntas du noga läsa och följa upp ovan angivna avsnitt. Vid den följande lektionen och laborationen är det meningen att begreppen ytterligare skall befästas. Upppgifterna: 6.18, 6.20, 6.23, 6.24 Finns på Kursplatsen (inlämnas senast 5 mars 2013). Modul 5: Korrelation och linjär regression Denna modul svarar mot lärandemålen 1, 9 och 10. Modulen omfattar kap. 7.1 3 (förutom 7.39), och du bör skumma dessa avsnitt före föreläsningen. Efter föreläsningen förväntas du noga läsa och följa upp ovan angivna avsnitt. Vid den följande lektionen och laborationen är det meningen att begreppen ytterligare skall befästas. Upppgifterna: 7.1, 7.4, 7.5, 7.7 Finns på Kursplatsen (inlämnas senast 12 mars 2013). Generellt om undervisningsmomenten Föreläsningar: Genomförs på konventionellt sätt. Föreläsningarna introducerar begrepp och ideer, men förutsätter att du själv studerar de relevanta avsnitten i kurslitteraturen. Om du har kikat 5
på stoffet före föreläsningen kan jag nästan lova att din behållning kommer att öka avsevärt. Alla bilder som visas på föreläsningarna kan laddas ned från Kursplatsen senast vid lunch dagen före. Laborationer, UPG1: Det finns fyra obligatoriska laborationer inlagda i kursen. Till varje sådan finns ett uppgiftsblad med beskrivning av vad du förväntas göra. Du skall också, tillsammans med två andra studenter, skriva en kort redogörelse, en sida, och lämna in. Beräkningarna görs i Excel och grupperna formerar ni själva. Det går bra att variera grupper mellan laborationerna. Alla arbeten lämnas in via Kursplatsen. Om du av någon orsak inte skulle kunna lämna in i tid, eller inte får redovisningen godkänd, erbjuds ytterligare tre möjligheter till inlämning under året (motsvarande omtentamina). Det är då 27 mars, 7 juni samt 31 augusti, 2013, som är sista dag. Notera att vi inte rättar inlämnade dokument kontinuerligt, utan endast i direkt anslutning till sista inlämningsdag. Den student som inte är godkänd på alla fyra laborationer senast i samband med allra sista inlämningstillfället 31 augusti behöver normalt göra om hela momentet UPG1 nästa år. Lektioner: Syftet med lektionerna är att dina frågor som student skall stå i centrum. Den mindre gruppen (jämfört med föreläsningarna) uppmuntrar förhoppningsvis dialog och samtal. Det finns en lektionsplanering, ovan under Organisation av undervisningen som anger vilka uppgifter ur läroboken som kan behandlas vid respektive lektionstillfälle. Du förväntas ha läst, om än inte löst, alla angivna uppgifter före aktuell lektion. Vid lektionstillfället har läraren en diskussion med er kring några av de angivna uppgifterna (vilka avgörs i samråd med gruppen), och övriga förväntas du klara ut efter undervisningspasset, själv eller ihop med andra. Tentamen, TEN1: Tentamen består av sex uppgifter à sex poäng. Dessa kopplar direkt till de fem modulerna (modul två kopplar till två uppgifter) och därmed även till lärandemålen. Notera dock att ämnet är kumulativt i sin uppbyggnad, delarna bygger på varandra, varför senare avsnitt ofta bygger på sådant du tillgodogjort dig i tidigare avsnitt. För betyget n krävs 6n 1 poäng. Tillåtna hjälpmedel på tentamen är kurslitteraturen, dvs Løvås, samt valfri miniräknare. 2 Det får finnas anteckningar i boken, jag förutsätter att du arbetar flitigt med pennan när du studerar, men inga lösa anteckningspapper. Påklistrade sidmarkeringar är dock godkända. Som alternativ kan även tidigare års kurslitteratur, Sannolkhetsteori och statistikteori med tillämpningar, av Blom m.fl., användas som hjälpmedel vid tentamen. Dock inte båda böckerna, Løvås och Blom, utan den tenterande får välja en av dem. Slutord Kunskaper i statistik och sannolikhetslära är väsentliga för nästan alla människor i ett modernt samhälle. Vi översköljs av påståenden baserade på statistik av mer eller mindre tvivelaktig karaktär, och behöver förmågan att kunna skilja det värdefulla från det rena tramset. Som högskoleutbildad inom ett kvantitativt ämne (vare sig det är logistik i någon form eller som ingenjör) har du ett särskilt ansvar att se till att verktyget statistik används på ett sätt som främjar ett gott och hållbart samhälle, och att det klargör samband snarare än förvirrar debatten. Den här kursen bär inte hela den vägen, men den är en god start för ett kreativt användande av starka matematiska verktyg i resten av din utbildning, och förhoppningsvis även i livet efter högskolan. Välkommen till kursen! Michael Hörnquist 2 Miniräknaren i mobiltelefonen är dock inte tillåten vid tentamen, då den ger möjlighet till kontakter med omvärlden. 6