Statistikens grunder. Webbsajt och kursinfo HT, dagtid Statistiska institutionen

Relevanta dokument
Kurshemsidan. Statistikens grunder, 15p dagtid. Kursens upplägg. Kursens upplägg.

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng (preliminär)

Statistikens grunder HT, dagtid Statistiska institutionen

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng (kvällskurs)

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng, ST111G

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

F2 SANNOLIKHETSLÄRA (NCT )

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng, ST111G

F9 SAMPLINGFÖRDELNINGAR (NCT

Kursbeskrivning för Statistikens grunder, 15 högskolepoäng, ST111G, kvällstid

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Kursbeskrivning för Statistisk teori med tillämpningar, 15 hp

Välkommen till Matematik 3 för lärare!

Kursbeskrivning för Statistisk teori med tillämpningar, 15 hp

1.1.1 Innehåll Momentet består av 24 föreläsningar som behandlar: Beskrivande statistik, Grundläggande sannolikhetslära. Stokastiska variabler.

732G01/732G40 Grundläggande statistik (7.5hp)

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

Föreläsning 5. Kapitel 6, sid Inferens om en population

Studiehandledning S0001M Matematisk statistik Läsperiod 2, HT 2017

Föreläsning 7: Punktskattningar

Beskrivning av och preliminära läsanvisningar till Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

Kursen ingår i civilekonomprogrammet samt kandidatprogrammet i företagsekonomi.

för att komma fram till resultat och slutsatser

Kursbeskrivning för Statistisk teori med tillämpningar, Moment 1, 7,5 hp

Föreläsning G60 Statistiska metoder

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

VT 15 Uppdaterad

FÖRELÄSNING 3:

Exempel för diskreta och kontinuerliga stokastiska variabler

Introföreläsning i S0001M Matematisk statistik Läsperiod 2, HT 2018

Studiehandledning S0001M Matematisk statistik Läsperiod 2, Ht 2013

Studiehandledning S0001M Matematisk statistik Läsperiod 4, VT 2017

Kursbeskrivning för statistisk teori med tillämpningar I + II, 15 hp

Föreläsning 7: Punktskattningar

Introföreläsning i S0001M, Matematisk statistik LP3 VT18

TEORINS ROLL I DEN VETENSKAPLIGA KUNSKAPSPRODUKTIONEN

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Kursbeskrivning för statistisk teori med tillämpningar I + II, 15 hp

TMS136. Föreläsning 2

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Stockholms Universitet Statistiska Institutionen VT Kursbeskrivning. Statistisk Teori I, grundnivå, 15 högskolepoäng

TMS136. Föreläsning 1

SF1901 Sannolikhetsteori och statistik I

Matematik och statistik NV1, 10 poäng

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Sannolikhetslära och statistik, grundkurs

STOCKHOLMS UNIVERSITET HT 2013 Statistiska institutionen Göran Rundqvist,

Studiehandledning S0008M Sannolikhetslära och statistik Läsperiod 1, HT 2017

Statistik 1 för biologer, logopeder och psykologer

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Sannolikhet och statistik 1MS005

STOCKHOLMS UNIVERSITET VT 2013 Statistiska institutionen Termeh Shafie

Slumpvariabler och sannolikhetsfördelningar

TMS136. Föreläsning 2

4 Diskret stokastisk variabel

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Kap 2: Några grundläggande begrepp

Kapitel 2. Grundläggande sannolikhetslära

Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap K så måste alltså: Lite kunskaps- och vetenskapsteori

2. VETENSKAP. 2.1 Kunskapsbegreppet. En central fråga i vetenskapsteorin är vad kunskap är. När vi pratar om

STOCKHOLMS UNIVERSITET HT 2010 Statistiska institutionen Linda Wänström (moment 1 och 2) Jörgen Säve-Söderbergh (moment 3 och 4)

Kursbeskrivning för Grundläggande statistik för ekonomer, 15 högskolepoäng, STE101

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

1 Mätdata och statistik

Kursbeskrivning för Ekonometri, 15 högskolepoäng

Finansiell statistik, vt-05. Allmän information. Johan Koskinen. F1(a) Allmän information

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Matematisk statistik TMS064/TMS063 Tentamen

HD-metoden och hypotesprövning. Vetenskapliga data

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

ÄMAD04, Matematik 4, 30 högskolepoäng Mathematics 4, 30 credits Grundnivå / First Cycle

STOCKHOLMS UNIVERSITET HT 2012 Statistiska institutionen Göran Rundqvist

KURSBESKRIVNING REGRESSIONSANALYS OCH UNDERSÖKNINGSMETODIK, 15HP INNEHÅLL VT14 ST123G. Kursen utgörs av två delkurser:

Föreläsning 8: Konfidensintervall

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Matematisk statistik - Slumpens matematik

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

STOCKHOLMS UNIVERSITET HT 2011 Statistiska institutionen Bertil Wegmann

Kap 3: Diskreta fördelningar

Föreläsning 3. Positivistiska teorier 1

Föreläsning 7: Punktskattningar

TAMS79: Föreläsning 1 Grundläggande begrepp

Samplingfördelningar 1

4.1 Grundläggande sannolikhetslära

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Transkript:

Statistikens grunder 2013 HT, dagtid Statistiska institutionen Webbsajt och kursinfo http://www.statistics.su.se Student Kurshemsidor Statistikens grunder, dagtid Läs kursbeskrivningen! MONDO: https://mondo.su.se/portal Logga in, välj kursen/fliken Statistikens grunder, dag 2013-08-29 Michael Carlson, Statistiska institutionen 1

Kurslitteratur Nyquist, H., Statistikens grunder, kompendium (N) finns att ladda ner på kurshemsidan & Mondo Thurén, T. (2007), Vetenskapsteori för nybörjare, 2:a upplagan, Liber: Stockholm (T) Övrigt kursmaterial såsom övningstentor, instruktioner till datorövningarna m.m. läggs löpande ut på Mondo Lärare på kursen Michael Carlson Kursansvarig, föreläsare, examinator Karl Hellström Lisa Nikiforova Karin Stål Mikael Havasi Övningslärare Grupp A Övningslärare Grupp B Övningslärare Grupp C Övningslärare Grupp D 2

Kursens upplägg Kursen består av fyra moment i två block: SG1: Moment 1: tentamen (6 poäng) Salsskrivning + frivillig uppgift Moment 2: inlämningsuppgift (1,5 poäng) Två deluppgifter som redovisas skriftligt och första även muntligt SG2: Moment 3: tentamen (6 poäng) Salsskrivning + frivillig uppgift Moment 4: inlämningsuppgift (1,5 poäng) Två deluppgifter som redovisas skriftligt Kursens upplägg Frivillig inlämningsuppgift Ger bonuspoäng på Moment 1 resp. 3 Övningsuppgifter som lämnas in skriftligt; sedan rättar ni någon kurskamrats lösning Betyg: Moment 1&3: A, B, C, D, E, Fx,F Moment 2&4: Godkänd, Underkänd Slutbetyg på hela kursen enligt Kursbeskrivningen 3

Betyg SG2 A B C D E SG1 A A A B C C B A B B C C C B B C C D D C C C D D E C C D D E + Godkänt på Moment 2 och 4 Kursens innehåll SG1: Vetenskap, modeller, kunskapsbildning Lite matematik, repetition Sannolikheter utfallsrum, händelser, sannolikheten för en händelse Stokastiska variabler, slumpvariabler diskreta och kontinuerliga 4

Kursens innehåll SG2: Deskription, beskrivande statistik Sampling, centrala gränsvärdessatsen (CGS) Estimation, punktskattning och intervallskattning Hypotesprövning Chi-två metoden (χ 2 -metoden) Tidsserier och index Beslutsteori Vad är det som krävs i tid? Lärarledd undervisning - föreläsningar 2 23 - räkneövningar 2 17 - datorlabbar 2 6 92 h Läsning egen tid Övningar/inluppar Restid Totalt Nio veckor heltid 100 h 100 h ca 70 h 362 h 360 h 5

Matematik Allmän räknefärdighet, använda lite sunt förnuft, t.ex. bedöma om en lösning verkar rimlig eller ej Förstå vad en formel säger, kunna uttrycka sig med hjälp av formler Elementär algebra, funktioner, summatecken, mängdlära, kombinatorik, potenser och logaritmer Lästips: Mot bättre vetande i matematik, Dunkels et al. Studentlitteratur, 3.e uppl. Ej kurslitteratur på Statistik I, men se avsnitt 1-3 och 5 Kurslitteratur på Statistik II Sannolikheter och slumpförsök SG1 Vi kommer att tala om sannolikheter i samband med slumpförsök. Ett slumpförsök är ett försök, som kan upprepas under likartade förhållanden, och där resultatet vid varje enskild upprepning inte kan förutsägas med säkerhet. Försök i vid mening (aktivitet, process, förlopp) 6

Sannolikheter, forts. SG1 Exempel på slumpförsök: Tärningskast (1, 2, 3, 4, 5 eller 6) Lottdragning (vinst eller förlust) Befruktning av äggcell (pojke eller flicka) Radioaktivt sönderfall (antal partiklar under ett visst tidsintervall) Industriell tillverkning av en enhet (fungerar eller trasig) Slumpmässigt urval från en population (vilka blir utvalda) Stokastisk variabel SG1 En stokastisk variabel är en kvantitativ variabel (numerisk, tal, siffror) vars värde bestäms av ett slumpförsök. Annat namn: slumpvariabel Utfallet av slumpförsöket bestämmer vilket värde (tal) den stokastiska variabeln ska anta. Vi kan i förväg ange vad som möjliga värden och sannolikheterna för dessa. 7

Stokastisk variabel, forts. Exempel på stokastiska variabler: SG1 Antal prickar vid ett kast med en tärning Summan av antal prickar vid två tärningskast Antal kast tills man för första gången får en sexa Antal flickor i en slumpmässigt vald trebarnsfamilj Längden hos ett slumpmässigt valt nyfött barn Livslängden hos en slumpmässigt vald glödlampa Årsinkomsten i ett slumpmässigt valt hushåll Vilka är de möjliga värdena för dessa stokastiska variabler? Stokastisk variabel, forts. SG1 En diskret stokastisk variabel kan anta ett ändligt antal möjliga värden eller oändligt men uppräkneligt antal värden ( listbara ). En kontinuerlig stokastisk variabel kan anta alla värden inom ett intervall på den reella talaxeln (intervallet kan ha ändlig eller oändlig utsträckning). 8

Sannolikhetsfördelningar SG1 Utifrån ganska standardmässiga slumpförsök och experiment kan vi definiera de möjliga utfallen och dessas sannolikheter. dvs. stokastiska variabler En funktion där man för ett givet utfall x kan beräkna sannolikheten att just det ska inträffa mha sannolikhetsfördelningen: f(x) = P(X = x) = sannolikheten Statistisk inferens SG2 Inferens = slutledning, att dra en slutsats En slutledning är en process vid vilken man från ett antal premisser och i kraft av en slutledningsregel framställer en slutsats. Statistisk inferens handlar om slutledning om det generella mha av en ändlig uppsättning observationer, dvs. ett stickprov, samt osäkerheten kring slutsatsen. 9

Statistisk inferens, forts. SG2 Inferensteori baseras på sannolikhetsteorin. Kvantifiering av osäkerheten i slutsatserna, dvs. ge ett mått på hur säkert/osäkert ett resultat är. Underlag för prediktioner och beslut. Vad är den genomsnittliga inkomsten i Stockholm? Är det säkert att Centern har gått upp? Ska jag köpa aktie A eller B? Eller en portfölj? Statistisk inferens, forts. SG2 Punktskattning skatta genomsnittlig inkomst för män och kvinnor Intervallskattning ge ett osäkerhetsintervall för skillnaden i inkomst Hypotesprövning pröva om det är statistiskt säkerställt att män har högre inkomst än kvinnor pröva om val av bilmärke är oberoende av ålder 10

Studiebesök på SCB 7 oktober kl 13-15, anmälan till studievagledare@stat.su.se senast 1 oktober Först till kvarn, mer information kommer! Inledning till Statistik, N Kap 1 Att lära sig något från observationer Sammanfatta erfarenheter Dra slutsatser (inferens) Göra förutsägelser (prediktion) Fatta beslut Typiskt ofullständig information Vi kan inte fråga alla, vi har inte tid att pröva varje kombination Statistiska metoder! 11

Ofullständig information Population U stlk = N Urval, stickprov (urvalsdesign d) Stickprov s stlk = n Inferens: säga något generellt gällande för hela populationen med ledning av informationen i stickprovet Ofullständig information Modell M stlk Urval, stickprov (iid observationer) Stickprov s stlk = n Inferens: säga något generellt gällande om en universell egenskap, datagenererande process eller superpopulation (som typiskt beskrivs med hjälp av en modell) med ledning av informationen i stickprovet 12

Varför observerar vi? Typ av studier: Deskriptiva, beskrivande ( så här ser det ut ) Förklarande, kausalitet ( för att ) Normativa, preskriptiva ( gör så här ) Explorativa syften, sökande efter (ny) kunskap Konfirmativa syften, bekräftande av kunskap Oavsett typ så är syftet att öka vår kunskap om omvärlden En idé Ta en titt i dagstidningen, webben, Text-TV Hur många nyheter verkar bygga på en statistisk undersökning? Inferens? Är nyheten baserad på beskrivande, förklarande, eller normativ studie? Tänk brett: opinionsundersökning, medicinska experiment, registerdata 13

Inledning, forts. Statistiska undersökningar, dvs. insamling av data, observationer som studerar och analyserar för att (förhoppningsvis) ge oss de svar som vi söker. Ordet statistik kan avse själva metoderna men kanske oftare används det som benämning på samlingen av observationer eller snarare sammanfattningar av data med beskrivande mått och grafiska presentationer. Lite vetenskapsteori Thurén Kap 2: Vetenskapen söker sanningen Vetenskapen går ständigt framåt Dogmatism Detta är den (absoluta sanningen) Relativism Sanningen förändras (på flera sätt) hela tiden, allstå finns ingen absolut sanning 14

Lite vetenskapsteori, forts. Thurén Kap 3: Definitioner Klargör alltid hur ni har definierat begreppen och vilka antaganden (premisser) som ligger bakom påståendena Annars kan inte din omgivning ta ställning till validiteten och reliabiliteten i dina påståenden Lite vetenskapsteori, forts. Thurén Kap 4: Iakttagelse och logik Empirisk kunskap dvs. det vi ser, hör, smakar, vi drar slutsatser om det allmänna genom det vi ser per definition är detta ofullständig information slutsatsen är mer eller mindre trolig eller sannolik 15

Lite vetenskapsteori, forts. Thurén Kap 4: Iakttagelse och logik Logik utgår ifrån premisser lagar som styr hur vi härleder slutsatser slutsatsen är alltid sann eller falsk premisserna kan vara mer eller mindre verklighetsförankrade Vetenskap, N Kap 2 Ett litet försök att bringa lite ordning bland begreppen. Kunskapstyper: Propositionell kunskap När föddes Astrid Lindgren? Icke propositionell kunskap Färdigheter (simning) Proposition = Påstående Ett begrepp inom logiken. Ett påstående kan vara sant eller falskt. Den här kursen: Kunskap = Propositionell kunskap 16

Sanningsteori Vad är sanning? Korrespondensteori Sant om det finns en motsvarande verklighet eller fakta Koherensteori Sant om det hänger ihop med andra etablerade sanningar, ska inte leda till paradoxer Ska höra till det system som är bäst Pragmatism Satsens sanning ligger i dess brukbarhet Sanning och kunskap Ett påstående måste vara sant för att vara kunskap. Låter som en självklarhet? Motiveringen är att vi kan välja våra handlingar och nå de mål vi satt upp endast om vi väljer utifrån det vi vet är sant. 17

Sanning Sanna påståenden Falska påståenden Vem bestämmer vad som är sant? Det vi tror är sant 1. Påstående som verkar vara sant 2. Nya observationer, nya fakta 3. Reviderat påstående Epistemologi Läran om vad man kan veta och hur man når kunskap Rationalism Ren tankeverksamhet Empirism Genom observationer och erfarenheter 18

Vetenskap Ordet vetenskap kan avse: Processen, dvs. hur får vi kunskap Resultatet av processen, den kunskap vi erhållit Vetenskaper kan delas in i: Generaliserande, nomotetiska Fysik, matematik, kemi, ekonomi, beteendevetenskaper, Inte bara naturvetenskaperna! Partikulariserande, idiokratiska Enskilda händelser Historia, konsterna Vetenskap, forts. Även efter vilken typ av objekt som studeras: Formella Studerar konstruerade objekt Logik, matematik, (fysik) Empiriska Studerar verkliga objekt Medicin, ekonomi, historia, (fysik) Med objekt avses till vardags ofta saker men även händelser och relationer studeras givetvis inom båda klasserna. 19

Vetenskap, forts. Var placerar vi ämnet statistik? Som vetenskap har ämnet sin grund i matematik och logik: Generell och formell dvs. allmängiltig, nomotetisk konstruerade objekt (tal, sannolikheter) Men tillämpningen av statistiska metoder: Typiskt inom de generella och empiriska vetenskaperna baseras på empiriska observationer Sannolikheter Om gud har gjort världen till en fullkomlig mekanism, har han åtminstone givit så mycket till vårt ofullkomliga intellekt att vi, för att kunna förutsäga små delar av den, inte behöver lösa oräkneliga differentialekvationer, utan med hygglig framgång kan använda tärningar. MAX BORN 20

Vad är en teori? Betyder något mer än bara ett antagande eller hypotes Vardagligt: Månen är gjord av ost är en proposition och inte en teori En teori är ett logiskt sammanhängande system av satser (påståenden) som beskriver relationer mellan väldefinierade objekt el. begrepp samt tolkningar av dessa relationer och objekt Teorier Formella vetenskaper Axiom dvs. elementära grundantaganden som antas vara sanna Logiska härledningar ur sanna påståenden till nya sanningar Rationalism, koherens Empiriska vetenskaper Vedertagna sanningar, påståenden Logiska härledningar ur sanna påståenden till nya sanningar och prediktioner Måste verifieras empiriskt Empirism, korrespondens, korherens 21

Bra teorier? En bra (empirisk) teori ska Vara så generell som möjligt Förklara så mycket som möjligt Möjliggöra verifierbara förutsägelser Ange riktlinjer (handling, beslutsunderlag) Men även Enkelhet och tydlighet (Occam s razor) Objektivitet En teori brukar inte betraktas som sann eller falsk, snarare bedöms efter sin användbarhet (pragmatism) Vetenskapens utveckling Kumulativitet Att alla nya forskningsresultat (dvs. sanningar) läggs till den etablerade teorin Står ej i konflikt med det etablerade (koherens) Ny pusselbit som passar in Paradigmskiften Nya fakta som står i konflikt med etablerade sanningar (bristande koherens, korrespondens) Gamla påståenden ger falska resultat eller felaktiga prediktioner Krävs en helt ny teori 22