SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Relevanta dokument
SF1914/SF1916: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

Föreläsning 1, Matematisk statistik Π + E

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

Matematisk statistik 9hp för: C,D,I, Pi

Föreläsning 1, Matematisk statistik för M

SF1901: Sannolikhetslära och statistik

Matematisk statistik - Slumpens matematik

SF1901: Sannolikhetslära och statistik

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

TAMS79: Föreläsning 1 Grundläggande begrepp

Sannolikhetsbegreppet

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Matematisk statistik fo r B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale.

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Matematisk statistik for B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale. Forel.

Föreläsning 1: Introduktion

Statistikens grunder HT, dagtid Statistiska institutionen

Grundläggande matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Matematisk statistik för D, I, Π och Fysiker. Matematisk statistik slumpens matematik. Tillämpningar för matematisk statistik.

Föreläsning 1: Introduktion

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

Kap 2: Några grundläggande begrepp

FMS012/MASB03: Matematisk statistik 9.0 hp för F+fysiker Föreläsning 1: Sannolikhet

Övning 1 Sannolikhetsteorins grunder

F2 SANNOLIKHETSLÄRA (NCT )

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

Introföreläsning i S0001M Matematisk statistik Läsperiod 2, HT 2018

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

Kombinatorik och sannolikhetslära

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 1: Introduktion

Introföreläsning i S0001M, Matematisk statistik LP3 VT18

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

TMS136. Föreläsning 1

1.1 Diskret (Sannolikhets-)fördelning

4 Diskret stokastisk variabel

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Välkommen till Matematik 3 för lärare!

13.1 Matematisk statistik

TMS136. Föreläsning 2

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

SF1901: Sannolikhetslära och statistik

Statistik 1 för biologer, logopeder och psykologer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

SF1901: Sannolikhetslära och statistik

Kursbeskrivning för Statistisk teori med tillämpningar, Moment 1, 7,5 hp

Statistik 1 för biologer, logopeder och psykologer

Grundläggande matematisk statistik

Matematisk statistik

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

TMS136. Föreläsning 2

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

ÄMAD04, Matematik 4, 30 högskolepoäng Mathematics 4, 30 credits Grundnivå / First Cycle

Föreläsning G60 Statistiska metoder

Lektionsanteckningar 11-12: Normalfördelningen

1 Mätdata och statistik

Studiehandledning S0001M Matematisk statistik Läsperiod 2, HT 2017

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Kap 3: Diskreta fördelningar

Föreläsning G70, 732G01 Statistik A

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Sannolikhet och statistik 1MS005

Fö relä sning 1, Kö system vä ren 2014

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

3 Grundläggande sannolikhetsteori

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Föreläsning 2, FMSF45 Slumpvariabel

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Beskrivande statistik

1.1 Diskret (Sannolikhets-)fördelning

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

TMS136. Föreläsning 7

TMS136. Föreläsning 1

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Föreläsning 2, Matematisk statistik för M

2 Dataanalys och beskrivande statistik

Transkript:

SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 1 GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK Tatjana Pavlenko 23 mars, 2015

KURSINFORMATION Blom m.fl. Sannolokhetsteori och statistikteori med tillämpningar På kursenshemsida finns formelsamling och tabeller tillägsmaterial (labhandledning, Matlab-filer, mm) gamla tentor Under Aktuell information ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc. Schemat omfattar två föreläsningar per vecka (förutom v. 18 och v. 21) en övning per föreläsning enligt Grupp 1: CMATD, Harald Lang Grupp 2: CMEDT, Andreas Kördel en förberedande Matlab-introdukton, v. 16. två datorlaborationer i v. 19 och v. 21.

EXAMINATION Den skriftliga tentamen (tisdag 09 juni) består av sex uppgifter och tentamenstiden är fem timmar. Varje korrekt löst uppgift ger 10 poäng och för betyget E krävs 24 poäng. De som får 22 eller 23 poäng på tentamen kommer att få möjlighet att komplettera till godkänt betyg (dock preliminära gränser). Bonuspoäng på förstagångstentamen kan erhållas genom godkänd kontrollskrivning (måndag 4 maj): 4 bonuspoäng godkända datorlaborationer: 3 + 3 = 6 bonuspoäng. Grupper om max två studenter. Obs! bonuspoäng kan endast tillgodoräknas på första ordinarie tentamen, dvs. tentamen tisdag 09 juni, och man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för att bonuspoängen skall räknas med.

INLEDNING: ALLMÄNT OM MATEMATISK STATISTIK. I dagens tillämpningar skapas det ofta stora datamängder (Big Data!). Då man observerar mätdata ser man ofta variationer i mätvärdena även om man i princip har mätt samma sak. I den här kursen ska vi studera matematiska principer som är användbara för att analysera sådana situationer. Fokus ligger på två områden: att kunna formulera matematiska modeller för vad som brukar benämnas slumpmässig variation att matematiskt analysera insamlade data som på ett eller annat viss påverkas av slumpen Sannolikhetsmodeller och statistiska metoder hjälper oss med allt detta!

SANNOLIKHETSLÄRA OCH STATISTIK Sannolikhetslära hur beskriver man slumpen? Statistisk inferens vilka slutsatser kan man dra av datamaterial?

VAD ÄR SLUMP? Inom sannolikhetsteorin används slump som en benämning på det oförutsägbara: även om ett försök upprepas exakt, går det inte att förutsäga resultaten från gång till gång. Utgående från slumpförsöket skapar man en modell vilken används vidare som bas för de matematiska beräkningarna.

MATEMATISKA MODELLER Deterministiska modeller: Ex. Ohms lag, samband mellan spänning U, strömstyrka I och resistans R: U = R I Så här är det, då blir det så här. Slumpmodeller: U = R I + ε där ε är slumpmässig variation/mätfel/mätosäkerhet. Så här är det, då kan det bli så här. Deterministiska modeller utvidgas med ett stokastiskt synsätt!

VAD ÄR SLUMPMÄSSIG VARIATION? Vad kan vi veta om slumpmässig variation? Inte exakt vad som kommer att hända, men hur ofta olika saker händer. Vad vi kan säga är hur sannolika olika händelser är.

GÅR DET ATT HELT UNDVIKA SLUMPEN? Svaret är nej! Om man inte till hundra procent kan garantera att ingenting kan gå fel, så kan inte risken för fel vara lika med noll.

INGENJÖRSTILLÄMPNINGAR Dimensionering av mekaniska konstruktioner, t ex broar och byggnadskonstruktioner. Belastning och materialegenskaper varierar slumpmässigt. Med hjälp av sannolikhetsteori kan man modellera fenomenen med komplex variabilitet.

INGENJÖRSTILLÄMPNINGAR Prediktion. Hur kan man förutsäga framtida värden baserat på historiska data. T ex väderprognoser utnyttjas för att i fjärrvärmeverk förutsäga förbrukningen på några dagars sikt.

FLER TILLÄMPNINGAR Kvalitetsstyrning som används för att övervaka en produktionsprocess. Med jämna mellanrum mäts då variabler av intresse i processen. Ekonomi och finansmatematik Aktiedata Räntor Försäkringar Signalbehandling Mobil och telekommunikation EEG/EKG Biologi, genetik och läkemedelsutveckling Elmarknad osv.

KORT OM BESKRIVANDE STATISTIK. BIRTH DATA FIGUR: Filen (fragment) birth.dat innehåller 26 variabler, 747 individer. Variabler: t ex var 3 är barnets vikt i gram. Läs mer om data i birth.txt

GRAFISK PRESENTATION AV ETT DATAMATERIAL För ett statistiskt material kan det vara meningsfullt att klassindela observationerna i lika stora intervall och avsätta en stapel vars höjd är proportionellt mot antalet mätvärden stapeln står på. Diagramtypen som då används kallas histogram.

HISTOGRAM FIGUR: Histogram av födelsevikt hos 747 barn i birth.dat. MATLAB: hist(birth(:,3))

SCATTERPLOT FIGUR: Consumption of heat (kw/kwmax)*100 as a function of outdoor temperature in offices in Stockholm city week days (red) respectively week-ends (black). Dalqvist et. al (2012) Energi (46(1):16 20..

LÄGESMÅTT: MEDELVÄRDET För ett datamaterial finns det ofta ett behov av att beskriva något slags genomsnittsvärde eller lägesmått som för (kvantitativa data) ges av bl a medelvärdet Medelvärdet = summan av alla observationer antalet observationer Allmänt, låt x 1,..., x n vara data. Medelvärdet definieras som x = 1 n n x i. i=1 I birth data: för födelsevikt (enhet:gram) har vi 747 x i = 2540225, x = 2540225/747 = 3400.6 i=1

SPRIDNINGSMÅTT Varians och standardavvikelsen är vanligaste sätt för att ange spridning om variabeln är kvantitativ. Variansen ges av s 2 = 1 n 1 standardavvikelse ges av s = 1 n 1 n i=1 n i=1 (x i x) 2. (x i x) 2. I birth data: s 2 = 324620 och s = 569.7519. Obs! s ges i gram.

SANNOLIKHETSTEORINS GRUNDER Vi behöver följande begrepp/definitioner Slumpförsöket är en experiment där resultatet inte kan på förhand avgöras. Ex: Tärningskast Resultatet av ett slumpmässigt försök kallas för utfall, betecknas med ω. Mängden av möjliga utfall kallas utfallsrum, bet. med Ω, det gäller att ω Ω. Ex: Tärningskast, ω = ant. ögon, Ω = {1, 2, 3, 4, 5, 6} Händelse är uppsättning intressanta utfall. Bet. med A, B, C,.... För en händelse A gäller det att A Ω, dvs A är delmängd av Ω. Ex: Tärningskast, A = udda ant. ögon, B = minst fyra A = {1, 3, 5}, B = {4, 5, 6} A Ω, B Ω Händelser och grundläggande mängdlära. Venndiagram. Ex. på tavla

FREKVENSTOLKNING AV SANNOLIKHET Ex: Tärningskast, A = vi får 6:an, A = {6}. Vi vill ordna sannolikheter till händelser, dvs vi vill ha ett tal som avspeglar hur stort är chansen att A inträffar. Sannolikheten för en händelse A betecknas P(A). Ex. Tärningskast: intuitivt P(A) = 1 6. Upprepade tärningskast. Hur ofta A inträffar? Talet P(A) måste väljas så att det överensstämmer med den relativa frekvensen för A f n (A) då det slumpmässiga försöket upprepas n ggr, dvs f n (A) = ant. ggr. A inträffar i n försök n P(A) då n. Ex: Relativ frekvens av sexor vid 1000 kast.

RELATIV FREKVENS AV SEXOR VID 1000 KAST 0.5 0.45 data1 data2 data3 0.4 0.35 r=randi(6,1000,1); y=(r==6);plot(n,cumsum(y)./n, b ); hold on Relativa frekvensen 0.3 0.25 0.2 0.15 0.1 0.05 0 0 100 200 300 400 500 600 700 800 900 1000 Antal kast Vi sätter alltså P(A) = 1/6.

KOLMOGOROVS AXIOMSYSTEM Sannolikhetsmått P(A) för varje A Ω. Axiomatiska uppbygnaden av sannolikhetslära. Grundbegriffe, (1933) av A.N. Kolmogorov. Sannolikhetsmåttet P ska uppfylla förljande axiom Ax. 1: För varje händelse A gäller det att 0 P(A) 1. Ax. 2: För hela Ω gäller att P(Ω) = 1 Ax. 3: Om A 1, A 2,..., är en följd av av parvis oförenliga händelser så gäller att P (A 1 A 2... ) = P(A 1 ) + P(A 2 ) + Överensstämmer med frekvenstolkningen av P(A). Masstolkning av P(A): lägg ut massan av 1 på Ω. Då är P(A) = massan på A. Regler för sannolikhetskalkyl (Ex på tavlan).

DEN KLASSISKA SANNOLIKHETSDEFINITIONEN Antag att Ω består av m stycken möjliga utfall (utfallsrummet är diskret), dvs Ω = {ω 1, ω 2,..., ω m } Välj p i = P(ω i ) = 1/m för alla i = 1,..., m dvs alla ω i är lika möjliga. m i=1 p i = 1. Betrakta A Ω. 1 ant. för A gynsamma utfall P(A) = P(ω i ) = = = g m ant. möjliga utfall m. ω i A ω i A I detta fall föreligger likformig sannolikhetsfördelning. Exempel (på tavla).

LITE KOMBINATORIK För att betrakta g och m i den klassiska sannolikhetsdefinitionen behöver vi några kombinatoriska begrepp. Multiplikationsprincipen är en grundläggande sats! Antag att åtgärd i kan utföras på a i olika sätt där i = 1, 2,..., n, dvs n st olika åtgärd föreligger. I så fall finns det totalt sätt att utföra de n åtgärdena. Följdsats: n element kan ordnas på olika sätt. a 1 a 2 a 3 a n n (n 1) 2 1 = n!

LITE KOMBINATORIK, FORTS. Med hjälp av multiplikationsprincipen får vi följande resultat för dragning av k st element ur n: 1. Dragning med återläggning av k st element ur n med hänsyn till ordning kan ske på n } n {{ n n } = n k k ggr olika sätt. 2. Dragning utan återläggning av k st element ur n med hänsyn till ordning kan ske på n(n 1)(n 2) (n k + 1) olika sätt. 3. Dragning utan återläggning av k st element ur n utan hänsyn till ordning kan ske på olika sätt. n(n 1)(n 2) (n k + 1) k! = ( ) n k