Föreläsning G60 Statistiska metoder

Relevanta dokument
Lektionsanteckningar 11-12: Normalfördelningen

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Samplingfördelningar 1

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistik 1 för biologer, logopeder och psykologer

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning G70 Statistik A

F9 SAMPLINGFÖRDELNINGAR (NCT

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Parade och oparade test

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

FÖRELÄSNING 7:

F3 Introduktion Stickprov

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Forskningsmetodik 2006 lektion 2

FÖRELÄSNING 8:

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Studietyper, inferens och konfidensintervall

Föreläsning 6, Repetition Sannolikhetslära

Grundläggande matematisk statistik

Formel- och tabellsamling i matematisk statistik

TMS136. Föreläsning 7

732G01/732G40 Grundläggande statistik (7.5hp)

Föreläsning 7. Statistikens grunder.

4.1 Grundläggande sannolikhetslära

Repetitionsföreläsning

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

1 Mätdata och statistik

Grundläggande matematisk statistik

Föreläsning 3. Sannolikhetsfördelningar

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Föreläsning G60 Statistiska metoder

Föreläsning 7: Punktskattningar

Föreläsning G70 Statistik A

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Föreläsning 5. Kapitel 6, sid Inferens om en population

Laboration med Minitab

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

TMS136. Föreläsning 10

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

, s a. , s b. personer från Alingsås och n b

Föreläsning 7: Punktskattningar

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Introduktion till statistik för statsvetare

DATORÖVNING 2: STATISTISK INFERENS.

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

FÖRELÄSNING 3:

Kap 3: Diskreta fördelningar

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Föreläsning 7: Punktskattningar

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

Några extra övningsuppgifter i Statistisk teori

Föreläsning 12: Regression

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

TMS136. Föreläsning 4

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

1 Sannolikhet enligt frekvenstolkningen Kast med tärning

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

LMA521: Statistisk kvalitetsstyrning

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

LMA522: Statistisk kvalitetsstyrning

Föreläsning 4: Konfidensintervall (forts.)

Hypotestestning och repetition

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Uppgift a b c d e Vet inte Poäng

F10 Problemlösning och mer om konfidensintervall

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning G60 Statistiska metoder

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Stokastiska signaler. Mediesignaler

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Introduktion till statistik för statsvetare

Diskussionsproblem för Statistik för ingenjörer

F9 Konfidensintervall

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Föreläsning G60 Statistiska metoder

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Transkript:

Föreläsning 4 Statistiska metoder 1

Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala gränsvärdessatsen 2

Sannolikhet Exempel Teoretiskt är sannolikheten för att få krona vid slantsingling 50 %. Men hur ser det ut rent praktiskt? 3

Sannolikhet Sannolikhet är chansen (eller risken) att få ett visst utfall vid ett försök. Om ett försök upprepas väldigt många gånger bör den relativa frekvensen (procent) för de olika utfallen närma sig den teoretiska sannolikheten. Ingen sannolikhet kan vara negativ och inte heller större än 1, och dessutom ska alla möjliga sannolikheter för de olika utfallen summera till 1. 4

Sannolikhet Slumpvariabel När man studerar sannolikheter och de olika utfallen är det slumpvariabler som undersöks. En slumpvariabel kan t.ex. vara: o X = antal rökare i ett urval om n stycken personer o X = längd på svenska kvinnor En slumpvariabel kan variera från urval till urval, och man kan med hjälp av olika sannolikhetsfördelningar beräkna de teoretiska sannolikheterna för de olika utfallen. 5

Sannolikhetsfördelning Binomialfördelning I boken finns ett exempel gällande rökare, där man antar att 1/3 av personalen på ett stort företag är rökare. Ett stickprov om 40 anställda på detta företag dras, så den slumpvariabel som undersöks är: o X = antal rökare i stickprovet om 40 anställda För att beskriva sannolikhetsfördelningen för denna (diskreta) slumpvariabel kan binomialfördelningen användas. För att beräkna sannolikheterna för de olika utfallen används denna formel: P X = x = n! x! n x! px 1 p n x 6

Sannolikhetsfördelning Binomialfördelning Nedan visas sannolikhetsfördelningen för antalet rökare i stickprovet visuellt. Vi använder formeln från föregående sida och beräknar lite olika sannolikheter. 7

Sannolikhetsfördelning Normalfördelning När en kontinuerlig slumpvariabel undersöks går man över till normalfördelningen. Ytan under kurvan i normalfördelning summerar till 1 (100 %), vilket är en förutsättning för att den ska kunna användas vid sannolikhetsberäkningar. 8

Sannolikhetsfördelning Normalfördelning Normalfördelningen är symmetrisk kring sitt medelvärde (μ), vilket innebär att den har likadant utseende ovan medelvärdet som under medelvärdet. På sidan 192 i boken finns det en tabell där det har sammanställts hur stor sannolikheten är att en standardiserad normalfördelad variabel är större än ett visst värde z. En standardiserad normalfördelad variabel har medelvärde 0 och standardavvikelse 1. För att standardisera en normalfördelad variabel X används: X μ Z = σ 9

Sannolikhetsfördelning Normalfördelning, exempel Sannolikheten att en kontinuerlig slumpvariabel X ska anta ett specifikt värde är i princip 0. Därför är det mest intressant att undersöka sannolikheten att slumpvariabeln är mindre än eller större än ett visst värde, eller sannolikheten att den skulle vara mellan två värden. Vi definierar slumpvariabeln: X = längden hos en slumpmässigt vald svensk kvinna Anta att längden är normalfördelad med medelvärde 168 cm och standardavvikelse 5 cm. Beräkna sannolikheten att: en kvinna är längre än 170 cm en kvinna är kortare än 167 cm en kvinna är mellan 167 och 170 cm lång 10

Population och stickprov Tanken med stickprov är att med hjälp av del av populationen skatta populationens parametrar, som t.ex. medelvärde och standardavvikelse. För att göra skillnad på populationens parametrar och de skattade värdena från stickprov brukar dessa benämningar användas: o Medelvärde: populationsmedelvärde = μ stickprovsmedelvärde = X o Standardavvikelse: populationsstandardavvikelse stickprovsstandardavvikelse = σ = s 11

Centrala gränsvärdessatsen Metoder som kommer att diskuteras på kommande föreläsningar bygger på att man kan anta normalfördelning. Men, ibland kan man inte anta att värdena i populationen är normalfördelade. Då kan man istället förlita sig på centrala gränsvärdessatsen (CGS). CGS säger att om n är tillräckligt stort blir medelvärdet av slumpvariabeln normalfördelat. 12

Centrala gränsvärdessatsen Exempel Nedan visas sannolikhetsfördelning för hur många syskon personer i Sverige har (påhittade siffror). 13

Centrala gränsvärdessatsen Exempel 10 000 stickprov dras från populationen från föregående sida. Som synes blir fördelningen för medelvärdena i dessa stickprov normalfördelad. 14

Tack för idag! Nästa tillfälle: Föreläsning 5, tisdag 5/3 13-15, sal A34 15