Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Relevanta dokument
Lektionsanteckningar 11-12: Normalfördelningen

Studietyper, inferens och konfidensintervall

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 5. Kapitel 6, sid Inferens om en population

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

FÖRELÄSNING 8:

Föreläsning G60 Statistiska metoder

Samplingfördelningar 1

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F3 Introduktion Stickprov

F9 SAMPLINGFÖRDELNINGAR (NCT

TMS136. Föreläsning 10

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

F9 Konfidensintervall

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning G60 Statistiska metoder

Hypotestestning och repetition

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Parade och oparade test

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 11: Mer om jämförelser och inferens

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Forskningsmetodik 2006 lektion 2

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

FÖRELÄSNING 7:

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Jämförelse av två populationer

EXTRA ÖVNINGSUPPGIFTER MED SVAR

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Höftledsdysplasi hos dansk-svensk gårdshund

Statistik 1 för biologer, logopeder och psykologer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

TMS136. Föreläsning 13

9. Konfidensintervall vid normalfördelning

TMS136. Föreläsning 7

Statistik och epidemiologi T5

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Exempel i stickprovsteori

Hur skriver man statistikavsnittet i en ansökan?

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

8 Inferens om väntevärdet (och variansen) av en fördelning

Naturliga populationers evolution och bevarande, 6hp

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Konfidensintervall, Hypotestest

Tentamen MVE301 Sannolikhet, statistik och risk

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

, s a. , s b. personer från Alingsås och n b

F22, Icke-parametriska metoder.

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Föreläsning 7: Punktskattningar

Tentamen MVE302 Sannolikhet och statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

TMS136. Föreläsning 11

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 12: Regression

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 7: Punktskattningar

Föreläsning 12: Repetition

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Urvalsmetoder: Stratifierat urval (kap 9.5)

Thomas Önskog 28/

Datorlaboration 2 Konfidensintervall & hypotesprövning

Matematisk statistik KTH. Formelsamling i matematisk statistik

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

FACIT (korrekta svar i röd fetstil)

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsning 7: Punktskattningar

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning G60 Statistiska metoder

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

2. Test av hypotes rörande medianen i en population.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Transkript:

P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. Population mean = μ µ x

Samplingsfördelningen för medelvärdet är också normalfördelat och har μ x = μ x Samplingsfördelningen har lägre variation än ursprungsfördelningen (kurvan är inte lika bred). Stickprovet storlek avgör samplingsfördelningens snävhet. Om standardavvilkelsen i ursprungspopulationen är σ blir samplingsfördelningens standardavvikelse enligt nedan. Den kallas även standard error (S.E.) σ x µ x σ x = x = µ x =µ σ x n Standard error = S.E.

Vi drar ett stort antal stickprov av en viss storlek ur denna fördelning. I varje stickprov räknar vi ut medelvärdet. Vi får en fördelning av medelvärden samplingsfördelning av medelvärden (sampling distribution of a mean) µ x x = µ x =µ

Om σ är okänd skattas standard error, S.E från s n Men vi kan då inte använda normalfördelningen utan vi måste använda t-fördelningen.

Om σ är känd används normalfördelningen och z Om σ inte är känd utan skattas den via s och t-fördelning används

t-fördelningen t-fördelningen liknar normalfördelningen men är plattare. Ju lägre stickprovsstorlek (n) desto plattare kurva. När n ökar närmar sig t- fördelningen normalfördelningen. Det finns en t-fördelning för varje antal s.k. frihetsgrader. Antalet frihetsgrader är kopplat till stickprovets storlek. Ju större stickprov desto fler frihetsgrader.

Frihetsgrader degrees of freedom, df Svårt begrepp men kan betraktas som en matematisk restriktion som måste användas då vi skattar parametrar från stickprov. Antalet värden i den slutliga beräkningen av en statistika som är fria att variera. Icke-statistisk illustration: Antag att vi har 100 kronor att dela ut till fyra olika barn som var och en knackar på hemma hos oss för att önska glad påsk. Om vi ger 30 kronor till barn 1, 20 till barn 2 40 till barn 3 så är vi låsta till att ge det fjärde barnet 10 kronor eftersom totalsumman inte kan överstiga 100 kronor. De tre första summorna är vi fria att variera men de sista är låst av att totalbeloppet inte får överstiga 100 kronor. Vi har 4-1=3 frihetsgrader.

Test av medelvärde när är okänd - den sanna populationens standardavvikelse skattas från standardavvikelsen i stickprovet - s Standard error (S.E.) skattas från s n och z ersätts med t

Observerade vikter 3.2 3.6 3.9 4.2 4.3 4.4 4.9 5.2 x = 4.3 Median = 4.3 Typvärde = 5.2 Vikt hos 5 veckor gamla vargvalpar Stickprov n 3.2 4.2 5.2 4.4 3.6 5.2 4.9 3.9 3.2 4.3 5.2 Variansen = s = (x i -x) 2 n-1 2 = 0.588 Antal obseravtioner 3 2 1 0 0.60 Standardavvikelsen = s = s 2 = 0.7668 0.80 3.2 3.6 3.9 4.2 4.3 4.4 4.9 5.2 Vikt

Konfidensintervall Ett intervall som med en viss sannolikhet täcker den parameter vi är intresserade av att skatta (t.ex. µ). Ett 95% konfidensintervall täcker med 95% sannolikhet populationens µ.

Med hjälp av konfidensintervall kan vi med viss säkerhet fastställa medelvärdet för populationen Beräkningen av konfidensintervall bygger på centrala gränsvärdessatsen. Den centrala gränsvärdessatsen möjliggör användande av normalfördelningen för att skapa konfidensintervall för populationsmedelvärdet. Den centrala gränsvärdessatsen säger att om stickprov av en given storlek dras ur en population så kommer fördelningen av stickprovsmedelvärdena (samplingsfördelningen) att likna en normalfördelning. Denna fördelning blir mer lik normalfördelningen ju större stickprovet det är. Om stickprovet är litet används t-fördelningen som liknar normalfördelningen men justerar för små stickprov (se t-tabellen).

Hypotesprövning två medelvärden - t-test Diastoliskt blodtryck hos behandlad grupp och kontrollgrupp Testet bygger på antagandena: OSU ur NF-populationer Lika varians i populationerna

Fröhandlaren

Fröhandlaren Hypotesprövningen kan även göras med chi2- aprior

Conservation Genetics 2013 Är populationerna olika i något avseende?

Antag: Vi undersöker förekomsten av en viss typ av parasit hos öring från de två populationerna. Är det någon skillnad i förekomst av parasiter hos fisk från de två olika populationerna? Observationer Population A Population B Med parasit 13 44 Utan parasit 25 29 H 0 : parasitförekomst är oberoende av population H 1 : parasitförekomst är inte oberoende av population SE VIDARE SEPARAT FIL!