Föreläsning G60 Statistiska metoder

Relevanta dokument
Föreläsning G60 Statistiska metoder

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Hur man tolkar statistiska resultat

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning G60 Statistiska metoder

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Om statistisk hypotesprövning

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TMS136. Föreläsning 13

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

8 Inferens om väntevärdet (och variansen) av en fördelning

2. Test av hypotes rörande medianen i en population.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

F3 Introduktion Stickprov

Föreläsning G60 Statistiska metoder

TMS136. Föreläsning 11

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

, s a. , s b. personer från Alingsås och n b

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Kapitel 10 Hypotesprövning

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning 5: Hypotesprövningar

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

F22, Icke-parametriska metoder.

Laboration 3 Inferens fo r andelar och korstabeller

Stockholms Universitet Statistiska institutionen Termeh Shafie

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Analytisk statistik. Tony Pansell, optiker Universitetslektor

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 12, FMSF45 Hypotesprövning

Hypotestestning och repetition

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Konfidensintervall, Hypotestest

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

TAMS65 - Föreläsning 6 Hypotesprövning

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Parade och oparade test

Stockholms Universitet Statistiska institutionen Termeh Shafie

TAMS65 - Föreläsning 6 Hypotesprövning

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Laboration 4: Hypotesprövning och styrkefunktion

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Studietyper, inferens och konfidensintervall

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

TENTAMEN I STATISTIKENS GRUNDER 2

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Medicinsk statistik II

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

FACIT (korrekta svar i röd fetstil)

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

7.3.3 Nonparametric Mann-Whitney test

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

FÖRELÄSNING 8:

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Korrelation och autokorrelation

Introduktion till statistik för statsvetare

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Omtentamen i Metod C-kurs

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Transkript:

Föreläsning 6 Statistiska metoder 1

Dagens föreläsning o Kort om projektet o Hypotesprövning Populationsandel Populationsmedelvärde p-värdet 2

Kort om projektet Syftet med projektet i denna kurs är att få testa hur en statistisk undersökning kan gå till i verkligheten. Bakgrunden är att ni, på uppdrag av arbetsgivare eller liknande, ska presentera underlag för en kommande kvalitativ undersökning. Alltså beskriva hur det ser ut, och inte analysera varför det ser ut som det gör. Ni ska även göra jämförelser mellan olika delpopulationer, så som kön, ålder eller liknande. Det vore också trevligt om ni jämförde olika länder. 3

Introduktion Föregående föreläsning diskuterades konfidensintervall. Det brukar användas när man inte har någon uppfattning om vilka värden populationsandelen eller populationsmedelvärdet kan anta. Men när man har en uppfattning (hypotes) om populationsvärdet, kan det prövas om denna hypotes kan vara sann eller inte. Denna metodik kallas för hypotesprövning. Hypotesen formuleras innan stickprovet dras, de anpassas inte efter de siffror som har erhållits i stickprovet. 4

Hypotesformulering Man formulerar en nollhypotes (H 0 ) och en mothypotes (H 1 ). Dessa formuleras så att det man vill testa finns i mothypotesen. I nollhypotesen måste alltid = finnas, hela metodiken bygger på detta! Vid hypotesprövning undersöks om det går att förkasta nollhypotesen eller inte: o Om nollhypotesen förkastas gäller det som står i mothypotesen (med en viss risk). o Om nollhypotesen inte förkastas kan inte för stora slutsatser dras. Om nollhypotesen förkastas brukar man också säga att det är signifikant, vilket innebär att det som uttrycks i mothypotesen är statistiskt säkerställt (beror inte på slumpen). 5

Signifikansnivå Innan hypotesprövning genomförs ska en signifikansnivå (α) bestämmas. Denna signifikansnivå är risken att förkasta en sann nollhypotes, och brukar vanligtvis sättas till 10, 5 eller 1 procent. Det finns en annan risk vid hypotesprövning, och det är risken att inte förkasta en falsk nollhypotes. Denna risk brukar betecknas med β och är i allmänhet ett okänt tal. Det finns ett förhållande mellan dessa två risker, och det är att när α minskar så ökar β och vice versa. 6

Genomförandet Hypotesprövning består av fyra stycken steg: 1. Formulera hypoteser 2. Bestämma signifikansnivå 3. Beräkna testvariabel 4. Undersöka om H 0 kan förkastas eller inte Först visas dessa fyra steg för andelar och därefter medelvärden. 7

Andelar, formulera hypoteser Hypoteserna formuleras utifrån vad man vill undersöka, och de kan formuleras på dessa olika sätt: H 0 : π = π 0 H 1 : π π 0 Pröva om populationsandelen är skilt från ett visst värde H 0 : π = π 0 H 1 : π < π 0 Pröva om populationsandelen är mindre än ett visst värde H 0 : π = π 0 H 1 : π > π 0 Pröva om populationsandelen är större än ett visst värde De formuleras alltså innan stickprovet dras! 8

Andelar, signifikansnivå och testvariabel Signifikansnivån sätts till antingen 10, 5 eller 1 procent. Därefter beräknas en testvariabel enligt följande uttryck: p π 0 z obs = π 0 (1 π 0 ) n p är stickprovsandelen π 0 är värdet som det testas mot n är stickprovsstorleken 9

Andelar, ska H 0 förkastas? För att undersöka om H 0 ska förkastas eller ej så jämförs den beräknade testvariabeln med ett kritiskt värde (z krit ). Detta kritiska värde bestäms av signifikansnivån och hypotesformuleringen. Om H 1 : π π 0 så förkastas H 0 om testvariabeln ligger utanför kritiska värden i normalfördelningens båda svansar Om H 1 : π < π 0 så förkastas H 0 om testvariabeln är mindre än ett kritiskt värde i normalfördelnings vänstra (nedre) svans Om H 1 : π > π 0 så förkastas H 0 om testvariabeln är större än ett kritiskt värde i normalfördelnings högre (övre) svans Detta kommer att visas med hjälp av normalfördelningskurvor på tavlan. 10

Andelar, exempel Vi återgår till exemplet gällande andelen EU-negativa i den vuxna svenska befolkningen. Man vill undersöka om andelen EU-negativa är mindre än 50 %, och för detta tillfrågas 120 personer gällande deras åsikt i frågan. Av dessa var 48 personer negativt inställda till EU. Är andelen EU-negativa signifikant mindre än 50 procent? 11

Medelvärden, hypoteser och signifikansnivå För medelvärden så formuleras hypoteserna på samma sätt. H 0 : μ = μ 0 H 1 : μ μ 0 Pröva om populationsmedelvärdet är skilt från ett visst värde H 0 : μ = μ 0 H 1 : μ < μ 0 Pröva om populationsmedelvärdet är mindre än ett visst värde H 0 : μ = μ 0 H 1 : μ > μ 0 Pröva om populationsmedelvärdet är större än från ett visst värde Signifikansnivån sätts till 10, 5 eller 1 procent. 12

Medelvärden, testvariabel För medelvärden kan två testvariabler beräknas, vilken som väljs beror på stickprovsstorleken (n). Vid stort stickprov (n > 30): Vid litet stickprov (n < 30): z obs = x μ 0 s n t obs = x μ 0 s n Så vi ser att det inte är någon skillnad mellan de två testvariablerna, skillnaden ligger i vilken tabell som används för att bestämma det kritiska värdet. 13

Medelvärden, ska H 0 förkastas? Testvariabeln jämförs med ett kritiskt värde enligt samma princip som för andelar. Åter igen bestäms det kritiska värdet utifrån signifikansnivå och hypotesformulering. Vid små stickprov bestäms det kritiska värdet även utifrån stickprovsstorleken, då frihetsgraderna som ska användas är n-1. 14

Medelvärden, exempel Vintillverkaren som var i farten på föregående föreläsning dyker upp igen. Tillverkaren vill nu undersöka om medelbetyget för vin A är signifikant högre än 12, och har för detta valt ut tio stycken personer som har provsmakat vinet. Sammanställda siffror från undersökningen visas nedan: x = 13.1 s = 1.85 Är medelbetyget signifikant högre än 12? 15

p-värdet För att avgöra om H 0 ska förkastas eller ej kan p-värdet användas istället för kritiskt värde. p-värdet är sannolikheten att få det observerade värdet på testvariabeln eller mer extremt om H 0 är sann. Denna definition kan vara lite bökig att förstå, men det viktiga med p-värdet är att om detta är mindre än signifikansnivån (α) kan H 0 förkastas. p-värdet kan enkelt beräknas när normalfördelningstabellen används, men om t-tabell används blir det genast lite bökigare och vi överlåter detta till datorerna. 16

p-värdet, exempel Vi återgår till exemplet gällande andelen EU-negativa i den vuxna svenska befolkningen. Man vill undersöka om andelen EU-negativa är mindre än 50 %, och för detta tillfrågas 120 personer gällande deras åsikt i frågan. Av dessa var 48 personer negativt inställda till EU. Är andelen EU-negativa signifikant mindre än 50 procent? o Besvara denna frågeställning med hjälp av p-värdet. 17

Tack för idag! Nästa tillfälle: Räknestuga 2, fredag 8/3 10-12, sal A39 18