Föreläsning G60 Statistiska metoder

Relevanta dokument
Föreläsning G60 Statistiska metoder

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsning G60 Statistiska metoder

2. Test av hypotes rörande medianen i en population.

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsningsanteckningar till kapitel 9, del 2

F3 Introduktion Stickprov

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

F22, Icke-parametriska metoder.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Hur man tolkar statistiska resultat

, s a. , s b. personer från Alingsås och n b

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Parade och oparade test

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Stockholms Universitet Statistiska institutionen Termeh Shafie

Hur skriver man statistikavsnittet i en ansökan?

TMS136. Föreläsning 13

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Stockholms Universitet Statistiska institutionen Termeh Shafie

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

Om statistisk hypotesprövning

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

7.3.3 Nonparametric Mann-Whitney test

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning G60 Statistiska metoder

Laboration 3 Inferens fo r andelar och korstabeller

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

732G01/732G40 Grundläggande statistik (7.5hp)

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Hypotestestning och repetition

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 5: Hypotesprövningar

a) Facit till räkneseminarium 3

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

TENTAMEN I STATISTIKENS GRUNDER 2

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Introduktion till statistik för statsvetare

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 12, FMSF45 Hypotesprövning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Bilaga 6 till rapport 1 (5)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

TENTAMEN FREDAGEN DEN 23 MARS 2012, Kl

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Jämförelse av två populationer

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = ξ = 2ξ 1 3ξ 2

TMS136. Föreläsning 11

import totalt, mkr index 85,23 100,00 107,36 103,76

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Tentamen i Matematisk statistik Kurskod S0001M

Jag läser kursen på. Halvfart Helfart

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning G70 Statistik A

Statistik 1 för biologer, logopeder och psykologer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

9. Konfidensintervall vid normalfördelning

Föreläsning 4: Konfidensintervall (forts.)

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Studietyper, inferens och konfidensintervall

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

Föreläsning 7 Statistiska metoder 1

Dagens föreläsning o Hypotesprövning för två populationer Populationsandelar Populationsmedelvärden Parvisa observationer Relation mellan hypotesprövning och konfidensintervall o Den statistiska felmarginalen 2

Introduktion Hypotesprövning kan även användas för att utreda om det är signifikant skillnad mellan två olika populationer. I denna kurs fokuseras det på signifikanta skillnader i populationernas medelvärden och andelar. Om det ej går att förkasta nollhypotesen, så är de uppmätta skillnaderna mellan de två stickproven som observerats inom den statistiska felmarginalen. Metodiken är densamma som vid en population: 1. Formulera hypoteser 2. Bestäm signifikansnivå 3. Beräkna testvariabel 4. Undersök om nollhypotesen ska förkastas eller ej 3

Andelar, hypotesformulering Vid jämförelse av två andelar formuleras hypoteserna enligt: H 0 : π 1 π 2 = 0 H 1 : π 1 π 2 0 Kan även ha ensidiga mothypoteser: H 1 : π 1 π 2 > 0 H 1 : π 1 π 2 < 0 Vid ensidiga mothypoteser är det viktigt att beräkna testvariabeln på den differens som står uttryckt i hypotesformuleringen! 4

Andelar, testvariabel Testvariabeln bestäms med hjälp av följande uttryck: z obs = p 1 p 2 1 p(1 p) n + 1 1 n 2 Där p är andelen i det sammanslagna stickprovet (de två stickproven tillsammans). Denna testvariabel jämförs med ett kritiskt värde ur normalfördelningstabell, eller så beräknas p-värdet. För att dessa beräkningar ska kunna användas så ska : vara större än fem. n 1 p 1 1 p 1 och n 2 p 2 (1 p 2 ) 5

Andelar, exempel Vi anknyter till ett exempel som använts tidigare under kursen, där inställningen till det svenska EU-medlemskapet undersöktes. Man vill undersöka om andelen EU-negativa har ökat från ifjol till detta år. Bland 120 slumpmässigt utvalda uppgav 48 att de var negativa till det svenska medlemskapet. En opinionsundersökning riktad till ett slumpmässigt urval om 1080 personer för ett år sedan visade att andelen som då var negativa till det svenska medlemskapet var 35.5%. o Utred med hjälp av hypotesprövning om andelen EU-negativa har ökat signifikant. 6

Medelvärden, hypotesformulering När det ska utredas om det finns en signifikant skillnad mellan två medelvärden så formuleras hypoteser enligt: H 0 : μ 1 μ 2 = d 0 H 1 : μ 1 μ 2 d 0 Där d 0 är värdet man vill testa skillnaden mot, oftast är d 0 = 0. Även här kan det formuleras ensidiga mothypoteser: H 1 : μ 1 μ 2 < d 0 H 1 : μ 1 μ 2 > d 0 Kom ihåg att det är viktigt att beräkna rätt differens vid ensidiga mothypoteser! 7

Medelvärden, testvariabel När medelvärden undersöks kan två olika testvariabler beräknas, vilken som väljs beror på hur stora stickproven är. Vid stora stickprov (både n 1 och n 2 är större än 30): z obs = x 1 x 2 d 0 s 1 2 2 n 1 + s 2 Vid små stickprov (någon av n 1 och n 2 är mindre än 30): n 2 t obs = x 1 x 2 d 0 s p 2 1 n 1 + 1 n 2 s p 2 = n 1 1 s 1 2 + n 2 1 s 2 2 n 1 + n 2 2 8

Medelvärden, exempel Vintillverkaren som har förekommit tidigare i kursen anser själv att vin A smakar bättre än vin B. Tillverkaren vill nu undersöka om den svenska vuxna befolkningen är av samma åsikt. 10 slumpmässigt utvalda personer fick provsmaka vin A. De gav vinet medelbetyget 13,1 med en standardavvikelse på 1,85. 9 andra slumpmässigt utvalda personer provsmakade vin B. Det vinet fick medelbetyg 10,4 och standardavvikelse 1,33. o Utred om den vuxna svenska befolkningen är av samma åsikt som vintillverkaren. 9

Parvisa observationer En statistisk undersökning kan ibland vara utformad så att samma enhet observeras två gånger, t.ex. före och efter en behandling. Då kan man inte använda den metodik vi har gått igenom tidigare under föreläsningen. Då ska man istället använda metoden för parvisa observationer. I denna metod beräknar man differenserna mellan mätvärdena, och genomför därefter hypotesprövning på denna differens. 10

Parvisa observationer, hypotesformulering Hypoteserna formuleras som vid hypotesprövning för en population. H 0 : μ = 0 H 1 : μ 0 Skillnaden är att μ i detta fall är den genomsnittliga skillnaden mellan populationerna. Vid sådana undersökningar är det oftast mest intressant med ensidiga hypotesprövningar. H 1 : μ > 0 H 1 : μ < 0 11

Parvisa observationer, testvariabel Testvariabeln känner vi också igen från hypotesprövning för en population: t obs = x μ 0 s n Där medelvärdet och standardavvikelsen beräknats för den aktuella differensen. Antalet frihetsgrader är n 1, där n är antalet differenser. 12

Parvisa observationer, exempel Det finns en teori att sprintlöpare presterar bättre på en bana de känner till. Därför fick tio stycken 200-meterslöpare åka till en för dem okänd bana och springa ett lopp första dagen och ett andra dagen. Deras tider anges nedan. Utred med hjälp av hypotesprövning om denna teori stämmer. Sprinter Dag 1 Dag 2 1 20,23 20,19 2 20,10 20,11 3 20,33 20,25 4 20,18 20,16 5 20,41 20,43 6 20,02 19,99 7 20,17 20,17 8 20,36 20,32 9 20,07 20,08 10 20,21 20,15 13

Relation mellan konfidensintervall och hypotesprövning Det finns en tydlig relation mellan konfidensintervall och hypotesprövning. Vi går inte in alltför djupt i denna relation, utan vi tar den kortfattade versionen gällande två populationer. Om ett skapat konfidensintervall omfattar noll så finns det ingen signifikant skillnad mellan de två populationerna. Skillnaden ligger alltså inom den statistiska felmarginalen. 14

Tack för idag! Nästa tillfälle: Föreläsning 8, tisdag 12/3 13-15, sal A33 15