Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Relevanta dokument
Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Hur man tolkar statistiska resultat

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Hypotestestning och repetition

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Medicinsk statistik II

Hur skriver man statistikavsnittet i en ansökan?

Gamla tentor (forts) ( x. x ) ) 2 x1

Parade och oparade test

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning G60 Statistiska metoder

, s a. , s b. personer från Alingsås och n b

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Statistik 1 för biologer, logopeder och psykologer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Statistik och epidemiologi T5

Föreläsning G60 Statistiska metoder

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

FACIT (korrekta svar i röd fetstil)

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Följande resultat erhålls (enhet: 1000psi):

Studietyper, inferens och konfidensintervall

Medicinsk statistik II

OBS! Vi har nya rutiner.

Sänkningen av parasitnivåerna i blodet

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F3 Introduktion Stickprov

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Uppgift 1. Produktmomentkorrelationskoefficienten

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

EXAMINATION KVANTITATIV METOD

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

EXAMINATION KVANTITATIV METOD vt-11 (110319)

TAMS65 - Föreläsning 6 Hypotesprövning

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

OBS! Vi har nya rutiner.

TMS136. Föreläsning 13

Föreläsningsanteckningar till kapitel 9, del 2

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Skrivning/skriftlig eksamen till statistikdelen av kursen i forskningsmetodik maj 2002

Höftledsdysplasi hos dansk-svensk gårdshund

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

OBS! Vi har nya rutiner.

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

7.3.3 Nonparametric Mann-Whitney test

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Att välja statistisk metod

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Jag läser kursen på. Halvfart Helfart

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Datorlaboration 2 Konfidensintervall & hypotesprövning

F22, Icke-parametriska metoder.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

7.5 Experiment with a single factor having more than two levels

Omtentamen i Metod C-kurs

F9 SAMPLINGFÖRDELNINGAR (NCT

Kapitel 10 Hypotesprövning

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Samplingfördelningar 1

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Föreläsning G60 Statistiska metoder

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

TMS136. Föreläsning 11

Lektionsanteckningar 11-12: Normalfördelningen

TAMS65 - Föreläsning 6 Hypotesprövning

Korrelation och autokorrelation

Tentamen i Metod C-kurs

FÖRELÄSNING 8:

Transkript:

Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större grupp estimering. att jämföra grupper mot varandra och dra slutsatsen om någon grupp avviker hypotesprövning. Estimering Med hjälp av slumpmässigt dragna stickprov uppskattar (estimerar) vi hur det ser ut i de populationer varifrån stickproven är tagna. Statistisk interferens Statistisk interferens Analys av stickprovet ger oss information om populationen, förutsatt att stickprovet är: tillräckligt stort slumpmässigt utvalt från populationen normalfördelat

Exempel på estimering Man vill veta hur mycket svenska -åringar tittar på TV per dag Ur populationen alla -åringar görs ett urval och ur detta dras ett stickprov. Dessa intervjuas om hur länge de tittar på TV. Medelvärdet för detta stickprov var,6 timmar. 9% konfidensintervall ger gränserna, till,8 tim.,,6,8 nedre gräns punktestimat övre gräns Med 9% sannolikhet ser en svensk -åring mellan,-,8 timmar på TV per dag.. Hypotesprövning Istället för att enbart estimera hur det ser ut i populationen försöker vi att statistiskt pröva hypoteser om populationen som stickprovet kommer ifrån. Nollhypotes (H ) Ett antagande om ingen skillnad eller samband föreligger. Att slumpen är orsaken till det erhållna värdet. Alternativhypotes (H ) (forskningshypotesen) Ett antagande om att det finns en skillnad eller ett samband. Att det finns en annan orsak än slumpen till det erhållna värdet. Hypotesprövning Sannolikhetsteorin Den grundläggande frågan är alltid om vårt stickprovsresultat gäller generellt (i populationen) eller är ett resultat av slumpmässiga variationer. Vi behöver en metod för att hantera osäkerheten i en urvalsundersökning. Hypotesprövningen testar om slumpverkan kan ses som orsaken till forskningsresultatet. Vi testar hypotesens giltighet genom en sannolikhetsberäkning. Hur beter sig ett slumpmässigt stickprov i förhållande till populationen? Ett stickprovsmedelvärde varierar från stickprov till stickprov, men i genomsnitt är det samma som populationsmedelvärdet (om stickprovet är slumpmässigt). Osannolikhet Vi kan välja att definiera en osannolik händelse som en händelse som bara inträffar av gånger om H är sann (oftare om den är falsk). variationer inom konfidensintervall beror sannolikt på slumpen variationer utanför konfidensintervall beror osannolikt på slumpen jättenormalt (jättesannolikt) normalt (sannolikt) mindre normalt (mindre sannolikt) Signifikansnivån Sannolikheten (risken) att dra fel slutsats bestäms genom signifikansnivån α (alfa) Normalt att acceptera % risk att slumpen orsakar resultatet Vi anger accepterad risknivå (signifikansnivå) för att begå fel i tolkningen av resultatet exempel: α=% ger ett 9% konfidensintervall exempel: α=% ger ett 99% konfidensintervall osannolikt

Slumpmässiga fel finns det en skillnad Typ I fel I verkligheten är det lika Typ I och typ II fel Vi riskerar ALLTID att begå ett misstag i vårt antagande typ I-fel: förkastar nollhypotesen trots att den är sann (vi finner en falsk skillnad) typ II-fel: accepterar nollhypotesen trots att den är falsk (vi missar en äkta skillnad) Analysen visar en skillnad att det är lika Sant positiv Falskt negativ Falskt positiv Sant negativ Hur stor risk är vi beredda att ta? högt α-värde risk för typ I-fel lågt α-värde risk för typ II-fel Typ II fel Exempel på studie med parvis jämförelse Vi undersöker om forin är den samma på långt och kort avstånd Frekvensdiagram på uppmätta forivärden PCT PCT på på avstånd avstånd och och nära nära före före behandling behandling PCT LH: N = 7; Mean =,76; StdDv =,7; Max = ; Min = PCT NH: N = 7; Mean =,88; StdDv =,768; Max = 8; Min = Hypoteserna som ska testas H : Forin påverkas inte av fixationsavståndet. H : Forin har inte samma vinkel på långt och nära avstånd. 6 7 8 9 PCT LH PCT NH Frekvensdiagram med normalkurvor på forivärden PCT på avstånd och nära före behandling PCT LH: N = 7; Mean =,76; StdDv =,7; Max = ; Min = PCT NH: N = 7; Mean =,88; StdDv =,768; Max = 8; Min = Har forin samma vinkel på långt och kort avstånd? Kan skillnaden i forimätningarna uppstått av slumpen? PCT på avstånd och nära före behandling 6 7 8 9 PCT LH PCT NH 6 7 8 9 PCT LH PCT NH

Har forin samma vinkel på långt och kort avstånd? Kan skillnaden i forimätningarna uppstått av slumpen? PCT på avstånd och nära före behandling Vi behöver Medel göra -9% KI en +9% statistisk KI analys! -9% KI +9% KI -9% KI +9% KI Medel medelv. medelv. SD fördeln. fördeln. PCT LH,,6,87, -,9,8 PCT NH,88 9,,,77,, Statistiska tester Utgår från: typen (kvalitén) av data om data är normalfördelat eller inte hur många grupper som ska jämföras 6 7 8 9 PCT LH PCT NH Lite begrepp T-test Variabel: något som kan variera hos vår population Resultatvariabel: anger resultatet, det vi är intresserade av Förklaringsvariabel: det som beskriver vår population, vi väljer själva Beroende data: inom grupp/individ (dependent, paired) Oberoende data: mellan grupp/individer (independent) Ensidigt / Tvåsidigt test (one-tailed / two-tailed) Förhållande mellan en eller två kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel) T-test ANOVA analysis of variance Resultatvariabeln alltid på y-axeln Kräver kvantitativ normalfördelad data Förhållandet mellan tre eller fler kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel) Analysera dataset: tårmenisk längd (m) män kvinnor

ANOVA analysis of variance Chi- / Fisher Exakt test Resultatvariabeln alltid på y-axeln Kräver kvantitativ normalfördelad data Analysera dataset: LUSvärde inkomst (kr) Korstabellanalys av data på nominalskale-nivå Nollhypotes: det föreligger ingen skillnad i proportioner mellan grupperna alt. Analyserar observerade frekvenser (O) vilka jämförs med förväntade frekvenser (E) alt. Jämför två grupper mot varandra som inte är matchade (ej beroende av varandra) läkare ingenjör pilot Chi- / Fisher Exakt test Korrelation mellan två variabler Om en förändring i den ena variabeln observeras samtidigt som en förändring sker i den andra variabeln, finns ett samband en korrelation mellan variablerna. Analysera dataset: stud Sthlm-Kalmar Genom att plotta de två variablerna i en scatter plot kan svärmen av datapunkter studeras. :a variabeln utmed y-axeln (arm strength) :a variabeln utmed x-axeln (grip strength) Korrelation mellan två variabler Trend Positiv (+) ökande Negativ (-) avtagande Nollkorrelation y= Korrelation och kausalitet Stark korrelation mellan glassförsäljningen och drunkningsolyckor ska glass förbjudas? Line of best fit Korrelationskoefficienten (r) - r + hur väl punkterna överensstämmer med linjen (styrkan i sambandet). =ingen korrelation =perfekt korrelation Analysera dataset: Frukten

Tolkning av resultat signifikans (p) p-värdet anger sannolikheten för att slumpen orsakat resultatet förkasta nollhypotesen om den vore sann När p-värdet är mindre än α-värdet är resultatet signifikant. Det föreligger sannolikt en skillnad! Ex. Jämförelsen av konvergensnärpunkt hos elever med läsbesvär med elever utan besvär var signifikant (p=,). Elever med besvär uppvisade en genomsnittlig KNP på 7 cm (±) medan elever utan besvär uppvisade en normal NPP på 7 cm (±). 6