Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik Tony Pansell, optiker Universitetslektor

Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp estimering 2. att jämföra grupper mot varandra och dra slutsatsen om någon grupp avviker hypotesprövning

Estimering Med hjälp av slumpmässigt dragna stickprov uppskattar (estimerar) vi hur det ser ut i de populationer varifrån stickproven är tagna.

Statistisk interferens Analys av stickprovet ger oss information om populationen, förutsatt att: stickprovet är tillräckligt stort slumpmässigt utvalt från populationen normalfördelat

Statistisk interferens

Exempel på estimering Man vill veta hur mycket svenska 10-åringar tittar på Tv per dag. Ur populationen alla 10-åringar görs ett urval och ur detta dras ett stickprov. Dessa intervjuas om hur länge de tittar på Tv. Medelvärdet för detta stickprov var 2,6 timmar. 95% konfidensintervall ger gränserna 2,4 till 2,8 tim. 2,4 2,6 2,8 nedre gräns punktestimat övre gräns Med 95% sannolikhet ser en svensk 10-åring mellan 2,4-2,8 timmar på Tv per dag.

Hypotesprövning Istället för att enbart estimera hur det ser ut i populationen försöker vi att statistiskt pröva hypoteser om populationen som stickprovet kommer ifrån. Nollhypotes (H0) Ett antagande om ingen skillnad eller inget samband. Att slumpen är orsaken till det erhållna värdet. Alternativhypotes (H1) (forskningshypotesen) Ett antagande om att det finns en skillnad eller ett samband. Att det finns en annan orsak än slumpen till det erhållna värdet.

Hypotesprövning Den grundläggande frågan är alltid om vårt stickprovsresultat gäller generellt (i populationen) eller är ett resultat av slumpmässiga variationer. Vi behöver en metod för att hantera osäkerheten i en urvalsundersökning. Hypotesprövningen testar om slumpverkan kan ses som orsaken till forskningsresultatet. Vi testar hypotesens giltighet genom en sannolikhetsberäkning.

Sannolikhetsteorin Hur beter sig ett slumpmässigt stickprov i förhållande till populationen? Ett stickprovsmedelvärdet varierar från stickprov till stickprov, men i genomsnitt är det samma som populationsmedelvärdet (om stickprovet är slumpmässigt).

Osannolikhet Vi kan välja att definiera en osannolik händelse som en händelse som bara inträffar 5 av 100 gånger om H0 är sann (oftare om den är falsk). variationer inom konfidensintervall beror sannolikt på slumpen variationer utanför konfidensintervall beror osannolikt på slumpen jättenormalt (jättesannolikt) normalt (sannolikt) mindre normalt (mindre sannolikt) osannolikt

Signifikansnivån Sannolikheten / risken att dra fel slutsats bestäms genom signifikansnivån α (alfa) Ofta accepteras 5% risk att slumpen orsakat resultatet. Vi anger accepterad risknivå (signifikansnivå) för att begå fel i tolkningen av resultatet exempel: α=5% ger ett 95% konfidensintervall exempel: α=1% ger ett 99% konfidensintervall

Slumpmässiga fel Verkligheten Skillnad Typ I fel Lika Test Skillnad Lika Sant positiv Falskt negativ Falskt positiv Sant negativ Typ II fel

Typ I och typ II fel Vi riskerar alltid att begå ett misstag i vårt antagande typ I-fel: förkastar nollhypotesen trots att den är sann (vi finner en falsk skillnad) typ II-fel: accepterar nollhypotesen trots att den är falsk (vi missar en äkta skillnad) Hur stor risk är vi beredda att ta? högt α-värde risk för typ I-fel lågt α-värde risk för typ II-fel

Exempel på parvis jämförelse Vi vill undersöka om forin är samma på avstånd och nära. H0: Forin påverkas inte av fixationsavståndet. H1: Forin har inte samma vinkel på långt och nära avstånd.

Frekvensdiagram på forivärden 5 Histogram PCT PCT på på avstånd avstånd och och nära nära före före behandling behandling PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4 4 No of obs 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 PCT 1 LH PCT 1 NH

Frekvensdiagram med normalkurvor på forivärden Histogram 5 PCT på avstånd och nära före behandling PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4 4 3 No of obs 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 PCT 1 LH PCT 1 NH

Har forin samma vinkel på avstånd och nära? Kan skillnaden i forimätningarna uppstått av slumpen? 5 Histogram PCT på avstånd och nära före behandling 4 3 No of obs 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 PCT 1 LH PCT 1 NH

Har forin samma vinkel på avstånd och nära? Kan skillnaden i forimätningarna uppstått av slumpen? 5 4 Histogram PCT på avstånd och nära före behandling Vi behöver göra en statistisk analys! Medel -95% KI +95% KI 3-95% KI +95% KI -95% KI +95% KI Medel medelv. medelv. SD fördeln. fördeln. PCT 1 LH 4,11 2,36 5,87 3,42-2,59 10,83 PCT 1 NH 11,88 9,43 14,33 4,77 2,54 21,23 No of obs 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 PCT 1 LH PCT 1 NH

Statistiska tester Utgår från: typen av data om data är normalfördelat eller inte hur många grupper som ska jämföras

Lite begrepp Variabel: något som kan variera hos vår population Resultatvariabel: anger resultatet, det vi är intresserade av Förklaringsvariabel: det som beskriver vår population, vi väljer själva Beroende data: inom grupp/individ (dependent, paired) Oberoende data: mellan grupp/individer (independent) Ensidigt / Tvåsidigt test (one-tailed / two-tailed)

Ensidigt och tvåsidigt test Ett ensidigt test kan användas om man med säkerhet vet att en eventuell förändring bara kan gå i en viss riktning Om man inte vet i vilken riktning en förändring kan gå, måste ett tvåsidigt test väljas. Om man tvivlar tvåsidigt test

T-test Förhållande mellan en eller två kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel) Resultatvariabeln alltid på y-axeln Kräver kvalitativ normalfördelad data Analysera dataset: tårmenisk längd (m) män kvinnor

ANOVA analysis of variance Förhållandet mellan tre eller fler kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel) Resultatvariabeln alltid på y-axeln Kräver kvalitativ normalfördelad data Analysera dataset: LUSvärde inkomst (kr) läkare ingenjör pilot

Chi-2 / Fisher Exakt test Korstabellanalys av data på nominalskale-nivå alt.1 Analyserar observerade frekvenser (O) vilka jämförs med förväntade frekvenser (E) alt.2 Jämför två grupper mot varandra som inte är matchade (ej beroende av varandra) Analysera dataset: stud Sthlm-Kalmar

Regression Regression sambandet mellan två eller fler kontinuerliga variabler (ex. ålder, längd, blodtryck) Analysera dataset: Frukten glassförsäljning vattentemperatur

Vilka statistiska metoder korrelerar med varandra Parametriska metoder Icke parametriska metoder Skillnader mellan oberoende grupper T-test för oberoende data Mann-Whitney test (2 oberoende stickprov) ANOVA/MANOVA Kruskal-Wallis test ( 3 oberoende) Skillnader mellan beroende grupper T-test för beroende data ANOVA Samband mellan variabler Korrelations koefficient Wilcoxon's matched pairs test Friedman's test Spearman Kategorisk data (ingen motsvarighet i parametriska) Chi-square test the Phi coefficient the Fisher exact test

Tolkning av resultat signifikans (p) Testfunktionen: p-värdet (p-value) anger sannolikheten för slumpens påverkan eller risken att förkasta nollhypotesen om den vore sann. När sannolikheten för ett slumpmässigt resultat är mindre än α- värdet är resultatet signifikant. Det finns en skillnad. p-värdet är mindre än 5%. Ex. Jämförelsen av konvergensnärpunkt hos elever med läsbesvär med elever utan besvär var signifikant (p=0,002). Elever med besvär uppvisade en genomsnittlig knp på 17 (±5) cm medan elever utan besvär uppvisade en normal knp (7 (±2) cm (Pansell et al., 2002).

Power Power (styrkan) hos ett test är ett mått på hur bra det är på att förkasta nollhypotesen om den är falsk. Power = förmågan att säga att det inte är slumpen när det verkligen inte är slump som orsakat skillnaderna mellan grupperna. Styrkan ökar med ökat antal N Styrkan minskar när alfanivån sjunker (ex från 0,05 till 0,01) Behålles H-noll kan det bero på att H-noll är sann eller att experimentet har låg styrka (power)

Analytisk statistik Tony Pansell, optiker Universitetslektor