Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Relevanta dokument
F3 Introduktion Stickprov

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning G60 Statistiska metoder

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Hur skriver man statistikavsnittet i en ansökan?

Statistik och epidemiologi T5

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Hypotestestning och repetition

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Hur man tolkar statistiska resultat

Föreläsning G60 Statistiska metoder

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Medicinsk statistik I

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Beskrivande statistik

Bearbetning och Presentation

EXAMINATION KVANTITATIV METOD vt-11 (110204)

2 Dataanalys och beskrivande statistik

Gamla tentor (forts) ( x. x ) ) 2 x1

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Lektionsanteckningar 11-12: Normalfördelningen

, s a. , s b. personer från Alingsås och n b

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning 7: Punktskattningar

Följande resultat erhålls (enhet: 1000psi):

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

2.1 Minitab-introduktion

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Examinationsuppgift 2014

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

7.5 Experiment with a single factor having more than two levels

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Medicinsk statistik II

Laboration 2 Inferens S0005M VT16

Statistik 1 för biologer, logopeder och psykologer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

TAMS65 - Föreläsning 6 Hypotesprövning

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Laboration 2 Inferens S0005M VT18

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

1 Mätdata och statistik

Föreläsning 1: Introduktion

FÖRELÄSNING 8:

LABORATION 1. Syfte: Syftet med laborationen är att

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 5. Kapitel 6, sid Inferens om en population

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Föreläsning 1: Introduktion

TAMS65 - Föreläsning 6 Hypotesprövning

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Att göra före det schemalagda labpasset.

Statistik. Statistik. Statistik. Statistics, Lars Walter. Forsknings- och utvecklingsenheten för närsjukvård. Folkhälsocentrum

Vetenskaplig metod och statistik

Föreläsning 7: Punktskattningar

2. Test av hypotes rörande medianen i en population.

Vetenskaplig metod och statistik

kodnr: 2) OO (5p) Klassindelningar

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

13.1 Matematisk statistik

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Föreläsning 1: Introduktion

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Förra gången (F4-F5)

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Vetenskaplig teori och metod Provmoment: Tentamen 1 Ladokkod:

MVE051/MSG Föreläsning 7

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning G60 Statistiska metoder

Välkommen till Matematik 3 för lärare!

Föreläsning G60 Statistiska metoder

732G01/732G40 Grundläggande statistik (7.5hp)

7.3.3 Nonparametric Mann-Whitney test

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift 1. Produktmomentkorrelationskoefficienten

Studieplanering till Kurs 2b Grön lärobok

Hypotestest och fortsättning av skattningar och konfidensintervall

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Transkript:

Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande tolkning av data. Histogram, spridningsdiagram, medelvärden, standardavvikelser, boxplots, etcetera. Matematisk statistik. Populationer, stickprov, slutsatser, osäkerhet, p-värden, signifikanstest, medelvärden, standardavvikelser, normalfördelningar, skattningar, konfidensintervall etcetera. Fredrik Jonsson Januari 2012, vt12 (1 : 18), vt12 (2 : 18) Vad är ett stickprov? Stickprov och urval Enkelt svar: ett begränsat antal individer som hör till en viss population (ett urval). Att tillämpa statistiska metoder handlar för det mesta om att låta begränsade urval tala för ett större sammanhang. Ofta underförstått: att stickprovet bör vara representativt för populationen. Bör undvikas: att stickprovet enbart innefattar extrema individer av ett eller annat slag. Avsikten med stickprov är: Att det är representativt för hela sammanhanget. Att det är tillräckligt stort så att observerade effekter inte förklaras av enskilda individer. Annan innebörd: att individerna valts slumpmässigt från populationen (sannolikhetsteori). För att öka trovärdigheten kan man: Bredda urvalet, exempelvis över tid eller geografiskt. Engelsk terminologi: sample = stickprov, sampling = att bilda stickprov, välja individer slumpmässigt Göra lägre anspråk vad gäller sammanhanget. Ta med fler individer i undersökningen., vt12 (3 : 18), vt12 (4 : 18)

Vad är ett medelvärde? Vad är en standardavvikelse? Givet n stycken tal x 1,..., x n definierar man medelvärdet x av dessa: x = 1 n n x i. Givet n stycken tal x 1,..., x n definierar man variansen s 2 av dessa: s 2 = 1 n 1 n (x i x) 2. Mäter den kvadratiska variationen kring medelvärdet. Kallas även för aritmetiskt medelvärde (jmf. geometriska och harmoniska dito). Engelska: mean. Uttrycket i genomsnitt motsvaras av on average. Exempel på ett lägesmått. Ett altenativt lägesmått ges av medianen, som anger det mittersta värdet i en storleksordning av x 1,..., x n. Motsvarande standardavvikelse s ges av s = 1 n (x i x) n 1 2. Om x 1,..., x n uttrycks i en viss enhet, så har s samma enhet. Ett spridningsmått., vt12 (5 : 18), vt12 (6 : 18) Hypotesprövning som vetenskaplig metod Hypotesprövning och statistisk signifikans En hypotes påstår något om den verklighet vi undersöker eller tänkt oss att undersöka. Undersökningar eller experiment utförs för att testa om hypotesen stämmer. Statistisk signifikans betyder att man utesluter den slumpmässiga variationen som alltför otrolig förklaring till den uppmätta effekten. Nollhypotes att det som verkar vara en skillnad bara beror på slump. Resultat 1: I linje med vad hypotesen förutspådde Resultat 2: En stark kontrast mot vad hypotesen förutspådde; något som talar emot hypotesen. Alternativ hypotes en förklaring till den uppmätta skillnaden i termer av verkliga skillnader. Slutsats 1: Hypotesen kan inte förkastas. Statistisk signifikans: nollhypotesen förkastas. Slutsats 2: Hypotesen verkar högst otrolig, och förkastas därför. Signifikansnivå: den gräns vid vilket det inträffande bedöms som alltför osannolikt ur noll-perspektivet. (Ex: 5%, 1%, 0,1%), vt12 (7 : 18), vt12 (8 : 18)

Varför statistiskt signifikanta resultat? Vad är ett p-värde? Att säkerställa slutsatser om populationer trots stickprovets begränsningar. Icke-signifikans betyder att man misslyckats. Den lägsta signifikansnivå med vilken den uppmätta effekten fortfarande är signifikant. Med andra ord, statistiska metoder ger ofta en form av kontroll. Sannolikheten att få en minst lika stor effekt enbart på grund av slump. Mer allmänt behandlar statistisk teori även felmarginaler och mätosäkerhet, hur man bäst tar till vara på information från stickprov, etcetera., vt12 (9 : 18), vt12 (10 : 18) Exempel Försöksplanering Vilka frågeställningar/hypoteser intresserar vi oss för? Hur använder vi våra tillgängliga resurser på bästa sätt? Vilken typ av data samlar vi in, och hur pass omfattande behöver studien vara? I mätningarna ovan verkar det finnas en positiv tendens. Motsvarande p-värde för att detta enbart skulle vara slump är (t-test) 1.75% Är insamlad data tillräckligt representativ och omfattande för sammanhanget som vi intresserar oss för? Kan data analyseras och redovisas med några vedertagna metoder? vilket är ett förhållandevis starkt indicium för att det råder en positiv tendens., vt12 (11 : 18) Är det relevant att inkludera någon form av kontrollgrupp?, vt12 (12 : 18) Kan det tänkas finnas andra förklarande faktorer än de som försöket uppmärksammar, och kan vi i så fall inkludera eller kontrollera dessa på något sätt?

... Stolp/stapeldiagram...är ett exempel på ett enklare programpaket utvecklat för statistiska beräkningar. Det påminner om Microsoft Excel i sitt upplägg. Mata in separata stickprov kolumnvis i arbetsfältet. Namnge gärna kolumnerna för att hålla ordning. Under fliken Graph återfinns diverse verktyg för grafiska representationer. För att beräkna medelvärden och standardavvikelser, använd exempelvis Basic statistics under fliken Stat. Kräver diskreta observationer., vt12 (13 : 18), vt12 (14 : 18) Histogram Lådagram (boxplot) Bygger på klassindelning relativt motsvarande data. Bygger på begreppen median och undre/övre kvartil., vt12 (15 : 18), vt12 (16 : 18)

Spridningsdiagram Ett exempel x = 5 och ȳ = 0. Samt s x = 1 och s y = 4. x y Parvisa observationer., vt12 (17 : 18) Centreringen är olika till vänster (5) och höger (0). Variationen till höger är ungefär fyra gånger så stor som den till vänster., vt12 (18 : 18)