Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Relevanta dokument
Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning G60 Statistiska metoder

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Lektionsanteckningar 11-12: Normalfördelningen

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Hypotestestning och repetition

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Bearbetning och Presentation

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning G60 Statistiska metoder

Thomas Önskog 28/

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Sju sätt att visa data. Sju vanliga och praktiskt användbara presentationsformat vid förbättrings- och kvalitetsarbete

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

TMS136. Föreläsning 10

Statistik 1 för biologer, logopeder och psykologer

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Forskningsmetodik 2006 lektion 2

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Studietyper, inferens och konfidensintervall

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistik och epidemiologi T5

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Medelvärde, median och standardavvikelse

Föreläsning 5. Kapitel 6, sid Inferens om en population

EXAMINATION KVANTITATIV METOD vt-11 (110319)

2 Dataanalys och beskrivande statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Medicinsk statistik I

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Medicinsk statistik I

Beskrivande statistik

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Lektion 1: Fördelningar och deskriptiv analys

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Parade och oparade test

Uppgift a b c d e Vet inte Poäng

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TMS136. Föreläsning 7

F9 Konfidensintervall

732G01/732G40 Grundläggande statistik (7.5hp)

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Vetenskaplig metod och statistik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

FÖRELÄSNING 8:

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

January 3, Statistiska metoder vid kvantitativa. undersökningar. Jan-Olof Johansson

Obligatorisk uppgift, del 1

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

F3 Introduktion Stickprov

Repetition kapitel 1, 2, 5 inför prov 2 Ma2 NA17 vt18

Föreläsningsanteckningar till kapitel 8, del 2

F13 Regression och problemlösning

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

EXAMINATION KVANTITATIV METOD

13.1 Matematisk statistik

EXTRA ÖVNINGSUPPGIFTER MED SVAR

F9 SAMPLINGFÖRDELNINGAR (NCT

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Föreläsning 7: Punktskattningar

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Uppgift a b c d e Vet inte Poäng

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

2.1 Minitab-introduktion

Föreläsning 7. Statistikens grunder.

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Gamla tentor (forts) ( x. x ) ) 2 x1

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Föreläsning 7: Punktskattningar

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Transkript:

Beskrivande statistik Tony Pansell, Leg optiker Docent, Universitetslektor

Beskrivande statistik Grunden för all analys är ordning och reda! Beskrivande statistik hjälper oss att överskådligt sammanfatta datamassor organisera beskriva presentera

Beskrivande statistik Målet är en lättöverskådlig vy av data frekvenstabeller hur många observationer finns på varje nivå? centralmått, spridningsmått beskriver frekvenstabellen med siffror diagram visualiserar data, lätt att jämföra korrelation finns det något samband mellan två variabler?

Frekvensfördelning Fördelningen av observationer på en skala som visar med vilken frekvens varje enhet förekommer. Exempel Resultat på prov för 12 studenter: 9, 6, 8, 8, 9, 5, 8, 6, 10, 9, 9, 7 Poäng Frekvens (antal studenter) 5 1 6 2 7 1 8 3 9 4 10 1 Totalt 12 4 3,5 3 2,5 2 1,5 1 0,5 0 5 6 7 8 9 10 Serie1

Centralmått Svarar på frågan: Vad är normalt? Vad är genomsnittet på provet? De tre vanligaste måtten på centraltendensen i en fördelning är: Typvärde (mest frekvent förekommande) Medianvärde (det mittersta värdet) Medelvärde (genomsnittet)

Centralmått 5, 6, 6, 7, 8, 8, 8, 9, 9, 9, 9, 10 Typvärde = 9 ex. mest frekvent förekommande frukten i en fruktkorg ex. mest frekvent förekommande husdjuret på arbetsplatsen Medianvärde = 8 Medelvärde = 94/12 = 7.83

Spridningsmått Hur stor är variationen runt centralmåttet? Variationsvidd (tillsammans med typvärde) högsta värdet minus det lägsta värdet Kvartilavvikelse (tillsammans med median) bygger på uppdelning av observationerna i kvartiler (fyra 25%-indelningar) Standardavvikelse (tillsammans med medelvärde) ( x m) S = n 1 2

Spridningsmått Variationsvidd 10-5 = 5 5, 6, 6, 7, 8, 8, 8, 9, 9, 9, 9, 10 Kvartilsavvikelse (9 6,5)/2 = 1,25 Standardavvikelse 1,53 S ( 7.83) = x 12 1 2

Resultatet på provet Centralmått ± spridningsmått Typvärde = 9 ± 5 Medianvärde = 8 ± 1,25 Medelvärde = 94/12 = 7.83 ± 1,53

Exempel Beskrivande statistik

Normalfördelning (Gaussian distribution) Det är vanligt att fördelningen av en studerad parameter är okänd. Normalfördelningen kan då användas som en preliminär beskrivning av parametern. Normalkurvan är en teoretisk fördelning där man utgår från medelvärdet och standardavvikelsen Antar en symmetrisk, klockformad kurva (normalkurvan) 5 Histogram (Spreadsheet3 1v*12c) Var2 = 12*1*normal(x; 7,8333; 1,5275) 4 No of obs 3 2 1 0 5 6 7 8 9 10 Var2

Normalfördelning Medelvärde anger positionen på x-axeln 80 70 60 80 70 µ=35 µ=45 60 50 50 Y 40 Y 40 30 30 20 20 10 10 0 10 20 30 40 50 60 70 80 X 0 10 20 30 40 50 60 70 80 X Standardavvikelsen anger utseendet på kurvan σ=3 σ=1 Y Y X X

Normalfördelning En normalfördelad variabel antar ofta värden som ligger nära medelvärdet och mycket sällan värden som har en stor avvikelse. jättenormalt (högst sannolikt) normalt (sannolikt) mindre normalt (mindre sannolikt) onormalt (osannolikt)

Normalfördelning Arean under kurvan är alltid 100% För ytan under kurvan gäller att: - ca 68% av ytan finns innanför gränserna ± 1 s - ca 95% av ytan finna innanför gränserna ± 2 s - ca 99,7% av ytan finns innanför gränserna ± 3 s

Konfidensintervall Vi kan aldrig veta det exakta genomsnittet i populationen eftersom vi endast mäter ett stickprov Osäkerheten speglas genom ett intervall av flera möjliga medelvärden = ett konfidensintervall Vi behöver ett intervall som med en fastställd osäkerhet (sannolikhet) täcker det verkliga genomsnittet i populationen

Konfidensintervall Konfidensintervallets bredd speglar osäkerheten i undersökningsresultatet smalt liten osäkerhet liten standardavvikelse brett större osäkerhet stor standardavvikelse σ=3 σ=1 Y Y X X

95%-igt konfidensintervall Det vanligast förekommande konfidensintervallet inom forskning Verkligheten vi försöker mäta befinner sig innanför konfidensintervallet vid 95 % av fallen, eller vid 19 av 20 gånger. Vi accepterar en 5%-ig risk att missa det sanna medelvärdet

Det går inte att visa bilden för tillfället. Hur beräknas konfidensintervall kring ett medelvärde Med 95% sannolikhet finns det verkliga genomsnittet i studiepopulationen i intervallet 14,0-17,6 µg/m3

Korrelation mellan två variabler Om en förändring i den ena variabeln observeras samtidigt som en förändring sker i den andra variabeln, finns ett samband en korrelation mellan variablerna. Genom att plotta de två variablerna i en scatter plot kan svärmen av datapunkter studeras. 1:a variabeln utmed y-axeln (arm strength) 2:a variabeln utmed x-axeln (grip strength)

Korrelation mellan två variabler Trend Positiv (+) ökande Negativ (-) avtagande Nollkorrelation y=0 Line of best fit Korrelationskoefficienten (r) -1 r +1 hur väl punkterna överensstämmer med linjen (styrkan i sambandet). 0=ingen korrelation 1=perfekt korrelation

Korrelation och kausalitet Stark korrelation mellan glassförsäljningen och drunkningsolyckor ska glass förbjudas?

Individuell liten forskningsstudie Del av obligatoriskt kursmoment

Genomförande Tisdag 1. 2. 3. Kom på en frågeställning Välj mätmetod Genomför datainsamling Torsdag 4. Analysera data med Instat 5. Förbered presentation till måndag

Exempel på studie Var äter man billigast Calzone, i Vasastan eller på Söder? besök 10 pizzerior i vardera stadsdel och ta priset på en Calzone Skiljer sig vikten mellan Toms och Cloettas geléhallon? Köp två påsar geléhallon, väg alla hallon Skiljer sig andelen manliga och kvinnliga cyklister i centrala Stockholm och i förorten? Räkna antal män/kvinnor som cyklar vid Hornstull och i Alby

Tänk på Bestäm dig för en jämförelse av minst två urval Åhléns mot Konsum; Söder mot Norr, Toms mot Cloetta, Killar mot Tjejer Du måste ha flera observationer i varje stickprov för att kunna räkna ut medelvärde och standardavvikelse (ca 10)