Kvantitativ strategi Univariat analys 2. Wieland Wermke

Relevanta dokument
Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Statistik 1 för biologer, logopeder och psykologer

Forskningsmetodik 2006 lektion 2

13.1 Matematisk statistik

Medelvärde, median och standardavvikelse

2 Dataanalys och beskrivande statistik

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning G60 Statistiska metoder

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Statistik och epidemiologi T5

Introduktion till statistik för statsvetare

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Grundläggande matematisk statistik

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Finansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Bearbetning och Presentation

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

MVE051/MSG Föreläsning 7

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsning G70 Statistik A

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Valresultat Riksdagen 2018

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

6-2 Medelvärde och median. Namn:

Beskrivande statistik

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Linjär regressionsanalys. Wieland Wermke

Föreläsning 4: Beskrivande statistik

Medicinsk statistik I

Hypotestestning och repetition

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

ÖVNINGSUPPGIFTER KAPITEL 2

Arvodesenkät. Resultat Egenföretagare.

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Hur måttsätta osäkerheter?

Grundläggande matematisk statistik

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

732G01/732G40 Grundläggande statistik (7.5hp)

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Psykologi som vetenskap


ÖVNINGSUPPGIFTER KAPITEL 2

Beskrivande statistik

F22, Icke-parametriska metoder.

2. Test av hypotes rörande medianen i en population.

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Statistik Lars Valter

Repetitionsföreläsning

Stokastiska signaler. Mediesignaler

Parade och oparade test

Kap 3: Diskreta fördelningar

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Naturliga populationers evolution och bevarande, 6hp

Richard Öhrvall, 1

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Föreläsning 4: Beskrivande statistik

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

OBS! Vi har nya rutiner.

Föreläsning 12: Regression

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

1.1 Diskret (Sannolikhets-)fördelning

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Fråga nr a b c d 2 D

INNEHÅLL DEL II: STATISTISK INFERENS SLUMPMÄSSIGA SAMPEL

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Bilaga 6 till rapport 1 (5)

Att välja statistisk metod

Förra gången (F4-F5)

Forskningsmetodik 2006 lektion 4 Felkalkyl. Per Olof Hulth

Extramaterial till Matematik X

EXAMINATION KVANTITATIV METOD

TAMS79: Föreläsning 6. Normalfördelning

medelvärdet för tid svarar mot medelvärdet för hastighet

ÖVNINGSUPPGIFTER KAPITEL 9

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

4 Diskret stokastisk variabel

Statistik 1 för biologer, logopeder och psykologer

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Att göra före det schemalagda labpasset.

Transkript:

+ Kvantitativ strategi Univariat analys 2 Wieland Wermke

+ Sammanfattande mått: centralmått n Beroende på skalnivån finns det olika mått, som betecknar variablernas fördelning n Typvärde eller modalvärde n talvärdet som förekommer mest n Median n Värde som ligger i mitten av alla observationsvärden (när man sorterar dem efter sitt talvärde, i turordning), Md delar urvalet i två jämna grupper n 1 4 5 7 9 12 14 n Om det är en jämt antal observationer, summerar man de två i mitten och delar summan med två n 1 4 5 7 9 12 14 15 à Md = 8 n Medelvärde

+ Formler n Statistiska analyser/beräkningar sammanfattas oftast i matematiska formler n Exempel: medelvärde: n Def. i vanliga ord: Summera samtliga observationers variabelvärde och dela denna summa med antalet observationer n Fortfarande ganska lätt, dock finns det mer komplexa exempel n Därför beskrivs alla statistiska operationer i formler n Också bra, dem är lika på alla språk!

+ Formler (ex. medelvärde) n Varje observation i urvalet betecknas med i som kan ta ett värde mellan 1 och n (antalet av observationer i urvalet) n varje observation i har ett bestämt värde för en viss variabel x; vi har n stycken x, en för varje i: x i n Alla x i ska nu summeras, det betyder: x 1 + x 2 + x 3 + + x n n Det uttrycks med ett sumtecken: grekiskt stor Sigma x = n x i i=1 n n Medelvärde av variabeln Summera alla värde x för observationen i som ligger mellan 1 och n och delar genom n n 1 4 5 7 9 12 14 15 = 8,375

+ Sammanfattande mått: Spridningsmått n Viktigt är också variabelns spridning n Utbredning (range) à avståndet mellan minsta och största värdet n Kvartilsavstånd: n man indelar fördelningen i fyra lika delar efter att ha sorterat dem efter sitt talvärde (som man också gör för medianen): Q1=första 25 procentgräns, Q2=median, Q3=75 procent n kvartilsavstånd= Q3-Q1 n Man får utesluta outliers etc.

+ Kvartilsavstånd

+ Varför är spridningsmått så viktiga? n de uttrycker kvalitet av utsagor över medelvärdet n en hög standardavvikelse ifrågasätter en utsaga över genomsnittet n För att kunna genomföra vissa analyser är det ibland bättre att utesluta vissa outliers (som kan analyseras extra eller tyda på fel svar) n Bloxplots är en bra instrument för att se sådana

+ Boxplotdiagram Värden som ligger längre ifrån boxen än 1,5 gånger avståndet mellan de yttre kvartilerna betraktas som utliggare outliers).

+ Varians och standardavvikelse n Det absolut vanligaste förkommande spridningsmåttet är standardavvikelsen n Första steget är att beräkna den så kallade variansen n Båda är nyckelmått i nästan alla kvantitativa analyser n Medelvärde och standardavvikelse ska anges i alla studier som använder sig av intervallskaladata!

+ Varians n Hur långt ifrån variabelns medelvärdet befinner sig varje observation? n Vi vill ha ett mått som uttrycker det genomsnittliga avståndet från medelvärdet, som kan visa hur stor variansen är n ju mindre variansen, ju större koncentration runt medelvärdet Medelvärde(

+ Varians n Problem: det går inte att bara summera, eftersom det bara blir noll (annars hade vi inget medelvärde) n à kvadrera differens mellan medelvärdet och det observerade värdet (minus försvinner), sedan summera n Problem: när man delar genom antalet, där blir variansen för liten n dra av ett från antalet innan du delar summan

+ Varians n Variansen visar därmed n ju större skillnaderna mellan medelvärdet och observationerna är, ju större är variansen n ju mer observationer ju mindre blir variansen (ju säkrare är medelvärdet) s 2 = (x x) 2 i n 1

+ Standardavvikelse n Eftersom variansen inte har samma dimension/enhet (t.ex. cm blir cm 2 ) som medelvärdet (pga. kvadraten), drar vi kvadratroten, så har både centralmått (medelvärde) samt spridningsmått (standardavvikelse) samma mått igen s = (x x) 2 i n 1

+ Standardavvikelse, exempel Observa(on Värde 1 1 (1-2) = - 1 (- 1) 2 = 1 2 1 (1-2) = - 1 (- 1) 2 = 1 3 1 (1-2) = - 1 (- 1) 2 = 1 4 3 (3-2) = 1 (1) 2 = 1 5 4 (4-2) = 2 (2) 2 = 4 Summa 10 Medelvärde 10/5 = 2 8 Variansen 8/(5-1) = 8/4 = 2 Standardavvikelsen Roten ur 2 = 1,4

+ Vilka mått användas för vilken skalnivå? *) ange även typvärdets andel (t ex i % = modalprocent) av alla plus det totala antalet enheter (n) (+) = Tillåtet med sällan förstahandsalternativet? = Tänkbart om kategorierna är fler och om de på ett meningsfullt sätt kan åsättas talvärden