Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Relevanta dokument
Kvantitativ strategi Univariat analys 2. Wieland Wermke

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Statistik 1 för biologer, logopeder och psykologer

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

13.1 Matematisk statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

2 Dataanalys och beskrivande statistik

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Föreläsning G70 Statistik A

Föreläsning G60 Statistiska metoder

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Statistiska undersökningar

Forskningsmetodik 2006 lektion 2

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Lektionsanteckningar 11-12: Normalfördelningen

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Statistik och epidemiologi T5

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Statistik Lars Valter

6-2 Medelvärde och median. Namn:

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

Repetitionsföreläsning

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

ÖVNINGSUPPGIFTER KAPITEL 2

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Föreläsning 4: Beskrivande statistik

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Moment 4: Metoder för dataanalys 4. 1 Statistisk analys

Medelvärde, median och standardavvikelse

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

ÖVNINGSUPPGIFTER KAPITEL 2

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Hypotestestning och repetition

732G01/732G40 Grundläggande statistik (7.5hp)

Statistik Termin 10, Läkarprogrammet, HT16

Beskrivande statistik

Fråga nr a b c d 2 D

Grundläggande matematisk statistik

Statistikens grunder HT, dagtid Statistiska institutionen

Förra gången (F4-F5)

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Naturliga populationers evolution och bevarande, 6hp

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Medicinsk statistik I

Valresultat Riksdagen 2018

Läs noggrant informationen nedan innan du börjar skriva tentamen

Linjär regressionsanalys. Wieland Wermke

OBS! Vi har nya rutiner.

Att välja statistisk metod

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Finansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TMS136. Föreläsning 7

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

MVE051/MSG Föreläsning 7

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Hur måttsätta osäkerheter?

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

EXTRA ÖVNINGSUPPGIFTER MED SVAR

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Föreläsning 4 Beskrivande statistik

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Introduktion till statistik för statsvetare

Beskrivande statistik

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Introduktion till statistik för statsvetare

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Skrivning i Sociologisk analys, Sociologi I, 7,5hp

INNEHÅLL DEL II: STATISTISK INFERENS SLUMPMÄSSIGA SAMPEL

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Bearbetning och Presentation

2. Test av hypotes rörande medianen i en population.

Föreläsning 4: Beskrivande statistik

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Kap 3: Diskreta fördelningar

Transkript:

+ Kvantitativ forskning C2 Viktiga begrepp och univariat analys

+ Delkursen mål n Ni har grundläggande kunskaper över statistiska analyser (univariat, bivariat) n Ni kan använda olika programvaror för olika statistiska analyser n Ni ska kunna förstå/analysera/presentera olika sorts statistiska presentationsformer (olika statistiska mått, diagram, tabeller)

+ Statistik n Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information n Ordet "statistik" kommer från latinet 'statisticus, med betydelsen 'statsman', 'politiker n à Försöker förbättra våra gissningar för att kunna styra bättre n à statistiska samband är dock först matematiska samband som måste sedan översättas i sin betydelse för varje samband

+ Genomgång: Variabler och variabeltyper

+ Variabel n Är ett namngivet objekt som används för att representera ett okänt värde (platshållare), till exempel ett reellt tal. n Variabler används i öppna utsagor. De kan anses stå i motsats till konstanter som är oföränderliga n x * y = 10 n Ex. 15 åriga pojkars TV beteende. Vad är variabel och vad är konstant?

+ Variabel n Definierade fack som fylls med innehåll (värden, observationer) från vissa observationsenheter (t.ex. grundskolelever) n variabel ålder (möjliga värde: 0-20) n betyg (möjliga värde: 1-5, A-F) n attityd (möjliga värde: Gillar inte (1) Gillar mycket (5)) n utbildning (ingen utbildning (1), gymnasium (2), högskolan (3)) http://wspace.se

+ Olika variabeltyper n Olika observationer har olika karaktär, som måste beaktas à observationsdata ser olika ut: n Man kan arbeta med olika sorters skalor som i sig innehåller mer eller mindre information samt kan användas för olika sorters analyser

+ Vad passar i de olika facken? Variabler kan vara Kvalitativa variabler kan indelas i kategorier Ex: kön, partitillhörighet Kvantitativa variabler (kan räknas) Ex: pris, meritvärde Diskreta variabler skalstegen är fasta, begränsad antal möjligheter Ex: attityd, meritvärde Kontinuerliga variabler alla skalsteg är möjliga Ex: pris, vikt, inkomst

+ Olika variabeltyper n Nominalskala: frekvens, endast klassificering, antal fall per grupp, kan endast räknas n Ordinalskala: rangordning, skalstegen olika långa, kan rangordnas <1.,2.,3.,4.> n Intervall: kan mätas, kan adderas, ingen nollpunkt, jämna skalsteg (equidistans) (+/-) n kvotskala: kan mätas, lika långa skalsteg, har absolut nollpunkt (+/-, 0)

+ Man kan alltid downgrade, men inte inte upgrade Nominalnivå Ordinalnivå Intervallnivå Kvotnivå rangordning jämna steg absolut nollpunkt kategorier (omvandlat till siffror) riktiga tal Exempel kön, etnisk bakgrund, typer utbildning, sociekonomisk bakgrund, (betyg) intelligenstest, testvärde, (attityd), (betyg) vikt, längd, ålder, pris Möjliga relationer lika/olika utöver: mindre/ bättre; färre/ mer; sämre/ bättre utöver: rum, distans mellan två entiteter (intervall) är kända och alltid lika långa; addera utöver: relationer mellan två entiteter; dubbelt så mycket/halv så mycket Möjliga statistika mått antal; frekvens (procent av helhet); Typvärde utöver median; kvartilsavstånd utöver: (atithmetrisk) medelvärde, standardavvikelse utöver: (geometriskt) medelvärde

+ Genomgång: Olika mått

+ Sammanfattande mått: centralmått n Beroende på skalnivån (nominal, ordinal, intervall) finns det olika mått, som betecknar variablernas fördelning n Typvärde eller modalvärde (för nominal) n Talvärdet som förekommer oftast n Ex. familjbakgrund: Tjänstmanfamilj: 120; Arbetarfamilj: 110 n Högsta examen: Högstadiet: 24; Studentexamen: 40; Kandidatexamen:56

+ Median n För ordinalskalnivå n Värde som ligger i mitten av alla observationsvärden när man sorterar dem efter sitt talvärde, i turordning, n Md delar urvalet i två jämna grupper n 1 4 5 7 9 12 14 n Om det är en jämt antal observationer, summerar man de två i mitten och delar summan med två n 1 4 5 7 9 12 14 15 à Md = 8

+ Exkurs: Formler n Statistiska analyser/beräkningar sammanfattas oftast i matematiska formler n sparar tid, men måste också kunna förstås n lika i alla språk n Exempel: medelvärde (centralmått för intervallnivå)? n Def. i vanliga ord: Summera samtliga observationers värde och dela denna summa med antalet observationer

+ Formler (ex. medelvärde) n Varje observation i urvalet betecknas med i som kan ta ett värde mellan 1 och n (antalet av observationer i urvalet) n varje observation i har ett bestämt värde för en viss variabel x; vi har n stycken x, en för varje i: x i n Alla x i ska nu summeras, det betyder: x 1 + x 2 + x 3 + + x n n Det uttrycks med ett summatecken: grekiskt stor Sigma x = n x i i=1 n n Medelvärde av variabeln Summera alla värde x för observationen i som ligger mellan 1 och n och delar genom n n 1 4 5 7 9 12 14 15 = 8,375

+ Formler (ex. medelvärde) n Varje observation i urvalet betecknas med i som kan ta ett värde mellan 1 och n (antalet av observationer i urvalet) n varje observation i har ett bestämt värde för en viss variabel x; vi har n stycken x, en för varje i: x i n Alla x i ska nu summeras, det betyder: x 1 + x 2 + x 3 + + x n n Det uttrycks med ett sumtecken: grekiskt stor Sigma x = n x i n Medelvärde av variabeln Summera alla värde x för observationen i som ligger mellan x 1 och n och delar Förenklat: genom n i n 1 4 5 7 9 12 14 15 = 8,375 x = n

+ Sammanfattande mått: Spridningsmått n Viktigt är också variabelns spridning n Utbredning (range) à avståndet mellan minsta och största värdet n 1 2 3 34 43 12: Range=42 n 4 99 1 2 3 4 101: Range= 100

+ Spridningsmått: Kvartilsavstånd n Man delar fördelningen in i fyra lika delar efter att ha sorterat dem efter sitt talvärde (som man också gör för medianen): n Q1=första 25 procentgräns (nedre kvartil), Q2=median, Q3=75 procent (övre kvartil) n kvartilsavstånd= Q3-Q1 n 1 2 3 4 5 6 7 8 9 10 11 12 n Q1: 3 Q2: 6,5 Q3: 9 = 3 4 5 6 7 8 9

+ Kvartilsavstånd Vad är de centrala värde Vad är kanske outliers? I synnerhet viktigt, om man har kontinuerliga variabler

+ Varians och standardavvikelse n Det absolut vanligaste förkommande spridningsmåttet är standardavvikelsen n Första steget är att beräkna den så kallade variansen n Medelvärde och standardavvikelse ska anges i alla studier som använder sig av intervallskaladata!

+ Varians n Hur långt ifrån variabelns medelvärdet befinner sig varje observation? n Vi vill ha ett mått som uttrycker det genomsnittliga avståndet från medelvärdet, som kan visa hur stor variansen är n ju mindre variansen, ju större koncentration runt medelvärdet Medelvärde(

+ Varians n Problem: det går inte att bara summera, eftersom det bara blir noll (annars hade vi inget medelvärde) n à kvadrera differens mellan medelvärdet och det observerade värdet (minus försvinner), sedan summera alla värde n Problem: när man delar genom antalet, där blir variansen för liten n dra av ett från antalet innan du delar summan (bara acceptera detta och lita på matematikerna)

+ Varians n Variansen visar därmed n ju större skillnaderna mellan medelvärdet och observationerna är, ju större är variansen n ju mer observationer ju mindre blir variansen (ju säkrare är medelvärdet) s 2 = (x x) 2 i n 1

+ Standardavvikelse n Eftersom variansen inte har samma dimension/ enhet (t.ex. cm blir cm 2 ) som medelvärdet (pga. kvadraten), drar vi kvadratroten, så har både centralmått (medelvärde) samt spridningsmått (standardavvikelse) samma mått igen s = (x x) 2 i n 1

+ Hur kan spridningsmåtten tolkas n Enklast: säger hur homogen ett urval, och hur tillförlitligt ett medelvärde är (mycket viktig för kontinuerliga variabler). Det behövs naturligtvis något att jämföra med Standardavvikelse Varians https://www.youtube.com/watch? v=pgfwj4grula

+ Standardavvikelse n Med medelvärde de två viktigaste mått för statistiska analyser på intervallnivå! n!±sd = Medelvärde plus/minus standardavvikelse n Antagningspoäng PIVA programmet! 15 ± 1 n = Medelvärde 15 med en genomsnittlig spridning av 1 poäng (14-16) n Det betyder naturligtvis också att vissa värde kan ligga mer än 1 sd från medelvärdet (t.ex. 2 poäng) n Standardavvikelse och medelvärde utgör normalfördelningen

+ Olika skalnivåer, olika mått Centralmått Spridningsmått Typvärde Median Medelvärde Variations vidd Kvartilsav stånd Standarda vvikelse Nominal ja nej nej ja, dock meningslös nej nej Ordinal ja ja (nej), dock vissa skalor kan omvandlas till intervall: betyg, attityd Intervall/ kvot ja, används dock mycket sällan ja, används om urvalet är mycket litet ja ja ja (nej), se medelvärde ja, används dock mycket sällan ja, används dock mycket sällan ja