Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Relevanta dokument
Föreläsning G60 Statistiska metoder

Statistik 1 för biologer, logopeder och psykologer

2 Dataanalys och beskrivande statistik

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Beskrivande statistik

Statistiska undersökningar

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

11. DESKRIPTION EN VARIABEL

Att göra före det schemalagda labpasset.

13.1 Matematisk statistik

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Föreläsning G70 Statistik A

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

11. DESKRIPTION EN VARIABEL

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Medelvärde, median och standardavvikelse

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

En typisk medianmorot

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Introduktion till statistik för statsvetare

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Beskrivande statistik

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

732G70, 732G01 Statistik A 7hp

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Bearbetning och Presentation

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Förra gången (F4-F5)

Forskningsmetodik 2006 lektion 2

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Valresultat Riksdagen 2018

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

F2 Beskrivning av ett datamaterial. Tabellering och val av diagram. Summatecknet

Statistiska begrepp och uttrycksformer

2.1 Minitab-introduktion

Marknadsinformationsmetodik Inlämningsuppgift

Datorövning 1 Statistik med Excel (Office 2007, svenska)

732G01/732G40 Grundläggande statistik (7.5hp)

Statistik. Statistik som beskriver vem och vilka vi är. Statistik som hjälpmedel i försäljning

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Medicinsk statistik I

Föreläsning 1: Introduktion

Läs noggrant informationen nedan innan du börjar skriva tentamen

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Statistik och epidemiologi T5

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Syfte med undervisningen är att du ska få utveckla din förmåga att...

Richard Öhrvall, 1

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Tentamen i Statistik, STA A13 (4 poäng) Lördag 11 november 2006, Kl

Grundläggande statistik kurs 1

ÖVNINGSUPPGIFTER KAPITEL 2

Mata in data i Excel och bearbeta i SPSS

*****************************************************************************

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Introduktion till statistik för statsvetare

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Why you should love statistics - Alan Smith. Hur väl känner du till ditt område? Vet eller tror du?

Föreläsning 1: Introduktion

Statistik i Excel en introduktion

ÖVNINGSUPPGIFTER KAPITEL 2

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Det är tänkt att varje elev eller grupp ska få en egen kopia av provresultaten och en egen datablankett att fylla i.

Repetitionsföreläsning

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Repetitionsprov inför provet Statistik

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 27 mars 2004, kl

Föreläsning 1: Introduktion

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Ma7-Åsa: Statistik och Sannolikhetslära

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Transkript:

Lägesmått Det kan ibland räcka med ett lägesmått för att beskriva datamaterial Lägesmåttet kan vara bra att använda då olika datamaterial skall jämföras Vilket lägesmått som skall användas: Typvärde Median Medelvärde 1

Typvärde Mest frekventa värdet Används framförallt vid nominalskala Ex: Linje Antal Kemi 250 typvärdet Ekon 570 Psyk 120 Mate 195 Data 50 2

Typvärde Typvärdet kan även användas som lägesmått vid ordinalskala Ex: Vi har följande tentamensresultat till en klass vid vxu: Resultat Antal MVG 4 typvärdet VG 22 G 60 IG 30 3

När beräknar man typvärdet? Mest vid nominal eller ordinal skala När det vanligaste värdet är av speciellt intresse Lätt att begripa När man utan närmare beräkningar vill ange ett genomsnittmått 4

Medelvärde Summan av alla observationer som sedan divideras med antalet observation Så här kan skrivas i matematiskt formelspråk för både: Populations medelvärd x n i= = 1 n x i 5

Några kommentarer Medelvärdet är mest använda av lägesmåtten Känslig för extrem mätvärden Symmetrisk fördelat material så är de tre lägesmåtten nästan lika Ju snedare materialet blir desto större skillnad på lägesmåtten, figur 1.16 6

Deskriptiv Statistik Hur ska jag organisera min data? Hur ska jag presentera den? Vilket presentationssätt ska jag använda? Tabell eller Diagram? 7

Frekvenstabell eller fördelning Datamaterialet innehåller många värden Först indelar materialet i ömsesidigt uteslutande klasser Beräkna frekvensen i varje klass 8

Frekvensfördelning Ex: Fördelning efter kön i klassen: Kvalitativ variabel Kön Antal Män 7 Kvinnor 5 Totalt 12 Summan av frekvenserna Män har frekvensen Kvinnor har frekvensen I denna undersökning har vi alltså mätt variabeln kön 9

Relativ Frekvens Man kan också redovisa den relativa fördelningen: Den relativa frekvensen visar andelen av observationerna i varje klass som ofta anges i procent. Kön Procent Män 42 Kvinnor 58 Totalt 100 (n=12) 10

Definitioner Klassmitten: Punkten som delar klassen i två lika stora delar. Medelvärdet av övre och undre klassgränsen. Klassfrekvens: Antalet observation i en klass Klassbredd: Övre klassgräns minus nedre klassgräns 11

Några Råd Dela in i lämpligt antal klasser 2 Tips: man beräknar där k: antal klasser, bör vara större än antalet observationer. k 2 k Eller: tumregel: minst ln(n)/ln(2) 2 5 = 32 > 30 n=30,, så förslaget är att ta minst 5 klasser! Ex: Tabell 1.11 och Tabell 1.12. 12

Några Råd Välj samma klassbredd i alla klasser Välj naturliga klassbredder: t.ex. ålderindelning görs i 5- eller 10-årsintervall Bestäm klassbredden: (Högstavärde - Lägsta värde) i = Antal klasser Justera till lämpligt värde, om det blir 9 är nog 10 lämpligare En obs. som hamnar på en klassgräns för vi till närmast övre klass 13

Medelvärde och standardavvikelse för klassindelade materialet Medelvärdet och standardavvikelse kan skrivas så här om man vill beräkna den från en frekvenstabell x där: k i= = 1 f n i y i s = k i= 1 f i ( y i n 1 x) 2 y: klassmitten f: frekvensen för varje klass k: antal klasser Exempel 1.17, sidan 14 14

Histogram (Figur 1.8) Datamaterialet innehåller många olika värden (kontinuerligt) 1. Klassindela materialet 2. Beräkna frekvensen i varje klass 3. För varje klass har vi en rektangel vars area är proportionell mot frekvensen i klassen frekvens 30 25 20 15 10 5 0 k 70 80 90 100 110 120 130 140 150 160 170 180 o tidsgång i sek Kontinuerlig n intervall t 15

antal Stapeldiagram (Bar Chart) Nominal Datamaterial med få olika värden (vanligt vid nominalskala) Representerar antal enheter av varje kategori på en stapel Linje Antal Bars show Means Kemi 250 500,00 Ekon 570 400,00 Psyk 120 Mate 195 Data 50 300,00 200,00 100,00 data ekon kemi mate psyk linje 16

Cirkeldiagram (Pie chart) Datamaterial med få olika värden (vanligt vid nominalskala) Linje Antal Kemi 250 Ekon 570 Psyk 120 linje data ekon kemi mate psyk Pies show Sums of antal Mate 195 Data 50 Bra för att visa relativa frekvenser. Cirkel-bitarna fördelas proportionellt mot relativa frekvensen 17

Vilket och När? Nominalskala: Stapeldiagram eller cirkeldiagram Diskret ordinal skala: Stapeldiagram Kontinuerlig ordinalskala: Histogram, stam-bladdiagram Diskret intervallskala: Stolpdiagram, figur 1.5 (antal defekta) Kontinuerlig intervallskala: Histogram, stam-bladdiagram Kvotskala: som intervallskala 18

Explorativ dataanalys (EDA) Ytterligare sätt att åskådliggöra data Stam-bladdiagram Box-plot 19

Stam-bladdiagram (Steam and Leaf) Ett sätt för att visa data. Varje tal delas i två delar: Siffror till vänster i talet bildar stam och de till höger blad Antar att vi har följande datamaterial: 150 159 155 148 175 153 151 146 168 153 138 161 164 157 146 148 143 Diagrammets stam 13 14 15 16 17 8 86683 9501337 814 5 Diagrammets blad Ex: exempel 1.19, sid. 26 20

Lådagram (Box plot) Ett grafiskt sätt att sammanfatta datamaterialet med hjälp av: min, max, kvartiler och median Dessa mått ger tillsammans en överblick av både läge och spridning Den lämpar sig bra när man vill jämföra två datamaterial med varandra Lådans vänsterkant är första kvartilen och dess högerkant tredje kvartilen. I lådan finns också medianen markerad Lådans längd motsvaras av kvartilavståndet, dvs lådan innehåller 50% av observationerna 21

Lådagram (Box plot) Outlier Minsta punkten inom inre staketet Största punkten inom inre staketet Misstänkt outlier o X X * Yttre stängslen Q 1-3(Q) Inre stängslen Q 1-1.5(Q) Q Median 1 Q 3 Inre Yttre stängslen stängslen Kvartilavstånd Q 3 +1.5(Q) Q 3 +3(Q) 22

Relationen mellan medelvärde och standardavvikelse Tjebysjevs olikhet Fungerar för alla fördelnigar oberoende av form Anger gränser runt medelvärdet inom vilka en viss % av observationerna finns med hjälp av standardavvikelsen 23

Tjebysjevs olikhet Minst 1 1 k 2 av observationerna från någon fördelning ligger inom k standard avvikelser från medelvärdet 1 1 3 1 2 = 1 = = 2 4 4 75% 2 Minst 1 1 8 1 2 = 1 = = 3 9 9 89% Ligger inom 3 sd från medelvärdet 1 1 15 1 2 = 1 = = 4 16 16 94% 4 24