Beskrivande statistik

Relevanta dokument
13.1 Matematisk statistik

2 Dataanalys och beskrivande statistik

Beskrivande statistik

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Statistik 1 för biologer, logopeder och psykologer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Föreläsning G60 Statistiska metoder

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Bearbetning och Presentation

Förra gången (F4-F5)

Föreläsning 1: Introduktion

Föreläsning G70 Statistik A

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Föreläsning 1: Introduktion

Statistiska undersökningar

Sammanfattningar Matematikboken X

TMS136. Föreläsning 7

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Medelvärde, median och standardavvikelse

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Introduktion till statistik för statsvetare

F2 Beskrivning av ett datamaterial. Tabellering och val av diagram. Summatecknet

Lite extra material för deltagarna i kursen MAB 5.1

Vägda medeltal och standardvägning

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

11. DESKRIPTION EN VARIABEL

Statistik och epidemiologi T5

11. DESKRIPTION EN VARIABEL

Introduktion till statistik för statsvetare

Valresultat Riksdagen 2018

Finansiell statistik, vt-05. Allmän information. Johan Koskinen. F1(a) Allmän information

Föreläsning 1: Introduktion

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Syfte med undervisningen är att du ska få utveckla din förmåga att...

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Ma7-Åsa: Statistik och Sannolikhetslära

Grundläggande statistik kurs 1

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

REPETITION 3 A. en femma eller en sexa?

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor

Stokastisk geometri. Lennart Råde. Chalmers Tekniska Högskola och Göteborgs Universitet

En typisk medianmorot

Kvantitativ strategi Univariat analys 2. Wieland Wermke

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

1.1 Diskret (Sannolikhets-)fördelning

732G70, 732G01 Statistik A 7hp

Stolpdiagram Genomförande Uppföljning

Fysikexperiment, 7.5 hp 1

Diagnos Sannolikhet/Statistik

732G01/732G40 Grundläggande statistik (7.5hp)

Lokal pedagogisk planering i matematik för årskurs 9

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Arbetsblad 8:1 Frekvenstabell 1

Statistik. Berit Bergius & Lena Trygg, NCM

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

9A Ma: Statistik och Sannolikhetslära

Tentamen: Vetenskapliga perspektiv på studie- och yrkesvägledning, 7,5hp distans (D1) & campus (T1), ht12

2.1 Minitab-introduktion

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Statistik 1 för biologer, logopeder och psykologer

Laboration med Minitab

SF1901: Sannolikhetslära och statistik

Introduktion till statistik för statsvetare

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, KORT OM BESKRIVANDE STATISTIK. Tatjana Pavlenko.

Extramaterial till Matematik X

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

7C Ma: VT 2018 Bråk och Procent/ statistik och sannolikhet Syftet med undervisningen är att du ska utveckla din förmåga att:

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Naturliga populationers evolution och bevarande, 6hp

HÖGA TRAMPOLIN STATISTIK OCH SANNOLIKHET. Sida. Innehåll. Till eleven

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

Att göra före det schemalagda labpasset.

Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

Statistiska begrepp och uttrycksformer

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

en femma eller en sexa?

Laboration 1: Beskrivande statistik

Statistik för Brandingenjörer. Laboration 1

ÄMNESPROV I MATEMATIK Skolår 9 Delprov B

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

ÖVNINGSUPPGIFTER KAPITEL 2

Delkursplanering MA Matematik A - 100p

*****************************************************************************

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Arbeta med normalfördelningar

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Transkript:

Beskrivande statistik Sorina Barza Department of Mathematics, Karlstad University, Sweden October 5, 2010

Vad är beskrivande statistik? Sammanställning av statistiska material

Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning

Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått

Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått Spridningsmått

Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått Spridningsmått

Vad är beskrivande statistik? Delen av statistiken som sysslar med insamling (t.ex. internet, telefonintervjuer, fysikaliska mättningar, etc.), sammanställning (t.ex. tabeller, grafiska bilder, etc) samt slutsatser och tolkning(hur väl man har lyckats med en vis medicin, en förpackning, etc.) av en statistisk material kallas deskriptiv statistik.

Sammanställning av statistiska material Frekvenstabell Ex. Följande statistiska material har samlats in i samband med en trafikräkning. Man har räknat de bilar som under 40 på varandra följande perioder om 2 minuter passerat en viss korsning. 6 4 1 2 2 3 5 4 6 3 2 6 7 5 3 4 4 2 3 8 4 4 2 1 4 5 4 2 6 7 5 4 2 1 2 3 5 3 5 3 Det är svårt från denna tabell att få en uppfattning om hur antalet passerande bilar har varierat.

Antal bilar Frekvens Relativ frekvens 1 3 3/40 0,08 2 8 8/40 0,20 3 7 7/40 0,18 4 9 9/40 0,23 5 6 6/40 = 0,15 6 4 4/40 = 0,10 7 2 2/40 = 0,05 8 1 1/40 0,03 40 1

I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser

I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1.

I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1. Sammanfattning: Ett statistiskt material består av observationer. Det antal gånger ett visst tal förekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer fås den relativa frekvensen.

I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1. Sammanfattning: Ett statistiskt material består av observationer. Det antal gånger ett visst tal förekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer fås den relativa frekvensen.

Klassindelning Ex. Vi bestämmer längderna av ett parti av 50 skruvar med hjälp av en linjal. Som resultat av denna undersäkning föreligger följande statistiska material: 11, 2 12, 3 17, 3 13, 2 16, 5 13, 4 17, 0 14, 5 15, 6 13, 4 12, 3 15, 9 14, 0 14, 5 14, 5 15, 6 12, 6 11, 8 12, 9 10, 9 11, 6 11, 4 13, 1 12, 3 13, 7 12, 5 11, 0 11, 4 13, 2 12, 3 13, 0 14, 5 13, 4 14, 3 15, 1 8, 8 16, 3 16, 1 13, 7 10, 3 11, 2 11, 3 10, 5 13, 0 17, 7 14, 2 11, 4 14, 4 9, 9 10, 3 Skruvarnas storlek varierar mellan 8,8 mm-17,7 mm; vi kan säga att mättningarna tillhör intevallet [8,, 18]. Vi delar detta intervall i 10 delintervall, nämligen (8, 9], (9, 10],... (17, 18] som vi kallar klasser. Följande tabell visar resultatet av denna klassindelning.

Klass Frekvens Relativ frekvens 8-9 1 1/50=0,02 9-10 1 0,02 10-11 5 0,10 11-12 8 0,16 12-13 9 0,18 13-14 9 0,18 14-15 7 0,14 15-16 4 0,08 16-17 4 0,08 17-18 2 0,04 50 1

Grafisk beskrivning av statistisk material Stolpdiagram-exemplet med bilar. Man kan använda frekvenser eller relativa frekvenser (detta ska kunna läsas i stolpdiagrammet). (se bild!)

Histogram-passar till statistiska material som sammanstlls i klasstabeller. Ibland kan man åskådliggöra statistisk material med histogram ritade på ett annat sätt t.ex. befolkningspyramider. (se bild)

Summaploygon- vi använder kumulerade relativa frekvenser. (se bild). Detta är ett av de bästa sätten att åskådliggöra ett statistiskt material. För varje klaassändpunkt kan vi läsa hur många observationer som är mindre eller eller lika med klaassändpunkten. Sektordiagramm (cirkeldiagram), stapeldiagram etc.

Lägesmåt Medelvärde Låt x 1, x 2,..., x k vara tal som förekommer som observationer i en statistisk material med motsvarande frekvenser n 1, n 2,..., n k och n = n 1 + n 2 +... + n k = k i=1 n i. Då är medelvärdet x = n 1x 1 + n k x k. n Ex. 1: material A 1 3 4 5 7 material B 4 6 9 10 11 x A = 4; x B = 8. Ex. 2: Antalet bilar under 40 tidsintervall om två minuter: x = 3, 8.

Median och kvartiller Medianen för ett statistisk material ordnat efter storlek är mittobservationen om materialet bestå r av ett udda antal observationer och den är medelvärdet av de båda mittobservationerna om materialet omfattar ett jämnt antal observationer. Ex. 1 Material A: 3 3 4 5 8 10 Material B: 3 3 4 5 8 30 Båda materialen har medianen 4,5. I material B finns en observation som avviker avsevärd från de andra. Medianen påverkas inte av avvikande observationer något som skjlier denna mått från medelvärdet! Medelvärden för Material A är 5,5 medan för material B är 10,5. Ex. 2 Bilarna: medelvärdet 3,8; medianen 4.

Medianen för ett kalssindelat material För ett klassindelat material kan vi inte beräkna medianen enligt medtoden ovan såvida vi inte är beredda att gåtillbaka till de ursprungliga observationerna och ordna de i storleksordning. Observera att de kan vara extremt många! Vi definierar medianen i detta fall som x-koordinatan av punkten på summapolygonen som har y-koordinatan 0,50. Ex. Skruvar! Medianen 13,1. Detta betyder att 50 procent av skruvarna är kortare än 13,5 mm.

Spridningsmått Variationsbredd= differensen mellan den största och minsta observationen. Varians och standard avvikelse Ex.Vi betraktar det statistiska materialet 1 3 5 8 9 10. Medelvärdet är 6 Vi beräknar nu avvikelsen mellan varje observation och medelvrdet, dvs vi minskar med 6 alla observationer. Vi kvadrerar avvikelserna, beräknar summan av dessa kvadrater och dividerar summan med 5 (antalet observationer -1). Talet som vi får är 12,8 och kallas materialets varians och betecknas med s 2. Ju störe spridning desto störe varians. Vill man ha samma måttenhet som på mättningar använder vi s = s 2 som kallas materialets standardavvikelse. varians:s 2 = 1 n 1 n (x i x) 2 i=1 standard avvikelse:s = s 2

Betydelsen av standardavvikelse Cebyshev s (Hitta detta namn i olika medier och gör en statistisk material på hur den stavas!) olikhet: Utanför intervallet x 2s, x + 2s kan högst 1/4 av observationerna (mätnigarna) ligga. Utanför intervallet x 3s, x + 3s kan högst 1/9 av observationerna (mätnigarna) ligga. osv. Utanför intervallet x ns, x + ns kan högst 1/n 2 av observationerna (mätnigarna) ligga.

Uppgifter Upp. 1 Vid en slutkontroll av en viss typ av DVD-apprater räknade man antalet fel hos 30 av dessa. Man erhöll följande antal fel : 3, 3, 0, 1, 0, 2, 0, 1, 2, 1, 1, 1, 1, 0, 2, 0, 0, 3, 2, 1, 2, 1, 1, 0, 1, 2, 1, 1, 2, 1. Konstruerra en fekvenstabell. Upp. 2 Följande tabell visar erhållna poäng vid kast med en tärning. Konstruera frekvenstabell. 1 4 6 3 6 6 5 6 1 4 1 3 3 5 3 6 5 5 4 6 2 1 6 2 5 3 6 2 4 2 2 2 6 3 3 2 6 3 6 6 1 3 5 6 6 2 1 5 3 4 6 4 3 6 1 2 2 2 5 6 Upp. 3 Följande tabell visar mängden äggvita i blodet hos 50 personer. Gör en klassindelning av detta material med lika breda klasser. 7, 61 7, 15 7, 42 7, 47 7, 81 7, 28 7, 07 7, 15 7, 14 7, 59 7, 42 7, 40 7, 33 7, 54 7, 18 6, 98 7, 45 7, 24 7, 34 7, 25 7, 12 7, 54 7, 40 7, 36 7, 34 7, 33 7, 52 7, 00 7, 54 7, 25 7, 60 7, 36 7, 49 7, 40 7, 15 7, 51 7, 32 7, 56 7, 20 7, 16 6, 95 6.97 7, 24 7, 07 7, 25 7, 62 7, 33 7, 41 7, 65 7, 07

Upp. 4 Rita en stolpdiagram till Uppgifterna 1 och 2. Upp. 5 Rita en histogram till Upp. 3. Upp. 6 Rita summaplygonet till materialet i uppgiften 3. Upp. 7 Beräkna medelvärdena för materialen i upp. 1, 2, 3. Upp. 8 Beräkna medianen för statistiska materialen givna i Upp. 1, 2, 3. Upp. 9 Beräkna standardavvikelsen för materialen i Upp. 1, 2, 3.