Beskrivande statistik Sorina Barza Department of Mathematics, Karlstad University, Sweden October 5, 2010
Vad är beskrivande statistik? Sammanställning av statistiska material
Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning
Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått
Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått Spridningsmått
Vad är beskrivande statistik? Sammanställning av statistiska material Grafisk beskrivning Lägesmått Spridningsmått
Vad är beskrivande statistik? Delen av statistiken som sysslar med insamling (t.ex. internet, telefonintervjuer, fysikaliska mättningar, etc.), sammanställning (t.ex. tabeller, grafiska bilder, etc) samt slutsatser och tolkning(hur väl man har lyckats med en vis medicin, en förpackning, etc.) av en statistisk material kallas deskriptiv statistik.
Sammanställning av statistiska material Frekvenstabell Ex. Följande statistiska material har samlats in i samband med en trafikräkning. Man har räknat de bilar som under 40 på varandra följande perioder om 2 minuter passerat en viss korsning. 6 4 1 2 2 3 5 4 6 3 2 6 7 5 3 4 4 2 3 8 4 4 2 1 4 5 4 2 6 7 5 4 2 1 2 3 5 3 5 3 Det är svårt från denna tabell att få en uppfattning om hur antalet passerande bilar har varierat.
Antal bilar Frekvens Relativ frekvens 1 3 3/40 0,08 2 8 8/40 0,20 3 7 7/40 0,18 4 9 9/40 0,23 5 6 6/40 = 0,15 6 4 4/40 = 0,10 7 2 2/40 = 0,05 8 1 1/40 0,03 40 1
I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser
I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1.
I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1. Sammanfattning: Ett statistiskt material består av observationer. Det antal gånger ett visst tal förekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer fås den relativa frekvensen.
I första kollonen har angivits antalet bilar I andra kollonen hur många gånger de olika antalen förekommer. Dessa tal kallas frekvenser I tredje kollonen har de relativa frekvenserna angivits. Deras summa är alltid 1. Sammanfattning: Ett statistiskt material består av observationer. Det antal gånger ett visst tal förekommer i materialet kallas frekvens. Om frekvensen divideras med antalet observationer fås den relativa frekvensen.
Klassindelning Ex. Vi bestämmer längderna av ett parti av 50 skruvar med hjälp av en linjal. Som resultat av denna undersäkning föreligger följande statistiska material: 11, 2 12, 3 17, 3 13, 2 16, 5 13, 4 17, 0 14, 5 15, 6 13, 4 12, 3 15, 9 14, 0 14, 5 14, 5 15, 6 12, 6 11, 8 12, 9 10, 9 11, 6 11, 4 13, 1 12, 3 13, 7 12, 5 11, 0 11, 4 13, 2 12, 3 13, 0 14, 5 13, 4 14, 3 15, 1 8, 8 16, 3 16, 1 13, 7 10, 3 11, 2 11, 3 10, 5 13, 0 17, 7 14, 2 11, 4 14, 4 9, 9 10, 3 Skruvarnas storlek varierar mellan 8,8 mm-17,7 mm; vi kan säga att mättningarna tillhör intevallet [8,, 18]. Vi delar detta intervall i 10 delintervall, nämligen (8, 9], (9, 10],... (17, 18] som vi kallar klasser. Följande tabell visar resultatet av denna klassindelning.
Klass Frekvens Relativ frekvens 8-9 1 1/50=0,02 9-10 1 0,02 10-11 5 0,10 11-12 8 0,16 12-13 9 0,18 13-14 9 0,18 14-15 7 0,14 15-16 4 0,08 16-17 4 0,08 17-18 2 0,04 50 1
Grafisk beskrivning av statistisk material Stolpdiagram-exemplet med bilar. Man kan använda frekvenser eller relativa frekvenser (detta ska kunna läsas i stolpdiagrammet). (se bild!)
Histogram-passar till statistiska material som sammanstlls i klasstabeller. Ibland kan man åskådliggöra statistisk material med histogram ritade på ett annat sätt t.ex. befolkningspyramider. (se bild)
Summaploygon- vi använder kumulerade relativa frekvenser. (se bild). Detta är ett av de bästa sätten att åskådliggöra ett statistiskt material. För varje klaassändpunkt kan vi läsa hur många observationer som är mindre eller eller lika med klaassändpunkten. Sektordiagramm (cirkeldiagram), stapeldiagram etc.
Lägesmåt Medelvärde Låt x 1, x 2,..., x k vara tal som förekommer som observationer i en statistisk material med motsvarande frekvenser n 1, n 2,..., n k och n = n 1 + n 2 +... + n k = k i=1 n i. Då är medelvärdet x = n 1x 1 + n k x k. n Ex. 1: material A 1 3 4 5 7 material B 4 6 9 10 11 x A = 4; x B = 8. Ex. 2: Antalet bilar under 40 tidsintervall om två minuter: x = 3, 8.
Median och kvartiller Medianen för ett statistisk material ordnat efter storlek är mittobservationen om materialet bestå r av ett udda antal observationer och den är medelvärdet av de båda mittobservationerna om materialet omfattar ett jämnt antal observationer. Ex. 1 Material A: 3 3 4 5 8 10 Material B: 3 3 4 5 8 30 Båda materialen har medianen 4,5. I material B finns en observation som avviker avsevärd från de andra. Medianen påverkas inte av avvikande observationer något som skjlier denna mått från medelvärdet! Medelvärden för Material A är 5,5 medan för material B är 10,5. Ex. 2 Bilarna: medelvärdet 3,8; medianen 4.
Medianen för ett kalssindelat material För ett klassindelat material kan vi inte beräkna medianen enligt medtoden ovan såvida vi inte är beredda att gåtillbaka till de ursprungliga observationerna och ordna de i storleksordning. Observera att de kan vara extremt många! Vi definierar medianen i detta fall som x-koordinatan av punkten på summapolygonen som har y-koordinatan 0,50. Ex. Skruvar! Medianen 13,1. Detta betyder att 50 procent av skruvarna är kortare än 13,5 mm.
Spridningsmått Variationsbredd= differensen mellan den största och minsta observationen. Varians och standard avvikelse Ex.Vi betraktar det statistiska materialet 1 3 5 8 9 10. Medelvärdet är 6 Vi beräknar nu avvikelsen mellan varje observation och medelvrdet, dvs vi minskar med 6 alla observationer. Vi kvadrerar avvikelserna, beräknar summan av dessa kvadrater och dividerar summan med 5 (antalet observationer -1). Talet som vi får är 12,8 och kallas materialets varians och betecknas med s 2. Ju störe spridning desto störe varians. Vill man ha samma måttenhet som på mättningar använder vi s = s 2 som kallas materialets standardavvikelse. varians:s 2 = 1 n 1 n (x i x) 2 i=1 standard avvikelse:s = s 2
Betydelsen av standardavvikelse Cebyshev s (Hitta detta namn i olika medier och gör en statistisk material på hur den stavas!) olikhet: Utanför intervallet x 2s, x + 2s kan högst 1/4 av observationerna (mätnigarna) ligga. Utanför intervallet x 3s, x + 3s kan högst 1/9 av observationerna (mätnigarna) ligga. osv. Utanför intervallet x ns, x + ns kan högst 1/n 2 av observationerna (mätnigarna) ligga.
Uppgifter Upp. 1 Vid en slutkontroll av en viss typ av DVD-apprater räknade man antalet fel hos 30 av dessa. Man erhöll följande antal fel : 3, 3, 0, 1, 0, 2, 0, 1, 2, 1, 1, 1, 1, 0, 2, 0, 0, 3, 2, 1, 2, 1, 1, 0, 1, 2, 1, 1, 2, 1. Konstruerra en fekvenstabell. Upp. 2 Följande tabell visar erhållna poäng vid kast med en tärning. Konstruera frekvenstabell. 1 4 6 3 6 6 5 6 1 4 1 3 3 5 3 6 5 5 4 6 2 1 6 2 5 3 6 2 4 2 2 2 6 3 3 2 6 3 6 6 1 3 5 6 6 2 1 5 3 4 6 4 3 6 1 2 2 2 5 6 Upp. 3 Följande tabell visar mängden äggvita i blodet hos 50 personer. Gör en klassindelning av detta material med lika breda klasser. 7, 61 7, 15 7, 42 7, 47 7, 81 7, 28 7, 07 7, 15 7, 14 7, 59 7, 42 7, 40 7, 33 7, 54 7, 18 6, 98 7, 45 7, 24 7, 34 7, 25 7, 12 7, 54 7, 40 7, 36 7, 34 7, 33 7, 52 7, 00 7, 54 7, 25 7, 60 7, 36 7, 49 7, 40 7, 15 7, 51 7, 32 7, 56 7, 20 7, 16 6, 95 6.97 7, 24 7, 07 7, 25 7, 62 7, 33 7, 41 7, 65 7, 07
Upp. 4 Rita en stolpdiagram till Uppgifterna 1 och 2. Upp. 5 Rita en histogram till Upp. 3. Upp. 6 Rita summaplygonet till materialet i uppgiften 3. Upp. 7 Beräkna medelvärdena för materialen i upp. 1, 2, 3. Upp. 8 Beräkna medianen för statistiska materialen givna i Upp. 1, 2, 3. Upp. 9 Beräkna standardavvikelsen för materialen i Upp. 1, 2, 3.