Något om beskrivande statistik



Relevanta dokument
Lösningsförslag till tentamen i 732G71 Statistik B,

Primär- och sekundärdata. Undersökningsmetodik. Olika slag av undersökningar. Beskrivande forts. Beskrivande forts

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Korrelationens betydelse vid GUM-analyser

4.2.3 Normalfördelningen

Föreläsningsanteckningar till Linjär Regression

Orderkvantiteter vid begränsningar av antal order per år

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Flexibel konkursriskestimering med logistisk spline-regression

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

Variansberäkningar KPI

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

Sensorer, effektorer och fysik. Analys av mätdata

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Vinst (k) Sannolikhet ( )

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Sensorer och elektronik. Analys av mätdata

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

MS-A0409 Grundkurs i diskret matematik I

Kompletterande kurslitteratur om serier

Applikationen kan endast användas av enskilda användare med förtroenderapportering.

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

(a) om vi kan välja helt fritt? (b) om vi vill ha minst en fisk av varje art? (c) om vi vill ha precis 3 olika arter?

Centrala gränsvärdessatsen

Orderkvantiteter i kanbansystem

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Sammanfattning. Härledning av LM - kurvan. Efterfrågan, Z. Produktion, Y. M s. M d inkomst = Y >Y. M d inkomst = Y

Enkel slumpvandring. Sven Erick Alm. 9 april 2002 (modifierad 8 mars 2006) 2 Apan och stupet Passagesannolikheter Passagetider...

Tentamen i Flervariabelanalys F/TM, MVE035

Fyra typer av förstärkare

Lektion 8 Specialfall, del I (SFI) Rev HL

Utbildningsavkastning i Sverige

Strukturell utveckling av arbetskostnad och priser i den svenska ekonomin

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

2 Jämvikt. snitt. R f. R n. Yttre krafter. Inre krafter. F =mg. F =mg

Tentamen i matematisk statistik

Allmänna avtalsvillkor för konsument

Funktionsteori Datorlaboration 1

Beräkna standardavvikelser för efterfrågevariationer

Normalfördelningar (Blom Kapitel 8)

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Föreläsning G70 Statistik A

Lösningsförslag

Mätfelsbehandling. Lars Engström

F15 ENKEL LINJÄR REGRESSION (NCT )

Gymnasial yrkesutbildning 2015

Välkommen in i konfirmandens egen bibel!

Föreläsning G04: Surveymetodik

REGRESSIONSANALYS S0001M

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Partikeldynamik. Fjädervåg. Balansvåg. Dynamik är läran om rörelsers orsak.

a utsöndring b upptagning c matspjälkning d cirkulation

Kap. 1. Gaser Ideala gaser. Ideal gas: För en ideal gas gäller: Allmänna gaslagen. kraft yta

Handlingsplan. Grön Flagg. Bosgårdens förskolor

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Borel-Cantellis sats och stora talens lag

Handlingsplan. Grön Flagg. I Ur och Skur Pinneman

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

2B1115 Ingenjörsmetodik för IT och ME, HT 2004 Omtentamen Måndagen den 23:e aug, 2005, kl. 9:00-14:00

Översikt av ouppklarade fall av dödligt våld i Skåne under tiden och framåt i tiden.

Multiplikationsprincipen

Arbetslivsinriktad rehabilitering för sjukskrivna arbetslösa funkar det?

Attitudes Toward Caring for Patients Feeling Meaninglessness Scale

Webprogrammering och databaser. Begrepps-modellering. Exempel: universitetsstudier Kravspec. ER-modellen. Exempel: kravspec forts:

Lycka till och trevlig sommar!

Tentamen i Tillämpad matematisk statistik för MI3 och EPI2 den 15 december 2010

Om ja, hur har ni lagt upp och arbetat i Grön Flagg-rådet/samlingarna med barnen och hur har det upplevts?

ESBILAC. mjölkersättning för hundvalpar BRUKSANVISNING.

En ideal op-förstärkare har oändlig inimedans, noll utimpedans och oändlig förstärkning.

Optimering av underhållsplaner leder till strategier för utvecklingsprojekt

Lösning till TENTAMEN

Lösningar och kommentarer till uppgifter i 1.1

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Grön Flagg-rapport Förskolan Fjäderkobben 17 apr 2014

KMR. mjölkersättning för kattungar BRUKSANVISNING.

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

Föreläsning 10: Kombinatorik

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Grön Flagg-rapport Förskolan Kalven 20 jan 2016

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

rm o rs W e d n r: A e n tio stra Illu Grön Flagg-rapport Hässlegårdens förskola 15 apr 2014

Databaser - Design och programmering. Programutveckling. Programdesign, databasdesign. Kravspecifikation. ER-modellen. Begrepps-modellering

Prisuppdateringar på elementär indexnivå - jämförelser mot ett superlativt index

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

Hur har Grön Flagg-rådet/elevrådet arbetat och varit organiserat? Hur har rådet nått ut till resten av skolan?

En studiecirkel om Stockholms katolska stifts församlingsordning

Statistiska undersökningar

Växelström = kapitel 1.4 Sinusformade växelstorheter

Markanvisningsavtal för och försäljning av fastigheten Gesällen 25

När vi räknade ut regressionsekvationen sa vi att denna beskriver förhållandet mellan flera variabler. Man försöker hitta det bästa möjliga sättet

Leica Lino. Noggranna, självavvägande punkt- och linjelasers

Transkript:

Något om beskrvade statstk. Iledg I de flesta sammahag krävs fakta som uderlag för att komma tll rmlga slutsatser eller fatta vettga beslut. Exempelvs ka det på ett företag ha uppstått dskussoer om att det förekommer kösdskrmerg, som yttrar sg att kvor har lägre löer ä mä. Det ka då vara rmlgt att för ett urval av kvor respektve mä ta reda på fakta. Fakta avser då te bara deras löer, uta också potetellt vktga faktorer som ålder, utbldg, atal aställgsår etc. Om det fortfarade fs löeskllader mella kvor och mä, fast ma tar häsy tll e mägd bakgrudsfaktorer, så står ma på betydlgt fastare mark är ma hävdar att det fs osaklga löeskllader på företaget. De stuato v beskrvt ova är typsk för e statstsk udersökg. Ma behöver få ett objektvt faktauderlag och samlar därför på sg e mägd data. Dessa data ka erhållas geom e observatosudersökg som exemplet ova, me äve expermetella udersökgar är valga. Exempelvs ka v täka oss e butk som vll studera hur olka expoerg av e vara påverkar varas försäljg. Ma bestämmer sg för att testa tre olka typer av expoerg och geomför dessa uder var sa tremåadersperoder. Seda ka ma jämföra försäljgssffror (tllsammas med aa vktg formato) för att komma fram tll e väl uderbyggd slutsats. Syftet med e statstsk udersökg är måga gåger ret beskrvade, vlket ebär att ma vll se verklghete som de är. Me ofta har ma också ett aalytskt syfte, som att göra e sambadsaalys eller pröva e uttalad hypotes ( löeexemplet vll ma studera sambadet mella lö och kö och testa om skllade är statstskt sgfkat ). Äve om syftet för e udersökg är aalytskt, har de ofta stora slag av beskrvade momet. Slutsatser frå e aalytsk udersökg dras alltd tll ågo populato. Populatoe ka vara ädlg och lätt att förstå (som t.ex. de aställda vd ett företag). Lka valgt är det med e oädlg populato, som är ett betydlgt mera vagt begrepp och ofta aväds då ma har oberoede mätgar vd t.ex. ett expermet. Ma vll då studera e mera allmä företeelse, som t.ex. hållfasthete hos e stållegerg, effekte av e reklamkampaj på försäljge av e vara, sambadet mella försäljge av e vara och dess prs etc.

. Olka typer av data Vad är u data? E defto ka vara att data är mått på varabler, som ka vara rmlga att studera med häsy tll udersökgsproblemet. I löeexemplet ka v bl.a. se följade varabler och mått: Lö rmlgt mått är måadslö kroor Ålder ka vara faktsk ålder atal år (kaske äve måader) me äve e klassdelg t.ex. femårsklasser Kö ka beteckas som K resp. M, me valgare är t.ex. resp. (fortfarade bara e beteckg fast det är sffror). Uppebarlge fs det två typer av varabler, ämlge de som kallas kvaltatva respektve kvattatva. E kvaltatv varabel är e varabel som deferar olka kategorer som t.ex. kö, yrke, födelselad etc. Varabel har get aturlgt sffermått me sffror aväds ofta som beteckg. E kvattatv varabel har som aturlgt mått sffror och sffrora har s självklara betydelse. Som exempel ka ämas atal bar e famlj, ålder och komst. Däremot är det te alltd självklart hur varabel skall mätas uta ma ka aväda olka sorters skalor. T.ex. ka ålder mätas atal år eller olka ålderskategorer. Ma brukar prata om fyra olka skalor på vlka varabler ka mätas. Nomalskala: är v bara ka betrakta data som olka grupper. Tll dea skala hör edast kvaltatva varabler. Ordalskala: är v betraktar data som grupper, me ka ragorda dem. Gruppera har alltså e bördes storleksordg, me avståde ka ädå vara olka mella dem. Tll dea skala hör både kvaltatva och kvattatva varabler. Ett exempel är åldersklassera (uder ), (mella och 4) samt 3 (över 4). E dvd klass är då ygre ä e klass etc. Itervall- och kvotskala är de exakta skalora för kvattatva varabler. Ur statstsk syvkel behadlas data mätta på dessa skalor på ett lkvärdgt sätt. Det som skljer varablera är att vssa varabler te har ågo gve ollpukt (som t.ex. temperatur). De mäts då på tervallskala där det är megsfullt att tala om dffereser (Vettgt uttalade: I dag är det grader, dvs grader varmare ä går då det var grader. Däremot fugerar det te

med: I dag är det % varmare ä går). E varabel på kvotskala har e väldeferad ollpukt och det är megsfullt att blda kvoter och uttrycka relatva mått (Lsa och Kar är resp. 4 år gamla. Alltså är Kar år äldre ä Lsa. Me det är också korrekt att säga att Kar är dubbelt så gammal som Lsa). Det blev ltet lågradgt detta med skalor och v skall te fördjupa oss mer, uta kostatera att skalora leder tll två typer av data. Kvaltatva varabler och kvattatva varabler på ordalskala ger båda frekvesdata, dvs för varje klass får ma atalet dvder (frekvese) som går klasse. Kvattatva varabler på tervall- eller kvotskala ger data form av esklda umerska värde. 3. Tabeller och dagram I meda, kursböcker och aat matas v daglge med formato form av tabeller och dagram. Iformatoe ser vederhäftg ut och det är lätt att ta tll sg de helt okrtskt, te mst för att måga tycker att det bara är tråkga sffror, som ma te orkar fördjupa sg ärmare. Me här rskerar ma att gå på ordetlga tar! Statstska uppgfter ka preseteras på måga olka sätt, och ma måste förstå hur de aktuella tabelle eller dagrammet är kostruerat, för att rätt tolka formatoe. Valge är formatoe formellt sett korrekt, me ka framställas på sådat sätt, att det är lätt att feltolka de om ma te graskar de krtskt. Särsklt tydlgt blr detta vd poltska debatter, då det är valgt att represetater för olka parter vsar dagram över ågo företeelse. Trots att ma llustrerar samma företeelse ger dagramme helt olka tryck (kaske för att ma aväder olka skalor, delvs olka tdsperoder etc). 3. Frekvesdata V studerar u e varabel som är delad olka klasser, och vll med hjälp av tabeller och dagram llustrera hur data fördelar sg över de olka klassera. Exempel I e medaudersökg rktad tll allmähete vll ma ta reda på sveska folkets ställg tll olka tdgar. För varje tdg får de svarade uttrycka s åskt på e femgradg skala. Frågora och svarsalteratve är av följade typ. Tdge XX är trovärdg Istämmer: te alls O O O O O helt och hållet 3

Sum of Atal Förutom svare på dessa frågor har ma också frågat om de svarades kö. 8 persoer har besvarat ekäte och v vll redovsa svarsfördelgara över kö, över trovärdghet me äve över kombatoe av kö och trovärdghet. Det seare gör v för att se om kvor och mä uppfattar trovärdghete på olka sätt. 3.. Kö Tabell. Svarsfördelg efter kö Kö Atal Adel ( procet) Kvor 38 47.5 Mä 4 5.5 Totalt 8 Dea fördelg ka llustreras ett stapeldagram, som har kostruerats de statstska programvara Mtab: Fgur Stapeldagram över kösfördelg 4 Mä 4 4 39 38 Kvor Kö Fgurtexte är te de syggaste, me detta bortser v frå u. Det v ka kostatera är att dagrammet och för sg är korrekt, me ger ett tryck av att kvora är väldgt få förhållade tll mäe. Detta beror på Y-axels skala, som te alls börjar. Det är lätt att styra om detta Mtab och v erhåller då stället följade: 4

Sum of Atal Fgur Stapeldagram över kösfördelg 4 Mä Kvor 3 Kö Nu får v ett helt aat och mera korrekt tryck av stapeldagrammet, eller hur? V ka dra lärdome att ma bör udvka stympade skalor, eftersom det omedelbara sytrycket av dagrammet lätt blr vlseledade. Ett alteratvt sätt att llustrera kösfördelge är med crkeldagram, vlket kostrueras så att crkelsektoreras areor är proportoella mot frekvesera: Fgur 3 Crkeldagram över kösfördelg Pe Chart of Kö (4; 5,5%) (38; 47,5%) Crkeldagram blr lätt rörga om varabel ka ata måga värde, och då lämpar sg stapeldagram allmähet bättre. Ma bör också täka på att crkeldagrammet är som tydlgast färg, och att dagramtype därför kaske te lämpar sg e svartvt rapport. 5

Sum of at 3.. Trovärdghet Vad gäller trovärdghete har följade resultat erhållts: Tabell Fördelg efter trovärdghet Trovärdghet Atal Procetuell adel 5 5 3 4 3 4 6 5 6 Totalt 8 Fgur 4 Stapeldagram över trovärdghetsfördelge 5 5 5 3 Trov 4 5 Fgur 5 Crkeldagram över trovärdghetsfördelge Pe Chart of Trov (; 5,%) 3 (4; 3,%) (; 5,%) 5 (6;,%) 4 (6;,%) 6

Sum of At 3..3 Kombatoe kö och trovärdghet För att studera kombatoe av kö och trovärdghet behöver v ta fram e korstabell, dvs e frekvestabell där båda varablera redovsas tllsammas. V kostruerar tabelle så att radera är kö, meda kolumera är trovärdghete. För att förekla redovsge så ges trovärdghete bara 3 klasser; egatva (urspruglg kod och ), obestämda (kod 3) och postva (kod 4 och 5): Tabell 3 Fördelg efter trovärdghet för mä och kvor. Atal Kö Trovärdghet Neg Obest Pos Totalt Kvor 8 8 38 Mä 6 4 4 Totalt 4 4 3 8 V ka kostatera att margalera har v de fördelgar som tdgare redovsats (trovärdghetsfördelge var dock då mera ffördelad). V ka också kostatera att mäe är betydlgt mer egatva ä kvora (6/4 = 38. % jämfört med 8/38 =.4 %). För att llustrera detta tar v fram ett stapeldagram uppdelat på kö: Fgur 6 Stapeldagram över trovärdghetsfördelge uppdelat på mä och kvor. Atal Neg Pos Pos Obest Obest Neg Ko 7

Percet Sum of At Eftersom atalet mä och kvor är olka, ka det vara ltet besvärlgt att drekt se skllade fördelg, är de som här ges atal. Det blr eklare om ma stället går över tll procetuella adelar om varje grupp (kö detta fall): Fgur 7 Stapeldagram över trovärdghetsfördelge uppdelat på mä och kvor. Procetuell adel 9 8 7 6 5 4 3 Neg Obest Pos Neg Obest Pos Ko Ma ser omedelbart frå de två fördelgara, att kvora har e klart mer postv ställg ä mäe tll tdges trovärdghet. Det ssta dagrammet ka ret formellt också kostrueras geom att låta trovärdghetsklassera utgöra x-axel : 8

Percet Sum of At 9 8 7 6 5 4 3 Mä Kvor MäKvor Mä Kvor Trov 3 Om v tttar på grupp så är mäes stapel dubbelt så hög som kvoras, dvs mäe är två gåger så egatva som kvora? Detta är dock fel sätt att tolka det hela, uta det v ka säga är, att av de egatva så utgör mäe två tredjedelar. Eftersom mäe är ågot fler stude, så är detta e del av förklarge tll mäes höga adel. V såg ju ova att av mäe är 38. % egatva, meda motsvarade adel blad kvora är.4 %. Adele egatva mä är alltså te dubbelt så stor som adele egatva kvor, uta bara 78 % större (38./.4 =.78). V drar lärdome, att de grupper ma vll jämföra bör utgöra dagrammets delgsgrud ( xaxel ), så att ma te rskerar att av msstag dra felaktga slutsatser. 3. Data form av esklda umerska värde (frå kvattatva varabler) De kvattatva varablera ka klassfceras dskreta respektve kotuerlga varabler. E dskret varabel ka bara ata vssa dskreta värde, och stället för att age alla esklda värde, så preseteras sådaa data form av frekvestabeller, precs som avstt 3.. E kotuerlg varabel atar alla värde ett tervall, vlket ebär att ett observatosmateral ehåller värde som stort sett alla är olka. Sådaa data ka te drekt preseteras tabeller och dagram, uta måste först delas klasser. Exempel (Dskret varabel) V studerar uder ett år atal trafkolyckor per dag som träffar e tätort. De = 365 observatoera är,,,,, 4,.,,,. Data ka sammafattas följade frekvestabell: 9

f Tabell 4 Atal och procetuell adel trafkolyckor per dag Atal olyckor (x) Atal dagar, frekves (f) Procetuell relatv frekves 7.9 5 34. 8.9 3 3 8.8 4 5.5 5 4. 6 7.5 8 Summa = 365 99.9 Dea fördelg llustreras lämplge med ett s.k. stolpdagram (stapeldagram för dskret varabel), där ma på y-axel har frekvesera eller relatva frekvesera för varje x-värde: Fgur 8 Fördelg över atal trafkolyckor per dag 5 3 x 4 5 6 7 Exempel 3 (Kotuerlg varabel) E föreg med 5 medlemmar har följade åldersfördelg

Tabell 5 Föreges åldersfördelg Ålder Frekves Relatv frekves ( %) -9 4-9 8 6 3-39 4 4-49 5 3 5-59 8 6 6-69 4 8 7- Alla 5 Fördelge för e kotuerlg varabel brukar llustreras med ett hstogram. På x-axel markeras klassgräsera och ovaför varje klass avsätts e rektagelarea som är proportoell mot frekvese (eller relatva frekvese). Om klassera är lka breda (vlket de helst bör vara), så är rektagels höjd proportoell mot frekvese. För att kostruera hstogram Mtab måste ma ha alla esklda data lagda. Här hade v te data på de forme och därför får v lov att själva rta ett hstogram. Detta görs förmodlge eklast för had. Pröva! (Observera att e perso som fyllt 9 år me äu te 3 ages med ålder 9). 4. Sammafattade mått på datamateral I föregåede kaptel har v studerat olka sätt att llustrera hela fördelge hos ett datamateral. Ofta vll ma sammafatta dea formato ågra ekla mått som är smdgare att hatera. Främst gäller detta om ma har data på e kvattatv varabel. De typer av mått som ma valge aväder är dels mått på observatoeras geomstt och dels mått på observatoeras sprdg krg geomsttet. 4. Geomsttsmått (lägesmått, cetralmått) Det särklass valgaste geomsttsmåttet är (artmetska) medelvärdet, me ma ser att äve medae aväds praktke. Typvärdet fugerar främst för kvaltatva data och för klassdelade kvattatva. Typvärdet är det valgaste värdet, dvs det x-värde som har de största frekvese. Medae (md) är det storleksordg mttersta värdet (om atalet observatoer är jämt, så deferas medae som medelvärdet av de två mttersta värdea). Medae delar alltså datamateralet mtt tu.

Medelvärdet ( x med statstskt språkbruk) för ett datamateral med observatoer beteckade x, x,... x deferas som x x x... x sum( x ) x Exempel 4 (baseras på exempel ) De första vecka är det observerade atalet olyckor,,,,, 4,. (med beteckgara ova är t.ex. x = och x 7 = ). V ser att typvärdet är, meda medae är md =. Medelvärdet av atalet olyckor är 4 x 7 9 7.3 Säg u att ssta dage var e extrem halkdag och det blev te alls olyckor uta stället! Fortfarade är typvärdet och medae. Medelvärdet blr dvs väsetlgt mycket större ä ova. 9 x 7 Detta är e geerell lärdom: Medelvärde är käslga för extremvärde, meda medavärde te påverkas ämvärd grad. Medae ka därför vara ett lämplgare geomsttsmått ä medelvärdet vssa sammahag. T.ex. aväds valge medalö stället för geomsttslö sambad med löeförhadlgar mella företag och fack. Exempel 5 V tar u och studerar alla olycksdata exempel. Typvärdet är olycka per dag. Atalet dagar är 365, varför värde r 83 ( storleksordg) är meda. V har st. :or och 5 st. :or, dvs värde r 3 upp tll och med r 7 är alla lka med, vlket ebär att md =. Medelvärdet är.7

x 365 x 365 5 8 3 3 4 4 5 6 7 365 495.36 365 Med formelspråk ka medelvärdet för dskreta data skrvas f x x V skall u studera e ltet besvärlgare me praktke valg stuato, är ma har medelvärdea beräkade för ett atal grupper och vll beräka medelvärdet för totala atalet observatoer. Atag för ekelhetes skull att v har två grupper med atalet observatoer resp.. Atag vdare att medelvärdea är x grupp x resp. x grupp x Det totala medelvärdet ka u skrvas som x x x grupp x grupp x x x x dvs det totala medelvärdet är ett vägt medelvärde av gruppmedelvärdea och vktera är grupperas relatva frekveser. Exempel 6 Ett företag är bekymrat över sjukfråvaros utvecklg och följer därför upp fråvaro det seaste året. I tabelle eda ges medelvärdet av atalet fråvarodagar uppdelat på företagets två avdelgar och på kö. Tabell 6 Medelatal fråvarodagar per år (atal persoer om paretes) 3

Kvor Mä Avd 5.8 (5) 6. (5) Avd 8.5 () 9. (7) Totalt? (5)? (75) V börjar med att beräka medelfråvaro för kvor resp. mä. För kvor blr de 5.8 8.5 3.48 3.4 6.88 6.9, meda motsvarade beräkg för mä ger 5 5 5 medelvärdet 8.89 = 8.9. Mäe har alltså stt fråvarodagar fler ä kvora. Hajar du te tll? V ser att på de två avdelgara har mäe ågot högre sjukfråvaro stt, me te alls så mycket som dagar. Då har v väl räkat fel!? Nej, faktskt te. Skälet tll de stora skllade är att mäe huvudsaklge fs på avdelg, och de avdelge har stort sett 3 sjukdagar flera ä avdelg (avdelgaras medelvärde ka med vägda medelvärde beräkas tll 5.9 resp. 9.). Om ma vll se skllade fråvaro beroede på kö (oavsett avdelg), måste medelvärdea vägas hop med e gemesam fördelg för köe. Det valgaste sättet att göra detta är med s.k. stadardvägg, där ma som gemesam fördelg aväder margalfrekvesera, dvs detta fall på avdelg och 8 på avdelg. Det stadardvägda medelvärdet för kvor blr då. 5.8.8 8.5 8., meda mäes medelvärde blr 8.5. Mäe har alltså geomstt bara e halv dag mera sjukfråvaro ä kvora. Det är helt korrekt att säga att mäe på företaget har geomstt fråvarodagar fler ä kvora. Här räkas både med ev. skllader beroede på kö, me också skllader beroede på vlka arbetsuppgfter ma har. Är ma ute efter att ebart spegla skllade mella köe, måste ma göra e stadardserad jämförelse, dvs ta bort ev. skllader arbetsuppgfter. Ett ekelt sätt att göra detta är att jämföra stadardvägda medelvärde. 4. Sprdgsmått Det är vktgt att som sammafattade mått på ett datamateral te bara beräka ett geomstt uta att också ge ett mått på sprdge data. Så t.ex. är medelvärdet för sffrora -, och, me samma medelvärde har v också för -, och. Dock har det seare datamateralet betydlgt mycket större sprdg ä det första. Det absolut valgaste sprdgsmåttet är datamateralets stadardavvkelse. Iblad aväds också kvartlavståd och varatosbredd som ekla mått på sprdg. Varatosbredde är dfferese mella största och msta värdet datamateralet. 4

Kvartlavstådet är dfferese mella de tredje och första kvartle. Första, adra och tredje kvartle delar upp det storleksordade datamateralet 4 lka stora delar, så att varje del fs e fjärdedel av totala atalet observatoer. Adra kvartle kallas valge för meda. Stadardavvkelse deferas som s ( x x) Kvadreras uttrycket erhålls varase s ( x x) som stort sett är medelvärdet av observatoeras kvadratska avvkelser frå stt geomstt. Geom e algebrask omskrvg ka formel för varase skrvas som s ( x ) x och dea formel är ofta eklare för umerska beräkgar. Exempel 7 Betrakta följade datamateral där observatoera skrvts storleksordg:,, 3, 3, 4, 6, 7, 8, 8, 9,, 3 Varatosbredde är 3 = 3 Datamateralet delas följade fyra grupper,, 3 3, 4, 6 7, 8, 8 9,, 3 De tre kvartlera blr därför rmlge 3, 6.5 och 8.5, varför kvartlavstådet är 8.5 3 = 5.5 7 Medelvärdet av de observatoera är x 6, varför varase är s 9 9 6 36 49 64 64 869 584 68 68 43 86 6.9 7 Stadardavvkelse är då 5

C s 86 4. Slutlge bör v äma att det fs ett atal olka sätt att beskrva datamateral för att llustrera materalets geomstt och sprdg. I lådagram (eg. boxplot) begräsas låda av första och tredje kvartle och dessutom rtas medae. Vdare går vgara ut tll m.- och max.- värdea. Neda fs ett lådagram för vårt ekla exempel: Fgur 9 Exempel på lådagram 5 Am.: I ett datamateral för e dskret varabel förekommer varje värde med e vss frekves, och då ka formel för varase skrvas s f ( x x) f x ( ) f x 5. Övgsuppgfter 5. I e partsympatudersökg tervjuades 8 persoer och ma fck följade sympatfördelg (atal som sympatserar med): (s) 36, (v) 6, (mp) 39, (m), (fp) 4, (c) 4, (kd) 3. Uta ställgstagade 49 a) Sätt upp e frekvestabell över datamateralet och rta ett stapeldagram. b) Illustrera datamateralet med ett crkeldagram. (Täk geom hur du vll behadla de osäkra) (Vlke typ av data har v detta fall?) 6

5. På e teta på tekska fakultete deltar 86 studeter varav 4 är kvor. På teta ka ma få betyge U, 3, 4 och 5. I tabelle eda redovsas resultatet U 3 4 5 Kvor 4 7 Mä 5 7 3 7 Ma vll jämföra tetaresultate för kvor och mä. Kostruera ett lämplgt stapeldagram för jämförelse och kommetera vad du ser. (Vlke typ av data har v detta fall?) 5.3 På teta ova ka ma maxmalt erhålla 4 poäg. I tabelle eda redovsas resultate för olka poägtervall: Itervall -4 5-9 -4 5-9 -4 Atal 3 6 38 7 Illustrera datamateralet med ett lämplgt hstogram (Vlke typ av data har v detta fall?) 5.4 Vd e avdelg för kvaltetskotroll gör ma stckprov på de artklar som produceras. Artklara paketeras lådor om st. och vd kotrolle plockas lådora ut slumpvs och alla artklara e utvald låda kotrolleras. Ma oterar atalet defekta artklar och för 5 kotrollerade lådor erhålls Atal defekta 3 6 Atal lådor 36 8 3 a) Illustrera datamateralet med ett stolpdagram 7

b) Beräka medelvärdet för atalet defekta artklar e låda c) Beräka medae för atalet defekta artklar e låda d) Vlket är typvärdet för atalet defekta artklar e låda 5.5 I e drottsföreg hör 6 % av medlemmara tll sekto och reste tll sekto. I tabelle eda redovsas medelålder uppdelad på sekto och på kö. I tabelle ages te atalet mä och kvor om varje sekto, uta stället de procetuella fördelge. Sekto Sekto Adel (%) Medelålder Adel (%) Medelålder Kvor 3.4 6 6.3 Mä 7 4. 4 8. a) Beräka medelålder sekto resp. sekto b) Beräka medelålder hela förege c) Beräka medelålder för föreges kvor 5.6 V fortsätter på uppgft 5.5. a) Beräka skllade medelålder mella sekto och sekto b) Hur stämmer resultatet a) med de åldersskllader ma ser mella sektoera för mä resp. kvor? Varför får ma olka resultat? c) V vll ha åldersskllade mella de två sektoera är ma stadardserar kösfördelge. Beräka de stadardserade medelvärdea för de två sektoera och otera att ma får de förvätade skllade medelålder. 5.7 I e telefoväxel oterar ma atalet kommade samtal uder varje arbetsdag. Uder e arbetsvecka har ma erhållt följade data: 55, 67, 53, 56, 34 8

Beräka medelvärde och stadardavvkelse för atalet kommade samtal per dag. 5.8 Se uppgft 5.4. Beräka stadardavvkelse för atalet defekta artklar e låda. 5.9 I e hushållsudersökg studerade ma bl.a. hushålles blehav. Hushåll som te hade bl oterades med värdet, meda hushåll med mst e bl fck värdet. I stude deltog 56 hushåll och följade resultat erhölls: Tllgåg tll bl (x) Frekves (f) 64 9 a) Beräka medelvärdet för x. Tolka värdet b) Beräka varase för x. c) Beräka x( x) och otera att det blr samma resultat som b) x( x) d) Försök vsa matematskt att s är ma har observatoer som bara består av :or och :or. Svar tll övgsuppgfter 5. a) Frekvestabell Row Part Atal s 36 v 6 3 mp 39 4 m 5 fp 4 6 c 4 7 kd 3 8 osäkra 49 9

Sum of Atal Stapeldagram c fp kd m mp osäkra Part s v b) Crkeldagram Pe Chart of Part m (; 5,%) kd ( 3; 3,8%) mp ( 39; 4,9%) fp ( 4; 5,3%) c ( 4; 5,%) osäkra (49; 8,6%) v ( 6; 7,8%) s (36; 9,5%) Data är kvaltatva/kategorska 5. Här är data på ordalskala och form av frekveser. Jämförade stapeldagram för betyge uppdelade på kö (procetuell fördelg):

Frekves Percet Sum of Atal 5 3 3 4 5 U 4 5 U k Kö m 5.3 Itervallgräsera sätts lämplge vd 4.5, 9.5, 4.5 och 9.5. För att få lka breda klasser sätts också första gräse vd -.5 och ssta vd 4.5 (praktskt lte kostgt!). Rta seda sammahägade staplar med höjde proportoell mot frekvese. (Här har v kvattatva, klassdelade data) 5.4 a) Stolpdagrammet 4 3 3 Defekta 4 5 6 b).5 c) d) 5.5 a) 3.59 resp. 6.98 b) 4.95 c) 4.63 5.6 a) 3.39 b) Skllad 3.9 för K resp. M. P.g.a. olka kösfördelg sektoera erhålls te dea åldersskllad totalt, då köe har olka åldrar.

c) Stadardserad kösfördelg: 4 % kvor och 58 % mä. Medlålder för sektoera blr då 3.386 resp. 7.86, dvs skllad 3.9 förstås. 5.7 Medelvärde 53, stadardavvkelse.94 5.8. 5.9 a).87 b).36