Olika typer av variabler och skalor Kvalitativ variabel -variabeln antar inte numeriska värden utan bara olika kategorier. vis olika bilmärken, eller man, kvinna. Kvantitativ variabel Antar numeriska värden som är resultat av beräkning eller mätning. Kontinuerlig variabel Kan anta alla värden. Ex, kroppslängd Diskret variabel Kan enbart anta vissa värden, (oftast heltal). Ex, antal barn. En variabel kan mätas på 4 olika typer av skalor: 1. 2. 3. 4. Varför behöver vi veta vilken skala en variabel är mätt på? Skaltypen avgör vilka beräkningar, diagram och statistiska test som vi kan använda. En kvalitativ variabel där de olika utfallen inte har en specifik ordningsföljd mäts på nominalskala. Exemel: Bilmärke: Volvo, BMW, VW, Peugot Kön: man, kvinna Vi kan rangordna olika observationer men inte avgöra avståndet mellan dem. : I en kursutvärdering frågas studenterna vad de anser om litteraturen och har följande alternativ att välja på. Mycket bra, bra, medel, dålig Vi kan mäta avståndet mellan två variabelvärden men kvoter har ingen meningsfull tolkning och nollan kan ej tolkas som avsaknad av egenskapen. Temperatur mätt i grader Celsius är ett exempel. På söndag är det 0 grader. På måndag är det 1 grad varmt. På tisdag är det 2 grader varmt. På onsdag är det 21 grader varmt. På torsdag är det 22 grader varmt. På söndag är det 273 K. På måndag är det 274 K. På tisdag är det 275 K. På onsdag är det 294 K. På torsdag är det 295 K. Det är meningsfullt att beräkna kvoter och noll betyder att egenskapen saknas. kroppslängd. Om Lisa är 80 cm lång och hennes mamma 160 så är mamma dubbelt så lång. Det är meningsfullt att dividera mammas längd med Lisas och beräkna en kvot. Om Kalle är 0 cm lång så finns han inte. Nollan betyder avsaknad av egenskapen. Årtal Årtal såsom 2010 och 2017 vilken skala mäts de på? Om vi är intresserade av hur länge sedan det var som Jesus föddes så har vi en kvotskala, för då får noll betydelsen att det är just nu han föds. Men oftast använder vi dem bara för att sortera in händelser i tiden och mäta hur lång tid det är mellan dem. I så fall blir det en intervallskala. 1
Respondenters värdering på en numerisk skala ger ordinalskala Kurslitteraturen var lämplig för att uppnå kursens syfte: 5 4 3 2 1 5 står för håller helt med och 1 för håller inte alls med. Frågan genererar ordinaldata, man brukar anse att respondenter inte på ett likvärdigt sätt bedömer avståndet mellan 1 och 2 respektive 2 och 3 så vi har inte intervallskala. Frågan kunde ju också ha formulerats: Kurslitteraturen var lämplig för att uppnå kursens syfte: Håller helt med Håller delvis med Vet inte har ingen åsikt Håller inte med Håller inte alls med på populationer, variabler och skalor. population variabel Typ av variabel skala Alla svenska bilar Alla svenska kvinnor mellan 25 och 35 år Antalet dörrar Diskret färg Kvalitativ märke Kvalitativ Ålder kroppsvikt Kontinuerlig (Ålder diskret?) kvotskala Yrke Kvalitativ (ordinal?) Utbildningsnivå Kvalitativ (typ av utbildning) Kontinuerlig (antal år) Nominal, Ordinal kvotskala på populationer, variabler och skalor. Population Variabel Typ av variabel skala Sånger i Eurovision song contest 2010 Längd Kvalité (poäng i omröstningen) Kontinuerlig Diskret Musikstil Kvalitativ Sjöar i Sverige Storlek (km 2 ) Kontinuerlig Vatten temperatur djup Kontinuerlig Kontinuerlig På vilken skala skulle vi mäta variabeln Din huvudsakliga sysselsättning? På vilken skala skulle vi mäta variabeln Ålder? På vilken skala skulle vi mäta variabeln Meningsfullhet? 2
Kapitel 2 Tabeller och diagram På vilken skala skulle vi mäta variabeln Utomhustemperatur i grader Celsius? Kvalitativa variabler Frekvens : Antalet observationer för ett visst utfall Kvantitativa variabler Frekvens: Antalet observationer som hamnar i ett intervall. Frekvenstabeller, kvalitativ variabel Vi vill beskriva könsfördelningen hos eleverna i en skola Frekvenstabeller, kvalitativ variabel, relativ frekvens Vi vill beskriva könsfördelningen hos eleverna i en skola Kön Antal Flickor 75 Pojkar 65 Totalt 140 Kön Andel Flickor 0,54 Pojkar 0,46 Totalt 1,00 Frekvenstabeller, kvalitativ variabel, relativ frekvens Vi vill beskriva könsfördelningen hos eleverna i en skola Kvalitativa variabler kan illustreras i cirkeldiagram Kön Procent Flickor 54 Pojkar 46 Totalt 100 flickor pojkar 3
Kvalitativa variabler kan också illustreras i stapeldiagram Kvalitativa variabler kan också illustreras i stapeldiagram Man bör undvika brutna staplar då skillnaderna mellan kategorierna överdrivs 80 80 60 75 40 70 20 0 flickor pojkar 65 60 flickor pojkar Bar Chart and Pie Chart Example SkiLodges.com is test marketing its new website and is interested in how easy its Web page design is to navigate. It randomly selected 200 regular Internet users and asked them to perform a search task on the Web page. Each person was asked to rate the relative ease of navigation as poor, good, excellent, or awesome. The results are shown in the table below. Vilken skala mäts variabeln på? o o o o kvotskala Frekvenstabell kontinuerlig variabel Kontinuerliga variabler måste klassindelas EXAMPLE Creating a Frequency Distribution Table Klassintervall: Avståndet mellan klassgränserna Frekvens: Antal observationer i varje klass. Klassens mittpunkt: Medelvärdet av övre och undre klassgräns. 4
Att konstruera en frekvenstabell Relativ frekvens Markera in alla observationer i de olika klasserna Räkna antalet streck i varje klass Grafisk illustration av en kontinuerlig variabels frekvensfördelning (samt diskreta variabler men många utfall) Histogram Frekvens polygon Kumulativ frekvens polygon Boxplot Histogram HISTOGRAM Ett diagram där klassgränserna anges på den vertikala axeln och frekvensen på den lodräta. Arean på en stapel anger frekvensen. Staplarna ritas intill varandra, utan mellanrum. Frekvens Polygon Frekvensen anges genom en punkt mitt över klassmitten och dessa punkter sammanbinds med en linje Histogram Versus Frequency Polygon Both provide a quick picture of the main characteristics of the data (highs, lows, points of concentration, etc.) Advantage of the histogram it depicts each class as a rectangle, with the height of the rectangular bar representing the number in each class. Advantage of the frequency polygon - it allows us to compare directly two or more frequency distributions. 5
Kumulativ frekvens Cumulative Frequency Distribution Ange vilka av följande diagram som används till a variabler Cirkeldiagram Boxplot Frekvenspolygon Stapeldiagram Histogram Frekvenstabeller, diskret variabel Vi vill beskriva åldersstrukturen hos eleverna i en skola Ålder, frekvens Andel elever, relativ frekvens 7 20 14 8 23 16 9 22 16 10 27 19 11 23 16 12 25 18 n = 140 100 Diskreta a variabler med ett fåtal olika utfall kan också illustreras i stapeldiagram antal elever i olika åldrar 30 25 20 15 10 5 0 7 8 9 10 11 12 6