Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, boxplot ) Deskription: lägesmått, spridningsmått Indexserie med bastidpunkt, förändring, genomsnittlig årlig förändring, penningvärde 1 Mera om mätnivåer Ett mått på hur mycket information som finns i observationerna. Det är viktigt med mätnivåer för att olika informationsmängd leder till olika analyser. Nominalskala Ordinalskala Intervallskala Kvotskala Nominalskala (kvalitativ) Notera! Inte lämplig för matematiska operationer som addition och subtraktion. (Alltså olämpligt att beräkna t ex medelvärde, standardavvikelse...) Lämpliga tabeller, diagram etc: Stapeldiagram (Bar Chart) och cirkeldiagram (Pie Chart) Lämpliga lägesmått: Typvärde (Mode) Lämpliga spridningsmått: - 1
Ordinalskala (kvalitativ) Typexempel: Attitydskalor (Bra, Sådär, Dåligt), betyg (U, G, VG), klädstorlek (S, M, L, XL, XXL),... Klassificering och rangordning, i någon storleksordning, av enheterna efter variabelvärdena. Skillnaden mellan variabelvärdena är dock inte alltid lika stora. Efter omkodning till siffror: siffervärdena har ingen kvantitativ betydelse. Vi kan uttala oss om vilka som har mer av en egenskap än andra men inte hur mycket de har. Ordinalskala (kvalitativ) Notera! Inte lämplig för matematiska operationer som addition och subtraktion. Lämpliga tabeller, diagram etc: Stapeldiagram och cirkeldiagram mm frekvenstabeller Lämpliga lägesmått: Median (M) och Typvärde (Mode) Lämpliga spridningsmått: Kvartilavvikelse (IQR = Interquartile range, variationsbredd (Range) Intervallskala (kvantitativ) Typexempel: Temperatur, Kalendertid Skillnaden mellan variabelvärdena är lika stora (ekvidistans), men saknar absolut nollpunkt. Notera! Addition och subtraktion är meningsfulla, men inte multiplikation och division. Det är alltså meningsfullt att tala om skillnader mellan variabelvärden men inte förhållanden av typen dubbelt så mycket. 2
Kvotskala (kvantitativ) Typexempel: Inkomst, Vikt, Längd Absolut nollpunkt. Notera! Alla räkneoperationer är tillåtna och meningsfulla. Förhållanden mellan värden av typen dubbelt så mycket är meningsfulla begrepp. Intervall- & kvotskala (Scale) Lämpliga tabeller, diagram etc: Histogram Frekvenstabeller, stapeldiagram (och cirkeldiagram) för klassindelat material Lämpliga lägesmått: Medelvärde (Mean, ) och median (Median, M) Lämpliga spridningsmått: Standardavvikelse (Standard deviation, ), Varains (Variance, ) Intervallskala & kvotskala Notera! Variabler som till sin natur är på kvot- eller intervallskala kan vara mätta på en lägre nivå ( Som man frågar får man svar... ). Undvik detta! Informationsförlust. 3
Vilken mätnivå? (Hjälp mig!) Ålder Ålder grupp 25-34, 35-44, 45-54,... Kön (man/kvinna) Rökare (ja/nej) BMI (23.45, 28.12, ) Bil modell (Volvo, Saab, Fiat) Temperatur (12C, -4C, 14C, ) Pengar på bankkontot med obegränsad kredit. Boxplot över Arbetsbörda (Intervall eller Kvot) Stapeldiagram Betyg (Antal) (Ordinal eller Nominal) 4
Stapeldiagram Betyg (Procent) (Ordinal eller Nominal) Tårtdiagram för Betyg (Ordinal eller Nominal) Histogram över Tentamenspoäng (Intervall eller Kvot) 5
Boxplot över Tentamenspoäng (Uppdelat på kön) Boxplot över Arbetsbörda (Uppdelat på kön) Stapeldiagram över Betyg (Uppdelad på kön) 6
Spridningsdiagram Arbetsbörda mot Tentamenspoäng Finns det ett samband? nominal ordinal kvot typvärde typvärde typvärde median (vissa fall medelvärde) variationsvidd kvartilavstånd median medelvärde variationsvidd kvartilavstånd standardavv. 20 Några felkällor vid statistiska undersökningar Bortfallsfel Individbortfall innebär att man från en eller flera individer ej får något svar på t.ex. en postenkät Partiellt bortfall innebär svarsvägran på vissa frågor Kan ge stora systematiska fel 21 7
Täckningsfel Övertäckning Urvalsramen innehåller individer som ej finns med i målpopulationen Undertäckning Urvalsramen saknar individer som finns med i målpopulationen Kan ge upphov till systematiska fel (bias) 22 Mätfel Mätfel som beror på respondenten Mätfel som beror på intervjuaren Mätfel som beror på mätmetoden Mätfel som beror på frågeformuläret 23 Kodningsfel Inmatningsfel Datorbearbetningsfel Bearbetningsfel 24 8
Urvalsfel Uppstår när man studerar ett urval i stället för hela populationen Slumpmässigt och möjligt att uppskatta om urvalet görs korrekt 25 Index (Kapitel 5.1 5.4, 5.7 5 8 i 2.) Indexserie med bastidpunkt (vanligtvis i 100 tals, %): förändring under en viss period. Genomsnittlig årlig ökning/minskning: hur stor är förändringen per år? Konsumentprisindex (KPI): ett mått på hur köpkraften för en krona ändras. Penningvärde (omräkning med KPI): hur mycket gml pengar värda nu? 26 Exempel Indexserie med bastidpunkt Förändring Antal gånger År boken lånats 1 6 2 11 3 10 4 14 5 13 Indexserie med första året som basår, % 100,0 183,3 166,7 233,3 216,7 Bilda en indexserie med första året som bastidpunkt som visar utvecklingen av antalet utlån per år av den aktuella boken. Vad blir indexvärdet sista året? Hur stor är förändringen av antalet under dessa år? Ange svaret i % med minst en decimal. Svar: 100*(13-6)/6= 116,7 27 9
Genomsnittlig årlig ökning, ränta på ränta princip Exempel (OBS! Hantera potenser!) Kostnaderna för kursliteraturen i en viss kurs ges i nedanstående tabell. År Kostnad 1 400 2 456 3 448 4 468 5 508 Index Index 100 114 112 117 127 Hur stor är den genomsnittliga årliga ökningen av kostnaderna under dessa år? Ange svaret i procent med minst en decimal. Lösn.: 100 1 127, eller 1 1.27. 1.0616 Alltså svaret är ca 6.2 (%) 28 KPI, Penningvärde, löpande vs fasta priser Exempel (Hemläxa, Exempel 14 på s. 142 144 i 2.) Vi ska undersöka kostnaderna för kurslitteratur i en viss kurs. För några tidigare år såg utvecklingen för kostnad och konsumentprisindex (KPI) ut på följande sätt. År Kostnad KPI 1 465 260 2 475 310 3 505 255 4 485 315 Vad kostade böckerna år 4 utryckt i första årets penningvärde? (I andra ord: hur mycket var 485 kr då under år 1? ) Lösning: 485 400, vilket i princip innebär att priset år 4 är mindre jmf med år 1 (i första årets penningvärde). Kronans köpkraft har sjunkit från år 1 till år 4. År 4 är kronan alltså bara värd 260/315=0.83 kronor jmf med år 1. 29 What lies ahead You learn statistics by doing statistical problems. Practice, practice, practice. Be prepared to work problems. The basic principle in learning is persistence. Being organized and persistent is more helpful in reading this book than knowing lots of math. The main ideas of statistics, like many ideas of any important subject, took a long time to discover and take some time to master. The gain will be worth the pain. 30 10