Arbetsgång vid statistiska undersökningar Problemformulering, målsättning Statistiska undersökningar Arbetsgången mm Definition av målpopulation Framställning av urvalsram Urval Utformning av mätinstrument Mätning Arbetsgång vid statistiska undersökningar (forts.) Bearbetning av data (Tabeller, diagram och beräkning av deskriptiva mått) Analys Presentation av resultat V E R K L I G H E T Val av mätinstrument Syfte/Problem Kunskap (Ämnes-& Statistikteori) Identifiering och definition av variabler Teorier om mätinstrumentet Data Statistiska tekniker Modell Slutsater Data Ny kunskap Undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att skaffa sig sådan kunskap är genom observationer Inom statistikteorin studeras hur observationer samlas in hur observationer analyseras hur slutsatser kan dras från observationer Deskriptiva och analytiska undersökningar Vid en deskriptiv eller beskrivande undersökning försöker man att, med hjälp av ett insamlat datamaterial, beskriva ett förhållande eller ett faktiskt händelseförlopp. Vid en analytisk eller förklarande undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör. 1
Mätnivåer Som man frågar får man svar... Deskriptiv statistik Val av tabeller, diagram och sammanfattande mått Nominalskala Ordinalskala Intervallskala Kvotskala Nominalskala Typexempel: Kön, civilstånd, yrke,... Klassificering av enheterna efter variabelvärdena. Variabelvärdena är endast namn (nomina). Av praktiska skäl ges variabelvärdena ofta siffervärden (kodas). Siffervärdena har dock ingen kvantitativ betydelse, d v s uttrycker inte hur mycket av en egenskap enheten har. Nominalskala Notera! Inte lämplig för matematiska operationer som addition och subtraktion. (Alltså olämpligt att beräkna t ex medelvärde, standardavvikelse...) Lämpliga tabeller, diagram etc: Frekvenstabeller, stapeldiagram (och cirkeldiagram) Lämpliga lägesmått: Typvärde Lämpliga spridningsmått: - Ordinalskala Typexempel: Attitydskalor (Bra, Sådär, Dåligt), betyg (U, G, VG), klädstorlek (S, M, L, XL, XXL),... Klassificering och rangordning, i någon storleksordning, av enheterna efter variabelvärdena. Skillnaden mellan variabelvärdena är dock inte lika stora. Siffervärdena har ingen kvantitativ betydelse. Vi kan uttala oss om vilka som har mer av en egenskap än andra men inte hur mycket de har. Ordinalskala Notera! Inte lämplig för matematiska operationer som addition och subtraktion. Lämpliga tabeller, diagram etc: Frekvenstabeller, stapeldiagram (och cirkeldiagram) Lämpliga lägesmått: Median (och typvärde) Lämpliga spridningsmått: Kvartilavvikelse, variationsbredd 2
Intervallskala Typexempel: Temperatur, Kalendertid Skillnaden mellan variabelvärdena är lika stora (ekvidistans), men saknar absolut nollpunkt. Notera! Addition och subtraktion är meningsfulla, men inte multiplikation och division. Kvotskala Typexempel: Inkomst, Vikt, Längd Absolut nollpunkt. Notera! Alla räkneoperationer tillåtna. Förhållanden mellan värden av typen dubbelt så mycket är meningsfulla begrepp. Det är alltså meningsfullt att tala om skillnader mellan variabelvärden men inte förhållanden av typen dubbelt så mycket. Intervallskala & kvotskala Lämpliga tabeller, diagram etc: Histogram Frekvenstabeller, stapeldiagram (och cirkeldiagram) för klassindelat material Lämpliga lägesmått: Medelvärde och median Lämpliga spridningsmått: Standardavvikelse Intervallskala & kvotskala Notera! Variabler som till sin natur är på kvot- eller intervallskala kan vara mätta på en lägre nivå ( Som man frågar får man svar... ). Undvik detta! Informationsförlust. Histogram Stapeldiagram, en variabel 5 6 4 5 4 3 3 2 2 1 34. 38. 42. 46. 5. 54. 58. 36. 4. 44. 48. 52. 56. Percent 1-24 Åldersklass 25-29 3-39 4- längd 3
Stapeldiagram, två variabler Liggande stapeldiagram 5 Grundskola Folkhögskola 4 Gymnasium 2 år 3 Gymnasium 3-4 år 2 Universitet max 2 år Percent 1-24 25-29 3-39 4- Kön Man Kvinna Utbildning Universitet > 2 år Utländsk utbildning 1 2 3 4 Åldersklass Percent Cirkeldiagram Låddiagram (Box plot) Chef 13,7% Outlier Minsta punkten inom inre et Största punkten inom inre et Misstänkt outlier o X X * Säljare 24,3% Arbetare 62,% Yttre Inre Q 1-1.5(IQR) Q 1-3(IQR) Q Median 1 Q 3 Kvartilavstånd IQR Inre Q 3 +1.5(IQR) Yttre Q 3 +3(IQR) Box plot 4
Box plot Frekvenstabell, en variabel 4 3 Envägsindelad frekvenstabell Innehåller en variabel samt absoluta eller relativa frekvenser 2 Exempel: Betyg, tenta 1 B e t y g A n t a l P r o c e n t ORD-provet -1 N = 237 Ekonomisk linje 265 Naturvetenskaplig li V G 4 2 G 1 4 U 1 1 4 2 5 1 Utbildning Korstabell, två variabler Korstabell eller tvåvägsindelad frekvenstabell Innehåller två variabler samt absoluta eller relativa frekvenser Exempel: Betyg och kön A n t a l P r o c e n t B e t y g M ä n K v i n n o r M ä n K v i n n o r U 1 4 5 6 4 4 G 2 4 1 1 4 4 V G 6 1 3 3 1 1 1 8 9 1 1 Kvottabell (två variabler) Envägsindelad kvottabell Innehåller två variabler, men en av variablerna finns i tabellcellerna i form av t ex medelvärden. Exempel: Genomsnittspoäng för män och kvinnor M ä n K v i n n o r 4 5. 6 4 2. 5 Spridningsdiagram (Scatter) 5
6