Kognitiv psykologi Moment 1: Statistik, 3 poäng VT 27 Lärare: Maria Karlsson Deskription (Kapitel 2 i Howell) Beskrivande mått, tabeller och diagram 1 2 Tabeller Tabell- och kolumnrubriker bör vara fullständiga men ändå kortfattade Lämplig uppställning: Tabellnr., rubrik Kort anmärkning som gäller hela tabellen Tabell Noter Längre anmärkningar Källhänvisning Ange enheten för respektive kolumn ovanför varje kolumn. Om samma enhet gäller för hela tabellen ges den i rubriken. 3 4 Tabell, en variabel Envägsindelad frekvenstabell Innehåller en variabel samt absoluta eller relativa frekvenser Tabell x.?? Studenternas fördelning på variabeln nivå på utbildning vid påbörjade högskolestudier. År 23. Procent. Nivå på utbildning Andel Grundskola/Enhetsskola,7 Folkhögskoleutbildning 1,3 2-årig gymnasieskola 6,2 3-årig yrk.gymn.skola 15,5 3- el. 4-årig gymn.skola 76,3 Totalt 1, 5 6 1
Tabell, två variabler Tvåvägsindelad frekvenstabell Innehåller två variabler samt frekvenser eller relativa frekvenser Envägsindelad kvottabell Innehåller två variabler, men en av variablerna finns i tabellcellerna i form av t.ex. medelvärden. Tabell x.?? Studenternas fördelning på variabeln nivå på utbildning vid påbörjade högskolestudier. År 23. Uppdelat på kön. Procent. Utbildning Man Kvinna Grundskola/Enhetsskola,8,5 Folkhögskoleutbildning,9 1,8 2-årig gymnasieskola 4, 7,7 3-årig yrk.gymn.skola 14, 16,2 3- el. 4-årig gymnasieskola 8,3 73,8 Totalt 1, 1, 7 8 Envägsindelad kvottabell: Genomsnittspoäng för män och kvinnor Män Kvinnor 45.6 42.5 Tabell, tre eller fyra variabler Tre variabler Trevägsindelad frekvenstabell Tvåvägsindelad kvottabell Fyra variabler Fyrvägsindelad frekvenstabell Trevägsindelad kvottabell 9 1 Diagram Diagramrubriken bör vara fullständig men ändå kortfattad Lämplig uppställning: Diagramnr., rubrik Kort anmärkning som gäller hela diagrammet Diagram Noter Längre anmärkningar Källhänvisning Välj diagramtyp som passar det aktuella problemet Välj lämpliga skalor för axlarna Stympa ej y-axeln i onödan. Om y-axeln stympas bör detta klart anges 11 12 2
Kvalitativa variabler För axlarna skall man tydligt ange variabler, enheter, skalsteg och skalvärden Diagrammet kan med fördel omges av en ram och innehålla stödlinjer För att visa en fördelning, i en population eller ett urval, när man har en kvalitativ variabel, kan man t.ex. använda ett stapeldiagram eller ett cirkeldiagram. 13 14 Stapeldiagram, en variabel. Absoluta frekvenser. 2 Stapeldiagram, en variabel. Relativa frekvenser. 7 6 5 4 1 3 2 Count Yrke Arbetare Säljare Chef 15 1 Yrke Arbetare Säljare Chef 16 Liggande stapeldiagram Cirkeldiagram Grundskola Folkhögskola Chef 13,7% Gymnasium 2 år Gymnasium 3-4 år Universitet max 2 år Säljare 24,3% Utbildning Universitet > 2 år Utländsk utbildning Arbetare 62,% 1 2 3 4 17 18 3
Fotbollsspelarens rörelsemönster 6 5 4 3 2 Kvantitativa variabler När man har en kvantitativ variabel kan man t.ex. använda histogram eller ett stambladdiagram. Man kan även klassindela materialet och presentera det med hjälp av ett stapeldiagram. 1 Stående+gång Halvsnabb+snabb löpn Joggning+lätt löpnin Ryck Bollinnehav Aktivitet 19 2 Histogram. Nyfödda barns fördelning på variabeln längd Histogram. Åldersfördelning för ett urval av högskoleprovtagare. 6 5 ANTAL 7 6 4 5 3 2 1 34. 38. 42. 46. 5. 54. 58. 36. 4. 44. 48. 52. 56. längd 4 3 2 1 15, 25, 35, 45, 55, 65, 75, 2, 3, 4, 5, 6, 7, 8, 21 ÅLDER 22 Stapeldiagram. Åldersfördelning för samtliga högskoleprovtagare våren 1987. Stapeldiagram, två variabler 5 5 4 4 3 3 2 2 1-24 25-29 3-39 1-24 Åldersklass 25-29 3-39 4-4- Kön Man Kvinna Åldersklass 23 24 4
Stam-bladdiagram. Chefernas fördelning på anställningstid. Anställningstid Stem-and-Leaf Plot Frequency Stem & Leaf 4,. 2344 6,. 567889 7, 1. 222233 8, 1. 56788899 9, 2. 111123344 5, 2. 56679 2, 3. 34 Tidsseriedata Tidsserier presenteras ofta med hjälp av s.k. linjediagram I linjediagram kan man ofta upptäcka sådant som trender, cykler eller säsongsvariationer. Stem width: 1, Each leaf: 1 case(s) 25 26 Privat konsumtion i USA Försäljning, kvartalsdata 2 3 18 Personal consumption expenditures 16 14 12 1 8 6 SALES 2 1 Q1 1992 Q1 1993 Q1 1994 Q1 1995 Q1 1996 Q1 1997 Q3 1992 Q3 1993 Q3 1994 Q3 1995 Q3 1996 Q3 1997 1939 194 1941 1942 1943 1944 1945 1946 1947 1948 1949 195 Year 27 Date 28 Pulsmätning Beskrivande mått 18 16 14 12 Om man vill beskriva en egenskaps fördelning i en population eller ett sampel kan man naturligtvis göra detta genom att räkna upp samtliga observationer. 1 PULS 8.5 5.5 1.5 15.5 2.5 25.5 3.5 35.5 4.5 45.5 3. 8. 13. 18. 23. 28. 33. 38. 43. TID 29 3 5
Kvartiler I en frekvenstabell sammanfattas en fördelning i ett fåtal värden - frekvenserna. Med hjälp av beskrivande mått sammanfattas fördelningen av ett eller ett fåtal tal. Genom att beräkna kvartiler sammanfattas en fördelning i tre tal: första kvartilen andra kvartilen (medianen) tredje kvartilen 31 32 Box-plot (lådagram) Lägger vi till det minsta och det största värdet kan vi beskriva fördelningen med hjälp av fem tal. (Five number summary) En boxplot (ett lådagram) är ett diagram som bygger på denna five number summary. Outlier o Minsta Största punkten punkten inom inom inre et Misstänkt inre et outlier X X * Yttre Inre Q 1 Median Q 3 Q 1-1.5(IQR) Kvartilavstånd IQR Q 1-3(IQR) Inre Yttre Q 3 +1.5(IQR) Q 3 +3(IQR) 33 34 Boxplot (lådagram), ORDprovet. 4 Box-plot (lådagram), NOGprovet 3 3 2 2 1 1 ORD-provet -1 N = 237 Ekonomisk linje 265 Naturvetenskaplig li NOG-provet -1 N = 237 Ekonomisk linje 265 Naturvetenskaplig li Utbildning Utbildning 35 36 6
Centralmått Genom att beräkna ett centralmått sammanfattas fördelningen i ett tal. Tre vanliga centralmått: Typvärdet Medianen Medelvärdet Typvärdet är det mest frekventa värdet Medianen är, om antalet mätvärden är udda, det mittersta av de rangordnade mätvärdena. Om antalet mätvärden är jämnt är medianen medelvärdet av de två mittersta mätvärdena. Medelvärdet är summan av alla mätvärden dividerat med antalet mätvärden. 37 38 Vilket av dessa tre mått skall vi använda? Detta beror framför allt på två saker: Syfte. Vad skall vi ha måttet till? Möjlighet att tolka resultatet (jmf mätnivån). Antag att vi sätter gul=1, blå=2 och röd=3. Eftersom vi har siffror kan vi beräkna typvärde, median och medelvärde. Men hur tolkar vi t.ex. medelvärdet 2,3 eller medianen 2? Medianen kräver rangordning, att 2 innebär mer av egenskapen än 1. Medelvärdet kräver dessutom ekvidistan, dvs. lika avstånd mellan skalstreck. Spridningsmått Ett centralmått sammanfattar en fördelning i ett enda tal och ger information om var fördelningens centrum är beläget. Ett spridningsmått ger information om fördelningens spridning. 39 4 Tre olika spridningsmått Variationsvidden är skillnaden mellan det största och det minsta värdet Kvartilavståndet är avståndet mellan första och tredje kvartilen. Måttet anger alltså inom vilket avstånd de 5% mittersta observationerna ligger. Standardavvikelsen är ett spridningsmått som beskriver hur mycket mätvärdena avviker från medelvärdet. 41 7