Statistik, 2p ANVISNINGAR Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel Detta häfte innehåller kortfattade anvisningar om hur ni använder Excel under denna laboration. Be om hjälp när/om ni tycker att dessa anvisningar är alltför knapphändiga. Innehållsförteckning: 1. Medelvärde, median och varians (sid. 1-2) 2. Histogram (sid. 2-6) 3. Punktdiagram (sid. 7-8) 4. Beräkna relativa frekvenser (sid. 9-10) 5. Sortera data (sid. 10-11) För samtliga nedanstående exempel används följande "fingerdata" för sex personer. Observera att denna excelfil inte är identisk med den ni själva analyserar! ***************************************************************************** 1:1 Medelvärde för kroppslängd. Skriv in =medel() i någon valfri cell och skriv därefter mellan parenteserna in det cellområde vars medelvärde skall beräknas (i exemplet nedan området D3:D8). Tryck därefter ENTER. Allmänt tips: istället för att skriva in cellreferenser för hand kan man använda musen och markera de aktuella cellerna genom att "dra" samtidigt som vänster musknapp hålls nedtryckt. Mycket användbart även i andra sammanhang
2. 1:2 Median för kroppslängd: 1:3 Varians för kroppslängd (för ett stickprov - om hela populationens varians skall beräknas används istället funktionen =variansp()): 2:1 Histogram för kroppslängd. Använd alternativet Dataanalys... som du finner under Verktyg i den övre menyn:
3. 2:2 Välj därefter Histogram: 2:3 Klicka på OK, så öppnas följande fönster: 2:4 Markera med musen (eller skriv in) de aktuella cellreferenserna i fältet Indataområde (obs. att dollartecknen "$" inte behöver skrivas in). Om fältet Fackområde lämnas tomt bestämmer Excel automatiskt antalet av antalet intervall i histogrammet (jfr. punkt 2:13 nedan). För att få bättre kontroll över var i ert Excel-dokument histogrammet hamnar kan ni skriva in något, t. ex. "Histogram för längd ", i fältet Nytt kalkylblad (nästa gång ni gör ett histogram ändrar ni detta namn till något annat namn). Klicka därefter på OK:
2:5 Resultatet blir en tabell (på ett nytt ark) där värdena i kolumnen Fack utgör övre intervallgränser ("Fler", cell A:4 nedan, motsvarar alltså klassen "större än 171.5" i detta exempel), medan siffrorna under Frekvens representerar antalet observationer i respektive intervall (totalt sex st. vilket stämmer i detta fall): 4. 2:6 I ett sista steg gäller det att använda tabellen ovan som utgångspunkt för att konstruera det så kallade histogrammet. Börja med att klicka på Diagramguiden (alternativt: markera först hela er histogramtabell, i exemplet cellerna A2:F8, och välj därefter Diagramguiden): 2:7 Välj Stapel och tryck på Nästa: 2:8 Markera cellerna i kolumnen Frekvens i fältet Dataområde:
2:9 För att slutligen få rätt värden på x-axeln, gå in under fliken Serie och markera cellerna i kolumnen Fack i fältet Etiketter för kategoriaxel (X) och tryck på Slutför: 5. 2:10 För att minska avståndet mellan staplarna, högerklicka på någon av dessa och välj Formatera dataserier...: 2:11 Under fliken Alternativ, sätt Mellanrum i X-led till värdet noll, och tryck OK:
6. 2:12 Det färdiga histogrammet ser nu ut som följer: 2:13 Om ni själva vill bestämma antalet intervall i histogrammet ska fältet Fackområde fyllas i (jmf. punkt 2:4 ovan). Börja med att skriva in de övre klassgränser som ni vill ha i några valfria celler ovanför varandra (i exemplet nedan är tre likbreda intervall angivna: 150, 160 och 170; cellerna H3:H5, vilket kommer att resultera i fyra intervall i histogrammet eftersom "Fler än 170" också kommer att inkluderas). Markera därefter dessa celler. Fortsätt som förut (se punkterna 2:5-2:12).
3:1 Punktdiagram för variablerna kroppslängd och pekfinger. Välj Punkt i diagramguiden och tryck Nästa>: 7. 3:2 Välj därefter fliken Serie: 3:3 Klicka på Lägg till:
3:4 Skriv därefter in de cellreferenser som representerar värdena på x- respektive y-axeln i fälten X-värden och Y-värden. För att på ett enkelt sätt göra detta kan man klicka på den lilla rutan längst till höger i fältet (där muspilen pekar på bilden): 8. 3:5 Följande ruta öppnar sig och ni kan skriva in, eller med musen markera, de celler som ska ingå som x- resp. y-värden (i bilden är kolumnen E, lillfingerlängder, markerad som x-värden): 3:6 Tryck på Slutför och resultatet blir det önskade punktdiagrammet. Genom att högerklicka med musen på den vita delen av figuren och därefter välja Diagramalternativ kan ni dessutom lägga till rubriker på axlarna (under fliken Rubrik):
4:1 Beräkna relativa frekvenser, i detta fall exemplifierat med variabeln kön. Det finns flera sätt att göra detta på. Här följer ett förslag: Börja med att infoga in ny (tom) kolumn, förslagsvis alldeles till höger om kolumnen "Kön". Högerklicka på kolumnhuvudet (i detta exemplet märkt "C") och markera hela kolumnen. Välj därefter Infoga: 9. 4:2 I cellen C3 skriver ni nu in följande formel: =om(b3="k";1;0), där B3 i detta exempel alltså är cellen alldeles till vänster om cellen med formeln (notera semikolon). Denna villkorsfunktion betyder i klartext följande: "Om det står "k" i cell B3, skriv en etta i denna cell (C3), om det inte står "k", skriv istället en nolla": 4:3 Tryck ENTER och kopiera därefter innehållet i cell C3 (använd tangenterna Ctrl+c) och klistra in detta i cellerna C4:C8 (tangenterna Ctrl+v). Det bör nu stå en etta vid varje "k" och en nolla vid varje "m" (OBS att ni ev. har andra beteckningar än "k" och "m" för kvinnor och män i er fil):
4:4 Den relativa frekvensen kvinnor kan nu beräknas som medelvärdet för cellerna C3:C8, vilket i vårt exempel blir 0.666 eller ca. 67% (=4/6): 10. 5:1 Ibland behöver man sortera sina data. Här följer ett exempel, åter för variabeln Kön. Börja med att markera hela tabellen, inklusive rubrikerna på översta raden: 5:2 Välj därefter Sortera under rubriken Data:
5:3 Välj att sortera efter variabeln "Kön". Se till att alternativet Rubrikrad är inprickat under Listan har, och tryck OK: 11. 5:4 Resultatet i vårt exempel blir som följer. Observera att samtliga kolumner har "följt med" i sorteringen (jmf. översta figuren på sid.1). Detta beror på att vi började med att markera hela tabellen innan vi sorterade våra data (se 5:1). Om vi endast hade markerat kolumnen "Kön" hade resultatet blivit att endast denna kolumn blivit sorterad, vilket inte är önskvärt i detta fall, eftersom vi ju vill att varje rad ska innehålla data för en och samma person: