v. 2015-01-07 ANVISNINGAR Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010 Detta häfte innehåller kortfattade anvisningar om hur ni använder Excel under denna laboration. Be om hjälp när/om ni tycker att dessa anvisningar är alltför knapphändiga. OBS! Alla anvisningar i text gäller MS Excel vers. 2010 på engelska. Vissa bilder visar formler på svenska men använd i datasalarna de engelska formler som finns in beskrivningar Innehållsförteckning: 1. Medelvärde, median och varians (sid. 1-3) 2. Histogram (sid. 4-12) 3. Punktdiagram (sid. 13-14) 4. Beräkna relativa frekvenser (sid. 15-16) 5. Sortera data (sid. 17-18) För samtliga nedanstående exempel används följande "fingerdata" för sex personer. Observera att denna excelfil inte är identisk med den ni själva analyserar!
1:1 Medelvärde för kroppslängd. Skriv in =AVERAGE() i någon valfri cell och skriv därefter mellan parenteserna in det cellområde vars medelvärde skall beräknas (i exemplet nedan området D3:D8). Tryck därefter ENTER. Allmänt tips: istället för att skriva in cellreferenser för hand kan man använda musen och markera de aktuella cellerna genom att "dra" samtidigt som vänster musknapp hålls nedtryckt. Mycket användbart även i andra sammanhang 2.
3. 1:2 Median för kroppslängd: =MEDIAN() 1:3 För att beräkna varians för kroppslängd skrivs =VAR.S(): (för ett stickprov - om hela populationens varians skall beräknas används istället funktionen =VAR.P():
2:1 Histogram för kroppslängd. Använd alternativet Dataanalysis... som du finner under fliken Data i den övre menyn: 2:2 Välj därefter Histogram: 4. 2:3 Klicka på OK, så öppnas följande fönster:
2:4 Markera med musen (eller skriv in) de aktuella cellreferenserna i fältet Input range (obs. att dollartecknen "$" inte behöver skrivas in). Om fältet Bin range lämnas tomt bestämmer Excel automatiskt antalet av antalet intervall i histogrammet (jfr. punkt 2:13 nedan). För att få bättre kontroll över var i ert Excel-dokument histogrammet hamnar kan ni skriva in något, t. ex. "Histogram för längd ", i fältet New worksheet Ply (nästa gång ni gör ett histogram ändrar ni detta namn till något annat namn). Klicka därefter på OK: 5. 2:5 Resultatet blir en tabell (på ett nytt ark) där värdena i kolumnen Bin utgör övre intervallgränser ("More", cell A:4 nedan, motsvarar alltså klassen "större än 171.5" i detta exempel), medan siffrorna under Frequency representerar antalet observationer i respektive intervall (totalt sex st. vilket stämmer i detta fall):
2:6 I ett sista steg gäller det att använda tabellen ovan som utgångspunkt för att konstruera det så kallade histogrammet. Markera cellerna i kolumnen frekvens. Välj fliken Insert och klicka på Column 6. 2:7 Då får du upp ett diagram som ser ut så här: 2:8 För att slutligen få rätt värden på x-axeln, högerklicka i figuren och välj Select Data. Välj Edit i rutan Horizontal (Category) Axis Label, då får du upp en ruta:
7. Markera cellerna i kolumnen Bin och tryck på ok. Tryck därefter på ok igen. 2.6/a Man kan hoppa över stegen 2.6-2.8 om man väljer att klicka för Chart output i histogram fönstret.
2:9 För att minska avståndet mellan staplarna, högerklicka på någon av dessa och välj Format Data Series...: 8.
9. 2:10 Sätt Gap Width till 0% och välj close: :
2:11 Det färdiga histogrammet ser nu ut som följer: 10.
2:12 Om ni själva vill bestämma antalet intervall i histogrammet ska fältet Bin range fyllas i (jmf. punkt 2:4 ovan). Börja med att skriva in de övre intervallsgränser som ni vill ha i några (Det är ni själva som väljer intervallsgränser, men det är bra om de är lika breda) valfria celler ovanför varandra (i exemplet nedan är tre lika breda intervall angivna: 150, 160 och 170; cellerna H3:H5, vilket kommer att resultera i fyra intervall i histogrammet eftersom "Fler än 170" också kommer att inkluderas!). Markera därefter dessa celler. Fortsätt som förut (se punkterna 2:5-2:11). 11.
3:1 Punktdiagram (Scatteplot) för variablerna kroppslängd och pekfinger. Välj Scatter under fliken Insert: 12. 3:2 Högerklicka i den tomma rutan och välj Select data. Klicka på Add:
3:3 Skriv därefter in de cellreferenser som representerar värdena på x- respektive y-axeln i fälten X-values och Y-values. För att på ett enkelt sätt göra detta kan man klicka på den lilla rutan längst till höger i fältet. Följande ruta öppnar sig och ni kan skriva in, eller med musen markera, de celler som ska ingå som x- resp. y-värden (i bilden är kolumnen E, lillfingerlängder, markerad som x-värden): 13. 3:4 Tryck på ok och sen ok igen och resultatet blir det önskade punktdiagrammet. Genom att klicka på diagramrutan och gå in på fliken Layout kan ni namnge axlarna.
4:1 Beräkna relativa frekvenser, i detta fall exemplifierat med variabeln kön. Det finns flera sätt att göra detta på. Här följer ett förslag: Vi ändrar text variabeln Kön så att det blir numerisk (t.ex: 1=HONA, 0=HANE) så att Excel kan räkna med variabeln. Börja med att infoga in ny (tom) kolumn, förslagsvis alldeles till höger om kolumnen "Kön". Högerklicka på kolumnhuvudet (i detta exemplet märkt "C") och markera hela kolumnen. Välj därefter Insert: 14.
4:2 I cellen C3 skriver ni nu in följande formel: =IF(B3="k";1;0), där B3 i detta exempel alltså är cellen alldeles till vänster om cellen med formeln (notera semikolon). Denna villkorsfunktion betyder i klartext följande: "Om det står "k" i cell B3, skriv en etta i denna cell (C3), om det inte står "k", skriv istället en nolla" GLÖM INTE ATT ÄNDRA k TILL DET TEXT NI VILLFÅ NUMERSIKT!: 15. 4:3 Tryck ENTER och kopiera därefter innehållet i cell C3 (använd tangenterna Ctrl+c) och klistra in detta i cellerna C4:C8 (tangenterna Ctrl+v). Det bör nu stå en etta vid varje "k" och en nolla vid varje "m" (OBS att ni har andra beteckningar än "k" och "m" för honor och hanar i er fil): 4:4 Den relativa frekvensen kvinnor kan nu beräknas som medelvärdet för cellerna C3:C8, vilket i vårt exempel blir 0.666 eller ca. 67% (=4/6):
16.
5:1 Ibland behöver man sortera sina data. Här följer ett exempel, åter för variabeln Kön. Börja med att markera hela tabellen, inklusive rubrikerna på översta raden: 17. 5:2 Välj därefter Sort under rubriken Data:
5:3 Välj att sortera efter variabeln "Kön". Se till att alternativet My data has headers är ikryssat, och tryck OK: 18. 5:4 Resultatet i vårt exempel blir som följer. Observera att samtliga kolumner har "följt med" i sorteringen (jmf. översta figuren på sid.1). Detta beror på att vi började med att markera hela tabellen innan vi sorterade våra data (se 5:1). Om vi endast hade markerat kolumnen "Kön" hade resultatet blivit att endast denna kolumn blivit sorterad, vilket inte är önskvärt i detta fall, eftersom vi ju vill att varje rad ska innehålla data för en och samma person: