Datorövning 1 Statistik med Excel En del i processövningen som ni ska genomföra under den här kursen är att konstruera och sammanställa en enkät. Denna sammanställning ska göras med hjälp av programmet Excel. Syftet med den här datorövningen är därför att ge er en introduktion i hur man sammanställer (i mått och bilder) ett datamaterial i Excel. Läs igenom detta innan ni börjar göra övningarna: Starta Excel. (Ni gör det genom att gå via Start/Programs/ Excel.) Ett Excel-dokument kallas för en arbetsbok. Rutnätet som ni har framför er kallas för ett kalkylblad. Arbetsboken består av tre kalkylblad som man kan växla mellan genom att klicka på flikarna längst ner till vänster i Excel-fönstret. (Om ni skulle behöva fler kalkylblad i er arbetsbok så fixar man det genom att gå in på menyn Insert/Worksheet.) Rutorna i kalkylbladet kallas för celler. Varje cell har en beteckning (cellreferens) i Excel. Rutan längst upp till höger kallas A1. Bokstaven A står för kolumn A, och siffran 1 betyder att det är rad 1. I bilden nedan är cell E6 markerad (vilket ni kan se uppe till vänster i fönstet). Anledningen till att det är viktigt att veta vilket namn varje cell har är att man måste ange detta då man ska utföra beräkningar. Man måste tala om för Excel vilka värden den ska beräkna medelvärdet av. Ex: AVERAGE(A1:A6) betyder att Excel beräknar medelvärdet av värdena som finns i cellerna A1, A2, A3, A4, A5 och A6. För att kunna utföra vissa statistiska beräkningar så krävs det att ni har Analysis ToolPak installerat. Kontrollera att kommandot Data Analysis finns under menyn Tools. Om det inte gör det så måste ni installera Analysis toolpak. Det gör ni genom att först klicka på Adds-Ins under Tools-menyn och sedan markera rutan Analysis ToolPak och klicka OK.
Övning 1 På kurshemsidan under Material/ Datorövning finns det en fil som heter Enkat.xls. Ni öppnar denna fil genom att klicka på filnamnet, Enkat.xls, och sedan öppna den med Excel. I Excel borde nu nedanstående data att visas: I kalkylbladet står svaren på ett antal enkätfrågor som 49 personer besvarat. Komplettera svaren med den 50:e personen som gav följande svar på enkäten: Kön: Kvinna, Anställning: Deltid, Ålder: 35, Erfarenhet: 13, Sömnproblem: Ofta, Stress: Ofta. Bra, nu är alla enkätsvar inmatade och vi kan börja dataanalysen! Övning 2 I den här övningen ska ni beräkna samt tolka de läges- och spridningsmått som lärt er under kursen. Dessa är till exempel: Median, typvärde, medelvärde, kvartil, standardavvikelse. Så här gör ni för att beräkna medianen: Ställ markören på en tom cell i kalkylbladet. I den markerade cellen så kommer medianen att anges. Klicka på knappen f x i verktygsfältet, eller gå via menyn Insert/Function. Välj Statistical under Or select a category.
Under Select a function kan man välja vilken statistisk funktion som man vill använda sig av. Välj MEDIAN och klicka sedan på OK. Ni har nu fått upp en dialogruta där ni ska ange vilka tal som beräkningen (medianen) ska utföras på. Ställ markören i rutan brevid Number 1 och markera sedan området under Ålder i kalkylbladet. Klicka OK. Medianen av de data som ni valt ska nu stå i cellen där du ställde markören i steg 1. Ett tips: Skriv Median= i cellen brevid, så att ni vet vad ni har räknat ut! a) Följ samma procedur som ovan då ni beräknar de läges- och spridningsmått som står angivna nedan: Observera att för beräkningen av kvartilerna så måste ni både specificera vilka värden som kvartilen ska beräknas på samt vilken kvartil som ni är intresserad av (1:a eller 3:e). MEDIAN: AVERAGE: MODE: MIN: MAX: QUARTILE: STDEV: Medianen, det variabelvärde som delar fördelningen mitt itu Medelvärde Typvärde Minimum, det lägsta värdet Maximum, det högsta värdet kvartiler standardavvikelse b) Ni har nu tagit fram ett läges- och spridningsmått åt gången, men det finns en möjlighet att ta fram alla ovanstående mått (+ några till) med hjälp av ett kommando. Det kommandot finns under Tools/Data Analysis/Descriptive Statistics. Ställ markören efter Input Range. Markera sedan hela kolumnen som innehåller åldrar (nklusive cellen där Ålder står). Klicka i rutan före Labels in first row. I Output Range ska ni ange var svaret/tabellen ska stå. Nedan står det I1,
dvs tabellen kommer att ha sitt vänstra övre hörn i cell I1. Klicka i rutan Summary statistics innan ni klickar på OK. Så här borde utskriften se ut: Ålder Mean 42,58 Standard Error 1,58593 Median 42 Mode 32 Standard Deviation 11,21422 Sample Variance 125,7588 Kurtosis -0,89321 Skewness 0,238063 Range 41 Minimum 23 Maximum 64 Sum 2129 Count 50 c) Ålder och yrkeserfarenhet är variabler som är mätta på kvotnivå, de övriga variablerna i enkäten är mätta på nominal- eller ordinalnivå. Vilken/ Vilka variabler är mätta på nominalnivå? Vilka läges- och spridningsmått är lämpliga att använda för att beskriva variabler som är mätta på nominal mätnivå? Ni behöver inte räkna ut dessa.
Vilken/ Vilka variabler är mätta på ordinalnivå? Vilka läges- och spridningsmått är lämpliga att använda för att beskriva variabler som är mätta på ordinal mätnivå? Ni behöver inte räkna ut dessa. d) Beräkna genomsnittsåldern för männen respektive kvinnorna i undersökningen. Börja med att sortera era data med avseende på kön. Det gör ni genom att först markera hela datamaterialet inklusive variabelnamnen. Välj sedan Data/Sort och under Sort by markera Kön. Klicka OK. Det ni nu har gjort är att flytta om raderna i kalkylbladet så att alla kvinnor hamnar först och alla män hamnar sist. Beräkna nu genomsnittsåldern för respektive kön. Hur skiljer sig genomsnittsåldern mellan män och kvinnor i undersökningen? Övning 3 I den här övningen ska ni rita ett histogram för variabeln Yrkeserfarenhet. Om man studerar variabeln yrkeserfarenhet kan man se att den varierar mellan 1 och 39. Ett förslag på klassindelning kan då vara 0-10, 10-20, 20-30, 30-40. De klassgränser som man vill ha måste man skriva in i kalkylbladet innan man kan rita ett histogram (ty Excels automatiska indelning är inte så bra). Om ni väljer gränserna ovan så skriv då in 10, 20, 30, 40 i en valfri kolumn i kalkylbladet. 10 20 30 40 Gå sedan in på menyn Tools/ Data Analysis/ Histogram och klicka OK. Ställ markören i rutan till höger om Input Range. Markera er datamängd (yrkeserfarenhet). Ställ markören till höger om Bin Range. Markera klassgränserna som ni skrivit i kalkylbladet. Markera alternativet Output Range under Output Options. Ställ markören i rutan till höger om Output Range. Markera var i kalkylbladet som du ni vill ha ert histogram genom att markera en ledig cell. Klicka i rutan Chart output sedan OK. Nu ritas histogrammet upp. Om man vill modifiera utseendet på histogrammet så gör man det genom att dubbelklicka på en stapel i histogrammet. En meny kommer upp och man får där olika möjligheter till att ändra utseendet på grafen. Om man till exempel vill ändra så att staplarna ligger kloss mot varandra så gör man det under Options. Ändra Gap width till 0.
En annan sak som man kan vilja modifiera är det som står under staplarna. Att det står 10 under den första stapeln kan vara lite missvisande eftersom det inte bara är 10 som stapeln representerar utan alla värden mellan 0 och 10. Ett sätt att ändra på texten under staplarna är att ändra texten i den frekvenstabell som Excel skriver ut (till vänster om grafen). Under Bin så kan man ändra 10 till 10-20, 20 till 11-20 osv Om man ändrar texten i Bin-kolumnen så ska texten under staplarna ändras simultant, stämmer det? Övning 4 I den här övningen ska ni göra ett stapeldiagram över variabeln Sömnproblem. Tyvärr kan man inte konstruera ett stapeldiagram över kolumnen innehållandes Sömnproblem direkt, utan man måste först göra en frekvenstabell över variabeln. Sällan/aldrig 22 Ibland 16 Ofta 12 Frekvenstabellen skapar man genom att först skriva in Sällan/ aldrig, Ibland och Ofta i en kolumn. Ställ markören i cellen till höger om Sällan/ aldrig och klicka på f x. Under Statistical finns ett kommande som heter COUNTIF, välj det. I Range markerar ni kolumnen innehållandes sömnproblem och i Criteria markerar ni en valfri cell i den kolumnen som innehåller ordet Sällan/aldrig. Om ni har gjort rätt så ska det stå 22 efter Sällan/aldrig i er frekvenstabell. Gör på motsvarande sätt för Ibland och Ofta. Ni kan nu rita ett stapeldiagram för variabeln Sömnproblem genom att först markera den frekvenstabell som ni nyss skapat och sedan gå in på menyn Insert /Chart (chart type: column). Tryck Next. Excel ger nu ett förslag på hur stapeldiagrammet kan se ut. Om ni tycker att det ser bra ut så trycker ni på Finish och ni är klara. (Om ni vill skriva en titel på diagrammet eller om ni vill förtydliga vad som står på axlarna så kan ni göra det genom att välja Next innan ni trycker på Finish.) Övning 5 Som i övning 4 så ska ni rita ett stapeldiagram över variabeln sömnproblem. Skillnaden är nu att ni ska göra separata staplar för män respektive kvinnor. 12 10 8 6 kvinna män 4 2 0 Sällan/aldrig Ibland Ofta
Börja med att göra en frekvenstabell (korstabell) över sömnproblem / kön. Enklast gör ni det genom att först sortera era data med avseende på kön och sömnproblem och sedan räkna antalet kvinnor som tex svarat ibland för hand. Om man inte vill räkna för hand så kan man även här använda kommandot COUNTIF. Kvinnor Män Sällan/ aldrig Ibland Ofta Markera den frekvenstabell som ni nyss skapat och gå in på menyn Insert/ Chart (chart type: column. Tryck Next. Excels förslag på stapeldiagram ritas upp i fönstret. Om ni är nöjda med utseendet på diagrammet så tryck på Finish, annars välj Next. Som ni har märkt så belyser övningarna 1-6 bara en bråkdel av allt man kan göra i Excel. Vi hoppas att denna övning har gett er in introduktion till hur man använder sig av Excel, och att ni därmed inte är rädda för att undersöka programmets möjligheter på egen hand. Vid nästa handledningstillfälle så kommer ni bland annat att öva på att göra spridningsdiagram, korstabeller samt testa oberoende. Ni kommer även att få möjlighet att få svar på frågor som uppkommer i samband med analysen av er egen enkät. Lycka till med de statistiska analyserna i Excel!