DATORÖVNING 2: TABELLER OCH STANDARD- VÄGNING. I den här datorövningen använder vi Excel för att konstruera pivottabeller, som vi sedan använder för att beräkna standardvägda medeltal. Vi skapar också en tabeller med hjälp av Minitab. START Logga som vanligt in genom att skriva in ditt user name och ditt password och välja log on to: HELIX. Klicka på OK. 1. SKAPA PIVOT-TABELLER I EXCEL Börja med att öppna Excel. Det gör du som vanligt på följande sätt: 1. Öppna Start-menyn (längst ned till vänster på skärmen). 2. Välj All Programs och sök upp alternativet Microsoft Office. 3. I undermenyn till Microsoft Office, välj Microsoft Office Excel 2003. Om du inte redan har anpassat Excel så att du kan göra dataanalys så gör det nu (se datorlaboration 1 för detaljer). DATA Betrakta följande lilla datamaterial över 20 personer: Person Kön Utbildning Ålderklass Månadslön 1 Man Högskola yngre 18400 2 Man Grundskola yngre 15300 3 Kvinna Högskola yngre 17600 4 Man Gymnasieskola medel 20100 5 Kvinna Högskola medel 15900 6 Kvinna Gymnasieskola yngre 13500 7 Man Högskola medel 23400 8 Kvinna Grundskola äldre 14100 9 Man Högskola medel 26700 10 Man Högskola äldre 25900 11 Kvinna Gymnasieskola medel 18600 12 Kvinna Högskola medel 31500 13 Kvinna Grundskola yngre 13600 14 Man Gymnasieskola äldre 22300 15 Man Högskola äldre 35900 16 Kvinna Högskola medel 24800 1
17 Man Gymnasieskola äldre 20000 18 Kvinna Högskola medel 19400 19 Kvinna Grundskola medel 14100 20 Man Högskola medel 23800 Börja med att ta in materialet i Excel. Antingen matar du själv in data i arbetsblad 1 (Sheet1), kolumn A-E, eller så kan du öppna den färdiga Excelfilen som ligger på kurshemsidan (data1_datorovn2.xls). Nu ska du göra lite olika tabeller utifrån detta material. TABELL 1 Markera hela dataområdet (det vill säga alla celler med information i) i Excelbladet. Öppna menyn Data och välj där alternativet PivotTable and PivotChart report Då får du upp följande dialogruta: I rutan har två alternativ förmarkerats (Microsoft Office Excel list or database) samt PivotTable. Låt dessa vara så och klicka på Next. Nu öppnas en ny dialogruta där du bara med Next bekräftar det valda dataområdet. Nästa dialogruta ser ut så här: 2
Här ska du välja om du vill ha pivottabellen på ett nytt kalkylblad eller på det aktuella bladet. Du väljer själv, men om du vill ha det på det aktuella bladet måste du ange ett område (sätt markören i fältet och välj med musen det område du vill ha). Klicka sedan på Layout (inte på Finish) så att följande dialogruta öppnas: Instruktionen talar om att du skall skapa en layout genom att dra fältknapparna (dvs knapparna med Person, Kön, Utbildning, Åldersklass eller Månadslön) till tabellen på det sätt du vill ha dem. Dra fältknappen för Kön till fältet ROW, fältknappen för Utbildning till fältet COLUMN och dra även fältknappen för Utbildning till fältet DATA (det går alltså att dra samma knapp flera gånger). Notera att det i Datafältet står Count of utbildning, dvs måttet är antal. Klicka på OK. Du kommer nu tillbaka till den förra dialogrutan, där du klickar på Finish. Beroende på hur du valt utdataområde kommer nu tabellen upp endera på ett nyöppnat blad eller i det område du bestämt. Notera vad tabellen innehåller: antal personer fördelade på olika kategorier av kön och utbildning. Dessutom får du två ytterligare små fönster: ett med vilket du kan skapa nya tabeller och ett annat (PivotTable Field List) med vilket du kan modifiera den 3
tabell du redan har. (Skulle det senare fönstret försvinna kan du återfå det genom att klicka i rubrikraden på tabellen längst till vänster.) TABELL 2 Antag att du exempelvis vill ha en trevägsindelad tabell, där du också får in Ålder. Markera då Åldersklass i fönstret PivotTable Field List. Längst ned finns en knapp där det står Add to och efter den finns ett fält där det står Row Area. Det går att välja andra ytor där, men låt det stå som det står och klicka på knappen Add to. Pivottabellen ändras nu och du får uppdelning på både kön och ålderklass i raderna. Markera nu det inre av pivottabellen, dvs den del som varken är kolumnrubrik, radrubrik eller summor. Klicka sedan på diagramknappen så får du ett diagram i ett nytt kalkylblad över tabellen. Om du inte gillar diagramtypen kan du högerklicka på någon av staplarna, välja alternativet Chart type... och sedan välja något du tycker är snyggare. TABELL 3 Markera åter hela dataområdet och välj PivotTable and PivotChart report från Data-menyn. Du kommer att rekommenderas att konstruera tabellen utifrån tidigare settings för detta dataområde. Svara Yes på frågan och Next i den efterföljande dialogrutan. Gör motsvarande val som tidigare till dess att du kommer till Layout. Välj där Kön till ROW-fältet och Utbildning till COLUMN-fältet, men välj denna gång Månadslön till DATA-fältet. Notera att det nu står Sum of Månadslön i detta fält. Det innebär att tabellen kommer att innehålla summerade månadslöner inom varje kombination av kön och utbildning. Det känns väl vettigare att beräkna medellönen i en sådan här tabell, men detta skall vi justera i den färdiga tabellen. Klicka därför på OK och sedan på Finish (som tidigare). I den tabell som kommer upp ser du att du har summerade månadslöner i cellerna. Enklast är nu att högerklicka i någon av cellerna. Då kommer det upp en undermeny i vilken du väljer Field Settings. Det ger en dialogruta i vilken du kan välja vad du vill att tabellen skall visa: Välj Average (står förstås för genomsnitt) och klicka på OK. Ni får du beräknade genomsnittslöner i cellerna. Formatet på dessa kan ställas till valfritt antal decimaler: markera alla celler du vill ändra format på, högerklicka, välj Format Cells och Number, och välj antal decimaler. 4
FUNDERA ÖVER: Vad säger tabellen om genomsnittslönen hos män respektive hos kvinnor, samt för olika utbildningsbakgrunder? TABELL 4 Markera åter hela dataområdet och välj PivotTable and PivotChart report från Data-menyn. Gör motsvarande val som tidigare till dess att du kommer till Layout. Välj Åldersklass till ROWfältet och Utbildning till såväl ROW-fältet som DATA-fältet. Återigen får du Count of Utbildning som knapp i detta fält. Klicka på OK och tag fram tabellen. Högerklicka sedan i en cell och välj Field Settings i undermenyn. Klicka på knappen Options>> så kommer det upp en utökad ruta: Det fält där det står Normal har en undermeny kopplad till sig där du kan välja bland andra alternativ. Välj alternativet % of total och klicka sedan på OK. Vad händer nu med tabellen? Pröva även med något av alternativen % of row resp. % of column. Observera att du måste ha Count of utbildning som vald funktion för att det ska fungera. 2. STANDARDVÄGNING MED EXCEL DATA Betrakta följande datamaterial, innehållande uppgifter om utbildningsnivå, ålder, kön och månadslöner hos 30 slumpmässigt valda personer från två olika företag, A och B: Företag Utbildningsnivå Ålder Kön Månadslön A Högre Äldre Kvinna 18390 A Lägre Yngre Man 17450 B Lägre Äldre Kvinna 18670 A Högre Yngre Kvinna 18310 B Lägre Yngre Kvinna 16370 A Lägre Äldre Man 19430 A Högre Äldre Man 18080 5
B Lägre Äldre Kvinna 14870 A Högre Yngre Man 18250 B Högre Äldre Kvinna 20010 B Högre Yngre Kvinna 14210 B Högre Yngre Man 17720 A Lägre Äldre Man 15360 B Högre Äldre Kvinna 17710 A Lägre Yngre Kvinna 16440 A Högre Äldre Kvinna 18120 B Högre Yngre Man 16790 A Lägre Äldre Man 18170 B Lägre Äldre Kvinna 15350 B Lägre Yngre Man 15190 A Högre Äldre Kvinna 16440 B Lägre Äldre Man 17950 A Lägre Äldre Kvinna 15990 B Lägre Äldre Man 15070 B Högre Yngre Kvinna 16380 A Lägre Äldre Kvinna 17570 A Högre Yngre Man 14810 B Lägre Yngre Man 14730 B Högre Äldre Kvinna 17370 A Lägre Yngre Man 14030 Börja med att ta in materialet i Excel, antingen genom att själv mata in data eller genom att öppna den färdiga Excelfilen som ligger på hemsidan (data2_datorovn2.xls). Gör en trevägsindelad medeltalstabell över månadslöner, där utbildningsnivå och ålder läggs i rader och kön läggs i kolumner. Välj månadslön och ålder i tabellens DATA-fält. Placera tabellen på ett nytt blad. Ordna till funktionerna i tabellen så att du får medellöner (Average) för månadslön och antal (Count) för ålder. Studera den erhållna tabellen och jämför totala medellöner för kvinnor och män. Är dessa samstämmiga med hur det ser ut för respektive kombination av ålder och utbildningsnivå? Beräkna standardvägda medellöner för kvinnor respektive män. Använd kombinationen av utbildningsnivå och ålder för samtliga anställda som standardiseringsvariabel. Om du har placerat tabellen så att den börjar i cell A1 på arbetsbladet (det vill säga att tabellen börjar i kolumn A:s rad tre) bör det fungera att skriva in följande formel i en tom cell för kvinnornas standardvägda medellön: =D5*$F$6/$F$18+D7*$F$8/$F$18+D11*$F$12/$F$18+D13*$F$14/$F$18 Kopiera cellen med kvinnornas medeltal och klistra in i cellen närmast till höger så erhålls standardvägt medeltal för männen. 6
Fundera över hur formeln är uppbyggd! (Ledtråd: D5 motsvarar medellönen för äldre kvinnor med högre utbildning, F6 motsvarar det sammanlagda antalet äldre män och kvinnor med högre utbildning, F18 motsvarar det totala antalet män och kvinnor etc.). Observera dollartecknen: de används för att inte just denna cellreferens skall förändras när man kopierar celler till andra platser. Jämför de standardvägda medellönerna med de totala medellönerna. Blir jämförelsen kvinnormän rättvisare med de standardvägda medellönerna jämfört med hur det blev med totalmedellönerna? UPPGIFT 1 a) Beräkna standardvägda medellöner för kvinnor och män med enbart utbildningsnivå som standardiseringsvariabel. Gör motsvarande jämförelser som ovan. b) Beräkna en ny medeltalstabell som möjliggör beräkning av standardvägda medeltal för yngre och äldre med kombination av utbildningsnivå och kön för samtliga anställda som standardiseringsvariabel. Jämför dessa med motsvarande totalmedellöner och ange vilka medellöner du tycker ger den mest rättvisa jämförelsen mellan yngres och äldres medellöner. c) Konstruera en lämplig medeltalstabell utifrån vilken du kan svara på följande fråga: Verkar medellönen vara högre i företag A än i företag B? Gör lämplig utredning för att svara på frågan. 3. TABELLER MED MINITAB Starta Minitab på vanligt sätt: 1. Öppna Start-menyn. 2. Välj All Programs och sök upp alternativet Minitab Solutions. 3. I undermenyn för Minitab Solutions, välj alternativet Minitab 15 Statistical Software English. Viktigt! Klicka i Session-fönstret så att det blir aktivt (titelraden tänds blå). Öppna menyn Editor och välj alternativet Enable commands. Det innebär att man kan skriva Minitabkommandon direkt i Session-fönstret istället för att använda menyer och dialogrutor. Successivt under utbildningen kommer ni att se att det ofta går snabbare att skriva kommandon. Dessutom krävs det att man lär sig litet kommandon för att kunna skriva s.k. makron i Minitab (makron är kortare programsnuttar). En annan finess med att aktivera kommandofunktionen är att allt som görs via menyer och dialogrutor också ekas med motsvarande kommandon i Session-fönstret. Via detta kan man enkelt lära sig de vanligaste kommandona. Det bör dock sägas att ekandet ger alla detaljnivåer för kommandot där flera är överflödiga. Detta beror på att alla kommandon har en förinställning (den s.k. default-inställningen) och det är ofta den man använder. Då behövs inte detaljinformationen. Kopiera över de data du använde i Excel i avsnitt 1 i Minitabs Worksheet-fönster, så att rubrikerna hamnar i rubrikraden (den onumrerade raden). Du ska nu skapa nu en korstabell motsvarande tabellerna 1, 2 och 3 i avsnitt 1 ovan. 7
TABELL 1 Öppna menyn Stat, välj undermenyn Tables och i denna alternativet Descriptive Statistics (Ett förkortat skrivsätt för detta är Stat Tables Descriptive Statistics och detta sätt att föreskriva kommandon skall vi använda mycket i instruktionerna.) Följande dialogruta kommer nu upp: I fältet Categorical variables:, välj Kön (C2) i fältet For rows: och Utbildning (C3) i fältet For Columns:. Klicka på OK. I Session-fönstret kommer nu först det kommando, eller snarare den följd av kommandon som era val motsvarar att skrivas ut följt av själva tabellen. Det bör se ut så här: MTB > Table 'Kön' 'Utbildning'; SUBC> Layout 1 1; SUBC> DMissing 'Kön' 'Utbildning'; SUBC> Counts. Tabulated statistics: Kön; Utbildning Rows: Kön Columns: Utbildning Grundskola Gymnasieskola Högskola All Kvinna 3 2 5 10 Man 1 3 6 10 All 4 5 11 20 Cell Contents: Count Kommandot heter alltså table (att det skrivs med stor inledningsbokstav i utskriften är bara skönskrift ). Efter kommandoordet följer de två klassificeringsvariablerna. Namnen används här och då måste de skrivas med apostrofer, men man kan även ange kolumnnumren, dvs C2 och C3 (utan apostrofer). Stor eller liten bokstav har som sagt ingen betydelse. Efter variablerna har ett semikolon skrivits in. Detta innebär att Minitab förväntar sig att ett underkommando följer 8
och du ser också att prompten har ändrats från MTB > till SUBC>. Vi ser att det följer flera underkommandon: Underkommandot Layout 1 1 innebär att en tabell med en radvariabel och en kolumnvariabel ska skapas. Underkommandot Dmissing Kön Utbildning innebär att eventuella saknade värden för varje kombination av kön och utbildning ska visas i tabellen. Underkommandot Counts innebär att antal observationer för varje kombination av kön och utbildning ska ges i tabellen. Notera att när flera underkommandon används avslutas det sista med en punkt medan alla föregående avslutas med semikolon. Semikolon innebär alltid att Minitab förväntar sig ytterligare ett underkommando. Om man är klar ger man alltså en punkt. Själva tabellen är mycket enkelt formaterad. Du ser att det finns en rad och en kolumn med rubriken All. Detta är förstås rad- respektive kolumnsumma. Längst ned ges information av vad varje cell i tabellen innehåller. Resten bör vara begripligt. Pröva nu att efter den nya prompten (dvs MTB > ) skriva table c2 c3 och sedan trycka på Enter. Blir det någon skillnad på den tabell ni då får och den tidigare? I detta fall behövdes alltså inte några underkommandon. Counts är exempel på en defaultinställning för kommandot table. Det innebär att om man vill ha något annat än counts måste detta anges med ett underkommando. Se vidare nedan. TABELL 2 Välj åter Stat Tables Descriptive Statistics Du kommer nu att se att variablerna kön och utbildning finns kvar i fältet Classification variables. Detta är typiskt för Minitabs funktioner. Det senast gjorda finns kvar i dialogrutorna (till dess att Minitab avslutas) och detta gäller även ytterligare dialogrutor som öppnats under samma funktion. Detta är viktigt att tänka på när man skall göra nya tabeller etc och inte vill ha kvar de gamla inställningarna. Ni måste alltså gå in och ändra överallt där det behövs. Välj nu variablerna kön och åldersklass som radvariabler, och variabeln utbildning som kolumnvariabel. Klicka på OK. Den resulterande tabellen bör se ut såhär: Tabulated statistics: Kön; Åldersklass; Utbildning Rows: Kön / Åldersklass Columns: Utbildning Kvinna Grundskola Gymnasieskola Högskola All medel 1 1 4 6 yngre 1 1 1 3 äldre 1 0 0 1 9
Man All medel 0 1 3 4 yngre 1 0 1 2 äldre 0 2 2 4 All 4 5 11 20 Studera vilka kommandon som genererats, och notera särskilt förändringen i underkommandot Layout. TABELL 3 Välj åter Stat Tables Descriptive Statistics Använd kön och utbildning som klassificeringsvariabler. I dialogrutan, klicka på Display summaries for Associated variables: så öppnas följande dialogruta: Välj variabeln Månadslön till fältet Associated variables och markera Means under Display. Klicka på OK. I huvuddialogrutan (dvs den första du fick upp), klicka på Display summaries for Categorial variables: och se till att alla rutor i den resulterande dialogrutan är avmarkera de. Klicka på OK och sedan på OK i huvuddialogrutan. Har du gjort rätt ska du få följande tabell: Tabulated statistics: Kön; Utbildning Rows: Kön Columns: Utbildning Grundskola Gymnasieskola Högskola All 10
Kvinna 13933 16050 21840 18310 Man 15300 20800 25683 23180 All 14275 18900 23936 20745 Cell Contents: Månadslön : Mean Jämför de erhållna tabellerna i Session-fönstret med motsvarande Excel-tabeller. Vi kan nog vara överens om att Excel-tabellerna är snyggare, men det krävs litet fler steg för att få ut dem. Vidare är Minitabs tabeller bättre designade för att ge den statistiska information man ofta efterfrågar, detta dock på bekostnad av tabellens utseende. Avsluta alla program och logga ut från systemet. 11