Vägda medeltal och standardvägning

Relevanta dokument
b) Beskriv resultaten för de 24 programstudenterna i ett lådagram (boxplot).

12. DESKRIPTION FLERA VARIABLER

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Föreläsning G60 Statistiska metoder

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Beskrivande statistik

Statistik 1 för biologer, logopeder och psykologer

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Föreläsning G70 Statistik A

Föreläsning G60 Statistiska metoder

F2 Beskrivning av ett datamaterial. Tabellering och val av diagram. Summatecknet

Beskrivande statistik

Grundläggande statistik kurs 1

13.1 Matematisk statistik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

2 Dataanalys och beskrivande statistik

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Introduktion till statistik för statsvetare

Kapitel 1 - bekanta dig med din målgrupp

MA1S TATISTIK UPPGIFTER

732G01/732G40 Grundläggande statistik (7.5hp)

En typisk medianmorot

ÖVNINGSUPPGIFTER KAPITEL 9

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Handledning för konstruktion av tabeller och diagram med Excel

Föreläsning G60 Statistiska metoder

ÖVNINGSUPPGIFTER KAPITEL 9

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

12. DESKRIPTION FLERA VARIABLER

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

4 Diskret stokastisk variabel

ÖVNINGSUPPGIFTER KAPITEL 2

Är sjukvården jämställd och går det åt rätt håll?

1 Mätdata och statistik

Statistik januari-december 2012 Samordningsförbundet Göteborg Centrum

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Lektionsanteckningar 11-12: Normalfördelningen

Regiongemensam elevenkät 2016

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Bearbetning och Presentation

Regiongemensam elevenkät 2016

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Regiongemensam elevenkät 2016

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

NÄMNAREN. problemavdelning

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STA A13 (4 poäng) Lördag 11 november 2006, Kl

Regiongemensam elevenkät 2016

Regiongemensam elevenkät 2016

Regiongemensam elevenkät 2016

Regiongemensam elevenkät 2016

DATORÖVNING 2: STATISTISK INFERENS.

Regiongemensam elevenkät 2016

Lite extra material för deltagarna i kursen MAB 5.1

6-2 Medelvärde och median. Namn:

Skrivning/skriftlig eksamen till statistikdelen av kursen i forskningsmetodik maj 2002

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Regiongemensam elevenkät 2016

SF1901 Sannolikhetsteori och statistik I

*****************************************************************************

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Regiongemensam elevenkät 2016

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 6. Korstabeller (Tvåvägstabeller) Kap Korstabeller

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

ÖVNINGSUPPGIFTER KAPITEL 2

Kapitel 1 - bekanta dig med din målgrupp

Bok: X (fjärde upplagan) Kapitel : 3 Längd, tid och samband Kapitel : 4 Algebra och mönster

Uppgift 1. Produktmomentkorrelationskoefficienten

Regiongemensam elevenkät 2016

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Sammanfattningar Matematikboken X

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Ålder och kön. LVM-klienter och ungdomar, år

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Parade och oparade test

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

FACIT (korrekta svar i röd fetstil)

Regiongemensam elevenkät 2016

Regiongemensam elevenkät 2016

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Regiongemensam elevenkät 2016

Dekomponering av löneskillnader

PLANERING MATEMATIK - ÅK 8. Bok: Y (fjärde upplagan) Kapitel : 5 Ekvationer Kapitel : 6 Sannolikhet och statistik. Elevens namn: Datum för prov

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Förra gången (F4-F5)

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

Transkript:

Linköpings universitet 2000 MAI/Statistik Eva Leander Vägda medeltal och standardvägning Här följer ett antal sidor som behandlar vägda medeltal och standardvägning. Avsnittet om vägda medeltal förbereder för avsnittet om standardvägning som är en viktig och mycket användbar metod för tabellanalys när man vill analysera data från olika grupper, där det finns störande variabler. Vägda medeltal Betrakta följande exempel. Man har registrerat antalet syskon, y, för vart och ett av de 8 barnen i en barngrupp i syftet att beräkna medelantalet syskon per barn. Följande resultat erhölls: Anna 2 Lena 2 Jan 0 Karin 1 Pia 0 Lotta 2 Per 1 Ann 2 Materialet kan beskrivas i en frekvenstabell värde absolut relativ y frekvens frekvens 0 2 0.25 1 2 0.25 2 4 0.50 Medelantalet syskon per barn (aritmetiska medelvärdet) tecknas vanligen µ och beräknas: (1) µ = 2+2+0+1+0+2+1+2 8 vilket istället kan skrivas 1

(2) µ = 0+0+1+1+2+2+2+2 = 2 0+2 1+4 2 8 = 2 0 + 2 1 + 4 2 = 0.25 0 + 0.25 1 + 0.50 2 = 1.25 8 8 8 8 = Här kan man se att det aritmetiska medelvärdet i materialet dels kan ses som medelvärdet av de 8 observationerna (1) och dels som ett vägt medelvärde av de tre variabelvärdena 0, 1 och 2. Dessa tre värden vägs ihop med vikter proportionella mot antalet personer med respektive syskonantal. Det vägda medelvärdet kan tecknas µ = ω 1 0 + ω 2 1 + ω 3 2 0.25 0.25 0.50 där vikterna ω 1, ω 2 och ω 3 är hämtade ur frekvenstabellen. Vi kan notera att summan av vikterna är 1. Vi skall se att µ kan beräknas som ett vägt medelvärde också på ett annat sätt. Medeltalet för flickorna, µ F, beräknas som µ F = summan av flickornas y-värden antalet flickor = 2+2+1+0+2+2 6 = 1.5 Ur uttrycket ovan kan man lösa ut Summan av flickornas y-värden = antalet flickor µ F eller enklare y i = N F µ F. F På motsvarande sätt beräknas för pojkarna µ P = y i P N P = 0+1 2 = 0.5 och 2

summan av pojkarnas y-värden, y i = N P µ P. P Vi beräknar nu µ, medelvärdet i hela materialet, igen µ = summan av alla y-värden N = 2+2+0+1+0+2+1+2 8 = y i y i F P {}}{{}}{ = 2 + 2 + 1 + 0 + 2 + 2 + 0 + 1 = 9+1 = 6 µ F +2 µ P 8 8 8 = = 6 8 µ F + 2 8 µ P = 0.75 µ F + 0.25 µ P = = 0.75 1.5 + 0.25 0.5 = 1.25 relativa relativa frekvensen frekvensen flickor pojkar Vi ser att µ här utgör ett vägt medelvärde av flickornas medeltal 1.5 och pojkarnas medeltal 0.5 med vikter proportionella mot antalet flickor respektive pojkar. Medelvärdet i hela materialet om 8 barn - totalmedelvärdet µ - kan alltså ses som en kompromiss mellan medelvärdena i materialets delar - de betingade medelvärdena µ F och µ P. Eftersom andelen flickor är mycket större än andelen pojkar blir flickvikten mycket större än pojkvikten och detta leder till att totalmedelvärdet ligger mycket närmare flickmedeltalet än pojkmedeltalet. Sammanfattningsvis kan det aritmetiska medelvärdet i ett material med N observationer på en variabel ses som 3

i) summan av samtliga observationer dividerad med N, något som skulle kunna kallas det ovägda medelvärdet av materialets observationer ii) iii) ett vägt medelvärde av samtliga olika variabelvärden i materialet med vikter proportionella mot antalet observationer med respektive värde ett vägt medelvärde av medelvärdena i materialets delar - de betingade medelvärdena - med vikter proportionella mot antalet observationer i respektive del. Generellt gäller om vägda medeltal, vare sig det gäller ett vägt medeltal av materialets k stycken värden ω 1 y 1 + ω 2 y 2 +... + ω k y k eller ett vägt medeltal av medeltalen i materialets l stycken delar ω 1 µ 1 + ω 2 µ 2 +... + ω l µ l att summan av vikterna ω i skall vara 1 och att ingen vikt får vara negativ. Detta avsnitt handlar om hur man gör och tolkar två- och trevägsindelade tabeller. Det kan också ses som en förberedelse för nästa del som handlar om standardvägning. Vi arbetar även fortsättningsvis med ett mycket enkelt exempel. Vi tänker oss att de 40 barnen, som är inskrivna vid ett fritidshem, beskrivs med avseende på de tre variablerna kön (u), ålder (x) och veckopeng (y) på sätt som antyds nedan: 4

Barn nr Kön Ålder Veckopeng 1 P 6 10 2 F 8 12 3 P 8 15 4 F 9 18............ 39 P 10 15 40 P 7 12 Vi kan beskriva hur de 40 barnen fördelar sig på ålder enligt Tabell 1 Barn fördelade på ålder Ålder Antal Procent 6 6 15 7 10 25 8 10 25 9 8 20 10 6 15 Totalt 40 100 Tvåvägsindelade frekvenstabeller Kanske vill vi jämföra flickor och pojkar med avseende på ålder. Man kan då utgå ifrån nedanstående tvåvägsindelade frekvenstabell med absoluta frekvenser 5

Tabell 2 Barn fördelade på kön och ålder Ålder Flickor Pojkar Samtliga Antal Antal Antal 6 1 5 6 7 2 8 10 8 4 6 10 9 5 3 8 10 4 2 6 Totalt 16 24 40 Av tabellen framgår t ex att av de 10 stycken 8-åringarna är 4 flickor medan 6 är pojkar, och att det finns dubbelt så många 10-åriga flickor (4 stycken) som 10-åriga pojkar (2 stycken). Om man vill jämföra flickornas åldersfördelning med pojkarnas måste man emellertid också ta hänsyn till att pojkarna är betydligt fler än flickorna. Detta gör man lämpligen genom att överföra ovanstående tabell till nedan givna tvåvägsindelade frekvenstabell med relativa frekvenser (här i procent). Tabell 3 Barn fördelade på kön och ålder Ålder Flickor Pojkar Samtliga Procent Procent Procent 6 6 21 15 7 13 33 25 8 25 25 25 9 31 13 20 10 25 8 15 Totalt 100 100 100 Av tabellen framgår att åldersfördelningarna är mycket olika för könen. Detta ser man lätt om man gör radvisa jämförelser. T ex gäller att andelen 6-åringar bland pojkarna är mer än 3 ggr så stor som bland flickorna, (21% jmf 6%). Bland flickorna är andelen barn under 8 år mindre än 20% medan motsvarande andel bland pojkarna är större än 50%. Andelen 8-åringar är lika stor (25%) bland båda könen medan de 4 stycken 10-åriga flickorna utgör 6

en mer än 3 ggr så stor andel som de 2 stycken 10-åriga pojkarna (25% jmf 8%). Sammanfattningsvis tenderar flickorna att vara äldre medan pojkarna i större utsträckning är yngre. Detta slår också igenom i medeltalen för ålder som här betecknas med variabelbeteckningen med en ribba över (x-bar). X F = 1 16 6 + 2 16 7 + 4 16 8 + 5 16 9 + 4 16 10 = = 0.06 6 + 0.13 7 + 0.25 8 + 0.31 9 + 0.25 10 = 8.56 (motsvarar 6% 13% 25% 31% 25% ) hämtade ut tabell 3. X P = 0.21 6 + 0.33 7 + 0.25 8 + 0.13 9 + 0.08 10 = 7.54 Flickorna är alltså i genomsnitt (aritmetiskt medelvärde) drygt ett år äldre än pojkarna. Nu övergår vi till problemet att jämföra könen med avseende på veckopeng. Vi kan tänka oss att först betrakta en tvåvägsindelad frekvenstabell eller - ännu enklare - att jämföra medelveckopengen för könen. Beräkning av aritmetiskt medelvärde med avseende på veckopeng ger Ȳ F = 16.56 kronor respektive ȲP = 15.67 kronor, dvs flickorna har i medeltal lite högre veckopeng än pojkarna. Om vi önskar något mer detaljerad information betraktar vi tvåvägsindelade frekvenstabeller med variabeln veckopeng klassindelad. Om man vill nöja sig med en mycket grov klassindelning kan man betrakta nedanstående tabeller. 7

Tabell 4 Barn fördelade på kön och ålder - Antal Veckopeng Flickor Pojkar under 16:50 9 17 16:50 eller mer 7 7 Totalt 16 24 Tabell 5 Barn fördelade på kön och ålder - Procent Veckopeng Flickor Pojkar under 16:50 56 71 16:50 eller mer 44 29 Totalt 100 100 Man jämför radvis procenttalen i tabell 5 och finner att andelen med låg veckopeng (här under 16:50) är högre bland pojkarna än bland flickorna medan andelen med hög veckopeng är högre bland flickorna än pojkarna. (Ett annat val av klassgräns kunde ha givit en annan bild.) Båda de valda sätten att beskriva materialet ger alltså vid handen att flickorna har högre veckopeng än pojkarna. Trevägsindelade frekvenstabeller I det aktuella materialet har vi förutom kunskap om kön och veckopeng även information om åldern för varje barn. Att åldern är en faktor som har stor betydelse för veckopengens storlek torde vara ovedersägligt. Låt oss därför ta hänsyn till åldern när vi analyserar sambandet mellan kön och veckopeng. Problemet är då att beskriva tre variabler samtidigt. Man kan här välja att göra trevägsindelade frekvenstabeller, t ex som nedan 8

Tabell 6 Barn i olika åldrar fördelade på kön och veckopeng - Procent Veckopeng 6-åringar 7-åringar 10-åringar Flickor Pojkar Flickor Pojkar Flickor Pojkar under 16:50 100 100 100 75 25 0 16:50 eller mer 0 0 0 25 75 100 Totalt 100 100 100 100 100 100 Vi kan uppfatta denna trevägsindelade tabell som 5 tvåvägsindelade tabeller, en för varje ålder, där man jämför flickor och pojkar med avseende på veckopeng. Man gör radvisa jämförelser av procenttalen enligt markering inom varje åldersgrupp. Härav kan man möjligen ana att andelen pojkar med högre veckopeng (16:50 eller mer) är lika stor eller större än motsvarande andel bland flickorna för samtliga åldrar. Den trevägsindelade frekvenstabellen är i detta fall mindre lämplig. Den delar de facto in totalt 40 personer i 20 grupper. Tabellen blir svåröverskådlig, många celler blir tomma eller nästan tomma och procenttalen baseras i flera fall på en eller ett par individer. Tvåvägsindelade medeltalstabeller Ett bättre alternativ är att bilda en tvåvägsindelad medeltalstabell enligt nedan: 9

Tabell 7 Genomsnittlig veckopeng för barn i olika åldrar - Kronor Ålder Flickor Pojkar 6 10.0 13.0 7 13.0 14.0 8 14.0 16.0 9 17.0 19.0 10 22.0 23.0 Samtliga 16.56 15.67 Av praktiska skäl är materialet konstruerat så att samtliga betingade medeltal antar heltalsvärden. Totalmedeltalen är däremot icke heltal. Tabellen konstrueras så att man räknar ut det aritmetiska medelvärdet av veckopengarna för alla barn av visst kön och viss ålder och för in på därför avsedd plats i tabellen. T ex fanns 4 stycken 10-åriga flickor (jmf tabell 2). Dessa har följande veckopengar: 20 kr, 22 kr, 22 kr, 24 kr och alltså i medeltal 20+22+22+24 4 = 22 kr. En jämförelse mellan könen med hjälp av tabellen ger vid handen att flickorna i genomsnitt har lägre veckopeng än pojkarna för samtliga åldrar. Ändå har vi tidigare funnit att flickorna har högre genomsnittlig veckopeng än pojkarna (16.56 jmf 15.67). Allstå ger jämförelse av totalmedeltalet en annan bild av sambandet mellan kön och veckopeng än en jämförelse mellan de betingade medeltalen. Orsaken till denna skenbara anomali utreds i det följande. Den genomsnittliga veckopengen för de 16 flickorna kan ses som ett vägt medeltal av de olika åldrarnas medelveckopeng - de betingade medeltalen. ω F 1 = vikten för 6-åringar, ω F 2 = vikten för 7-åringar osv Ȳ F = ω F 1 10 + ω F 2 13 + ω F 3 14 + ω F 4 17 + ω F 5 22 Den genomsnittliga veckopengen för de 24 pojkarna kan på motsvarande sätt ses som ett vägt medeltal av pojkarna betingade medeltal Ȳ P = ω P 1 13 + ω P 2 14 + ω P 3 16 + ω P 4 19 + ω P 5 23 10

Både bland flickorna och bland pojkarna är de betingade medeltalen högre ju högre ålder. Viktsystemen ω F i respektive ω P i hämtas från åldersfördelningen för flickorna respektive pojkarna i tabell 3, dvs och ω F 1 = 0.06 ω F 2 = 0.13 ω F 3 = 0.25 ω F 4 = 0.31 ω F 5 = 0.25 ω P 1 = 0.21 ω P 2 = 0.33 ω P 3 = 0.25 ω P 4 = 0.13 ω P 5 = 0.08 Sålunda blir de två totalmedeltalen Ȳ F = 0.06 10 + 0.13 13 + 0.25 14 + 0.31 17 + 0.25 22 = 16.56 Ȳ P = 0.21 13 + 0.33 14 + 0.25 16 + 0.13 19 + 0.08 23 = 15.67 Skälet till att flickornas totalmedeltal blir högre än pojkarnas är alltså att flickorna har höga vikter där det är högre veckopeng (äldre barn) medan pojkarna har höga vikter där det är låg veckopeng (yngre barn). Att skillnaden mellan totalmedeltalen har blivit som den blivit beror i hög grad på att flickorna är äldre än pojkarna. Om man vill ge ett mått på skillnaden i veckopeng mellan flickor och pojkar för barn i samma ålder, blir skillnaden mellan totalmedeltalen här missvisande. I nästa avsnitt kommer en metod att konstruera ett bättre mått. Nu kommer vi till standardvägning och vi anknyter direkt till det tidigare exemplet med barnen och deras veckopengar. Standardvägning Låt oss göra ett tankeexperiment. I en annan barngrupp uppvisar barnen samma genomsnittliga veckopeng för varje kombination av kön och ålder som i vårt exempel. Emellertid fördelar sig såväl flickor som pojkar på ålder enligt tabell 8 11

Tabell 8 Genomsnittlig veckopeng (kronor) och åldersfördelning (procent) för en grupp barn Ålder Genomsnittlig Åldersfördelning veckopeng Flickor Pojkar Flickor Pojkar 6 10 13 15 15 7 13 14 25 25 8 14 16 25 25 9 17 19 20 20 10 22 23 15 15 Samtliga 14.95 16.70 100 100 Totalmedelvärden för könen ȲF och ȲP : Ȳ F = 0.15 10 + 0.25 13 + 0.25 14 + 0.20 17 + 0.15 22 = 14.95 Ȳ P = 0.15 13 + 0.25 14 + 0.25 16 + 0.20 19 + 0.15 23 = 16.70 Skillnaden mellan könen kan skrivas Ȳ P ȲF = 0.15 (13 10) + 0.25 (14 13) + 0.25 (16 14)+ +0.20 (19 17) + 0.15 (23 22) = = 0.15 3 + 0.25 1 + 0.25 2 + 0.20 2 + 0.15 1 = 1.75 och vi kan notera att resultatet är ett vägt medeltal av de i tabellen observerade radskillnaderna, något som känns rimligt och rättvist. Detta beror på att pojkar och flickor har samma åldersfördelning. Noteras kan att just de valda vikterna (0.15, 0.25, 0.25, 0.20, 0.15) motsvarar den totala åldersfördelningen i vårt tidigare exempel med de 40 barnen, jmf tabell 3. I praktiken arbetar man ofta just på detta sätt. Om könen fördelar sig mycket olika på ålder (som i vårt exempel med de 40 barnen) bildar man standardvägda medeltal, där man på det sätt vi gjorde ovan beräknar de 12

totalmedeltal, som skulle uppstått om både pojkar och flickor fördelat sig på ålder som samtliga barn i materialet gör och vi hade fått fram samma medeltalstabell som den vi har observerat. Om, som i vårt exempel, samtliga radskillnader har samma tecken, kommer detta tecken att synas också i skillnaden mellan de standardvägda medeltalen. Lite terminologi Om vi vill undersöka vilken betydelse kön har för veckopengens storlek utgör veckopeng beroende variabel eller resultatsvariabel, medan kön är undersökningsvariabel. Åldern, som vi konstanthåller genom att vi gör jämförelser inom varje åldersgrupp, utgör standardiseringsvariabel eller kontrollvariabel. I de olika tabeller vi har sett i detta kapitel har vi genomgående låtit vår undersökningsvariabel dela in materialet i tabellkolumner. Indelning i rader i tabellen bestäms av den beroende variabeln i frekvenstabeller (jmf t ex tabellerna 4, 5, 6) och av standardiseringsvariablerna i medeltalstabeller. Vid beräkningen av standardvägda medeltal på föregående sida valde vi samtliga barns fördelning på ålder som standardfördelning. Det förekommer att man hämtar sina standardvikter från någon annan standardfördelning. T ex kan man beräkna standardvägda medeltal baserade på att både flickor och pojkar fördelar sig på ålder som flickorna gör, dvs använda flickornas åldersfördelning som standardfördelning. Antag att vi vill jämföra veckopengen för pojkar och flickor i samma ålder och även vill sortera med hänsyn till förekomst av äldre syskon. I så fall kan vi bilda en tabell på följande form: 13

Genomsnittlig veckopeng Ålder Har äldre syskon Flickor Pojkar.... 7 Nej 11 12 7 Ja 15 16 8 Nej 12 15.... och arbeta på den på liknande sätt som ovan. Varje ålderskategori hade då delats upp i två delar och vi hade fått 2 standardiseringsvariabler (kontrollvariabler) nämligen ålder och förekomst av äldre syskon. Uppgift På ett medelstort företag sammanställer man på personalavdelningen uppgifter om de anställdas sjukfrånvaro. Man finner att under föregående verksamhetsår var den genomsnittliga sjukfrånvaron bland kvinnorna 6.77 dagar och bland männen 8.90 dagar. Med ledning av nedanstående medeltalstabell kan man närmare analysera statistiken över sjukfrånvaro. Tabellen redovisar den genomsnittliga sjukfrånvaron bland männen och kvinnorna i företaget med uppdelning på arbetsplats och ålder. Genomsnittlig sjukfrånvaro 1999 i antal dagar (Antal anställda anges inom parantes) Arbetsplats Ålder Kvinnor Män Avdelning I Yngre 6.2 (40) 6.4 (15) Äldre 5.4 (110) 5.5 (35) Avdelning II Yngre 9.4 (50) 9.9 (400) Äldre 7.6 (50) 8.1 (300) 6.77 8.90 (250) (750) 14

a) Jämför kvinnornas sjukfrånvaro med männens med hjälp av standardvägning. Standardvikterna skall hämtas från samtliga anställdas fördelning på arbetsplats och ålder. b) Jämför resultaten i a) med den bild man får om man jämför kvinnor och män i hela företaget (6.77 respektive 8.90 dagar). Förklara vad som orsakar skillnaden. Svar: a) Standardvägda medeltal för kvinnorna 8.01 och för männen 8.44. 15