Lunds unverstet Statstska nsttutonen Effekter av kön, ålder och regon på sjukpennngen Sverge -en varansanalys Rkke Berner Uppsats statstk 0 poäng Nvå 6-80 poäng Oktober 006 Handledare: Mats Hagnell
Abstract Accordng to TCO (The Swedsh Central Organsaton for Publc Servants) the worst threat to the Swedsh welfare s that so many people because of bad health and unemployment are not a part of the labour force. If Sweden could make people wth health and unemployment problems half the sze as today, the GDP would ncrease wth more than fve percent. In real money ths means 0 bllon Swedsh kronor a year. Accordng to SCB (the Swedsh Central Bureau of Statstcs) the dfference between women and men s absence owng to llness should be nvestgated more closely n order to get at better understandng of the problem. A good way to study the absence owng to llness s to analyse the share of people wth sck-beneft. The purpose of ths essay s to analyse whether the sck-beneft dffers due to the varaton n the ndependent factors (age, gender, regon and tme). Furthermore, the nteracton, f any, between the analysed factors wll be studed and nterpreted. To get a better understandng of how much every factor and nteracton explans the dfferences n sck-beneft, the strength of the effect (eta square) s calculated. Ths measure together wth sgnfcant dfferences s far more nformatve then just sgnfcant dfferences. Ths allows us to elmnate sgnfcant factors from our model because of the small contrbuton to the varaton n the dependent factor. We have chosen to call the dependent factor Proporton of the populaton wth sck-beneft and the ndependent factors n ths essay are age, gender, regon and tme. The age-factor s dvded nto nne dfferent groups, the regon-factor s dvded nto three groups and the years ncluded n ths study are 000-005. The reason why a tme factor s chosen for analyse s to study whether the absent owng to llness has changed over tme and f so, n what way. A four-way analyss of varance wth fxed effects s the best way to examne the dfferences n Proporton of the populaton wth sck-beneft. We start out by elmnatng the nsgnfcant nteractons and then accordng to nteracton plots and the sze of eta squared we reduce the model even more. In the fnal model we fnd sgnfcant nteractons between gender and age, between gender and regon and between regon and age. There s a tendency for women n the northern parts of Sweden to have a hgher proporton of sck-beneft. If we look at the nteracton between gender and age t shows that the dfference between men and women s not the same for those n the age group 0-4 years and 60-64 years, as for those n the mddle age groups. The dfferences n the mddle age groups are greater and the bggest dfference s seen n the agegroup 35-39 years where the proporton wth sck-beneft s twce as bg for women. The nteracton between age and regon ndcates that people between 35 and 39 years, n the northern parts of Sweden, receve sck-benefts to a larger extent than those between 40 and 44 years. Ths s not the case n the rest of Sweden. Tendences were shown for the Proporton of the populaton wth sck-beneft to decrease after year 00. Ths ndcates that the Swedsh goal of cuttng the proporton of people absent owng to llness n half s gong n the rght drecton.
Innehållsförtecknng Abstract... Innehållsförtecknng...3 Inlednng...4. Bakgrund... 4. Syfte... 5 Data...6. Undersöknngens datamateral... 6. Databehandlng... 6.3 Andra tänkbara varabler... 7 3 Metod...8 3. Varansanalys med obalanserad data... 8 3. Tolknng av samspel... 9 3.3 Styrkan av effekterna... 0 4 Resultat...5 4. Överskt över den beroende varabeln... 5 4. Varansanalys... 5 4.3 Samspelseffekter... 7 4.4 Sammanfattande resultat... 5 Slutdskusson...5 Sammanfattnng...6 Ltteraturförtecknng...7 Blaga...8 Sverges län... 8 Åldersgrupper... 8 Blaga Nya modellen...9 SAS-kommandon... 9 Resultat... 9 Blaga 3 Slutgltga modellen...33 SAS-kommandon... 33 Resultat... 33 3
Inlednng Enlgt Tjänstemännens Centralorgansaton, TCO, (003) fnns det dagsläget drygt 5, mljoner personer så kallad arbetsför ålder Sverge. Med detta menas personer som är mellan 0 och 64 år gamla. Av dessa går endast tre mljoner tll jobbet en vanlg dag. Det fnns naturlgtvs många anlednngar tll att ungefär 40 procent av arbetskraften befnner sg på annat håll, och några av orsakerna är bra orsaker. Exempel på bra egenskaper är studer, barnledghet och semester. Bra egenskaper är de därför att de längden höjer vår välfärd. Det fnns däremot alldeles för många fall av dålga orsaker tll att man nte befnner sg arbetskraften. Sådana orsaker är sjukdom och arbetslöshet. Förutom att dessa dålga egenskaper leder tll personlgt ldande så är de det största hotet mot den svenska välfärden. I samhällsdebatten brukar det annars hävdas att det är en åldrande befolknng kombnaton med för få födda som utgör det värsta hotet mot vår välfärd. Men enlgt TCO är detta alltså nte sant. Det är med andra ord vktgt att v får ner dagens höga sjukskrvnngs- och förtdspensonerngstal. Tdgare undersöknngar har vsat på att en halverng av ohälsotalen skulle nnebära att bruttonatonalprodukten stger med mer än fem procent. Detta skulle alltså betyda att en halv mljon fler männskor arbetar och reda pengar 0 mljarder kronor om året. I början av 990-talet ökade arbetslösheten fyrfaldgt Sverge. Så gott som var tonde person förlorade stt arbete och det dröjde ett par år nnan upp emot hälften av dessa männskor httat tllbaka n på arbetsmarknaden. Denna omfattande rörelse n, ut och nom arbetsmarknaden påverkade nte bara den svenska befolknngens försörjnngsstuaton utan även arbetsplatserna anpassade sg tll den nya stuatonen. Arbetskraven ökade och mycket av den gamla tryggheten gck förlorad. Trolgtvs har dessa mljöombyten på arbetsplatserna mycket att göra med att folk sjukskrver sg mer och tll följd har v Sverge under de senaste åren sett en påfallande öknng av Sverges ohälsotal. (SCB 004:3). Enlgt Statstska Centralbyrån, SCB, (004:3) har de senaste årens ökade ohälsotal fört med sg en omfattande debatt, tll största del tll följd av de ökade kostnader ohälsotalen fört med sg. I början av år 003 påbörjade SCB ett stort projekt vars ändamål var att samordna statstken som beskrver sjukfrånvaro och ohälsa Sverge. I projektets sammanfattande rapport (SCB 004:3) beskrver man förhållanden som har analyserats men som bör studeras mera ngående. Ett av dessa förhållanden är skllnaden mellan männens och kvnnornas sjukskrvnngar. Generellt har man sett att andelen sjukskrvnngar är högre bland kvnnor än män. Detta gäller oavsett vlken närngsgren eller sektor de arbetar och oavsett vlken ålder de har. Fokus bör enlgt SCB läggas på förklarngar av skllnader och lkheter mellan kvnnors och mäns sjukskrvnngar.. Bakgrund Enlgt försäkrngskassan (005) har utbetalnngarna från socalförsäkrngen ökat sedan slutet av 990-talet. Detta beror tll största del på att fler och fler männskor är sjukskrvna och att sjukskrvnngsperoderna tenderar att bl allt längre. En person som är sjukskrven får sjukpennng eller rehablterngspennng under hela veckan eller del av veckan, beroende på hur mycket han eller hon bedöms orkar arbeta samt hur mycket han eller hon arbetar vanlga fall. Sjukpennngen och rehablterngspennngen ersätter alltså en del av nkomstförlusten orsakat av sjukdom. Av utbetalnngarna från sjukförsäkrngen, med andra ord utbetalnngarna av sjukpennng, rehablterngspennng och närståendepennng, utgjorde sjukpennngen 83 och 8 procent under åren 003 respektve 004. Rehablterngspennngen utgjorde däremot bara 7 4
respektve 6 procent av de totala utbetalnngarna samma år. En bra varabel att analysera sjukskrvnngarna efter bör alltså vara sjukpennngen.. Syfte När det kommer tll skllnader mellan andelen män och kvnnor som får sjukpennng har man med avseende på tdgare undersöknngar redan en klar bld av att kvnnor större utsträcknng tlldelas denna bdragstyp. Syftet med undersöknngen denna uppsats är att med hjälp av statstska metoder se efter vart dessa skllnader fnns och undersöka om det fnns samspel med andra faktorer. Då Sverge sedan år 00 haft tydlga mål att halvera ohälsotalen, ska v även undersöka om andelen som får sjukpennng har ökat eller mnskat med tden. För att få en bättre förståelse för hur stor betydelse varje analyserad faktor har för skllnaden tlldelad sjukpennng beräknas styrkan av effekten. Detta mått, tllsammans med sgnfkanta skllnader, ger oss en mera nformatv bld av hur stor vkt man ska lägga på de sgnfkanta skllnaderna... Avgränsnngar Studen begränsas tll att studera de varabler som försäkrngskassan har offentlggjord på sn hemsda med hänsyn tll sjukpennng. Tdpunkten för sjukpennngutbetalnngarna är år 000 tll och med 005. Undersöknngen görs med hjälp av varansanalys. 5
Data I detta avsntt presenteras datamateralet som undersöknngen bygger på samt hur materalet har behandlats. Avsnttet avslutas med en dskusson om andra tänkbara varabler.. Undersöknngens datamateral Undersöknngen är baserad på Försäkrngskassans statstk över utbetalda sjukpennngar från år 000 tll och med år 005. Statstken över sjukpennngar beskrvs Försäkrngskassans databas som antal personer som har fått sjukpennng under ett år. Datan är sn tur ndelad efter regon, ålder och kön. Regonerna utgörs av Sverges olka län (se blaga ). Åldersvarabeln är ndelad olka åldersgrupper. Den första åldergruppen är 0-4 år och ssta 60-64 år. Däremellan fnns alltså sju åldersgrupper, alla med samma klassbredd (se blaga ). För att få ett relatvt mått på antal utbetalda sjukpennngar, som gör det möjlgt att jämföra regonerna, beräknas ett mått som v valt att kalla Andel av befolknngen med sjukpennng fram. Andel av befolknngen med sjukpennng fås genom att ta antal personer som har fått sjukpennng under ett år och dvdera med. V har nu ett genomsnttlgt värde på antal utbetalda sjukpennngar per månad. Denna sffra dvderas sn tur med det totala antalet nvånare för tllhörande kön, åldersgrupp och län. Tll exempel så hade kvnnor åldern 0-4 år, under år 000, Stockolms län, totalt 0984 stycken utbetalda sjukpennngar. Detta blr genomsntt 95,33 per månad. Antalet dvderas med 54446, som alltså är det totala antalet kvnnor åldern 0-4 som var bosatta Stockholms län under år 000. Slutlgen får v alltså fram att genomsntt,68 procent av kvnnorna fck sjukpennng varje månad. Samma beräknngar görs för alla län, åldersgrupper, kön och årtal. Sammanlagd blr det 68 observatoner.. Databehandlng För att datan ska kunna analyseras är det nödvändgt att koda om vssa varabler. I följande delavsntt tar v upp hur de olka förklarande varablerna på bästa sätt transformeras... Kön Kön är en så kallad kvaltatv varabel. Detta nnebär alltså att kön är en varabel med ckenumerska värden. Oftast när man analyserar kön kodar man om varabeln tll en 0/-varabel. Detta betyder alltså att värdet på de ndvder som är av kvnnlgt kön blr och värdet på de ndvder som är av manlgt kön kodas tll 0... Regon Varabeln regon har olka nvåer (län). Inkluderas alla analysen skulle v trolgtvs få problem med kollneartet. V blr alltså tvungna att defnera om varabeln regon på ett sådant sätt som ger oss mndre nvåer (regoner) att jämföra. SCB delar upp Sverges län tre olka länsregoner (se blaga ). Använder v oss stället av dessa får v följande varabler; Länsregon = Länsregon = Länsregon 3 = 3 6
En annan anlednng som stödjer vår nya regonsndelnng är att de slutgltga resultaten blr mera lättolkade. Det är lättare att dra godtagbara slutsatser från en jämförelse av tre olka grupper än med olka grupper...3 Ålder Ålder är en så kallad ordnalskala. Det fnns med andra ord en naturlg rangordnng mellan nvåerna. Den första nvån, 0-4 år, är mnst (yngst) och den ssta nvån, 60-64 år, är störst (äldst). V kan välja en kodnng där = 0-4 år, = 5-9 år och så vdare. En fördel med denna numerska omkodnng är att nvåerna kommer rätt ordnng tabeller och dagram...4 Årtal Eftersom årtal är en kvanttatv varabel behöver denna alltså nte kodas om. V har sex olka årtal, år 000, 00, 00, 003, 004 och 005..3 Andra tänkbara varabler Syftet med detta delavsntt är att ge läsaren tps om andra, mera ngående, ntressanta analyser. Begränsar man sg nte tll att använda de varabler som Försäkrngskassan offentlggjort på sn hemsda, beträffande sjukpennng, fnns det naturlgtvs en mängd andra ntressanta varabler att ttta på. Eftersom det nte var möjlgt att htta relevant data tll faktorerna, som nämns nedan, var det däremot nte möjlgt att genomföra godtagbara analyser. Några för oss ntressanta exempel vore storleken på företaget ndvden arbetar, vlken sektor man är verksam, vlka famljeförhållanden man har samt vlka motons-, mat- och rökvanor ndvden har. En annan ntressant nfallsvnkel vore att undersöka om det fnns genetska samband mellan sjukskrvnngarna. 7
3 Metod När man söker efter statstska samband mellan en beroende varabel och kvaltatva förklarngsvarabler används med fördel varansanalys. 3. Varansanalys med obalanserad data Det är nte ovanlgt att man har obalanserad data sna experment. I vårt fall har v olka replkat de olka länsregonerna. I länsregon har v fyra replkat, alltså fyra olka län (se blaga ), länsregon har v replkat och länsregon 3 har v sex olka replkat. Enlgt Montgomery (005) får man göra om formlerna som används vd balanserad varansanalys när man har så kallad obalanserad data. Med obalanserad data menas alltså att v har olka replkat för olka grupper. Anta att v har en tvåsdg varansanalysmodell med fxa effekter; yjk j ( τβ ) ε jk = µ + τ + β + + j Där antal observatoner den j:te cellen är n. Dessutom är n j = n antal observatoner den j :te raden (den :te nvån hos faktor A) och (den j:te nvån hos faktor B). Detta nnebär att n = a j n j = n = b j = är antal observatoner den j:te kolumnen a b n j = j = är det totala antalet observatoner. 3.. Hypoteser och testfunktoner V börjar alltd med att testa samspelseffekten. Fnns det en sgnfkant samspelseffekt, med andra ord att v förkastar nollhypotesen testet H H 0 : ( τβ ) : ( τβ ) j j = 0 för alla j 0 för mnst ett par j kan man genom en så kallad samspelsplott få en bld av och tolka samspelet mellan de två faktorerna. Samspelsplottar beskrvs vdare delavsntt 3.. Fnns det nget sgnfkant samspel är det möjlgt att analysera de två faktorerna var för sg. Detta görs med följande test. H H 0 : τ = 0 för alla : τ 0 för mnst ett H H 0 : β = 0 för alla j j j : β 0 för mnst ett j Testfunktonerna för de tre olka testen blr tur och ordnng; 8
MS MS AB A F =, F = och F = E MS MS E MS MS B E Där alltså det första testet syftar tll att testa samspelet, det andra tll att testa skllnader hos faktor A s grupper och slutlgen det ssta testet ämnar analysera skllnader hos faktor B s grupper. Det som skljer obalanserad data från balanserad data är sättet man beräknar fram kvadratsummorna på. Med obalanserad data fås kvadratsummorna enlgt; SS A a y = n =... y... N SS B b y. = j = n. j. j y... N SS AB a b y a b = j. y y... j n j n = = =. j = n. j. j + y... N SS TOT a b n = = j = k = y jk y... N SS E = SS T SS A SS B SS AB Med hjälp av kvadratsummorna tas medelkvadratsummorna fram, vlka alltså utgör nämnare och täljare testfunktonerna. De olka faktorerna varansanalys har antngen fxa effekter eller stokastska effekter. Med fxa effekter menas att nvåerna på en faktor nte är valda slumpmässgt, utan undersöknngen täcker helt enkelt alla de nvåer som är ntressanta. Säg stället att man har femton olka nvåer på en faktor och nte har råd (eller td) att undersöka alla. Det är då möjlgt att slumpmässgt välja ut, tll exempel, 3 nvåer och analysera skllnader mellan dessa. I ett sådant fall är effekterna stokastska. Testfunktonerna ovan är alla resultat av en analys där alla effekterna är fxa. Anlednngen tll att testfunktoner med stokastska effekter nte presenteras är att det är rrelevant för denna undersöknng, där ju alla effekterna är fxa. Inga slumpmässga urval av nvåer har nämlgen gjorts. 3. Tolknng av samspel Samspelsplottar är fgurer över nteraktonen mellan två faktorer. En samspelsplott vsar medelvärdena hos en faktors olka nvåer när den andra faktorns nvåer hålls konstant. Ett samspel mellan två faktorer betyder att reaktonen från en faktornvå beror på nvåerna hos den andra faktorn. Grafskt ses detta när lnjerna samspelsplotten korsar varandra eller går sär. Parallella lnjer ndkerar däremot att nget samspel verkar fnnas mellan faktorerna. 9
I fgur och ser v exempel på samspelsplottar. I den första fguren fnns nga ndkatoner på samspel, medan v fgur tydlgt kan se samspel. y j. y j. A B C B C A 3 4 Fgur : Samspelsplot utan samspelseffekter 3 4 Fgur : Samspelsplot med samspelseffekter 3.3 Styrkan av effekterna När man ett statstskt experment har funnt skllnader mellan olka gruppers medelvärden ndkerar detta på att ett samband fnns mellan den beroende och de oberoende varablerna. I varansanalys hör man, detta sammanhang, ofta termen effekt. Effekten är en återspeglng av dessa skllnaden mellan populatonernas medelvärden. Enlgt Hays (974) är ett resultat som vsar på både sgnfkanta skllnader mellan grupper och en relatv hög skattnng av effekternas styrka mycket mera nformatvt än enbart de sgnfkanta skllnaderna. För att på bästa sätt få en bld av vad som menas med effekternas styrka och hur de uppskattas, börjar v med att förklara utfrån ensdg varansanalys för att sedan gå n på mera komplcerade modeller. 3.3. Ensdg varansanalys I en analys där man har en oberoende varabel med a olka behandlngar och där varje behandlng utförs n gånger används följande modell: y j =,,..., a = µ + τ + εj j =,,..., n 0
Effekten för behandlng (grupp) defneras enlgt Hays (974) som skllnaden mellan den :te gruppens medelvärde µ och populatonens medelvärde µ. Alltså; τ = µ µ där τˆ = x. Om ngen effekt fnns är τ = 0 för varje grupp. Detta är ekvvalent med att skrva µ µ =... = µ = µ = a. Det är naturlgtvs ntressant att nte bara htta skllnader mellan olka grupper, utan också få en dé om hur stor styrkan på sambandet mellan beroende och oberoende varabler dessa sgnfkanta skllnader representerar. Enlgt Hays (974) kan man för detta ändamål använda ndexet η (eta kvadrat), som kallas för proportonen av varansen Y som förklaras av varabeln X. När det kommer tll varansanalys utökar man η så att den förklarar samma sak, fast nu med avseende på att den oberoende varabeln har olka grupper, eller nvåer, och alltså nte är kontnuerlg. V vll med andra ord att η representerar en procentuell förändrng (mnsknng) varatonen hos Y som ges av att man vet att en observaton tllhör en oberoende varabelkategor, alltså X, X,... eller X a. x X Ett exakt mått på η är; η a τ p( σ Y σ ε = = = a σ Y σ ε + τ = X ) p( X ) η symbolserar alltså hur mycket det betyder att veta tll vlken grupp X en observaton tllhör, när det kommer tll förmågan att förutspå värdet på den beroende varabeln Y. I ett stckprov kan v skatta η genom att använda oss av: E( MSB) = σ + ε E( MSW ) = σ ε a = n τ a Om n p X ( ) = kan man grovt skatta η enlgt: N ˆ η = SSB ( a ) MSW SST + MSW Formeln kan också skrvas om som:
F ˆ η = ν + + F ν Där F = MSB när H förkastas ( : =0 ) och MSW 0 H0 η ν = antal frhetsgrader nämnaren och ν = antal frhetsgrader täljaren. När H förkastas kommer F att följa en cke-central (noncentral) F-fördelnng med 0 parametrarna ν, ν och δ. Man kan uttrycka väntevärdet för denna ν δ E ( F ) = + ν ν F -fördelnng som: Där δ = a τ p( x ) = = σ a = nτ Nσ Detta nnebär att v kan skrva om skattnngen av η tll: δ ˆ η = N + δ Om F byts ut mot stckprovets MSB MSW blr skattnngen av η : ( ν ) F ν ˆ η = ν + ( ν ) F + ν ν Det är vktgt att påpeka att ndexet η nte alltd är helt tllfredsställande. Största anlednngen tll detta kommer sg av att när man skattar η med hjälp av en cke-central F-fördelnng ( F - fördelnngen) kan man bland få negatva värden på η 0. Skulle v få ett negatvt värde sätts η således lka med noll. η, vlket nte är möjlgt praktken då Om η -värdet är lka med 0,089 tolkas det som att v sänker osäkerheten Y med 8,9 % om v vet tll vlken grupp en observaton tllhör. 3.3. Tvåsdg varansanalys Modellen för en tvåsdg varansanalys ser ut enlgt följande;
yjk j ( τβ ) εjk = µ + τ + β + + j Där alltså τ µ µ β = µ µ = j j och. Termen ( ) j två oberoende varablerna. Enlgt Wner (97) defneras parametern På samma sätt fås; b τβ symbolserar samspelseffekten mellan de a = θ = τ β j = θ = β och b Eftersom varanskomponenterna defneras som; a τ kan v skrva om, och tll; θ τ θ β β j τ a a b = j = θ = τβ = j = σ τ =, σ β = och a b θ τβ b σ τβ ( τβ ) ab = a j b = j = θ τ ( τβ ) j ( a )( b ) enlgt; Skattnngarna av θ τ På samma sätt blr; a b =, θ β σ β θ τ a σ τ blr; θ ˆ τ = ( )( ) a b = och θ τβ = σ τβ b ab ( )( MSA MSE) a ( a )( FA ) MSE = npq npq ( b )( FB ) MSE ˆ θ β = och ˆ θ npq τβ ( a )( b )( FAB ) MSE = npq För att sedan beräkna hur mycket varatonen den förklarande varabeln som förklaras av de olka faktorerna A, B och dess samspel AB beräknas η -värdena enlgt; θτ ητ = θ + θ + θ + σ τ β τβ ε 3
Skattnngen ges av; ˆ η τ = På samma sätt blr alltså; och ˆ β η = ˆ τβ η = ( a )( FA ) ( a )( F ) + ( b )( F ) + ( a )( b )( F ) + npq A B ( b )( FB ) ( a )( F ) + ( b )( F ) + ( a )( b )( F ) + npq A B ( a )( b )( FAB ) ( a )( F ) + ( b )( F ) + ( a )( b )( F ) + npq A B I en modell av högre ordnng, säg en tresdg varansanalysmodell eller en fyrsdg varansanalysmodell, kan η, för de olka faktorerna och samspelen, skattas analogt. AB AB AB 4
4 Resultat I tdgare avsntt nämndes att varansanalys var ett bra analysverktyg när man söker efter statstska samband mellan en beroende varabel och kvaltatva förklarngsvarabler. Eftersom så är fallet denna uppsats använder v med fördel varansanalys. Den modell som bäst passar vår data är en fyrsdg varansanalys med fxa effekter. Modellen som följer av de olka databehandlngarna blr följande; y jklm = µ + τ + β + γ + δ + ( τγδ ) + ( βγδ ) + ( τβγδ ) kl j k jkl l ( τβ ) + ( τγ ) + ( βγ ) + ( τβγ ) + ( τδ ) + ( βδ ) + ( τβδ ) + ( γδ ) jkl j + ε jkllm k jk =,,..., a j =,,..., b k =,,..., c l =,,..., d m =,,..., n h jk l jl jl kl + Där y jklm utgör de olka observatonernas Andel av befolknngen med sjukpennng. a = 9 (no olka åldersgrupper), b = 6 (sex olka år), c = (de olka könen), d = 3 (de tre olka länsregonerna) och eftersom vår data är obalanserad symbolserar nh de olka replkaten de olka länsregonerna. I blaga ser v att länsregon har v 4 replkat, vlket alltså nnebär att n = 4. Länsregon som har hela replkat gör att n = och länsregon 3 med sna 6 replkat ger n 3 = 6. 4. Överskt över den beroende varabeln Innan v börjar med analysen är det ntressant att skaffa sg en bld av hur Andel av befolknngen med sjukpennng ser ut. I tabell ges en sammanfattnng av varabeln. V kan utläsa att genomsntt 5,8 procent av befolknngen mellan 0 och 64 år får sjukpennng. V ser också att skllnaden mellan maxmum och mnmum är relatvt stor. Descrptve Statstcs Andel av befolknngen som får sjukpennng Vald N (lstwse) N Mnmum Maxmum Mean Std. Devaton 68,003,895,05789,096675 68 Tabell : Överskt över den beroende varabeln 4. Varansanalys Tabell vsar resultatet från den fyrsdga varansanalysen med fxa effekter. V ser att många av samspelen har höga p-värden och alltså kan exkluderas från modellen. 5
Tests of Between-Subjects Effects Dependent Varable: Andel av befolknngen med sjukpennng Source Corrected Model Intercept Länsregon Årtal Kön Ålder Länsregon * Årtal Länsregon * Kön Årtal* Kön Länsregon * Årtal* Kön Länsregon * Ålder Årtal * Ålder Länsregon * Årtal * Ålder Kön * Ålder Länsregon * Kön * Ålder Årtal * Kön * Ålder Länsregon *Årtal * Kön *Ålder Error Total Corrected Total Type III Sum Partal Eta of Squares df Mean Square F Sg. Squared,879 a 33 5,88E-03 97,553,000,94 6,877 6,877 5304,7,000,983,08 5,4E-0 908,8,000,483 6,358E-0 5,7E-0 3,0,000,354,55,55 96,44,000,87,89 8, 866,675,000,885,994E-03 0,994E-04 3,34,000,07,403E-0,0E-0 0,447,000,7 5,E-03 5,044E-03 7,506,000,043,749E-04 0,749E-05,46,95,00,879E-0 6,75E-03 9,694,000,39,04E-0 40,60E-04 4,36,000,08,76E-03 80,03E-05,369,000,05 6,90E-0 8 8,68E-03 44,65,000,373 5,567E-03 6 3,480E-04 5,834,000,046,998E-03 40 4,995E-05,838,755,07 7,5E-04 80 9,403E-06,58,000,006,6 944 5,964E-05 9,596 68,995 67 a. R Squared =,94 (Adjusted R Squared =,93) Tabell : Varansanalys av den ursprunglga modellen. För att således få en bättre och enklare modell tas dessa osgnfkanta parametrar bort en efter en. V börjar med att ta bort fyrfaktorsamspelet och fortsätter därefter tlls dess att alla parametrarna är sgnfkanta. Detta leder tll att vår nya modell blr. y jklm = µ + τ + β + γ ( τγδ ) kl + ε j jklm k + δ + =,,..., a j =,,..., b k =,,..., c l =,,..., d m =,,..., n l ( τβ ) + ( τγ ) + ( βγ ) + ( τδ ) + ( βδ ) + ( γδ ) h j k jk l jl kl + I modellen har v sex sgnfkanta tvåfaktorssamspel och ett sgnfkant trefaktorssamspel. I tabell 3 nedan redovsas resultatet från varansanalysen SPSS och blaga httas resultaten från V har valt att döpa denna modell tll nya modellen för att senare uppsatsen nte blanda hop den med den slutgltga modellen. 6
Tukeys test SAS. Anlednngen tll att båda resultaten fnns redovsade är att SPSS ger en bra sammanfattande bld av analysen medan SAS redovsar skllnaderna mellan de olka grupperna mera ngående. Tests of Between-Subjects Effects Dependent Varable: Andel av befolknngen med sjukpennng Source Corrected Model Intercept Ålder Årtal Kön Länsregon Årtal * Ålder Kön * Ålder Årtal * Kön Länsregon * Ålder Länsregon * År Länsregon * Kön Länsregon * Kön * Ålder Error Total Corrected Total Type III Sum Partal Eta of Squares df Mean Square F Sg. Squared,875 a 3,659E-0 95,976,000,939 6,877 6,877 700,7,000,983,89 8, 986,40,000,88 6,358E-0 5,7E-0 6,877,000,345,55,55 9855,50,000,8,08 5,4E-0 967,06,000,473,3E-0 40 3,078E-04 5,49,000,093 6,90E-0 8 8,68E-03 53,99,000,364 5,704E-03 5,4E-03 0,35,000,045,879E-0 6,75E-03 0,957,000,35,994E-03 0,994E-04 3,557,000,06,403E-0,0E-0 4,368,000,66 5,567E-03 6 3,480E-04 6,08,000,044, 54 5,605E-05 9,596 68,995 67 a. R Squared =,939 (Adjusted R Squared =,936) Tabell 3: Varansanalys av den nya modellen 4.3 Samspelseffekter Detta delavsntt syftar tll att förklara de olka samspelseffekterna. Genom så kallade samspelsplottar är det möjlgt att få en bld av samspelen som gör det lättare att tolka nteraktonen. Varje samspel analyseras var för sg nedanstående avsntt. 4.3. Samspelet mellan ålder och årtal I fgur 3 ser v den första av våra samspelsplottar. Här ser v tydlgt att desto äldre man är, desto större andel av befolknngen får sjukpennng. Ett undantag är emellertd den äldsta åldersgruppen som alltd bara har den tredje största andelen med sjukpennng. Något större samspel ser v egentlgen nte från fguren. Personer åldersgrupp har alltd mnst andel som får sjukpennng och åldersgrupp 8 har alltd högst andel med sjukpennng, oavsett vlket år v analyserar. Ska man vara petg ser v däremot ndkatoner på att skllnaden mellan åldersgrupperna verkar mnska med åren och då framförallt för de äldre åldersgrupperna. η -värdet säger oss att varatonen Andel av befolknngen med sjukpennng endast tll 9,3 procent (se tabell 3) beror på samspelet mellan ålder och årtal. Detta kombnaton med att v nte ser tydlgare tendenser tll korsade lnjer gör att v väljer att bortse från det sgnfkanta samspelet. 7
, Ålder,0 0-4 år 5-9 år,08 30-34 år Medelvärde,06,04 35-39 år 40-44 år 45-49 år,0 50-54 år 55-59 år 0,00 000 00 00 003 004 005 60-64 år Årtal Fgur 3: Samspelsplot mellan ålder och årtal 4.3. Samspelet mellan ålder och kön Fgur 4 vsar på ett tydlgt samspel mellan kön och ålder. Först ser v att kvnnor alltd har högre andel som får sjukpennng oavsett vlken åldersgrupp v undersöker. Vad som skljer sg är att åldergrupp 9 (alltså den äldsta) för män är den åldersgruppen som har den näst högsta andelen med sjukpennng, medan samma åldersgrupp lgger på sjätteplats för kvnnor. Kvnnorna åldern 35-39 år tlldelas även tll större del sjukpennng än vad kvnnor ålders 40-44 år och 60-64 år gör, vlket nte är fallet för männen. Även η -värdet är relatvt högt. 36,4 procent av varatonen Andel av befolknngen med sjukpennng kan förklaras av detta samspel., Ålder,0,08 0-4 år 5-9 år 30-34 år Medelvärde,06,04 35-39 år 40-44 år 45-49 år,0 50-54 år 55-59 år 0,00 Man Kvnna 60-64 år Kön Fgur 4: Samspelsplot mellan kön och ålder 8
4.3.3 Samspelet mellan årtal och kön Samspelet mellan kön och årtal verkar, med hänsyn tll fgur 5, nte specellt stort. V kan tydlgt se att kvnnor alla åren har haft högre andel som fått sjukpennng än männen. Då nga lnjer korsar varandra, vlket ju skulle ndkera på ett samspel, och det faktumet att η -värdet är 4,5 procent gör att v kan bortse fram detta sgnfkanta samspel.,09,08,07 Årtal Medelvärde,06,05 000 00 00,04 003 004,03 Man Kvnna 005 Kön Fgur 5: Samspelsplot mellan årtal och kön 4.3.4 Samspelet mellan ålder och länsregon Länsregon har alltd högst Andel av befolknngen med sjukpennng, oavsett vlken ålder som prövas. Länsregon 3 har alltd lägst. Med andra ord tlldelas det en större andel sjukpennng tll personer som bor den norra delen av Sverge, än vad som tlldelas de sydlgare delarna. Utfrån fgur 6 kan v se att två lnjer korsas en gång. Det är därför tydlgt att det fnns ett samspel mellan länsregon och och åldersgrupperna 4 och 5. I länsregon tlldelas alltså ndvder åldern 35-39 år procentuellt sett mera sjukpennng än vad som ges ndvder åldern 40-44 år. Utöver detta samspel är lnjerna stort sett parallella. η -värdet, som är 3,5 procent är relatvt högt och v väljer därför att nte bortse från detta samspel. 9
, Ålder,0,08 0-4 år 5-9 år 30-34 år Medelvärde,06,04 35-39 år 40-44 år 45-49 år,0 50-54 år 55-59 år 0,00 3 60-64 år Länsregon Fgur 6: Samspelsplot mellan ålder och länsregon 4.3.5 Samspelet mellan årtal och länsregon Endast,6 procent av varatonen Andel av befolknngen med sjukpennng kan förklaras av samspelet mellan årtal och länsregon. Fgur 7 antyder också att lnjerna är någorlunda parallella. Detta medför att v väljer att bortse från detta samspel.,09,08 Årtal Medelvärde,07,06 000 00 00,05 003 004,04 3 005 Länsregon Fgur 7: Samspelsplot mellan årtal och länsregon 4.3.6 Samspelet mellan kön och länsregon Inte heller här ser v att lnjerna korsar varandra. Däremot vsar fgur 8 på att skllnaderna mellan regonerna är mycket större för kvnnorna är för männen, vlket även det ndkerar på ett samspel. η -värdet är 6,6 procent och F-värdet är högt (4,368). Ett högt F-värde tyder på att samspelseffekterna är stora. V kan alltså nte bortse från detta samspel. 0
,0,09,08 Medelvärde,07,06,05 Länsregon,04,03 Man Kvnna 3 Kön Fgur 8: Samspelsplot mellan länsregon och kön 4.3.7 Samspelet mellan ålder, kön och länsregon I Fgur 9 ser v nga tecken på samspel, då alla lnjerna verkar parallella. Ett samspel går däremot att utläsa från fgur 0, men då endast 4,4 procent av varatonen Andel av befolknngen med sjukpennng kan förklaras av samspelet och det faktumet att F-värdet är relatv lågt gör att v väljer att bortse från detta. Ett bättre sätt att avblda ett trefaktorsamspel vore med en tredmensonell graf, men på grund av brstande kunskaper kunde en sådan graf nte redovsas.,0 Kön = Man Ålder 0-4 år,08 5-9 år 30-34 år Medelvärde,06,04 35-39 år 40-44 år 45-49 år,0 50-54 år 55-59 år 0,00 3 60-64 år Länsregon Fgur 9: Samspelsplot mellan ålder, länsregon och män
,4, Kön = Kvnna Ålder 0-4 år 5-9 år,0 30-34 år Medlevärde,08,06 35-39 år 40-44 år 45-49 år,04 50-54 år,0 55-59 år 0,00 3 60-64 år Länsregon Fgur 0: Samspelsplot mellan ålder, länsregon och kvnnor 4.4 Sammanfattande resultat Eftersom många av samspelen nte var specellt betydande är det nu möjlgt att förenkla vår modell ytterlgare. Från ovanstående delavsntt framgck det att endast tre samspel var väsentlga. Samspelet mellan kön och ålder, mellan kön och regon och slutlgen mellan regon och ålder. Inkluderas endast dessa tllsammans med de ensklda faktorerna blr vår slutgltga modell; y jklm = µ + τ + β + γ j k + δ + l ( τγ ) + ( τδ ) + ( γδ ) k l kl + ε jklm =,,..., a j =,,..., b k =,,..., c l =,,..., d m =,,..., n h I tabell 4 ser v resultatet av en varansanalys på vår slutgltga modell.
Tests of Between-Subjects Effects Dependent Varable: Andel av befolknngen med sjukpennng Source Corrected Model Intercept Ålder Årtal Kön Länsregon Kön * Ålder Länsregon * Ålder Länsregon * Kön Error Total Corrected Total Type III Sum Partal Eta of Squares df Mean Square F Sg. Squared,849 a 4 4,40E-0 669,50,000,97 6,877 6,877 04588,7,000,979,89 8, 693,94,000,859 6,967E-0 5,393E-0,9,000,33,55,55 8400,78,000,79,08 5,4E-0 84,350,000,46 7,6E-0 8 8,895E-03 35,78,000,37,879E-0 6,75E-03 7,864,000,4,403E-0,0E-0 8,75,000,4,46 5 6,576E-05 9,596 68,995 67 a. R Squared =,97 (Adjusted R Squared =,95) Tabell 4: Varansanalys med den slutgltga modellen I blaga 3 redovsas resultaten från Tukeys test. Jämför v denna modell med modellen som v kallade nya modellen ser v att den justerade förklarngsgraden bara har sjunkt från 0,936 tll 0,95. Eftersom faktorn Årtal nte fnns med något av de tre samspelen är det alltså möjlgt att analysera denna separat. Eftersom η -värdet är 3,3 procent förklarar alltså varabeln Årtal 3.3 procent av den totala varatonen Andel av befolknngen med sjukpennng. I blaga 3 kan v med hjälp av Tukeys test se att det fnns sgnfkanta skllnader mellan alla åren förutom mellan år 00 och år 003. Från och med år 00 tll år 005 fnns sgnfkanta skllnader mellan alla åren. V ser även att Andel av befolknngen med sjukpennng blr allt lägre. Ifrån samspelsplottarna ovanstående delavsntt 4.3., 4.3.4 och 4.3.6 ser v att det fnns tydlga samspel mellan kön och länsregon, mellan kön och ålder samt mellan ålder och länsregon. Kombnaton kvnnor och länsregon ger tll exempel en hög andel som får sjukpennng. Ser man på samspelet mellan kön och ålder, vsar det sg att skllnaderna mellan män och kvnnor nte är lka stora för ndvder åldersgruppen 0-4 år och 60-64 år, som hos de övrga åldersgrupperna. Dessa åldersgrupper ser ut att ha någorlunda lka skllnader. Störst skllnad fnns dock hos åldersgruppen 35-39 år, där andelen med sjukskrvnng ungefär är dubbelt så stor för kvnnorna. I fgur 6 åskådlggjordes nteraktonen mellan ålder och länsregon. Det vsade sg där att ndvder åldern 35-39 år som är bosatta länsregon tll större del tlldelas sjukpennng än ndvder åldern 40-44. Inga tendenser tll samspel kunde däremot ses mellan de olka åldersgrupperna och länsregon och. Detta eftersom lnjerna samspelsplotten var nästntll parallella. Ifrån tabell 4 kan v se att 85,9 procent av varatonen Andel av befolknngen med sjukpennng kan förklaras av de olka åldersgrupperna. Lte av denna varaton kommer däremot också från kön samt lte från länsregon. 77 procent av varatonen Andel av befolknngen med sjukpennng kan förklaras av vlket kön en ndvd tllhör. På samma sätt beror alltså lte av 3
denna varaton på vlken länsregon en ndvd bor samt vlken ålder han/hon har. Länsregon förklarar 4,6 procent av varatonen den beroende varabeln, men denna andel måste precs som ovan tolkas som om att en del av varatonen beror på kön och ålder. 4
5 Slutdskusson Att det fnns skllnader mellan hur stor andel av männen och kvnnorna som får sjukpennng hade v, med hänsyn tll det nledande avsnttet, redan en klar bld av. Däremot var det ntressant att se hur stora dessa skllnader egentlgen är. Förutom skllnader mellan könen lyckades v denna uppsats även vsa på att det fnns skllnader mellan olka regoner, olka åldrar och olka årtal. Att äldre männskor tll större grad tlldelas sjukpennng kommer ju nte som någon överrasknng, men att de personer som arbetar sna ssta år nnan pensonerngen faktskt har en längre andel som tlldelas sjukpennng än de som är något yngre var förbluffande. Tukeys test vsade på sgnfkanta skllnader mellan alla åldersgrupperna (se blaga 3), men v måste som sagt ta denna sgnfkans med en nypa salt eftersom lte av varatonen beror på vlket kön en ndvd har samt vlken del av Sverge denne bor. Samspelet mellan ålder och kön gav oss en bld av att skllnaderna mellan könens Andel av befolknngen med sjukpennng var mndre för den äldsta och den yngsta åldersgruppen, samtdgt som skllnaderna var som allra störst för de mellersta åldersgrupperna. De regonala skllnaderna var överraskande. Vad som gör att svenskar som är bosatta längre norrut tll större del tlldelas sjukpennng är svårt att avgöra. Kanske kan det bero på att man har en annan typ av sysselsättnng som är mera belastande och stressande och därav har en högre andel sjukskrvnngar. Detta är däremot bara spekulatoner. Ifrån blaga 3 kan v utläsa att Tukeys test vsar på sgnfkanta skllnader mellan alla tre länsregonerna. Mnst skllnad fnns mellan länsregon och 3. Störst skllnad ses mellan den nordlgaste och den sydlgaste länsregonen. Precs som för skllnaderna mellan åldersgrupperna ska v alltså nte lägga för stor vkt vd denna sgnfkans eftersom en del av varatonen beror på de könsmässga och åldersmässga skllnaderna. Samspelet mellan länsregon och kön gjorde det möjlgt att se att kvnnor norra delarna av landet har en högre andel som tlldelas sjukpennng än övrga Sverge. Ytterlgare en sak som var förvånande är att samspelet mellan ålder och länsregon pekade på att det fnns skllnader mellan hur stor andel som tlldelas sjukpennng de olka åldersgrupperna de olka länsregonerna. Hur det kan komma sg att en yngre åldersgrupp, 35-39 år, länsregon får procentuellt sett mera sjukpennng än en något äldre åldersgrupp, 40-44 år, är svårtolkat. I de två andra länsregonerna förekommer nämlgen nte detta särdrag. Även fast det nte heller är möjlgt att analysera faktorn kön för sg själv, på grund av samspelseffekterna mellan kön och åldersgrupper samt kön och länsregon, pekar mycket av undersöknngen på att det fnns stora skllnader mellan könen. Fastän η = 0,79 för varabeln kön och en del av denna varaton beror på varatonen de tre länsregonerna och de olka åldersgrupperna, tycks ändå mycket av varatonen bero på endast de könsmässga skllnaderna. Tttar man tll exempel en extra gång på de samspelsplottar som analyserar bland annat kön, ser v att lnjerna alltd är tlltagande. Detta betyder alltså att kvnnor alltd har högre andel utbetald sjukpennng än vad männen har. Att det fnns sgnfkanta skllnader mellan åren 000-005 har påvsats och v ser en tydlg neråtgående trend efter år 00. Undersöknngen vsar därmed att Sverges välfärdsmål, att halvera ohälsotalet, går åt rätt håll. 5
Sammanfattnng Enlgt TCO (003) är det värsta hotet mot Sverges välfärd att så många svenskar tll följd av sjukdom och arbetslöshet nte befnner sg arbetskraften. En halverng av det så kallade ohälsotalen skulle nnebära att bruttonatonalprodukten skulle stga med mer än fem procent. I reda pengar nnebär detta 0 mljarder kronor om året. SCB anser att skllnader mellan bland annat män och kvnnors sjukskrvnngar bör studeras mera ngående. Detta för att man ska skaffa sg en bättre bld av varför sjukskrvnngarna uppkommer. Ett bra sätt att studera Sverges sjukskrvnngar på är genom att ttta på vem som tlldelas sjukpennng. Syftet med denna uppsats är att se efter vart skllnaderna tlldelad sjukpennng fnns, samt att studera och försöka tolka eventuella samspel. För att få en bättre förståelse för hur mycket varje analyserad faktor har för betydelse för skllnaden tlldelad sjukpennng beräknas styrkan av effekten. Detta mått ( η ), tllsammans med sgnfkanta skllnader, ger oss en mera nformatv bld av hur stor vkt man ska lägga på de sgnfkanta skllnaderna. Det faktorer som förhållande tll, vad v valt att kalla, Andel av befolknngen med sjukpennng analyseras uppsatsen är ålder, kön, länsregon och td. Åldersvarabeln är ndelad 9 olka åldersgrupper, länsregonsvarabeln tre grupper och tden som analyseras är åren 000 tll och med 005. Anlednngen tll att en tdsvarabel också har tagt med är för att analysera om sjukskrvnngarna tenderar att sjunka med tden. Analysen görs med hjälp av en fyrsdg varansanalysmodell med fxa effekter. Undersöknngen börjar med att elmnera osgnfkanta samspelseffekter. Därefter analyseras vkten av de resterande sgnfkanta samspelen med hjälp av samspelsplottar och η -värdet. I en den slutlga modellen ser v att det fnns sgnfkanta samspel mellan kön och ålder, kön och länsregon samt mellan ålder och länsregon. Det fnns tll exempel en klar tendens tll att kvnnor norra Sverge högre grad tlldelas sjukpennng. Ser man på samspelet mellan kön och ålder, vsar det sg att skllnaderna mellan män och kvnnor nte är lka stora för ndvder åldersgruppen 0-4 år och 60-64 år. Däremellan är skllnaderna någorlunda lka. Störst är skllnaden däremot mellan könen när det kommer tll åldersgruppen 35-39 år, här är andelen med sjukskrvnng ungefär dubbelt så stor. Ytterlgare en slutsats v kunnat dra var att en yngre åldersgrupp, 35-39 år, länsregon procentuellt sett får mera sjukpennng än en något äldre åldersgrupp, 40-44 år. I de två andra länsregonerna förekommer däremot nte detta särdrag. Klara tendenser tll att Andel av befolknngen med sjukpennng sjunker med tden har httats. Detta tyder alltså på att Sverges mål att halvera ohälsotalen har lyckats bra under de senaste fyra åren. 6
Ltteraturförtecknng Hays, W.L., Statstcs for the socal scences, Holt, Rnehart and Wnston, London. 974. Marcouldes, G.A. & Hershberger, S.L., Multvarate Statstcal Methods, Lawrence Erlbaum Assocates, Inc., Mahwah, 997. Montgomery, D.C., Desgn and Analyss of Experments, John Wley & Sons, Inc., Danvers, 005. Wner, B.J., Statstcal prncples n expermental desgn, McGraw-Hll Kogakusha, LTD., Tokyo, 97. SCB, Sjukfrånvaro och ohälsa Sverge en belysnng utfrån SCB:s statstk, SCB-tryck, Örebro, 004:3 TCO, Ohälsan kräver akutgrupp, http://www.sf.se/epbrowser/dokumentarkv/press/mar- Anns%0artklar/Debart_SvD_0030408.pdf, 003-04-08 LO, ohälsans trappa, EO prnt AB, Stockholm, 004 Försäkrngskassan, Socalförsäkrngens omfattnng och fnanserng 003-006, AB Danagårds Grafska, 005 7
Blaga Sverges län Stockholms län länsregon Uppsala län länsregon Södermanlands län länsregon Östergötlands län länsregon Jönköpngs län länsregon 3 Kronobergs län länsregon 3 Kalmar län länsregon 3 Gotlands län länsregon 3 Bleknge län länsregon 3 Skåne län länsregon 3 Hallands län länsregon Västra Götalands län länsregon Värmlands län länsregon Örebro län länsregon Västmanlands län länsregon Dalarnas län länsregon Gävleborgs län länsregon Västernorrlands län länsregon Jämtlands län länsregon Västerbottens län länsregon Norrbottens län länsregon Åldersgrupper 0-4 år 5-9 år 30-34 år 35-39 år 40-44 år 45-49 år 50-54 år 55-59 år 60-64 år 8
Blaga Nya modellen SAS-kommandon OPTIONS NODATE NOCENTER; DATA SJUKPENNINGEN; INPUT Aldersgrupp Ar Kon ProcentMedSjukpennng Lansregon; CARDS; 000 0.068765 000 0.080904 000 0.060756... 9 005 0 0.0589436 ; PROC GLM; CLASS Aldersgrupp Ar Kon Lansregon; MODEL ProcentMedSjukpennng = Aldersgrupp Ar Kon Lansregon Aldersgrupp*Ar Aldersgrupp*Kon Ar*Kon Aldersgrupp*Lansregon Ar*Lansregon Kon*Lansregon Aldersgrupp*Kon*Lansregon; MEANS Kon Ar Lansregon Aldersgrupp / TUKEY; MANOVA H=Aldersgrupp Ar Kon Lansregon Aldersgrupp*Ar Aldersgrupp*Kon Ar*Kon Aldersgrupp*Lansregon Ar*Lansregon Kon*Lansregon Aldersgrupp*Kon*Lansregon / PRINTH PRINTE; RUN; Resultat The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 54 Error Mean Square 0.000056 Crtcal Value of Studentzed Range.77337 Mnmum Sgnfcant Dfference 0.0006 Means wth the same letter are not sgnfcantly dfferent. T u k e y 9
G r o u p n g Mean N Kon A 0.07400 34 B 0.047806 34 0 he GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 54 Error Mean Square 0.000056 Crtcal Value of Studentzed Range 4.03377 Mnmum Sgnfcant Dfference 0.006 Means wth the same letter are not sgnfcantly dfferent. T u k e y G r o u p n g Mean N Ar A 0.0649073 378 00 B 0.066573 378 003 B B 0.06883 378 00 C 0.0556637 378 004 D 0.053865 378 000 30
E 0.0489673 378 005 The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate. Alpha 0.05 Error Degrees of Freedom 54 Error Mean Square 0.000056 Crtcal Value of Studentzed Range 3.3679 Comparsons sgnfcant at the 0.05 level are ndcated by ***. Dfference Lansregon Between Smultaneous 95% Comparson Means Confdence Lmts - 0.056074 0.04609 0.065939 *** - 3 0.0966 0.085705 0.00758 *** - -0.056074-0.065939-0.04609 *** - 3 0.0040538 0.003963 0.0049 *** 3 - -0.0966-0.00758-0.085705 *** 3 - -0.0040538-0.0049-0.003963 *** The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 54 Error Mean Square 0.000056 Crtcal Value of Studentzed Range 4.390 Mnmum Sgnfcant Dfference 0.00 Means wth the same letter are not sgnfcantly dfferent. T u k e y G r o 3
u p n g Mean N Aldersgrupp A 0.084983 5 8 B 0.077057 5 7 C 0.07467 5 9 D 0.0683403 5 6 E 0.065875 5 5 F 0.0587086 5 4 G 0.048053 5 3 H 0.033577 5 I 0.06975 5 3
Blaga 3 Slutgltga modellen SAS-kommandon OPTIONS NODATE NOCENTER; DATA SJUKPENNINGEN; INPUT Aldersgrupp Ar Kon ProcentMedSjukpennng Lansregon; CARDS; 000 0.068765 000 0.080904 000 0.060756... 9 005 0 0.0589436 ; PROC GLM; CLASS Aldersgrupp Ar Kon Lansregon; MODEL ProcentMedSjukpennng = Aldersgrupp Ar Kon Lansregon Aldersgrupp*Kon Aldersgrupp*Lansregon Kon*Lansregon; MEANS Kon Ar Lansregon Aldersgrupp / TUKEY; MANOVA H=Aldersgrupp Ar Kon Lansregon Aldersgrupp*Kon Aldersgrupp*Lansregon Kon*Lansregon / PRINTH PRINTE; RUN; Resultat The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 5 Error Mean Square 0.000066 Crtcal Value of Studentzed Range.7733 Mnmum Sgnfcant Dfference 0.0007 Means wth the same letter are not sgnfcantly dfferent. T u k e y G r o u 33
p n g Mean N Kon A 0.07400 34 B 0.047806 34 0 The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 5 Error Mean Square 0.000066 Crtcal Value of Studentzed Range 4.03365 Mnmum Sgnfcant Dfference 0.007 Means wth the same letter are not sgnfcantly dfferent. T u k e y G r o u p n g Mean N Ar A 0.0649073 378 00 B 0.066573 378 003 B B 0.06883 378 00 C 0.0556637 378 004 D 0.053865 378 000 E 0.0489673 378 005 The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng 34
NOTE: Ths test controls the Type I expermentwse error rate. Alpha 0.05 Error Degrees of Freedom 5 Error Mean Square 0.000066 Crtcal Value of Studentzed Range 3.367 Comparsons sgnfcant at the 0.05 level are ndcated by ***. Dfference Lansregon Between Smultaneous 95% Comparson Means Confdence Lmts - 0.056074 0.045389 0.066759 *** - 3 0.0966 0.084799 0.00844 *** - -0.056074-0.066759-0.045389 *** - 3 0.0040538 0.00350 0.004985 *** 3 - -0.0966-0.00844-0.084799 *** 3 - -0.0040538-0.004985-0.00350 *** The GLM Procedure Tukey's Studentzed Range (HSD) Test for ProcentMedSjukpennng NOTE: Ths test controls the Type I expermentwse error rate, but t generally has a hgher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 5 Error Mean Square 0.000066 Crtcal Value of Studentzed Range 4.39087 Mnmum Sgnfcant Dfference 0.00 Means wth the same letter are not sgnfcantly dfferent. T u k e y G r o u p n g Mean N Aldersgrupp A 0.084983 5 8 35
B 0.077057 5 7 C 0.07467 5 9 D 0.0683403 5 6 E 0.065875 5 5 F 0.0587086 5 4 G 0.048053 5 3 H 0.033577 5 I 0.06975 5 36