Replik till Åke Dahlerg

Relevanta dokument
Ger inte intensifierade arbetsförmedlingsåtgärder för äldre några sysselsättningseffekter?

Metoduppgift 4- PM. Inledning: Syfte och frågeställningar:

Utvärdering av samordningsförbundens verksamhet

Att utvärdera arbetsmarknadsprogram i Sverige: Rätt svar är viktigt, men vilken var nu frågan?

Vad vet vi om arbetsmarknadspolitikens insatser och effekter? Sara Martinson IFAU Mötesplats om försörjningsstöd 16 oktober 2016

Låt inte det bästa bli det godas fiende

Frågor för bedömning av utvärdering av projekt

Att utvärdera offentlig politik med registerdata

Utvärdering av försöksverksamheten för vissa nyanlända invandrare (FNI) - ett randomiserat experiment

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Ett alternativt program för äldre långtidsarbetslösa utvärdering av Arbetstorget för erfarna

Lycka till! Nämnden för omvårdnadsutbildningar Sjuksköterskeprogrammet 180hp. SJSD10, Sjuksköterskans profession och vetenskap I, 15 hp, Delkurs II

Ex post facto forskning Systematisk, empirisk undersökning. om rökning så cancer?

COACHING - SAMMANFATTNING

Reflektioner från Enheten Forskning och utvärdering. - Angående Rambölls slututvärdering av Ung komp.

Introduktion till kausala effekter

Anvisningar till rapporter i psykologi på B-nivå

Beteendevetenskaplig metod. Metodansats. För och nackdelar med de olika metoderna. Fyra huvudkrav på forskningen Forskningsetiska principer

Urval och insamling av kvantitativa data. SOGA50 16nov2016

Handisam. Beräkningsunderlag för undersökningspanel

Provmoment: Tentamen 3 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Profilering av sjukskrivna. Per Johansson Uppsala Universitet Nationalekonomi och UCLS, IFAU och ISF

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

för att komma fram till resultat och slutsatser

Trygghet i arbete sysselsättning och inkomst. Preliminära resultat från en enkätundersökning till anställda hösten 2010

LAURA LARSSON Utvärdering av ungdomsåtgärder*

SKILLSS. LSS verksamheter

RAPPORT 2019:14 Underlättar tillgång till a-kassa övergången mellan utbildning och arbete?

Beteendevetenskaplig metod

Några begrepp. Vad är statistik? Data. Grundläggande begrepp Olika slag av undersökningar

Utvärderingsforskning och administrativa utvärderingar av arbetsmarknadsutbildning

Introduktion Kritiskt förhållningssätt Olika typer av undersökningar

KENNETH CARLING & KATARINA RICHARDSON En jämförelse av arbetsmarknadsprogrammens effekt på anställningssannolikheten

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Forum jämlik stad Fler i arbete: Forskning och erfarenheter. Sara Martinsson Vad vet vi om. arbetsmarknadspolitikens insatser och effekter?

Men hur trovärdig är studien egentigen?

Vad är kännetecknande för en kvalitativ respektive kvantitativ forskningsansats? Para ihop rätt siffra med rätt ansats (17p)

Interna och externa coachningstjänster. en utvärdering av resultatet

Uppföljning av studerande på yrkesvux inom GR 2010

733G22: Statsvetenskaplig metod Sara Svensson METODUPPGIFT 3. Metod-PM

FORSKNINGSRAPPORT 2001:2

diskriminering av invandrare?

Hur gör de egentligen?

OBS! Vi har nya rutiner.

Att välja statistisk metod

ÖKAR DELTAGANDE I AKTIVITETSGARANTIN MÖJLIGHETEN TILL ARBETE?

Arbetsmarknads- och socialförvaltningens resultat av kund- och brukarundersökningen, KBU, år 2016

Checklista för systematiska litteraturstudier 3

Experimentell design. Kvasiexperimentell design. Sambandsstudier

Statistik 1 för biologer, logopeder och psykologer

Epidemiologisk studiedesign (Forskningsmetodik)

Klinisk forskningsmetodik. Olof Akre, läkare, forskare, Enheten för klinisk epidemiologi, KS

Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?

Samverkan utan gränser

Tryggare omställning ökad rörlighet ETT TRS-PROJEKT

Arbetsmarknadspolitik och sysselsättning - vad säger forskningen? Oskar Nordström Skans

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Metodologier Forskningsdesign

Den verkliga arbetslöshetens utveckling sedan 1996

Erica Schytt. Barnmorska Föreståndare för Centrum för klinisk forskning Dalarna Docent Karolinska Institutet Professor Høgskulen på Vestlandet

Arbetslöshetsförsäkringen kontroll och effektivitet

Förändring, evidens och lärande

Den gröna påsen i Linköpings kommun

tidskrift för politisk filosofi nr årgång 9

Forskningsprocessens olika faser

Exempel på gymnasiearbete inom ekonomiprogrammet juridik

Hur går en statistisk undersökning till?

Att följa upp och utvärdera arbetsmarknadspolitiska program

PETTER ASP. Uppsåtstäckning vid aberratio ictus replik på en replik NR 3

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Hur, när och till vad använder personer sin smarta telefon eller surfplatta? Personers medievanor på mobila enheter.

Evidens Vetenskap i äldrevården

Samhällsekonomisk utvärdering av utfallet for Enter Fredrik Hansen

Tentamen i psykologi

Studietyper, inferens och konfidensintervall

Hur stor är egentligen ungdomsarbetslösheten?

Working Paper Series

Nationalekonomernas oberoende en kommentar till Lars Jonung*

Tentamen: Vetenskapliga perspektiv på studie- och yrkesvägledning, 7,5hp distans (D1) & campus (T1), ht12

Vilket av följande alternativ är INTE ett sätt att kontrollera för möjliga ovidkommande gruppsskillnader i mellanpersonsdesign?

Välkomna! Närträff 9 februari Samordnareen. nyckelfunktion för att stärka utbildningens kvalitet

JAN EKBERG & DAN-OLOF ROOTH Är invandrare oprioriterade inom arbetsmarknadspolitiken?

UTVÄRDERING VANLIGA PROBLEM. Mats Fridell TYPER AV UTVÄRDERINGAR. (1) Utvärdering när projektet redan slutförts

Konfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta

Börja med resultatet om du vill designa en lyckad klinisk studie

Sammanfattning 2015:4

Datainsamling Hur gör man, och varför?

Översikt. Experimentell metodik. Mer exakt. Människan är en svart låda. Exempel. Vill visa orsakssamband. Sidan 1

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Nationell samling för unga utanför

Utvärdering enligt utvärderingsplan delrapport Äldre- och Handikappomsorgens Myndighetsavdelning

Seminarieredovisning om Bergers och Luckmanns Kunskapssociologi (GDK; TRTE11 ht 2008)

Effektutvärdering av politik

Det livslånga utanförskapet Långvarig arbetslöshet, funktionsnedsättningar och förtidspensioner bland unga. Li Jansson Maj 2011

Sammanfattning 2014:8

Tentamen Metod C vid Uppsala universitet, , kl

Vad är bra forskning?

Intervjumetodik. Fördjupad forskningsmetodik, allmän del, vt Mikael Nygård, Åbo Akademi

Kvantitativ strategi viktiga begrepp 3. Wieland Wermke

Unga möter (inte) Arbetsförmedlingen. Malin Sahlén Mars 2011

Transkript:

DEBATT Per Johansson och Sophie Langenskiöld Replik till Åke Dahlerg I förra numret av Arbetsmarknad & Arbetsliv framförde Åke Dahlberg kritik mot vår utvärdering av Arbetstorget för erfarna (Johansson & Langenskiöld 2008). Han avslutar sin artikel med att förespråka experiment eller en kombination mellan en ekonometrisk och en beteendevetenskaplig ansats (Dahlberg 2008 s 78). På detta allmänna plan har vi naturligtvis inga invändningar. Även om randomiserade experiment har sina nackdelar, så propagerar IFAU (Institutet för arbetsmarknadspolitisk utvärdering) oftast för experiment som utvärderingsmetod. Det finns heller ingen motsättning mellan en effektstudie och användandet av kvalitativa data. I själva verket berikar dessa ansatser varandra. Men i andra avseenden framstår Åke Dahlbergs kritik mot vår studie som grundlös och inkonsekvent. Innan vi bemöter Åke Dahlbergs sakkritik finns det dock anledning att reda ut begreppen lite grann. Vi börjar därför med att diskutera värdet av experiment i en utvärderingssituation. Om experiment som utvärderingsmetod Den stora fördelen med ett experiment är att vi vet varför en individ har fått del av en åtgärd. Detta medför att experiment i idealfallet ger resultat som är internt valida, det vill säga de visar på effekten för de deltagare som deltog i åtgärden (till exempel äldre långtidsarbetslösa i Stockholm). Att resultaten har intern validitet innebär dock inte att de med Per Johansson är professor i ekonometri, särskilt mikroekonomisk utvärderingsforskning vid nationalekonomi, Uppsala universitet och verksam vid Institutet för Arbets- som inte har extern validitet kan inte över- nödvändighet har extern validitet. Resultat marknadspolitisk Utvärdering (IFAU). per.johansson@ifau.uu.se föras till andra populationer (till exempel äldre långtidsarbetslösa i Sveg) än den som Sophie Langenskiöld är doktor i ekonomi faktiskt deltog i åtgärden. och adjungerad forskare vid Institutet för Detta är en idealbild av vad experiment Arbetsmarknadspolitisk Utvärdering (IFAU). sophie.langenskiöld@ifau.uu.se kan åstadkomma. I praktiska tillämpningar kan randomiserade studier vara förknippade med problem (se till exempel Heckman med flera 1999). Ibland kan både kontroll- och behandlingsgrupp vara kontaminerad; till exempel kan individer som ingått i kontrollgruppen fått del av en annan alternativ behandling. I vissa fall uppkommer även problem som har att 75

Per Johansson och Sophie Langenskiöld göra med att kontroll- och behandlingsgrupp har behandlats på olika sätt, även i andra avseenden än dem som har att göra med själva åtgärden. Dessutom är experiment inte alltid genomförbara, både av etiska skäl eller kostnadsskäl. Även om det är en god regel att verka för att genomföra randomiserade studier, tvingas utvärderare allt som oftast fundera på vilka alternativ som ger trovärdiga resultat. Alternativ till experiment Av flera skäl är det viktigt att fundera på hur en trovärdig utvärdering av ett program ska kunna genomföras innan programmet sjösätts i stället för efter (som i fallet med Arbetstorget för erfarna, AE). Det väsentliga är att beslutsfattare tänker igenom hur en åtgärd ska utvärderas innan man genomför åtgärden. Man kan tänka sig en mängd olika utvärderingsstrategier och vi ger två exempel nedan. 1. Med ett klart och tydligt regelsystem som avgör vem som får åtgärden och vem som inte får åtgärden blir självselektion eller selektion av handläggare ett mindre problem och åtgärden kan utvärderas på ett trovärdigt sätt med hjälp av statistiska metoder. Nedan ges tre konkreta exempel på designer. a. Sekventiellt introducera den nya åtgärden för olika kontor. b. Ge åtgärden deterministiskt till alla långtidsarbetslösa 55 år eller äldre men inte till några yngre än 55 år. c. Ge ett erbjudande om åtgärden till arbetslösa äldre än 55 år slumpmässigt vid olika arbetslöshetstider så länge de fortfarande är inskrivna som arbetslösa vid en arbetsförmedling. 2. Genomföra prospektiva studier. Detta innebär att man samlar in detaljerade uppgifter (till exempel via enkäter) om arbetslösa personers motivation, sökbeteende, hälsa et cetera innan införandet av åtgärden i fråga. Sedan samlar man in uppgifter vid ett senare tillfälle. Effektutvärderingen består då i att mäta förändringarna i dessa självrapporterade uppgifter för dem som gick in i åtgärden och ställa dem mot förändringarna i gruppen som inte deltog i åtgärden. Men i praktiken är det få beslutsfattare som tänker på utvärderingen innan de fattar beslut om att införa en åtgärd. I dessa fall får man förlita sig på retrospektivt insamlade data. Detta gör det svårare att utvärdera programåtgärder, vare sig informationen är insamlad via enkäter, intervjuer eller registerdata. Matchning som alternativ till experiment I de allra flesta utvärderingssituationer ställs utvärderaren inför faktum och har således bara retrospektiva data till sitt förfogande. En rimlig ansats är då att för- 76

Replik till Åke Dahlberg söka efterlikna en experimentsituation så långt som möjligt. Matchning är ett sätt att skapa en sådan situation. Ambitionen i en matchningsstudie är normalt att skatta en effekt som gäller för dem som faktiskt deltagit i åtgärden. Matchning är baserat på följande grundantagande: givet en uppsättning observerade egenskaper (till exempel arbetslöshetshistorik, utbildning och ålder), antas åtgärdsdeltagandet vara oberoende av de icke-observerade faktorer som kan påverka framgången på arbetsmarknaden (det är som om slumpen har avgjort vem som har fått del av åtgärden). Under detta antagande kan vi skatta effekten av åtgärden genom att jämföra två individer en deltagande individ och en jämförelseindivid som båda har varit arbetslösa lika länge, samt har samma utbildning och ålder. Fördelen med matchningsansatsen jämfört med till exempel regressionsanalys är att man skapar en kontrollgrupp utan att studera utfallsvariabeln (till exempel sökintensitet, hälsa, arbete et cetera) och detta förhindrar sökande efter effekter. När man väl bestämt vad som är en lämplig kontrollgrupp (det vill säga motsvarande det som det randomiserade experimentet skulle skapa) skattas effekten som skillnaden mellan de behandlades medelvärden och kontrollgruppens medelvärden. Trovärdigheten i all typ av utvärdering handlar i slutändan om hur rimlig jämförelsen som ligger till grund för effektskattningen är. Trovärdigheten i en matchningsstudie (i likhet med all empirisk forskning) beror till syvende och sist på hur mycket man kan observera om individerna. Matchning som metod i utvärderingen av Arbetstorget för erfarna I denna utvärdering kontaktades vi av Åke Dahlberg efter det att studien hade påbörjats för att genomföra en effektstudie. Med tanke på det specifika selektionsförfarandet av deltagare till programmet var det inte möjligt att genomföra en trovärdig effektstudie bara utifrån retrospektivt insamlade registeruppgifter. Vi beslutade därför gemensamt att genomföra en enkätundersökning där vi samlade in uppgifter om till exempel sökbeteende, motivation, tidigare erfarenhet och hälsa både före och efter programmet. Ett problem är att uppgifterna som avser tiden innan åtgärdsstart mäts i efterhand (retrospektivt) vilket gör att svaren blir mindre tillförlitliga än om de mäts innan (prospektivt) åtgärden börjat (jämför punkt 2 ovan). Arbetstorget för erfarna beslutade att bekosta enkätundersökningen. I samarbete med Arbetstorget för erfarna utformades enkäten och testades vid tre olika fokusgruppsmöten. Den ansågs av alla berörda parter (företrädare för Arbetstorget för erfarna, Åke Dahlberg och av oss) fungera för att genomföra en trovärdig utvärdering av programmet. Ambitionen i detta fall var att skatta effekten av programmet för deltagarna. Eftersom programmet var till för äldre långtidsarbetslösa i Stockholm är det na- 77

Per Johansson och Sophie Langenskiöld turligt att välja ut jämförelseindivider ur samma population. Enkäten skickades ut till deltagarna i Arbetstorget för erfarna och jämförelseindivider som bodde i Stockholms kommun hade samma fördelning på kön, ålder och arbetslöshetshistorik, och var arbetslösa vid samma tidpunkt som programdeltagarna. Eftersom vi trodde att svarsfrekvensen skulle vara lägre i jämförelsegruppen valde vi att ta ett större urval av arbetslösa icke-deltagare. För varje deltagare valde vi fem icke-deltagare. Per konstruktion kommer inte bortfallet att vara skevt i termer av observerade egenskaper och arbetslöshetshistorik. I tillägg konstanthåller vi för deltagarnas och jämförelseindividernas självrapporterade motivation, hälsa och sökbeteende innan programmet startade. Det grundläggande antagandet för utvärderingen är alltså att individer med samma observerade egenskaper, arbetslöshetshistorik, motivation, sökbeteende et cetera är jämförbara. Bortfallet är inget problem för den interna validiteten under förutsättning att vi kan tro på de grundläggande antagandena. Mer om Åke Dahlbergs sakkritik Enligt egen utsaga är Åke Dahlberg inte kritisk till vår rapport utan kritisk till den typ av kvantitativ utvärderingsstudie som vår rapport representerar. Han vill därför ha en diskussion om den metod som använts. Vi tror dock inte riktigt på att Åke Dahlberg på allvar är intresserad av en sådan diskussion utan drivs av andra incitament än rent vetenskapliga. Vi finner i synnerhet fem sakförhållanden problematiska. 1. Åke Dahlberg och IFAU hade intentionen att skriva en gemensam studie ända fram till dess att resultaten blev kända. När resultaten blev kända bestämdes att Åke Dahlberg skulle skriva en separat rapport. Denna rapport består till stora delar av kritik mot vår rapport. Vi välkomnar konstruktiv kritik, men förfarandet framstår som anmärkningsvärt, särskilt när alla parter var överens om utvärderingsstrategin på förhand. 2. Det är märkligt att i ena stunden diskutera det svåra selektionsproblemet (Dahlberg 2008 s 77) för att sedan helt bortse från denna problematik. Det är denna typ av logiska hopp som Åke Dahlberg gör sig skyldig till när han använder sig av aggregerad statistik (tabell 3 och 4) för långtidsarbetslösa personer i ålder 50-64 i hela landet för att påvisa att AE har en effekt. Åke Dahlberg behöver förklara varför denna jämförelse är rimlig. Varför skulle äldre arbetslösa individer i till exempel Sveg vara jämförbara med progamdeltagare i Stockholm? Den jämförelse som Åke Dahlberg gör är orimlig. 3. Det är anmärkningsvärt att så mycket energi läggs på att argumentera för att sysselsättningsresultatet i vår rapport inte är trovärdigt. Däremot 78

Replik till Åke Dahlberg verkar Åke Dahlberg inte ha några problem med övriga resultat ökad sökintensitet, ökad kontaktfrekvens och förbättrad (självupplevd) hälsa som är framtagna med samma metod. 4. Att i ena stunden förespråka experiment (som i grunden är en helt teorilös ansats) för att i andra stunden använda sig av sökteori för att förkasta empiriska resultat är inkonsekvent. Vi fann det också förvånande att inte den ökade sökintensiteten ökar sysselsättningen. Men från detta följer inte att man ska misstro sysselsättningsresultatet. Effekten på sökintensitet kanske inte är tillräcklig för att den ska få avtryck i en ökad sysselsättning. Man kan också argumentera för att sysselsättningsresultatet ska ges särskild stor tilltro eftersom vi får samma resultat på sysselsättningen från två oberoende datakällor: via register (Ams arbetslöshetsregister) och enkäten. Dessutom har retrospektiva frågor välkända problem som vi delvis redan har varit inne på. Det är inte långsökt att tänka sig att individer som uppenbarligen är nöjda med programmet (enligt Åke Dahlbergs intervjuundersökning) i efterhand också överskattar dess effekt på till exempel sökintensiteten. 5. Det är klart att intervjuer är ett mycket värdefullt komplement till kvantitativa effektstudier. De är dock ingalunda ett substitut. Intervjuer med ett 30- tal deltagare och ett 15-tal projektmedarbetare är en svag grund för att uttala sig generellt om åtgärdens effekter och tillika en svag grund för att förkasta effektskattningar som inte passar i Åke Dahlbergs föreställningsvärld. Sammanfattningsvis har vi alltså mycket svårt att se att vissa delmängder av resultaten ska ges en större tilltro än andra. Vår inställning är att antingen får man tillstå att alla resultat är trovärdiga eller så får man argumentera för att inga är det. Den senare ståndpunkten är respektabel men innebär att vi bara kan förlita oss på experimentell evidens (om ens detta). I alla sammanhang skulle vi hävda att studier som försöker kontrollera för observerade egenskaper är avsevärt trovärdigare än studier som grundar sina slutsatser på skillnader i medelvärden. Referenser Dahlberg Å (2008): Ger inte intensifierade arbetsförmedlingsåtgärder för äldre några sysselsättningseffekter? Arbetsmarknad & Arbetsliv, vol 14, nr 3, s 67-78. Heckman J, LaLonde R & Smith J (1999): The Economics and Econometrics of Active Labor Market Programs. I Ashenfelter O & Card D (red): Handbook of Labor Economics, vol 3A (s 1865-2097). North-Holland: Amsterdam. Johansson P & Langenskiöld S (2008): Ett alternativt program för äldre långtidsarbetslösa utvärdering av Arbetstorget för erfarna. Rapport 2008:2. Uppsala: IFAU. 79