1
Seminarium om datalager Ingemar Svensson, Analysavdelningen 2
Lite bakgrund om Pensionsmyndigheten 3
Pensionsyndigheten bildades 2010-01-01 Sammanslagning av o premiepensionsmyndigheten (PPM) o pensionsverksamheten vid Försäkringskassan Vi finns på 8 orter: Luleå, Söderhamn, Gävle, Stockholm, Karlstad Växjö, Halmstad och Visby Cirka 1 000 medarbetare Det finns drygt 100 servicekontor Servicekontoren är ett samarbete mellan: - Försäkringskassan - Skatteverket - Pensionsmyndigheten 4
Pensionsmyndighetens IT-system är en vidareutveckling av PPM:s IT-system System för Ärendehantering Premiepensionen (Pluto) Telefoni och e-post Webb Många tunga IT-system ligger kvar på Försäkringskassan De kommer inte att flyttas Stora kostnader för att bygga nytt på Pensionsmyndigheten Samordningsvinster mellan Pensionsmyndigheten och Försäkringskassan Under överskådlig framtid kommer vi att ha källsystem för datalagret både på Pensionsmyndigheten (i Stockholm) och på Försäkringskassan (i Sundsvall) 5
Varför vi behöver ett datalager 6
1. Pensionsmyndigheten är officiell statistikmyndighet Ansvarsområde: stöd vid ålderdom 2. Pensionsmyndigheten ska följa, analysera och förmedla ålderspensionssystemets utveckling och effekter för enskilda och samhälle (instruktionen 2 ) 3. Statistik och statistiska analyser behövs för andra ändamål på myndigheten: kvalitetsförbättringar, information mm T.ex. kundsegmentering, prediktionsmodeller 1-2 ingår i den särskilda verksamheten för framställning av statistik. Statistiksekretessen gäller. 7
Försäkringsstatistik antal pensionärer och pensionssparare, pensionsbelopp, pensionsbehållningar, fondinnehav och deras marknadsvärde etc Produktionsstatistik uppgifter för resultatuppföljning med kund -perspektiv t.ex. handläggningstider, utbetalningsprecision, andel besvarade telefonsamtal i tid uppgifter för produktionsuppföljning, produktionsstyrning, produktionsplanering t.ex. volymer av inkomna och avslutade ärenden, antal genomförda arbetsmoment av olika slag Stort fokus på produktionsstatistiken under de första åren 8
Vägledande principer och ambitioner 9
Transparens, stöd för öppen källkod och öppna data I princip all statistik och resultatinformation ska bli tillgänglig via externwebben Egen sida på GitHub (samarbetsplattform för öppen källkodsutveckling) https://github.com/swedishpensionsagency Kolumnorienterad databashanterare för R-användare (Coldbir) R-paket för automatisk generering och design av dokument (rapporter med text, tabeller och diagram) Öppen källkod i Excel/VBA-baserade simuleringsmodeller Pensionsmodellen: Finansiella simuleringar av pensionssystemet på makronivå Typfallsmodellen: Pensionsutfallet för en individ med specificerade egenskaper 10
Våra nuvarande datalager Pågående och planerat utvecklingsarbete 11
Nuvarande datalager: Store (Försäkringskassan) Asta (arv från PPM) Kopia av Pluto (källsystemet) (arv från PPM) Alla ska ersättas med ett nytt sammanhållet datalager: PEnsionsmyndigheterns DAtaLager - Pedal 4-5 år för att ersätta pensionsdelen av Store med Pedal Filer med historiska data började levereras i augusti 2013 Troligen slutar Pensionsmyndigheten använda Store 2016-01-01 12
Utvecklingsplaner (i urval) för Pedal 1. Använd den befintliga datafångsten från källsystemen på Försäkringskassan. Styr om filerna som idag går till Store så att de i stället går till Pedal. 2. Ersätt alla viktiga produkter från Store (statistikrapporter mm) med motsvarande produkter via Pedal. Måltidpunkter 1/7 2015 och 1/9 2015. 3. Vidareutveckla statistiken och analysdatabaser 4. Datafångst från andra myndigheter för statistikändamål (t.ex. sjuk- och aktivitetsersättning, egenlivräntor) 5. Utöka datafångsten från pensionsmyndighetens källsystem (t.ex. levnadsintyg) 13
Organisation, utvecklingsmetodik och arkitektur 14
Organisation och utvecklingsmetodik Agila metoder. Tonvikt på informella metoder för att styra och bedriva arbetet. Desto större fokus på god dokumentation av slutprodukter Alla nödvändiga kompetenser samlade i en organisatorisk enhet (processorienterad snarare än funktionsorienterad organisation). Business Intelligence Competence Center 2 breda yrkesroller: Dataanalytiker: kravanalys, dokumentation Utvecklare: utveckling och förvaltning av produktionskod, drift av datalagret 15
Utgångspunkter för arkitektur och organisation 1. Komplexa och innehållsrika administrativa data - skapar både möjligheter och utmaningar 2. Råa administrativa data svåra att använda. Data kräver omfattande förädling för att bli relevanta och användbara för statistik och analysändamål 3. Att skapa lättanvända och relevanta förädlade data kräver detaljkunskaper om pensionssystemets regelverk, arbetsrutiner i ärendehandläggningen, egenheter hos ITsystemen mm 4. Det är tidskrävande att bygga upp dessa kunskaper och analysera källdatat för att avgöra hur det ska förädlas 5. Förändringar i datafångsten från källsystemen kan bara göras fyra gånger per år 16
Pedal består av flera databaser med olika syften Lagring av data med olika förädlingsgrad Stöd för inkrementell utveckling: vi ska kunna leverera det viktigaste först Stöd för flexibilitet Obearb Analyser Ad hoc-statistik Källsystem Filer Grund Dim Statistikunderlag Statistikrapporter 17
Våra verktyg SAS Data Integration Studio (ETL-verktyg) Microsoft SQL Server (datalagring, databearbetningar) Microsofts rapporteringsverktyg R (databearbetningar, statistiska analyser, visualisering) SAS Base (databearbetningar) Shiny (R-paket) och javascript (statistikpresentation på externwebben) Git/Stash/Jira/Confluence (pattform för samarbete, versionshantering av kod och ärendehantering) 18