En metadatadriven arkitektur/plattform Johan Erikson, SCB
Varför gemensam produktionsmiljö? Önskan 1: Effektivare statistikproduktion Använda gemensamma verktyg, jobba på samma sätt Lätt att sätta upp nya undersökningar inte behöva bygga nya system Önskan 2: Minska risken för fel Färre manuella moment Mindre dataskyffling Ändringar på ett ställe i (mer) ordnad form Önskan 3: Effektivare IT-förvaltning Lokala produktionssystem kostar mycket att underhålla Gamla system är osäkra, personberoende, dyra Önskan 4: Samordnad statistik Konsistens mellan källor, jämförbarhet, ny statistik
Vad är metadatadriven? Designdriven tänk först, gör sen Metadata används för att manifestera designen och styra produktionen Metadata i vid mening: Traditionella metadata (beskrivning av innehåll) Processdata Processtyrande data
Vad är den gemensamma produktionsmiljön? Sammanhållen miljö som omfattar de gemensamma verktygen och kopplar ihop dem Tillhandahålls genom Verksamhetsstödet processytor som kan liknas vid kontrollpanel Processytorna blir navet i produktionen tillgång till verktyg, lägesrapportering, kvalitetssäkring, processdata, roller Tillhandahållen som ett antal tjänster Plattformen i sig tillhandahåller funktionaliteten, lokala produktionssystem behövs inte Produkten gör och underhåller sina egna inställningar Nya funktioner i och nya versioner av verktyg kan rullas ut inom plattformen Designval avgör vad som ska användas Dataflödet sker automatiskt mellan de olika verktygen genom kommunikationsplattform och metadata
Statistisk infrastruktur Metoder, Kommunikations- verktyg och plattform tjänster Variabler och klassifikationer Urval Administrativa data Skanning Intervju Granskning Manuell utr. Kodning Imputering Komplettering Skattning Tabellering Webbinsamling Röjandekontroll Publicering Processyta för Samla in Processyta för Bearbeta Processyta för Analysera Processyta för Redovisa och Kommunikationsplattform för Samla in Kommunikationsplattform för Bearbeta & Analysera Verksamhetsstödet Kommunikationsplattform för Redovisa och Observationsdatalager Mikrodatalager Måldatalager Presentationsdatalager (SSD) Metadatalager Basregister Processdatalager Identiteter och behörigheter (IAM)
SCB:s strategi för samordnad statistikproduktion Utvärdera och återkoppla Fastställ behov Designa och planera Skapa och testa Samla in Bearbeta Analysera Redovisa och Stöd och infrastruktur Behörighet Dataåtkomst Plattform VST Processflöde Metadata Frågor Variabler Termer Klassifikationer Processdata Direktinsamling Administrativa data Observationsdatalager Datalager Måldatalager Presentationsdatalager Publicering Spridning Basregister
SCB:s strategi för samordnad statistikproduktion Utvärdera och återkoppla Fastställ behov Designa och planera Skapa och testa Samla in Bearbeta Analysera Redovisa och Stöd och infrastruktur Behörighet Dataåtkomst Plattform VST Processflöde TRITON Metadata Frågor Variabler Termer Klassifikationer Processdata Direktinsamling Administrativa data Observationsdatalager Datalager Måldatalager Presentationsdatalager Publicering Spridning Basregister
SCB:s strategi för samordnad statistikproduktion Utvärdera och återkoppla Fastställ behov Designa och planera Skapa och testa Samla in Bearbeta Analysera Redovisa och Stöd och infrastruktur Behörighet Dataåtkomst Plattform VST Processflöde TRITON Metadata Frågor Variabler Termer Klassifikationer Processdata Direktinsamling Administrativa data Observationsdatalager Datalager Måldatalager REDOVISNING Presentationsdatalager Publicering Spridning Basregister
SCB:s strategi för samordnad statistikproduktion Utvärdera och återkoppla Fastställ behov Designa och planera Skapa och testa Samla in Bearbeta Analysera Redovisa och Stöd och infrastruktur Behörighet Dataåtkomst Plattform VST Processflöde TRITON Metadata Frågor Variabler Termer Klassifikationer Processdata Direktinsamling Administrativa data Observationsdatalager BERÄKNING Datalager Måldatalager REDOVISNING Presentationsdatalager Publicering Spridning Basregister
Vilka huvudsakliga delar? Insamling och grundläggande bearbetning Triton Bearbetning och analys Beräkningar Redovisning Publiceringskalender Publicering i Sveriges Statistiska Databaser SSD Styrning och gemensamma metadata Processytor Undersökningsdatabas Processtyrning Variabler och värdemängder Indataleveranser
Grundprinciper Ansvarsfördelning Design och parametersättning Återkoppling och processdata Kvalitetssäkring Spårbarhet Kommunikation Tjänster Datalagring Skalbarhet Säkerhet