Creating a Model for a Central Metadata Repository

Relevanta dokument
Geneva Klas Blomqvist Eva Holm

National Implementation of the GSBPM The Swedish Experience. Mats Bergdahl Statistics Sweden

SVENSK STANDARD SS-EN ISO 19108:2005/AC:2015

Rosetta. Ido Peled. A Digital Preservation System. December Rosetta Product Manager

Swedish National Data Service

Biblioteket.se. A library project, not a web project. Daniel Andersson. Biblioteket.se. New Communication Channels in Libraries Budapest Nov 19, 2007

Styrteknik : Funktioner och funktionsblock

Support Manual HoistLocatel Electronic Locks

Kristina Säfsten. Kristina Säfsten JTH

Botnia-Atlantica Information Meeting

Patientrapporterade utfallsmått, ett verktyg för jämlik vård? Evalill Nilsson Universitetslärare, med dr Avd f Samhällsmedicin

Measuring child participation in immunization registries: two national surveys, 2001

Sara Skärhem Martin Jansson Dalarna Science Park

Support for Artist Residencies

Klicka här för att ändra format

Resultatkonferens Välkommen!

Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET

Application Note SW

Swedish adaptation of ISO TC 211 Quality principles. Erik Stenborg

EMIR-European Market Infrastructure Regulation

Fujitsu Day Göteborg 8 oktober

Documentation SN 3102

Isolda Purchase - EDI

SRS Project. the use of Big Data in the Swedish sick leave process. EUMASS Scientific program

Robust och energieffektiv styrning av tågtrafik

Michael Q. Jones & Matt B. Pedersen University of Nevada Las Vegas

Revidering av ISO Peter Allvén SIS TK-304/PostNord

Performance culture in policing. Författare: Tevfik Refik Altonchi (Ph.d)

Utvecklings- och tillväxtplan för ett hållbart Åland

DCAT-AP. Vad är det och vad kommer härnäst

Mer OOP. Variation i typ. Medlen repetition. Generiska klasser. Gränssnitt - Interface. Mer om klasser Några exempel UML

Projekt E-ARK stöd vid digital arkivering. Björn ES Solutions

Design. Vad lärde jag mig förra lekfonen? Hur bidrog jag Fll lärandet? Kravhantering sammanfa0ning 13/04/14

Swedish electoral data: General elections Statistics Sweden

SVENSK STANDARD SS-ISO 8734

3rd September 2014 Sonali Raut, CA, CISA DGM-Internal Audit, Voltas Ltd.

The Swedish National Patient Overview (NPO)

Brandsäkerhet hos. ny europeisk handbok

Försöket med trängselskatt i siffror

Affärsmodellernas förändring inom handeln

Ei R2015:15. Figure 1. An information model based on all-to-all communication. Source: Sweco. Kund = Customer. Elhandlare = Electricity supplier

ISO general purpose screw threads Basic profile Part 1: Metric screw threads

Analys och bedömning av företag och förvaltning. Omtentamen. Ladokkod: SAN023. Tentamen ges för: Namn: (Ifylles av student.

Design för användbarhet

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Mapping sequence reads & Calling variants

Vässa kraven och förbättra samarbetet med hjälp av Behaviour Driven Development Anna Fallqvist Eriksson

SVENSK STANDARD SS-EN 13612/AC:2016

3 rd October 2017

Authentication Context QC Statement. Stefan Santesson, 3xA Security AB

Alternativet är iwindows registret som ni hittar under regedit och Windows XP 32 bit.

Taking Flight! Migrating to SAS 9.2!

Nya möjligheter med M3 Technology. Björn Svensson, Björn Torold

1. Unpack content of zip-file to temporary folder and double click Setup

SVENSK STANDARD SS

Registerforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen

Collaborative Product Development:

FÖRBERED UNDERLAG FÖR BEDÖMNING SÅ HÄR

Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

Lösenordsportalen Hosted by UNIT4 For instructions in English, see further down in this document

Managing addresses in the City of Kokkola Underhåll av adresser i Karleby stad

Agenda. Tid Aktivitet Föreläsare Åtgång tid 08:30 Registrering vid TS recep. Transport till våning 5.

Eurokod 3: Dimensionering av stålkonstruktioner Del 4-3: Rörledningar. Eurocode 3 Design of steel structures Part 4-3: Pipelines

Implementationsstrategier för PLCS

Senaste trenderna inom redovisning, rapportering och bolagsstyrning Lars-Olle Larsson, Swedfund International AB

Skyddande av frågebanken

Policy and planning processes for promoting bicycle use in Sweden Kerstin Robertson

Riktlinjer för informationsutbyte av forskningsinformation

Objektorienterad Programkonstruktion. Föreläsning 2 2 nov 2016

SOA One Year Later and With a Business Perspective. BEA Education VNUG 2006

Materialplanering och styrning på grundnivå. 7,5 högskolepoäng

Why WE care? Anders Lundberg Fire Protection Engineer The Unit for Fire Protection & Flammables Swedish Civil Contingencies Agency

icore Solutions. All Rights Reserved.

Accessing & Allocating Alternatives

ERS (Electrical Road System) Slide-in project within FFI program

Installation Instructions

Kursplan. AB1029 Introduktion till Professionell kommunikation - mer än bara samtal. 7,5 högskolepoäng, Grundnivå 1


The Swedish system of Contract Archaeology

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

SVENSK STANDARD SS-ISO :2010/Amd 1:2010

Den Danske Bank in Sweden

Alla Tiders Kalmar län, Create the good society in Kalmar county Contributions from the Heritage Sector and the Time Travel method

CM FORUM. Introduktion till. Configuration Management (CM) / Konfigurationsledning. Tobias Ljungkvist

HP BSM - Erfarenheter från FMS projektet ComHem Jan Östgren MangE Nordic AB (Med hjälp från Thomas Englund ComHem)

Urban Runoff in Denser Environments. Tom Richman, ASLA, AICP

Vad kännetecknar en god klass. Vad kännetecknar en god klass. F12 Nested & Inner Classes

State Examinations Commission

Fortbildningsavdelningen för skolans internationalisering. Dossier 3. European Language Portfolio 16+ Europeisk språkportfolio 16+ English version

Nordic Casemix Centre (NCC) (Nordiskt center för patientgruppering r.f)

European Spallation Source (ESS) från Projektmodeller till Plant/Product Lifecycle Management

Innovation och produktutveckling. Joakim Lilliesköld & Liv Gingnell

SweLL & legal aspects. Elena Volodina

PowerCell Sweden AB. Ren och effektiv energi överallt där den behövs

Transkript:

Creating a Model for a Central Metadata Repository Klas Blomqvist EDDI 14, London 2014-12-02

Background Statistics Sweden - NSI > 200 statistical products Traditional stove-pipes production system Product oriented Decentralised organisation Relatively independent departments 50% financed by commissions solution for each customer Strategies (Decision by the Director General) Register system must be coordinated Data storage changed from accessing individual products to accessing the entire data warehouse

Content Register and data warehousing vision and strategy A central metadata repository Standards based GSBPM GSIM Testing in production systems

GSBPM - Generic Statistical Business Process Model

GSIM Conceptual model GSIM DDI Implementation standards Other relevant standards SDMX Geospatial standards

Strategy Support process oriented production Active Communication with suppliers Survey A Data store A Survey B Data store B Survey C Data store C Use of registers when possible Standardization Dissemination Publishing Dissemination Publishing Dissemination Publishing Survey A Survey B Survey C Input data warehouse Output data warehouse Dissemination Publishing Dissemination Publishing Dissemination Publishing

Direct data collection Specify needs Administrative data SCB s strategy on coordinated statistics production Design and plan Logical Evaluate storage and feed of back a variable Build and test The centre of a sphere of interest Owns the population Continuously updated Independent of other base registers Has links to the other base registers Contains mainly stock variables Input data Time stamped data Business sphere Collect Process Analyse Disseminate Business and communicate Support and infrastructure Platform / service layer Micro Data Base register Metadata Data Individuals Population sphere Macro Data Observation data Target data Presentation data Real property Real property sphere Publishing Dissemination Process data automatically provided Variable values checked Process individually Data or by comparisons Longitudinal editing and analysis supported Physical data transportation minimized No private versions

A Central Metadata Repository Evaluate and feed back Specify needs Design and plan Build and test Collect Process Analyse Disseminate and communicate Support and infrastructure Operations Support SCB.SE The Platform Rules Business Services Catalogue Process Methods Process Steps SCBDOK Tech info Metadata Store Business Processes Variables DoS Populations Unit es Value Domains Thesaurus Question Bank Process Metrics Statistical Data Production Data Data Store

Current Metadata Situation at SCB Local systems SCBDOK MetaPlus BaS SSD Input Raw data Throughput Micro data Output Macro data

Desired Metadata Situation Common vocabulary Metadata Repository SCBDOK BaS Process metadata Question Bank MetaCollect ETL rules MetaPlus Aggr. rules MacroMeta Input Raw data Throughput Micro data Output Macro data

Metadata Expectations More active metadata Documentation during the design phase Metadata driven production Enable tracing What was the question that led to this published figure? Ideally a two-stage tracing for NA More and better process data Who did what when and why? More comprehensive metadata Improved search mechanisms Unified terminology Thesaurus

Runs and feeds the processes input process Output/ input process output

Macro editing with drill-down MetaCollect ETL MetaPlus Aggr. Metadata repository MacroMeta rules rules Input Raw data Throughput Micro data Output Macro data Read Insert new generation Display source micro data Macro edit Micro data Display edit results Deemed as being incorrect Macro data Click suspect item

The Current Metadata Situation Evaluate and feed back Specify needs Design and plan Build and test Collect Process Analyse Disseminate and communicate Support and infrastructure Operations Support SCB.SE Metadata Local systems SCBDOK MetaPlus DoS SSD Input Raw data Throughput Micro data Data Output Macro data

MetaPlus Structure Register Object class Variable Conceptual value domain Register variant Population Object variable Value domain Register version Context Population Context variable Value Data base table Column

Central Metadata Store for efficient statistics production Business Design, Process, Process step, Activity, Method, Rule, Service, Round Exchange Statistics product, Supplier, User, Contract, Agreement Structures Dataset, Reference metadata, Data Structure, Dimension, Record Concepts Unit, Population, Variable, Value Domain, Classification

Common and specific metadata Specify needs Design and plan Process step Service catalogue Variable Classification Process step within a round Service within a round Value domain Instance variable Build and test Evaluate and feed back Collect Process Analyse Disseminate and communicate Support and infrastructure Common to the entire statistics production process Individual product implementation Common metadata definitions Definitions of occurrences specific to a production round Frame unit data Sample unit data Report unit data Observation unit data Statistical data collection Process data Data Store Actual occurrences

Metod struktureras av struktureras av struktureras av lagras i tar innebörd från grupperas i Designregel Designbeskrivning beskrivs av Sökväg implementerar Processindataspec bidrar till Processdesign bidrar till Processutdataspec är del av Processtyrningsregeldesign Omgång Versionshantering Presentationsspråk Tesaur specificeras av specificerar Processtyrningsregel Processtyrningsregel före efter specificeras av Omgångsprocessteg baseras på Processteg Processnummer Ordning inom nivån använder utför Tjänst Tjänstegränssnitt Fysisk plats Version Språk Begrepp instansierar används i Omgångsprocesstegstjänst använder Statistikprodukt Produktkod Benämning Officiell Statistik Utdatamottagare Adress ingår avtal ingår avtal Indataleverantör Adress Extern beskriver Processindata Processtegsavsnitt används av Avsnittstext Standardtext Processtegsinstans Processutdata skapas av Starttidpunkt Sluttidpunkt Starthändelse Referensmetadataavsnitt Avsnittsnummer Avsnittsnamn Obligatorisk Ordningsnummer inom nivå specificeras av används som input Referensmetadata Referensmetadatatyp används som output avser utgör grund för Fråga Frågetext Data in/ut Riktning styr Avtal Kontrakt baseras på Informationsset skapar Omgångsreferensmetadata Text Datapunkt använder Datum identifierare mått attribut Dataresurs Lagringsplats grupperar Dataset Lagringsplats Datakolumn Datatyp lagrar Instansvariabel Källa Roll Variabelroll Objekt Lagringsplats Tid observerar observerar hel/del förälder/barn Dimensionsdatapunkt Objektdatapunkt Identifierarkomponent Måttkomponent Attributkomponent Dimensionsdataset observerar Objektdataset Dimensionsdatastruktur Objektdatastruktur Dimensionsvariabler [1..n] Datastruktur Objektdatapost Logisk post är källan till är målet för grupperas struktureras av Postrelation grupperas av definieras av Representerad variabel mäter Dimensioner Tid Konceptuell variabel tar betydelse från Operationell regel Formel definieras av avser Värdemängd mäter mäter Objekttyp specificeras av hierarki innehåller Nod mappar källa tar betydelse från mappar mål Kategori Aggregation e Alias Not Kategorienhet Kodenhet Klassifikationsenhet (Värde?) Officiellt namn Beskrvining Kod Kod Innehållsbeskrivningar Aktuell Kategoriset Kodlista Population Klassifikation förälder/ Referensperiod barn Geografisk avgränsning Aktuell Populationstyp Ansvarig enhet/avdelning Delpopulation baseras på hämtar värden från Klassifikationsversion Klassifikationsvariant Mappning Giltig från och med Giltig till och med Nivå Klassifikationsenhet Kodstruktur Kodtyp Dummykod Nivånamn Nivånummer Antal Värden Nyckel Publikationer Källa Mål Källnivå Målnivå Relationstyp Flytande Datastrukturkomponent specificerar Beskriven värdemängd Kategorisk värdemängd förhåller sig till NodSet Måttenhet Datatyp Ömsesidigt uteslutande Version Organisation jämför

SCB s strategy on coordinated statistics production Evaluate and feed back Specify needs Design and plan Build and test Collect Process Analyse Disseminate and communicate Support and infrastructure Platform / service layer Metadata Direct data collection Data Micro Data Macro Data Publishing Administrative data Input data Observation data Target data Presentation data Dissemination Base register Process Data

A Central Metadata Repository Evaluate and feed back Specify needs Design and plan Build and test Collect Process Analyse Disseminate and communicate Support and infrastructure Operations Support SCB.SE The Platform Rules Business Services Catalogue Process Methods Process Steps SCBDOK Tech info Metadata Store Business Processes Variables DoS Populations Unit es Value Domains Thesaurus Question Bank Process Metrics Statistical Data Production Data Data Store

Metod struktureras av struktureras av struktureras av lagras i tar innebörd från grupperas i Designregel Designbeskrivning beskrivs av Sökväg implementerar Processindataspec bidrar till Processdesign bidrar till Processutdataspec är del av Processtyrningsregeldesign Omgång Versionshantering Presentationsspråk Tesaur specificeras av specificerar Processtyrningsregel Processtyrningsregel före efter specificeras av Omgångsprocessteg baseras på Processteg Processnummer Ordning inom nivån använder utför Tjänst Tjänstegränssnitt Fysisk plats Version Språk Begrepp instansierar används i Omgångsprocesstegstjänst använder Statistikprodukt Produktkod Benämning Officiell Statistik Utdatamottagare Adress ingår avtal ingår avtal Indataleverantör Adress Extern beskriver Processindata Processtegsavsnitt används av Avsnittstext Standardtext Processtegsinstans Processutdata skapas av Starttidpunkt Sluttidpunkt Starthändelse Referensmetadataavsnitt Avsnittsnummer Avsnittsnamn Obligatorisk Ordningsnummer inom nivå specificeras av används som input Referensmetadata Referensmetadatatyp används som output avser utgör grund för Fråga Frågetext Data in/ut Riktning styr Avtal Kontrakt baseras på Informationsset skapar Omgångsreferensmetadata Text Datapunkt använder Datum identifierare mått attribut Dataresurs Lagringsplats grupperar Dataset Lagringsplats Datakolumn Datatyp lagrar Instansvariabel Källa Roll Variabelroll Objekt Lagringsplats Tid observerar observerar hel/del förälder/barn Dimensionsdatapunkt Objektdatapunkt Identifierarkomponent Måttkomponent Attributkomponent Dimensionsdataset observerar Objektdataset Dimensionsdatastruktur Objektdatastruktur Dimensionsvariabler [1..n] Datastruktur Objektdatapost Logisk post är källan till är målet för grupperas struktureras av Postrelation grupperas av definieras av Representerad variabel mäter Dimensioner Tid Konceptuell variabel tar betydelse från Operationell regel Formel definieras av avser Värdemängd mäter mäter Objekttyp specificeras av hierarki innehåller Nod mappar källa tar betydelse från mappar mål Kategori Aggregation e Alias Not Kategorienhet Kodenhet Klassifikationsenhet (Värde?) Officiellt namn Beskrvining Kod Kod Innehållsbeskrivningar Aktuell Kategoriset Kodlista Population Klassifikation förälder/ Referensperiod barn Geografisk avgränsning Aktuell Populationstyp Ansvarig enhet/avdelning Delpopulation baseras på hämtar värden från Klassifikationsversion Klassifikationsvariant Mappning Giltig från och med Giltig till och med Nivå Klassifikationsenhet Kodstruktur Kodtyp Dummykod Nivånamn Nivånummer Antal Värden Nyckel Publikationer Källa Mål Källnivå Målnivå Relationstyp Flytande Datastrukturkomponent specificerar Beskriven värdemängd Kategorisk värdemängd förhåller sig till NodSet Måttenhet Datatyp Ömsesidigt uteslutande Version Organisation jämför

Ongoing Prototype - Access database Coordinating economic short term statistics (5 products) Testing in Structural business statistics and National accounts (Excessive Deficit Procedure - EDP) Case on sampling filling the blue part Version 1.1 Next step - Incorporating in/with the platform

giltig metod refererar till använder lagras i refererar till tar innebörd från grupperas grupperas i rollen avser struktureras av struktureras av struktureras av struktureras av baseras på Designregel giltig designregel Processindataspec Metod vald metod Processtegsdesign bidrar till utför Processutdataspec (Datastruktur) Undersökningsdesign utformar Undersökning Startdatum Slutdatum Status initierar Åtgärd beroende initierar Behov Båsenbergamodellen Konceptuell modell av SCB:s gemensamma metadatalager Version 1.1 2014-10-16 specificeras av (Datastruktur) Flödesregeldesign bidrar till Giltig tjänst Tjänst finns i vald tjänst möjliga tjänster Tjänstegränssnitt Fysisk plats är tillåten i specificerar Processflöde Flödesregel Omgångsprocessteg före Starthändelse efter Starttidpunkt Status Omloppstid Processtegsutförande instansierar specificeras av valt processteg utför är beroende av Processteg är Processnummer underordnat Ordning inom nivån Produktionsomgång kan förekomma i Startdatum Omgångstyp Slutdatum Omgång Startdatum Slutdatum specificeras av baseras på avser Statistikprodukt Produktkod Benämning Officiell Statistik Register Uppdrag Versionshantering Presentationsspråk Tesaur Giltig från Språk Begrepp Giltig till Noteringstid Noterat av Slutnoteringstid Slutnoterat av Utdatamottagare Adress Indataleverantör ingår avtal Postadress Data in/ut ingår avtal styr Telefon E-postadress Intern/Extern Riktning Frågor som modellen ska svara på A beskriver Processindata Starttidpunkt skapas av Processutdata används av Sluttidpunkt (Dataset) Starthändelse (Dataset) Status Referensmetadataavsnitt Processtegsavsnitt Avsnittstext Avsnittsnummer Standardtext Avsnittsnamn Obligatorisk Ordningsnummer inom nivå Referensmetadata Referensmetadatatyp lista över variabler Blankett Media Fråga Frågetext Avtal Avtalsägare Förordning Innehåll Kontrakt Leveranskanal Postbeskrivning Leveransschema baseras på Informationsset skapar använder Omgångsreferensmetadata Text Dataresurs grupperar Dataset (sökväg) Datapunkt identifierare mått attribut Kontextvariabel Datakolumn lagrar Datatyp Roll Källa Roll Variabelroll utgör grund för använder Datum Objekt Tid observerar observerar hel/del förälder/barn Identifierarkomponent Måttkomponent Attributkomponent Datastrukturkomponent Dimensionsdatapunkt Dimensionsdataset observerar Objektdataset Dimensionsdatastruktur Objektdatastruktur Dimensionsvariabler [1..n] Datastruktur specificerar Objektdatapunkt Objektdatapost Logisk post är källan till är målet för Postrelation grupperas av definieras av Representerad variabel mäter Dimensioner tar betydelse från Operationell regel Formel rollen Nod mäter tar betydelse från Kategori Aggregation e Alias Not Konceptuell variabel mäter Objekttyp Kategorienhet Kodenhet Beskrvining Kod specificeras av hierarki innehåller mappar källa mappar mål Klassifikationsenhet (Värde?) Officiellt namn Kod Innehållsbeskrivningar Aktuell definieras av Kategoriset Kodlista Population Klassifikation förälder/ Referensperiod barn Värdemängd Geografisk avgränsning Aktuell Populationstyp Ansvarig enhet/avdelning Delpopulation baseras hämtar värden från på Klassifikationsversion Klassifikationsvariant förhåller sig till Beskriven värdemängd Kategorisk värdemängd NodSet Version Måttenhet Ömsesidigt uteslutande Organisation Datatyp Mappning Giltig från och med Giltig till och med Nivå Klassifikationsenhet Kodstruktur Kodtyp Dummykod Nivånamn Nivånummer Antal Värden Nyckel Publikationer Källa Mål Källnivå Målnivå Relationstyp Flytande jämför består av

The end