GeoTest 2011 Feasibility Testing Testing INSPIRE Annex II + III Data Specifications Rapport upprättad 2011-12-21 Av GeoTest projektet Bilagor 1) Datamodeller tema Djup och höjd 2) Testrapport JRC (Extern bilaga)
Innehållsförteckning Innehållsförteckning... 1 1 Introduktion... 4 1.1 Om GeoTest-projektet... 4 1.2 Test av Inspire s dataspecifikationer... 4 2 Metod för transformationstester... 5 2.1 Skrivbordsstudie... 9 2.1.1 Material - Källdata... 10 2.1.1.1 Tema 2.2 Höjd och djup (EL)... 10 2.1.1.2 Tema 3.7 - Anläggningar för miljöövervakning (EF)... 11 2.1.1.3 Tema 3.11 - Områden med särskilda restriktioner (AM)... 13 2.1.2 Analys av Inspire s dataspecifikationer... 15 2.1.2.1 Tema 2.2 - Höjd och djup... 16 2.1.2.2 Tema 3.7 - Anläggningar för miljöövervakning... 17 2.1.2.3 Tema 3.11 - Områden med särskilda restriktioner... 18 2.1.3 Schemamatchning... 19 2.1.3.1 Tema 2.2 - Höjd och djup... 21 2.1.3.2 Tema 3.7 - Anläggningar för miljöövervakning... 24 2.1.3.3 Tema 3.11 Områden med särskilda restriktioner... 26 2.1.4 Val av verktyg... 27 2.2 Transformation... 28 2.2.1 Rumslig transformation och formatkonvertering... 28 2.2.1.1 Tema 2.2 - Höjd och djup... 29 2.2.1.2 Tema 3.7 - Anläggningar för miljöövervakning... 30 2.2.1.3 Tema 3.11 - Områden med särskilda restriktioner... 31 2.2.2 Schemamappning och schematransformation... 32 2.2.2.1 Tema 2.2 - Höjd och djup... 33 2.2.2.2 Tema 3.7 - Anläggningar för miljöövervakning... 37 2.2.2.3 Tema 3.11 - Områden med särskilda restriktioner... 41 2.3 Validering... 43 2.3.1 Tema 2.2 - Höjd och djup... 44 2.3.2 Tema 3.7 - Anläggningar för miljöövervakning... 44 2.3.3 Tema 3.11 - Områden med särskilda restriktioner... 45 3 Resultat och diskussion... 45 3.1 Transformationernas genomförbarhet... 45 3.1.1 Resursförbrukning... 46 2
3.1.2 Måluppfyllelse... 47 3.1.2.1 Tema 2.2 - Höjd och djup... 49 3.1.2.2 Tema 3.7 - Anläggningar för miljöövervakning... 52 3.1.2.3 Tema 3.11 - Områden med särskilda restriktioner... 55 3.2 Granskning av dataspecifikationer... 58 3.2.1 Tema 2.2 - Höjd och djup... 59 3.2.2 Tema 3.7 - Anläggningar för miljöövervakning... 60 3.2.3 Tema 3.11 - Områden med särskilda restriktioner... 61 3.3 Erfarenheter från testgenomförandet... 61 4 Slutsatser... 64 Referenser... 65 Bilaga 1 Datamodeller tema 2.2 Höjd och djup... 67 3
1 Introduktion 1.1 Om GeoTest-projektet Målet med GeoTest-projektet är att utveckla testtjänster inom geodataområdet. Testerna bedömer om dataspecifikationer och geodatatjänster är användbara och av tillräckligt hög kvalitet. GeoTest är en gemensam satsning i samverkan mellan Lantmäteriet, Högskolan i Gävle och Future Position X (FPX), och bidrar till en kvalitetssäkrad infrastruktur för geodata. 1.2 Test av Inspire s dataspecifikationer En infrastruktur för rumslig information i Europeiska gemenskapen (Inspire) är ett EG-direktiv med syfte att skapa en Europeisk infrastruktur för rumsliga data. Denna infrastruktur skall underlätta tillgången och utbytet av harmoniserade geodata och metadata, vilket skall ske via standardiserade nättjänster. Inspire-direktivet kräver således att medlemsstaterna tillhandahåller data och metadata enligt ett antal dataspecifikationer. Data ligger dock ofta lagrade enligt lokala scheman, varför de behöver transformeras så att de uppfyller kraven i Inspire s dataspecifikationer. Den 30:e juni 2011 skickades Inspire s dataspecifikationer för bilaga II och III ut på remiss och en utlysning (CT, 2011) gjordes för att testa densamma. Lantmäteriet (Inspire-samordnare och initiativtagare till GeoTest-projektet) gav GeoTest i uppdrag att bistå informationsansvariga myndigheter med testerna i sitt remissarbete. Det övergripande syftet med testerna som anges i utlysningen från kommissionen är att granska remissutgåvorna av Inspire s dataspecifikationer för bilaga II och III. Denna granskning kan delas upp i två delar: (1) test av genomförbarhet för transformation ( feasibility testing ); och (2) test av ändamålsenlighet ( fitness for purpose ). Transformationstesterna (1) anses i utlysningen som de viktigaste i nuläget och det är dessa tester som GeoTest har utfört. Det primära syftet med transformationstesterna är att mäta den tekniska genomförbarheten för transformation av lokala data så att de blir kompatibla med Inspire s dataspecifikationer. Det sekundära syftet är att, utifrån testerna, ge synpunkter på eventuella svagheter i remissutgåvorna av dataspecifikationerna. Lantmäteriet angav också önskemål om att testa teman där flera myndigheter är informationsansvariga, dvs. ansvariga att tillhandahålla sina respektive geodatamängder som ett gemensamt 4
Inspire-tema. Det antas finnas speciella svårigheter med ett sådant gemensamt ansvar för en datamängd, som tester kan hjälpa till att lyfta fram och belysa. GeoTest-projektet har också inkluderat dessa samtester när testmodell och testplan togs fram. De teman och myndigheter som GeoTest-projektet har utfört transformationstester för är följande: Tema 2.2 - Höjd och djup (EL): Åt Lantmäteriet och Sjöfartsverket. Tema 3.7 - Anläggningar för miljöövervakning (EF): Åt SGU och Naturvårdsverket. Tema 3.11 - Områden med särskilda restriktioner (AM): Åt Naturvårdsverket och SGU. Efter testerna har följande resultat rapporterats till kommissionen: Rapport som beskriver tillvägagångssätt och resultat. Produkter som matchningstabeller och transformerade datamängder har bifogats. Konkreta förslag på förbättringar av dataspecifikationerna. Utöver detta har GeoTest rapporterat resultaten till testande myndigheter och miljödepartementet, och synpunkter på dataspecifikationerna har lämnats till Lantmäteriet inför deras sammanställning av det svenska remissvaret. Då rapporteringen till kommissionen var förhållandevis övergripande, syftar denna rapport till att på ett mer utförligt sätt beskriva de tester som har utförts. Syftet är således att rapporten skall bidra med ytterligare information till berörda myndigheter, som hjälp i det kommande arbete med att Inspire-anpassa sina data. I följande avsnitt kommer metod, resultat och slutsatser för testerna att beskrivas. 2 Metod för transformationstester Målet med testerna är att mäta den tekniska genomförbarheten för transformation av lokala data till Inspire-kompatibla datamängder. Resultaten från transformationstesterna är dels en uppskattning av transformerbarhet och dels konkreta förslag på förbättringar av dataspecifikationerna. Målet är även att samtesta olika datamängder för samma tema. Vid samtest slås därför olika datamängder inom samma tema ihop, transformeras och resultaten analyseras. Transformering av data kan antingen utföras i förväg och sparas i en cache (offline transformation), vid det ögonblick då data efterfrågas (on-the-fly-transformation) (Beare et al., 2010), eller via en kombination av de båda (Hemmatnia, Broecke och Rammsdonk, 2010). Under en offlinetransformation används principen Extract Transform Load (ETL), vilket innebär att data Extraheras från källan (ofta en databas), Transformeras och Laddas och sedan in i ett nytt system. Med en on-the-fly-transformation menas att data är kvar i källdatabasen och att transformationerna 5
exekveras vid den tidpunkt då de efterfrågas. I våra transformationstester använder vi oss av ETL. Orsaken är främst att undvika tidsödande uttag ur databasen för varje testkörning. En viktig del i transformationsprocessen är schemaöversättning. Schemaöversättningen, vars mål är att översätta ett dataschema till ett annat, består av tre komponenter: Schemamatchning: Identifiering av koncept i källschemat som delar mening med koncept i målschemat. Schemamappning: Specificering av hur koncept i källschemat relaterar till koncept i målschemat. Det vill säga hur data skall transformeras till målschemat. Till exempel klassificeringar, typkonverteringar, namnbyten etc. Schematransformation: Exekvering av mappningarna/transformationsreglerna. Termen koncept inkluderar i detta sammanhang objekttyper, attribut/element, datatyper, värden osv. Vid transformation av geodata behövs ofta både icke-rumsliga och rumsliga/geometriska transformationer. Dessa kan antingen utföras i samma verktyg eller separat. I våra tester har separata verktyg använts (se kapitel 2.1.4 Val av verktyg). De rumsliga transformationerna och de icke-rumsliga schemamappningar och schematransformationer skiljs därför åt i denna rapport. Testmetoden delas således in i tre delar: 1. Skrivbordsstudie: Analys av krav i Inspire-specifikationer, schemamatchning och val av verktyg för transformation (Figur 1). 2. Transformation: Rumslig transformation och formatkonvertering (Figur 2); och (ickerumslig) schemamappning och schematransformation (Figur 3). 3. Validering: Validering av transformerade data mot dataspecifikation (Figur 4). 6
Figur 1: Skrivbordstudie. Tillvägagångssätt är följande: (1) Krav i Inspire s dataspecifikationer analyseras; (2) en schemamatchning utförs mellan källdata och Inspire-specifikation; (3) matchningstabell valideras mot domänexpert; (4) verktyg för transformation väljs beroende på vilka operationer som måste utföras. Figur 2: Transformeringsfas. Utifrån krav och rekommendationer slås olika källdatamängder ihop, transformeras och/eller konverteras. 7
Figur 3: Transformeringsfas. En schemamappning och schematransformation utförs där källdata omvandlas till den grad att de följer Inspire s scheman. Figur 4: Validering. De transformerade datamängderna valideras mot Inspire s scheman och dataspecifikationer. Därefter skapas en testrapport. Som nämnts analyseras dataspecifikationerna och genomförbarhet för transformation utifrån ovan beskrivna tester. Angående genomförbarhet för transformation används följande mått (detta dokumenteras främst i matchningstabellerna, vilket visas i Figur 1-Figur 4): Resursförbrukning: Tid som gått åt till att transformera källdata till Inspire-kompatibla datamängder. Varje delmoment har rapporterats. Erforderlig erfarenhet hos personal för att klara av att utföra transformationerna. Investeringskostnader. Till exempel vid köp av mjukvara och utbildning. Måluppfyllelse: Kvantifiering av antalet objekt, attribut och associationer som kan eller inte kan transformeras till målschemat. Antal problematiska transformationer. Exempelvis transformationer som kräver manuellt arbete eller som påverkar kvaliteten negativt. 8
Komplexitet av de nödvändiga operationerna. Hur stor del av de matchade attributen som är konstanta för en datamängd Komplexitet av operationer har kategoriserats enligt Tabell 1, se Beare et al. (2010). Komplexiteten på transformationerna kan ge en indikation om hur mycket källdata skiljer sig mot måldata. Tabell 1: Komplexitet av transformationer Komplexitet Beskrivning Nivå 1 Namnbyte av klasser (objekttyper) och attribut Nivå 2 Enkel härledning av attribut-värde Nivå 3 Sammanslagning av element Nivå 4 Komplex härledning och dynamisk typselektering Nivå 5 Härleda värden baserade på flera objekttyper/element Nivå 6 Sammanflätning och modell-generalisering De kommentarer på dataspecifikationerna (se Figur 1-Figur 4) som gjordes berörde främst: Vaga eller otillräckliga definitioner och förklaringar. Otillräckliga kodlistor och attribut. Inkonsistens mellan dataspecifikationer och tillhörande GML-scheman. Datamodeller som skapar redundanta data. I följande underkapitel beskrivs de tre delarna i testmetoden. 2.1 Skrivbordsstudie Målet med skrivbordsstudien är att analysera källdata, krav och rekommendationer i Inspirespecifikationerna, utföra schemamatchning samt välja lämpliga verktyg för transformationerna. Skrivbordsstudien består således av fyra moment: 1. Analys av källdata. 2. Analys av dataspecifikationer. 3. Schemamatchning mellan källschema och Inspire-schema 4. Val av verktyg för transformation. Det övergripande tillvägagångssättet beskrivs i Figur 1. 9
2.1.1 Material - Källdata De lokala data/källdata som transformationstestats har levererats av Sjöfartsverket, Lantmäteriet, Naturvårdsverket och Sveriges Geologiska Undersökning (SGU). Nedan presenteras de testade datamängderna för respektive tema och myndighet. 2.1.1.1 Tema 2.2 Höjd och djup (EL) För tema Höjd och djup har två typer av höjddata från två myndigheter testats (Sjöfartsverket och Lantmäteriet). Dessa täcker båda Bergkvara kustområde och gränsar till varandra. Det senare var nödvändigt för att samtester skulle kunna utföras. Sjöfartsverket Djupdata som har levererats från Sjöfartsverkets består av följande: Oreducerade djuppunkter (Figur 5): Från djupdatabasens arkivlager (18datamängder). Puntkttätheten varierar på sjömätningsmetod. Högst täthet är runt hamnar och grunda farleder. o Format: xyz ASCII-filer. o Horisontell projektion: SWEREF 99 TM. o Vertikal referensnivå: Medelvattenytan år 2000 (MVY 2000). Sjömätningsytor: Information om vilken sorts sjömätning som utförts över ett visst område. Innehåller attribut om till exempel metod, årtal, utrustning etc. o Format: ESRI Shape. o Projektion: SWEREF 99 TM. Figur 5: Oreducerade djuppunkter över Bergkvara kust 10
Lantmäteriet För Lantmäteriet har höjddata från GSD-Höjddata, grid 2+ testats: GSD-Höjddata, grid 2+: Höjdmodell över Bergkvara kustområde. Fyra bearbetningsrutor på 2,5 x 2,5 km (Figur 6 a). o Format: Esri ASCII Grid (4 st). o Horisontell projektion: SWEREF 99 TM o Vertikalt referenssystem: RH 2000. Puntkttäthet: För varje bearbetningsyta levereras information om punkttäthet (Figur 6 b). o Format: TIF o Horisontell projektion: SWEREF 99 TM Figur 6: a) GSD-Höjddata, grid 2+ över Bergkvara; b) Punkttäthet över samma bearbetningsytor (svart färg innebär noll punkttäthet). 2.1.1.2 Tema 3.7 - Anläggningar för miljöövervakning (EF) Totalt har fyra datamängder testats från två myndigheter, SGU och Naturvårdsverket. SGU SGU har tillhandahållit två rikstäckande datamängder för miljöövervakning av grundvattenkemi (Figur 7 a): information om stationer, representerade som punkter. 11
o Format: ESRI Shape o Projektion: SWEREF 99 TM information om program och nätverk. Utan geometrier. o Format: Excel Utöver ovanstående datamängderna har kompletterande information muntligen erhållits om två olika processtyper (som kan kopplas till ett av nätverken). Naturvårdsverket Naturvårdsverket har tillhandahållit två rikstäckande datamängder (Figur 7 b): Stationer som mäter trender och variationer i vattnets kemi i olika sjötyper över landet o Format: ESRI Shape o Projektion: SWEREF 99 TM Stationer som mäter försurande och övergödande nedfall över Sverige o Format: ESRI Shape o Projektion: SWEREF 99 TM Båda datamängderna representerar stationerna som punktgeometrier. Information om de nätverk som dessa stationer tillhör har hämtats manuellt från Miljödataportalen. Både SGU och Naturvårdsverket har även tillhandahållit datamängder innehållande mätserier. Dessa data ska beskrivas via standarden Objects and Measurement (ISO, 2011). Eftersom Geo- Test i huvudsak ska testa Inspire s dataspecifikationer, och det i dataspecifikationen för Anläggningar för miljöövervakning även saknades bra beskrivningar över hur denna ska länkas samman med Objects and Measurements har mätseriedata inte tagits med i dessa tester. 12
Figur 7: a) Miljöövervakning av grundvattenkemi; b) Miljöövervakning av nederbörd och vattenkemi 2.1.1.3 Tema 3.11 - Områden med särskilda restriktioner (AM) För tema AM har totalt 11 datamängder testats från två myndigheter: Naturvårdsverket och SGU. SGU För SGU har sex datamängder testats angående undersökningstillstånd och bearbetningskoncessioner för mineralrättigheter (Figur 8a). Nedan tillstånd och förbud gäller för olika företag och privatpersoner som bedriver mineralprospektering eller koncessioner att bearbeta mineral som gruvor och torvtäkter. Beviljade undersökningstillstånd för metaller och industrimaterial. Beviljade undersökningstillstånd för diamanter, olja och gas. Förbudsområden 1-årsregeln för diamanter, olja och gas. Förbudsområden 1-årsregeln för metaller och industrimaterial. 13
Beviljade bearbetningskoncessioner. Gällande torvkoncessioner. Datamängderna innehåller information som innehavare, valt förstahandsmineral, tillståndets namn, identitetsnummer och giltighetstid. Metadata finns på Geodata.se. För samtliga datamängder gäller följande: Format: ESRI Shape Projektion: SWEREF 99 TM Naturvårdsverket För Naturvårdsverket har fem skyddade områden enligt ramdirektivet för vatten (EC, 2000) testats (Figur 8 b). Dessa är: Avloppsvattenkänsliga områden (två datamängder: kväve och fosfor): Områden som kräver mer långtgående rening av avloppsvatten från tätort än vad övriga områden gör. Badplatser: Områden med många badande under säsongen där vattenkvaliteten övervakas. Fiskvattenområden: vattenområden som är speciellt viktiga för att upprätthålla fiskbestånden Nitratkänsliga områden: områden särskilt känsliga för nitratbelastning Badplatser representeras som punkter och de övriga datamängderna som polygoner. Vidare finns metadata på Geodata.se. För samtliga datamängder gäller följande: Format: ESRI Shape Projektion: SWEREF 99 TM 14
Figur 8: a) Undersökningstillstånd och bearbetningskoncessioner inom mineralrättsregistret; b) Olika skyddade områden enligt ramdirektivet för vatten. 2.1.2 Analys av Inspire s dataspecifikationer För att få vetskap om hur de Inspire-kompatibla datamängderna skall se ut och vilka krav och rekommendationer de bör uppfylla, behöver målspecifikationerna inspekteras. Först och främst granskas datamodellerna och de olika krav som finns specificerade. De specificerade kraven och rekommendationerna kan kategoriseras i två delar: Kompatibilitet med scheman (data skall vara strukturerat enligt specificerade objekttyper, datatyper, attribut, kodlistor etc.) o Kapitel 5 - Data content and structure. o Kapitel 9 - Delivery. Övriga krav och rekommendationer o Kapitel 2 - Overview. o Kapitel 6 - Reference systems. 15
o Kapitel 7 - Data quality. o Kapitel 8 - Dataset-level Metadata. o Kapitel 10 - Data capture. o Kapitel 11- Portrayal. Kapitel 8 och 11 har legat utanför transformationstesterna. Kapitel 7 och 10, som innehåller krav och rekommendationer på kvalitet, har inte kunnat testas fullt ut då mycket av innehållet fortfarande är under diskussion. Prioritet i testerna har legat på att lokala datamängder skall bli kompatibla med schemana för varje tema. Generellt för samtliga Inspire-teman är att de skall uppfylla nedan krav: Allmänna krav om anpassning till schema o Rumsliga datamängder som relaterar till temat skall använda de objekttyper och datatyper som anges i schemat o Varje geografiskt objekt skall uppfylla alla de restriktioner som anges för dess objekttyp eller datatyp. Referenssystem o Geografiska koordinatsystem: Datumet European Terrestrial Reference System 1989 (ETRS89) skall användas. o Temporala referenssystem: För datum skall den Gregorianska kalendern användas. Tidsvärden skall tillhandahållas antingen med UTC eller i lokal tid plus tidszon. Format o Datamängder skall levereras i GML 3.2.1 och följa för temana tillhörande XMLschema. I följande underkapitel ges en översiktlig presentation av de teman som har testats. 2.1.2.1 Tema 2.2 - Höjd och djup Temat Höjd och djup (EL, 2011) definieras som digitala höjd/djup-modeller för land, is och havsytor. Dessa inkluderar topografi, batymetri och strandlinjer. Temat består av fyra datamodeller: Base, Vector, Coverages och TIN (Figur 9). På grund av de många modellerna i Höjd och djup visas dessa modeller i Bilaga 1: Datamodeller tema 2.2 Höjd och djup. 16
Figur 9: Överskådlig UML-modell av modellerna Base, Vector, Coverages och TIN. Varje schema beskriver vilka objekttyper det innehåller. Objekttyper som angetts i kursiv text är abstrakta. Om modellen Coverages skall användas bör dataspecifikationen och dokumentet GML Application Schema for Coverages (Baumann, 2010) studeras. 2.1.2.2 Tema 3.7 - Anläggningar för miljöövervakning Temat beskriver placering och användning av anläggningar för miljöövervakning. Dataspecifikationen (EF, 2011) beskriver en generell modell vars syfte är att utgöra en gemensam struktur som olika domäner ska kunna använda (Figur 10). Dataspecifikationen hänvisar till ISO 19156-standarden Observation and Measurements (ISO, 2011) för beskrivning av mätserier, d.v.s. för tidsserier över mätta, modellerade eller simulerade data. Inspire har tagit fram ett vägledande dokument, D2.9 Guidelines for the use of Observations & Measurements and Sensor Web Enablement-related standards in INSPIRE Annex II and III data specification development (C-TWG, 2011), som ger en beskrivning över hur denna standard ska användas. 17
Figur 10: Överskådlig UML-modell av Anläggningar för miljöövervaknings applikationsschema För att kunna implementera temat Anläggningar för miljöövervakning måste både dataspecifikationen för temat samt dokument D2.9 studeras. Tillgång till standarden ISO 19156 är också att rekommendera. 2.1.2.3 Tema 3.11 - Områden med särskilda restriktioner Områden med särskilda restriktioner (AM, 2011) definieras som områden som har fastställts i enlighet med särskilda lagstiftande krav för att leverera följande miljömål: Skydda och förbättra miljöns kvalitet. Skydda miljö- och naturresurser 18
Skydda och kontrollera risker från naturkatastrofer eller katastrofer skapade av människor. Skydda växters, djurs och människors hälsa. Kontrollera utveckling och fysisk planering Schemat (Figur 11) kan alltså innehålla in mängd olika typer av områden, och det anger också information om ansvarig myndighet, administrativa uppgifter samt information om de kontrollerade aktiviteter som utförs inom dessa områden. Figur 11: UML-modell för tema 3.7 Områden med särskilda restriktioner. 2.1.3 Schemamatchning En schemamatchning är det första steget i en schemaöversättning. Under denna process matchas koncept i målschemat (i detta fall Inspire-scheman) med koncept i källschema/källdata som har samma, eller liknande, betydelse. Det primära syftet med schemamatchningen brukar vara 19
att få vetskap om vilka koncept i källdata som kan transformeras till vilka koncept i målschemat. Resultatet kommer således att ligga till grund för de kommande schemamappningar och schematransformationer. Under schemamatchningen identifieras också problem i form av källdata som saknas eller eventuella problematiska transformationer. Detta illustreras via en gapanalys som kan ligga till grund för kostnad-nytta-analyser. En schemamatchning görs ofta i samarbete med domänexperter för respektive tema. Formellt kan en transformation beskrivas som: Där representerar mängden av samtliga. I en schemamatchning beskrivs därför de första stegen i en transformation. Schemamatchningar kan genomföras manuellt eller semi-automatiskt/automatiskt. Det finns ännu utmaningar för automatiska matchningsverktyg (Lee, 2010), och vid förmedling via ett lättförståeligt medium är matchningstabeller i kalkylprogram att föredra. Dock kan verktyg för automatisk schemamatchning vara att föredra när tusentals koncept skall matchas mot varandra. Det allmänna tillvägagångssättet under en manuell matchning är som sagt att avgöra om två eller flera koncept i olika scheman representerar samma koncept i verkligheten. Inspire s testgrupp har för varje tema skapat matchningstabeller i Excel (Figur 12) vilka har erbjudits de testande. Dessa matchningstabeller har exporterats automatiskt från UMLmodellerna. I våra tester har vi använt dessa matchningstabeller. Komplexa attribut (attribut som i sin tur innehåller attribut) har ibland inte beskrivits korrekt och vi har därför fått göra modifieringar för att få med samtliga attribut. Vi har dessutom lagt till en notering på transformationsnivå för varje attribut som skall transformeras. Tillvägagångssättet för schemamatchningarna (se figur 1) i testerna är följande: 1. Identifiering av koncept (objekttyper, attribut och övriga data). 2. För varje koncept i målschemat anges motsvarande koncept i källschemat. 3. Preliminära mappningar och transformationsgrader anges. 4. Noteringar och kommentarer vid tveksamma matchningar, vilket fungerar som kommunikation till domänexperter. 5. Validering av matchningarna mot domänexpert. 6. Matchningstabellerna uppdateras efter återkoppling. 7. Kommentera eventuella brister i dataspecifikationerna som upptäckts vid matchningen. Exempelvis oklara beskrivningar och otillräckliga kodlistor. 20
I följande avsnitt presenteras de schemamatchningar som har utförts för respektive tema. Notera att matchningarna endast redovisas översiktligt på objekttyp-nivå. De detaljerade mappningarna med attributnivå inkluderad redovisas i kapitel 2.2 Transformation. Figur 12: Exempel på matchningstabell i Microsoft Excel 2.1.3.1 Tema 2.2 - Höjd och djup För temat Höjd och djup matchades källdata från Sjöfartsverket och Lantmäteriet mot de fyra modellerna Base, Vector, Coverages och TIN. Förutom beskrivningen av de data som matchats har även transformationsnivå angetts för varje matchat attribut. I följande avsnitt presenteras vilka objekttyper som vilka källdata har blivit matchade mot. Sjöfartsverket För Sjöfartsverket matchades djupdata mot sju objekttyper i fyra datamodeller (Figur 13). De objekttyper som inte lokala data matchades mot var BreakLine och IsolatedArea i modellen Vector, samt specifika objekttyper för höjddata. Innan de flesta schemamatchningarna kunde utföras var data för vissa objekttyper först tvunget att skapas utifrån de oreducerade djuppunkterna. Detta gällde för modellerna TIN och Coverages, samt för objekttyperna DepthContour (djuplinjer) och VoidArea. För modellen Base skapades många nya värden då inga data fanns tillgängliga för denna. I kapitel 2.2.1 Rumslig transformation och formatkonvertering redovisas det i detalj hur de nya objekttyperna skapades utifrån de oreducerade djuppunkterna. Formellt kan schemamatchningarna för varje modell och objekttyp beskrivas som nedan. Modell Base 21
Där representerar data och information från andra platser än själva attributen i datamängderna. Till exempel metadata, tillhörande information och tolkning av data. Modell Vector Där representerar reducerade djuppunkter, representerar djuplinjer och representerar tomma områden. Samtliga datamängder skapades utifrån de erhållna oreducerade djuppunkterna (se 2.1.1.1, Sjöfartsverket). Modell Coverages Där representerar ett grid skapat utifrån de oreducerade djuppunkterna. Modell TIN Där representerar ett TIN skapat utifrån. 22
Figur 13: Data matchades mot samtliga relevanta objekttyper förutom IsolatedArea och Break- Line. De övriga namn representerar datatyper och abstrakta objekttyper (i kursiv stil). Contour- Line och SpotHeight representerar höjddata. Lantmäteriet För Lantmäteriet utfördes schemamatchningar för sex objekttyper i fyra modeller (Figur 14). Då data levererades i Esri ASCII Grid kunde dessa matchas direkt mot modellen Coverages. För övriga modeller fick data skapas utifrån källdata. Formellt beskrivs schemamatchningarna för varje modell och objekttyp nedan. Modell Base Där representerar data och information från andra platser än själva attributen i datamängderna. Till exempel metadata, tillhörande information och tolkning av data Modell Vector Där representerar höjdlinjer som genererats från den erhållna datamängden GSD- Höjddata (se 2.1.1.1, Lantmäteriet). Modell Coverages Där representerar GSD-Höjddata. Modell TIN Där representerar ett TIN skapat utifrån. 23
Figur 14: Data matchades mot samtliga relevanta objekttyper förutom IsolatedArea, BreakLine och VoidArea. De övriga namn representerar datatyper och abstrakta objekttyper (i kursiv stil). 2.1.3.2 Tema 3.7 - Anläggningar för miljöövervakning Dataspecifikationen för Anläggningar för miljöövervakning är en komplex modell som innehåller totalt 13 objekttyper. Dessa objekttyper innehåller i sin tur 10 obligatoriska attribut, 20 upphävbara (voidable) attribut och 17 valfria attribut. Förutom beskrivningen av de data som matchats har även transformationsnivå angetts för varje matchat attribut. Se Figur 15 för de utförda matchningarna 24
Figur 15: Data matchades mot de sju i figuren markerade objekttyperna. I följande avsnitt presenteras de utförda schemamatchningarna för SGU och Naturvårdsverket. SGU Innehållet i källdata har analyserats och sedan matchats mot stationer, program och nätverk (objekttyperna EnvironmentalMonitoringFacility, EnvironmentalMonitoringNetwork, EnvironmentalMonitoringProgram, OperationalActivityPeriod och ObservingCapability). Dessa matchningar har granskats av SGU och vissa justeringar har sedan gjorts i matchningstabellen. Utöver informationen från källdata har SGU beskrivit två typer av processer för miljöövervakning. Denna information har definierats som konstanter för ytterligare tre objekttyper (Observing- Capability, INSPIRE_OM_Process och INSPIRE_GF_PropertyType). Formellt beskrivs de utförda matchningarna på objektnivå som: 25
Där representerar data om program och nätverk (utan geometrier) och är punktdata som beskriver stationer för övervakning av grundvattenkemi (se 2.1.1.2, SGU). Naturvårdsverket Källdata har analyserats och sedan matchats mot stationer (objekttypen EnvironmentalMonitoringFacility). Information om nätverk finns på Miljödataportalen vilken har används för objekttypen EnvironmentalMonitoringNetwork. Formellt beskrivs de utförda matchningarna på objektnivå enligt följande: Där representerar stationer som mäter försurade och övergödande nedfall, är stationer som mäter trender och variationer i vattnets kemi, och är den information som hämtats från bland Miljödataportalen (se 2.1.1.2, Naturvårdsverket). 2.1.3.3 Tema 3.11 Områden med särskilda restriktioner För temat Områden med särskilda restriktioner matchades källdata från SGU och Naturvårdsverket mot modellen Area Management Restriction and Regulation Zones. Förutom beskrivningen av de data som matchats har även transformationsnivå angetts för varje matchat attribut. SGU Samtliga av datamängder angående undersökningstillstånd och bearbetningskoncessioner för mineralrättigheter har matchats mot Inspire-temat i en och samma matchningstabell. Mycket information har funnits på andra platser än i själva attributen. Till exempel i namnet på datamängderna eller på Internet. Efter en första matchning gjordes en validering av matchningsresultatet mot domänexperter på SGU. Formellt beskrivs de utförda schemamatchningarna, på objektnivå, nedan. 26
Där och representerar de olika datamängderna för undersökningstillstånd och bearbetningskoncessioner för mineralrättigheter (se 2.1.1.3, SGU). är en samlingsklass för de data inom som styrs av samma lagar och riktlinjer (vilket syns i UML-modellen i 2.1.2.3). Naturvårdsverket Samtliga datamängder angående skyddade områden enligt vattendirektivet har även här matchat mot Inspire-temat i en och samma matchningstabell. Också i detta fall har mycket information funnits på andra platser än i själva attributen. Främst gäller det miljödataportalen och information hos Vattenmyndigheterna. De utförda schemamatchningarna, på objektnivå, beskrivs formellt som: Där och representerar de olika datamängderna för skyddade områden enligt vattendirektivet. 2.1.4 Val av verktyg Det finns i dag flera programvaror som kan utföra rumslig dataharmonisering, såväl kommersiella som de som är baserade på öppen källkod (Steiniger och Bocher, 2009). Vilka verktyg som bör väljas kan bero på vilka transformationer som skall utföras, hur data skall lagras och publiceras, om transformationer utförs via ETL (Extract, Transform, Load) eller on-the-fly samt licenskostnader/tillgängliga licenser. Se exempelvis Bear at al. (2010) för en undersökning av olika verktyg för schematransformation som stöder rumsliga transformationer. Många verktyg för rumslig dataharmonisering brukar ofta ha ett bristfälligt stöd för XML-grammatiken Geographical Markup Language (GML). Detta gäller särskilt GML version 3.2.1, vilket är det format som data skall tillhandahållas i enligt Inspire s dataspecifikationer. Ett alternativt tillvägagångssätt är att utföra de rumsliga transformationerna i ett GIS-verktyg och den icke-rumsliga schemaöversättningen i verktyg specialiserade för XML-transformationer. Detta har vi gjort vid transformationstesterna. Altova Mapforce är ett verktyg för (icke rumslig) schemaöversättning med kraft- 27
fulla funktioner för XML. Det har här använts i kombination med kommersiella GIS-verktyg och GIS-verktyg baserade på öppen källkod, se Tabell. Tabell 2: Verktyg för transformationstester Process Verktyg Licenser Kostnader Schemamatchning Microsoft Excel Kommersiell eller Inga eller Open Office öppen källkod Rumslig transformation Quantum GIS Öppen källkod Inga ArcGIS Desktop 60 dagar fri Inga 10 Schemamappning/ Schematransformation Altova Mapforce 2 Professional edition: $800 Validering oxygen XML Editor 1 Lärarlicens Professional: $350 2.2 Transformation När den förberedande skrivbordsstudien är gjord kan transformationer påbörjas. Målet med denna fas är att transformera data till Inspire-kompatibla datamängder och identifiera problem och kostnader som kan uppstå under processen. Transformeringsfasen är uppdelad i följande två delar (Figur 2-Figur 3). 1. Rumslig transformation och formatkonvertering 2. Schemamappning och schematransformation. Notera att de rumsliga transformationerna kan inkluderas i schemamappningen, om mappningsverktyg med tillräckliga funktioner för både XML-transformationer och rumsliga transformationer används. Formellt kan en transformation beskrivas som: Där representerar mängden av alla. 2.2.1 Rumslig transformation och formatkonvertering Rumsliga transformationer (eller geometriska transformationer) är den process som omvandlar de geografiska elementen i data. Under transformationstesterna är målet dels att utföra de nödvändiga transformationerna till den grad att data uppfyller de geometriska kraven i dataspecifikationerna, och dels att identifiera svårigheter och problem. Exempel på transformationer är kantmatchning, konvertering eller skapande av geometriska datatyper, omsampling/filtrering, geokodning, koordinattransformationer, hopslagning av ny och gammal information, omklassificeringar etc. Det kan krävas komplexa rumsliga transformationer om definitionerna på de geo- 28
grafiska objekten i målspecifikationerna skiljer sig stort från hur de beskrivs i källdata. Målet med formatkonvertering till de standardiserade formaten GML eller XML är för att underlätta hanteringen och bearbetningen av data. Det övergripande tillvägagångssättet, som beskrivs i Figur 2, är att utifrån krav och rekommendationer som påverkar geometrin transformera och konvertera källdatamängderna. Datamängder inom samma tema slås antingen i hop under den rumsliga transformationen eller under den resterande schemaöversättningen. De allmänna krav, för samtliga teman, som påverkar hur rumsliga data skall transformeras anges i kapitel 2.1.2 Analys av Inspire s dataspecifikationer. Utöver dessa finns åtskilliga tema-specifika krav och rekommendationer, vilka inte beskrivs här. I följande avsnitt beskrivs de utförda rumsliga transformationerna. Notera att i de formella beskrivningarna av transformationerna används samma namn på källdatamängderna som i avsnittet för schemamatchningar (2.1.3.1). 2.2.1.1 Tema 2.2 - Höjd och djup Förutom att transformera data så att de uppfyllde geometriska kraven och rekommendationerna i dataspecifikationen var även målet att utföra samtester. För temat Höjd och djup handlade det om att kombinera avgränsande djup- och höjddata till gemensamma höjd/djup-modeller i olika representationer. Utifrån dessa transformationer var det sedan möjligt att analysera målspecifikation och källdata utifrån lämplighet för sådana kombinerade modeller. Då datamängderna från Lantmäteriet och Sjöfartsverket slogs i hop till gemensamma modeller beskrivs transformationerna för båda myndigheterna i samma sektion. Nedan beskrivs transformationer formellt inom varje målmodell, d.v.s. Coverages, Vector, och TIN. För modellen Base behövdes inga rumsliga transformationer utföras. Modell Coverages representerar punkttäthet för varje (se 2.1.1.1, Lantmäteriet), används för att eliminera områden med noll punkttäthet (i stort sett bara de havsområden som djupdata 29
täcker) och är en koordinattransformation. och är de datamängder som sedan skall mappas mot objekttypen ElevationGridCoverage. Modell Vector Där och är datamängderna som skall mappas mot objekttyperna DepthContour och ContourLine (kapitel 2.2.2.1). Där kommer att mappas mot objekttypen SpotDepth (kapitel 2.2.2.1). De skapade tomma områdena ( ) används vid dessa tester endast för att ge exempel på hur data kan transformeras till objekttypen VoidArea och inte för att eliminera tomma områden vid skapandet av Grid- och TIN-modellerna (vilket kan göras senare vid behov). Modell TIN Där och kommer att mappas mot objekttypen ElevationTIN (kapitel 2.2.2.1). 2.2.1.2 Tema 3.7 - Anläggningar för miljöövervakning För SGUs och Naturvårdsverkets datamängder utfördes en koordinattransformation till ETRS89 samt en konvertering av geometrin till GML-format. Processen beskrivs formellt nedan. 30
Naturvårdsverket Där och är de datamängder som sedan mappas till objekttypen EnvironmentalMonitoringFacility (kapitel 2.2.1.2). SGU Där sedan mappas till EnvironmentalMonitoringFacility och till EnvironmentalMonitoringNetwork och EnvironmentalMonitoringProgram. 2.2.1.3 Tema 3.11 - Områden med särskilda restriktioner Förutom koordinattransformation till ETRS89 och formatkonvertering till GML slogs datamängderna från varje myndighet i hop till gemensamma datamängder, och enkla geometrikonverteringar (punktskikt med badplatser till polygoner) utfördes. Samtesterna för detta tema handlade om att slå i hop samtliga datamängder till en datamängd och undersöka om det uppstod konflikter. Naturvårdsverket Där sedan mappas till ManagementRegulationOrRestrictionZoneCollection. 31
SGU är den datamängd som sedan mappas till ManagementRegulationOrRestrictionZoneCollection. 2.2.2 Schemamappning och schematransformation Under en schemamappning specificeras det hur koncept i källschemat relaterar till koncept i målschemat. En annan beskrivning är att transformationsregler skapas. Dessa exekveras sedan under schematransformationen. Schemamappningen och schematransformationen utfördes i programvaran Altova MapForce och det generella tillvägagångssättet (figur 3) har varit att: 1. Mappa lokala GML-scheman mot Inspire s GML-scheman. Matchningstabeller och dataspecifikationer fungerar som kompletterande information. Kommentera dataspecifikationerna utifrån: a. Vaga eller otillräckliga definitioner och förklaringar. b. Otillräckliga kodlistor och attribut. c. Inkonsistens mellan dataspecifikationer och tillhörande GML-scheman. d. Datamodeller som skapar redundanta data. 2. Exekvera mappningarna (schematransformation). 3. Uppdatera matchningstabellerna med information om bland annat transformationsgrad och problematiska transformationer. Vanliga operationer som förekommer vid en schemamappning är format- och värdekonverteringar, omstrukturering, omdöpning, sammanslagning/uppdelning, filtrering, nyskapande av värden och omklassificeringar (Lehto, 2007). GIS-operationer kan också förekomma om det finns funktionalitet för det. En mappning kan utföras på datamängder, objekttyper, element, instanser eller en kombination av dem. Dessa kan i sin tur delas in i En-till-en. Exempel: Ett element i källschemat mappas direkt till ett element i målschemat. En-till-flera/flera-till-en. Exempel: Ett element i källschemat delas upp och mappas till flera element i målschemat, eller flera element i källschemat delas upp och mappas till ett element i målschemat. 32
Flera-till-flera. Exempel: Flera element i källschemat mappas till flera element i målschemat. Under våra tester har schematransformationerna utförts i Altova Mapforce. I de följande delkapitlen beskrivs de schemamappningar och schematransformationer som utförts för varje tema. De formella beskrivningarna delas in i nivåer för objekttyp och dess attribut. Vidare är strukturen för transformation den följande: Där kan uteslutas om dataspecifikationen endast innehåller en modell och kan utökas med underattribut. Om samma operation utförs på flera attribut inom samma objekttyp eller attribut anges de berörda attributen inom hakparenteser. 2.2.2.1 Tema 2.2 - Höjd och djup I de föregående rumsliga transformationerna förbereddes datamängderna till den grad att schemamappning och schematransformation i Altova Mapforce kunde utföras. Djup- och höjddata för Sjöfartsverket och Lantmäteriet mappades till respektive Inspire-scheman. Efter detta slogs samtliga datamängder samman till modellen Base. Nedan beskrivs formellt de mappningar som utförts. Modell Base Schemamappningen till modellen Base var gemensam för både Sjöfartsverket och Lantmäteriet. Objektnivå Attributnivå [ ] Objektnivå Attributnivå [ ] 33
Sjöfartsverket Modell Vector Objektnivå Attributnivå [ ] Där innebär skapande av nya värden, exempelvis konstanta värden, och representerar data och information från andra platser än själva attributen i datamängderna. Objektnivå Attributnivå [ ] Objektnivå Attributnivå [ ] 34
Modell Coverages Objektnivå Attributnivå [ ] Modell TIN Objektnivå Attributnivå [ ] Lantmäteriet Modell Vector Objektnivå 35
Attributnivå [ ] Modell Coverages Objektnivå Attributnivå [ ] Modell TIN Objektnivå Attributnivå [ ] 36
Sammanslagning av höjd- och djupdata (samtest) Efter att schemamappningar och transformationer utförts för varje myndighets datamängder infogades varje objekttyp till samlingsklassen ElevationDataset. Där och representerar datamängder från både Sjöfartsverket och Lantmäteriet, och attributet innehåller de sammanfogade objekttyperna. Den transformerade datamängden ( ) döptes sedan om till SE_SFV_LM_ElevationDataset_Bergkvara. 2.2.2.2 Tema 3.7 - Anläggningar för miljöövervakning Datamängderna i GML och XML mappades i denna del sina respektive objekttyper och slogs sedan ihop till samlingsklassen EnvironmentalMonitoringFacilities. Nedan beskrivs de utförda schemamappningar och transformationer för SGU och Naturvårdsverket. SGU SGU s shape-fil med stationer för miljöövervakning av grundvattenkemi konverterades till en GML-fil (SGUEmfGML) och Excel-filen med programinformation konverterades till en XML-fil (SGUEmpXML). Därefter utfördes fyra separata mappningar mellan källdata GML-filer och Inspire xsd-filen för EnvironmentalMonitoringFacilities: 1. från program för miljöövervakning av grundvattenkemi till objekttypen Environmental- MonitoringProgram 2. från program för miljöövervakning av grundvattenkemi till EnvironmentalMonitoring- Network 3. från stationer för miljöövervakning av grundvattenkemi till objekttyperna EnvironmentalMonitoringFacility och OperationalActivityPeriod 4. konstanta värden till objekttyperna ObservingCapability, INSPIRE_OM_Process och IN- SPIRE_GF_PropertyType Mappningarna var av olika komplexitet, ett antal namnbyten och tillägg av konstanta värden, men även några konkateneringar av källdataelement, samt några lite mer komplexa filtreringsoperationer utfördes. Resultatet blev fyra Inspire GML-filer för EnvironmentalMonitoringFacilities. För att kunna slå ihop dessa mappades de fyra GML-filerna igen till Inspire xsd-filen för EnvironmentalMonito- 37
ringfacilities. Detta resulterade i en gemensam Inspire GML-fil innehållande alla från SGU mappade data. Objektnivå Attributnivå Objektnivå Attributnivå Objektnivå Attributnivå Objektnivå Attributnivå 38
Objektnivå Attributnivå Objektnivå Attributnivå Objektnivå Attributnivå Sammanslagning till en gemensam GML-fil Naturvårdsverket Naturvårdsverkets shape-filer för Försurande och övergödande ämnen i nederbörd (NVEmfGML1) och Sjöar trendstationer, vattenkemi (NVEmfGML2) konverterades till GML-filer. Därefter utfördes tre separata mappningar mellan källdata GML-filer och Inspire xsd-filen för EnvironmentalMonitoringFacilities: 1. från Försurande och övergödande ämnen i nederbörd till objekttypen Environmental- MonitoringFacility 2. från Sjöar trendstationer, vattenkemi till objekttypen EnvironmentalMonitoringFacility 3. konstanta värden (hämtade från Miljödataportalen) till objekttypen EnvironmentalMonitoringNetwork Alla mappningar var enkla att genomföra, det var antingen namnbyten, enkel värdemappning eller tillägg av konstanta värden. 39
De resulterande tre Inspire GML-filerna slogs sedan ihop till en gemensam GML-fil genom att mappa de tre filerna till Inspire xsd-filen för EnvironmentalMonitoringFacilities igen. Objektnivå Attributnivå Objektnivå Attributnivå Objektnivå Attributnivå 40
Sammanslagning till en gemensam GML-fil Sammanslagning datamängder (samtest) Både Naturvårdsverket och SGU är informationsansvariga myndigheter för temat Anläggningar för miljöövervakning. Myndigheterna är ansvariga för alla objekttyper inom temat, dvs. ingen uppdelning av informationsansvaret har gjorts mellan olika myndigheter. Det har därför inte skett någon samordning mellan myndigheterna vid tillhandahållandet av informationen. Som en enkel samtest har GML-filer från SGU och GML-filer från Naturvårdsverket slagits samman till en gemensam GML-fil för alla EnvironmentalMonitoringFacilities. Sammanslagning till en gemensam GML-fil Den sammanslagna datamängden döptes sedan om till SE_SGU_NV_EnvironmentalMonitoringFacilities 2.2.2.3 Tema 3.11 - Områden med särskilda restriktioner För temat Områden med särskilda restriktioner mappades de producerade datamängderna i GML till objekttypen ManagementRegulationOrRestrictionZoneCollection, vilket är en samlingstyp för områden (ManagementRegulationOrRestrictionZone) som regleras av samma direktiv och lagar. SGU För SGU transformerades den skapade GML-filen (MRRGML) innehållandes de sex hopslagna datamängderna för undersökningstillstånd och bearbetningskoncessioner för mineralrättigheter. De utförda mappningarna beskrivs formellt nedan. Objektnivå Attributnivå 41
MRORZ är en förkortning av ManagementRegulationOrRestrictionZone, vilket är den objekttyp som innehåller samtlig information. Den ingår sedan i samlingsklassen ManagementRegulation- OrRestrictionZoneCollection. Där innebär skapande av nya värden, exempelvis konstanta värden, och representerar data och information från andra platser än själva attributen i datamängderna. Naturvårdsverket Här transformerades den skapade GML-filen (OmrSärskRestrGML) innehållandes fem hopslagna skyddade områden enligt vattendirektivet ramdirektivet för vatten (avloppsvattenkänsliga områden, badplatser, fiskvattenområden och nitratkänsliga områden). Schemamappningarna och transformationerna beskrivs formellt nedan. Objektnivå Attributnivå 42
representerar information hämtad från andra ställen än själva attributen i da- Där tamängden. Sammanslagning av datamängder (samtest) Efter att de båda datamängderna för SGU och Naturvårdsverket transformerats till Inspire s schema slogs dessa i hop till en gemensam objekttyp Den sammanslagna datamängden döptes sedan om tillse_nv_sgu_areamanagementregulationorrestrictionzonecollection 2.3 Validering Målet med valideringsfasen är att säkerställa att de transformerade datamängderna uppfyller de krav som finns specificerade i dataspecifikationen. I våra tester utförs denna validering i två moment (Figur 4): Datamängderna, i GML, valideras i en XML-editor mot det Inspire GML-schema som de skall vara kompatibla med. I Inspire-specifikationerna täcker denna validering de flesta krav i kapitel 5 - Data content and structure samt kraven i kapitel 9 - Delivery. Datamängderna valideras mot kraven i Inspire-specifikationerna. I våra tester gäller detta främst kraven specificerade i kapitel 2 - Overview, kapitel 5 - Data content and structure och kapitel 6 - Reference systems. Valideringen görs genom att: o Granska datamängdernas geometrier i GIS-verktyg. o Manuellt gå igenom de specificerade kraven i Inspire-specifikationen. 43
Om datamängderna inte är giltiga mot sina respektive GML-scheman och Inspire-specifikationer utförs nödvändiga ändringar i transformeringsfasen varefter validering påbörjas igen. Resultatet av valideringen, som kan vara antingen positivt (giltiga data) eller negativt (ej giltiga data), rapporteras sedan. En kvalitetskontroll utförs också där antal objekt i de färdiga GML-filerna jämförs med källdata. Att manuellt gå igenom kraven i Inspire-specifikationerna är en långsam process, och när de slutgiltiga versionerna av Inspire-specifikationerna har publicerats kommer de att innehålla en testsvit som underlättar valideringsprocessen. Många krav och rekommendationer kan då anges i formaliserade språk för validering. Exempelvis Schematron (ISO, 2006), som kan kombineras med GML-scheman (se exempelvis Ford et al. (2011) och Costello och Simmons, 2008). Formellt kan en validering av datamängden beskrivas som: Där representerar mängden av alla I följande underkapitel redogörs den validering som utförts för de testade temana. Dessa processer var iterativa och ändringar i datamängderna gjordes tills de klarat samtliga fyra steg. 2.3.1 Tema 2.2 - Höjd och djup De transformerade datamängderna för Sjöfartsverket och Lantmäteriet validerades enligt stegen beskrivna i 2.3 Validering. Formellt beskrivs processen som: 2.3.2 Tema 3.7 - Anläggningar för miljöövervakning De transformerade datamängderna för SGU och Naturvårdsverket validerades enligt stegen beskrivna i 2.3 Validering. Formellt beskrivs processen som: 44
2.3.3 Tema 3.11 - Områden med särskilda restriktioner De transformerade datamängderna för SGU och Naturvårdsverket validerades enligt stegen beskrivna i 2.3 Validering. Formellt beskrivs processen som: 3 Resultat och diskussion GeoTest-projektets uppdrag har varit att bistå informationsansvariga myndigheter med test av de nya Inspire-specifikationerna som en del i myndigheternas remissarbete. Det övergripande syftet med testerna var att granska remissutgåvorna av Inspire s dataspecifikationer för bilaga II och III. GeoTest har testat transformationernas genomförbarhet, vars primära syfte är att mäta den tekniska genomförbarheten för transformation av lokala data så att de blir kompatibla med Inspire s dataspecifikationer. Det sekundära syftet är att, utifrån testerna, ge synpunkter på remissutgåvorna av dataspecifikationerna. Syftet var även att samtesta olika datamängder för samma tema. För att uppnå målen slogs därför olika datamängder inom samma tema ihop, transformeras och resultaten analyseras. Tre sorters resultat har erhållits från transformationstesterna: Transformationernas genomförbarhet. Synpunkter på dataspecifikationerna. Erfarenheter från testgenomförandet. Dessa presenteras i följande kapitel. 3.1 Transformationernas genomförbarhet 45
Testresultaten har analyserats för att studera om det är tekniskt genomförbart att transformera källdata så att de kan tillhandahållas enligt Inspire s dataspecifikationer. I analysen ingår även att bedöma hur svåra och tidskrävande dessa transformationer förväntas vara, det vill säga hur stor skillnad det är på struktur och innehåll mellan källdata och Inspire s dataspecifikationer. Måtten för att bedöma genomförbarhet av transformation har varit de följande: Med avseende på resursförbrukning o Tid som gått åt till att transformera källdata till Inspire-kompatibla datamängder. Varje delmoment har rapporterats. o Erforderlig erfarenhet hos personal för att klara av att utföra transformationerna. o Investeringskostnader. Till exempel vid köp av mjukvara och utbildning. Med avseende på måluppfyllelse o Kvantifiering av antalet objekt, attribut och associationer som kan eller inte kan transformeras till målschemat. o Antal problematiska transformationer. Exempelvis transformationer som kräver manuellt arbete eller som påverkar kvaliteten negativt. o Komplexitet av de nödvändiga operationerna. o Hur stor del av de matchade attributen som har fyllts med information från andra platser än själva attributen i källdata. Till exempel konstanta värden från webbsidor, metadata eller från tolkning av källdata. Resultat för resursförbrukning och måluppfyllelse presenteras i följande underkapitel. 3.1.1 Resursförbrukning Under testperioden har olika mått på resursförbrukning noterats. Dessa efter förslag och mallar från kommissionens utlysning (CT, 2011). Tidsåtgång Tidsåtgången för att transformera källdata till Inspire-kompatibla datamängder har delats in i olika delmoment och rapporterats till kommissionen (Tabell 2). Då vi har använt kommissionens mall för indelning av moment skiljer de sig en aning mot momenten i denna rapportstruktur. 46
Tabell 2: Tidsåtgång per delmoment för samtliga testade teman. Delmoment Tidsåtgång (i persondagar) Sätta upp infrastruktur för tester 5 Identifiera och samla in källdata 5 Studera dataspecifikationer och källdata 15 Utföra schemamatchning 15 Utföra schemamappning och schematransformation 20 Validera testresultaten 5 Dokumentera testresultaten 10 Administrera och koordinera testarbetet 10 Summa 85 Erfarenhet av personal Olika roller och kompetenser krävdes för att testarbetet skulle kunna genomföras: Ett lokalt testteam på de olika myndigheterna med expertkompetens inom den egna domänen och verksamheten. Testare på GeoTest med detaljerad kunskap om testmetoden och de verktyg som behövs för att utföra testerna. Samordnare mellan domänexperter och testare. Investeringskostnader Tabell 3 beskriver de verktyg som GeoTest använt för transformationstesterna. Både kommersiella programvaror och programvaror baserade på öppen källkod har använts. Samtliga rumsliga transformationer har dock kunnat utföras i de programvaror som baseras på öppen källkod. Den totala kostnaden för de programvaror som använts under testerna beräknas vara 1150. Tabell 3: Verktyg för transformationstester Process Verktyg Licenser Kostnader Schemamatchning Microsoft Excel eller Kommersiell eller öppen Inga Open Office källkod Rumslig transformation Quantum GIS Öppen källkod Inga ArcGIS Desktop 10 60 dagar fri Inga Schemamappning/ Schematransformation Altova Mapforce 2 Professional edition: 800 Validering oxygen XML Editor 1 Klassrumslicens Professional: 350 3.1.2 Måluppfyllelse I följande delar rapporteras de mått på måluppfyllelse som har analyserats för varje tema. Det vill säga GAP-analys, problematiska transformationer, transformationsgrad och andel konstanta värden. 47
Modellen för de olika transformationsnivåerna har tagits fram av Beare et al. (2010). Syftet har varit att kategorisera de funktioner som krävs av verktyg för de skall kunna transformera källdata till måldata. Modellen kan också ge en uppskatting om hur mycket källdata skiljer sig från målschema. Nedan ges en övergripande beskrivning. Varje nivå inkorporerar alla funktionaliteter från de föregående nivåerna. Nivå 1 - Namnbyte av klasser (objekttyper) och attribut: Detta innebär att endast namnen på objekttyper och attribut i källdata ändras. Innehållet i källdata är således identiskt med motsvarande innehåll i målschemat. Transformationerna utförs i 1:1 förhållanden. Nivå 2 - Enkel härledning av attribut-värde: Attribut i målschemat erhålls via en enkel härledning av attribut-värden i källdata. Till exempel genom konvertering av nummer till text, ifyllande av nya värden, konvertering av måttenheter, transformationer baserade på enkla geometriska funktioner etc. Transformationerna utförs i 1:1 förhållanden. Nivå 3 - Sammanslagning av objekttyper och attribut: Flera attribut/objekttyper i källdata kan slås samman till ett gemensamt i målschemat. Fortfarande råder här ett 1:1 förhållande i matchningen med avseende på semantiken. Sammanslagning beror i stället på att koncepten i källdata har delats upp vid lagring, till exempel i en relationsdatabas. Nivå 4 - Komplex härledning och dynamisk typselektering: Detta är en utökning av nivå 2 och en enskild klass kan mappas mot flera olika målklasser, beroende på värdena inom attributen i källdata. Till exempel, genom att använda filtreringsfunktioner (if/then/else, större än/mindre än, OR/NOT/AND etc.) och loopar. Nivå 5 - Härleda värden baserade på flera objekttyper/attribut: Till skillnad mot nivå 2-4 tillåter Nivå 5 att kontextuell information används för att skapa värden för målklassen. Exempel på detta är rumsliga relationer (within, overlaps, intersects), universella (for all features x then ) och existentiella kvalifikationer (there exists such a feature x such that ). Nivå 6 - Sammanflätning och modell-generalisering: Här tillåts en n:m-mappning där flera källkoncept kan mappas mot flera målkoncept. Till exempel skapande av separata geometrier från källdata, skapande av ett målkoncept från olika koncept i olika källscheman, generalisering av flera koncept till ett större målkoncept etc. Vad beträffar GAP-analyserna (t.ex. Tabell 4), anses attribut som matchade om de obligatoriska underliggande attributen (sub-attribut) har kunnat matchas. Vid kvantifieringen av de matchade attributen har de delats upp beroende på om de är obligatoriska, upphävbara (voidable) eller frivilliga. Antal attribut anges dels utan sub-attribut (d.v.s. huvudattribut) och dels med subattribut inräknade. De underliggande attributen klassificeras (obligatoriska, upphävbara eller frivilliga) som det huvudattribut de tillhör. 48
3.1.2.1 Tema 2.2 - Höjd och djup Sammanfattningsvis har det visat sig möjligt att för de testade datamängderna transformera höjd- och djup-data till samtliga scheman i Inspire s dataspecifikation för Höjd och djup. För Lantmäteriet och Sjöfartsverket är resultaten i GAP-analyserna identiska för de gemensamma objekttyperna eftersom många datamängder fick skapas utifrån de levererade källdata. Transformeringsgraden på de rumsliga transformationerna ansågs hög (nivå 6), vilket beror till stor del på att höjd- och djupdata slogs ihop till gemensamma modeller. Dessa transformationer bör emellertid kunna automatiseras och de verkar inte påverka kvaliteten på data negativt. Vidare är det värt att notera att i GAP-analyserna (Tabell 4 och 6) för schemana Base, Coverages och Vector SpotDepth finns det några attribut med ett stort antal sub-attribut. Orsaken är ofta kopplingar till externa modeller eller datatyper. Följande attribut utmärker sig: Coverages: Attributet rangetype, som beskriver strukturen på värdena i en yta, använder sig av swe:datarecord från OGC-standarden Sensor Web Enablement vilket innehåller ett stort antal sub-attribut. Vector SpotDepth: Varje djup- eller höjdpunkt kan tilldelas ett namn som består av temat Geographical Names eller objekttypen Sea Area Name från temat Sea Regions. Dessa består vardera av 11 attribut. Base: För objekttypen ElevationDataSet är det möjligt att använda ISO 19115-attributet för metadata, som består av ett stort antal attribut. I följande avsnitt presenteras måluppfyllelsen för de testade datamängderna. Sjöfartsverket För Sjöfartsverket transformerades djupdata till de fyra schemana Base, Vector, Coverages och TIN. Samtliga objekttyper testades förutom BreakLine och IsolatedArea inom schemat Vector eftersom testdata inte fanns för dessa. Sammanfattningsvis kunde alla obligatoriska attribut fyllas för de testade objekttyperna (Tabell 4). För vissa upphävbara och frivilliga attribut saknades det emellertid data. 49
Tabell 4: GAP-analys. Kvantifiering av attribut i Inspire-scheman som kunde fyllas med data. De antal som anges inom parenteser inkluderar samtliga underliggande attribut. Notera att schemat Base innehåller två objekttyper: ElevationDataset och ElevationReference. Schema Obligatoriska Upphävbara (voidable) Frivilliga Inspire Transformerade % Inspire Transformerade % Inspire Transformerade % EL-Base 3 (5) 3 (5) 100% (100%) EL-Vector: 5 (7) 5 (7) 100% DepthContour (100%) EL-Vector: SpotDepth EL-Vector: VoidArea 5 (7) 5 (7) 100% (100%) 3 (5) 3 (5) 100% (100%) EL-Coverages 7 (29) 7 (9) 100% (31%) EL-TIN 5 (7) 5 (7) 100% (100%) 3 (33) 2 (2) 67% (6%) 5 (5) 5 (5) 100% (100%) 4 (4) 4 (4) 100% (100%) 2 (2) 2 (2) 100% (100%) 4 (12) 4 (8) 100% (67%) 2 (2) 2 (2) 100% (100%) 4 (6) 2 (4) 50% (67%) 1 (1) 0 (0) 0% (0%) 2 (23) 0 (0) 0% (0%) 2 (2) 0 (0) 0% (0%) 3 (8) 1 (2) 33% (25%) 1 (1) 0 (0) 0% (0%) De flesta icke-rumsliga transformationerna som utfördes var av låg komplexitet (nivå 2) men mycket information fick hämtas från andra platser än från själva källdata-attributen. Av samtliga huvudattribut som ansågs matchade var det 68 % som fick tillges sådana värden. Därutöver klassades de rumsliga transformationerna som komplexa (nivå 6). Se Tabell 5 för den uppskattade transformationsgraden. Tabell 5: Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är ej inräknade vilket innebär att graderingen representerar de attribut i tabell 4 som inte är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade EL-Base 0% 70% 0% 0% 0% 10% 20% EL-Vector: 9% 73% 0% 0% 0% 9% 9% DepthContour EL-Vector: 0% 73% 0% 0% 0% 9% 18% SpotDepth EL-Vector: VoidArea 0% 57% 0% 0% 0% 14% 29% EL-Coverages 0% 65% 0% 0% 0% 21% 14% EL-TIN 0% 74% 0% 0% 0% 13% 13% Lantmäteriet Även för Lantmäteriet transformerades höjddata till de fyra schemana Base, Vector, Coverages och TIN. På grund av avsaknad av testdata utfördes inga tester för objekttyperna IsolatedArea, BreakLine, SpotHeight och VoidArea. Samtliga tillhörande schemat Vector. Sammanfattningsvis 50
kunde alla obligatoriska attribut fyllas för de testade objekttyperna (Tabell 6). För vissa upphävbara och frivilliga attribut saknades det dock data Tabell 6: GAP-analys. Antal attribut i Inspire-scheman som kunde fyllas med data. Antal inom parenteser inkluderar samtliga sub-attribut. Schemat Base innehåller två objekttyper: ElevationDataset och ElevationReference. Schema Inspire Obligatoriska Upphävbara (voidable) Frivilliga Transformerade EL-Base 3 (5) 3 (5) 100% (100%) EL-Vector: ElevationContour 5 (7) 5 (7) 100% (100%) EL-Coverages 7 (29) 7 (9) 100% (31%) EL-TIN 5 (7) 5 (7) 100% (100%) % Inspire Transformerade 3 (33) 2 (2) 67% (6%) 5 (5) 5 (5) 100% (100%) 4 (12) 4 (8) 100% (67%) 2 (2) 2 (2) 100% (100%) % Inspire Transformerade % 4 (6) 2 (4) 50% (67%) 1 (1) 0 (0) 0% (0%) 3 (8) 1 (2) 33% (25%) 1 (1) 0 (0) 0% (0%) Som för Sjöfartsverket var de icke-rumsliga transformationerna av låg komplexitet (nivå 2) och ofta fick information hämtas från andra platser än i källdata-attributen. Av de huvudattribut som kunde matchas var det 76 % som fick ges sådana värden. För schemana TIN och Vector skapades datamängder utifrån det levererade GSD-Höjddata grid 2+ och de rumsliga transformationerna klassades som komplexa (nivå 6). Se Tabell 7 för den uppskattade transformationsgraden. Tabell 7: Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är inte inräknade, vilket innebär att graderingen representerar de attribut i tabell 6 som ej är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade EL-Base 0% 70% 0% 0% 0% 10% 20% EL-Vector: 9% 73% 0% 0% 0% 9% 9% ElevationContour EL-Coverages 0% 65% 0% 0% 0% 21% 14% EL-TIN 0% 74% 0% 0% 0% 13% 13% Även om det krävdes många steg under den rumsliga transformeringsfasen upptäcktes inga problematiska transformationer, där till exempel kvalitet riskerades att degraderas. Illustrering av datamängder Under samtesterna slogs höjd- och djupdata ihop till gemensamma modeller och de illustreras i figur 16. Djupdata och höjddata fick emellertid delas upp i olika objekttyper då det i dataspecifikationens kodlistor inte finns koder för gemensamma höjd/djup-modeller (tas upp närmare i 51
kapitel 3.2). Vidare har de flesta GIS-verktyg i nuläget begränsat stöd för hantering av geometrier beskrivna i GML Coverages och GML TIN, och för GML Coverages rekommenderas det att i stället hänvisa till externa filer via attributet gml:file. Till exempel JPEG 2000. På grund av det begränsade stödet i verktygen illustreras objekttyperna ElevationGridCoverage och ElevationTIN i ESRI ArcGRID. Figur 16: Olika höjdmodeller över Bergkvara kustområde. a) SpotDepth; b) VoidArea; c) DepthContour och ContourLine (den röda linjen illustrerar var höjd/djup är noll, d.v.s. en eventuell strandlinje); d) ElevationGridCoverage (rosa områden illustrerar höjd/djup nära noll) e) ElevationTIN. 3.1.2.2 Tema 3.7 - Anläggningar för miljöövervakning Sammanfattningsvis har testerna visat att det är tekniskt genomförbart att transformera både Naturvårdsverkets och SGUs källdata till Inspires modell för Anläggningar för miljöövervakning. Modellen innehåller 13 objekttyper och 26 associationer. 52
SGU För SGU transformerades miljöövervakningsstationer för grundvattenkemi till sju objekttyper i Inspires modell. Tabell 8 visar att alla obligatoriska attribut, knappt hälften av de upphävbara attributen samt cirka två tredjedelar av de valfria attributen kunde matchas. Tabell 8: Antal attribut i Inspire-scheman som kunde fyllas med data. De antal som anges inom parenteser inkluderar samtliga sub-attribut. Schema Inspire Obligatoriska Upphävbara (voidable) Frivilliga Transformerade EMF 8 (23) 8 (23) 100% (100%) % Inspire Transformerade 22 (88) 10 (16) 45% (18%) % Inspire Transformerade % 14 (14) 9 (9) 64% (64%) Av de attribut som matchats var två stycken, inspireid och representativeparty, komplexa attribut (d.v.s. attribut som i sin tur innehåller ytterligare attribut i en hierarkisk struktur). InspireId ingår i fem och responsibleparty i tre av de objekttyper som matchats. Dessa attribut anses matchade om de obligatoriska underliggande attributen har värden. Alla tre underliggande attribut för inspireid kunde matchas, men endast två av de 22 underliggande attributen för responsibleparty. Om även dessa attribut tas med i beräkningarna kunde endast 18 % av de upphävbara attributen matchas (värden inom parentes i Tabell 8). Andelen konstanta värden som lagts till är relativt hög, 12 av de 27 transformerade attributen (44 %) har konstanta värden. Konstanterna är av två typer; värden som lagts till för att komplettera källdata och är det samma för hela datamängden (t ex mediamonitored: water), eller information som manuellt lagts till där färdiga datamängder saknats (t ex information om processer). Inga riktigt problematiska transformationer behövde utföras. Några lite mer komplexa filteroperationer utfördes, i övrigt förekom endast transformationer av typen namnbyte på klasser och attribut, tillägg av konstanta värden, samt sammanslagning av källdataelement (Tabell 9). Tabell 9: Transformationsnivå. Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är inte inräknade, vilket innebär att graderingen representerar de attribut i tabell 9 som ej är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade EMF 15% 70% 4% 11% 0% 0% 39% Ingen komplex geometrisk transformation av källdata behövde göras, endast en transformation av geometrin till det format som krävs i GML 3.2.1. 53
För de sju objekttyper som transformerats har tre associationer mellan dessa lagts till. Naturvårdsverket För Naturvårdsverket transformerades två datamängder, Trender och variationer i vattnets kemi i olika sjötyper, samt Försurande och övergödande nedfall, till två objekttyper i Inspires modell. Tabell 10 nedan visar att alla obligatoriska attribut, hälften av de upphävbara attributen samt cirka 80 % av de valfria attributen kunde matchas. Tabell 10: Antal attribut i Inspire-scheman som kunde fyllas med data. De antal som anges inom parenteser inkluderar samtliga sub-attribut. Schema Inspire Obligatoriska Upphävbara (voidable) Frivilliga Transformeradradmerade % Inspire Transforme- % Inspire Transfor- 14 (58) 7 (13) 50% (22%) EMF 3 (9) 3 (9) 100% (100%) % 6 (6) 5 (5) 83% (83%) Av de attribut som matchats var två stycken, inspireid och representativeparty, komplexa attribut (d.v.s. attribut som i sin tur innehåller ytterligare attribut i en hierarkisk struktur). InspireId och responsibleparty ingår i all objekttyper som matchats. Dessa attribut anses matchade om de obligatoriska underliggande attributen har värden. Alla tre underliggande attribut för inspireid, men endast tre av de 22 underliggande attributen för responsibleparty kunde matchas. Om även dessa attribut tas med i beräkningarna kunde endast 22 % av de upphävbara attributen matchas (värden inom parentes i tabell 10). Andelen konstanta värden som lagts till är hög, 60 % av de transformerade värdena är konstanter. Dessa konstanter är av två typer; värden som lagts till för att komplettera källdata och är det samma för hela datamängden (t ex mediamonitored: air), eller information som manuellt lagts till där färdiga datamängder saknats (t ex information om nätverk). Inga problematiska transformation behövde utföras. Endast transformationer av typen namnbyte på klasser och attribut, tillägg av konstanta värden, samt sammanslagning av källdataelement utfördes (Tabell 11) Tabell 11: Transformationsnivå. Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är inte inräknade, vilket innebär att graderingen representerar de attribut i tabell 11 som ej är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade EMF 27% 73% 0% 0% 0% 0% 35% 54
Ingen komplex geometrisk transformation av källdata behövde göras, endast en transformation av geometrin till det format som krävs i GML 3.2.1. För de två objekttyper om transformerats har en association mellan dessa lagts till. Illustrering av datamängder I Figur 17 nedan visas den resulterande GML-filen över samtliga Environmental Monitoring Facilities från Naturvårdsverket och SGU, presenterade i Quantum GIS. Figur 17: Visualisering av en GML-fil innehållande samtliga Environmental Monitoring Facilities från Naturvårdsverket och SGU. 3.1.2.3 Tema 3.11 - Områden med särskilda restriktioner Sammanfattningsvis har det visat sig tekniskt möjligt att transformera de testade datamängderna till schemat för Områden med särskilda restriktioner och samtliga obligatoriska attribut har kunnat ges värden. Däremot har vi inte kunnat transformationstesta datatyperna Management- Information och ControlledActivityInformation (Figur 11) eftersom de inte fanns med i det för dataspecifikationens tillhörande GML-schemat. Orsaken är troligtvis att det fortfarande diskutteras kring hur datatyperna skall användas. Resultatet från schemamatchningen för dessa två datatyper inkluderas emellertid i GAP-analyserna. Vidare kan det nämnas att de attribut med 55
många sub-attribut är främst det obligatoriska legalbasis och de frivilliga Geographical Names och Sea Area Name. De två senare ingår i huvudattributet name. Nedan presenteras måluppfyllelsen för varje myndighet. SGU För SGU transformerades djupdata till modellen för Områden med särskilda restriktioner. Samtliga obligatoriska attribut kunde fyllas men för vissa upphävbara och frivilliga attribut saknades det data. Tabell 12: Antal attribut i Inspire-schemat Management Regulation Or Restriction Zone (AM) som kunde fyllas med data. De antal som anges inom parenteser inkluderar samtliga subattribut. Obligatoriska Upphävbara (voidable) Frivilliga Schema Inspire Transformeradmeradmerade % Inspire Transfor- % Inspire Transfor- % AM 5 (20) 5 (14) 100% (70%) 5 (13) 3 (6) 60% (46%) 10 (36) 4 (9) 40% (25%) Både de rumsliga och icke-rumsliga transformationerna som utfördes var av låg komplexitet (Tabell 13). Många nya värden fick dock hämtas från andra platser, till exempel för det obligatoriska attributet legalbasis som beskriver de lagar och förordningar som reglerar ett visst område. 67 % av de matchade huvudattributen tillgavs data från andra platser än själva attributen i källdatamängderna. Tabell 13: Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är ej inräknade, vilket innebär att graderingen representerar de attribut i tabell 13 som inte är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade AM 17% 50% 0% 0% 0% 0% 33% Inga problematiska transformationer upptäcktes. Men då information ofta fick hämtas från andra platser kan det innebära extra kostnader i tid. Naturvårdsverket För Naturvårdsverket transformerades djupdata till schemat för Områden med särskilda restriktioner. Samtliga obligatoriska attribut kunde fyllas men för vissa upphävbara och frivilliga attribut saknades det data (Tabell 14). 56
Tabell 14: Antal attribut i Inspire-schemat Management Regulation Or Restriction Zone (AM) som kunde fyllas med data. De antal som anges inom parenteser inkluderar samtliga subattribut. Obligatoriska Upphävbara (voidable) Frivilliga Schema Inspire Transformeradmeradmerade % Inspire Transfor- % Inspire Transfor- % AM 5 (20) 5 (14) 100% (70%) 5 (13) 2 (3) 40% (23%) 10 (36) 3 (8) 30% (22%) Majoriteten av de icke-rumsliga transformationerna gavs transformationsgraden 4 (Tabell 15) eftersom ett antal filteroperationer utfördes. Många konstanta värden fick också läggas till (exempelvis för attributet legalbasis) och för de matchade huvudattributen låg dessa på 72 %. De utförda rumsliga transformationerna var en geometrikonvertering för badplatser där punkter omvandlades till polygoner. Tabell 15: Transformationsgrad för obligatoriska, upphävbara och frivilliga attribut. Sub-attribut är ej inräknade, vilket innebär att graderingen representerar de attribut i tabell 15 som inte är inom parenteser. Schema 1 2 3 4 5 6 Ej transformerade AM 6% 11% 0% 27% 0% 6% 50% Som för SGU upptäcktes det inga problematiska transformationer för Naturvårdsverket datamängder, även om det kan ge kostnader i tid då information ofta måste hämtas från andra platser än från värdena i attributen. Illustrering av datamängder I och med samtesterna slogs samtliga datamängder från SGU och Naturvårdsverket ihop till en gemensam GML-fil (figur 18). 57
Figur 18: Datamängder sammanslagna till objekttypen Management Regulation Or Restriction- Zones Collection för temat Områden med särskilda restriktioner. I figuren skiljs olika områden åt via attributen specialisedzonetype och ZoneType. 3.2 Granskning av dataspecifikationer Det primära syftet med transformationstesterna är att mäta den tekniska genomförbarheten för transformation av lokala data så att de blir kompatibla med Inspire s dataspecifikationer. Det sekundära syftet är att, utifrån testerna, kunna ge kommentarer på remissutgåvorna av dataspecifikationerna. Kommentarerna har sedan skickats till JRC i samband med testrapporten. Under testarbetet har Inspires dataspecifikationer granskats i en iterativ process (se Figur 1- Figur 4): I början av testperioden för att förstå temats innehåll och struktur, samt hur datamodellerna är uppbyggda. Vid schemamatchning då källdata matchas mot objekttyper och attribut i dataspecifikationen. 58