Förändrad teckenkodning i TIF



Relevanta dokument
KUNDREGISTER Sid 2(7) Teknisk specifikation

REDIGERA PLYMEDIA-TEXTER med Subtitle Workshop 2.5.1

Versionshistoria för Fairway 5.0.1b8

Dragningssystemet. Filbeskrivning för osigillerad resultatfil från premieobligationsdragning. Version 1.2

FrontPage Express. Ämne: Datorkunskap (Internet) Handledare: Thomas Granhäll

Kom igång! Snabbstart för dig som är administratör

Att hämta organisationers publikationsposter ur DiVA

Körschema för årsuppdatering Version 2,18. Läs igenom dokumentet innan du börjar med årsavstämningen!

MANUAL WEBBADMINISTRATION. Webbadministration. Webbserver FTP. Datalagring & backup

TDP002 - Imperativ programmering

Ansökan om stöd till kulturverksamhet via webben Gäller från

Skapa ärende Sökande

Ikon Menyalternativ Funktion och beskrivning Sök och ersätt text i arbetsfältet. Ramformatering

F2 Datarepresentation talbaser, dataformat och teckenkodning EDAA05 Datorer i system! Roger Henriksson!

Labora&on 1 Introduk&on &ll utvecklingsmiljön övningar/uppgi<er

I den här labben ska vi använda oss av en trevlig nyhet i HTML5: Local Storage, för att implementera en sorts lokal gästbok.

F2 Datarepresentation talbaser, dataformat och teckenkodning

Körschema för Årsuppdatering Version 1,9. Läs igenom dokumentet innan du börjar med årsavstämningen!

Bordermail instruktionsmanual

ROT + RUT = HUSAVDRAG

TDP002 - Imperativ programmering

Installation av Visma Skatt och Lathund för import av portfölj

Quick Start CABAS. Generella systemkrav CABAS / CAB Plan. Kommunikation. Säkerhet

Flex - Manual. Innehåll

Introducerande övningar i HTML

Användarhandledning för RALF

Personalsupport. Medicinska fakulteten, Lunds universitet. Textredigeraren. Moodle version 2.7.1

WebbSMS från datorn. Innehållsförteckning

Pyramid Business Studio - e-line & Betalkort

Hur du gör ditt Gilles hemsida - en liten hjälp på vägen

Digital inlämning av årsredovisning

e-line Kort- och Bankbetalning

Användarmanual Stiga on Line

Kortfattad Instruktion för inventering av kemikalier och produkter i Klara

Övning (X)HTML 2. Sidan 1 av

Formatbeskrivning Kreditavisering ankommande utlandsbetalningar

Uppgraderingsinstruktion för Tekis-FB Avisering version 6.3.1


XML-produkter. -Registret över verkliga huvudmän (RVH) Teknisk handledning för webbtjänst mot RVH (Web Services) Datum: Version: 1.

Tecken och strängar i Java

Uppdatering av föreningsuppgifter i föreningsregistret på landskrona.se

Hur man lägger upp och redigerar dokument i Typo3.

BEHANDLINGSREGLER. för. e-tullräkning

TDDD78, TDDE30, 729A Tecken och strängar med och utan Java

Ansökan om föreningsbidrag och kulturstöd via webben. Kundens ex. Gäller från

DABAS Update. Produktblad

Topocad Systeminställningar

Verktyget är begränsat till Microsoft Internet Explorer v 7.0 och uppåt

Bruksanvisning Anmälningsblankett.

Caspeco Business Control 6 CASPECO MANUAL KU

Versionshistoria för Fairway 5

Uppdatering av föreningsuppgifter i föreningsregistret på GÄLLER FRÅN

Installation, Novaschem 2005

Caspeco Business Control 6 CASPECO MANUAL KU

Manual för beställning via Capitex

Instruktioner till ansökningsformuläret i Prisma: Tidskriftsbidrag 2018

Import / export av personer i Vaka 2.

Innan du anmäler dig till Quantum View Outbound Checklista

Labora&on 1 Introduk&on &ll utvecklingsmiljön övningar/uppgi<er

Uppdateringsinstruktion INFOFLEX version 5 och senare

Grundritning Torpargrund

Publicera material i Blackboard

EVO DEV. EvodevExcel.GarpReportAddin

Lathund för studenter

Kortfattad Instruktion för inventering av kemikalier och produkter i Klara

Installationsanvisning - Kopplingen mellan GK96 och golf.se -

Nemo96 HD och Nemo96 HD+ firmware uppdatering

Dagens innehåll. 1. Hantering av ipad 2. Montera fodralet 3. Uppstart av ipad 4. Skapa Apple-ID

Lathund för övningen: Skapa film med Windows Movie Maker och publicera på YouTube

Manual för publicering av tävlingar på MapandCoach

Så här fungerar nya webbföranmälan

SEB. Four foils. SEB IT Lars-Göran Karlsson

Om manualen inte räcker till vänligen kontakta Madeleine Rietz på ITavdelningens supportmejl

Skattereduktion för husarbete

7-8 oktober lyft i prod till version oktober Verifiering av uwap93 - sync

Arbeta i Sharepoint dokumenthanteringssystem

Manual Demoväska RFID. Manual Demoväska. Sara Svensson/Monika Lindgren/Fredrik Karlsson Version BnearIT AB 1(17)

FileCentral Desktop. Användarhandledning Version

Körschema för årsuppdatering

Versionsnyheter. Visma Administration Visma Fakturering Visma Förening. Visma Mobil Scanner. Visma Administration Webbfakturering

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Instruktionsdokument Husarbete (hushålls- och ROT-arbete)

Online-resultat. Manual

ATT SKAPA EN NY PLANERINGSGRUPP och koppla ihop allt. OBS! Tänk på att läsa igenom allt sakta och följ sedan instruktionen.

Användarmanual för Content tool version 7.5

Windows 10 Utforskaren

Logga in. Placera barn. Kolumner Ändra ordning på kolumner. Spara egna kolumnval. Urval. Ändra taxekategori. Sök. Uppsägning av plats

FTP-via-Internet Teknisk manual

Administrationsmanual ImageBank 2

INSTALLATIONS ANVISNING

INFORMATION FRÅN VITEC. Mobil ärende version 2.4

F3 Datarepresentation teckenkodning och datakompression EDAA05 Datorer i system! Roger Henriksson!

Formatbeskrivning. CashPool - Notional Group Account Ränteinformation på fil. Handelsbankens CSV & SKV format

Vid problem med programmet kontakta alltid C/W Cadware AB på telefon

Uppgraderingsinstruktion för Tekis-FB Avisering version 6.3.0

Datorövning 1 Calc i OpenOffice 1

Hantera och ladda minneskort i TPB katalogen.

Att ladda ner från legimus.se

I valfri objektlista börjar du med att markera det objekt du vill arbeta med. Klicka på Utför, välj Matrix och därefter Skicka order.

Transkript:

Sid 1(7) Innehållsförteckning 1 Inledning...2 1.1 Bakgrund...2 1.2 Sammanfattning...2 2 Förändringsbeskrivning...3 2.1 Allmänt...3 2.2 Redigeringstecken i texterna blir oförändrade...3 2.3 Några förbättringar med UTF-8...3 2.3.1 Exempel på beskrivningstexter...4 2.4 Förändrade posttyper och distributionsfiler...5 2.5 Införandeplan av UTF-8...6 2.5.1 Driftsättning...6 2.5.2 Arbetsgång vid driftsättningen...6 2.6 Testfiler i UTF-8 format...6 3 Åtgärder för TIF - användare...7 3.1 Rekommenderade åtgärder...7 3.2 Om ingen anpassning görs...7

Sid 2(7) 1 Inledning 1.1 Bakgrund Taric Internet Fildistibution (TIF) har sedan starten för drygt tio år sedan använt den västeuropeiska teckenkodningen ISO-8859-1 för alla distributionsfiler som läggs ut på vår FTP-server. Vi avser att ändra kodningen till den mer moderna och internationellt anpassade teckenkodningen UTF-8. Taric3 som infördes av Tullverket i mars 2011 använder UTF-8 i grunden. Det ger användaren möjlighet att presentera helt korrekta beskrivningstexter med ovanliga tecken och symboler som inte finns tillgängliga i ISO-8859-1. Förändringen gör det möjligt för den som använder TIF att kunna få helt korrekta och lättförståeliga beskrivningstexter med olika typer av ovanliga tecken och symboler som används i Taric. Sedan starten av TIF har det funnits problem med att översätta vissa ovanliga tecken. Det kan hanteras om man använder UTF-8. Det har även framkommit önskemål från användare om att få UTF-8 teckenkodning i filerna. Dessutom internationaliseras lösningen och säkerställs för framtiden på ett bättre sätt. 1.2 Sammanfattning Tullverket kommer att förändra teckenkodningen för TIF:s distributionsfiler i både flat och XML-format från dagens ISO-8859-1 till UTF-8 format. Införandet sker från och med måndag den 15 april 2013. De som använder TIF och nyttjar posttyper med beskrivningstexter kan välja att anpassa sitt användande av dem till UTF-8 och få fördelarna som det innebär eller att inte göra någon åtgärd alls men istället kanske få problem med visningen av vissa vanliga tecken som t.ex. å, ä, ö. Om man använder filer utan beskrivningstexter behövs inget göras då allt i grunden kommer fungera som tidigare.

Sid 3(7) 2 Förändringsbeskrivning 2.1 Allmänt Teckenuppsättningarna mellan ISO-8859-1 och UTF-8 stämmer delvis överens med i UTF-8. Representationen ser lika ut om man tittar i en fil. Skillnaden är att i UTF-8 finns möjlighet att lagra all världens tecken och symboler. Det sker med genom att vissa tecken representeras med 2-4 databyte istället för 1 databyte. Om man öppnar en fil i UTF-8 format i en textredigerare eller annat program som inte stödjer detta format så kan man exempelvis se flerdatabyte tecknen nedan. å = à ä = à ö = à é = à µ = μ α = α ± = ± ω = Ï = â Läs mer om UTF-8 på t.ex. http://sv.wikipedia.org/wiki/utf-8 2.2 Redigeringstecken i texterna blir oförändrade I beskrivningstexterna förekommer vissa redigeringstecken som användes innan UTF-8 fanns i Taric. Dessa kommer tillsvidare att finnas kvar fast de inte längre behövs.!1! Radbrytning <P> Radbrytning (skall enligt uppgift ersätta!1!) Hårt mellanslag $ Efterföljande tecken skall vara upphöjt (superscript) @ Efterföljande tecken skall vara nedsänkt (subscript)!%! Per tusen!x! Multiplikation!o! Grader!>=! Större än eller lika med 2.3 Några förbättringar med UTF-8 Kan hantera alla världens tecken och symboler. Är mer vanligt som standarduppsättning i operativsystem och nya program. De översättningsproblem som finns idag och som resulterar i ett? i distributionsfilen kommer att försvinna.

Sid 4(7) 2.3.1 Exempel på beskrivningstexter Här kan ni se några exempel på hur varukodsbeskrivningar ser ut i filerna respektive vid presentation. Varukod 3926909755 ISO-8859-1 ----Platta produkter av polyeten, perforerade i motstående riktningar, med en tjocklek av minst 600?m men högst 1 200?m och en vikt av minst 21 g/m$2 men högst 42 g/m$2 ----Platta produkter av polyeten, perforerade i motstående riktningar, med en tjocklek av minst 600?m men högst 1 200?m och en vikt av minst 21 g/m 2 men högst 42 g/m 2 UTF-8 ----Platta produkter av polyeten, perforerade i motstã ende riktningar, med en tjocklek av minst 600 μm men hã gst 1 200 μm och en vikt av minst 21 g/m$2 men hã gst 42 g/m$2 ----Platta produkter av polyeten, perforerade i motstående riktningar, med en tjocklek av minst 600 µm men högst 1 200 µm och en vikt av minst 21 g/m 2 men högst 42 g/m 2 Varukod 2907290070 ISO-8859-1 ---2,2,2,6,6,6 -Hexa-_tert_-butyl-_?,?,? _-(mesitylen-2,4,6-triyl)tri- _p_-kresol (CAS RN 1709-70-2) ---2,2,2,6,6,6 -Hexa-_tert_-butyl-_?,?,? _-(mesitylen-2,4,6-triyl)tri- _p_-kresol (CAS RN 1709-70-2) UTF-8 ---2,2â~@²,2â~@³,6,6â~@²,6â~@³-Hexa-_tert_-butyl-_α,αâ~@²,αâ~@³_-(mesitylen-2,4,6- triyl)tri- _p_-kresol (CAS RN 1709-70-2) ---2,2,2,6,6,6 -Hexa-_tert_-butyl-_α,α,α _-(mesitylen-2,4,6-triyl)tri- _p_-kresol (CAS RN 1709-70-2)

Sid 5(7) 2.4 Förändrade posttyper och distributionsfiler Posttyperna D, E, F, K, M, O, R, Q och T påverkas. I filerna ändras bara själva beskrivningstexterna, övrig hantering av filerna blir oförändrad. Filerna i flat respektive XML- format ändras och det gäller för både total samt differensfilerna. (#### = serienummer) Posttyp D - Varuslagstexter Filer: ####_KD_EN.tot, ####_KD_EN.totxml, ####_KD_SV.tot, ####_KD_SV.totxml, ####_DD_EN.dif, ####_DD_EN.difxml, ####_DD_SV.dif, ####_DD_SV.difxml Posttyp E - Tilläggskodtexter Filer: ####_KE_EN.tot, ####_KE_EN.totxml, ####_KE_SV.tot, ####_KE_SV.totxml, ####_DE_EN.dif, ####_DE_EN.difxml, ####_DE_SV.dif, ####_DE_SV.difxml Posttyp F - Fotnotstexter Filer: ####_KF_EN.tot, ####_KF_EN.totxml, ####_KF_SV.tot, ####_KF_SV.totxml, ####_DF_EN.dif, ####_DF_EN.difxml, ####_DF_SV.dif, ####_DF_SV.difxml Posttyp K Procentsatser till jordbrukskomponenter (meursing) Fältet: SHORT_DESCR Filer: ####_KK.tot, ####_KK.totxml, ####_DK.dif, ####_DK.difxml Posttyp M - Exportbidragsnomeklatur Filer: ####_KM_EN.tot, ####_KM_EN.totxml, ####_KM_SV.tot, ####_KM_SV.totxml, ####_DM_EN.dif, ####_DM_EN.difxml, ####_DM_SV.dif, ####_DM_SV.difxml Posttyp O Nationella skatter och avgifter Filer: ####_KO.tot, ####_KO.totxml, ####_DO.dif, ####_DO.difxml Posttyp Q Nationella skatter och avgifter, fotnotstexter

Sid 6(7) Filer: ####_KQ.tot, ####_KQ.totxml, ####_DQ.dif, ####_DQ.difxml Posttyp R - Kodförteckning Fältet: SHORT_DESCR Filer: ####_KR_EN.tot, ####_KR_EN.totxml, ####_KR_SV.tot, ####_KR_SV.totxml, ####_DR_EN.dif, ####_DR_EN.difxml, ####_DR_SV.dif, ####_DR_SV.difxml Posttyp T - Växelkurser Fältet: EXCH_NAME Fältet: CTRY_TEXT Filer: ####_KT.tot, ####_KT.totxml, ####_DT.dif, ####_DT.difxml 2.5 Införandeplan av UTF-8 2.5.1 Driftsättning Driftsättning planeras till måndagen den 15 april 2013. 2.5.2 Arbetsgång vid driftsättningen Under måndag eftermiddag på driftsättningsdagen kommer nya totalfiler med UTF-8 formatering att finnas klara för nedladdning. De kommer att ha samma serienummer som föregående körning föregående fredag. Senare vid vanlig tid ca: 22.00 kommer nya differensfiler i UTF-8 format läggas ut. De innehåller då bara förändringar från föregående körning och har sekvensnumret efter total-filerna som skapats under dagen. Efter driftsättningen kommer total och diff-filer endast att finnas i UTF-8 format och läggas ut enligt tidigare rutin dvs. total-filer var 30:e körning samt diff-filer varje vardag. 2.6 Testfiler i UTF-8 format Testfiler finns på webben http://distr.tullverket.se/taric/ och kan även nås via vår FTP server. Notera att filerna inte är PGP- signerade, behöver bara packas upp för att kunna läsas. (Se testlänkarna längst ner på sidan)

Sid 7(7) 3 Åtgärder för TIF - användare 3.1 Rekommenderade åtgärder Vad ni behöver göra beror naturligtvis på hur datat från TIF används och hur lösningen har implementerats. Några punkter att tänka kan vara nedanstående. Testa ert verksamhetssystem eller användandet av TIF-filerna med framtagna UTF-8 testfiler, så att ni kan verifiera att textbeskrivningarna visas korrekt. Göra eventuella anpassningar av ert system eller själva inläsningen av filerna, så att ni får en korrekt presentation av texterna. Om ni går över till att lagra UTF-8 formaterat data i ert verksamhetssystem behöver ni rensa ert gamla TIF-data som lagras i ISO-8859-1 och ladda in nya total-filer vid driftsättningen. Vill ni behålla ISO-8859-1 i sitt system kan ni välja att konvertera UTF-8 till ISO- 8859-1 vid t.ex. inläsningen av datat, men då har ni kvar samma översättningsproblem som finns idag. Ta fram en plan för ert införande vid själva driftsättningen. 3.2 Om ingen anpassning görs Allt kommer i grunden fungera som tidigare vilket gör att det finns en möjlighet att ni inte behöver införa eventuella anpassningar på själva driftsättningsdagen. Om ni väljer att inte göra någonting alls får ni kanske problem med visning av t.ex. (åäö) i ert system. Om man inte rensar sitt TIF data och fortsätter att läsa in de dagliga differensfilerna kommer alla uppdaterade texter allteftersom bli i UTF-8 format och man får då en blandning av de två teckenkodningarna. Men det går naturligtvis alltid att rensa sitt data och ladda in nya totalfiler när man vill.