Slutrapport. Improvement of the distribution keys for the estimated trade in the Swedish Intrastat system

Relevanta dokument
2004:10. Förbättring av bortfallsprocessen i Intrastat. Avdelningen för Ekonomisk statistik

STATISTIKENS FRAMSTÄLLNING

STATISTIKENS FRAMSTÄLLNING

Utrikeshandel med varor 2009 HA0201

Bruttolista/Arbetsplan med förenklingsåtgärder från Finansdepartementet och myndigheter

Slutrapport [Evaluation of the collection system of the Swedish Specific Movements]

STATISTIKENS FRAMSTÄLLNING

Utrikeshandel med varor 2010 HA0201

Utrikeshandel med varor 2016 HA0201

KVALITETSDEKLARATION

STATISTIKENS FRAMSTÄLLNING

KVALITETSDEKLARATION

Lastbilsundersökningen: Hantering av överrapporterat stillestånd

Yttrande till kommunrevisionen över granskning av attester för utbetalningar

Försäljning av kalk för jord- och trädgårdsbruk, sjöar, vattendrag och skog 2000

STATISTIKENS FRAMSTÄLLNING

Utrikeshandel med varor 2014 HA0201

Modellprognos för konjunkturlönestatistikens definitiva utfall januari 2018 december 2018

Kvalitetsdeklaration Statistik om kommunala hälso- och sjukvårdsinsatser 2017

Beskrivning av produktregistret

Person- och godstransporter på järnväg, 2010 kvartal 1. Statistik 2010:4

Fortsatt stort exportöverskott i juli. Handelsnettot för januari-juli 2005 gav ett överskott på 94,2 miljarder kronor

Modellprognos för konjunkturlönestatistikens definitiva utfall december 2016-november 2017

Hantering av högkostnadsskyddet för tandläkarvård i KPI

Modellprognos för konjunkturlönestatistikens definitiva utfall för oktober 2017 september 2018

STATISTIKENS FRAMSTÄLLNING

Konkurser och offentliga ackord

Modellprognos för konjunkturlönestatistikens definitiva utfall april 2017-mars 2018

Utrikeshandelsstatistik 1999

Modellprognos för konjunkturlönestatistikens definitiva utfall för mars 2016-februari 2017

Alla företag i EU ska rapportera sin handel med andra EU-länder. I Sverige ska flödet av varor rapporteras till SCB var månad.

STATISTIKENS FRAMSTÄLLNING

Konjunkturstatistik, löner för kommuner (KLK)

Analys av samvariationen mellan faktorer som påverkar vattennivåerna i Karlstad

STATISTIKENS FRAMSTÄLLNING

Revisionsrapport. 1 Inledning. Revision av uppbördsprocessen Moms. Skatteverket Solna. Datum Dnr

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Utöver projektdirektivet ska en teknisk dokumentation för projektet arbetas fram.

Ansiktsigenkänning med MATLAB

TYA:s Arbetskraftsbarometer

STATISTIKENS FRAMSTÄLLNING

STATISTIK I BLICKFÅNGET

Konjunkturstatistik över sjuklöner (KSju) 2014 AM0209

FI Dnr

Rammeverk: Rutin för intern uppföljning av korrigeringar i levererad statistik felrapportering

STATISTIKENS FRAMSTÄLLNING

Kvalitetsdeklaration Statistik om kommunala hälso- och sjukvårdsinsatser 2016

Beskrivning av statistiken

1. Uppdraget. 2. Metod

STATISTIKENS FRAMSTÄLLNING

Biotopskydd och naturvårdsavtal på skogsmark 2012 JO1402

Biotopskydd och naturvårdsavtal på skogsmark 2011 JO1402

Inventering av kommunägda företag 2000

Kvalitetsdeklaration Statistik om spädbarnsföräldrars rökvanor 2016

Askstatistik från energistatistik

Konsekvensutredning avseende förslag till ändrade föreskrifter om uppgiftsinsamling från huvudmännen inom skolväsendet m.m

STATISTISKA CENTRALBYRÅN

Kvalitetsdeklaration Statistik om sjukdomar behandlade i slutenvård 2017

Energipriser på naturgas och el

Hamnar och stuverier samt stödtjänster inom sjötransport

Biotopskydd och naturvårdsavtal på skogsmark 2013 JO1402

Analys av Skolverkets beräkning av bidragsramar

STATENS LÅNEBEHOV OCH FINANSIERING

Göteborg Energi AB. Självdeklaration 2012 Verifiering av inköpsprocessen Utförd av Deloitte. 18 december 2012

Uppföljningsundersökning. Lärare. Teknisk rapport

Justering av vattenförekomster

STATISTIKENS FRAMSTÄLLNING

STATISTIKENS FRAMSTÄLLNING

STATISTIKENS FRAMSTÄLLNING

Rättsavdelningen Serdar Gürbüz

STATISTIKENS FRAMSTÄLLNING

Presentationstext Företagens utländska handelskrediter Registertyp survey, urval

KVALITETSDEKLARATION Ohälsomått

Juli månads handelsnetto i nivå med förväntningarna. Handelsnettot för januari-juli 2004 gav ett överskott på 110,6 miljarder kronor

Särskild utbildning för vuxna: elever per 15 oktober 2012 UF0110

Kvalitetsdeklaration Statistik om spädbarnsföräldrars rökvanor 2015

Att beräkna t i l l v ä x t takter i Excel

Sveriges utrikeshandel och internationella handelsmönster i skuggan av den ekonomiska krisen. 2 september 2010

STATISTIK I BLICKFÅNGET

Kontinuitetshantering IT-avbrott - hur beroende är ditt företag?

Dekomponering av löneskillnader

Skogsentreprenörer 2013 JO0504

TILLSTÅND OCH ÖVERVAKNING AV UTSLÄPP

Regeringskansliet Faktapromemoria 2016/17:FPM40. Förordning och direktiv om mervärdesskatt vid gränsöverskridande e-handel. Dokumentbeteckning

Konjunkturstatistik, löner för landsting 2002 AM0109

Statistik om spädbarnsföräldrars rökvanor 2014

Intrastatregistrering och -rapportering

2004:03. Minskad detaljeringsgrad i Sveriges officiella utrikeshandelsstatistik

Hög utrikeshandel i november. Handelsnettot för januari november 2007 gav ett överskott på 114,4 miljarder kronor

Vad Betyder måtten MAPE, MAD och MSD?

Importen ökade med 12 procent. Handelsnettot för januari juli 2007 gav ett överskott på 82 miljarder kronor

STATISTIKENS FRAMSTÄLLNING

Utredning kring effekter av hemtjänståtgärder

Utbetalningar av arbets- och yrkesskadelivräntor 2015 SF0207

Utbetalningar av arbets- och yrkesskadelivräntor 2012 SF0207

Insatser för barn och unga enligt SoL och LVU 2008 SO0211

Sammanfattning till Extremregn i nuvarande och framtida klimat

Statistiska centralbyråns författningssamling

Jämställdhetsbonus 2012 SO0212

Transkript:

1(60) Slutrapport keys for the estimated trade in the Revision Nummer Revision Datum Summarisk beskrivning av ändringar 1.1 2011-12-12 Version 1 1.2 2012-02-02 Version 2 (preliminär slutrapport) 1.3 2012-08-13 Slutjusteringar av rapporttexten (definitiv slutrapport) Ändringarna markerade

2(60) Innehåll 1 Sammanfattning... 3 2 et... 6 2.1 PROJEKTETS BAKGRUND OCH UPPGIFT... 6 2.2 DELTAGARE, BESTÄLLARE OCH MOTTAGARE... 9 3 Resultat... 11 3.1 BORTFALL OCH BORTFALLSSKATTNINGSMETODER PÅ DETALJNIVÅ... 11 3.1.1 Kartläggning... 11 3.1.2 Utvärdering... 16 3.2 MÖJLIGHETER ATT FÖRBÄTTRA TILLFÖRLITLIGHETEN I FÖRDELNINGSNYCKLARNA... 18 3.2.1 Förbättra tillförlitligheten när historik finns... 18 3.2.2 Förbättra tillförlitligheten när historik saknas... 27 3.3 ANALYS AV DATA FRÅN FÖRETAG SOM TIDIGARE VARIT UPPGIFTSSKYLDIGA... 38 3.4 TRÄFFSÄKERHETSSTUDIER (JATT)... 41 3.5 MÖJLIGGÖRA TOTAL STATISTIK PÅ DETALJERAD FÖRETAGSNIVÅ... 45 3.6 FALLSTUDIE AV KRITISKA KN8 - OCH LANDKOMBINATIONER... 46 4 Fortsättning... 52 Bilaga 1 Skattningsgrupper för storleksklass 1 i införseln... 54 Bilaga 2a Andel skattad handel i Intrastat 2010, första publiceringstillfället per kapitel... 55 Bilaga 2b Andel skattad handel i Intrastat 2010, senaste publiceringstillfället per kapitel... 57 Bilaga 3a Andel skattad handel i Intrastat 2010, första publiceringstillfället per EU-land... 59 Bilaga 3b Andel skattad handel i Intrastat 2010, senaste publiceringstillfället per EU-land... 60

3(60) 1 Sammanfattning Detta projekt avser göra en djupare kartläggning och utvärdering av metoder, system och rutiner som idag används i samband med imputering av bortfall i Intrastatsystemet. Skattningar för bortfall görs i två steg, där steg 1 avser skattning på total företagsnivå och steg 2 avser fördelning av skattat värde per företag på varukoder (KN8) kombinerat med EU-länder. Detta projekt är avgränsat till steg 2. Två effektmål har tagits fram i projektet: 1. Andelen skattade KN8 * land kombinationer, där den skattade andelen utgör minst 25 procent vid 1:a publiceringen ska minska med minst 25 procent. 2. Minskning av andelen kritiska skattningar (minst 50 procents absolut diff mellan skattat och inkommet värde) på nivån KN8*land till 70 procent. I och med att momsvärdena idag levereras allt snabbare från Skatteverket, måste SCB:s kompensationsrutin för cut off delen ses över. Under den närmaste tiden tycks som om en överskattning av handeln under tröskelvärdena har gjorts för ett antal publiceringsomgångar. Detta i kombination med att en allt större andel företag idag redovisar momsuppgifterna kvartalsvis, har föranledett en del ändringar i nuvarande skattningsmetoder för cut off delen på total nivå. I samband med detta projekt har nya rutiner utvecklats för att eliminera att stora momsvärden som enligt Intrastatregistret är ej uppgiftsskyldiga blandas med de företag som värdemässigt understiger cut off värdet 4,5 mkr. På grund av viss eftersläpning i uppgiftsskyldighetsregistret hamnar ibland större värden än cut off gränsen bland värdemässigt små företag, och skapar viss oreda i skattningarna på KN8*land. Dessa flyttas nu istället till objektbortfallet, och blandas med uppgiftslämnare som är objektbortfall. Det handlar här om ett par företag per månad som flyttas. Dessutom har en rutin som pekar ut s.k. engångshandlande företag tagits fram för att eliminera risken att dessa företag trots vissa befintliga kriterier skattas för de månader de inte har handel. Det kan här handla om att de tidigare inte haft momsvärden, och plötsligt inkommer med ett högt momsvärde, och blir uppgiftsskyldiga i Intrastat. Fyra olika metodansatser har testats för att förbättra bortfallsskattningarna på detaljnivå när historik används; metoder med tröskel för värde, säsongsmetoder med tröskel för värde, metoder med tröskel för frekvens samt metoder där nuvarande metoder justerats vad gäller kriteriet för antal månaderna med tröskel för värde. Den bästa metoden (den metod som ger lägst andel kritiska skattningar enligt modifierat effektmål 2) är enligt utvärderingen metoder som använder ett halvårs data där minst 2 månader finns tillgängliga för det senaste halvåret. Andel kritiska skattningar är här 82,7 procent, jämfört med 85,2 procent för den nuvarande metoden.

4(60) Vidare kan observeras att tröskel för värde inte fungerar så bra som man rent intuitivt hade trott. Ju större värdetröskel, desto större andel kritiska skattningar.tröskeln för frekvens fungerar i viss grad. Enligt vår empiriska utvärdering är den bästa tröskeln för frekvens ungefär 33 procent. Högre trösklar tycks inte minska vårt ovan nämnda andelsmått vidare. Heller tycks inte flera tidigare års data hjälpa oss. Resultatet blir sämre om man använder tre års data än ett år. Detta indikerar på att data för bortfallsföretagen är ganska instabila. För att undvika att en månads handelsstruktur ska få alltför stor genomslagskraft för ett med historik skattat bortfallsföretag har tidigare konstaterats att kriteriet om historik borde ses över. Det finns naturligtvis en stor risk att de företag som enbart har inkommit med en rapport har felaktigheter i sina data, och man bör därför ha flera insamlade rapporter än 1 för att historikuppgifter på företagsnivå ska kunna användas. Om man i framtiden dessutom skulle vilja ha totala företagsvärden fördelade på land och KN8 krävs att man är försiktigare med kriteriet av företagshistorik. Vi föreslår här en ändring av historikkriteriet till minst tre redovisade månader för den senaste tolvmånadersperioden om historiska uppgifter ska användas på företagsnivå. För att inte vissa KN8*land kombinationer ska blåsas upp fördelas handeln istället ut på många KN8*land kombinationer. Så som det är idag, har vi tämligen bra skattningar för större KN8*land kombinationer, men skattningar på alltför många kombinationer. Istället skulle vi behöva omfördela de värdemässigt alltför små kombinationerna till värdemässigt större. Detta skulle exempelvis kunna göras genom införande av ett tröskelvärde på frekvens (som tidigare föreslagits). Nya och i princip helt maskinella metoder/rutiner har tagits fram för att ersätta den tidigare så tidskrävande och komplicerad manuella gruppsammansättningen för företag utan historik. Tidigare gjordes denna omkring vart femte år (i princip i samband med SNI-omläggningarna). I samband med detta kan följande aspekter beaktas: Ny storleksklassindelning för skattningsgrupperna. Tydligare avgränsningar för dataunderlaget för gruppsammansättningen. Rutin för maskinella kontroller av företag där branschtillhörigheten ändrats. Automatisk omklassificering av redovisande företags SNI-koder i de fall relevanta SNIkoder saknas. Omklassificering görs enligt faktisk redovisad handel. Bättre maskinella granskningskontroller i samband med skapandet av fördelningsnycklar har tagits fram. En ansats som tagits fasta på här är införandet av möjligheten att dämpa effekten av värdemässigt dominanta företag för en viss skattningsgrupp per storleksklass. Således har vi infört kriteriet att ett företag inte får utgöra mer än 10 procent av gruppens totala värde inom den lägsta storleksklassen, i annat fall skickas företaget med dess handel till en restgrupp, vars fördelningsnyckel skapas utifrån samtliga de företag som hamnat i denna restgrupp för storleksklassen och flödet i fråga. Införandet av dessa dämpande kriterier har gjort att vi inte längre har samma problem med risken att vissa KN8 - och landkombinationer för handeln under

5(60) tröskelvärdet blir överskattade. Även för de två övriga storleksklasserna har nya kriterier införts för att eventuellt skickas till restgruppen. I dessa fall ligger gränsen nu på 40 procent. Strukturerade metodrutiner avseende sex olika steg har tagits fram och kommer nu att kunna utföras i ett och samma SAS-program, där också möjligheterna för mer frekventa uppdateringar än tidigare i praktiken kan göras av skattningsgrupperna. För att skapa homogena grupper använder vi klusteranalys (proceduren PROC FASTCLUS i SAS). Proceduren kombinerar en metod för att hitta ett första kluster med en iterativ standardalgoritm för att minimera summan av kvadrerade avstånd från klustrets medelvärde. Metoden bygger på sortering efter närmaste centroid. En uppsättning punkter som kallas cluster seeds (klusterfrön) väljs som utgångspunkt för klustren. Varje observation kan hänföras till det närmaste klusterfröet för att bilda tillfälliga kluster. Fröna kan sedan ersättas med hjälp av tillfälliga kluster, och processen upprepas tills inga fler förändringar sker i klustren. I centroid metoden, är avståndet mellan två kluster definierat som euklidiska avstånd (kvadrerade avstånd) mellan deras centroids och medelvärde. För att bestämma bästa antalet kluster för varje storlekskategori har vi dels utgått från tre för sammanhanget relevanta statistika, förklaringsgraden (R 2 ), F-pseudo-test (F-Pseudo), samt Cubic Clustering Criteria (CCC). Estimationssystemet i DotNet är relativt nytt, och har med tiden haft vissa inkörningsproblem, vilka i samband med projektet kunnat pekas ut och lösas. Exempel på sådana är värden angivet i tusentalsformat i momsgranskningen, överföringar av perioder med slutgiltiga skattade data där vissa revideringsperioder ibland inte överförts korrekt samt hantering av styrtabell för kompensation av ej inkomna momsuppgifter för handeln under tröskelvärdet i kombination med klassificering av kvartalsredovisande respektive månadsredovisande företag. Även förslag på vissa utvecklingsinsatser av estimationssystemet har pekats ut och kommer framöver att beaktas vidare: - Önskemål om att kunna ändra den maskinellt valda skattningsmetiden på företagsnivå manuellt, och kanske i framtiden flytta momsgranskningen till insamlingsenheten. - Viss osäkerhet om vilka outputlistor som idag behövs. Möjligen kan vissa tas bort framöver. Listorna borde för övrigt också sparas i systemet, och inte bara i Excel. - Problem med helårskörningar eftersom man inte tillämpar historiska uppgiftsskyldighetsperioder och osäkerhet ibland uppstår i samband med momsgranskningen. För att man snabbt ska kunna kontrollera de vara - och landkombinationer som verkar vara överskattade har en ny rutin för lagring av en outputdatatabell med andelen skattad handel per kombination av land*kn8 utvecklats. De kritiska kombinationerna, här definierade som att andelen skattad handel är minst 50 procent och där samtidigt värdet för kombinationen är minst 30 mkr, sparas nu undan för månatlig outputdatagranskning.

6(60) I projektet har studerats möjligheten att använda data från uppgiftslämnare som varit uppgiftsskyldiga tidigare, men som på grund av höjning av tröskelvärdena idag inte längre är detta. Våra historiska jämförelsedata avser drygt 2 000 uppgiftslämnare, vilkas Intrastatrapporter 200405-200412 utgörs av 77 000 varuposter. De kapitel och de landskoder som utgör mer än tre procent av samtliga kapitel/länder bland dels de historiska data, jämförs med de fördelningsnycklar som vi använder idag för handeln under tröskelvärdet. Sammanfattningsvis kan kommenteras att både de kapitel och de länder som utgör minst tre procent i princip finns i både skattningarna för cut off delen samt i historikuppgifterna. Vad gäller kombinationen av dessa finns dock större skillnader. Fördelningsnycklarna för kapitel och land med avseende på två olika ansatser för JATT (Just Above Threshold Trade) har jämförts. Dels med avseende på inkomna rapporter från de två respektive fyra procent minsta uppgiftsskyldiga företagen som ligger i täckningsgradsintervallet 93-95 procent samt 91-95 procent i införseln, samt på samma sätt intervallen 95-97 procent respektive 93-97 procent i utförseln. Spontant tycks det här som om de fem fördelningsnycklarna liknar varandra en hel del vad gäller landskoder och KN8, men nyckeln för den totalt insamlade handeln tycks dock avvika en del från de övriga. Speciellt kan detta märkas för landskoderna DK och FI. Detta beror förmodligen på att de finns en mycket stor andel mindre företag som handlar mer frekvent med grannländerna. 2 et 2.1 ets bakgrund och uppgift Intrastatundersökningen är en månadsvis cut off undersökning vars tröskelvärden ska vara beräknade för att lägst motsvara den täckningsgrad som fastställs via de lagar och för undersökningen särskilda EU-förordningar. I takt med ökade krav om att förenkla för uppgiftslämnarna, har detta täckningsgradskrav successivt sänkts, och möjliggjort höjningar av tröskelvärdena. Idag är dessa krav formulerade som att minst 95 procent av den totala införseln och 97 procent av den totala utförseln ska vara insamlad vid slutgiltiga data. Exkluderingströskelvärdet (ETV) är idag 4,5 miljoner kronor för både införseln och utförseln. I takt med minskad uppgiftslämnarbörda i samband med höjningar av ETV och det faktum att handeln från vissa företag inte längre insamlas, måste företagen nu istället skattas som handel under cut off delen. Omkring 9 procent av införselvärdet och 5 procent av utförselvärdet skattas (skattningar för objektsbortfall + cut off delen) idag vid det första publiceringstillfället. Vid det senaste publiceringstillfället skattas omkring sex procent av införselvärdet och tre procent av utförselvärdet.

7(60) et syftar främst till att utvärdera och förbättra de objekts- och täckningsbortfallsmetoder för steg 2 som idag används i Intrastat. Under 2010 genomfördes för övrigt ett utvecklingsprojekt med fokus på steg 1. I samband med detta utvecklades skattningsmodeller baserade på tidseriemetoder eller modellskattningar som alternativa imputeringsmetoder för objektsbortfallet. Dessa kommer implementeras i skarp drift fr.o.m. 2012 års publiceringar. Det här projektet kan betraktas som en fortsättning på det tidigare projektet som genomfördes 2010, men då alltså med fokus på steg 2. målen/huvudmålen i detta projekt är: Utvärdering/förbättring av nuvarande fördelningsnycklar, samt bakomliggande metoder och kriterier, som idag används i skattningarna i Intrastat. Förbättra metoder där branscher kan grupperas automatiskt i enlighet med homogenitet i handeln. Utveckla nya metoder där det är möjligt att leverera detaljerade värden (KN8*land) för varje företag (insamlade och skattade). Undersöka möjligheten att komplettera med data från företag som tidigare var uppgiftsskyldiga i Intrastat. Undersöka möjligheten att använda en JATT-ansats i skattningarna (Just Above Threshold Trade). Undersöka om säsongsaspekten kan beaktas vid skattningarna i samband med fördelning av vara kombinerat med land. Utvärdering och förbättring av rutiner vid produktionskörningar. Följande två effektmål har tagits fram i projektet: Effektmål 1: Effektmål 1 avser att andelen skattade KN8*land kombinationer, där den skattade andelen utgör minst 25 procent vid 1:a publiceringen ska minska med minst 25 procent.

8(60) Vid första publiceringen 2010 i införseln avser 7 862 KN8*landkombinationer av totalt 62 440 kombinationer där det skattade värdet utgör mer än 25 procent av totalvärdet (12,6 procent). Vårt effektmål för första publiceringen 2012 i införseln blir därför maximalt 5 896 kombinationer (9,4 procent). Vid första publiceringen 2010 i utförseln avser 5 933 KN8*landkombinationer av totalt 76 051 kombinationer där det skattade värdet utgör mer än 25 procent av totalvärdet (7,8 procent). Vårt effektmål för första publiceringen 2012 i utförseln blir därför maximalt 4 450 kombinationer (5,9 procent). Effektmål 2: Effektmål 2 avser jämförelser av skillnader i värde för KN8 * land kombinationer bland företag som bortfallsskattats vid första publiceringstillfället och vid det senaste publiceringstillfället inkommit med faktiska uppgifter. Uppföljningen avser enbart de bortfallsföretag, vars skattade värden fördelats med historik. Referensperiod är helåret 2010. Under 2010 bortfallsskattades 8 986 företag med historikuppgifter vid första publiceringstillfället. Av dessa har 5 712 inkommit med sina uppgifter vid det senaste publiceringstillfället (pubid=166). Underlaget för effektmålet bygger alltså på skillnaden i värde för det bortfallsskattade värdet och det senare inkomna på nivån KN8*land. Tabell 1 visar fördelningen av kritiska skattningar på KN8*land nivå. Som kritisk skattning definieras de kombinationer där den absoluta avvikelsen är större än 50 procent mellan det skattade värdet och det inkomna. Underlaget är även fördelat på fyra olika storleksklasser baserat på det inkomna värdet. Tabell 1: Underlag för effektmål 2 Införsel Utförsel stlklass kritisk stlklass kritisk 0 1 Totalt 0 1 Totalt 0-1 mkr 4411 16357 20768 0-1 mkr 4087 15157 19244 21,24 78,76 21,24 78,76 1-10 mkr 1146 1300 2446 1-10 mkr 692 593 1285 46,85 53,15 53,85 46,15 10-100 mkr 161 275 436 10-100 mkr 71 59 130 36,93 63,07 54,62 45,38 >100 mkr 7 34 41 >100 mkr 7 6 13 17,07 82,93 0,14 0,04 Totalt 5725 17966 23691 Totalt 4857 15815 20672 24,17 75,83 100 23,5 76,5 100

9(60) I införseln uppgår de kritiska kombinationerna till 75,8 procent och i utförseln till 76,5 procent. En ambition vore att minska denna andel till effektmålet om maximalt 70 procent för de båda flödena. För att förtydliga när effektmålen ska följas upp m.m. har tabell 2 tagits fram: Tabell 2: Effektmål och detaljer Specificerade effektmål för projektet 1. Andelen skattade KN8 * land kombinationer, där den skattade andelen utgör minst 25 procent vid 1:a publiceringen ska minska med minst 25 procent. 2. Minskning av andelen kritiska skattningar (minst 50 procents absolut diff mellan skattat och inkommet värde) på nivån KN8*land till 70 procent SCB-mål enligt verksamhetsplan 2011 Mål 2. Kvalitet, rättssäkerhet och effektivitet Mål 2. Kvalitet, rättssäkerhet och effektivitet Uppföljning (avser 2012) Görs i samband med första publiceringen av december 2012 i februari 2013 Görs i samband med Quasi final statistiken 2012 vid första publiceringen av augusti 2013 som sammanställs i oktober 2013. Ansvarig MA (Frank.W) MA (Frank.W) 2.2 Deltagare, beställare och mottagare gruppen har haft följande sammansättning:, (ledare, metodansvarig) Yingfu Xie, (deltagare, metodstatistiker) Ari Mansikkaviita, ES/UI (deltagare, handläggare)

10(60) ets beställare är Annika Nyström, enhetschef ES/UI. Mottagare är Christian Surtin, förvaltningsansvarig för Utrikeshandel med varor (UHV). Till projektet är även knuten en referensperson, Martin Ribe, bitr. processansvarig för processområdena Bearbeta och Analysera, PCA/LEDN samt Maria Adolfsson från ES/UI. et är ett EU-projekt, som finansieras med upp till 70 procent av Eurostat av bidragsforumet MEETS. MEETS är en förkortning för Modernisation of European Enterprise and Trade Statistics financing programme. et ska leverera en engelskspråkig projektrapport till Eurostat (EU-projektrapport), som i detta sammanhang betraktas som kund (delfinansiär). De projektmål som specificeras ska ha täckts in och genomförts för att fullständigt EU-bidrag (70 %) ska kunna utbetalas till beställaren av delfinansiären (Eurostat, G4). För att säkra kvaliteten i den produktionslösning som väljs, kommer projektets resultat testas/verifieras enligt de metoder och på det sätt som anges i Verksamhetsstödet och i enlighet med SCB:s testmodell (TMOD). et har bedrivits i två tidsmässiga etapper, etapp 1 och etapp 2. Etapp 1 avser perioden mars juni 2011 och etapp 2 perioden september december 2011, då projektet slutfördes. Fem projektgruppsmöten har hållits i etapp 1 och tre i etapp 2. Dessutom har två avstämningsmöten mellan projektledaren och beställaren hållits för respektive etapp. Efter tre projektgruppsmöten gjordes en riskanalys där en akut risk kunde identifieras. Åtgärder vidtogs för detta. ets huvudaktiviteter och delaktiviteter har specificerats och kontinuerligt följts upp i en aktivitetsplan. Varje delaktivitet har tidsbestämts med start- och slutdatum, och haft en eller flera utpekade aktivitetsansvariga. Dessutom har ett statusvärde använts för uppföljning av hur långt respektive aktivitet kommit i förhållande till vad som var förväntat inom ramen för projektets arbete. Sammanlagt har 16 specificerade delaktiviteter arbetats med under projektets gång. Även milstolpar har identifierats inom ramen för detta projekt (se tabell 3).

11(60) Tabell 3: Identifierade milstolpar och slutdatum Specifikation Kartläggning och utvärdering av processen och nuvarande skattningsmetoder vid fördelning på KN8 * land. Utvärdering av nuvarande rutiner vid produktionskörningar inklusive outputdata. Förbättringar av de nuvarande skattningsmetoderna vid fördelning på Klar senast 5 maj 2011 12 maj 2011 13 oktober 2011 KN8 * land. Formell avslutning av projektgruppen. 13 oktober 2011 Framtagande av nya skattningsgrupper för skattningar då historik saknas. 2 december 2011 Definitiv projektrapport enligt PMOD till beställaren. 31 december 2011 Definitiv engelsk projektrapport (för Eurostat) till beställaren. 31 december 2011 Implementering av de nya skattningsmetoderna i Intrastat estimationssystem för skarp drift. Implementering av systemlösning där uttag av total (insamlad + skattad) detaljstatistik på företagsnivå kan göras. Mars 2012 (inför publiceringen av januari 2012). September 2012 3 Resultat 3.1 Bortfall och bortfallsskattningsmetoder på detaljnivå 3.1.1 Kartläggning Skattningarna av bortfallet görs grovt i två steg: Steg 1: Skattning av total flödesspecifik handel per företag. Steg 2: Fördelning av den skattade totala företagshandeln på varukod (KN8) kombinerat med landskod. De alternativa skattningsmetoder som idag används i steg 1 för objektsbortfallet är: - Framskrivning med Exponential Smoothing, utan säsongskomponent - Framskrivning med Exponential Smoothing, med säsongskomponent - Imputering med moms - Manuella imputering (kompletteringar för partiellt bortfall) - Månadssnitt baserat på senaste helårets totala värden (insamlat + skattat) med säsongskomponent.

12(60) Skattningarna med de olika bortfallsskattningsmetoderna jämförs sedan, och ett automatiskt metodval väljer ut den metod som ger den mest tillförlitliga skattningen för företaget i fråga. För skattningar av handeln under tröskelvärdet (cut off delen) används justerade momsvärden per företag avseende föregående års motsvarande perioder. Steg 2 (fördelning av den skattade totala företagshandeln på varukod kombinerat med landskod) kan sedan i sin tur delas in i följande två typfall: 1. Fördelning av den skattade totala företagshandeln på varukod kombinerat med landskod när historik finns. 2. Fördelning av den skattade totala företagshandeln på varukod kombinerat med landskod när historik saknas. Efter att företagets handel skattats totalt fördelas företagets skattade totala införsel och/eller utförsel för kombinationen av KN8 och land. Fördelningen på varukoder och länder görs med hjälp av fördelningsnycklar som i första hand bestäms av hur företaget tidigare rapporterat (företag med historik) och i andra hand bestäms av hur liknande företag rapporterat (företag utan historik). De företag som ligger under exkluderingströskelvärdet skattas med momsuppgifter, och handeln fördelas på varukoder och länder enligt en fördelningsnyckel som beräknas med hjälp av s.k. liknande företag. Även för uppgiftsskyldiga företag som saknar historik (kritiska bortfallsföretag) fördelas handeln på varukoder och länder enligt en fördelningsnyckel som beräknas med hjälp av s.k. liknande företag. 1. Fördelning av skattad handel för företag med historik Fördelning enligt historik baseras idag på de senaste tolv månadernas handel. Villkoret var innan projektstarten att minst en rapporterad månad måste finnas för att historik ska kunna användas. De maximalt tre månaderna närmast den aktuella publiceringsperioden används sedan för att beräkna en fördelningsnyckel för företaget. För varje företag bestäms en fördelningsnyckel där varje värde i nyckeln beräknas som kvoten av värdet för kombinationen vara och land och värdet av all varuhandel. Med hjälp av dessa framräknade andelar fördelas sedan företagets skattade totala månadsvärde på varor och länder. Införsel och utförsel behandlas separat.

13(60) Exempel Antag att företag i har rapporterat värden för månad m-3 till och med månad m-1 och låt y ij( m u) beteckna värdet av handeln som företag i haft under månad m-u med vara*land kombinationen j. Andelen av handeln som ska fördelas på vara*land kombinationen j, p, skattas med: ijm p ˆ ijm 3 u 1 3 J y u 1 j 1 ij( m y u) ij( m u) Värdet av handeln för företag i med vara*land kombinationen j under månad m, yˆ där ijm pˆ ijm yˆ im yˆ im är skattad total införsel eller utförsel för företag i för den aktuella månaden. y ijm, skattas med Om företaget exempelvis har rapporterat endast två tidigare månader, så bestäms andelarna enligt dessa månader. Fördelningsnyckeln bestäms alltså av de månader som finns tillgängliga med de kriterier för antal månader som beskrivs ovan. 2. Fördelning av skattad handel för företag utan historik Om historik saknas fördelas total skattad in- och/eller utförsel enligt handel för liknande företag. Företagen delas in i homogena grupper och en fördelningsnyckel för vara*land kombinationer tas fram i varje grupp. Med homogena grupper avses att företagen i en grupp handlar med samma varor eller har samma handelsmönster. Grupperna indelas efter storlek (enligt årsmässig införsel/utförsel) och företagens branschtillhörighet. Alla företag delas in i storleksfördelade grupper, och bortfallsföretagen (som saknar historik) samt de företag som ligger under tröskelvärdet får sin handel fördelad på varor och länder enligt gruppens fördelningsnyckel. Fördelningsnyckeln i en grupp bestäms av de svarande (redovisande företagen) i gruppen. Företagen indelas sedan tröskelvärdeshöjningen 2009 i tre storleksklasser (enligt årliga momsvärden) för införsel och tre för utförsel (<4 miljoner kr, 4-40 miljoner kr, >40 miljoner kr). Därefter sker en gruppering enligt följande steg 1. Företagen delas in i branscher på tresiffrig SNI, hädanefter kallad SNI3, och deras handel grupperas på tresiffrig SITC (Standard International Trade Code), hädanefter kallad SITC3. 2. Företagens branschtillhörighet enligt SNI-klassificeringen jämförs med den faktiska handeln. 3. SITC3-handeln inom respektive bransch översätts till SPIN3 (varu-sni)

14(60) 4. De SPIN3-koder med högst belopp anses vara representativa för branschen och jämförs med andra branscher för att hitta liknande handelsmönster. 5. Grupperna skapas manuellt på så sätt att branscher med liknande handelsmönster slås ihop. Varje grupp ska bestå av minst fem företag där inget av de i gruppen ingående företagen får utgöra en större handelsandel än 50 procent. Om ett företag utgör en större andel än 50 procent av gruppens total, ska dess handel inte medräknas i gruppen. De branscher som innehåller mindre än fem företag eller som inte kan slås ihop med andra branscher läggs i en restgrupp. En lösning med maskinell gruppindelning har även använts vid fastställande av grupperna. Denna behöver dock utvecklas för att kunna användas fullt ut. För varje grupp av svarande företag bestäms en fördelningsnyckel med andelar per vara kombinerat med land. Varje värde i en nyckel beräknas som kvoten mellan två summor för företagsgruppen, värdet av vara kombinerat med land i täljaren och värdet av all varuhandel i nämnaren. Införsel och utförsel behandlas separat men beräkningarna hanteras på samma sätt. En grupp svarande företag indiceras med g och har en gemensam nyckel f gj enligt nedan, där summan över i avser företag som tillhör gruppen (grupptillhörighet betecknas med ) f gj i i g y g J j 1 ij y ij i g w i p ij, för j=1,..,j där w i i t. g i t. i och p ij y ij J yij j 1 och där t i. är totala införseln eller utförseln för företag i, det vill säga t i. = J y ij j 1. Gruppnyckeln är ett vägt medelvärde av de enskilda nycklarna. Företag i har en vikt w i som är proportionell mot företagets handelsvärde, och är lika med företagets andel av gruppens totala införsel (utförsel). Vi sammanfattar de nuvarande skattningsmetoderna i tabell 4:

15(60) Tabell 4: Skattningsmetodernas övergripande struktur Typfall Objektsbortfall Cut off delen Steg 1: Skattning av totalt företagsvärde Metod 1..5 Metod 3 för föregående års period Steg 2: Fördelning av skattat värde på Med eller utan Utan historik KN8*land Steg 2a: Fördelning med historik (företagsnivå) Steg 2b: Fördelning utan historik (ej företagsnivå) historik Minst en insamlad månad för senaste tolvmånadersperioden Minst en insamlad månad för den senaste tolvmånadersperioden Ej möjlig idag I samband med att bortfallsskattningsapplikationen lyftes in i uttagssystemet (DotNet applikation) körs sedan dess månadsvis följande steg (tabell 5): Ingen insamlad månad tillgänglig för den senaste tolvmånadersperioden Tabell 5: Övergripande körningssteg i Intrastat skattningssystem Körningssteg Översiktlig beskrivning 1.Hämta från databasen Hämtar information om publiceringsmånad och historikmånader. Läser in data från MSSQL och lägger variabler tillrätta. 2.Granska moms Skapar granskningslistor för momsgranskning. Uppdaterar momsdataseten med de rättade momsuppgifterna. 3.Bortfallsskattning Skapar imputeringsvärden för varje bortfallsföretag. Väljer ett av imputeringsvärdena enligt modellval. Lägger till kompletterande uppgifter som lästs in från MSSQL. Fördelar skattningarna med hjälp av fördelningsnycklar enligt företagshistorik. Fördelar skattningarna med hjälp av fördelningsnycklar då historik saknas. Räknar om skattningarna från fakturavärde till statistiskt värde. Ändrar eventuella gamla varukoder till nya varukoder där koderna har ändrats. Beräknar bortfallsmått. 4.Output_totalt Skapar bortfallssammanställning på totalnivå. 5.Filöverflyttning Sparar undan temporära skattningsfiler för uppföljning. 6.Output_vara_land Skapar outputdata för vara*land. 7.Output_ftg Skapar outputdata för företag. 8.Överföring 1 Uppdatering och överföring av bortfallsdata från SAS till MSSQL, samt godkännande av pubid. 9.Överföring 2 Uppdatering av andra viktiga tabeller i produktionen (vitesregister, totala företagsvärden) samt styrtabeller. 10.Borttag Borttag av temporära datafiler inför nästkommande produktionsomgång.

16(60) Efter att steg 1-7 utförts har 16 Excelfiler skapats för det senaste pubidet. Dessa avser bl.a. följande outputdata: - De 10 största skattade värdena på vara*land nivå - Icke ryggradsföretag_30_mkr (mindre företag med skattat värde på minst 30 mkr) - Skattade ryggradsföretag (skattningar för de största företagen) - Totalt - Skattade (kritiska) KN8-koder på företagsnivå Listorna analyseras för att se om rimliga bortfallsimputeringar gjorts på företagsnivån samt på olika varugrupp- och landnivåer. 3.1.2 Utvärdering I och med att momsvärdena idag tycks levereras allt snabbare från Skatteverket, måste SCB:s kompensationsrutin för cut off delen ses över. Under den närmaste tiden tycks som en viss överskattning av handeln under tröskelvärdena har gjorts för ett antal publiceringsomgångar. Detta i kombination med att en allt större andel företag idag redovisar momsuppgifterna kvartalsvis, föranleder en del ändringar i nuvarande skattningsmetoder för cut off delen på total nivå. Vid beräkningar av de nuvarande fördelningsnycklarna används inga kriterier om tids- eller säsongvariation när historik finns tillgänglig. Således finns viss risk att ett bortfallsföretag för juli exempelvis skattas med den handel företaget hade i december. Om då företaget kanske har markant avvikande handel för december finns risk för orimliga skattningar. Istället föreslås att en månads handelsstruktur inte ska kunna få alltför stor genomslagskraft för ett skattat företag, och att man därför ändrar kriteriet om historik. Vad gäller de metoder som idag används då historik saknas finns vissa nackdelar. Senast skattningsgrupperna skapades var år 2006, och dessa är baserade på den gamla SNIversionen (SNI2002). Grupperna bör istället baseras på den senaste SNI-versionen (SNI2007). Grupperna är dessutom baserade på EU25, och bör nu vara baserade på EU27. Dessutom har vi idag en förmodligen förändrad handelsstruktur än den vi hade 2006. Andra aspekter som uppmärksammats är: - Tidskrävande och komplicerad manuell gruppsammansättningsrutin som görs vart femte år med tämligen begränsad maskinell förvaltning. - De maskinella granskningskontrollerna behöver förbättras. - Storleksklassindelningen är föråldrad och behöver ses över.

17(60) - Tydligare definierade grunddata för underlaget för gruppsammansättningen. - Mer detaljerade outputdata för bättre (manuella) kontrollmöjligheter. - En bättre rutin för maskinella kontroller av de företag där branschtillhörigheten ändras skulle möjligen behövas. - En automatisk funktion som omklassar redovisande företag som saknar relevanta SNI-koder i företagsregistret efter faktisk redovisad handel skulle behöva införas. Vi önskar få bättre tillförlitlighet i de skattade detaljerade uppgifterna, och önskar göra mer ingående kontroller av skattade data för landsfördelade varukoder. Som det tidigare varit kan det genereras avvikande skattningar på landsfördelade KN8-koder, vilket ibland skulle kunna ifrågasättas av användare av statistiken. I dessa fall handlar det ofta om engångshandlande utländska företag med enorma värden, som en viss tid i början felaktigt betraktas som att ligga under tröskelvärdet i uppgiftsskyldighetsregistret i Intrastat. Estimationssystemet i DotNet är relativt nytt. Det har inte alltid fungerat felfritt men problemen har dock alltid gått att åtgärda. Exempel på problem/ önskemål om ändringar: - När man manuellt ändrat ett momsvärde vid en viss produktionsomgång, så har detta värde dividerats med tusen i nästkommande körning. Det ändrade värdet skrivs i tusentals kronor och syns i outputlistorna i kronor. I nästkommande körning kan värdet vara borta från momsgranskningslistan men syns dock i outputlistorna nu har dock de tre sista siffrorna försvunnit. Problemet är idag löst. - Problem med överföringsprogrammet, då inte samtliga nya och reviderade perioder kommit med till de skarpa produktionstabellerna. Problemet är idag löst. - Önskemål om att kunna ändra den maskinellt valda skattningsmetoden på företagsnivå manuellt, och kanske i framtiden flytta momsgranskningen till insamlingsenheten. Önskemålet är ännu inte infriat. - Viss osäkerhet om vilka outputlistor som idag behövs. Möjligen kan vissa tas bort framöver. Listorna borde för övrigt också sparas i systemet, och inte bara i Excel. Önskemålet är ännu inte infriat. - Problem med helårskörningar eftersom man inte tillämpar historiska uppgiftsskyldighetsperioder och osäkerhet ibland uppstår i samband med momsgranskningen. Önskemålet delvis infriat. - Problem med hantering av styrtabell för kompensation av ej inkomna momsuppgifter för handeln under tröskelvärdet i kombination med klassificering av kvartalsredovisande respektive månadsredovisande företag. Problemet löst.

18(60) 3.2 Möjligheter att förbättra tillförlitligheten i fördelningsnycklarna 3.2.1 Förbättra tillförlitligheten när historik finns För att undvika att en månads handelsstruktur ska få alltför stor genomslagskraft för ett med historik skattat bortfallsföretag har tidigare konstaterats att kriteriet om historik borde ses över. Det finns naturligtvis en stor risk att de företag som enbart har inkommit med en rapport har felaktigheter i sina data, och man bör därför ha flera insamlade rapporter än en. Om man i framtiden dessutom skulle vilja ha totala företagsvärden fördelade på land och KN8 krävs att man är försiktigare med kriteriet av företagshistorik. Vi föreslår här en ändring av historikkriteriet till minst tre månader. Men låt oss först titta på effekten av en sådan ändring vad gäller andelen skattat objektsbortfall och andelen skattat bortfall där historik saknas: Tabell 6-9 nedan visar fördelningen av det skattade objektsbortfallet på de båda kategorierna för publiceringsperioden 201009 före och efter implementerandet av kriterieändringen för när historik kan användas. Man kan tydligt se att andelen skattat objektbortfallsvärde som kan användas vid historik med införande av betydligt hårdare krav (minst tre månader för den senaste tolvmånadersperioden) nu har minskat. För en ordinär produktionsomgång med en publiceringsmånad (201009) och tre revideringsmånader verkar andelen ha minskat från 62,9 procent till 43,3 procent. Före ändringen är andelen skattat värde med historik större än andelen som skattas där historik inte används för publiceringsmånaden (201009) samt två revideringsmånader, men inte för den tredje av revideringsmånaderna (201006). Efter kriterieändringen tycks det som om andelen skattat värde med historik blir lägre än andelen som skattas utan historik redan vid den första revideringsmånaden i publiceringsperioden (201008). Tabell 6: Införsel, före ändringen ar månad flöde med historik utan historik totalt 2010 6 införsel 45,5% 54,5% 100,0% 2010 7 införsel 51,9% 48,1% 100,0% 2010 8 införsel 58,1% 41,9% 100,0% 2010 9 införsel 73,7% 26,3% 100,0% summa: 62,9% 37,1% 100,0%

19(60) Tabell 7: Införsel, efter ändringen ar månad flöde med historik utan historik totalt 2010 6 införsel 38,3% 61,7% 100,0% 2010 7 införsel 29,9% 70,1% 100,0% 2010 8 införsel 39,0% 61,0% 100,0% 2010 9 införsel 56,1% 43,9% 100,0% summa: 43,3% 56,7% 100,0% Även för utförseln kan man tydligt se att andelen skattat objektbortfallsvärde som kan användas vid historik nu har minskat. Här verkar andelen ha minskat från 52,8 procent till 27,0 procent. För utförseln verkar det dessutom som om andelen skattat värde med historik är lägre än andelen som skattas utan historik redan vid publiceringsmånaden (201009). Man kan också uppmärksamma att andelen skattad handel för objektbortfall där historik nu kommer att användas i förhållande till det totalt skattade objektsbortfallet, är mycket låg för de månader som reviderats flest gånger i perioden; 8,2 procent för juli och 7,2 procent för juni. Tabell 8: Utförsel, före ändringen ar månad flöde med historik utan historik totalt 2010 6 utförsel 25,7% 74,3% 100,0% 2010 7 utförsel 34,2% 65,8% 100,0% 2010 8 utförsel 46,5% 53,5% 100,0% 2010 9 utförsel 69,0% 31,0% 100,0% summa: 52,8% 47,2% 100,0% Tabell 9: Utförsel, efter ändringen ar månad flöde med historik utan historik totalt 2010 6 utförsel 7,2% 92,8% 100,0% 2010 7 utförsel 8,2% 91,8% 100,0% 2010 8 utförsel 21,9% 78,1% 100,0% 2010 9 utförsel 49,2% 50,8% 100,0% summa: 27,0% 73,0% 100,0% Att andelen skattad handel i objektsbortfallet som skattas med historik skiljer sig markant mellan införseln och utförseln efter ändringen av historikkriteriet beror säkerligen på att utförselredovisande uppgiftslämnare mer regelbundet rapporterar sin handel, och att bortfallet är betydligt lägre i utförseln.

20(60) Verifiering av effektmål: Vi har tidigare pekat ut följande två effektmål för skattningarna: 1) Andelen skattade KN8*land kombinationer, där den skattade andelen utgör minst 25 procent vid 1:a publiceringen ska minska med minst 25 procent. 2) Minskning av andelen kritiska skattningar (minst 50 procents absolut differens mellan skattat och inkommet värde) på nivån KN8*land till 70 procent För att verifiera och testa våra effektmål med hårdare krav än ovan inför vi följande förtydliganden av kritiska skattningar i effektmål 2: a. Om det inte finns inkomna eller skattade värden för kombinationen j, kommer kombinationen betraktas som kritisk. b. Om både inkomna och skattade värden finns för kombinationen j, räknas skattningen för den som kritisk om den absoluta avvikelsen till det (senare) rapporterade värdet överstiger 50 %, d.v.s. där är det inkomna värdet. Med våra här specificerade hårdare krav vad gäller effektmål 2 blir andelen kritiska skattningar högre än tidigare för år 2010. Andelen kritiska skattningar i införseln uppgår nu till 86,1 procent i införseln, 83,5 procent i utförseln, och 85,2 procent totalt. Figur 1 redovisar fördelningen av antal KN8*land kombinationer för 2006-2010 på företagsnivå. Nästan en tredjedel av kombinationerna (60 760 av 193 475) avser endast en kombination, och 56,2 procent avser mindre än 5 kombinationer. Så få observationer utesluter möjligheten för mer kvalificerade tidsserieanalyser och säsongsanalys på KN8*land nivån. Därför bör vi bara tillämpa metoder som fungerar på en högre aggregeringsnivå.

21(60) Figur 1: KN8*land kombinationer för 2006-2010 på företagsnivå Om vi gräver lite djupare i data märker vi att många KN8*land kombinationer har fördelats ut för skattade värden, där dessa egentligen inte är relevanta. I dessa fall handlar det om objektsbortfall, där Intrastatrapporterna senare inkommit, men där inga värden kan hänföras till just de specifika kombinationerna i de rapporterna som senare kommit in. Det vill säga, vi fördelar idag ut handeln på alltför många kombinationer. Det bör dock anmärkas att det handlar om mycket små värden som fördelats på många KN8*land kombinationer. För att inte vissa KN8*land kombinationer ska få för stort genomslag och blåsas upp fördelas handeln istället ut på många KN8*land kombinationer. Så som det är idag, har vi tämligen goda skattningar för större KN8*land kombinationer, men skattningar på alltför många kombinationer. Istället skulle vi i framtiden behöva hitta en metod som omfördelar de värdemässigt alltför små kombinationerna till värdemässigt större. Detta skulle exempelvis kunna göras genom införande av ett tröskelvärde för detta ändamål.

22(60) Om ett företag i, är bortfall i Intrastatsystemet vid månad m, skattas alltså först en total handel för företaget,. Därefter görs en fördelning av värdet till varukod (KN8 nivå) kombinerad med land. När historiska insamlade data finns tillgängliga för företaget, kommer vi beräkna andelen av handeln på KN8*land kombination j för den totala handeln som företaget har rapporterat för alla kombinationer j=1,, J. Handeln för de minst tre senaste tillgängliga månaderna för den senaste tolvmånadersperioden kommer användas enligt formeln nedan: (1) p ijm 3 u 3 u y 1 ij( m u) J y 1 j 1 ij( m u). Där yij( m u) är det insamlade värdet i månaden m-u, för kombinationen j. När det finns färre än tre månaders data, används i vår testansats alla tillgängliga månaders värden. Det fördelade värdet för kombinationen j,, för j=1,, J, är bara p ijm*. Vi testar fyra olika metodansatser: Katalog 1 - Metoder med tröskel för värde: metodansats som använder historiska ett, två, till och med tre års data, respektive, som i ekvation (1), men kombinationer som fått värden mindre än en tröskel (procent) borttas och fördelas om. Fördelningsmetoder som i (1) med ett och tre års data, med trösklarna 0, 1, och 5 procent, respektive. Katalog 2 - Säsongsmetoder med tröskel för värde: metodansats som i första hand använder samma månad i föregående år eller för föregående månad för något av de tidigare två åren, med en tröskel på värde eller inte. Om månader saknas, används den nuvarande eller justerade metoden med tröskel på värde. När data inte finns, tillämpas flera alternativ: den nuvarande metoden, ekvation (1) med högst 6 månaders data (med antingen tröskel=0 eller 1 procent), respektive (separat). Katalog 3- Metoder med tröskel för frekvens: metoder som använder historiska 1 till 3 års data, men KN8*land kombinationer som har funnits mindre ofta än en tröskel (procent) borttas. Tröskel på värde kan finnas eller inte. Fördelningsmetoder där vi använder halvårsdata, ett, två respektive tre års data, med trösklar på frekvens (17, 25, 33, och 50 procent), vilka motsvarat minst 2, 3, 4, och 6 månader på ett år, respektive. Även tröskel för värde testas i vissa fall. Katalog 4 Justering av metoden i ekvation 1: metoden (1) använder data för de högst 3 senaste månaderna (på ett år). Det är värt testa metoder som ökar data till högst 6 månader, med tröskel på värde eller inte. Tröskel på värde testas även direkt med den nuvarande metoden.

23(60) Den nuvarande metoden med tröskel på värde (1 eller 5 procent). Fördelningsmetoder där vi använder de högst 6 senaste månadernas data för ett år, med trösklar om 0, 1, och 5 procent med avseende på värde respektive. Det bör anmärkas att tröskelvärdet i katalog 1-4 kan vara lika med noll för att inte någon kombination ska tas bort. Det finns några trösklar, eller metoder som inte har testats. Dessa fall ingår istället i andra metoder. T.ex., om tröskel för frekvens är noll och även noll för värde, kommer metoder i katalog 3 hänföras till katalog 1. Å andra sida, är det inte nödvändigt att testa alla fallen, om man märker att resultatet inte blir bättre. Det kan även hända att ett företag har många likstora KN8*land kombinationer med avseende på värde eller frekvens. När trösklarna tillämpats, övertäcks ingen kombination. För att undvika bortfall i resultatet använder vi samtliga kombinationer i dessa fall. Från resultaten i tabell 10, kan man dra vissa slutsatser: Den bästa metoden, märkt med fetstil i tabell 10, är enligt utvärderingen en metod som använder ett halvårs data där minst 2 månader finns tillgängliga för det senaste halvåret. Andel kritiska skattningar är här 82,7 procent, jämfört med 85,2 procent för den nuvarande metoden (se tabell 11). I alla metoderna har införseln och utförseln behandlats på samma sätt. Det är fullt möjligt att använda olika metoder för dem. Notera att ingen metod överträffar den nuvarande när det gäller utförseln. Tröskel för värde fungerar inte så bra som man rent intuitivt hade trott. Ju större värdetröskel, desto större andel kritiska skattningar. Tröskeln för frekvens fungerar i viss grad. Enligt vår empiriska utvärdering är den bästa tröskeln för frekvens ungefär 33 procent, vilket motsvarar 4 månaders frekvens för ett år. Högre trösklar hjälper inte vidare. Flera tidigare års data hjälper inte. Som metoderna i katalog 1 och 3 visar, blir resultatet sämre om man använder tre års data än ett år. Det indikerar att för dessa bortfallsföretag, är data instabila. Det finns indikationer på att fördela på KN8*land nivå är svårt. Att tillämpningen av en värdetröskel fungerar mindre bra innebär att historiskt stora värden inte behöver vara stora eller vara med i handeln alls idag.

24(60) Tabell 10. Resultat med de olika föreslagna metoderna Andel kritiska skattningar (procent) Införsel Utförsel Totalt Den nuvarande metoden (ekvation 1) 86,1 83,5 85,2 K Ett års data. Tröskel för värde: 0 % 87,6 90,2 88,5 A T 1 % 93,7 93,7 93,7 A 5 % 96,8 97,2 97,0 L O Tre års data. Tröskel för värde: 0 % 91,2 92,8 91,8 G 1 % 94,0 93,8 94,0 1 5 % 96,9 97,3 97,0 K A T A L O G 2 K A T A L O G 3 K A T A L O G 4 Samma månad i 3 år. Saknas data, nuvarande metod. (tröskel 0) 88,8 91,4 89,7 Som ovan. Saknas data, högst 6 mån. data i nuvarande metod. 88,8 91,3 89,7 Som ovan, men med tröskeln 1 procent. 95,5 95,3 95,4 Halv års data. Ingen tröskel på värde. Tröskel på frekvens: Ett års data. Tröskel på värde (TV): Tröskel på frekvens (TF): Två års data. Ingen tröskel på värde. Tröskel på frekvens: Tre års data. Ingen tröskel på värde. Tröskel på frekvens: 17 % 81,7 85,7 83,1 25 % 81,3 85,5 82,8 33 % 81,2 85,4 82,7 50 % 81,4 86,2 83,0 TF:17 % TV:0 % 82,4 86,5 83,8 TF:17 % TV:1 % 93,7 93,6 93,7 TF:17 % TV:5 % 96,8 97,3 97,0 TF:25 % TV:0 % 82,0 86,3 83,5 TF:25 % TV:5 % 96,0 97,2 96,4 TF:33 % TV:0 % 81,6 86,2 83,1 TF:50 % TV:0 % 82,8 87,8 84,6 17 % 83,5 87,7 85,0 25 % 82,8 87,0 84,3 33 % 82,7 87,2 84,3 50 % 88,2 92,3 89,6 17 % 84,2 88,1 85,6 25 % 83,4 87,5 84,9 33 % 83,4 87,7 85,0 50 % 85,1 88,9 86,4 Nuvarande metod. Tröskel på värde: 1 % 93,8 93,7 93,8 5 % 96,9 97,3 97,0 Nuvarande metod med de högst 6 senaste månaderna. Tröskel på värde. 0 % 85,2 88,0 86,1 1 % 93,7 93,5 93,6 5 % 96,7 97,3 97,0

25(60) I tabell 11-12 visas testresultaten med nuvarande metod respektive den metod som enligt testerna visar sig vara bäst. Tabell 11: Resultat för fördelning enligt nuvarande metod Fördelning enligt nuvarande metod. Antal KN8*land kombinationer Andel kritiska kombinationer Flöde Införsel Grupp 1: inget insamlat värde 45032 1.0000 2: inget skattat värde 84 1.0000 4:insamlat 0-1 mkr 66592 0.7799 5:insamlat 1-10 mkr 4274 0.6708 6:insamlat 10-100 mkr 454 0.7731 7:insamlat över 100 mkr 14 0.7143 Totalt 116450 0.8611 Utförsel Grupp 1: inget insamlat värde 27108 1.0000 2: inget skattat värde 124 1.0000 4:insamlat 0-1 mkr 34865 0.7222 5:insamlat 1-10 mkr 1475 0.4861 6:insamlat 10-100 mkr 98 0.4286 7:insamlat över 100 mkr 10 0.7000 Totalt 63680 0.8351 Totalt Grupp 1: inget insamlat värde 72140 1.0000 2: inget skattat värde 208 1.0000 4:insamlat 0-1 mkr 101457 0.7601 5:insamlat 1-10 mkr 5749 0.6234 6:insamlat 10-100 mkr 552 0.7120 7:insamlat över 100 mkr 24 0.7083 Totalt 180130 0.8519

26(60) Tabell 12: Resultat för fördelning enligt bästa metod. Fördelning enligt bästa metod. Antal KN8*land kombinationer Andel kritiska kombinationer Flöde Införsel Grupp 1:inget insamlat värde 32435 1.0000 2:inget skattat värde 74 1.0000 4:insamlat 0-1 mkr 66592 0.7453 5:insamlat 1-10 mkr 4274 0.4684 6:insamlat 10-100 mkr 454 0.3921 7:insamlat över 100 mkr 14 0.5000 Totalt 103843 0.8120 Utförsel Grupp 1:inget insamlat värde 19137 1.0000 2:inget skattat värde 147 1.0000 4:insamlat 0-1 mkr 34865 0.7845 5:insamlat 1-10 mkr 1475 0.6190 6:insamlat 10-100 mkr 98 0.5306 7:insamlat över 100 mkr 10 1.0000 Totalt 55732 0.8543 Totalt Grupp 1:inget insamlat värde 51572 1.0000 2:inget skattat värde 221 1.0000 4:insamlat 0-1 mkr 101457 0.7588 5:insamlat 1-10 mkr 5749 0.5070 6:insamlat 10-100 mkr 552 0.4167 7:insamlat över 100 mkr 24 0.7083 All 159575 0.8268

27(60) Utvärderingen har hittills fokuserat på effektmål 2. I projektet finns det också ett effektmål 1 som avser andelen skattade KN8 * land kombinationer, där den skattade andelen utgör minst 25 procent vid 1:a publiceringen ska minska med minst 25 procent. Notera att även effektmål 1 inte är lätt att nå, beroende på dels att den skattade totalhandeln, inte kan påverkas genom fördelningen, utan bara kan omfördelas. Effektmål 1 innefattar inte bara bortfallsföretag med historiska data, utan också uppgiftsskyldiga företag utan historiska data eller ej uppgiftsskyldiga företag under tröskelvärdet. Därför är det svårt att dra slutsats från den här utvärderingen. Notera att antalet KN8*land kombinationer för objektsbortfallet vid första publiceringstillfället, som sedan inkommit med Intrastat är 108 207 st. i vår utvärdering. Den nuvarande skattningsmetoden fördelade ut 180 130 kombinationer, och den bästa metoden från utvärderingen är 159 575. Det finns flera metoder med större trösklar för värde eller frekvens som genererat mycket mindre antal kombinationer. Detta är emellertid inte säkert en indikation på förbättringar varken för effektmål 2 eller effektmål 1. Som vi tidigare nämnt är det inte en lätt uppgift att fördela skattade värden på en så detaljerad nivå som KN8*land, med korta, volatila och oregelbundna data. I utvärderingen har många metoder ingått som gett olika resultat. Vissa av dem visar tendenser som kan leda till flera tester. Den stora mängden information från alla metoder kan vara värt att analysera vidare. Vi har i arbetet begränsat oss till enbart fyra olika metodansatser. Det kan finnas andra synvinklar som kan utöka antalet tänkbara fördelningsmetoder också. Mikrogranskning för detaljerade historiska data, och senare data på nivån KN8*land samt jämförelse mellan dessa kan förmodligen vara en bra start, även om detta kan vara tidskrävande. 3.2.2 Förbättra tillförlitligheten när historik saknas För att få en bild av förhållandet mellan de tre skattningskategorierna cut off delen, objektsbortfall med historik samt objektsbortfall utan historik kan vi studera tabell 13. Tabellen visar andelen och faktiskt skattat värde för de tre kategorierna för första publiceringen av 201108, med dess sju revideringsperioder. Det bör observeras att kriteriet om minst tre månaders historik implementerats vid denna publiceringskörning. Vi kan bl.a. uppmärksamma att merparten av det skattade värdet utgörs av skattningar utan historikinformation per företag. För revideringsmånaden 201101 skattas 97,5 procent av bortfallsvärdet utan historik. För publiceringsmånaden är denna siffra 77,5 procent. Man kan också se att cut off ligger konstant mellan 2,0 och 2,6 miljarder SEK i införseln och mellan 0,9 och 1,2 miljarder SEK i utförseln.