D-LAB DATADRIVET LABB Siamak Khatibi BLEKINGE INSTITUTE OF TECHNOLOGY Institutionen för Teknik och Estetik, DITE KARLSHAMN 1
CORE OF OUR ACTIVITIES AND ITS RELATION TO OTHER FIELDS 2
ONGOING PROJECTS: Scaling-Super resolution Semantic modeling (UAV) Camera sensor- dynamic range Image/video quality assessment Image content assessment Integral imaging-plenoptic Blurring artifact classifier Video tagging D-Lab 3
ANDRA DATA RELATERADE FORSKNINGSGRUPPER IN BTH Datoranvändning med människan i centrum för nya visuella och interaktiva applikationer (Human-Centered Computing for Novel Visual and Interactive Applications) BigData 4
VAD ÄR DATA-DRIVEN INNOVATION (DDI)? DDI avser användningen av data och analys för att förbättra eller främja nya produkter, processer, organisationsmetoder och marknader. 5
DATA ÄR DEN NYA R&D FÖR 21-TALET INNOVATIONSSYSTEMS Offentlig förvaltning Hälsa Detaljhandel Lantbruk Vetenskap och utbildning Transport 6
DATA ÄR INTE OLJA, UTAN EN INFRASTRUKTUR Data är icke-konkurerande (men exklusiv) Dataåteranvändning och icke-diskriminerande åtkomst kan maximera sitt värde Data möjliggör mångsidiga marknader Data är ett kapital med ökad avkastning Data kan återanvändas som ingång för vidare produktionen Data länkning är en nyckelkälla för innovativa idéer Data är en generell inmatning med inget inneboende värde Data är en ingång för flera ändamål Dess värde beror på komplementära faktorer relaterade till kapaciteten att extrahera information (t ex färdigheter, programvara) 7
DET FRAMVÄXANDE GLOBALA DATA EKOSYSTEMET Thousands Number of top sites hosted 450 80 400 70 60 50 350 40 30 300 20 RUS 10 250 0 200 Top locations by number of colocation data centres and top sites hosted Magnified DEU R² = 0.5737 CHN FRA JPN NLD CAN AUS IND 0 50 100 150 200 GBR R² = 0.9758 USA 150 100 50 0 DEU FRA GBR 0 200 400 600 800 1 000 1 200 1 400 Number of co-location data centres Source: OECD (2015), Data-driven Innovation: Big Data for Growth and Well-Being, OECD Publishing 8
INFÖRANDET AV DDI OCH RELATERAD TEKNIK I FÖRETAG The diffusion of selected ICT tools and activities in enterprises, 2014 Percentage of enterprises with ten or more persons employed Gap 1st and 3rd quartiles Average Lowest Highest % 100 FIN FIN 80 60 MEX NZL ISL BEL FIN NZL KOR 40 MEX KOR 20 0 TUR Broadband Website E-purchases Social media ERP Cloud computing JPN Source: Based on OECD Science, Technology and Industry Scoreboard 2015 (forthcoming), OECD, ICT Database; Eurostat, Information Society Statistics and national sources, July 2014. ISL POL MEX HUN E-sales Supply chain mngt. (ADE) CAN RFID 9
MED FOKUS PÅ SMÅ OCH MEDELSTORA FÖRETAG Use of cloud computing as a percentage of enterprises in each employment size class, 2014 % All enterprises 10-49 50-249 250+ 70 60 50 40 30 20 10 0 Source: OECD, ICT Database; Eurostat, Information Society Statistics and national sources, January 2015. http://dx.doi.org/10.1787/888933224863 10
BRISTEN PÅ DATASPECIALISTER ÄR OCKSÅ EN SAKNAD MÖJLIGHET FÖR SKAPANDE AV ARBETSTILLFÄLLEN % 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 Data specialists as a share of total employment in selected OECD countries 2013 2012 2011 Source: OECD based on data from Eurostat, Statistics Canada, Australian Bureau of Statistics Labour Force Surveys and US Current Population Survey March Supplement, February 2015. 11
CLOUD-BASED AUTOMATIC DATA PROCESSING I D-Lab 12
IN GENERAL: TWO KEY STEPS Input Data Preprocessing Outliers / Mess Computer Vision/ Machine Learning Output Classification/ Prediction 13
EXAMPLE: TIME SERIES Normal Data Training Input Time Series Auto Imputation Auto Detection & Labelling Accident Data Training Output Prediction Event Data Training Different models for different situations to improve accuracy 14
TECHNICAL STACK Layer Software Examples Usage/Providing Library R-Caret, Python-Scikit-Learn, Weka, PLC, OpenCV, CaffeOnSpark Analysis Abilities Framework GPU, Spark, TensorFlow Parallel/Distributed Computing Persistent Storage Hadoop, Cassandra Distributed Data Platform Docker/Kubernetes, Mesos, Marathon/Jenkins Isolated Environment Infrastructure Openstack Virtual Machines 15
DEEP LEARNING IN WEB https://www.youtube.com/watch?v=qzaacl_f9r0 16
DEEP LEARNING IN WEB https://www.youtube.com/watch?v=qzaacl_f9r0 17
TARGETING: DRAG-DROP-CLICK MACHINE LEARNING https://www.youtube.com/watch?v=w0jrgvwdhn4
TARGETING: DRAG-DROP-CLICK MACHINE LEARNING https://www.youtube.com/watch?v=w0jrgvwdhn4
VINNOVA ANSÖKAN-2017 URBAN DATA AV SMÅ OCH MEDELSTORA STÄDER Mål Ett datadrivet innovationslabb avses att startas och bedrivas inom det tematiska området urban data i små och medelstora städer. Labbet blir en öppen arena för att tillgängliggöra och förädla data. Detta skapar i sin tur förutsättningar för innovationer för såväl offentliga sektorn, näringslivet och privata entreprenörer. Etableringen av labbet med sin virtuella miljö möjliggör lärande, utveckling och användning av tjänster baserade på urban data. 20
VINNOVA ANSÖKAN-2017 URBAN DATA AV SMÅ OCH MEDELSTORA STÄDER Partner BTH-DITE Karlskrona Kommun Karlshamn kommun NetPort Science Park 21