Tuve Löfström Lektor i datavetenskap Sektionen för informationsvetenskap Högskolan i Borås
Med 10 miljarder människor blir det 3.52 TB per person 90% av den data som existerar idag har skapats under de senaste två åren(ibm).
Big data The amount of data in our world has been exploding. Companies capture trillions of bytes of information about their customers, suppliers, and operations, and millions of networked sensors are being embedded in the physical world in devices such as mobile phones and automobiles, sensing, creating, and communicating data. Multimedia and individuals with smartphones and on social network sites will continue to fuel exponential growth. Big data large pools of data that can be captured, communicated, aggregated, stored, and analyzed is now part of every sector and function of the global economy. Like other essential factors of production such as hard assets and human capital, it is increasingly the case that much of modern economic activity, innovation, and growth simply couldn t take place without data. Från preface av Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, 2011. www.siir.se
Big data Då mängden data blir så stor att standardsystem inte klarar av att samla in, bearbeta och behandla den inom en rimlig tid, benämns dessa datamängder för big data. Att analysera och utnyttja dylika datamängder för att hitta intressanta mönster och utvinna värdefull information kallas big data analytics. Exakt vad som utgör big data varierar utifrån uppgifterna infrastrukturen ackumulerade erfarenheten hos företaget som äger datamängderna. Big data analytics kräver exceptionell teknik, för att på ett effektivt sätt kunna behandla data, inom givna tidsramar. www.siir.se
Big data => Smart data Fokus bör flyttas från big data till mer fundamentala och principiellt viktiga problem ( smart data ) inom dataanalys Du behöver inte drunkna i data för att kunna simma i information Inte ens de största svenska e-handelsföretagens kunddatabaser utgör big data i betydelsen att typiska big data -lösningar i form av olika MapReduce verktyg, exempelvis Hadoop, krävs. Det är därmed andra faktorer än förmågan att snabbt samla in, lagra och bearbeta stora mängder data som avgör om svenska handelsföretag skall vara framgångsrika i sin dataanalys. En viktig konsekvens av detta är att dataanalys inte kräver gigantiska investeringar i hårdvara, analysverktyg och konsulttjänster och i och med det blir tillgängligt även för mindre aktörer. www.siir.se
Vilket steg tror ni är svårast och har störst betydelse för resultatet? Vilket steg är överlägset lättast?
AI-algoritmen står egentligen bara för detta steget
Generiska tekniker Det avgörande är inte att välja rätt algoritm eller system, utan att ha tillräcklig kunskap om möjligheterna för att kunna identifiera lämpliga användningsområden i den egna verksamheten Algoritmerna är generella trots att problemen är specifika Prediktiv modellering är då en algoritm utifrån tillgänglig historisk data skapar en modell som senare används för förutsägelser (prediktioner) eller förklaringar För handeln kan prediktiv modellering utnyttjas för exempelvis: responsmodellering (utveckla sin marknadsföring baserat på den respons man tidigare fått), churn-predicering (förutsägelse av vilka som kommer att sluta vara kunder och hur de ska behandlas) försäljningsprognoser kundvärde Det är viktigt att inse att det tekniskt är exakt samma metoder och algoritmer som används för alla dessa (och många andra liknande) uppgifter. Och jag menar verkligen EXAKT samma metoder! www.siir.se
Project Data Purpose (sample) Technique Partners DATAMINE 7 MSEK (3.3 MSEK) Web CRM Robot journalism Personalization Traditional AI NLP Predictive modeling Hall Media Stena Line AB Pdb DADEL 19 MSEK Patient records ADE reports Chem-phys. data Find adverse drug effects NLP Predictive modeling KI WHO AstraZeneca SAD (DDI) 12 MSEK (6 MSEK) Click-streams CRM Predict churn Estimate lifetime value Attribution Predictive modeling Ellos Eton Vinga of Sweden DASTARD 4.0 MSEK Chem-phys. data Maintenance data from trucks Drug discovery Reduce fuel consumption Predictive modeling AstraZeneca Scania FBI 2.0 MSEK CRM Campaign data Sales data Improve forecasts Consumer insights Predictive modeling Clustering ICA Willys Pericles 9.6 M Space data Digital art Anomaly detection Digital preservation Predictive modeling Clustering Tate museum Space Applications Services GOATS 2.4 MSEK Swing data from Trackman Video Find key indicators of swing quality Support teaching online Predictive modeling Concept description PGA instructors Golf schools Golf clubs
Säljer presentartiklar till företag Väldigt korta artikelcykler Majoriteten av artiklarna byts ut mellan två säsonger Skapa datadrivna inköpsprognoser för nya varor Generella features: kategori, färg, form, förpackning, mm Utnyttja hemsidan: besökshistorik som underlag för inköp
Driver ett 20-tal tidningar i Småland och Jönköpingsregionen Är mitt uppe i en digital transformation Går från att vara ett traditionellt mediahus till att bli en datadriven organisation Personalisering Datadrivna redaktörsbeslut Beslutstöd till journalister
Ellos skickar ut mängder av kampanjer Varje kampanj består av ett antal Kampanjelement Fri frakt 25% rabatt på första varan Krav värde Vilka kampanjelement fungerar och hur samverkar de Vinst Aktivering Miljontals ordrar kopplade till kampanjer har analyserats
Hur stor skall bemanningen vara i B&Bs lager? Går från två till ett skift Har både fast anställd och timanställd personal Antal som ringts in har tidigare kunnat justeras under andra skiftet Antalet orderrader att plocka kan variera mellan 5000 och 25000 Stor andel orderrader rapporteras in sent kvällen innan eller under arbetsdagen B&B vill få en prognos så tidigt som möjligt Samarbete med Pdb
Alla pratar om digitalisering Digitaliseringen innebär för många branscher en snabb och disruptiv förändring som påverkar alla aspekter av organisationers verksamhet. Trots detta bör digitaliseringen, enligt mig och många andra, ändå i första hand ses som en nödvändig förutsättning för den verkliga revolutionen - då det praktiska genomslaget av artificiell intelligens (AI) äntligen motsvarar den hype som länge funnits kring begreppet. Vinnova skriver följande i rapporten "Artificiell Intelligens i svenskt näringsliv och samhälle" (2018): "Sveriges värdeskapande potential i användningen av AI i näringsliv och offentlig verksamhet är stor. De flesta bedömningar pekar på en tillväxtpotential som är dubbelt så snabb med stort AI-utnyttjande i ekonomin jämfört med ett lågt AI-utnyttjande."
Humans perform tasks and business processes. 0 LEVELS OF COGNITIVITY (AUTONOMOUS BUSINESS) 5 AI generates and tests business hypotheses across the business as well as push those changes live. Humans can intervene but probably only at a very coarse level. 1 4 Specific tasks or business processes are performed with connected data and simplistic views in B.I tools. Humans make all decisions. AI is used to support human decision making (recommender type support) in specific tasks or business processes. 2 3 AI completely controls specific tasks or business processes and makes decisions. Humans can easily intervene and monitor decisions. AI creates business relevant hypotheses through monitoring and controlling tasks and business processes without human intervention.
AI Nu och i omedelbar framtid FATE: Fairness, Accountability, Transparency, and Ethics in AI As we harness the power of AI, machine learning, and data science throughout many aspects of society and Microsoft systems and products, we need to consider the larger issues with AI. These techniques raise complex ethical and social questions: How can we best use AI to assist users and offer enhanced insights, while avoiding exposing them to discrimination in health, housing, law enforcement, and employment? How can we balance the need for efficiency and exploration with fairness and sensitivity to users? As we move toward relying on intelligent agents in our everyday lives, how do we ensure that individuals and communities can trust these systems? (Microsoft research group FATE)
FATE AI går i dag från beslutsstöd till automatiskt beslutsfattande FATE-aspekterna är avgörande för att vi skall kunna lita på AI. GDPR Art. 13:2F The controller shall, at the time when personal data are obtained, provide the data subject with the following further information necessary to ensure fair and transparent processing: the existence of automated decision-making, including profiling, referred to in Article 22 (1) and (4) and, at least in those cases, meaningful information about the logic involved, as well as the significance and the envisaged consequences of such processing for the data subject. Vår forskningsgrupp arbetar bland annat med Transparency en AI måste kunna förklara sitt resonemang, på ett språk som användaren förstår! Vi argumenterar även för att en AI måste kunna redovisa hur säker den är i sina rekommendationer.
Övergripande rekommendation Använd dataanalys! Det kan stödja mängder av olika processer och beslut Sambanden som hittas är objektiva och kan mycket väl vara oväntade Själva dataanalysen är förvånansvärt enkel Dataanalys inom handeln (och liknande områden) är sällan big data analytics Det finns mängder av fritt tillgängliga och lättanvända verktyg vilka samtidigt är extremt kraftfulla Man kan välja att bara nyttja dataanalys för enstaka uppgifter, och det är enkelt att kombinera dataanalys med mer traditionella metoder det är absolut inte allt eller inget Överväg att anställa data scientists och/eller samarbeta med akademin. Tänk inte digitalisering tänk AI! Beakta FATE.
Tack! Frågor? tuve.lofstrom@hb.se Tar gärna frågor nu eller via mail