Big Data i spelbranchen

Relevanta dokument
Jonas Gustavsson. Leverans av 10PB Isilon

Leverantör av programvarutjänster skapar kostnadseffektiv lösning för e-förvaltning

Kompletterande instruktioner för installation och konfiguration av HMS-server för koppling mot KONTAKT

Diagnostisktprov Utveckla i Azure

Webbtjänster med API er

LATHUND INSTALLATIONSANVISNINGAR PROJEKTSTRUKTUR 1 SAMMANFATTNING FUNKTIONER I INSTALLATIONSPAKET TEKNISK PLATTFORM...

McAfee epolicy Orchestrator Pre-Installation Auditor 2.0.0

ADITRO LÖSNINGAR FÖR EN ENKLARE JOBBVARDAG SUMMIT 2014 PER JOHANSSON & JOEL KÖHL ADITRO L FRÅN WINDOWS TILL WEB

Daniel Akenine, Teknikchef, Microsoft Sverige

Innehållsförteckning. Användarmanual för Lockbee Backup Databas 2009

Årsskiftesrutiner i HogiaLön Plus SQL

TMP Consulting - tjänster för företag

VI SI CLOSETALK AB SYSTEMKRAV

Gran Canaria - Arbetsbeskrivning knapplänkar (Mediator 8)

Innehåll. MySQL Grundkurs

Installation och konfiguration av klientprogramvara 2c8 Modeling Tool

Tentamen i datakommunikation EDA343/DIT420 Vt 2011

AVCAD 4.0 för Windows

STYRKAN I ENKELHETEN. Business Suite

Författare Version Datum. Visi System AB

Storegate Pro Backup. Innehåll

Vad är molnet? Vad är NAV i molnet? Vem passar NAV i molnet för? Fördelar med NAV i molnet Kom igång snabbt...

Din leverantör av hissautomater, pallställ, grenställ och utdragsenheter.

Mamut Open Services. Mamut Kunskapsserie. Kom i gång med Mamut Online Survey

TrustedDialog roadmap

Öppna data på Gävle kommun

Användarhandledning Plancenter Admin version 2011

Installationsanvisningar VISI Klient

Datacentertjänster IaaS

Kapitel 4 Arkivmenyn Innehåll

LEANanalyser En helt ny generations analys- och visualiseringsverktyg

Manual - Inläsningstjänsts App (ios för iphone och ipad)

Vi söker nya och spännande medarbetare till vårt utvecklingsteam.

Bilaga 2 utdrag urinförandehandbok

Uni-View Excel rapporter

Installation av Virtual Skipper Online

UPPFÖLJNING AV- OCH SÄKERHETSINSTÄLLNINGAR FÖR WEBBSIDOR 1 (8)

FrontPage Express. Ämne: Datorkunskap (Internet) Handledare: Thomas Granhäll

Komma igång med Qlikview

Virtuell Server Tjänstebeskrivning

Programinstallation Datorbaserat handsmörjningssystem

Installationsanvisningar HogiaLön Plus

Rekommendationer teknisk lösning_samsa_ ver

Installationsmanual ImageBank 2

Installation xvis besökssystem, Koncern

Årsskiftesrutiner i HogiaLön Plus SQL

Introduktion till hårdvara, mjukvara och operativsystem

Sokigo AB OVK 2.0. Pentium- eller AMD-processor (x64 processor) på 1,6 GHz Dual Core eller motsvarande.

Öppna SGU. - Vad är öppna data? - 5 star model - Öppen standard - Öppna format - Öppen licens - Teknik - REST / Atom - Exempel

Installationsanvisningar HogiaLön Plus

Integrationstjänsten - Meddelandetjänsten Version 1.0

Myndigheten för samhällsskydd och beredskap 1 (10) Datum Installationsguide ROPA

SNABBGUIDE för Windows Media Encoder (media kodaren) - Sänd live med din webbkamera

Installera SoS2000. Kapitel 2 Installation Innehåll

LEDNINGSÄGARMODUL. Systemkrav 1(6)

Klient/server. Översikt. Lektion 1: Webbtekniker från Microsoft. Webbteknik från Microsoft. Klient/server. Designmönster. Utrullning.

Installationsbeskrivning

Manual - Inläsningstjänsts App (Android)

Kodi Lathund UPPGIFT 22 TOBIAS GUSTAFSSON. TOBIAS GUSTAFSSON Tärna folkhögskola

GADD Software en introduktion

FORT! Installera programmet nu!

Installationsguide, Marvin Midi Server

LEX INSTRUKTION REPLIKERING UPPGRADERING

Administrationsmanual ImageBank 2

Bilaga 3. Säkerhet och sekretess Växjö universitet. Institutionen för pedagogik Peter Häggstrand Per Gerrevall

Data på disk är en teknisk lösning i Capitex Säljstöd som gör att viss information ej sparas i databasen utan direkt på serverns hårddisk.

6. Nytt kalenderår. Nytt kalenderår i Access Nytt kalenderår i SQL

Guide för installation av programvara NPD SV

Installation och setup av Net-controller AXCARD DS-202

LETTER OF NET CHANGES RELEASE 6.1. Beställning E-post: FACKTA Point of Sale V6R1

SLU Säkerhets instruktioner avseende kryptering av filer

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Fullständig prestandahantering

TEKNISK SPECIFIKATION. för TIDOMAT Portal version 1.3.1

Platsbesök. Systemkrav

Windowsadministration I

DI Studio nyheter

Klarna och Big Data. Erik Zeitler

Det här dokumentet är till för att ge en översikt över ASP.NET MVC samt hur WCF Services används från.net applikationer.

Dokumentation EDP Future Statistics. v 2.12

Snabbmanual: Analysen

Handbok. Elektronisk PODD SW. Art.nr Rev B SE

TEKNISK SPECIFIKATION. för TIDOMAT Portal version 1.7

DIGITAL SÄLJSTART SYSTEMET SAMLAR DATA I VARJE STEG - DATAN LIGGER TILL GRUND FÖR ANALYSER AV KÖPARE OCH BOSTÄDER

JobOffice SQL databas på server

Installationshandbok.

Introduktion till SAML federation

1 Vad är Versionshantering? 2 Git. 2.1 GitHub

Uppdatera Easy Planning till SQL

SharpdeskTM R3.2. Installationsguide Version

Användarmanual Elevdator

SharpdeskTM R3.2. Installationsguide Version

2I1070 Lektion 2 Servlets och databaskopplingar Internetprogrammering 2I1049 Treskiktsarkitektur Klient-server med servlets

Customer-Facing BI dela med dig av ditt data. 18 oktober Christer Arnqvist

Installation av Butiksdata

Installation/uppdatering av Hogia Personal fr.o.m. version 13.1

IDE USB kabel Windows XP, Vista 7 löäzxcvbnmqwertyuiopåasdfghjklöäz [Version 1.4, ]

PrintObs.NET dokumentation

Fördelar med Scanteco HC & SC- DVR Series

Meditech. CardioVisions. version 1.19.xx. Installationshandledning

Transkript:

Big Data i spelbranchen ett projekt med Hadoop och open source i fokus

Kunden Företaget arbetar med onlinespel och utvecklar många olika spel för över 100 spelbolag, exempelvis Casinon som Casinostugan och LeoVegas. Spelarna som är spridda över hela världen ska ha tillgång till onlinespel vilket ställer höga prestandaoch tillgänglighetskrav. Som ett exempel hade man 21,4 miljarder gaming transaktioner under 2014. 44 procent av alla internetanvändare spelar någon gång spel på internet för nöjes skull, även om det inte alltid spelas om pengar. 31 procent gör det varje vecka och 17 procent dagligen. Dessa fakta är tagna från 2015 men värdena har legat konstant senaste 9 åren enligt IIS, Internetstiftelsen i Sverige.

Projektets utmaningar 1) Att förstå hur företagets kunder använde spelets funktioner och inställningar beroende på vilken enhet de spelade ifrån. 2) Att förstå spelens användbarhet och användarupplevelse. Exempelvis genom frågor såsom: a) Stänger spelarna av vissa funktioner beroende på var i spelet de befinner sig? b) Vilket är det vanligaste sättet att hålla en enhet beroende på den fysiska storleken på den? Når man knapparna enkelt med tummarna? c) Hur ser heatmappen ut för miss clicks, det vill säga där kunderna klickar men det inte finns någonting att klicka på? Behöver man förtydliga att det inte är klickbart eller nyttja för att faktiskt vara klickbara? d) Skiljer ovanstående frågor sig något beroende på geografi? 3) Systemet ska kunna hantera ca 150.000 events i sekunden från hela världen. Lösningar Ett flertal datacenter sätts upp spridda över hela världen. Alla spel exekveras i en browser. En plugin skapas för att samla in information liknande: Vilken enhet spelarna använder sig av? Hur mycket minne det finns? Vilken version av browser som används? Är browsern maximerad eller inte? Vilken är skärmens upplösning? Operativsystemets språk i varje spelklient? Spelet i sig skickar information om vilka funktioner som används, vilka inställningar som görs, vilka händelser som sker i spelet och alla mus/touchskärmsklickningar som sker mm. Data från varje spelare skickas till närmaste datacenter för detaljerad analys. Processing och aggregeringar sker i varje datacenter och skickas därefter till ett centralt datacenter för self service BI samt analys på en högre nivå.

Val av Produkter NiFi : Kunden behövde ett agilt och enkelt sätta att flytta data. Niagara Files kan göra det, samtidigt som det hjälper till med att flytta och spåra data. Det kan beskrivas som data logistik, ungefär som DHL flyttar och spårar paket. En annan fördel är att det går att konfigurera till stor del. Exempelvis med accepterade förluster kontra garanterad leverans, låg latency kontra högt throughput, dynamiska prioriteringar och flöden som modifieras i runtime. Vi valde använda REST interface, öppet från internet JSON data, med enkel validering av schema och data samt en utökning av JSON med data för plats, tid mm KAFKA : För att klara belastningen behövdes ett Message Queue system för att hantera stora mängder av streamat data. Detta åstadkoms genom att lägga samtliga meddelande i en KAFKA kö med många som lyssnar (till skillnad från point to point i vanlig MQ). Vi såg en stor fördel med KAFKA eftersom det håller persistent data, en intressant egenskap då man enkelt kan spela upp och återskapa meddelanden och konsumera dom igen. KAFKA klarar dessutom ofta ett högre genomflöde än traditionella meddelandehanterare. En anledning till detta är att man inte håller reda på vem eller när meddelanden konsumerats, utan det är upp till mottagaren, dvs konsumenten att hålla reda på det. Därför används KAFKA ofta tillsammans med Storm, HBase och Spark för realtidsanalys och för att rendera data.

STORM : Användes som streamingprocessor av JSON data, hantering av eventuella duplikat i meddelanden från Kafka och för att spara informationen i Hadoop / HDFS. STORM används generellt för att processa stora mängder data, lite av vad Hadoop är för batch. Den är extremt snabb med möjlighet att processa miljoner rader per sekund och node. Hadoop : Kraftfull open source programvara till låg kostnad. Hadoop erbjuder tillförlitlig, skalbar och distribuerad databehandling på allt ifrån en enda server till tusentals datorer. Det passade utmärkt i projektet då man med Hadoop kan bearbeta stora, röriga datauppsättningar för att ge inblickar och svar, vilket bidrar till att klargöra otydlig information. Spark : Vi behövde processing av JSON meddelanden för Dynamisk ELT till Hive och lät detta ske via Spark. Spark är utmärkt för att snabbt kunna processa stora datamängder, det kör i minnet med omfattande utvecklings APIer, låter utvecklare exekvera streaming, maskinlärande eller SQL workloads som kräver snabb iterativ access till dataset. Hive : Hive valdes som den primära SQL databasen för analys och aggregeringar av data. - HBase - NoSql databas som är kolumnbaserad i stora tabeller. Den kallas även the Hadoop database. - Phoenix är som ett tillägg ovanpå HBase och levereras med JDBC drivers. Med hjälp av denna tas kundens SQL fråga och kompileras till ett antal HBase scans och ser till att dessa scans producerar ett JDBC resultat. - Sista steget var att aggregera på en högre nivå och samla allt detta data i ett centralt Hadoopkluster för bland annat Self Service BI. Analytiker och utvecklare arbetar sedan direkt mot denna databas. Summering Genom Self service BI lyckades vi identifiera och snabbt analysera konsekvenser av ändringar i spelet. Analytiker och utvecklare kunde använda Self Service BI som ett verktyg för att öka kvalitén och användarvänligheten i spelen och det nu gick att utföra A/B tester för att hitta den bästa funktionaliteten för spelarna. Precis som förutsatt klarade systemet vid projektets slut av 150.000 events i sekunden i genomsnitt world wide. Det var både ett spännande och mycket lyckat projekt där vi nådde våra målsättningar.