SAS Grid Computing. Kent Odelli, IT Architect SAS Institute. Copyright 2010, SAS Institute Inc. All rights reserved.



Relevanta dokument
Elisabet Stöök Konsult SAS Institute AB Copyright 2003, SAS Institute Inc. All rights reserved.

Ny skalbar och öppen OLAP-teknologi, SAS OLAP server

Copyright 2003, SAS Institute Inc. All rights reserved.

Tomas Borg, konsult, SAS Institute Elin Rydell, konsult, SAS Institute Copyright 2003, SAS Institute Inc. All rights reserved.

SAS Institute Education Center. Kurser hösten 2007

DI Studio nyheter

SAS Intelligence Architecture. Patrick Eckemo IT Arkitekt / PM Arkitektur SAS Institute

Nya BI-klienter i SP4. Daniel.Ringquist@swe.sas.com Product Manager Business Intelligence SAS Institute

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Nya möjligheter med M3 Technology. Björn Svensson, Björn Torold

Migrering av AppDevStudio och SAS/IntrNet applikationer till SAS 9. Daniel Lindborg Konsult SAS Institute

Johan Elfman Konsult SAS Institute AB Copyright 2003, SAS Institute Inc. All rights reserved.

Michael Q. Jones & Matt B. Pedersen University of Nevada Las Vegas

FANS Network Meeting. SAS Platform 25/10-18

Aktivitetsschemaläggning för flerkärninga processorer

EVRY One Outsourcing Linköping AB. Erfaranheter av daglig drift och nyttjande av IFS Applications 8.

Vägen fram för ArcGIS for Server. Johnny Björk

Data Domain. Världens snabbaste Backup.

Testdriven utveckling. Magnus Jonsson Siemens Medical Solutions

LARS. Ett e-bokningssystem för skoldatorer.

SAS USER FORUM SWEDEN 2017 USER FORUM. SAS Viya och öppenhet en gemomgång av LUA-, Java-, Python- och REST-gränssnitten mot SAS Viya

Hyper-Threading i Intelprocessorer

Administration / Disk Management. EC Utbildning AB

Vad gör européer på dagarna? Anders Kraftling SAS-ansvarig Statistiska Centralbyrån

Kvalitetssäkra ditt projekt med kontinuerlig integration

Application Note SW

Introduktion till migrering till molnet. PART 4: Plattformar för molntjänster

SharePoint 2010 licensiering Wictor Wilén

TDDIU81. Processer och trådar. Andreas Dahlberg, Jonathan Doherty, Tony Magnusson, Patrik Ottosson, Rasmus Siljedahl

Cloud Computing för arkitekter Sten Sundblad IASA och Sundblad & Sundblad

Superscalar Bra: Hårdvaran löser allt: Hårdvara detekterar poten6ell parallellism av instruk6oner Hårdvara försöker starta exekvering (issue) av så

F2 Exchange EC Utbildning AB

Minnesisolering för virtuella maskiner en hypervisorstudie

Extern åtkomst Manual för leverantör

Introduktion till programmering SMD180. Föreläsning 1: Programmets väg

ÖVERVAKNING AV SQL SERVER

Systemkrav Bilflytt 1.4

Modul-Fleet NÄR DU VILL FÅ UT MER AV DIN FLOTTA. I can help! Ordered 3 items. Can t serve last client. Running late!

Dagens OS. Unix, Linux och Windows. Unix. Unix. En översikt av dagens OS Titt på hur de gör. Många varianter Mycket gemensamt. En del som skiljer

Hjälpmedel: Inga hjälpmedel förutom penna, suddgummi och glatt humör.

Exam Concurrent and Real-Time Programming

Datorteknik ERIK LARSSON

IBM FlashSystem (och lite SSD)

Schemaläggningsmetodik för multi-core inom Windows 7 OS Vad är scheduling och hur schemalägger Windows OS sina processer?

Vilka trender och tendenser påverkar ditt val av beslutssystem

Fakulteten för ekonomi, kommunikation och IT. Corba. Datum: Mathias Andersson

Vilket moln passar dig bäst?

Olika OS. Unix, Linux och Windows. Unix. Unix. En översikt av ett par OS. Titt på hur de gör. Många varianter. Mycket gemensamt. En del som skiljer

Instruktioner för uppdatering från Ethiris 5.x till 6.0

Flytta din affär till molnet

Visual Analytics från en SAS-programmerares perspektiv

Datorarkitekturer med operativsystem ERIK LARSSON

PROFINET MELLAN EL6631 OCH EK9300

Aditro Our focus benefits yours Nyhetsdagar för användare av Aditros lösningar för Privat Marknad Sverige Sverige Aditro E&O

Seminarium Internet of Things - Chalmers Industriteknik 13 April Johanna Ternström Product Manager

Hyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2

Outline. Datorsystemtekni. Kravspecifikation. Kravspecifikation (forts.)

Microsoft Operations Manager 2005

Taking Flight! Migrating to SAS 9.2!

Systemkrav Bilflytt 1.3

QC i en organisation SAST

Kontinuerlig lönsamhetsanalys med ABC/ABM. Hellen Wohlin, Pointer

Dynamics 365 for Operations MIKAEL ALGEROTH

Aditro Our focus benefits yours Molnet -- Presentation

Dag König Developer Tools Specialist Microsoft Corporation

PowerCell Sweden AB. Ren och effektiv energi överallt där den behövs

Boiler with heatpump / Värmepumpsberedare

Quick Start Guide Snabbguide

Systemkrav Tekis-Bilflytt 1.3

Introduktion till hårdvara, mjukvara och operativsystem

ADITRO LÖSNINGAR FÖR EN ENKLARE JOBBVARDAG SUMMIT 2014 PER JOHANSSON & JOEL KÖHL ADITRO L FRÅN WINDOWS TILL WEB

Operativsystem. Hierarkin för hårdvara läses nerifrån

Det finns en handledning till kortet på hemsidan. AVR STK500.

Ta kontroll över kopiering och utskrifter med uniflow Output Manager

Amazon Cloud Computing Joakim Lindbom CTO, Capgemini Sverige. Who am I? Jobbat inom Capgemini sedan 1985

Metadata och Säkerhet i SAS miljön Frida Säfström

Tips & Trix - Teknik Jeeves World Copyright 2011 Jeeves Information Systems AB

Ta kontroll över dina loggar och gör dem användbara!

Vår flexibla lösning för för Intelligent Workload Management

Användarhandbok. Trio Visit Web. Trio Enterprise 4.1

Nedladdning från PA. 1. Koden (nyckeln) 2. Programmet. SPSS Statistics 23. Gunilla Rudander IBM Corporation

electiaprotect GSM SEQURITY SYSTEM Vesta EZ Home Application SMART SECURITY SYSTEMS! SVENSKA ios Android

Utarbetat av Område Informationsklass. Teknisk standard Ånge Kommun...1. Syfte med beskriven it-miljö...3. Hårdvara...

What Is Hyper-Threading and How Does It Improve Performance

Vabas Systemkrav

Real world SharePoint 2013 architecture decisions. Wictor Wilén

Läs detta! Uppgifterna är inte avsiktligt ordnade efter svårighetsgrad. Skriv ditt idnummer på varje blad (så att vi inte slarvar bort dem).

Alla mediafiler Säkert på ett ställe

Nätverket Den viktigaste faktorn för ökad produktivitet och kvalité.

Utveckla samarbete inom avdelningen. Utveckla samarbetet. mini workshop! i butikens ledningsgrupp. Grid International AB. Grid International AB

Styrteknik 7.5 hp distans: E-1000 och E-Designer

HANTERING AV UPS CX

Kommunikation och Automation

Välkommen! SA S PSA S Im I puls s Mobilite t t e 8 1

Storage. Effektivare datalagring med det intelligenta informationsnätet.

LEX INSTRUKTION REPLIKERING UPPGRADERING

Transkript:

SAS Grid Computing Kent Odelli, IT Architect SAS Institute

Vad är Grid? En samling av resurser som är samordnade för att lösa ett gemensamt problem.

Varför Grid? Märkbar ökning i data. Märkbar ökning i analysbehov. Ökning i antalet SAS-användare. Schemalagda jobb som inte kan avslutas i tid pga. brist på hårdvaruresurser. Hårdvara som inte kan utnyttjas i andra sammanhang pga. sämre prestanda. Växande IT-kostnader som påverkar SAS-användarna hos verksamheten.

Problemscenario Perioder med hög belastning / Schemaläggning Körningar vid vissa perioder kan inte hanteras effektivt pga. begränsad budget. Många jobb som behöver schemaläggas har komplexa beroenden när det gäller tidpunkter och/eller dataleveranser. Schemaläggningsverktygen som AT och CRON räcker inte till.

Problemscenario Användning Flera SAS-användare som exekverar SAS-jobb på en och samma SAS-server, ibland samtidigt. Ad-hoc-användare som utvecklar, testar, implementerar och administrerar modeller, queries, osv. Användarna upplever att det är krångligt att administrera SAS-miljön.

Problemscenario Data Data som ökar exponentiellt och blir mer komplext. Behov av fördjupade och komplexare analyser för bättre och mer exakt resultat.

Problemscenario Energikonsumtion (Det icke-gröna alternativet) Många SAS-installationer på varsin fysisk server.

Vad kan SAS Grid lösa?

Lösningsscenario Perioder med hög belastning / Schemaläggning Linjär skalbarhet ( skala ut i stället för skala upp ). Inkrementella IT-kostnader, både på hård- och mjukvara. Dynamisk resursallokering (flexibel kapacitet). Policies och prioriteringar for att styra hårdvaruresurser. Ett visuellt användargränssnitt för att skapa och administrera SAS arbetsflöden som ska schemaläggas på gridnodes.

Lösningsscenario Användning SAS Grid Manager exekverar delar av ett arbetsflöde så snart hårdvaruresurser blir tillgängliga. Jobben med högre prioritet kan hanteras genom att pausa körning av andra jobb med lägre prioritet ( preemption ). SAS Grid Manager styr hur mycket hårdvaruresurser ett jobb kan använda, och på så sätt förhindra att all kraft tas i anspråk.

Lösningsscenario Data Grid Manager delar upp lasten mellan flera servrar, vilket minskar tiden för en körning drastiskt. SAS Grid Manager exekverar delar av ett arbetsflöde så snart hårdvaruresurser blir tillgängliga.

Lösningsscenario Energikonsumtion (Det gröna alternativet) Alla hårdvaruresurser i en grid utnyttjas till fullo. När ett jobb avslutas skickar SAS Grid Manager omedelbart nya uppgifter, så att hårdvaran aldrig idlar. SAS Grid Manager kan hantera exekvering av modeller parallellt, vilket utnyttjar tillgängliga resurser på bästa sätt.

Vad kan SAS Grid Manager? SAS Grid Manager Distributed Enterprise Scheduling Workload Balancing Parallelized Workload Balancing Sprida ut jobben inom ett arbetsflöde mellan resurser. Sprida ut arbetsbelastningen mellan resurser. Sprida ut parallelliserad arbetsbelastning mellan resurser.

SAS-produkter på Grid SAS Grid Manager Distributed Enterprise Scheduling Workload Balancing Parallelized Workload Balancing SAS Data Integration Studio SAS Web Report Studio SAS Marketing Automation SAS Marketing Optimization Alla SAS-program (med en wrapper ), inklusive stored processes och SAS Enterprise Guide. SAS Data Integration Studio SAS Enterprise Miner SAS Risk Dimensions SAS-program (efter mod).

Komponenter kompatibla med SAS Grid SAS Metadata Server. SAS Object Spawner. SAS OLAP Server. SAS/SHARE Server. Platform Process Manager. Web Application Tier-komponenter. Andra kritiska komponenter, inklusive 3:e partsprodukter (JBOSS).

Arkitektur Mjukvara Gemensam filarea för: - Jobb-deployment. - Käll- och måldata. - SAS-applikationer. SAS Management Console Grid Manager Plug-in Platform Grid Management Service Platform LSF Platform LSF Platform LSF Platform LSF SAS Data Integration Studio Platform Process Manager SAS Enterprise Miner SAS Enterprise Guide Other SAS Clients - Base SAS - SAS CONNECT - SAS Workspace Server - SAS Grid Server - SAS Data Step Batch Server - Base SAS - SAS CONNECT - SAS Workspace Server - SAS Grid Server - SAS Data Step Batch Server - Base SAS - SAS CONNECT - SAS Workspace Server - SAS Grid Server - SAS Data Step Batch Server Gridklienter Grid Control Server Gridnode 1 Gridnode n SAS Metadata Server

Arkitektur Hårdvara Gridklienter Grid Control Server Gridnode 1 Gridnode n SAS/CONNECT

Samordning av resurser på SAS Grid LSF Queue: Samordnare för alla jobb i grid. Jobb-schedulering och kontroll. Diverse policies för att administrera köer: Prioriteringar och preemption. Jobb-slots och slot-pools. Hosts och hostgrupper. Användare och användargrupper.

SAS Grid Manager SAS Code Analyzer SAS Job Step 1 Step 2 Step 3 Step 4 Step 5 Step 6 Fyra rader av kod! SAS yourjob.sas PROC SCAPROC; RECORD yourjob.txt Run;

Grid-anpassning av SAS-kod SAS Code Analyzer - Kodexempel /*----------------------------------------------------------------------*/ /*----------------------------------------------------------------------*/ /* There are 2 tasks in this job. */ /*----------------------------------------------------------------------*/ Get an available session with the scagrid_gs function */ /* 2 of these tasks can be RSUBMITed. */ /*----------------------------------------------------------------------*/ Wait for and sign off all sessions. */ /* These 2 tasks used 15 units of time. */ proc /*----------------------------------------------------------------------*/ scaproc; getsession 1 "sess"; run; /* The longest task took 15 units of time, 100% of total time. */ %put %scagrid_waitfors(&scagrid_sessions); sess=&sess; /*----------------------------------------------------------------------*/ /*----------------------------------------------------------------------*/ %let SCAGRID_SESSIONS=2; /* Termination rsubmit for for task our 1 SCAGRID functions. */ /*----------------------------------------------------------------------*/ /*----------------------------------------------------------------------*/ /* Enable grid service */ rsubmit proc scaproc; &sess sysrputsync=yes shutdown; run; cmacvar=scagrid_task_1; /*----------------------------------------------------------------------*/ proc /*----------------------------------------------------------------------*/ summary data=wk_data.a; %let rc=%sysfunc(grdsvc_enable(_all_, resource=sasapp)); var /* All x; done. output out=new1 mean=mx; */ /*----------------------------------------------------------------------*/ run; /*----------------------------------------------------------------------*/ /* This macro starts up the connect sessions */ endrsubmit; /*----------------------------------------------------------------------*/

Köer Begin Queue QUEUE_NAME = High PRIORITY = 80 QJOB_LIMIT=100 PREEMPTION = PREEMPTABLE[Med Low] End Queue Begin Queue QUEUE_NAME = Med PRIORITY = 90 QJOB_LIMIT=25 PREEMPTION = PREEMPTABLE[Low] PREEMPTIVE[High] End Queue Begin Queue QUEUE_NAME = Low PRIORITY = 100 QJOB_LIMIT=15 PREEMPTION = PREEMPTIVE[Med+1 High+2] End Queue

SAS Command Line Grid Submission Utility Fristående verktyg. Användarna kan submit and forget. Det är inte nödvändigt att vara uppkopplad för att exekvera jobben. Användarna kan granska jobbstatus och output medan jobbet körs. Användarna kan avsluta körningen i förtid ( kill ). Använder SAS Checkpoint/Restart -funktionalitet. Använder SAS Grid Manager metadata for centraliserad kontroll. Kräver en gemensam filyta för klienter och griden.

SAS Checkpoint/Restart-funktionalitet Information lagras i Checkpoint Library. Exekvering av DATA- och PROC-stegen. När ett jobb avslutas i förtid: Startar om jobbet i Restart -mode. Läser Checkpoint Library. Fortsätter från den exekvering som avslutades korrekt. WORK-tabeller kan lagras och återanvändas. Globala statements och macros exekveras om. Checkpoint Library SAS Job DATA Step DATA Step PROC Step DATA Step PROC Step PROC Step

Datalagring är nyckeln! Gemensam filyta (SAN?) Throughput 30-50 MB/sek/CPU-core (~1.8 3GB/sek med 64 CPU-cores). Datakomprimering (SPDS) Vid libname-assignment ( COMPRESS=YES ). Beroende av typen av data.

Show Me The Money! Ingen anledning att köpa en ny stor server, vanliga blades eller arbetsstationer är tillräckliga. Nya servrar kan läggas till i griden när som helst. Befintliga licenser för operativsystem kan återanvändas. Floating -licenser. Betala enbart för resurser som utnyttjas. SAS-jobb scheduleras beroende på resurstillgänglighet.

Dokumentation http://www.sas.com/grid

Frågor?

Thank You Kent Odelli, IT Architect SAS Institute kent.odelli@swe.sas.com Copyright 2010, SAS Copyright Institute Inc. 2010, All SAS rights Institute reserved. Inc. All rights reserved.