Sunet distribuerad lagring Förstudierapport

Relevanta dokument
VÄLKOMNA! SND workshop 15 november

Öppen tillgång till forskningsdata Forskarsamhället i förändring

SUNET:s strategi SUNET:s strategigrupp

Vad händer på SND. Arbetet framåt. Max Petzold

Avtal om Kundens användning av tjänsten Video- och distansmöte

Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online

Projektdirektiv. SKONA: SND:s konsortie- och nätverksarbete

SUNET:s strategigrupp för lärosätenas generella behov

Video- och distansmöte - Beskrivning och tjänstespecifika villkor

På gång i Sunet. Maria Häll, CEO/Föreståndare, Sunet Sunetdagarna KTH, Stockholm

Datacentertjänster IaaS

Inbjudan till dialog avseende drift och kundstöd

Svensk nationell datatjänst en infrastruktur för forskningsdata inom samhällsvetenskap, humaniora och medicin

SND, Fair Data och vägen framåt

Forskningsdatapiloten - erfarenheter och diskussion

Svensk Nationell Datatjänst

5 frågor som hjälper dig i valet av redundant lösning

Avtal om Kundens användning av

ÖPPEN TILLGÅNG TILL FORSKNINGSDATA

Innehåll Molntjänster... 4 Vad är detta?... 5 Cirkeln sluts... 6 The Cloud... 7 The Cloud (forts.)... 8 Definition av molntjänster...

Molntjänster. Översikt. Lektion 1: Introduktion till molntjänst. Introduktion till molntjänst. Vilka tjänster finns? Säkerhet.

Projektbeskrivning OpenDataUmea

Sunet /7 SUNET

E-HANDEL. It-stöd för e-handel

Avtal om Kundens användning av Journal via nätet Bilaga 1 - Specifikation av tjänsten Journal via nätet (Enskilds direktåtkomst)

1177 Vårdguiden e-tjänster. Beskrivning och tjänstespecifika villkor

DIG IN TO Nätverksadministration

Projekt Tillgängliggörande av forskningsdata 2016

Kundcase. Nacka kommun storsatsar på digital hälsa. Rätt uppkoppling avgör när Vital Integration levererar välfärdsteknik till Nacka

ESSArch vid Riksarkivet i Sverige

Nationell Tjänsteplattform och säkerhetsarkitektur. Per Brantberg, område arkitektur/infrastruktur

Swedish National Data Service

Riksarkivets IT-verksamhet. En integrerad del av vårt dagliga arbete och långsiktiga verksamhetsutveckling. Rolf Källman

Protokoll. fört vid kommittésammanträdet den 7 mars 2018.

Avtal om nyttjande av Svenska kyrkans gemensamma IT-plattform

Lathund Beställningsblankett AddSecure Control

Vetenskapsrådets samordningsuppdrag om öppen tillgång till forskningsdata - datahanteringsplaner

VETENSKAPSRÅDETS UPPDRAG: SAMORDNA DET NATIONELLA ARBETET MED ATT INFÖRA ÖPPEN TILLGÅNG TILL FORSKNINGSDATA

Bilaga 3a Ickefunktionella

W HIT E PA P ER. Vanliga frågor om Hybrid datacenter som tjänst. Hur kan jag veta att investeringen blir lönsam? t e xt : Johan Bentzel

Sunets verksamhetsplan 2015

Sjunet Anslutningsavtal Förenklat regelverk för informationssäkerhet

Bilaga 3a. Ickefunktionella krav. Upphandling av ett helhetsåtagande avseende IT-stöd för pedagogiskt material inom Skolplattform Stockholm

Framgångsfaktorer i molnet!

FUNKTIONSHYRA. Primärvård i Landstinget i Uppsala Län

Nytt leasingsystem. Förslag till beslut

Godkännande av kundapplikationer

Open APC Sweden. Nationell öppen databas över publicerings- kostnader för öppet tillgängliga artiklar

RIKTLINJER. Riktlinjer för styrning av IT-verksamhet

Svensk nationell policy för tillgängliggörande och lagring av forskningsdata. Wilhelm Widmark

Skolfederation.se. KommITS

SwePub Analys. Noden för publikationsdata i det svenska ekosystemet för forskningsinformation

Nätverksgruppen kring EU-projekt som berör digitaliseringsfrågorna

Infrastrukturkostnader inom IT-området för 2013

Slutrapport. Arbetsgruppen för Högskolans e-publicering. Till Forum för bibliotekschefer, Sveriges universitets- och högskoleförbund (SUHF)

Marketplace As a Service. White Label-tjänst

ÖVERGÅNG TILL KOMMUNIKATIONSTORGET 2.0

MOLNTJÄNSTER ÄR DET NÅGOT FÖR OSS?

Tjänstefiera din IT. - Vi har beslutat oss för att flytta vår IT till molnet. - Vilka tjänster passar våra behov och vår budget?

FUNKTIONSHYRA Primärvård i Region Uppsala

Storage. Effektivare datalagring med det intelligenta informationsnätet.

Economicmodelimpactand cloud management. PART 2: Business model enactment

RAID-torn med 4 fack för externa hårddiskar - esata USB 3.0 kabinett

DP1 och DP2. Stefan Andersson, Eva Müller Enheten för digital publicering, Uppsala universitetsbibliotek.

SND Nätverksträff 1 juni Välkomna!

Virtuell Server Tjänstebeskrivning

Samverkan och nätverk inom ABM-området. Infrastruktur i samverkan. 11 november Gunnar Sahlin.

Version Juni Utskriftsbeställning

Din guide till en säkrare kommunikation

Kommunikationstorget för Västra Götalands kommuner närmare varandra

Nyanskaffning av nätverksutrustning - Finansiering Ärende 5 KS 2018/200

SÅ SKAPAR STOKABKONCERNEN RESILIENS I DET UPPKOPPLADE STOCKHOLM

HUR MAN LYCKAS MED BYOD

Protokoll. fört vid kommittésammanträdet den 9 mars 2017.

Använd molntjänster på rätt sätt

Wexnet Green Data Center

Varför ska min organisation införa IPv6 och hur kan vi gå till väga

Bilaga, Definition av roller och begrepp, till policy för IT-säkerhet. Publiceringsdatum Juni 2007 ( rev. September 2011)

Sourcingdagarna, 8-9 Februari

SIMPLIFYSCAN. För intelligent scanning

Verkliga data för IT-beslut.

Introduktion till migrering till molnet. PART 4: Plattformar för molntjänster

Datum/Date. Protokoll. fört vid kommittésammanträdet den 4 april 2019.

Caperio CloudSystem NICE TO MEET YOU. Komplett molntjänst för etablering av infrastruktur och applikationer

PROGRAM PLAN POLICY RIKTLINJER

Kriswebb och Krisserver ur ett tekniskt perspektiv

Nationell flerpartstjänst. En pilotstudie

Bilaga 05. Beskrivning av befintlig IT-miljö

TJÄNSTEBESKRIVNING DATACENTER

Plattform as a Service, leverantör tillhandahåller plattformen, jag tillhandahåller applikation och ansvarar för denna.

IT-strategi. För Vallentuna kommun Antagen i kommunfullmäktige Reviderad SID 1/5 BILAGA 1

Vad är Svensk nationell datatjänst och hur kan det bistå dig kring forskningsdata och datahantering?

molndal.se MÖLNDALS STAD invånare

Sid 1 Aug Säker it-drift för offentliga aktörer Försäkringskassan

Utmaningar vid molnupphandlingar

Förvaltningsåtagande. Provisum

Förenkla leveransen av nästa generations kundupplevelse. PureConnect

Bilaga Funktionshyra Vårdval Gynekologi sida 1 (5) FUNKTIONSHYRA. Vårdval Gynekologi

Föreställ dig en enklare värld. med HPE SimpliVity

Gränssnitt och identiteter. - strategiska frågor inom Ladok3

Transkript:

Sunet distribuerad lagring Förstudierapport Inledning/Bakgrund Under 2016 genomförde Sunet tillsammans med ett antal av de större nationella och internationella infrastrukturerna (SND, SNIC, SciLifeLab, Onsala Rymdobservatorium, EISCAT_3D och MaxIV) en dialog kring behovet av samordning av långsiktig lagring av forskningsdata. Behoven av samordning involverar både metadata, identifierare, protokoll, APIer samt även tekniska lösningar för lagring av digitala objekt på permanent lagringsmedium (lågnivålagring). Under 2017 genomförde Sunet en förstudie tillsammans med bla Göteborgs Universitet, Uppsala Universitet, SND och SciLife Lab (bla BILS) i syfte att utforska möjligheterna till en distribuerad lagringslösning där befintliga lokaler och resurser på lärosäten används för att sänka kostnaden. Som resultat av denna förstudie ämnar Sunet etablera ett utvecklingsprojekt i syfte att etablera en distribuerad tjänst för objektlagring. Denna kan fungera som lagringsinfrastruktur vid behov av att kunna lagra digitala objekt på ett så billigt och enkelt sätt som möjligt. Detta dokument är underlag till detta utvecklingsprojekt i samverkan med berörda parter. Förslaget bygger på en distribuerad tjänst i meningen att lagringsplattformen (servrar, lagringsmedium, mm) framförallt kommer att placeras hos de lärosäten som har störst behov av lagring. En sådan tjänst kommer i någon mening vara federerad genom att vissa lärosäten kommer att kunna bidra med resurser för inplaceringen (datorhall, el, kyla osv) till tjänsten, i utbyte mot lägre kostnad för lagring av större volymer. Denna tjänst, Sunet distribuerad lagring, kommer att erbjudas enligt en fast prislista till alla Sunet-anslutna organisationer på samma sätt som alla andra tilläggstjänster, t.ex. Box, Zoom etc. Tjänsten Sunet distribuerad lagring kommer att etableras som en vidareutveckling av Sunets befintliga tjänster i inom gruppen Sunets molntjänster. Den viktiga och stora skillnaden är att Sunet distribuerad lagring kommer att ägas helt och hållet av Sunet till skillnad från Sunets befintliga molntjänster där ägandestrukturen ser annorlunda ut. Dock kommer Sunet distribuerad lagring att integreras tekniskt så att det blir möjligt att enkelt flytta tjänster och data mellan Sunets befintliga molntjänster. Utgångspunkten för Sunet distribuerad lagring är ett långsiktigt åtagande för Sunet så länge det finns intresse och behov hos Sunets kunder. Sammanfattning Förslaget är att etablera en federerad/distribuerad lagringstjänst med följande egenskaper: Plattformen består av ett antal lagringsnoder som presenteras via en gemensam tjänsteportal.

Användare får tillgång till tjänsteportalen via SWAMID-inloggning, som också kan styra fakturering och uppföljning. All hårdvara och mjukvara som används i tjänsten ägs av Sunet. Lagringsnoder placeras på de lärosäten som beställer minst 2 PB (PetaByte) lagring. För att uppnå lägsta möjliga kostnad vid stora volymer förutsätts att lärosätet har möjlighet att erbjuda el, kyla och plats i kvalitetssäkrad datorhall. Kapacitet kan beställas i ett antal nivåer kopplade till olika pris. Lärosäten som inte vill ha en egen lagringsnod kan välja att köpa kapacitet från en av de befintliga lagringsnoderna. Lagringsnoderna ansluts direkt till Sunets nät, SunetC, med minst 100 Gbps och belastar inte lärosätets nätverk eller uppkopplingen till Sunet. Lagringsnoder kan vid behov anslutas direkt till lokala beräkningsresurser. Tekniken bygger på CEPH och OpenStack. Lagrings-APIet blir i första hand Amazon S3. Applikationer/tjänster som SND utvecklar kommer att anslutas direkt till lagringsnoderna för maximal prestanda. Utgångspunkten för Sunet distribuerad lagring är ett långsiktigt åtagande för Sunet så länge det finns intresse och behov hos Sunets kunder. Övergripande Mål och PKIer Följande mål, med tillhörande KPIer, har använts för att designa och utvärdera lösningar för tjänsten: Kostnad. Det övergripande målet med lagringstjänsten är att på ett så kostnadseffektivt sätt som möjligt uppfylla lagringskraven från ett så stort antal tjänster som möjligt som har behov av att kunna lagra och hämta digitala objekt. Genom att bygga en generell lagringsinfrastruktur kan kostnaden amorteras över ett stort antal tjänster vilket i sin tur minskar kostnaden per lagrad GByte. Den huvudsakliga KPIn för plattformen är kostnad per GByte per månad. Närhet. I volymer över 0.1 PB data blir nätverkskapaciteten en dimensionerande faktor. Vid en hastighet om 10 Gbit/s tar det ca 20 timmar att överföra 100 TB. Om infrastrukturen bara ska användas för arkivering räcker detta antagligen, men eftersom arkivering av data endast utgör en liten del av lagringsbehovet för forskardata är det iså fall svårt att uppfylla målet (1) om kostnadseffektivitet. För att infrastrukturen ska vara användbar för mer än arkivering måste data alltså vara tillgängligt med högsta möjliga överföringshastighet mätt i Gbit/s. Den praktiska gränsen ligger idag kring 50-70 Gbps. Enkelhet. En lagringstjänst som riktar sig till forskare måste vara enkel att använda och måste gå att integrera med existerande processer och applikationer. En möjlig KPI för detta är % forskare som använder tjänsten som del av de som har möjlighet att använda tjänsten.

Förslag på Tjänstebeskrivning Lagringstjänsten består av följande delar: En portal där behöriga användare kan skapa och administrera sina lagringsresurser. Användare loggar in i portalen med SWAMID-inloggning. Ett antal lagringsnoder placerade på de lärosäten som beställer (antingen direkt eller aggregerat) 2 PB lagring eller mer. Ett API (AWS S3) som ger tillgång till enskilda logiska lagringsytor i form av digitala objekt och samlingar av digitala objekt. Detta API används av tjänster och applikationer för att lagra och hämta data som lagrats i tjänsten. Ett gränssnitt för direkt anslutning av servrar/virtuella maskiner till en lagringsnod som driftas antingen i Sunet eller i lärosätets regi. En fakturerings/redovisningsprocess som medger projektbaserad uppföljning och fakturering av de resurser som används i systemet. Införandeprojekt Sunet kommer att etablera ett utvecklings- och införandeprojekt för tjänsten Sunet distribuerad lagring. För detta projekt kommer Sunet att etablera en styrgrupp som i huvudsak består av de lärosäten som under förstudiefasen indikerat att man är intresserad av tillräckligt stora lagringsvolymer för att motivera etablering av en lagringsnod. Sunet kommer att tillsätta en projektledare och även etablera en referensgrupp i huvudsak bestående av personer som representerar framtida användare av tjänsten eller som besitter värdefull teknisk kunskap. Projektet kommer även att få i uppdrag att hitta ett bra och beskrivande namn på tjänsten samt att slutligen etablera de tjänste- och prisnivåer som skissats nedan. Affärsrelationer Lagringstjänsten kommer att drivas på samma sätt som SunetC: alla materiella och immateriella resurser ägs av Sunet och drift kan ske genom ett antal kontrakterade driftspartners under ledning av Sunetpersonal. Denna ansats garanterar långsiktighet i tjänsten eftersom Sunet inte behöver upphandla själva tjänsten, utan endast möjligtvis driften av befintliga resurser och hårdvara. Detta innebär dock att Sunet måste stå för alla investeringar vilket medför att Sunet kommer att etablera tjänsten i takt med att det finns konkreta kunder i tjänsten. Det finns också vissa miniminivåer som måste uppnås innan det är kostnadseffektivt att bygga lagring på detta sätt.

Sunet kommer att etablera tjänsten med hjälp av existerande kontrakt gentemot de flesta underleverantörer som täcker både hårdvara, mjukvaruutveckling och drift, men kommer på sikt att behöva förnya dessa upphandlingar i den takt som krävs för att hålla tjänsten vid liv. Detta arbetssätt är exakt samma som används för nätet och har visat sig fungera väl. En viktig skillnad mot hur SunetC drivs är dock att resurser i lagringstjänsten måste kunna redovisas och faktureras på projektnivå. Ett lärosäte väljer att skriva ett eller flera kontrakt för att få tillgång till tjänsten t.ex. kan olika större forskningsprojekt ha egna projekt medan lärosätets IT-avdelning tar hand om mindre projekt och enskilda forskare. Varje lagringsresurs i tjänsten kopplas till ett projekt som knyts till en projektkod eller annan fakturareferens i lärosätets ekonomisystem. Resurser faktureras per kontrakt och portalen erbjuder möjlighet att ladda ner en specifikation av resurser som konsumerats, med tillhörande projektkoder för varje faktura. De lärosäten som så önskar kan koppla projektkoder via SWAMID-inloggning så att lärosätets processer för hantering av behörigheter styr både vem som får rätt att skapa lagringsytor samt hur kostnaderna för dessa bokförs. Genom att välja att teckna ett eller flera kontrakt kan lärosätet välja hur finkornig delegationen av ansvar till användargrupper ska vara - vissa lärosäten kan välja att teckna ett kontrakt och hantera den interna kostnadsfördelningen på egen hand medan andra lärosäten kan välja att teckna ett kontrakt per användargrupp. Tjänste-/prisnivåer Sunet planerar att etablera 3 tjänstenivåer: liten, mellan och stor. Samtliga dessa nivåer levereras på samma sätt - via lagrings-api:et men skiljer sig åt i minsta storlek på beställningen, priser samt var lagringsresursen etableras. Dessa är dock endast kontraktsmässiga skillnader - åtkomsten av lagringsresurserna sker på samma sätt oavsett hur mycket som beställs och var dessa resurser etableras. Nivå Beskrivning Pris(kr/GB /mån) liten mellan stor lagring levereras i mån av utrymme från någon existerande lagringsnod optimerat för lägsta möjliga produktionskostnad lagring i inkrement om 160 TB levereras från närliggande befintliga lagringsnod 2 PB och uppåt levereras från lokal (eller närmaste om det inte finns möjlighet till lokal placering) lagringsnod TBD TBD TBD

Teknisk arkitektur En lagringsnod består av ett CEPH-kluster frontat av ett antal API-servrar som implementerar AWS S3-gränssnittet. En gemensam tjänsteportal presenterar lagringsnoderna som regioner i analogi med hur AWS (Amazon Web Services) och andra publika molntjänster låter användaren välja var data lagras. Vid behov kan virtuella maskiner levereras i nära anslutning till en lagringsnod tex tjänster som behöver snabb access till lagringen. Data lagras erasure-kodat på sk SMR-diskar i CEPH-klustret och data kan vid behov replikeras mellan olika regioner för att uppnå geografisk redundans för kritiskt data. Lagringsnoden ansluts (via Frontend/API-servrarna) både campus-nätet och direkt till SunetC antingen med multipla 10G eller 100G interface. Anslutningshastigheten kommer att anpassas och växa med behovet

Dessutom kommer det erbjudas möjlighet att ansluta lokala beräknings- och analysresurser direkt till lagrings-nätet vilket gör det möjligt att använda lagringen för tjänster där det är viktigt att ha låg fördröjning till lagringsinfrastrukturen. Koppling till Svensk Nationell Datatjänst (SND) Svensk Nationell Datatjänst (SND) koordinerar ett nätverk av 27 svenska lärosäten med syfte att förbättra tillgängligheten av svenska forskningsdata enligt FAIRprinciperna. Detta inkluderar moduler för att koordinera ett nationellt repositorium av forskningsdata samt en nationell sökportal och metaregister. Genom att integrera tjänsten med SND:s system för metadatabeskrivningar av dataset försäkras en stark koppling mellan data och tillhörande metadata av hög kvalitet och beskrivna med relevanta standarder. En centralisering hantering av metadata säkerställer att dessa är harmoniserade och interoperabiliteten mellan olika system ökar. Detta innebär även att dataset i förlängningen bli sökbara i SND:s nationella sökportal, samt i internationella portaler kopplade till SND, såsom t.ex. CESSDA Portal, ARIADNE och DataCite. SND är den svenska service providern för DataCite. Genom att integrera tjänsten med SND:s tjänster för persistenta identifierare kan Data Object Identifiers (DOI) genereras för enkel citering och tillgängliggörande av dataset. Tjänsten kan även integreras med SND:s tillgängliggörandetjänster. Detta förenklar hanteringen av utlämningsärenden från universiteten.