Distributed Computing

Relevanta dokument
Introduktion till hårdvara, mjukvara och operativsystem

Filöverföring i Windowsmiljö

Ufologi. Upplägg. Vad den här kursen handlar om Intelligent liv i Universum Är vi ensamma? 7.5 hp, sommaren 2013.

DIG IN TO Nätverksadministration

Molntjänster. Översikt. Lektion 1: Introduktion till molntjänst. Introduktion till molntjänst. Vilka tjänster finns? Säkerhet.

Sökandet efter intelligent liv i rymden 5 hp, hösten Upplägg. Vad den här kursen handlar om. Kursinfo I. Allmän kursinfo. Vår plats i Universum

Minnesisolering för virtuella maskiner en hypervisorstudie

1642 uppfann Blaise Pascal världens första mekaniska räknemaskin. Den kunde både addera och subtrahera. Den kan ses som en föregångare till datorn.

Innehåll Molntjänster... 4 Vad är detta?... 5 Cirkeln sluts... 6 The Cloud... 7 The Cloud (forts.)... 8 Definition av molntjänster...

Molntjänster för administration, utbildning och forskning. Projektplan för 2017

Uppvaktning av utbildningsminister Jan Björklund

Har vi nått målet? En säker virtuell miljö

Datorn från grunden. En enkel introduktion. Innehåll: Inledning 1 Vad är en dator? 2 Datorns olika delar 3 Starta datorn 5 Stänga av datorn 7

Ufologi. Upplägg. Vad den här kursen handlar om Intelligent liv i Universum Är vi ensamma? 7.5 hp, hösten 2014.

Systemkrav Bilflytt 1.4

Metoder för datasäkerhet. Vad handlar en sådan kurs om???

Summering: Workshop 14/3-19

ARTIFICIELL INTELLIGENS

Intelligent liv i Universum Är vi ensamma? 7.5 hp, sommaren 2013

Datakursen PRO Veberöd våren 2011 internet

Sverige kan bli föregångsland inom tillämpning av AI

CHALMERS TEKNISKA HÖGSKOLA EDA Datakommunikation och Distribuerade System

Framtida trender av revision

Skingrad. 6NLQJUDG²HQG\VWRSLVNVNLOGULQJDYQlWYHUNVVDPKlOOHWVXWYHFNOLQJ

Sökandet efter intelligent liv i rymden 5 hp, hösten Upplägg. Vad den här kursen handlar om. Allmän kursinfo. Vår plats i Universum

Storage. Effektivare datalagring med det intelligenta informationsnätet.

Intelligent liv i Universum Är vi ensamma? 7.5 hp, hösten 2012

IT-GUIDE Version 1.0 Författare: Juha Söderqvist

Medicinsk Informatik VT 2004

Systemkrav Tekis-Bilflytt 1.3

Datorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)

FileMaker. Köra FileMaker Pro 10 på Citrix Presentation Server

Är vi ensamma i Universum?

Innovationen inom IT spiller över på testområdet

Nyttjande av kartor och kartteknik hur ser framtiden ut? Jonas Bäckström, Sokigo AB

Introduktion till migrering till molnet. PART 4: Plattformar för molntjänster

Modernt arbete kräver moderna verktyg

Datacentertjänster IaaS

Request For Information (RFI)

Systemkrav Bilflytt 1.3

Artificiell Intelligens den nya superkraften

Datormetaforen. Från människa till dator Från dator till människa o.s.v.

Big Data för Fordon och Transport! Vår Digitala Framtid, Trafikverket!! Björn Bjurling, SICS Swedish ICT, !

Från böcker till blockkedja. så skapade vi en organisation för innovation. Anna Eriksson Lantmäteriet

Vad är en dator? Introduktion till datorer och nätverk. Pontus Haglund Institutionen för datavetenskap (IDA) 21 augusti 2018

Lathund. IT-säkerhet, GDPR och NIS. Version 3.0

Tomas Borg, konsult, SAS Institute Elin Rydell, konsult, SAS Institute Copyright 2003, SAS Institute Inc. All rights reserved.

Litteratur. Nätverk, Internet och World Wide Web. Olika typer av nätverk. Varför nätverk? Anne Diedrichs Medieteknik Södertörns högskola

STYRKAN I ENKELHETEN. Business Suite

IT-miljö för Undervisning Solna. Roland Orre Solna Gymnasium

Ufologi. Upplägg. Vad den här kursen handlar om Intelligent liv i Universum Är vi ensamma? 7.5 hp, hösten 2012.

Trust-IT Cloud Services

Kursplaner för Administartör IT-System Innehåll

Sökandet efter intelligent liv i rymden 5 hp, hösten 2015

Datorns utveckling. Bild av ENIAC

Framtiden inom geografisk IT, trender och vad som kommer påverka alla som arbetar med GIS. Lars Backhans, ESRI

Migration to the cloud: roadmap. PART 1: Möjligheter och hinder för att migrera till molnet

Elisabet Stöök Konsult SAS Institute AB Copyright 2003, SAS Institute Inc. All rights reserved.

Yrkeshögskolan Novia Utbildningsprogrammet i elektroteknik

OSE gruppen vid Åbo Akademi är en tvärvetenskaplig forskargrupp inom optimering och systemteknik

Skolan håller på att digitaliseras! Hänger du med på resan? Lärardagen 16 augusti

0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ

Vår flexibla lösning för för Intelligent Workload Management

Primtal, faktorisering och RSA

doing stuff that nobody

Verksamhetsplan för Stockholmskretsen samt verksamhet inom RO Stockholm inom DF Service AB

Ventilen. Nytt på IT- fronten. System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande

Denna genomgång behandlar följande: Trådlösa tekniker WLAN Utrustning Säkerhet Konfiguration

DÅTID NUTID FRAMTID TEKNIK

FileMaker Pro 13. Använda Fjärrskrivbord med

Internets historia och utveckling

Internets historia i Sverige

B2B Cloud. Vi hjälper dig på din resa mot en IT som klarar verksamhetens framtida krav.

Digitalisering för HR

POLICY FÖR DATA- OCH INFORMATIONSSÄKERHET VID BMC I LUND

Ventilen. Cafévärdar Gunilla Schultzén och Gunnel Agrell Lundgren

Grundläggande programmeringsteknik Datorsystem

Välkommen till nyföretagarprogrammet Kick Start. Introduktion - ansvar, åtagande, förväntningar

DESIGN FÖR LÄRANDE ETT MULTIMODALT PERSPEKTIV

Datasäkerhet. Informationsteknologi sommarkurs 5p, Agenda. Slideset 10. Hot mot datorsystem. Datorsäkerhet viktigare och viktigare.

Skolan håller på att digitaliseras! Hänger du med på resan? Öppen föreläsning 5 mars

Öppna data Offentlighetsprincipen för det 21:a århundradet

Installationshandbok för SunForum 3.2

HEY! CODE I SKOLAN. VISAR ALLTID DEN RIKTIGA KODEN

Denna genomgång behandlar följande:

Behörighetssystem. Ska kontrollera att ingen läser, skriver, ändrar och/eller på annat sätt använder data utan rätt att göra det

Cloud Computing för arkitekter Sten Sundblad IASA och Sundblad & Sundblad

Grundläggande datavetenskap 4p

Sekretessmeddelande Kelly Services AB Innehåll

TDDD80. Mobila och sociala applikationer Introduktion HTTP,SaaS. Anders Fröberg Institutionen för Datavetenskap (IDA)

Handledarutbildning NT. Arlanda den 3 maj 2017

Enkät om IT-stress 600 yrkesarbetande svenskar om psykisk belastning på grund av IT. Genomförd oktober 2011.

Kryptografi - När är det säkert? Föreläsningens innehåll. Kryptografi - Kryptoanalys. Kryptering - Huvudsyfte. Kryptografi - Viktiga roller

Datorhistorik. Föreläsning 3 Datorns hårdvara EDSAC. Eniac. I think there is a world market for maybe five computers. Thomas Watson, IBM, 1943

NATURKUNSKAP. Ämnets syfte. Kurser i ämnet

Digital kommunikation

FileMaker Pro 11. Köra FileMaker Pro 11 på Citrix XenApp

SIMD i Intel s P5- baserade Pentium MMX

Digitaliseringssatsning tillsammans med innovativa lantbruksföretag

Transkript:

Distributed Computing Stefan Saxén Department of Computer Science Åbo Akademi University, FIN-20520 Åbo, Finland e-mail: ssaxen@abo.fi URL: http://www.abo.fi/~ssaxen Sammanfattning Detta papper presenterar Distributed Computing och ger en förklaring på vad det är samt jämför det med andra motsvarande innovationer. En beskrivning på historien och utvecklingen av Distributed Computing ges samt en insikt på nutiden. Vidare presenteras användningen och områdena för utnyttjandet av Distributed Computing. En presentation på några tillämpningar av Distributed Computing ges. 1

Klassificering ACM: SIG-ACM: C.2.4 F.1.2 SIGMOD SIGAPP 1. Introduktion Distributed Computing tog sina första steg redan på 80-talet. Sedan dess har en enorm utveckling skett inom området och Distributed Computing har under de senaste åren blivit ett mycket populärt område. Distributed Computing växte mycket i popularitet på grund av det stora intresset för peer-to-peer system. Distributed Computing är en form av distribuerade system där data administreras av en central server som sedan behandlas av flera kundmaskiner, servern och kundmaskinerna kommunicerar över någon typ av nätverk. Distributed Computing kallas på ett mindre seriöst sätt till den fattiga mannens superdator. Distributed Computing är dock en mycket viktig del av forskning i dagens läge. Denna utveckling har gjort det möjligt att utföra mycket stora och tunga uträckningar på ett kostnadseffektivt och tidseffektivt sätt. 2

Fördelarna med Distributed Computing [ENT] Distributed Computing blandas ofta med Grid Computing. Båda dessa är en form av distribuerade system och Distributed Computing kan ses som en del av Grid Computing. Grid Computing strävar till att skapa ett stort och flexibelt nätverk av maskiner där resurserna är fritt tillgängliga för den som behöver dem. Till detta system kan höra vanliga arbetsstationer, PCn, men oftast är det fråga om stora och effektiva servrar och superdatorer. Distributed Computing utnyttjar samma grundprinciper men riktar sig mera mot att samla ihop ett mycket stort nätverk av vanliga användares maskiner. Dessa kundmaskiner är ofta av låg prestanda och körs långt på kundens villkor. Arkitekturen för Distributed Computing måste således göra det möjligt att exekvera små delar av projektet på ett sådant sätt att 3

användaren av kunddatorn inte störs i sitt dagliga arbete av uträckningarna. Distributed Computing projekt fungerar alla långt med samma principer. Denna princip går ut på att man har ett centralt organ som bestämmer vad som skall beräknas och vad man vill nå med beräkningarna. Detta organ har hand om en central server som sköter om att den datan man vill ha beräknad delas upp i små lämpliga storleks block som sedan delas ut åt de kundmaskiner som deltar i projektet. Dessa kunddatorer utför sedan beräkningarna med hjälp av sådan processorkraft som annars skulle gå outnyttjad. Efter att kunden slutfört beräkningarna på ett block returnerar den datan till den centrala servern som sedan ser till att alla resultat slås samman till en helhet. Kommunikationen mellan den centrala servern och kundmaskinerna sker över nätverk, oftast över Internet. Konceptet med Distributed Computing grundar sig på det faktum att en persondator största delen av tiden inte utnyttjar mer än en bråkdel av sin processkraft. Persondatorer används främst till såna saker som ordbehandling, skrivandet och läsandet av elektronisk post samt för tillgång till Internet. Alla dessa användningar kräver inte någon hög prestanda av persondatorn och en hög procent av dens resurser blir outnyttjade. Distributed Computing utnyttjar denna resurs av outnyttjad processkraft för beräkningar. Distributed Computing har också sina gränser, inte all data kan beräknas på detta sätt. Det finns data som är mycket svårt att dela upp i mindre block och detta gör det omöjligt att inom rimlig tid skicka det över 4

nätverk. Dagens nätverk har en mycket begränsad kapacitet och sådana beräkningar som kräver mycket stor nätverks kapacitet kan därför inte utnyttja detta koncept. Beräkningar som till exempel 3D rendering hör till detta område och är därför inte möjliga användare av Distributed Computing i dagens läge. En annan begränsande faktor för utnyttjande av Distributed Computing är säkerhetsorsaker. Eftersom konceptet grundar sig på en öppen distribution av blocken över Internet till kunddatorer runt om i världen kan inte säkerheten och integriteten av blocken garanteras. Detta faktum gör att man inte kan utnyttja Distributed Computing till sådana projekt som till exempel kärnvapenforskning 2. Historia och utveckling Distributed Computing tog sina första steg på 80-talet då Intel började utnyttja sina arbetsstationer för att beräkna ritningar till nya halvledarchips. Intel förstod att utnyttja enstaka arbetsstationers tomgångstid och deras interna nätverk för att distribuera och samla ihop dessa beräkningar. Lokaliserad Distributed Computing har sedan dess använts till en stor del av tillämpningar. Till dessa tillämpningar hör bland annat rendering av 3D animationer, Väderleksprognoser och andra tillämpningar som kräver hög beräkningsförmåga. Med utvecklingen av Internet blev det möjligt att skapa större distribuerade projekt, det blev möjligt att på en massiv skala utföra 5

beräkningar. De första Distributed Computing projekten som var öppna för allmänheten var matematik relaterade. De första projekten marknadsfördes som tävlingar för att locka användare. Till en början var det nästan endast matematik och dataintresserade personer som deltog i dessa projekt. Till dessa första projekt hörde bland annat faktoriseringen av tal med 129 siffror, sökning efter stora primtal och försök att bryta enkrypteringar. 3. Några av dagens tillämpningar Distributed.net var en av de första tillämpningarna som fick massorna bakom sig. Detta projekt fick vanliga datoranvändare att ge sin dators beräkningstid för projektet. Projektet grundades 1997 för att dekryptera enkryptionsalgoritmer och har sedan dess löst många så kallade utmaningar gjorda av enkryptionsalgoritmtillverkare. [DIST] SETI@home är det Distributed Computing projekt som blivit kändast bland allmänheten. Projektet grundades på Berkeley universitet i Californien, USA. SETI@home projektets mål är att analysera data samlat av ett radioteleskop i Arecibo, Puerto Rico. Från dessa analyser hoppas man hitta signaler som härstammar från utomjordisk intelligens, det vill säga man söker efter signaler skickade av andra civilisationer i universum. Det är fråga om en otroligt stor mängd data som skall analyseras och Distributed Computing har visat sig vara mycket användbart för att på ett billigt och effektivt sätt utföra analyser på denna data. Data som fås från Arecibo delas upp i små stycken som sedan kan delas ut åt deltagare i 6

projektet. En representation av datauppdelningen kan ses i figuren nedan. [SETI] Uppdelning av den stora datamängden i SETI@home projektet [SETI] Projektet har cirka en miljon deltagande datorer med en sammanlagd processkraft av cirka 60 TeraFLOPS, detta kan jämföras med en av dagens kraftigaste superdatorer, IBMs ASCI White, som har en processkraft på 12 TeraFLOPS. SETI@home projektets stora popularitet har skapat ett stort intresse i Distributed Computing och har lett till att många nya projekt har skapats. Berkeley Open Infrastructure for Network Computing, eller BOINC, är ett relativt nytt projekt som har vuxit fram från den stora framgången av SETI@home. BOINC är efterträdaren till SETI@home och projektet kommer att fortsätta på denna plattform. BOINC gjordes från första början till en öppen plattform som även kunde utnyttjas till andra projekt. Många av de erfarenheter man fått med det tidigare SETI@home projektet har utnyttjats i planeringen av denna nya plattform. Redan nu körs flera projekt med hjälp av BOINC, som tidigare nämnts så körs fortsättningen till SETI@home projektet med denna, utöver detta använder sig projekt inom områdena för klimatforskning, medicin och fysik också av den öppna BOINC plattformen. 7

4. Framtiden Framtiden för Distributed Computing ses som mycket god för forskning. Konceptet grundar sig på att den dagliga användaren av datorer vill delta och ge av sin dators kapacitet till projektet. Det projekt som kommer att ha framgång inom detta område är då med andra ord det som kommer att vinna mest användare, och därmed deras datorer, till sig. Antalet beräkningskraft projekten har är direkt bundet till mängden deltagare i det. Det hittills största Distributed Computing projektet, SETI@home, har fått så många deltagare på grund av att det erbjuder samtidigt en intressant screensaver. I många fall vet inte ens deltagarna vad de ger sin beräkningstid åt, det tycker endast att screensavern är intressant. Screensavers kommer dock inte att räcka till för att hålla användare intresserade av projekt. Det finns flera företag som har planer för projekt där användarna skulle få betalt för den beräkningstid de ger åt projektet. När Distributed Computing blir en konventionell och vardaglig sak tror många att det kommer att finnas en ekonomi som grundar sig på beräkningskraft. I dessa visioner får datoranvändare betalt för beräkningstid på basen av utbud och efterfrågan. Distributed Computing ses som en lösning till många av dagens komplexa problem. Det ses som en lösning till AIDS, cancer och andra svåra sjukdomar. Det beräknas att varje sjukdom vi känner till idag har ett botemedel men datamängden för att kunna hitta dessa botemedel är så ofantligt stor att vi inte på något sätt nu kan hitta dem. Distributed 8

Computing tros kunna lösa många av just de problemen som har ofantligt stora datamängder. Det tros att genombrott inom nästan vilka områden som helst kan ske med hjälp av Distributed Computing. Distributed Computing är en del av utvecklingen av datamaskiner. Man visste redan för hundra år sedan att datorer kunde analysera all denna data men man kunde inte förvänta sig att det skulle ske då miljoner människor tillsammans gör det. Distributed Computing ses inte som ett kontroversiellt område men som med all teknologi så finns det även här rum för missbruk. Databeräknings förmåga ses som ett tecken på välfärd och som ett övertag över länder med mindre databeräkningsförmåga. Världen blir allt digitalare och beräkningsförmåga blir ett vapen som kan riktas mot tävlande länder och organisationer. Så gått som alla regeringar använder sig av Internet för att kommunicera, denna kommunikation skyddas med hjälp av enkryptering. Med hjälp av Distributed Computing kan man möjligen skapa sätt att bryta dessa krypteringar. Möjligheten till detta utgör ett stort hot mot sekretessen för alla regeringar. Många av världens dilemman, så som till exempel människokloning, är en biprodukt av den snabba utvecklingen av datorer. Distributed Computing kommer att ta den förmågan vi har idag och föra den i höjderna och göra forskning som tidigare varit omöjligt möjlig, detta i sin tur kommer att skapa många nya dilemman för mänskligheten. 9

5. Avslutning Distributed Computing kan ses som en mycket lovande teknologi för framtidens forskning. Distributed Computing ger möjligheten till gigantisk beräkningskapacitet till sektorer som annars inte skulle ha möjlighet till detta. Det ger mänskligheten ett mycket användbart verktyg för att lösa såna stora problem som att bota allvarliga sjukdomar, bevisa att det finns utomjordiskt liv och utföra virtuella experiment med sådana ämnen som annars skulle skada vår omgivning, så som till exempel kärnvapen. Distributed Computing kommer med all säkerhet att ha mycket stor inverkan på dataindustrin och också på hela mänskligheten. 6. Källförtäckning [DIST] distributed.net, http:// www.distributed.net/ [SETI] Search for Extra Terrestrial Intelligence at Home, http://setiathome.berkeley.edu/ [BOINC] Berkley Open Infrastructure for Network Computing, http://boinc.berkeley.edu/ [GR03] Berman, Fox, Hey: Grid Computing, Making the Global Infrastructure a Reality, 2003 [ENT] Entropia, PC Grid Computing, http://www.entropia.com/ 10