Klusterbaserad dataspridning med FTP/FXP ANTON WESTIN

Storlek: px
Starta visningen från sidan:

Download "Klusterbaserad dataspridning med FTP/FXP ANTON WESTIN"

Transkript

1 Klusterbaserad dataspridning med FTP/FXP ANTON WESTIN Examensarbete Stockholm, Sverige 2011

2 Klusterbaserad dataspridning med FTP/FXP ANTON WESTIN Examensarbete i datalogi om 30 högskolepoäng vid Programmet för datateknik Kungliga Tekniska Högskolan år 2011 Handledare på CSC var Anders Lansner Examinator var Jens Lagergren TRITA-CSC-E 2011:079 ISRN-KTH/CSC/E--11/079--SE ISSN Kungliga tekniska högskolan Skolan för datavetenskap och kommunikation KTH CSC Stockholm URL:

3 Klusterbaserad dataspridning med FTP/FXP Detta examensarbete handlar om att modernisera och effektivisera användandet av ett mycket gammalt filöverföringsprotokoll, FTP. Vid dataspridning med hjälp av FXP (server-till-server-överföring med FTP) i en miljö med flera noder (servrar) är de befintliga metoderna inte särskilt tidseffektiva ur två olika perspektiv. För administratören krävs med dagens klientmjukvaror ett större arbete för att sätta upp en kedja av serverpar med vilka överföringar som ska genomföras och i vilken ordning. Denna kedja ger inte heller ett optimalt överföringsmönster, trots arbetet att förbereda den, och den hanterar dessutom inte tillfälliga prestandaproblem på ett bra sätt. För att förbättra detta förfarande har en prototyp av en klientmjukvara utvecklats som nyttjar en klusterbaserad approach. Den jämför de inblandade noderna med varandra kontinuerligt på flera sätt och anpassar dynamiskt överföringsmönstret på filbasis mellan varje överföring. Det visade sig att denna metod kan vara mycket effektiv beroende på vilken miljö och testmetod som används, då den reducerar förarbetet vid ett överföringsmönster till 0, och under de genomförda testerna presterade den i genomsnitt 10% bättre än de konventionella lösningarna avseende överföringsmönstret. Slutsatsen är att det finns gott om utrymme för optimering av FXP-överföringar med flera noder, och att den implementerade metoden är ett effektivt sätt att förbättra denna procedur ur flera perspektiv.

4 Cluster-based data spreading with FTP/FXP This thesis project deals with modernization and optimization of the usage of a very old file transfer protocol, FTP. For data distribution through FXP (server-toserver transfer with FTP) in an environment with multiple nodes (servers), the currently available methods are not very effective from two points of view. For an administrator equipped with currently available client softwares, a large amount of work is required to prepare a chain of server pairs containing which transfers that are meant to be executed, and in which order. This chain also does not produce an optimal transfer pattern, despite the work of preparing it, and also does not account for sudden performance drops. To streamline this procedure, a client software has been developed that implements a cluster-based approach. It compares the involved nodes with each other continually in several ways and dynamically adapts the transfer pattern on a file basis between every transfer. It was shown that this method can be very effective depending on the environment and test method that is used, as it reduces the preparation work for a transfer pattern to 0, and during the conducted tests it performed an average of 10% better than the conventional solutions considering the transfer pattern itself. The conclusion is that there is a lot of potential in FXP transfer optimization with several nodes, and that the implemented method is an effective way of streamlining this procedure from several perspectives.

5 Innehållsförteckning 1. Bakgrund och problembeskrivning Internetkommunikationens struktur FTP-Protokollet Användningsområden Spridningseffektivitet det aktuella problemet Teori FTP FXP SSL C Sockets och Pthreads Metodideer Kluster istället för par Poängtilldelning Förenade fillistor mellan multipla anslutningar till samma server Implementation Användargränssnitt Anslutningshantering och serverhantering Kommunikation mellan trådar Överföringsimplementationen Transferobjekt Lagring av serverinformation Sektioner Uppdateringsmotorn hjärtat i klienten Poängsystemet vilka överföringar ska genomföras? Potential Felhantering och att avbryta överföringar När överföringen är färdig Statistik och informationsinsamling Testning och utvärdering Referensklienten och begränsningar Testdata Testmiljön Testkörning 1 en anslutning per server Testkörning 2 en anslutning per server med belastning Testkörning 3 två anslutningar per server Testkörning 4 två anslutningar per server med belastning Testkörning 5 tre anslutningar per server Testkörning 6 tre anslutningar per server med belastning Felkällor Sammanfattning och slutsatser Resultat från testkörningarna Praktisk nytta Framtiden för protokollet Vidare arbete Slutsatser...36 Referenser/litteraturförteckning...37

6

7 1. Bakgrund och problembeskrivning 1.1 Internetkommunikationens struktur För att strukturera kommunikationen över internet sker all trafik genom flera lager av så kallade protokoll. Det mest grundläggande lagret behandlar elektriska impulser, nästa lager behandlar bitkonvertering, och så vidare. Förutom de grundläggande lagren som implementeras i hårdvara finns det även flera lager av protokoll som implementeras i mjukvara. Längst ner på protokollstegen finns de så kallade applikationsprotokollen, som används för att definiera en mall för hur applikationer på olika datorsystem ska kommunicera och förstå varandra [1]. När man använder en webläsare sker den mesta trafiken exempelvis via HTTP (Hyper Text Transport Protocol), vilket är det protokoll som definierar hur websidor ska överföras från webservern och tas emot av webläsaren hos klienten. När man skickar ett mail använder man sig i regel av protokollet SMTP (Simple Mail Transfer Protocol) för att kommunicera med mailservern. När man laddar ner en stor fil någonstans är det ganska vanligt att man (inte nödvändigtvis medvetet) använder sig av protokollet FTP, och detta protokoll är vad denna rapport handlar om. 1.2 FTP-Protokollet FTP (File Transfer Protocol) är ett ur internetperspektiv mycket gammalt serverklient-protokoll, avsett för filöverföring. Den första RFC'n (Request For Comments, ett dokument som specifierar metoder och beteende) skrevs av Abbay Bushan och publicerades redan 1971 (RFC 114) före både TCP och IP - vilket gör FTP till ett av de absolut äldsta internetprotokoll som fortfarande används i bred utsträckning. Protokollet har dock uppdaterats i flera omgångar sedan dess och den aktuella versionen fastslogs med RFC 959 år 1985 [2]. Senare har ytterligare tillägg och stöd för bland annat IPv6 och diverse säkerhetsfunktioner lagts till, men grundprotokollet är fortfarande detsamma [3]. 1

8 1.3 Användningsområden FTP-protokollet är mycket väl lämpat för filöverföringsuppgifter av varierande art [1]. Exempelvis har protokollet sedan internets barndom varit den främsta metoden för att ladda upp filer till servrar som hanterar websidor, s.k. webservrar. Det är även väldigt vanligt att företag använder en eller flera FTP-servrar som bas för att låta sina kunder eller användare få tillgång till relevanta filer och dokument. FTP är så väl utbrett att det i princip ses som en standard för många filöverföringsuppgifter, och det finns numera tiotals klient- och servermjukvaror att välja mellan, och många fler därtill som indirekt använder FTP på olika sätt. Sedan många år tillbaka stöder dock de flesta webläsare FTP, vilket gör att en separat FTP-klient blir överflödig för de flesta användare utan mer avancerade behov. fil1.zip Klient fil2.zip Server Figur 1. En illustration över normal användning av FTP-protokollet. Grafik hämtad från Wikipedia. FXP (File exchange Protocol) är ett speciellt sätt att använda FTP-protokollet på, alltså inte ett eget protokoll som namnet antyder [4]. Vid FXP ansluter en användare till två olika FTP-servrar och instruerar dem att skicka filer direkt mellan varandra, alltså utan att filerna går via klienten. FXP började praktiseras för omkring 10 år sedan, och är således mycket mer modernt än ren FTP. På senare år har det även börjat dyka upp klientmjukvaror som är specifikt avsedda för FXP, men de flesta stödjer normal FTP-användning också. FXP har uppenbara fördelar i och med att det möjliggör att servrar med snabba internetanslutningar kan skicka data i hög hastighet mellan varandra, även om klienten som styr trafiken använder en långsam internetanslutning. 2

9 fil1.zip Server 1 Server 2 [klient] PASV [server] epm (x,x,x,x,y,y) [klient] RETR fil1.zip [server] opening data connection... [klient] PORT x,x,x,x,y,y [server] command ok [klient] STOR fil1.zip [server] opening data connection... Klient Figur 2. En illustration över kommunikationsmodellen vid FXP. Grafik hämtad från Wikipedia. 1.4 Spridningseffektivitet det aktuella problemet Om man vill använda FTP/FXP för att sprida data mellan ett större antal FTPservrar kommer man snabbt inse att det inte finns någon bra metod för att genomföra detta särskilt effektivt. De klientmjukvaror som för närvarande finns tillgängliga på marknaden är alla uppbyggda för FXP-överföring i par, där man ansluter till två FTP-servrar åt gången och genomför överföringar mellan dessa. I en större miljö med många FTPservrar (exempelvis mellan olika kontor inom ett företag, med en eller flera källor för datan) blir detta mönster i praktiken ineffektivt. Teoretiskt sett kan det lösas optimalt genom att exempelvis ställa upp en kedja för par-överföringar och nå maximal hastighet för överföringen genom att låta servrarna strömma de inblandade filerna innan de är färdigställda på respektive server, men detta bygger på att alla inblandade servrar alltid är lika snabba, och att alla servrar alltid fungerar. I verkliga situationer är saker och ting väldigt sällan teoretiskt perfekta, och om någon inblandad server går offline eller blir överbelastad av annan trafik så kommer kedjan omedelbart att sluta fungera, eller åtminstone bli väldigt ineffektiv. En annan, möjligtvis mer effektiv lösning vore att behandla alla servrar som ett kluster, alltså att alla inblandade servrar bearbetas i en samling, istället för mekaniska par. Då kan man, genom att ta hänsyn till servrarnas respektive belastning, hastighet, överföringsstatus med mera, införa metoder för att löpande avgöra vilka överföringar som är mest optimala att genomföra. Detta ger möjlighet 3

10 att nå en mycket hög effektivitet utan att få allvarliga problem med spridningen om någon server beter sig onormalt. Denna metod blir då inte heller begränsad till att genomföra hela överföringsjobb via samma serverpar likt den vanliga kedjebaserade lösningen, utan man kan istället gå ner på filnivå och ta nya beslut om överföringsrutter för varje fil. 4

11 2. Teori I detta avsnitt ges en djupare inblick i teknik och protokoll som läsaren behöver känna till för att tillgodogöra sig rapportens innehåll i sin helhet. 2.1 FTP FTP har två olika typer av anslutningar: en kontrollanslutning för styrtrafik, samt anslutningar för datatrafik. FTP är alltså ett så kallat out-of-band-protokoll, vilket innebär att det behöver mer än en port för att fungera korrekt [2]. FTP-servrar lyssnar normalt sett efter styrtrafiksanslutningar på TCP-port 21. Detta är naturligtvis konfigurerbart i de flesta servermjukvaror, men mer om det senare. Styrtrafiken sker i klartext, det vill säga kommandon som är läsbara (och ofta även förståeliga) för en människa. FTP-servern svarar på kommandon med tresiffriga statuskoder samt en valfri klartextsträng. Klienten använder i sin tur dessa statuskoder för att avgöra om kommandon utförts korrekt eller ej. Ett exempel på ett korrekt utfört kommando: [klient] AUTH SSL [server] 234 AUTH SSL successful Servern svarar alltså med statuskoden 234, samt textsträngen AUTH SSL successful.. Klienten kontrollerar statuskoden och 234 innebär i detta fall att kommandot utfördes korrekt och att en begäran om SSL-kryptering godkändes. Klienten bryr sig i de flesta fall inte om den efterföljande textsträngen. Som synes i exemplet ovan kan FTP ha stöd för krypterad trafik över SSL [5, 10]. Det aktuella kommandot förhandlar fram en krypterad session för styrtrafiken. Proceduren som sker när en anslutning etablerats börjar normalt med att FTPservern ger ett välkomstmeddelande som ofta identifierar vilken FTP-server det rör sig om: [server] 220 Welcome to ftp.sunet.se Sedan förväntas klienten lämna inloggningsuppgifter i form av användarnamn och lösenord. FTP kräver alltid inloggningsuppgifter, men alla publika FTP-servrar stödjer även anonym inloggning genom att klienten då lämnar användarnamn: anonymous och lösenord: anonymous. 5

12 För att initiera dataanslutningar kan FTP agera i två olika lägen: active mode och passive mode. På grund av FTP's out-of-band-natur behöver en dataanslutning köras separat från kontrollanslutningen, och servern måste ansluta till klienten eller vice versa. Detta är vad active mode och passive mode handlar om. Vid active mode öppnar klienten en port och meddelar sedan denna till servern, som i sin tur förväntas ansluta till klienten på denna port och på så sätt initiera en dataanslutning. Kommandot ser ut på följande vis: [klient] PORT A1,A2,A3,A4,a1,a2 där A1-A4 är klientens fyra punktavskiljda delar av dess ip-adress, och a1-a2 är den öppnade TCP-porten i formatet a1*256+a2. Vid passive mode begär klienten istället att få ansluta till en port hos servern med kommandot PASV. [klient] PASV [server] 227 Entering Passive Mode (A1,A2,A3,A4,a1,a2) A1-A4 och a1-a2 fungerar på samma sätt, förutom att det nu istället handlar om serverns ip-adress och port. När anslutningen är initierad via PORT eller PASV kan klienten ange om den vill ladda upp eller ner en fil med kommandona RETR eller STOR. FTP-serverns fillista kan också hämtas via dataanslutningen med kommandot LIST. Detta är endast ett litet urval av de mest nödvändiga FTP-kommandona för att visa hur FTP-kommunikation fungerar. En komplett lista med FTP-kommandon finns i RFC 959 [2]. 2.2 FXP Vid normal server-klient-användning av FTP skulle egentligen inte IP-adresserna som ges vid PASV/PORT behövas, eftersom servern redan känner till klientens IPadress via kontrollanslutningen och vice versa. Dessa IP-adress-fält nyttjas vid FXP. Man initierar helt enkelt passive mode på den ena servern, och ger det IP som returneras till den andra servern i ett active-mode-kommando. Sedan körs STOR och RETR samtidigt på båda servrarna så att överföringen påbörjas. Proceduren beskrivs tydligare i tabellen nedan, där målet är att överföra fil1.zip från server 2 till server 1: 6

13 Tabell 1. Beskrivning av hur en FXP-överföring initieras på de två inblandade servrarna Server 1 Server 2 [klient] PASV [server] 227 Entering passive mode (A1,A2,A3,A4,a1,a2) STOR fil1.zip [klient] PORT A1,A2,A3,A4,a1,a2 [server] 200 Command ok. RETR fil1.zip Den IP-adress som ges i A1-A4 i detta fall representerar alltså IP-adressen till server 1, och server 2 instrueras sedan att ansluta till den [4]. En nackdel med FXP jämfört med vanlig FTP är att klienten inte har något smidigt sätt att hålla reda på vilken hastighet överföringen sker i, förrän överföringen är färdig. RETR- och STOR-kommandona returnerar nämligen ingenting förrän överföringen är helt färdigställd. 2.3 SSL FTP är ett i grunden osäkert protokoll. All data, även inloggningsuppgifter inklusive lösenord, överförs i klartext, och kan lätt utnyttjas av någon som lyssnar av trafiken. Detta problem är vanligt bland protokoll som utformats före de vanliga krypteringsmetoderna (exempelvis SSL) föreslogs en uppsättning utökade kommandon för FTP-protokollet i en RFC-draft vilket gav möjlighet att kryptera både kontroll- och dataanslutningarna med SSL/TLS [10]. Denna RFC färdigställdes först 2005 som RFC 4217, så numera kan FTP ses som någorlunda säkert [5]. SSL-implementationen fungerar (som tidigare visat i ett exempel) genom AUTHkommandot, som förhandlar fram en SSL- eller TLS-session över kontrollanslutningen. Detta kommando skickas direkt när anslutningen etableras, alltså innan inloggningsuppgifterna, vilket gör att även dessa skickas via den krypterade sessionen. Det finns med hjälp av nyare tilläggskommandon även möjlighet att kryptera datatrafiken [5, 6]. 7

14 2.4 C++ C++ är ett mycket vanligt och välutvecklat objektorienterat programmeringsspråk, avsett för de flesta användningsområden. C++-kod körs på relativt låg nivå och ger bra kontroll över hårdvaran. I detta projekt har C++ valts som språk, delvis på grund av dess lämpliga egenskaper, men även eftersom det ligger inom författarens kunskapsområde. 2.5 Sockets och Pthreads Då detta projekt arbetar med FTP-protokollet på en väldigt grundläggande nivå finns det tyvärr inget lämpligt FTP-bibliotek med färdiga funktioner som skulle kunna användas i projektet. Istället har all nödvändig socket- och kommunikationskod skrivits från grunden. För att hantera sockets på ett bra sätt behöver projektet även använda sig av en viss mängd trådning. Detta görs med hjälp av Pthreads. Pthreads, eller POSIX Threads, är ett API för att skapa och hantera trådar i UNIXbaserade C/C++-program [7]. Multipla FTP-anslutningar (som nämnts ovan), beräkningssystem och eventuellt (i mån av tid) ett relativt avancerat grafiskt interface medför att trådning är absolut nödvändigt för detta projekt. Stöd för Pthreads finns inbyggt i GNU C++, vilket är den vanligaste C++-kompilatorn för Linux och som kommer att användas i detta projekt. 8

15 3. Metodideer I detta kapitel gås den planerade angreppsmetoden igenom. Det beskriver inte nödvändigtvis exakt hur prototypen faktiskt implementerades i slutändan, eftersom proceduren kom att ändras en aning under implementationsförloppet. Detta är dock vad som ursprungligen planerades. 3.1 Kluster istället för par Den planerade angreppsmetoden är att implementera ett klusterbaserat system, mycket olikt det par-baserade system alla nuvarande FXP-klienter nyttjar. I det klusterbaserade systemet anger man vilka FTP-servrar som ska vara inblandade i en överföring, och sedan skall systemet, genom att via ett poängsystem genomföra de mest optimala överföringarna, se till att de aktuella filerna distribueras till alla angivna FTP-servrar. 3.2 Poängtilldelning Systemet kommer alltså att med hjälp av de tillgängliga fillistorna ställa upp alla möjligheter till överföringar av filer genom att tilldela dem olika poängvärden, och sedan genomföra dem som får bäst poäng. Poängsystemet kan baseras på exempelvis: Filstatus (om filen håller på att laddas upp, hur mycket som laddats upp, vilken hastighet den laddas upp i, eller om den är färdigställd) De aktuella servrarnas routing/hastighet gentemot varandra (statistik lagras för alla överföringar för att avgöra om den tilltänkta överföringen skulle ske i adekvat hastighet) Hela överföringens status (hur många filer av dem som ska överföras som hunnit färdigställas, servrar som ligger efter får högre prioritet om det inte beror på sämre anslutningshastighet, etc) Filens tillgänglihet sett till de andra servrarna (filer som inte hunnit spridas till så många servrar har högre värde) 9

16 Fillistorna ska hållas uppdaterade i så hög frekvens som systemet klientmjukvaran körs på tillåter, och poängtabellen återevalueras så snart ny information kommer in. Detta medför att programmet kommer att kräva förhållandevis mycket beräkningskraft, vilket gör att kraftig trådning och eventuellt ett flerkärnigt datorsystem kommer att vara nödvändigt för att hålla prestandabehoven i schack om man har tillräckligt många FTP-servrar inblandade. 3.3 Förenade fillistor mellan multipla anslutningar till samma server I FTP-protokollet är en kontrollanslutning upptagen medan en fil överförs, så om det finns möjlighet till flera anslutningar till varje server så underlättar den extra anslutningen att hålla reda på serverns aktuella filstatus. Om man exempelvis har en anslutning som laddar upp en fil och en annan som uppdaterar fillistan regelbundet, kan man med hjälp av fillistan se vilken hastighet uppladdningen håller. Om man uppdaterar listan en gång i sekunden och ser att filen ökar i storlek med x MB varje gång, så vet man att överföringen sker i ungefär x MB/s. 10

17 4. Implementation I detta kapitel beskrivs implementationsmetodiken för klientmjukvaran i detalj, samt vilka val som gjorts längs vägen med tillhörande motivationer om varför just dessa metoder valts. 4.1 Användargränssnitt För att kunna tillgodogöra sig information och statistik från klienten på ett smidigt sätt under tiden som ett (eller flera) spridningsjobb pågår är någon form av grafiskt gränssnitt nödvändigt. Ett grafiskt användargränssnitt möjliggör även att användaren kan kommunicera med programmet, i form av knapptryckningar och textinmatning. Användaren kan då även ges möjlighet att filtrera vilken information denna vill titta på, genom att erbjudas val mellan olika statistiksidor eller menyer. Allt detta faller dock utanför ramen för detta projekt, då fokus ligger på själva motorn (kärnan i klienten) snarare än användarupplevelsen. I stället har ett rudimentärt kommandoradsgränssnitt implementerats, där man vid start av klienten (vilket görs via en terminal) även kan ange ett antal argument som specifierar vad som ska överföras, vilken sektion (mapp, position på en server) materialet finns i, samt vilka servrar som ska vara inblandade i överföringen. Klienten påbörjar sedan denna överföring omedelbart när den startar, och användaren tillåts inte påverka klienten under tiden som spridningsjobbet pågår. När jobbet är klart avslutas klienten. I terminalen syns under spridningsjobbets gång rådata från alla kontrollanslutningar, vilket innehåller i princip allt som händer i klienten. På grund av det ostrukturerade upplägget, samt att ny data processas i ett mycket högt tempo och att det i princip är omöjligt att hinna läsa vad som står, så är denna data dock så gott som omöjlig att tolka på ett informativt sätt. 11

18 Figur 3. Klienten som den ser ut under körning utan grafiskt gränssnitt. Den omgivande terminalen är inte en del av klientmjukvaran. Syntaxen för att använda klienten ser ut på följande vis: Usage:./fxptool <release> <section> <site1> <site2> [site3 [site4 [... ] ] ] 4.2 Anslutningshantering och serverhantering Den mest grundläggande delen av klienten, och även det område där programmeringsarbetet påbörjades, är den som håller reda på anslutningar och råkommunikation med FTP-servrarna. Då inget färdigt bibliotek för FTPprotokollets kommunikation används i detta projekt handlar en stor del av programkoden om just detta. Då FTP-protokollet är så pass gammalt skiljer det sig en del från modernare protokoll i flera avseenden. Framförallt sker all kontrollkommunikation i klartext (när SSL inte nyttjas), men en mer påverkande skillnad för programstrukturen är att det inte finns någon form av id-taggning eller möjlighet att identifiera returvärden och svar från FTP-servern, vilket medför att klienten sällan kan vara 100% säker på att det svar som lästs faktiskt är svaret från det senaste utförda 12

19 kommandot. Vidare finns det ingen tydlig slutpunkt i ett kommandosvar, vilket gör att klienten måste undersöka formateringen på svaret och i viss mån gissa sig till om hela svaret tagits emot, eller om det kommer finnas mer data att hämta. Som exempel kan nämnas ett problem som uppstod under testfasen av projektet, på grund av ett speciellt beteende hos FTP-servermjukvaran glftpd. Vid utförande av vissa kommandon ger glftpd ibland ifrån sig ett extra svar, som dock inte påverkar kommunikationsflödet i övrigt: 550 Unable to read user file! Och därefter även det faktiska svaret på kommandot. Detta innebär att klienten läser det felaktiga svaret som svar på det aktuella kommandot, det aktuella kommandots svar som svar på nästa kommando, och så vidare. Beteendet ställer till problem även för andra FTP-klienter, och visar helt klart på en av FTP-protokollets svagheter. För att lösa detta problem har ett specialfall implementerats för just detta beteende. Då varje server kan ha flera anslutningar organiseras dessa i en serverhanterare (en för varje server) som håller reda på aktuella fillistor, överföringar, status för serveranslutningarna, med mera. Serverhanteraren agerar mellanlager mellan dessa anslutningar och motorn i klienten, tilldelar arbetsuppgifter till dem och rapporterar status och fillistor till motorn. I serverhanteraren sköts även den så kallade unifierade fillistan. Serveranslutningarna var för sig håller inte reda på någon fillista, utan denna sammanställs som en gemensam lista (eftersom alla serveranslutningar under en serverhanterare ändå kommer att hantera samma mapp på samma server) i serverhanteraren. För att ett program med flera samtidiga serveranslutningar ska fungera effektivt behöver anslutningarna skötas i separata trådar, så att inte resten av programmet ska behöva vänta så fort kommunikation ska genomföras. 4.3 Kommunikation mellan trådar Ett vanligt problem i multitrådade applikationer är hur informationsdelning, synkronisering och dataintegritet mellan trådarna ska skötas. I detta projekt används tråd-api'et Pthreads, eller POSIX Threads. Detta API innehåller ett antal datastrukturer och funktioner som ger möjlighet att säkerställa korrekt kommunikation mellan trådarna. En vanligt förekommande felaktighet i multitrådade program är så kallade race 13

20 conditions. En race condition innebär att två eller flera trådar läser och modifierar en variabel samtidigt, vilket kan leda till inkonsistens eftersom en läs/skrivoperation utförs i flera steg. För att undvika detta tillhandahåller Pthreads så kallade Mutual exclusion-lås, och med hjälp av dessa kan programflödet kontrolleras så att två trådar inte kan jobba mot samma variabel samtidigt. En annan, mer avancerad typ av lås som tillhandahålls av Pthreads är en så kallad semafor. Semaforer är väldigt användbara för synkronisering mellan trådar, och för att sköta kommunikationen mellan anslutningshanteraren och serverhanteraren i detta projekt, som körs i varsin tråd, används semaforer i kombination med två kommandoköer och switch-satser. Serverhantereraren kan lägga kommandon på kö hos en anslutningshanterare, vilken sedan utför det aktuella kommandot när den har färdigställt det tidigare kommandot. Samma procedur används även åt andra hållet, för att exempelvis låta serverhanteraren veta att en anslutningshanterare lyckats logga in på servern. Anledningen till att kommunikationsmodellen är så pass invecklad är att vissa kommandon är avsedda att utföras asynkront det vill säga att serverhanteraren inte nödvändigtvis vill vänta på ett svar från anslutningshanteraren, utan helt enkelt kunna gå vidare med andra sysslor medan kommandot utförs av anslutningshanteraren. 4.4 Överföringsimplementationen Transferobjekt I en vanlig FTP/FXP-klient, som är par-baserad, är det väldigt simpelt att starta en filöverföring eftersom klienten då alltid jobbar med enbart två serveranslutningar, och det är just dessa anslutningar som överföringen ska ske mellan. I den klusterbaserade implementationen ser det något annorlunda ut, då motorn istället jobbar mot serverhanterarna, och utifrån det bara vet att en överföring skulle vara lämplig mellan de två aktuella servrarna. För att lösa detta skapar och startar motorn ett överföringsobjekt för varje möjlig överföring, och detta överföringsobjekt sköter sedan resten av överföringen medan motorn återgår till sin vanliga syssla (att uppdatera och jämföra fillistor.). Överföringsobjektet börjar med att försöka få tag i en ledig serveranslutning från vardera serverhanterare. Om detta inte går avbryts överföringsförsöket. När en ledig anslutning tilldelats från vardera serverhanterare sker proceduren på samma sätt som i en vanlig FTP/FXP-klient, alltså att kommandon körs på båda servrarna för att initiera överföringen. När överföringen är påbörjad finns det utrymme för att låta överföringsobjektet hålla reda på överföringshastigheten, och avbryta överföringen om det visar sig gå för sakta. Detta är dock inte implementerat. 14

21 När överföringen är färdigställd mäter överföringsobjektet hur lång tid överföringen tog och räknar utifrån tiden och filstorleken ut hastigheten på överföringen. Denna lagras sedan som en del av ett jämförelsevärde för det aktuella serverparet. 4.5 Lagring av serverinformation För att hålla reda på information om de servrar man vill använda sig av använder sig klienten av en fil som lagras lokalt på hårddisken, definierad som sitedb. I denna fil finns all nödvändig information om varje server, såsom: serverns ip-adress och port användarnamn lösenord antalet tillåtna simultana anslutningar antalet tillåtna simultana nerladdningar antalet tillåtna simultana uppladdningar sektionsdefinitioner andra egenskaper, såsom stöd för SSL, PRET [8], om passive mode inte fungerar, med mera. Filen innehåller även klientens egen historik för servrarna, exempelvis överföringshastigheter i förhållande till andra servrar och dylikt. Filen läses när klienten startar, och skrivs då och då medan klienten är igång. Med den aktuella implementationen måste information om servrar matas in manuellt i denna fil. Med ett grafiskt gränssnitt skulle detta kunna ske direkt i klienten istället, vilket skulle öka användbarheten kraftigt. Denna fil bör av säkerhetsskäl krypteras på något sätt. Den absolut minsta nödvändiga implementationen vore att lagra lösenorden med någon form av kryptering istället för klartext. Lösenorden kan dock inte hashas, eftersom de måste kunna återskapas och användas vid inloggning till servrarna. Inga krypteringsfunktioner är dock implementerade i prototypklienten. 15

Beslutsstöd för prissättning till webbutik Projektrapport

Beslutsstöd för prissättning till webbutik Projektrapport Beslutsstöd för prissättning till webbutik Projektrapport 22 september 2011 This paper is about the development of an application that collects and processes market pricing data. This is used by an online

Läs mer

TEMPERATURÖVERVAKNING AV KYLTRANSPORTER

TEMPERATURÖVERVAKNING AV KYLTRANSPORTER Examensarbete 20 poäng D-nivå TEMPERATURÖVERVAKNING AV KYLTRANSPORTER Reg.kod: Oru-Te-EXA089-D100/04 Johan Björk och Jonas Johansson Magisterprogrammet inom datateknik 160 p Örebro vårterminen 2004 Handledare:

Läs mer

Skill Test En Webbaserad Platform för Rekryteringstester

Skill Test En Webbaserad Platform för Rekryteringstester Skill Test En Webbaserad Platform för Rekryteringstester Kandidatarbete inom data- och informationsteknik ANDERS HALLGREN CHRISTIAN MEIJNER MARKUS ANDERSSON NORÉN PHILIP EKMAN PONTUS DOVERSTAV SIMON WIDLUND

Läs mer

Femte Generationens Operativsystem

Femte Generationens Operativsystem Femte Generationens Operativsystem Fredrik Tolf 22 november 2004 Sammanfattning I ett års tid har jag utformat planer på hur man bör bygga ett operativsystem, som jag anser är bättre

Läs mer

Institutionen för datavetenskap

Institutionen för datavetenskap Institutionen för datavetenskap Department of Computer and Information Science Examensarbete Jämförelse av aggregeringswebbdelar i MOSS 2007 av Mohammed Aghili LIU-IDA/LITH-EX-A--09/021--SE 2010-08-30

Läs mer

Undersökning för förbättring av analys och rapportering i kvalitetsregister

Undersökning för förbättring av analys och rapportering i kvalitetsregister UPTEC X 11 005 Examensarbete 30 hp Mars 2011 Undersökning för förbättring av analys och rapportering i kvalitetsregister Joel Damberg Bioinformatics Engineering Program Uppsala University School of Engineering

Läs mer

Kvalitetskontroll av centrala Internetfunktioner

Kvalitetskontroll av centrala Internetfunktioner IT-kommissionen Kvalitetskontroll av centrala Internetfunktioner Benny Stridsberg Rapport 67/2003 IT-kommissionen, 103 33 Stockholm. Telefon: 08-405 10 00 ii Kvalitetskontroll av centrala Internetfunktioner

Läs mer

ANNA GUSTAFSSON JONAS ÅSTRÖM

ANNA GUSTAFSSON JONAS ÅSTRÖM Androidapplikation för fjärrövervakning av affärskritiska driftsystem Android application for remote monitoring of business-critical operating systems Examensarbete inom högskoleingenjörsprogrammet ANNA

Läs mer

Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna

Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna Datavetenskap Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna Examensarbete, C-nivå 10 poäng 2003:25 ASP och PHP En jämförelse mellan de båda teknikerna Björn Andersson

Läs mer

Utvärdering av Microsoft SharePoint 2003

Utvärdering av Microsoft SharePoint 2003 Avdelning för datavetenskap Jan Ljungkvist Utvärdering av Microsoft SharePoint 2003 Evaluation of Microsoft SharePoint 2003 Examensarbete C-uppsats 10p Datum: 07-06-05 Handledare: Examinator: Katarina

Läs mer

EDA 390 - Datakommunikation och Distribuerade System. Peer-To-Peer system

EDA 390 - Datakommunikation och Distribuerade System. Peer-To-Peer system EDA 390 - Datakommunikation och Distribuerade System Peer-To-Peer system Andreas Bernet 810929-0018 beran@etek.chalmers.se Sektion: Elektroteknik Johan Zhang 820401-1830 zhaj@etek.chalmers.se Sektion:

Läs mer

Ärendehanteringssystem på web

Ärendehanteringssystem på web Ärendehanteringssystem på web Examensarbete inom Högskoleingenjörsprogrammet i datateknik JOHAN NILSSON HANSEN Institutionen för data- och informationsteknik CHALMERS TEKNISKA HÖGSKOLA Göteborg, Sverige

Läs mer

Optimering av databasinformation

Optimering av databasinformation Optimering av databasinformation Optimization of Database Information John Blomberg Sebastian Östlund Examensarbete inom informationoch programvarusystem Högskoleingenjör Degree Project in Information

Läs mer

Mobila system för serviceteknikeryrket

Mobila system för serviceteknikeryrket Mobila system för serviceteknikeryrket Undersökning av behoven och utveckling av en handdatorapplikation C H R I S T O F F E R O L S S O N Examensarbete Stockholm, Sverige 2007 Mobila system för serviceteknikeryrket

Läs mer

UTVECKLING AV ETT WEBBASERAT EKONOMISYSTEM FÖR EN LITEN ORGANISATION

UTVECKLING AV ETT WEBBASERAT EKONOMISYSTEM FÖR EN LITEN ORGANISATION UTVECKLING AV ETT WEBBASERAT EKONOMISYSTEM FÖR EN LITEN ORGANISATION David Luotonen EXAMENSARBETE 2009 DATATEKNIK UTVECKLING AV ETT WEBBASERAT EKONOMISYSTEM FÖR EN LITEN ORGANISATION Development of a web

Läs mer

Automatiska epostutskick vid postförsändelser till medlemmar hos Svenskt Militärhistoriskt Bibliotek

Automatiska epostutskick vid postförsändelser till medlemmar hos Svenskt Militärhistoriskt Bibliotek Automatiska epostutskick vid postförsändelser till medlemmar hos Svenskt Militärhistoriskt Bibliotek Automatic email digest of mail to members of the Swedish Military Historical Library Jani Morko Examensarbete

Läs mer

Mälardalens högskola IDT, 2013-05-30

Mälardalens högskola IDT, 2013-05-30 LAN-UPPGRADERING Dennis Israelsson Lagom & Gott Ljud AB Examinator, Mats Björkman Akademisk handledare, Hans Bjurgren Företagets handledare, Mikael Sjöman Mälardalens högskola IDT, 2013-05-30 Sammanfattning

Läs mer

Utvärdering av Autoclass C

Utvärdering av Autoclass C Utvärdering av Autoclass C Martin Karresand, Dan Nordqvist FOI-R--1484--SE ISSN-1650-1942 Ledningssystem Teknisk rapport December 2005 FOI är en huvudsakligen uppdragsfinansierad myndighet under Försvarsdepartementet.

Läs mer

The Undisputable Connection to SPCS En sammankoppling av Visma SPCS och MS Outlook. Gustav Wilhelmsson och Thomas Woxberg

The Undisputable Connection to SPCS En sammankoppling av Visma SPCS och MS Outlook. Gustav Wilhelmsson och Thomas Woxberg Examensarbete The Undisputable Connection to SPCS En sammankoppling av Visma SPCS och MS Outlook av Gustav Wilhelmsson och Thomas Woxberg LITH-IDA-EX-ING--06/007--SE 2006-06-05 Linköpings universitet Institutionen

Läs mer

C-UPPSATS. Företagsportaler

C-UPPSATS. Företagsportaler C-UPPSATS 2006:216 Företagsportaler En jämförelse mellan en standardlösning och egenutveckling Daniel Barsk Luleå tekniska universitet C-uppsats Data och systemvetenskap Institutionen för Industriell ekonomi

Läs mer

LAGRAD PROCEDUR MOT DATABASAPPLIKATION EFFEKTIVITET OCH FUNKTIONALITET

LAGRAD PROCEDUR MOT DATABASAPPLIKATION EFFEKTIVITET OCH FUNKTIONALITET LAGRAD PROCEDUR MOT DATABASAPPLIKATION EFFEKTIVITET OCH FUNKTIONALITET Examensarbete Systemarkitekturutbildningen Andreas Boldizar Tobias Johansson VT 2012:KSAI03 Systemarkitekturutbildningen är en kandidatutbildning

Läs mer

Extern utläggsregistrering med Microsoft Dynamics AX FREDRIK ANDERSSON

Extern utläggsregistrering med Microsoft Dynamics AX FREDRIK ANDERSSON Extern utläggsregistrering med Microsoft Dynamics AX FREDRIK ANDERSSON Examensarbete Stockholm, Sverige 2009 Extern utläggsregistrering med Microsoft Dynamics AX FREDRIK ANDERSSON Examensarbete i datalogi

Läs mer

Institutionen för datavetenskap Department of Computer and Information Science

Institutionen för datavetenskap Department of Computer and Information Science Institutionen för datavetenskap Department of Computer and Information Science Examensarbete Avkodning av streckkoder i mobila enheter av Jonatan Stolt LIU-IDA/LITH-EX-G--09/014 SE 2009-12-09 Linköpings

Läs mer

Problem med implementering av mjukvara inom projektstyrning i området postproduktion. JONAS BJÖRKGREN och MATHIAS NILSSON TUORDA

Problem med implementering av mjukvara inom projektstyrning i området postproduktion. JONAS BJÖRKGREN och MATHIAS NILSSON TUORDA Problem med implementering av mjukvara inom projektstyrning i området postproduktion JONAS BJÖRKGREN och MATHIAS NILSSON TUORDA Examensarbete Stockholm, Sverige 2011 Problem med implementering av mjukvara

Läs mer

Operatörsgränssnitt för manöversystem

Operatörsgränssnitt för manöversystem Operatörsgränssnitt för manöversystem Maria Karimian TRITA-NA-E04111 NADA Numerisk analys och datalogi Department of Numerical Analysis KTH and Computer Science 100 44 Stockholm Royal Institute of Technology

Läs mer

Byggserverövervakning

Byggserverövervakning Byggserverövervakning Utveckling av ett system för att synliggöra integrationsproblem Build server monitoring Development of a system visualizing problems with integration Andreas Cider Max Jacobs Fakulteten

Läs mer

EXAMENSARBETE IP-TELEFONI STEFAN HOLMGREN OLA LUNDQVIST. Samhällsvetenskapliga och ekonomiska utbildningar SYSTEMVETARPROGRAMMET C-NIVÅ

EXAMENSARBETE IP-TELEFONI STEFAN HOLMGREN OLA LUNDQVIST. Samhällsvetenskapliga och ekonomiska utbildningar SYSTEMVETARPROGRAMMET C-NIVÅ 2002:209 SHU EXAMENSARBETE IP-TELEFONI Framtiden för telekommunikation? STEFAN HOLMGREN OLA LUNDQVIST Samhällsvetenskapliga och ekonomiska utbildningar SYSTEMVETARPROGRAMMET C-NIVÅ Institutionen för Industriell

Läs mer

Design och implementation av ett webbaserat bokningssystem för offentlig sektor

Design och implementation av ett webbaserat bokningssystem för offentlig sektor Design och implementation av ett webbaserat bokningssystem för offentlig sektor David Åberg 9 februari 2009 Examensarbete i Datavetenskap, 30 hp Handledare på CS-UmU: Helena Lindgren Extern handledare:

Läs mer

Ett förslag till en kombinerad lösning för ett informationsoch kundrelationssystem för bilköp SAID EL SHOBAKI

Ett förslag till en kombinerad lösning för ett informationsoch kundrelationssystem för bilköp SAID EL SHOBAKI Ett förslag till en kombinerad lösning för ett informationsoch kundrelationssystem för bilköp SAID EL SHOBAKI Examensarbete Stockholm, Sverige 2010 Ett förslag till en kombinerad lösning för ett informationsoch

Läs mer

Tidrapporteringssystem för mobiltelefoner

Tidrapporteringssystem för mobiltelefoner Författare: Johan Andersson, Håkan Spaak Extern handledare: Peter Svensson, Intelliplan AB Intern handledare: Jan-Erik Moström, Umeå Universitet 2 Sammanfattning Rapporten behandlar utvecklingen av en

Läs mer