Nytt från NATINELLT SUPERDATRCENTRUM VID LINKÖPINGS UNIVERSITET NR 10 APRIL 2002 Tre gånger mer pengar till NSC Vetenskapsrådet har beslutat att utöka finansieringen av Nationellt Superdatorcentrum (NSC) vid Linköpings universitet. Under hösten 2001 genomförde Vetenskapsrådet en utredning som rekommenderade en kraftig ökning av anslaget till NSC. Under 2002 disponerar NSC 17.5 mkr från Vetenskapsrådet. Den ökade finansieringen kommer bl.a. att användas till en utökning av NSCs datorkapacitet både i form av maskiner med stort minne, vilket viktiga användargrupper vid NSC är i stort behov av, men även en satsning på storskaliga distribuerade minnessystem, säger Anders Ynnerman föreståndare för NSC. Den ökade finansieringen kommer också att göra det möjligt för NSC att utöka arbetet med att utveckla och installera Linuxbaserade PC-kluster för superdatorberäkningar. Linuxkluster erbjuder en mycket kostnadseffektiv lösning för stora beräkningar och genom att bygga vidare på NSCs erfarenhet inom området kommer vi framöver Anders Ynnerman att kunna bygga kluster bestående av uppemot 1000 CPUer, säger Niclas Andersson som är tekniskt ansvarig för klusterverksamheten vid NSC. NSCs åttonde PC-kluster placeras i LUND NSC har inom samarbetet med LUNARC designat, byggt och installerat ett beräkningskluster på Lunds datorcentral (LDC). Klustret består av 65 st datorer (+ 1 i reserv) med vardera en AMD AthlonXP 1900+, 1 GByte DDR-minne samt en 40 GByte IDE-disk. Alla datorerna är sammankopplade med ett internt FastEthernet-nätverk. vanpå operativsystemet Redat Linux har den programmerings- och produktionsomgivning som tagits fram på NSC installerats. mgivningen gör det enkelt för användare att komma igång och den ser likadan ut från kluster till kluster även om underliggande hårdvara och konfiguration skiljer sig åt. Datorklustret kommer att användas av de åttiotalet användare som är knutna till LUNARC, Lunds universitets centrum för vetenskapliga och tekniska beräkningar. - Vi har sedan tidigare goda erfarenheter av Linux-kluster och ser samordningsvinster med att bygga gemensamma resurser för användare på Lunds universitet, berättar Göran Sandberg, professor i strukturmekanik och föreståndare för LUNARC. NSC har sedan 1999 designat, byggt, installerat och administrerat PCkluster. Användarna av klustren kommer från SKF, SAAB Avionics, SAAB Aero, såväl som akademiska forskare, doktorander och studenter från hela Sverige. NSC arrangerar årligen workshopen "Linux Clusters for Super Computing (LCSC)". Årets workshop kommer äga rum den 24-25 oktober 2002. Utöver det nybyggda PC-klustret har LUNARCs användare tillgång till en 48 processors SGI 2000, en SGI nyx2 med 4 processorer och två PC-kluster med 8 respektive 32 processorer. De största förbrukarna av LUNARCs resurser återfinns inom applikationsområdena kemi, fysik och tillämpad mekanik. Datorerna som utgör byggstenarna i klustret är levererade av Compliq System AB, Lund. NSC har sedan 1999 designat, byggt, installerat och administrerat PCkluster. Användarna av klustren kommer från SKF, SAAB Avionics, SAAB Aero, såväl som akademiska forskare, doktorander och studenter från hela Sverige. NSC arrangerar årligen workshopen "Linux Clusters for Super Computing (LCSC)". Årets workshop kommer äga rum den 24-25 oktober 2002. 1
Ledaren Det pågår intensiv verksamhet vid NSC. Efter Vetenskapsrådets beslut om att tilldela NSC ett kraftigt utökat anslag under 2002 har arbetet med att planera för expansion av delad minneskapacitet och en kraftfull satsning på PC-kluster påbörjats. Motiveringen till satsningen på att utöka den delade minneskapaciteten står att finna i den kraftiga översökningen av NSCs SGI 3800 system under förra året. Det söktes ungefär 7 ggr mer tid på systemet än vad som var tillgängligt. Detta är en indikator på att svensk nationell superdatorverksamhet under de senaste åren underprioriterat denna typ av resurser. NSCs SGI 3800 var därför ett mycket eftertraktat tillskott till den nationella superdatorparken. I detta nummer av Nytt från NSC har vi nöjet att presentera resultat från ett projekt som kunnat genomföras med hjälp av den storskaliga delade minneskapaciteten vid NSC. Projektet handlar om beräkningskemiska studier av ämnen för behandling av cancer. Läsare av Nytt från NSC under de senaste åren har knappast kunnat undgå Professor Anders Ynnerman Föreståndare NSC att notera den satsningen som gjorts på PC-kluster vid NSC. Redan 1999 var NSC igång med att bygga kluster och verksamheten har kontinuerligt utvecklats sedan dess. NSC arrangerade i höstas, för andra året i följd, Workshop on Linux Clusters for Super Computing. Klusterworkshopen var också denna gång synnerligen välbesökt och ett referat av den finns med i detta nummer. Intresset för workshopen har varit så stort att vi nu gör den till ett årligt återkommande evenemang. Vi kan också notera att de samarbeten som NSC etablerat inom klusterområdet har fortsatt att utvecklas. Ett aktuellt exempel på detta är det kluster som byggts inom ramen för NSCs samarbete med LUNARC och som i dagarna tagits i drift. De erfarenheter och den kompetens inom klusterområdet som byggts upp vid NSC under de senaste åren, tillsammans med den utökade finansieringen från Vetenskapsrådet, gör det nu möjligt att ta ett stort kliv in i framtiden genom att bygga ett storskaligt PC-kluster som kommer att utgöra en av NSCs huvudproduktionsresurser. NSCs PC-kluster Ingvar har med framgång använts i allmän produktion i en blandad batchmiljö och det nya klustret kommer att utnyttja den produktionsmiljö som utvecklats vid NSC. Det nya klustret kommer att ha uppemot 400 processorer och ett snabbt nätverk. Klustret kommer att vara tillgängligt för NSCs akademiska användare såväl som Saab AB och SMI. Redan i vårens ansökningsomgång ges det tillfälle att söka tid på denna nya resurs vid NSC. Klustret kommer att byggas under sommaren och förväntas tas i drift under tredje kvartalet 2002. 2002 är som framgår ovan ett mycket händelserikt år för NSC och vi ser fram emot att kunna rapportera om utvecklingen i kommande nummer av Nytt från NSC. Sök SNAC tid Nu är det dags att söka datortid inför hösten från The Swedish National Allocation Committe, SNAC. Passa på att söka tid på NSCs mycket populära delat minnesresurs samt vid NSCs nya stora PC-kluster för superdatorberäkningar som kommer att tas i drift under tredje kvartalet i år. Ansökningstiden för tilldelning av resurser vid NSC och andra nationella PD-centra går ut klockan 16:00 måndagen den 29 april. fullständiga eller för sent inkomna ansökningar behandlas ej. För information och det elektroniska ansökningsformuläret se SNACs hemsida http://www.snac.vr.se/. Deadline 29 april 2
Kemiska experiment på superdatorer Forskningen inom teoretisk kemi omfattar metodutveckling och implementering av nya kvantkemiska metoder såväl som tillämpningen av dessa metoder till aktuella kemiska problem. NSC står för huvuddelen av den beräkningstid som krävs för dessa forskningsprojekt. Som fig. 1 (se nästa sida) visar har metodutvecklingen i vår grupp alltmer blivit inriktad mot täthetsfunktionalteori (DFT). Detta för att tillämpningarnas huvudområde har förskjutits från organisk kemi till problem inom biokemi och läkemedelskemi och därmed från förhållandevis små till betydligt större molekyler. DFT-beräkningar på SGI 3800 med dess delade minne möjliggör undersökning av molekyler med upp till 150 atomer, vilket kräver biljontals integralberäkningar. Med hjälp av NSCs beräkningskapacitet kan därmed viktiga frågor undersökas och lösas genom beräkningar, t ex: ur kan en naturligt förekommande substans som är mycket giftig modifieras till ett ogiftigt anticanceragens (fig. 1). Datorstödd konstruktion av ogiftiga anticanceragens på enediynbasis Mikroorganismer och människor har en sak gemensamt: Båda angrips av mikroorganismer. Skillnaden är att mikroorganismerna har funnits på jorden minst två miljarder år längre än människan och därmed vet de mycket bättre hur man försvarar sig mot bakterier och virus. Vissa mikroorganismer har visat sig producera så kallade enediyner: dynemicin (fig. 2, nästa sida), calicheamicin, esperamicin m m. Enediynerna har förmågan att förstöra DNA från toxiska bakterier och virus. Detta sker i tre steg: Först hjälper ett leveranssystem enediynet att docka till DNA-helixens minor groove. Sedan ser en molekylär utlösningsmekanism till att enediynenheten i den naturliga substansen genomgår en Bergmancyklisering och därmed formar p-didehydrobenzen, en mycket reaktiv biradikal som har jämförts med en biologisk stridsspets (i samband med det krig mot cancer USAs regering utlyst på 70-talet). Slutligen attackerar och förstör denna stridsspets DNA, vilket orsakar cellens död. Denna enkla trestegsmekanism, som är mycket effektiv i naturen, har motiverat många vetenskapsmän att undersöka om en sådan mekanism kan användas för att förstöra DNA i tumörceller. Problemet med de naturliga enediynerna är dock att de inte kan skilja mellan tumörceller och friska celler i människokroppen, dvs alla naturliga enediyner är mycket giftiga. I vår forskning om enediyner har vi satt upp kriteria för ett nytt anticanceragens som dels är mycket aktiv, dels är selektiv och ogiftig. Nyckeln till vår metod är att tumörceller har ett lite högre behov av näring än friska celler, vilket leder till ett lite lägre p-värde i en tumörcell (p = 6.5) jämfört med en frisk cell (p = 7), som kan sänkas ytterligare till p = 5.5 genom att framkalla hyperglukemi, dvs förhöjd blodsockerhalt. Vi modificerar det naturliga enediynets stridsspets genom en funktionell grupp som fyller två syften: Å ena sidan säkerställer den att substansen förstör sig själv vid p = 7, så att den blir harmlös för en frisk cell. Å andra sidan känner den av den högre aciditeten i en tumörcell och startar då stridsspetsens omvandling från en harmlös form till en aggressiv, som attackerar tumörcellens DNA. Eftersom alla dessa omvandlingar är baserade på enkla reaktioner kan de studeras på datorn med kvantkemiska metoder. ittills har dessa beräkningar inskränkts till enediynernas aktiva komponenter, vilket medför risken att missa effekter som uppstår vid de reala enediynernas reaktioner. Med SGI 3800, som erbjuder 96 GB delat minne och en topprestanda av 96 GFlops, kunde vi ta ett viktigt steg framåt och studera det naturligt förekommande Dynemicin A. Vi kunde bestämma struktur, konformation och biologisk aktivitet för Dynemicin A med hjälp av DFT. I synnerhet kunde vi för första gången beskriva geometriska och energetiska detaljer för utlösningsmekanismen i Dynemicin A (se fig. 2). Att addera väte till antraquinondelen leder till en kedja av förändringar som är nödvändiga för att sätta igång Bergman-reaktionen. Resultaten bekräftar och fördjupar den befintliga kunskapen om Dynemicin A, vilket visar att beräkningarna är meningsfulla och pålitliga. Därefter konstruerade vi, återigen med hjälp av beräkningar, ett modifierat dynemicin genom att bygga in en blockeringsgrupp och en sensor. Den substans man kommer fram till på så sätt attackerar inte friska celler eftersom stridsspetsen förstörs vid p = 7 innan den kan angripa DNA. I tumörcellen däremot aktiveras den vid kroppstemperaturen och attackerar DNA i cellen. Alla krav till en anticanceragens uppfylls för det modifierade dynemicinet. Det pågående beräkningsarbetet fokuserar på den nya substansens syntes (genom datorstödd syntes), möjligheter för läkemedlets intag, biverkningar m m. Genom detta beräkningsarbete inhämtar man så mycket kunskap om de nya substanserna som möjligt innan man påbörjar labbundersökningarna och kan därmed förkorta tiden för dessa avsevärt. Dieter Cremer, Elfi Kraka, Jürgen Gräfenstein Göteborgs universitet, teoretisk kemi 3
Method Development Application Fields Figure 1 Density Functional Theory RSS-DFT for biradicals SIC-DFT, SIC-free functionals BS-SIC-UDFT CAS-DFT Ensemble DFT, REKS NMR chemcial shifts NMR spin-spin coupling constants Relativistic DFT Spectroscopy Adiabatic vibrational mode analysis Automated correlation of vibrational spectra Automated analysis of NMR coupling constants MBPT and Coupled Cluster Theory MP6 and CBS limits QCISDT, QCISDTQ UF-CCSD and <S^2>, PCCSD Unified reaction valley approach Extension of the Reaction Path amiltonian Reaction path following methods Pharmaceutical Chemistry Computer aided design of non-toxic enediyne anticancer drugs, Design of antimalaria drugs Biochemistry -bonding characterized by NMR spin-spin-coupling constants; Investigation of protein ubiquitin; Description of DNA base-pairs, Description of DNA hairpin molecule Karplus curves for ribose. Nerve gases Soman and Somarin Mechanistic Studies Use of the reaction valley analysis for symmetry-allowed and -forbidden reactions, addition and substitution reactions; Investigation of quantum-mechanical tunneling Atmospheric Chemistry zonolysis of alkenes and alkines radical production in the polluted atmosphere Van der Waals complexes Symmetry-adapted perturbation theory, Electron density analysis NADP (Triggering) C C Alcohol formation C Naturally occuring Dynemicin A Bergman cyclization warhead abstraction from DNA C C C Alcohol Biradical Arene Figure 2 4
Lyckad kluster-workshop NSC arrangerade den andra svenska klusterworkshopen med titeln "Workshop on Linux Clusters for Super Computing" 25-26 oktober 2001 i Linköping. Workshopen samlade 126 deltagare, ungefär lika fördelat mellan industri, universitet, och studenter. Dagen före workshopen arrangerade studenternas datorförening vid Linköpings universitet, Lysator, ett mycket välbesökt föredrag av Ben Segal från CERN, en av de speciellt inbjudna föreläsarna till workshopen. Ben Segal var mycket aktiv under uppbyggnaden av internet i Europa och föredragets titel var "Kreativitet och slump: CERN, webben och internet". I sitt föredrag berättade Segal bl.a. om arbetet som utfördes av Tim Berners-Lee vid CERN 1989-1991 med att knyta ihop icke-homogen information på icke-homogena datorer över icke-homogena nätverk - ett arbete som lade grunden till world wide web. Workshopen inleddes av den andre av de två inbjudna huvudtalarna, Mark Baker från universitetet i Portsmouth. Baker konstaterade i sitt föredrag att klustertekniken kan betraktas som ett genombrott för att åstadkomma mycket kostnadseffektiv tillgång till högpresterande datorer. Baker understryker dock att trots att mycket utveckling skett och att det nu är relativt enkelt att sätta upp ett fungerande kluster, behöver programvaran för att enkelt integrera system utvecklas ytterligare. Det behövs fler mjukvarupaket för kluster innehållande verktyg för administration av kluster men även användarfunktionalitet såsom avlusningsoch profileringsverktyg behöver utvecklas. IEEE startade 1999 en "Task Force for Cluster Computing" som dels är ett samarbetsorgan inom området och dels arrangerar en årlig internationell konferens inom området. I sitt föredrag rapporterade Baker från årets konferens "Cluster 2001" som arrangerades i Newport Beach med 300 deltagare och 20 företagsutställningar. Viktiga områden som avhandlades vid konferensen var bl.a. just verktyg för systemadministration och kommunikation. Det finns ett flertal (minst tolv) paketerade klusterlösningar, men ingen är ännu standardiserad. Ben Segal presenterade vid workshopen "The European DataGrid Project". Föredraget gav en inblick i projektet och adresserade speciellt det kommande behovet av datalagring och beräkningar vid CERN. De kommande experimenten vid CERN, t.ex. LC (Large adron Collider) kommer att generera data för analys med hastigheter upp emot 100 Mbytes per sekund, men med varje händelse oberoende, varför det går utmärkt att parallellisera analysen över ett heterogent sammansatt nätverk av PC-kluster. Christian Lundh från Volvo Aero talade om strömningsberäkningar på kluster. Genom att använda kluster har kostanden för simuleringar ar turbiner minskats med 90 %. Volvo Aero har flera kluster varav det största har 100 noder och man kör ett egenutvecklat TML - baserat system för övervakning av systemet. Per Kjäll från Elekta Instrument AB talade om möjliga tillämpningar av kluster inom strålningsterapi. Dosen från en gammakniv baserad på Cobolt60- källor simuleras och man studerar deposition av strålning i hjärnan med hjälp av Monte Carlo simuleringar som kommer att köras på PC-kluster. Iakov Nakhimovski berättade om den första tillämpningen som använde sig av NSCs PC-kluster 1999, nämligen SKFs simulering av kullager. Simuleringarna är mycket beräkningsintensiva och utförs i huvudsak på två kluster vid NSC samt ett som är placerat på SKF Nova i Göteborg. Stefan Persson från Saab Avionics simulerar blixtnedslag i flygplan. Strömstyrkan kan vara så hög som 200 000 ampere. Problemet har ökat under senare år eftersom fler och fler flygningar genomförs under dåliga väderförhållanden, man utnyttjar mer kompositmaterial samt har mer elektronik i planen. För simuleringarna löses Maxwells ekvationer i tre rumsdimensioner utnyttjande finita differensmetoder i tidsdimensionen. Utmärkt skalning har uppnåtts på ett PC-kluster upp till 16 noder. Nästa steg är att utföra beräkningar med så hög upplösning att data måste läggas på skivminnet (out-of-core). Avsikten är att använda ett kluster med 100 processorer och med stora skivminnen. Mark Baker återkom med ett föredrag om Jinis användning i Grid-projekt. Jini är en programmeringsmodell i Java för att, bland annat, specificera resurser och för att bygga och erbjuda distribuerade nätverkstjänster. Jini definierar ett antal programmeringsgränssnitt för att göra detta transparent över flera datorer. Vid en avslutande session förmedlade Mark Baker och Ben Segal sin syn på utvecklingen av klusterområdet och uppmuntrade de svenska deltagarna i workshopen att engagera sig i och bidra till den internationella utvecklingen. Detta referat har endast behandlat ett fåtal av de många föredragen som hölls vid workshopen. Via NSCs hemsida (Gå till Support/Cluster info/workshops/programme) kan man nå konferensens program, där det finns mer information samt länkar till -bilder från vissa av föredragen. 5
Tekniska tipsrutan KMMER I VARJE NUMMER Kalendarium Gaussian-98 kan nu köra på 256 MB noder på T3E Med hjälp av proceduren nedan kan du nu på T3E köra Gaussian-98 och använda 256MB noder. Detta ger dubbelt så mycket tillgängligt minne mot förut. bservera att max 36 processorer är tillåtet per jobb som använder 256MB noder. a) I ditt batch script, lägg in föjande rad: # QSUB -la 256Mb b) Begär 4 extra processorer mot vad du skulle begära normalt. m du vill köra ett Gaussian-98 jobb med 8 processorer, begär 12: # QSUB -l mpp_p=1 c) Vid exekvering, lägg till ett "mpprun -a -L 256Mb" kommando framför Gaussian-98 binären ($g98root/g98/g98): mpprun -a -L 256Mb $g98root/g98/g98 Välbesökta parallellprogrammeringskurser på NSC Två dagar fyllda med teori och praktiska övningar i parallell programmering med MPI (Message Passing Interface) och penmp visade sig vara ett lyckat koncept som samlade dryga 30-talet användare på NSC. Till kursen den 26-27 februari hade NSC bjudit in Dr Mike Pettipher och Dr Neil Stringfellow från Manchester Computing för att föreläsa. Ämnet var parallell programmering med två olika metoder: - Meddelandehantering (eng. message passing) med MPI, den standard som numera är den helt dominerande för meddelandehantering. - Direktiv för att parallellisera loopar på delat-minnes-system. är har olika "dialekter" enats i penmp som blivit mycket uppmärksammat på senare år. Manchester Computing har på samma sätt som NSC satsat på att kunna erbjuda datorresurser som är baserade på delat minne (exempelvis SGI) såväl som distribuerat minne (exempelvis Cray T3E eller PC-kluster). Kurserna var hämtade från det kursutbud som regelbundet ges vid Machester Computing och visade sig vara mycket uppskattat bland NSCs användare. Alla NSCs användargrupperingar (akademiker, SAAB och SMI ) var väl representerade vid kursen. Nationellt superdatorcentrum, Linköpings universitet, 581 83 Linköping Tel: 013-28 26 18, Fax: 013-28 25 35, E-post: nsc@nsc.liu.se www.nsc.liu.se LTAB, Linköping 2002.448 CUG Summit 2002 2nd IEEE International Symposium on Cluster Computing and the Grid (CCGrid2002) 20-24 May 2002, Manchester, England. http://www.cugoffice.org/cugoffice_realms/cug_s02/index.html 21-24 May 2002, Berlin, Germany. http://www.ccgrid.org/ccgrid2002/ http://ccgrid2002.zib.de/conference/workshops/index.html PARA'02, Conference on Applied Parallel Computing 15-18 June 2002, Espoo, Finland. http://www.csc.fi/para2002/ 16th International Conference on Supercomputing 22-26 June 2002, Columbia University, New York City, USA. http://www.tc.cornell.edu/ics02/ Euro-Par 2002 27-30 August 2002, Paderborn, Germany. http://europar.upb.de/ CLUSTER 2002: IEEE Fourth International Conference on Cluster Computing 23-26 September 2002, Chicago, Illinois, USA. http://www-unix.mcs.anl.gov/cluster2002/ 3rd Workshop on Linux Clusters for Super Computing 24-25 ctober 2002, NSC, Linköping, Sweden. http://www.nsc.liu.se/lcsc/ (Not yet updated for 2002)