Distribuerad data-analys inom CMS-experimentet Distribuerad data-analys inom CMS-experimentet Tomas Lindén Forskningsinstitutet för fysik CMS programmet De andra Finlandssvenska fysikdagarna 13.-15. November 2009 November 14, 2009 1 Tomas Lindén
Innehåll 1. Introduktion 2. Large Hadron Collider (LHC) 3. Compact Muon Solenoid-projektet (CMS) 4. CMS distribuerad analys 5. Sammanfattning November 14, 2009 2 Tomas Lindén
1. Introduktion Standard modellen + den bäst testade vetenskapliga teorin + sammanfattar väl vår kunskap om materiens minsta beståndsdelar - är ofullständig - bryter unitariteten i TeV energiområdet November 14, 2009 3 Tomas Lindén
1. Introduktion Figure 1: Proton-proton tvärsnitt. November 14, 2009 4 Tomas Lindén
2. Large Hadron Collider 1984 Workshop: Förslag: installera en Large Hadron Collier i LEP tunneln 1987 CERNs långtids planeringskommitte med Carlo Rubbia som ordförande rekommenderar LHC som CERNs rätta framtida val 1989 LEP lagringsringen startas 1992 LHC experimentens första idéer presenteras i Evian les Bains 1994 LHC, ATLAS och CMS godkänns (Technical Proposals) 1998 Byggnadsarbetena påbörjas 2000 CMS monteringen börjar på markytan, LEP stängs 2003 ATLAS grottan är färdig, monteringen under mark börjar 2005 CMS grottan är färdig November 14, 2009 5 Tomas Lindén
2. Large Hadron Collider 2008 LHC & experimenten färdiga för strålar 2009 Första proton-proton kollisionerna förväntas 2010 3,5+3,5 TeV kollisioner 2011 7+7 TeV kollisoner 201x SLHC fas 1: öka luminositeten med en faktor 2-4 November 14, 2009 6 Tomas Lindén
2. Large Hadron Collider Figure 2: Proton-proton kollisioner vid LHC-acceleratorn. November 14, 2009 7 Tomas Lindén
2. Large Hadron Collider Figure 3: LHC lagringsringen. November 14, 2009 8 Tomas Linde n
2. Large Hadron Collider Figure 4: Svetsing av LHC vakum segment. November 14, 2009 9 Tomas Linde n
2. Large Hadron Collider Figure 5: Hela LHC kyldes ner igen i oktober 2009. November 14, 2009 10 Tomas Lindén
3. Compact Muon Solenoid-projektet CMS en av de två generella LHC-detektorerna Higgs-fysik Supersymmetri Ny fysik (överraskningar) Optimerad för identifiering av myoner, fotoner och elektroner Optimerad för mätandet av rörelsemängden för dessa partiklar Mäter också hadronerans och hadronskurarnas energi (jets) Saknad energi är en annan viktig mätstorhet (eng. missing energy) God identifiering av sekundära τ-lepton och b-kvark vertex. Totalt 78,2 * 10 6 individuella kanaler. Oktober 2006: 2000 fysiker och ingenjörer, inklusive 400 studenter, 155 institut November 14, 2009 11 Tomas Lindén
3. Compact Muon Solenoid-projektet Figure 6: CMS med kiseldetektorn installeras i December 2007. 12 November 14, 2009 Tomas Linde n
3. Compact Muon Solenoid-projektet Några nyckelparametrar för LHC och CMS Design luminositet 10 34 cm 2 s 1 Totalt tvärsnitt 100 mb Kollisionsfrekvens 40 MHz Effektiv mättid / år 10 7 s Event storlek 1 MB Nivå 1 (speciell hårdvara) avfyrning 100 khz Hög nivå (PC farm) avfyrning 100 Hz Datarat 100 MB/s Datavolym / år O (PB) November 14, 2009 13 Tomas Lindén
3. Compact Muon Solenoid-projektet Figure 7: En CMS sektor. November 14, 2009 14 Tomas Lindén
3. Compact Muon Solenoid-projektet November 14, 2009 15 Tomas Linde n
3. Compact Muon Solenoid-projektet Figure 8: CMS detektorn. November 14, 2009 16 Tomas Lindén
3. Compact Muon Solenoid-projektet Figure 9: CMS rz splash event display 2009.11.07. Rött ECAL, HCAL blått, tracker avstängd, myonkamrarna låg HV, magneten 3,8 T November 14, 2009 17 Tomas Lindén
4. CMS distribuerad analys Ändamålen med en CMS Tier-2 site: Resurser för att köra forskarnas analyser på griden Generera Monte Carlo data for analys, kalibrering och prestanda studier med utdatat arkiverat på band på närmaste Tier-1 site Resurser på en CMS grid site personal CPU Compute Element skiva Storage Element Storage Resource Manager (SRM) implementation band (endast för Tier-1 nivå) nätverk 1 10 Gb/s mjukvara, CMSSW, CRAB, ProdAgent, PhEDEx,... finansiering November 14, 2009 18 Tomas Lindén
4. CMS distribuerad analys CMS grid analys användargränssnittet CMS Remote Analysis Builder (CRAB) känner till var CMS datat finns lagrat, enkelt val av input data submitterar med jobbet användarens dynamiska bibliotek till CMSSW avbrutna jobb kan skickas pånytt jobben kan hanteras av en server (CRABserver) fungerar på ARC, glite och OSG November 14, 2009 19 Tomas Lindén
4. CMS distribuerad analys Figure 10: CRAB overview. November 14, 2009 20 Tomas Lindén
4. CMS distribuerad analys Test av det distribuerade beräkningssystemet CMS och de andra experimenten har testat sina beräkningsmodeller flera gånger i s.k. Data Challenges för att försäkra sig om att breäkningssystemet prestanda räcker till för att behandla LHC-datat. De senaste övningarna har varit: The Combined Computing Readiness Challenge (CCRC) / Computing, Software and Analysis challenge 08 i februari, maj 2008 Scale Testing for the Experiment Program in 2009, STEP09 maj, juni October exercise, oktober 2009 November 14, 2009 21 Tomas Lindén
4. CMS distribuerad analys Figure 11: LHC beräkningsresursernas nätverk i Finland. November 14, 2009 22 Tomas Lindén
4. CMS distribuerad analys Figure 12: CMS beräkningsklustrarna i Finland. November 14, 2009 23 Tomas Lindén
4. CMS distribuerad analys Figure 13: Datat som CMS överfört med PhEDEx under första veckan av October exercise. November 14, 2009 24 Tomas Lindén
4. CMS distribuerad analys Figure 14: Allt data som CMS överfört med PhEDEx. November 14, 2009 25 Tomas Lindén
4. CMS distribuerad analys Figure 15: Jobsubmissionen i början av October exercise var 4x medeltalet. November 14, 2009 26 Tomas Lindén
5. Sammanfattning LHC experimentens databehandling är såväl CPU- som data intensiv. Grid teknologin är nödvändig för LHC experimentens framgång. LHC kollisionsdata är att vänta i årsskiftet 2009/2010. LHC mätdatat kommer ge ny kunskap inom ett nytt energiområde. November 14, 2009 27 Tomas Lindén