Sammanfattning av kandidatarbetet

Relevanta dokument
4-1 Hur lyder Schrödingerekvationen för en partikel som rör sig i det tredimensionella

Instuderingsfrågor, Griffiths kapitel 4 7

Configuration-Interaction Methods and Large-scale Matrix Diagonalization

Kvantmekanik II (FK5012), 7,5 hp

1-1 Hur lyder den tidsberoende Schrödingerekvationen för en partikel som rör sig längs x-axeln? Definiera ingående storheter!

Atom- och kärnfysik med tillämpningar -

Kvantfysik SI1151 för F3 Tisdag kl

Hjälpmedel: Det för kursen ociella formelbladet samt TeFyMa. 0 x < 0

Kvantmekanik II - Föreläsning 7

Atom- och kärnfysik med tillämpningar -

Dugga i FUF040 Kvantfysik för F3/Kf3

Kvantmekanik II Föreläsning 2 Joakim Edsjö 1/37

FFM234, Klassisk fysik och vektorfält - Föreläsningsanteckningar

Andra föreläsningen kapitel 7. Patrik Lundström

Lösningsförslag till övningsuppgifter, del V

Kvantmekanik - Gillis Carlsson

FK Kvantfysikens principer, Fysikum, Stockholms universitet Tentamensskrivning, onsdag 21 december 2016, kl 17:00-22:00

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

Konvergens för iterativa metoder

TENTAMEN I KVANTFYSIK del 1 (5A1324 och 5A1450) samt KVANTMEKANIK (5A1320) med SVAR och LÖSNINGSANVISNINGAR Tisdagen den 5 juni 2007

Beräkningsvetenskap introduktion. Beräkningsvetenskap I

Bose-Einsteinkondensation. Lars Gislén, Malin Sjödahl, Patrik Sahlin

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

Pipelining i Intel Pentium II

TMV142/186 Linjär algebra Z/TD

Murray Gell-Mann och

Om Particle Data Group och om Higgs bosonens moder : sigma mesonen

FFM234, Klassisk fysik och vektorfält - Föreläsningsanteckningar

Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, Del A

Tekniska beräkningar. Vad är tekn beräkningar? Vad är beräkningsvetenskap? Informationsteknologi. Informationsteknologi

Basbyte (variabelbyte)

29 november, 2016, Föreläsning 21. Ortonormala baser (ON-baser) Gram-Schmidt s ortogonaliseringsprocess

Vektorrum. EX. Plan och linjer i rummet genom origo. Allmänt; mängden av lösningar till AX = 0.

TAMS79: Föreläsning 10 Markovkedjor

MS-A0409 Grundkurs i diskret matematik Appendix, del II

Föreläsning 2 Modeller av atomkärnan

Approximation av funktioner

Exempel :: Spegling i godtycklig linje.

Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts.

Lösning till tentamensskrivning i Diskret Matematik för CINTE, CL2 och Media 1, SF1610 och 5B1118, onsdagen den 17 augusti 2011, kl

Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or.

Fysikaliska modeller

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT Lars Larsson Algoritmer 1

Beräkningsvetenskap introduktion. Beräkningsvetenskap I

1 LP-problem på standardform och Simplexmetoden

1 Minkostnadsflödesproblem i nätverk

Exempel :: Spegling i godtycklig linje.

Linjär algebra/matematik. TM-Matematik Mikael Forsberg ma014a, ma031a

Andragradspolynom Några vektorrum P 2

SUBATOMÄR FYSIK F3, 2004

Egenvärdesproblem för matriser och differentialekvationer

Kursplanen är fastställd av Naturvetenskapliga fakultetens utbildningsnämnd att gälla från och med , vårterminen 2016.

6.1 Skalärprodukt, norm och ortogonalitet. TMV141 Linjär algebra E VT 2011 Vecka 6. Lärmål 6.1. Skalärprodukt. Viktiga begrepp

Lösningsanvisningar till de icke obligatoriska workoutuppgifterna

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016

1 Duala problem vid linjär optimering

Kvantmekanik II - Föreläsning 10

Lösningsförslag till Tentamen i 5B1118 Diskret matematik 5p 11 april, 2002

För studenter på distans och campus Linjär algebra ma014a ATM-Matematik Mikael Forsberg

Numerisk lösning till den tidsberoende Schrödingerekvationen.

Systemkonstruktion Z3 (Kurs nr: SSY-046)

Föreläsning 6: Nätverksoptimering

Hemuppgift 1, SF1861 Optimeringslära för T

Projekt Finit Element-lösare

Föreläsning 2: Simplexmetoden. 1. Repetition av geometriska simplexmetoden. 2. Linjärprogrammeringsproblem på standardform.

Föreläsning 9: NP-fullständighet


Oändligtdimensionella vektorrum

Beräkningsvetenskap. Vad är beräkningsvetenskap? Vad är beräkningsvetenskap? Informationsteknologi. Informationsteknologi

Fixpunktsiteration. Kapitel Fixpunktsekvation. 1. f(x) = x = g(x).

Föreläsning 8 Elementarpartiklar, bara kvarkar och leptoner

Föreläsning 8 Elementarpartiklar, bara kvarkar och leptoner

. (2p) 2x + 2y + z = 4 y + 2z = 2 4x + 3y = 6

Maj Lycka till! Sergei Silvestrov. 1. a) Bestäm Jordans normalform och minimalpolynom av Toeplitzmatrisen T =

Lösningar - Rätt val anges med fet stil i förekommande fall (obs att svaren på essäfrågorna inte är uttömmande).

Gemensamt projekt: Matematik, Beräkningsvetenskap, Elektromagnetism. Inledning. Fysikalisk bakgrund

Numeriska metoder för ODE: Teori

1. (Dugga 1.1) (a) Bestäm v (3v 2u) om v = . (1p) and u =

SF1624 Algebra och geometri Tentamen Torsdag, 9 juni 2016

Linjära ekvationssystem

Talmängder. Målet med första föreläsningen:

För ingenjörs- och distansstudenter Linjär Algebra ma014a ATM-Matematik Mikael Forsberg

Kursplanen är fastställd av Naturvetenskapliga fakultetens utbildningsnämnd att gälla från och med , vårterminen 2018.

TANA17 Matematiska beräkningar med MATLAB för M, DPU. Fredrik Berntsson, Linköpings Universitet. 27 oktober 2015 Sida 1 / 31

Tentamen i Modern fysik, TFYA11/TENA

Tentamen i FUF050 Subatomär Fysik, F3

2x + y + 3z = 1 x 2y z = 2 x + y + 2z = 1

Datorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)

Övningshäfte 6: 2. Alla formler är inte oberoende av varandra. Försök att härleda ett par av de formler du fann ur några av de övriga.

Frågorna 1 till 6 ska svaras med ett kryss för varje korrekt påstående. Varje uppgift ger 1 poäng.

Föreläsning 7: Kvadratisk optimering. 4. Kvadratisk optimering under linjära bivillkor

Föreläsning 5: Grafer Del 1

Tentamen i Beräkningsvetenskap I/KF, 5.0 hp,

Optimering med bivillkor

Parallellism i CDC 7600, pipelinens ursprung

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

Optimeringslara = matematik som syftar till att analysera och. Optimeringslara ar en gren av den tillampade matematiken.

Prestanda och skalbarhet

ax + y + 4z = a x + y + (a 1)z = 1. 2x + 2y + az = 2 Ange dessutom samtliga lösningar då det finns oändligt många.

SJÄLVSTÄNDIGA ARBETEN I MATEMATIK

Transkript:

Sammanfattning av kandidatarbetet Feasibility of FPGA-based Computations of Transition Densities in Quantum Many-Body Systems 0.1 Teori och bakgrund Målsättningen att beskriva atomkärnans egenskaper har gjorts möjlig av den kvantfysikaliska formalism som byggts upp under det senaste seklet. Inom denna formalism beskrivs atomkärnans tillstånd med en vågfunktion ψ vars egenskaper representeras av operatorer ˆV. Om ψ inte är en egenfunktion till ˆV, är det dock omöjligt att associera ˆV med ett deterministiskt värde, utan endast ett väntevärde, vilket ges av V = ψ ˆV ψ. (1) Drivkraften i denna studie är att kunna beräkna sådana väntevärden, eller generaliserat, matriselement mellan ett initialtillstånd och ett finaltillstånd hos en atomkärna, V if = ψ f ˆV ψ i. (2) Om det finns analytiska uttryck för ψ och ˆV är utvärderingen av dessa uttryck tämligen rättframt. Vågfunktioner av intresse är dock i allmänhet egenfunktioner till det studerade systemets Hamiltonoperator, och bortsett från ytterst enkla fall saknas i allmänhet analytiska uttryck för sådana. Vidare finns inga exakta uttryck för den nukleära Hamiltonianen, och en jämförelse mellan beräkningar och experiment blir därför ett mått på hur väl den använda Hamiltonianen svarar mot verkligheten. En konventionell metod för att finna energiegenfunktionerna för en atomkärna bestående av A partiklar och med en realistisk potential, utgörs av att expandera tillståndsrummet i en flerkroppsbas. Med detta menas en A-faldig tensorprodukt av enpartikeltillstånd α, det vill säga vågfunktioner som kan användas för att beskriva ett system bestående av en nukleon. Flerkroppsbasen betecknas då α 1 α 2...α A, (3) med den fysikaliska tolkningen att α 1,..., α A är ockuperade tillstånd. Pauliprincipen medför att α i skall vara distinkta, det vill säga att ett enpartikeltillstånd bara får förekomma en gång i ett flerkroppstillstånd. Av detta följer att eftersom partiklarna i en atomkärna, det vill säga neutroner och protoner, är fermioner, måste baselementet i (1.3) vara antisymmetriskt med avseende på permutation av två enpartikeltillstånd. Utgående från denna flerkroppsbas kan vi skapa matrisrepresentationen av Hamiltonianen och diagonalisera denna, och på så vis finna egenvektorer ψ. Eftersom en fullständig bas har oändlig dimension är det i praktiska beräkningar nödvändigt att trunkera basen för att erhålla ändlig dimension. En sådan trunkering kommer dock alltid att påverka noggrannheten med vilken vi kan beräkna egenfunktionerna, och i slutändan också V if. Redan för relativt lätta kärnor med A = 10 krävs en bas av dimension ca 10 9 för att erhålla tillförlitliga resultat, vilket innebär matriser med 8 element, det vill säga ohyggligt stora matriser. En effektiv representation av problemet erhålls med hjälp av den kvantfysikaliska formalismen second quantization. I denna formalism använder man sig av så kallade skapelse- och förinteseloperatorer, a α i och a αi vars verkan på ett flerkroppstillstånd av typ (3) är att skapa respektive förinta enpartikeltillståndet α i, förutsatt att tillståndet inte finns respektive finns flerkroppstillståndet, { a ± α 1 α 2...α i...α A, o 1,2,...,A och i 1,2,...,A α i a αj α 1 α 2...α A = (4) 0, annars 1

där tecknet avgörs av hur tillståndet eventuellt måste ordnas om. Ur detta förstår vi att ett matriselement av typen α 1α 2...α A a α i a αj α 1 α 2...α A (5) är nollskilt endast om den enda skillnaden mellan flerkroppselementen är tillstånden α i och α j. Om detta är uppfyllt säger vi att flerkroppstillstånden kopplar till varandra. Vår studie har syftat till att undersöka lämpligheten i att använda FPGA-hårdvara för att hitta alla sådana kopplingar. I studien har vi begränsat oss till så kallade enkroppsoperatorer (betecknas med Ô som i one-body operator), som med hjälp av second quantization kan skrivas enligt Ô = α iα j O αiα j a α i a αj (6) Ekvation (2) kan då uttryckas O if = ψ f Ô ψ i = α iα j α i O α j ψ f a α i a αj ψ i. (7) Den stora fördelen med denna variant är att termen ψ f a α i a αj ψ i, ett s.k. matriselement för övergångssannolikhet, är samma för alla enkroppsoperatorer. Om man beräknar dessa får man därför en beräkningsmässigt betydligt enklare summering för att kunna beräkna matriselement för en mängd olika observabler. Slutprodukten för beräkningarna utgörs därför av ψ f a α i a αj ψ i eller ännu hellre en reducerad variant av sådana, där hänsyn till Ô:s symmetrier har tagits. 0.2 Avgränsning och modellrum En viktig aspekt för att effektivt kunna utföra de ovan beskrivna beräkningarna, är att välja en lämplig bas. Till att börja med behövs enpartikeltillstånd som svarar mot en välbestämd energi. I beräkningarna har vi använt tillstånd svarande mot en tredimensionell harmonisk oscillator, det vill säga tillstånd med kvanttalen α i = (n i,l i,j i,i ), vars energikvanta ges av N = 2n + l. Flerkroppsbasen kan därefter konstrueras som en tensorprodukt av dessa, som förutom Pauliprincipen tar hänsyn till följande trunkeringar och villkor: Summan av energierna för de ingående enpartikeltillstånden får inte överstiga ett givet värde N tot, det vill säga A N i N tot. (8) i=1 Flerkroppstillstånden har en välbestämd paritet, det vill säga antingen + eller. Tack vare den harmoniska oscillatorns egenskaper kan detta uttryckas som att A i=1 l i modulo två skall ha en viss rest (antingen 0 eller 1). Flerkroppstillstånden har en välbestämd total projektion av rörelsemängdsmomenta, M. Detta innebär att projektionerna för enpartikeltillståndens enskilda rörelsemängdsmoment måste uppfylla A i = M. (9) i=1 Om ett enpartikeltillstånd i ett flerpartikeltillstånd byts, måste det därför verifieras att dessa villkor är uppfyllda för att det nya tillståndet skall vara giltigt och därmed ge upphov till en koppling. 0.3 Metod För att undersöka lämpligheten av att FPGA-implementera beräkningen av övergångstätheter, har vi utformat ett antal strategier för hur en FPGA kan användas för att identifiera alla kopplingar i en flerkroppsbas. Dessa implementerades på en FPGA, vilket i aktuellt fall skett med hjälp av ett högnivåprogrammeringsspråk, utvecklat av Maxeler. Därefter utvärderades dessa med avseende på korrekthet hos 2

Average execution time [ µs] Non dynamic energy bound, A=2 Non dynamic energy bound, A=4 Non dynamic energy bound, A=8 Dynamic energy bound, A=2 Dynamic energy bound, A=4 Dynamic energy bound, A=8 parity groups, A=2 parity groups, A=4 parity groups, A=8 Figur 1: Genomsnittliga exekveringstid per mångkroppstillstånd som funktion av storleken på mångkroppsbasen för olika algoritmer och partikelantal. de beräknade resultaten, samt prestandan hos denna beräkning. Till den FPGA-implementerade beräkningen utformades även en Matlab-kod för att kunna omvandla utdataformatet, från oreducerad till reducerad form. Prestandan för FPGA-beräkningen tillsammans med omvandlingen jämfördes slutligen med motsvarande prestanda för en kod som beräknar den reducerade representationen för övergångstätheter med hjälp av CPU-baserade beräkningskluster, Trdens, tillhandahållet av forskargruppen för subatomär fysik verksamma vid institutionen för fundamental fysik, Chalmers. 0.4 Algoritmer Inom ramen för detta arbete har vi utformat tre olika algoritmer: En algoritm, med vilken vi utför utbyten av enpartikeltillstånd, svarande mot olika α i i ett flerpartikeltillstånd parallellt, detta genom att använda en kedjad struktur av räknare till att parametrisera ersättande enpartikel-tillstånds kvanttal, utan några former av förberäknade kontrollsignaler. En variant av ovanstående algoritm där vi för varje flerpartikel-tillstånd beräknar den maximala energi som ett ersättande enpartikel-tillstånd kan ha för att energi-trunkeringsvillkoret inte skall brytas och använder detta för att begränsa antalet enpartikeltillstånds utbyten som testas. En algoritm där vi istället för att parametrisera ersättande enpartikeltillstånds kvanttal, betecknar enpartikeltillstånden med ett index, i en uppräkning. I denna uppräkning har de grupperats i grupper med samma paritet och värde på, samt med avtagande energi som en funktion av index, inom varje -paritets grupp. Om ett utbyte av enpartikel-tillstånd, inom en sådan grupp, sker från ett tillstånd med lägre till högre index, uppfylls såväl villkoret för paritet, projektion av magnetiskt moment samt energi. Att endast betrakta utbyten av enpartikel-tillstånd från lägre till högre index leder också till att De olika algoritmerna medför olika sannolikheter för att FPGA-hårdvaran, i en given klockcykel, skall finna ett nollskilt matriselement. De strategier som använder kontrollsignaler kommer generellt ha en högre sådan sannolikhet, vars fördelar dock måste vägas mot det extra behovet av beräkning av kontrollsignaler. 3

Average execution time per many body state [ µs] 10 5 10 4 10 3 A=2 A=4 A=8 Figur 2: Genomsnittlig exekveringstid för MATLAB att behandla alla nollskillda element med sitt ursprung ur ett och samma mångkroppstillstånd. 10 4 trdens, A=4 trdens, A=8 Average execution time [s] 10 3 10 2 10 7 Figur 3: Genomsnittlig exekveringstid för Trdens att utföra hela beräkningen av reducerade matrisrepresentationen. Även denna är per mångkroppstillstånd i basen som skickas in för att kunna jämföras med FPGA-värdena. 4

0.5 Implementation och utvärdering För att utvärdera prestandan har exekveringstiden för FPGA-implementationerna mätts då de behandlat tillstånden i flerkroppsbaser med olika trunkering och identifierat alla nollskilda matriselement. Resultaten från detta har sammanställts i figur 1 som en processhastighet, alltså en genomsnittlig exekveringstid per mångkroppstillstånd. Figuren visar att 2 10 5 4 10 6 nollskillda matriselement identifieras varje sekund för system av de studerade storleksordningarna. Från figur 1 framgår även att användandet av kontrollsignaler i implementationerna ökar effektiviteten upp till en faktor tio. Motsvarande processhastighet för beräkningen av den reducerade övergångstätheten, baserat på de nollskilda matris-element som FPGA-hårdvaran hittar, visas i figur 2. Denna är upp till 10 4 gånger långsammare än identifieringen av element. Dessa beräkningar har utförts på i MATLAB på en CPU. En jämförelse med motsvarande jämförelsetal för Trdens, återfunna i tabell 3, visar att identifikationen av nollskilda matriselement som sker på FPGA-hårdvaran, är runt två storleksordningar snabbare än den totala beräkningen med Trdens. Efterbehandlingen av datan, i och med omvandlingen till en reducerad representation på CPU, är dock betydligt långsammare varmed implementationen som en helhet blir långsammare än Trdens. Resultatet tyder på att om hela beräkningen kan utföras på en FPGA skulle den vara snabbare än Trdens då de extra beräkningarna inte skulle påverka exekveringstiden i någon större utsträckning, tack vare den pipelinade-beräkningsstrukturen. Clebsch-Gordan coefficienter kan behandlas genom förberäkna dessa och sedan utföra look-ups i minne. 0.6 Generaliseringar Naturliga generaliseringar av arbetet inom detta projekt utgörs av att utvidga de FPGA-implementerade algoritmerna till att kunna behandla system bestående av både neutroner och protoner, vilket ej gjordes i denna studie. Detta kan ske med rättframma metoder, varvid ett femte kvanttal, isospin, introduceras och, i fallet med de två första algoritmerna, behandlas analogt med de övriga kvanttalen. För den tredje algoritmen, erfordrar användandet av isospin att enpartikeltillstånden sorteras om. En annan möjlig generalisering utgörs av att utforma FPGA-algoritmer som identifierar nollskilda matriselement för två- och trekropps-operatorer, vilka behövs för att beskriva många fysikaliska egenskaper. Dessa operatorer kopplar tillstånd där inte bara ett, utan två respektive tre enpartikeltillstånd skiljer mellan flerkroppstillstånden. För att göra detta kan algoritmerna ett och två användas, fast där ett större antal storheter parametriseras. Istället för att låta denna parametrisering ske med räknare vore det dock bättre att lagra egenskaper relaterade till nya enpartikeltillstånd i ROM-minne, på FPGA-hårdvaran. Vinsterna med att i likhet med den andra algoritmen använda förberäknade kontrollsignaler för att öka sannolikheten att en klockcykel hittar ett nollskilt matriselement ökar också. 0.7 Slutsats Studien visar att identifikationen av nollskilda element, på en FPGA, kan ske med god prestanda jämfört med prestandan för Trdens. Detta gäller trots att de utförda implementationerna var drabbade av I/O-begränsningar som skulle kunna lösas genom att överge Maxelers programmeringsinterface, till fördel för ett HDL. Det visade sig dock att omvandlingen av utdatan från FPGA-hårdvaran, till en reducerad representation av övergångstätheten, var en större flaskhals i beräkningen, som även gjorde att dess övergripande prestanda blev sämre än för Trdens. Detta beror troligtvis på att denna del av beräkningen implementerats i MATLAB och inte varit föremål för optimering. Det finns även förutsättningar för att utvidga den del av beräkningen som utförs på FPGA-hårdvaran till att även inbegripa en större del av övergångstäthetens omvandling till en reducerad representation. Eftersom FPGA-hårdvaran har en pipeline-beräkningsstruktur ökar tillägget av de extra beräkningarna inte exekveringstiden markant. Detta pekar på att det borde vara möjligt att använda en FPGA för att accelerera beräkningen av övergångstätheter trots att studiens implementationer inte explicit kunnat påvisa detta. 5