Biokemi. SF1538 Projekt i simuleringsteknik. Skolan för teknikvetenskap. Introduction. Michael Hanke. Kemiska reaktioner

1 (35) : Biokemi Skolan för teknikvetenskap SF1538 Projekt i simuleringsteknik

2 (35) Innehåll : 1 2 3 : 4 5 6 7 8

3 (35) Introduktion : Biokemiska är basen till livet Undersökningen av reaktionskedjor kallas for systembiologi Vanligtvis beskrivs meningsfulla biologiska system genom reaktionskedjor med många (10... 1000 eller fler).

4 (35) En makroskopisk model : Vi antar att vi har många så att en (kontinuerlig) beskrivning med hjälp av koncentrationer är meningsful En mol innehåller N A 6, 022 10 23 (Avogadros tal) En mol av en ideal gas i normaltillstånded intar 22,4 l Allmänt beror koncentrationen av substanser i reagerande system både på tiden punkt i volymen. Vi antar att volymen är well-stirred så att koncentrationen bara beror på tiden.

5 (35) lag : Grundläggande antagande Sannolikheten att en reaktion förekommer är proportionell mot sannolikheten att ett antal reaktantmolekyl i rätt relation kolliderar. Corollary Sannolikheten för reaktionen är proportionell mot koncentrationen av reaktander. Notera att proportionalitetskonstanten k beror väldigt starkt på omgivande förhållanden (temperatur, tryck, etc)

6 (35) Ex: Förbränning av kolmonoxid : CO + O CO 2 Dubbelpilar indikerar att reaktionen är reversibel. Så faktiskt har vi två : R 1 : CO + O CO 2 R 2 : CO 2 CO + O Vi har tre substanser med concentrationer [CO], [O], [CO 2 ] Den första reaktionen leder till (d/dt)[co] = k 1 [CO] [O] (d/dt)[o] = k 1 [CO] [O] (d/dt)[co 2 ] = +k 1 [CO] [O] Analog får vi för den andra reaktionen (d/dt)[co] = +k 2 [CO 2 ] (d/dt)[o] = +k 2 [CO 2 ] (d/dt)[co 2 ] = k 2 [CO 2 ]

7 (35) Exempel (cont) : Eftersom alla händer samtidigt beskrivs hela balansen genom summan av alla individuella reaktionsbalanser: (d/dt)[co] = k 1 [CO] [O] + k 2 [CO 2 ] (d/dt)[o] = k 1 [CO] [O] + k 2 [CO 2 ] (d/dt)[co 2 ] = +k 1 [CO] [O] k 2 [CO 2 ]

8 (35) Allmän formulering : R r (r = 1,..., M) S j substanser (j = 1,..., N) c j = [S j ] koncentration av substansen S j k r reaktionskonstant i reaktion R r ν + rj, ν rj stökiometriska koefficienter Vi undersöker ett kemiskt system med na ν r,1 S 1 + ν r,2 S 2 + + ν r,n S N ν r,1 + S 1 + ν r,2 + S 2 + + ν + r,n S N Obs: Reversibla beskrivs genom två individuella!

9 (35) lag : Vårt grundläggande antagande leder till reaktionssannolikheten i reaktion R r ω r (c 1,..., c N ) = k r ν rk >0 c Nettobidraget av reaktion R r till omsättningen av substansen S j blir då d dt c j = ν rj ω r (c 1,..., c N ) med ν rj = ν + rj ν rj Massbalansen i systemet beskrivs sedan genom ett system av ode, d M dt c j = ν rj ω r (c 1,..., c N ), j = 1,..., N. r=1 ν rk k

10 (35) lag (cont) : Systemets tillstånd beskrivs fullständigt med hjälp av vektorn av alla koncentrationer C(t) = (c 1 (t),..., c N (t)) Om man känner tillståndet C(t 0 ) vid en viss tidspunkt t 0, så är systemets tillstånd känt för all framtid. Systemet är deterministiskt!

11 (35) : Reaktioner: Exempel: Produktion degradering A k1, k2 A Stökiometriska koefficienter: ν 11 = 1, ν+ 21 = 1 Differentialekavation för a = [A]: Lösning: d dt a = k 1a 1 + k 2 a 0 = k 1 a + k 2. a(t) = ( a(0) k ) 2 a(0) exp( k 1 t) + k 2 k 1 k 1

12 (35) Exempel (cont) Med k 1 = 0.1, k 2 = 1, a(0) = 0 får vi följande lösning: :

13 (35) system : Många substanser i en biologisk cell finns bara i väldigt få exemplar (kanske 10 1,..., 10 6 ) I dessa fall är begreppet koncentration tveksamt. Vi kommer att a systemets evolution genom att räkna na.

14 (35) En stokastisk modell : Låt A + B C vara en bimolekylär reaktion av två substanser A, B som ger C. Vi antar som förr massverkans lag: sannolikheten för en reaktion är proportionell mot antalet som behövs som reaktanter. Substanser beskrivs genom antalet av varje substans: Låt a = A, b = B c = C. Tillståndsvektorn x = (a, b, c) N 3 är en tupel av icke-negativa heltal.

15 (35) En stokastisk modell (cont) : Låt ν r = ( 1, 1, +1) vektorn av stökiometriska koefficienter. Propensity ω r (x) beskriver sannolikheten per tidsenhet att reaktionen R r händer. I vårt exempel, ω r (x) = k 1 ab. Om reaktionen händer så förändras tillståndet enligt x neu = x alt + ν r. Modellen är ett exempel för en kontinuerlig i tiden diskret i tillståndet Markovprocess

16 (35) Markovprocesser : Definition Låt (X (t)) t 0 vara en stokastisk process med kontinuerlig tid diskreta värden. Processen är en Markovprocess om P(X (t n +T ) X (t 1 ) = x 1,..., X (t n ) = x n ) = P(X (t n +T ) X (t n ) = x n ) för alla t > 0, 0 < t 1 < < t n, x 1,..., x n. Konsekvens: Framtiden vid t > t n beror bara på tillståndet vid t n men inte på tidigare tilstånd.

17 (35) Propensities : För enkla kan man visa att propensity ω ser ut som: reaktionstyp propensity S 1 k r x 1 S 1 + S 2 k r x 1 x 2 2S 1 1 k r 2 x 1(x 1 1) Obs: Konstanterna k r är inte desamma som för makromodellen!

18 (35) En stokastisk model: allmän formulering : R r (r = 1,..., M) S j substanser (j = 1,..., N) X j (t) antalet molekyl av substansen S j (j = 1,..., N), X(t) = (X 1 (t),..., X N (t)) ν r stökiometrivektorer (r = 1,..., M) ω r (x) propensity-funktion (r = 1,..., M) Egenskap Vektorn X(t) är en diskret stokastisk variabel!

19 (35) : a variabler karakteriseras av sannolikhetsfördelning. Eftersom variabeln är diskret är det meningsfult att fråga efter sannolikheten P(x, t) att systemet är i tillståndet x vid en viss tidspunkt. Låt P(x, t x 0, t 0 ) vara sannolikheten att X(t) = x om X(t 0 ) = x 0. (betingad sannolikhet) Man kan visa att (, CME) P(x, t x 0, t 0 ) t M ( ) = ωr (x ν r P(x νr, t x 0, t 0 ) ω r (x)p(x, t x 0, t 0 ) ) r=1 }{{}}{{} inflöde utflöde Om vi vet lösningen P(x, t x 0, t 0 ) så kan vi beräkna andra intressanta värden, t ex väntevärdet, variansen, högre moment, mm

20 (35) (cont) : Eftersom P(x, t 0 x 0, t 0 ) = { 1, om x = x 0, 0, annars, CME är ett system av ordinära differentialekvationer där P(x, x 0, t 0 ) är en skalär funktion (indexerad med tillståndsvektorn x. Antalet ekvationer är lika med dimensionen av tillståndsrummet. Exempel: Antar att vi har ett system med 10 olika substanser som var en kan förekommer med max 100 exemplar. Antalet ekvationer blir 100 10 = 10 20!!

21 (35) : Reaktioner:A k1, : Exempel k2 A Låt p n (t) = P(n, t n 0, t 0 ), p 1 (t) 0 d dt p n = k 1 (n + 1)p n+1 k 1 np n + k 2 p n 1 k 2 p n, n = 1, 2,... Antalet partiklar är obegränsat! Därför har vi ett ode-system med oändligt många skalära ekvationer! Väntevärdet E(t) varians V (t) ges genom E(t) = np n (t), V (t) = (n E(t)) 2 p n (t) n=0 n=0 Man kan visa: d dt E = k 1E + k 2, d dt V (t) = 2k 1V + k 1 E + k 2

22 (35) Exempel (cont) Med k 1 = 0.1, k 2 = 1, A(0) = 0 får vi följande lösning i jämviksläge (t ): :

23 (35) : simuleringsalgoritm Iden Simulera enstaka trajektorier med Monte Carlo-proceduren! Algoritm (princip) för en trajektorie 1 Sätt x = x 0, t = t 0. 2 Välj slumpmässigt tiden τ > 0 till nästa reaktionen. 3 Välj index r till nästa reaktion. 4 Sätt x = x + ν r. 5 Sätt t = t + τ. 6 Om t < T f gå till steg 2. Problem: Hur bestämmer man slumptalen τ r?

24 (35) SSA: Gillespie algoritm : Låt a 0 (x) = N ω r (x). Man kan visa att τ(x)är exponentiellt fördelat med medelvärdet a 0 (x) 1 : P(τ < t) = 1 exp( ta 0 (x)). Nästa reaktionen R(x)är en diskret variable med sannolikheten P(R = r X = x) = ω r (x)/a 0 (x). r=1 Därmed gäller F (r; x) := P(R r) = 1 a 0(x) r ρ=1 ω ρ(x).

25 (35) SSA: Gillespie algoritm : 1 Sätt x = x 0, t = t 0. 2 Beräkna a 0 (x) = N r=1 ω r (x). 3 Bestäm ett jämtfördelat slumptal u 1 U(0, 1). 4 Sätt τ = ln u 1 /a 0 (x). 5 Bestäm ett jämtfördelat slumptal u 2 U(0, 1). 6 Bestäm r så att F (r 1, x) < u 2 F (r, x). 7 Sätt x = x + ν r. 8 Sätt t = t + τ. 9 Om t < T f gå till steg 2.

26 (35) Vi tar vårt standardexempel: Reaktioner:A k1, k2 A Med k 1 = 0.1, k 2 = 1, A(0) = 0 får vi: Exempel :

27 (35) : Makroskopisk mikroskopisk model Man kan fråga vad händer med medelvärdet av antalet partiklar? CME leder till d M dt E[X ] = ν r E[ω r (X )] r=1 Om vi har bara linjära S j, ω r är linjär, vi får M d dt E[X ] = ν r ω r (E[X ]) r=1 som är ett slutet system! Beräkna gränsövergång n j där n j /V = const = c j. (koncentrationen) Under realistiska antaganden kan man härleda gränsvärdet (reaction rate equation) d M dt C = ν r ω r (C) r=1

28 (35) : Exempel1: Reaktioner: Behövs mikroskopisk model överhuvudtaget? A + A k1 C A + B k2 D (1) Propensities är ickelinjära i det här fallet! Modifikation: Inkludera produktion av A, B. Dessutom är vi inte intresserad av produkterna C.D: ODE beskrivning A + A k1 A + B k2 (2) k3 A da dt = 2k 1a 2 k 2 ab + k 3 db dt = k 2ab + k 4 k4 B (3)

Exempel 1: Jämviktsläge Parametrarna: k 1 = 10 3, k 2 = 10 2, k 3 = 1.2, k 4 = 1, A(0) = B(0) = 0. : Antalet molekyl av A B är korrelerade i jämviktsläget. 29 (35)

Exempel 1 (cont) : Bilden visar marginalfördelning av A Medelvärdet för antalet molekyl A 9.6 Jämnviktsläge för ode-systemet: a = 10 30 (35)

31 (35) Exempel: Schlögls system : Reaktioner: 2A k1 k2 3A, k3 k4 A Ode: da dt = k 2a 3 + k 1 a 2 k 4 a + k 3 Parameter: k 1 = 0.18min 1, k 2 = 2.5 10 4 min 1,k 3 = 2200min 1,k 1 = 37.5min 1. Ode:n har två stabila (vid 100 400) jämviktslägen ett instabilt sådant

32 (35) Schlögls system (cont) :

33 (35) Schlögls system :

34 (35) : Att snabba upp SSA: SSA algoritmen simulerar alla individuella steg för steg: Det tar väldigt mycket tid att simulera en enstaka trajektorie. Fråga: Kan man inte sammanfatta ett antal individuella genomför de i ett (större) steg? Egenskap: Låt τ > 0 vara steglängden propensity ω r för reaktionen R r vara konstant. Sedan är antalet individuella av R r i intervallet [t, t + τ) Poissonfödelat P(ω r τ) med medlevärdet ω r τ. Ide: Om X (t) = x τ är så litet att ω r (x) const i [t, t + τ), så blir antalet individuella nästan Poissonfördelat. Därför kan vi approximera X (t + τ) x + M P(ω r (x)τ)ν r. r=1 Approximationskvaliten beror på hur man effektivt väljer τ = τ(x). (Cao, Gillespie, Petzold, J Chem Phys, 124(2006),044109)

35 (35) : Modellering med hjälp av massverkans lag Makroskopisk modell: Koncentrationer leder till ode För att a biologiska system med få behövs en stokastisk modell masterekvationen Gillespies algoritm: SSA τ- leaping kan användas för att snabba upp algoritmen Note: Alla exempel är inspirerade av: R. Erkban, S.J. Chapman, P.K. Maini: A practical guide to stastic simulations of reaction diffusion processes. http://people.maths.ox.ac.uk/erban/education/streacdiff.pdf