Biokemi. SF1538 Projekt i simuleringsteknik. Skolan för teknikvetenskap. Introduction. Michael Hanke. Kemiska reaktioner

Relevanta dokument
Problemlösning 2 Stokastisk simulering., Problemlösning 2 Stokastisk simulering 1/13

Monte Carlo-metoder. Bild från Monte Carlo

Tentamen i Beräkningsvetenskap II, 5.0 hp,

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Systemteknik/Processreglering F3

SF1544 LABORATION 2 INTEGRATION, MONTE-CARLO OCH BLACK-SCHOLES EKVATION FÖR OPTIONER

Kinetik. Föreläsning 1

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

TAMS14/36 SANNOLIKHETSLÄRA GK Poissonprocessen (komplettering) Torkel Erhardsson 14 maj 2010

Kinetik, Föreläsning 2. Patrik Lundström

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Kinetik. Föreläsning 2

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Biologi: en utmaning för Numerisk Analys

4 Diskret stokastisk variabel

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Formler och tabeller till kursen MSG830

Repetition F4. Lunds universitet / Naturvetenskapliga fakulteten / Kemiska institutionen / KEMA00


Problemsamling i Sannolikhetsteori

Avsnitt 12.1 Reaktionshastigheter Kemisk kinetik Kapitel 12 Kapitel 12 Avsnitt 12.1 Innehåll Reaktionshastigheter Reaktionshastighet = Rate

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Kapitel 12. Kemisk kinetik

SF1911: Statistik för bioteknik

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

SF1901: Sannolikhetslära och statistik

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Tentamen i Beräkningsvetenskap II, 5.0 hp,

Fö relä sning 2, Kö system 2015

TAMS79: Föreläsning 10 Markovkedjor

Kap 2. Sannolikhetsteorins grunder

Föreläsning 7: Punktskattningar

Markovprocesser SF1904

Grundläggande matematisk statistik

Markovprocesser SF1904

Betingning och LOTS/LOTV

SF1633, Differentialekvationer I Tentamen, torsdagen den 7 januari Lösningsförslag. Del I

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kinetik, Föreläsning 1. Patrik Lundström

d dx xy ( ) = y 2 x, som uppfyller villkoret y(1) = 1. x, 0 x<1, y(0) = 0. Bestäm även y( 2)., y(0) = 0 har entydig lösning.

Grundläggande matematisk statistik

Demonstration av laboration 2, SF1901

Markovprocesser SF1904

TMS136. Föreläsning 4

Markovprocesser SF1904

Föreläsning 7: Punktskattningar

Statistisk analys av komplexa data

Hur måttsätta osäkerheter?

Tentamen i Beräkningsvetenskap II, 5.0 hp, Del A

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Övning 1 Sannolikhetsteorins grunder

SF1901 Sannolikhetsteori och statistik I

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

y(0) = e + C e 1 = 1

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

Några extra övningsuppgifter i Statistisk teori

En trafikmodell. Leif Arkeryd. Göteborgs Universitet. 0 x 1 x 2 x 3 x 4. Fig.1

ÖVNINGSUPPGIFTER KAPITEL 9

Stokastiska processer med diskret tid

Statistiska begrepp och metoder som används i Successivprincipen

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Gaser: ett av tre aggregationstillstånd hos ämnen. Flytande fas Gasfas

= = i K = 0, K =

Markovprocesser SF1904

Tentamen i Kemisk Termodynamik kl 14-19

Kapitel 5. Gaser. är kompressibel, är helt löslig i andra gaser, upptar jämt fördelat volymen av en behållare, och utövar tryck på sin omgivning.

Övning 1(a) Vad du ska kunna efter denna övning. Problem, nivå A. Redogöra för begreppen diskret och kontinuerlig stokastisk variabel.

Kemisk Dynamik för K2, I och Bio2

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

F10 Kap 8. Statistikens grunder, 15p dagtid. Binomialfördelningen 4. En räkneregel till. Lite repetition HT Sedan

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Gaser: ett av tre aggregationstillstånd hos ämnen. Flytande fas Gasfas

Repetition F12. Lunds universitet / Naturvetenskapliga fakulteten / Kemiska institutionen / KEMA00

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Lärmål Sannolikhet, statistik och risk 2015

VI. Reella gaser. Viktiga målsättningar med detta kapitel. VI.1. Reella gaser

SF1901: Sannolikhetslära och statistik

Tentamen MVE301 Sannolikhet, statistik och risk

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Dagens teman. Linjära ODE-system av ordning 1:

Föreläsning 7: Punktskattningar

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Oberoende stokastiska variabler

= y(0) för vilka lim y(t) är ändligt.

Stokastiska processer och simulering I 24 maj

DIFFERENTIALEKVATIONER. INLEDNING OCH GRUNDBEGREPP

ÖVNINGSUPPGIFTER KAPITEL 9

Kap 3: Diskreta fördelningar

4.1 Grundläggande sannolikhetslära

DIFFERENTIALEKVATIONER. INLEDNING OCH GRUNDBEGREPP

Föreläsning 12: Repetition

Härledning av Black-Littermans formel mha allmänna linjära modellen

KEM A02 Allmän- och oorganisk kemi. KINETIK 2(2) A: Kap

Om existens och entydighet av lösningar till ordinära differentialekvationer

Transkript:

1 (35) : Biokemi Skolan för teknikvetenskap SF1538 Projekt i simuleringsteknik

2 (35) Innehåll : 1 2 3 : 4 5 6 7 8

3 (35) Introduktion : Biokemiska är basen till livet Undersökningen av reaktionskedjor kallas for systembiologi Vanligtvis beskrivs meningsfulla biologiska system genom reaktionskedjor med många (10... 1000 eller fler).

4 (35) En makroskopisk model : Vi antar att vi har många så att en (kontinuerlig) beskrivning med hjälp av koncentrationer är meningsful En mol innehåller N A 6, 022 10 23 (Avogadros tal) En mol av en ideal gas i normaltillstånded intar 22,4 l Allmänt beror koncentrationen av substanser i reagerande system både på tiden punkt i volymen. Vi antar att volymen är well-stirred så att koncentrationen bara beror på tiden.

5 (35) lag : Grundläggande antagande Sannolikheten att en reaktion förekommer är proportionell mot sannolikheten att ett antal reaktantmolekyl i rätt relation kolliderar. Corollary Sannolikheten för reaktionen är proportionell mot koncentrationen av reaktander. Notera att proportionalitetskonstanten k beror väldigt starkt på omgivande förhållanden (temperatur, tryck, etc)

6 (35) Ex: Förbränning av kolmonoxid : CO + O CO 2 Dubbelpilar indikerar att reaktionen är reversibel. Så faktiskt har vi två : R 1 : CO + O CO 2 R 2 : CO 2 CO + O Vi har tre substanser med concentrationer [CO], [O], [CO 2 ] Den första reaktionen leder till (d/dt)[co] = k 1 [CO] [O] (d/dt)[o] = k 1 [CO] [O] (d/dt)[co 2 ] = +k 1 [CO] [O] Analog får vi för den andra reaktionen (d/dt)[co] = +k 2 [CO 2 ] (d/dt)[o] = +k 2 [CO 2 ] (d/dt)[co 2 ] = k 2 [CO 2 ]

7 (35) Exempel (cont) : Eftersom alla händer samtidigt beskrivs hela balansen genom summan av alla individuella reaktionsbalanser: (d/dt)[co] = k 1 [CO] [O] + k 2 [CO 2 ] (d/dt)[o] = k 1 [CO] [O] + k 2 [CO 2 ] (d/dt)[co 2 ] = +k 1 [CO] [O] k 2 [CO 2 ]

8 (35) Allmän formulering : R r (r = 1,..., M) S j substanser (j = 1,..., N) c j = [S j ] koncentration av substansen S j k r reaktionskonstant i reaktion R r ν + rj, ν rj stökiometriska koefficienter Vi undersöker ett kemiskt system med na ν r,1 S 1 + ν r,2 S 2 + + ν r,n S N ν r,1 + S 1 + ν r,2 + S 2 + + ν + r,n S N Obs: Reversibla beskrivs genom två individuella!

9 (35) lag : Vårt grundläggande antagande leder till reaktionssannolikheten i reaktion R r ω r (c 1,..., c N ) = k r ν rk >0 c Nettobidraget av reaktion R r till omsättningen av substansen S j blir då d dt c j = ν rj ω r (c 1,..., c N ) med ν rj = ν + rj ν rj Massbalansen i systemet beskrivs sedan genom ett system av ode, d M dt c j = ν rj ω r (c 1,..., c N ), j = 1,..., N. r=1 ν rk k

10 (35) lag (cont) : Systemets tillstånd beskrivs fullständigt med hjälp av vektorn av alla koncentrationer C(t) = (c 1 (t),..., c N (t)) Om man känner tillståndet C(t 0 ) vid en viss tidspunkt t 0, så är systemets tillstånd känt för all framtid. Systemet är deterministiskt!

11 (35) : Reaktioner: Exempel: Produktion degradering A k1, k2 A Stökiometriska koefficienter: ν 11 = 1, ν+ 21 = 1 Differentialekavation för a = [A]: Lösning: d dt a = k 1a 1 + k 2 a 0 = k 1 a + k 2. a(t) = ( a(0) k ) 2 a(0) exp( k 1 t) + k 2 k 1 k 1

12 (35) Exempel (cont) Med k 1 = 0.1, k 2 = 1, a(0) = 0 får vi följande lösning: :

13 (35) system : Många substanser i en biologisk cell finns bara i väldigt få exemplar (kanske 10 1,..., 10 6 ) I dessa fall är begreppet koncentration tveksamt. Vi kommer att a systemets evolution genom att räkna na.

14 (35) En stokastisk modell : Låt A + B C vara en bimolekylär reaktion av två substanser A, B som ger C. Vi antar som förr massverkans lag: sannolikheten för en reaktion är proportionell mot antalet som behövs som reaktanter. Substanser beskrivs genom antalet av varje substans: Låt a = A, b = B c = C. Tillståndsvektorn x = (a, b, c) N 3 är en tupel av icke-negativa heltal.

15 (35) En stokastisk modell (cont) : Låt ν r = ( 1, 1, +1) vektorn av stökiometriska koefficienter. Propensity ω r (x) beskriver sannolikheten per tidsenhet att reaktionen R r händer. I vårt exempel, ω r (x) = k 1 ab. Om reaktionen händer så förändras tillståndet enligt x neu = x alt + ν r. Modellen är ett exempel för en kontinuerlig i tiden diskret i tillståndet Markovprocess

16 (35) Markovprocesser : Definition Låt (X (t)) t 0 vara en stokastisk process med kontinuerlig tid diskreta värden. Processen är en Markovprocess om P(X (t n +T ) X (t 1 ) = x 1,..., X (t n ) = x n ) = P(X (t n +T ) X (t n ) = x n ) för alla t > 0, 0 < t 1 < < t n, x 1,..., x n. Konsekvens: Framtiden vid t > t n beror bara på tillståndet vid t n men inte på tidigare tilstånd.

17 (35) Propensities : För enkla kan man visa att propensity ω ser ut som: reaktionstyp propensity S 1 k r x 1 S 1 + S 2 k r x 1 x 2 2S 1 1 k r 2 x 1(x 1 1) Obs: Konstanterna k r är inte desamma som för makromodellen!

18 (35) En stokastisk model: allmän formulering : R r (r = 1,..., M) S j substanser (j = 1,..., N) X j (t) antalet molekyl av substansen S j (j = 1,..., N), X(t) = (X 1 (t),..., X N (t)) ν r stökiometrivektorer (r = 1,..., M) ω r (x) propensity-funktion (r = 1,..., M) Egenskap Vektorn X(t) är en diskret stokastisk variabel!

19 (35) : a variabler karakteriseras av sannolikhetsfördelning. Eftersom variabeln är diskret är det meningsfult att fråga efter sannolikheten P(x, t) att systemet är i tillståndet x vid en viss tidspunkt. Låt P(x, t x 0, t 0 ) vara sannolikheten att X(t) = x om X(t 0 ) = x 0. (betingad sannolikhet) Man kan visa att (, CME) P(x, t x 0, t 0 ) t M ( ) = ωr (x ν r P(x νr, t x 0, t 0 ) ω r (x)p(x, t x 0, t 0 ) ) r=1 }{{}}{{} inflöde utflöde Om vi vet lösningen P(x, t x 0, t 0 ) så kan vi beräkna andra intressanta värden, t ex väntevärdet, variansen, högre moment, mm

20 (35) (cont) : Eftersom P(x, t 0 x 0, t 0 ) = { 1, om x = x 0, 0, annars, CME är ett system av ordinära differentialekvationer där P(x, x 0, t 0 ) är en skalär funktion (indexerad med tillståndsvektorn x. Antalet ekvationer är lika med dimensionen av tillståndsrummet. Exempel: Antar att vi har ett system med 10 olika substanser som var en kan förekommer med max 100 exemplar. Antalet ekvationer blir 100 10 = 10 20!!

21 (35) : Reaktioner:A k1, : Exempel k2 A Låt p n (t) = P(n, t n 0, t 0 ), p 1 (t) 0 d dt p n = k 1 (n + 1)p n+1 k 1 np n + k 2 p n 1 k 2 p n, n = 1, 2,... Antalet partiklar är obegränsat! Därför har vi ett ode-system med oändligt många skalära ekvationer! Väntevärdet E(t) varians V (t) ges genom E(t) = np n (t), V (t) = (n E(t)) 2 p n (t) n=0 n=0 Man kan visa: d dt E = k 1E + k 2, d dt V (t) = 2k 1V + k 1 E + k 2

22 (35) Exempel (cont) Med k 1 = 0.1, k 2 = 1, A(0) = 0 får vi följande lösning i jämviksläge (t ): :

23 (35) : simuleringsalgoritm Iden Simulera enstaka trajektorier med Monte Carlo-proceduren! Algoritm (princip) för en trajektorie 1 Sätt x = x 0, t = t 0. 2 Välj slumpmässigt tiden τ > 0 till nästa reaktionen. 3 Välj index r till nästa reaktion. 4 Sätt x = x + ν r. 5 Sätt t = t + τ. 6 Om t < T f gå till steg 2. Problem: Hur bestämmer man slumptalen τ r?

24 (35) SSA: Gillespie algoritm : Låt a 0 (x) = N ω r (x). Man kan visa att τ(x)är exponentiellt fördelat med medelvärdet a 0 (x) 1 : P(τ < t) = 1 exp( ta 0 (x)). Nästa reaktionen R(x)är en diskret variable med sannolikheten P(R = r X = x) = ω r (x)/a 0 (x). r=1 Därmed gäller F (r; x) := P(R r) = 1 a 0(x) r ρ=1 ω ρ(x).

25 (35) SSA: Gillespie algoritm : 1 Sätt x = x 0, t = t 0. 2 Beräkna a 0 (x) = N r=1 ω r (x). 3 Bestäm ett jämtfördelat slumptal u 1 U(0, 1). 4 Sätt τ = ln u 1 /a 0 (x). 5 Bestäm ett jämtfördelat slumptal u 2 U(0, 1). 6 Bestäm r så att F (r 1, x) < u 2 F (r, x). 7 Sätt x = x + ν r. 8 Sätt t = t + τ. 9 Om t < T f gå till steg 2.

26 (35) Vi tar vårt standardexempel: Reaktioner:A k1, k2 A Med k 1 = 0.1, k 2 = 1, A(0) = 0 får vi: Exempel :

27 (35) : Makroskopisk mikroskopisk model Man kan fråga vad händer med medelvärdet av antalet partiklar? CME leder till d M dt E[X ] = ν r E[ω r (X )] r=1 Om vi har bara linjära S j, ω r är linjär, vi får M d dt E[X ] = ν r ω r (E[X ]) r=1 som är ett slutet system! Beräkna gränsövergång n j där n j /V = const = c j. (koncentrationen) Under realistiska antaganden kan man härleda gränsvärdet (reaction rate equation) d M dt C = ν r ω r (C) r=1

28 (35) : Exempel1: Reaktioner: Behövs mikroskopisk model överhuvudtaget? A + A k1 C A + B k2 D (1) Propensities är ickelinjära i det här fallet! Modifikation: Inkludera produktion av A, B. Dessutom är vi inte intresserad av produkterna C.D: ODE beskrivning A + A k1 A + B k2 (2) k3 A da dt = 2k 1a 2 k 2 ab + k 3 db dt = k 2ab + k 4 k4 B (3)

Exempel 1: Jämviktsläge Parametrarna: k 1 = 10 3, k 2 = 10 2, k 3 = 1.2, k 4 = 1, A(0) = B(0) = 0. : Antalet molekyl av A B är korrelerade i jämviktsläget. 29 (35)

Exempel 1 (cont) : Bilden visar marginalfördelning av A Medelvärdet för antalet molekyl A 9.6 Jämnviktsläge för ode-systemet: a = 10 30 (35)

31 (35) Exempel: Schlögls system : Reaktioner: 2A k1 k2 3A, k3 k4 A Ode: da dt = k 2a 3 + k 1 a 2 k 4 a + k 3 Parameter: k 1 = 0.18min 1, k 2 = 2.5 10 4 min 1,k 3 = 2200min 1,k 1 = 37.5min 1. Ode:n har två stabila (vid 100 400) jämviktslägen ett instabilt sådant

32 (35) Schlögls system (cont) :

33 (35) Schlögls system :

34 (35) : Att snabba upp SSA: SSA algoritmen simulerar alla individuella steg för steg: Det tar väldigt mycket tid att simulera en enstaka trajektorie. Fråga: Kan man inte sammanfatta ett antal individuella genomför de i ett (större) steg? Egenskap: Låt τ > 0 vara steglängden propensity ω r för reaktionen R r vara konstant. Sedan är antalet individuella av R r i intervallet [t, t + τ) Poissonfödelat P(ω r τ) med medlevärdet ω r τ. Ide: Om X (t) = x τ är så litet att ω r (x) const i [t, t + τ), så blir antalet individuella nästan Poissonfördelat. Därför kan vi approximera X (t + τ) x + M P(ω r (x)τ)ν r. r=1 Approximationskvaliten beror på hur man effektivt väljer τ = τ(x). (Cao, Gillespie, Petzold, J Chem Phys, 124(2006),044109)

35 (35) : Modellering med hjälp av massverkans lag Makroskopisk modell: Koncentrationer leder till ode För att a biologiska system med få behövs en stokastisk modell masterekvationen Gillespies algoritm: SSA τ- leaping kan användas för att snabba upp algoritmen Note: Alla exempel är inspirerade av: R. Erkban, S.J. Chapman, P.K. Maini: A practical guide to stastic simulations of reaction diffusion processes. http://people.maths.ox.ac.uk/erban/education/streacdiff.pdf