Analys av jämviktslägen till differentialekvationer

Analys 360 En webbaserad analyskurs Ordinära differentialekvationer Analys av jämviktslägen till differentialekvationer Anders Källén MatematikCentrum LTH anderskallen@gmail.com

Analys av jämviktslägen till differentialekvationer 1 (11) 1 Introduktion I det här kapitlet ska vi diskutera olika typer av jämviktslägen till s.k. autonoma differentialekvationer x (t) = f(x(t)) där f är en kontinuerligt deriverbar funktion. Ordet autonom syftar på att högerledet endast beror av t genom x(t), dvs det är x(t) som entydigt bestämmer x (t), oavsett vilken tidpunkten är. En viktig konsekvens av det är att om vi låter x(t, x 0 ) beteckna lösningen på problemet x (t) = f(x(t)), x(0) = x 0. (1) Vi ser då att funktionen t x(t + s, x 0 ) löser samma differentialekvation, men nu är värdet då t = 0 lika med x(s, x 0 ). Med andra ord: x(t + s, x 0 ) = x(t, x(s, x 0 )). (2) Denna formel innebär att differentialekvationen är tidshomogen, d.v.s. det spelar ingen roll närifrån vi börjar räkna tiden. Ett jämviktsläge till ekvationen x = f(x) är en konstant lösning x(t) = x. För en sådan gäller att x = 0 och alltså att f(x ) = 0. Om det gäller att det finns en omgivning U av x sådan att när x(0) ligger i U så gäller att x(t) x då t, så sägs jämviktsläget vara asymptotiskt stabilt. Ett lite svagare villkor är att kräva att det för varje omgivning U av x finns en omgivning V av x sådan att om x(0) V så gäller att x(t) ligger i U för alla t > 0. När så är fallet säger man att jämviktläget är stabilt. Ett jämviktsläge som inte är stabilt sägs vara instabilt. Målet med det här kapitlet är att undersöka hur man kan avgöra stabiliteten av ett jämviktsläge. Vi ska dock inte göra det för skalära ekvationer, där det räcker att undersöka grafen för funktion f för att dra sådana slutsatser, utan i situationen när f : R n R med f(x) = (f 1, (x),..., f n (x)), x = (x 1,..., x n ). Allt vi sagt ovan gäller utan ändring för sådana autonoma system av differentialekvationer. Innan vi går in på analysen av jämviktslägen till sådana autonoma system ska vi betrakta en speciell typ av sådana system, nämligen de för vilka gäller att f(x) = grad F (x) där F : R n R är en två gånger kontinuerligt deriverbar funktion. Inom fysiken kallas sådana system konservativa och funktionen F kallas en potentialfunktion. Vi ser det gärna mer som att differentialformen i f i(x)dx i är exakt med primitiv funktion F. För ett konservativt system gäller att en jämviktpunkt x uppfyller grad F (x ) = 0, vilket betyder att den är en stationär punkt till funktionen F. Vidare vet vi att om x (t) = grad F (x(t)), så gäller att x(t) hela tiden rör sig i den riktning i vilken F ökar mest. Att undersöka stabilitet av ett jämviktsläge till et konservativt system blir därför ekvivalent med att undersöka vilken typ en stationär punkt till dess primitiva funktion är av. Så diskussionen i det här kapitlet är en generalisering av den diskussionen.

Analys av jämviktslägen till differentialekvationer 2 (11) 2 Undersökning av en skalär ekvation Först några ord om fallet n = 1. Det är i princip mycket enklare än högredimensionella fall, eftersom vi kan rita upp grafen till funktionen i högerledet och sedan avläsa hur lösningen beter sig från detta. Mer precist, låt x (t) = f(x(t)) och rita upp grafen för f mot x, men kalla y-axeln för x. Jämviktslägena är då de punkter där grafen till f skär x-axeln och genom att se hur den skärningen sker kan vi oftast lätt avgöra om jämviktsläget är stabilt eller inte. I figuren till höger har vi t.ex. ett jämviktsläge i punkten a. När grafen till f går genom den punkten är den växande, vilket betyder att om x(t) < a, men nära, så gäller att x (t) < 0. Den funktionen är alltså avtagande, vilket betyder att den rör sig bort från a. På y y = f(x) samma sätt ser vi att om x(t) > a så är x (t) > 0, så x(t)n är därför växande. Även nu rör x(t) sig iväg a b x från a, så vi kan dra slutsatsen att a är ett instabilt jämviktsläge. Notera att i a är f (a) eftersom tangenten är växande. Det är alltså ett tillräckligt villkor att f (a) > 0 för att a ska vara ett instabilt jämviktsläge. Det är emellertid inte nödvändigt: vi kan ju ha f (a) = 0 men funktionen är ändå växande i a. Analyserar vi punkten b på motsvarande sätt ser vi att nu gäller omvändningen: om x(t) är nära b kommer x(t) att närma sig b med tiden. I den punkten är tangenten avtagande, allså f (b) < 0, så vi ser att det är ett tillräckligt villkor för att ett jämviktsläge ska vara stabilt, och till och med asymptotiskt stabilt. Det återstående fallet är att derivatan är noll i jämviktspunkten. Då får man närmare analysera grafen för att avgöra vad som händer med x(t) när den kommer nära jämviktspunkten. I de kommande avsnitten ska vi diskutera motsvarande fråga för system av differentialekvationer. Där är dock situationen oftast mer komplicerad och en enkel figur behöver inte vara till hjälp. Vi kommer att fokusera på 2 2-system, för att kort efteråt diskutera högre ordningens system. 3 Linjära ekvationssystem Nästa steg är att undersöka linjära ekvationssystem x (t) = Ax(t), x(0) = x 0, (3) där A är en n n-matrix. Sådana system löses med linjär algebrametoder genom att beräkna egenvärden och egenvektorer. Jämviktslägena ges av ekvationen Ax = 0. Om A är inverterbar betyder det att x = 0. I annat fall finns det ett helt underrum, nollrummet till A av stationära lösningar.

Analys av jämviktslägen till differentialekvationer 3 (11) Vi konstaterar nu att om vi som tidigre låter x(t, x 0 ) beteckna lösningen till (3), så gäller att avbildningen x 0 x(t, x 0 ) på R n är en linjär avbildning. Vi har nämligen att c(t) = x(t, x 0 ) + x(t, y 0 ) är sådan att c (t) = Ax(t, x 0 ) + Ax(t, y 0 ) = Ac(t), c(0) = x 0 + y 0, så det gäller att c(t) = x(t, x 0 + y 0 ). Om vi nu låter A(t) vara avbildningsmatrisen för avbildningen x 0 x(t, x 0 ) på R n så gäller alltså att x(t, x 0 ) = A(t)x 0. Men eftersom lösningen är tidshomogen (ekvation (2)), så gäller här att A(t + s)x 0 = A(t)(A(s)x 0 ), och det för alla x 0. Det följer att vilket motiverar att vi skriver A(t + s) = A(t)A(s) A(t) = e ta. För en skalär ekvation är detta korrekt, men i det allmänna fallet är det endast en beteckning! För att beräkna matrisen ifråga behöver man använda sig av spektralsatsen i den linjära algebran. Dock kan vi notera att d dt eta x = Ae ta x. Detta är nämligen ekvationssystemet ovan, ty om vi skriver x(t) = e ta x så gäller att x (t) = Ax(t) = Ae ta x. Den fundamentala observationen är nu att om λ är ett egenvärde till A med tillhörande egenvektor v och vi skriver x(t) = f(t)v där f är en reellvärd funktion, så gäller att f (t)v = x (t) = Ax(t) = A(f(t)v) = f(t)av = λf(t)v, dvs f (t) = λf(t). Med startvillkoret f(0) = 1 har denna lösningen f(t) = e λt. Det betyder att x(t) = e λt v är lösningen på (3) när vi tar x 0 = v. För att nu hitta allmänna lösningar använder man linjär algebran med vars hjälp vi försöker skriva startvärdet som en linjärkombination av egenvektorer. Vi för inte en allmän diskussion kring detta, utan nöjer oss med att illustrera två viktiga fall för 2 2-system. Matrisen A har två olika reella egenvärden Låt de två egenvärdena vara λ 1, λ 2 med tillhörande egenvektorer v 1, v 2. Skriv sedan u 0 som en linjärkombination av egenvektorerna: Då har funktionen u 0 = c 1 v 1 + c 2 v 2. u(t) = c 1 e λ 1t v 1 + c 2 e λ 2t v 2 egenskapen att den löser ekvationssystemet och uppfyller att u(0) = u 0. Detta kontrolleras lätt, och betyder att u(t) är lösningen på problemet.

Analys av jämviktslägen till differentialekvationer 4 (11) Exempel 1 För att lösa systemet { x = 3x 4y y = 2x + 9y bestämmer vi först egenvärden och egenvektorer till motsvarande matris. Dessa är λ 1 = 5 och λ 2 = 7, och som motsvarande egenvektorer tar vi t.ex. v 1 = (2, 1), v 2 = (1, 1). Det följer att den allmänna lösningen till systemet ges av ( ) ( ) 2 1 u(t) = c 1 e 5t + c 1 2 e 7t. 1 Konstanterna c 1, c 2 bestäms typiskt av ett begynnelsevillkor. Matrisen A har komplexa egenvärden Om egenvärdena är komplexa, är dessa komplex-konjugat, eftersom matrisen A är reell, så den karakteristiska ekvationen får reella koefficienter. Låt λ vara ett komplext egenvärde till A. Ekvationssystemet Av = λv har då en lösning bland vektorer med komplexa element. Lösningen v kan inte vara reell, ty om så vore fallet skulle Av vara en reell vektor, vilket inte λv är. Vidare gäller att egenvärdet λ har v som egenvektor. Detta följer av att λ v = λv = Av = A v, eftersom A är en reell matris. Det följer att den allmänna lösningen till systemet kan skrivas u(t) = c 1 e λt v + c 2 e λt v, där c 1, c 2 är komplexa tal. Men lösningen är reell, och för att få den på den formen använder vi Eulers formel som ger att e λt = e αt (cos(βt) + i sin(βt)), λ = α + iβ. Stoppar vi in detta i formeln ovan får vi för u(t) = (x(t), y(t)) att x(t) = e αt (c 11 cos(βt) + c 12 sin(βt)), y(t) = e αt (c 21 cos(βt) + c 22 sin(βt)), för fyra reella konstanter c 11, c 12, c 21, c 22. Här bestäms c 11, c 21 ifrån starvillkoret, varefter de återstående två bestäms med hjälp av egenvektorn v. Det är emellertid ofta lättare att bestämma dessa konstanter på det sätt som illustreras i nästa exempel, och som den fördelen att man inte behöver arbeta med komplexa tal. Exempel 2 Vi ska lösa systemet { x = 4x 5y, x(0) = 1 y = 2x 2y, y(0) = 0.

Analys av jämviktslägen till differentialekvationer 5 (11) Koefficientmatrisens egenvärden är 1 ± i. Den allmänna lösningen på systemet har därför formen x(t) = e t (c 11 cos t + c 12 sin t), y(t) = e t (c 21 cos t + c 22 sin t). Här bestäms c 11, c 21 av startvillkoret: c 11 = 1, c 21 = 0. För att bestämma de övriga konstanterna beräknar vi x (0) = c 11 + c 12 = 1 + c 12, y (0) = c 21 + c 22 = c 22. Ekvationen u (0) = Au(0) innebär därför att ( ) ( ) ( ) 1 + c12 4 5 1 =. 2 2 0 c 22 Ur detta får vi att c 12 = 3, c 22 = 2, och därför att lösningen på problemet ges av x(t) = e t (cos t + 3 sin t), y(t) = 2e t sin t. Anmärkning Ett fall återstår för 2 2-system: när den egenvärdesekvationen har en dubbelrot. 4 Fasporträtt nära origo för typiska linjära 2 2- system När vi grafiskt ska illustrera lösningen till ett linjärt 2 2-system, är en möjlighet att rita ut de två funktionerna x(t) och y(t) i samma koordinatsystem. För många ändamål är det den bästa beskrivningen. Ett alternativt sätt är att rita den orienterade kurva vars parametrisering är c(t) = (x(t), y(t)) i xy-planet. Här ser man hur funktionerna beror av varandra, men parametern t syns inte, så vi ser inte vilka värden funktionerna har vid speciella tidpunkter. Det finns emellertid en stor fördel med att illustrera lösningen på detta sätt: man kan rita ut många lösningar i samma figur utan att förlora överskådligheten. Lösningskurvorna kallas då för banor till systemet, och figuren som sådan kallas för systemets fasporträtt. Vi ska nu se på hur fasporträtten kan se ut för typiska linjära 2 2-system, och fortsätter med beteckningarna från föregående avsnitt. För att slippa diskutera vissa specialfall separat, antar vi att matrisen A är inverterbar, alltså inte har egenvärdet noll. Vi ska då se närmare på de två viktiga fall vi diskuterade i föregående avsnitt. Matrisen A har två olika reella egenvärden Som vi sett ovan är den allmänna lösningen i detta fall u(t) = c 1 e λ1t v 1 + c 2 e λ2t v 2, uttryckt i egenvärden och egenvektorer till A. Vi antar att λ 1 < λ 2.

Analys av jämviktslägen till differentialekvationer 6 (11) När vi ska rita fasporträttet börjar vi med att rita ut de två axlar som går genom origo och har samma riktning som egenvektorera. Koordinaterna för u(t) i koordinatsystemet [0, v 1, v 2 ] ges då av (c 1 e λ 1t, c 2 e λ 2t ). Hur denna bana uppför sig beror av tecknet på egenvärdena, men oberoende av dem kan vi konstatera att eftersom (c 1 e λ 1t, c 2 e λ 2t ) = c 1 e λ 1t (1, c 2 c 1 e (λ 2 λ 1 )t ), så gäller (eftersom λ 2 > λ 1 ) att alla banor närmar sig v 2 -axeln då t. Om den är på väg mot eller bort från origo, beror emellertid på tecknet på egenvärdena: Båda egenvärdena är negativa. Då gäller att alla exponentialfunktionerna går mot noll då t går mot oändligheten, och alltså att u(t) (0, 0) då t. Origo sägs då vara en stabil knut. y x v 2 v 1 Båda egenvärdena är positiva Då gäller att alla banor går mot origo om vi går baklänges i tiden. Går vi framåt i tiden, försvinner alltså banorna bort från origo. Origo sägs då vara en instabil knut. Denna illustreras ovan, där nu banorna går i motsatt riktning till hur de gjorde när knuten var stabil. Ett positivt och ett negativt egenvärde. Alltså λ 1 < 0 < λ 2. I detta fall finns det två banor som skiljer sig från de övriga, nämligen positiva och negativa v 1 -axlarna. På dessa gäller nämligen att u(t) = (c 1 e λ 1t, 0) (0, 0) då t. Dessa banor går alltså in mot origo. De banor som utgörs av positiva och negativa v 2 -axeln försvinner emellertid bort från origo. Det gäller också alla andra banor, vilka försvinner bort från origo och samtidigt asymptotiskt närmar sig v 2 -axeln. Det betyder att även denna gång är origo ett instabilt jämviktsläge, men nu kallas det en sadelpunkt.

Analys av jämviktslägen till differentialekvationer 7 (11) y v 1 x v 2 Matrisen A har komplexa egenvärden. Den allmänna lösningen ges nu av u(t) = (x(t), y(t)), där x(t) = e αt (c 11 cos(βt) + c 12 sin(βt)), y(t) = e αt (c 21 cos(βt) + c 22 sin(βt)). Om α = 0 är u(t) en periodisk funktion med perioden 2π/ β, så banorna blir slutna kurvor runt origo. Man säger då att origo är ett centrum. Om α < 0 gäller att banorna snurrar runt origo, men samtidigt närmar sig origo, medan om α > 0 snurrar de runt och bort från origo. I det förra fallet är origo en stabil spiral, i det senare är origo en instabil spiral. I figuren nedan är origo stabilt, y x men det är bara att vända på pilen, så blir det instabilt. Vi avslutar nu avsnittet med att poängtera följande, som följer ur diskussionen ovan: Origo är ett stabilt jämviktsläge till systemet precis då alla egenvärden till systemet har negativa realdelar. Vi avslutar denna diskussion med att relatera den till analys av stationära punkter.

Analys av jämviktslägen till differentialekvationer 8 (11) Exempel 3 Låt Q(x, y) = ax 2 +2bxy +cy 2 vara en kvadratisk form, där vi (för enkelhets skull) antar att ac b 2 0. De stationära punkterna ges då av ekvationssystemet ( ) ( ) a b x Au = 0 där A =, u =, b c y och eftersom A antas inverterbar är enda lösningen u = 0. Den enda stationära punkten är alltså i origo. Vi har nu att c (t) = grad Q(c(t)) c (t) = Ac(t) och eftersom sådana kurvor klättar upp på ytan z = Q(x, y) ser vi att a) Origo är ett lokalt maximum för Q om origo är en stabil knut för A b) Origo är ett lokalt minimum för Q om origo är en instabil knut för A c) Origo är en sadelpunkt för Q om origo är en sadelpunkt för A. Eftersom matrisen A är symmetrisk kan endast dessa tre fall inträffa (när A är inverterbar); en symmetrisk matris har endast reella egenvärden så spiraler kan inte uppträda. 5 Linjärisering av icke-linjära system Vi vill nu använda det vi lärt oss om linjära system för att diskutera stabiliteten av jämviktslägen till ett icke-linjärt system. Eftersom vi antar att f är kontinuerligt deriverbar gäller att nära jämviktsläget så gäller att f kan approximeras med det linjära system som definieras av dess linearisering. Eftersom vi diskuterar allmänna ekvationer är det inget problem i diskussion att anta att jämviktsläget är origo. Det underlättar beteckningarna att göra det, men vi formulerar satserna nedan i allmänhet. Vi har nu, att eftersom f är kontinuerligt deriverbar och f(0) = 0 så kan vi skriva f(x) = A(x)x, där A(x) = 1 0 f (tx)dt är sådan att A(0) = f (0) är lika med funktionalmatrisen för f i jämviktspunkten. Vi skriver oftast A = f (0) nedan, och alltså A(0) = A. Som illustration till vad som kommer tar vi ett speciellt exempel. Exempel 4 Antag att A är symmetrisk och att alla dess egenvärden är negativa. Det betyder att origo är ett asymptotiskt stabilt jämviktsläge för det lineariserade systemet x = Ax. Vi ska visa att detsamma gäller för det icke-linjära systemet. För att göra det använder vi att för en symmetrisk matris vet vi att det största värde funktionen x x t Ax antar då x 2 = 1 är lika med det största egenvärdet till A. Enligt förutsättningarna är detta negativt, så det finns ett ɛ > 0 sådant att x t Ax ɛ x 2.

Analys av jämviktslägen till differentialekvationer 9 (11) Men det betyder att det finns en omgivning x < δ till origo sådan att x t A(x)x ɛ x 2 /2 Betrakta nu funktionen K(t) = x(t) 2 = x(t) t x(t). För den gäller att Om x(t) < δ så gäller då att K (t) = 2x(t) t x (t) = 2x(t) t A(x(t))x(t). K (t) ɛ x(t) 2, så x(t) är strängt avtagande. Det följer att om x(0) < δ så gäller inte bara att x(t) < δ för alla t, utan även att x(t) 0 då t. Det följer att 0 är ett asymptotiskt stabilt jämviktsläge för det icke-linjära systemet. Situationen i exemplet är speciell, men vi ska nu se hur vi kan modifiera resonemanget till att visa motsvarande påstående för allmänna ickelinjära system. Vi börjar med ett lemma. Lemma 1 Om A är en reell n n-matrix sådan att Re λ < 0 för alla egenvärden λ till A. Då finns en positivt definit kvadratisk form Q på R n sådan att för något ɛ > 0. Bevis. Definiera Q(Ax, x) ɛq(x) Q(x) = 0 e ta x 2 dt som blir en positivt definit kvadratisk form på R n. För den gäller att Q(Ax, x) = 0 e ta Ax e ta xdt = 1 2 0 d e ta x 2 dt = 1 dt 2 x 2. Men om c är det största värdet av Q då x 2 = 1 så följer att Q(x) c x 2, så högerledet ovan är Q(x)/(2c). Vi har också Lemma 2 Låt Q(x) vara en kvadratisk form och låt Q(x, y) beteckna motsvarande bilinjärform. Då gäller att d dt Q(x(t)) = 2Q(x (t), x(t)). Om Q(x) är positivt definit, så gäller att om funktionen t Q(x(t)) är strängt avtagande så gäller att lim t 0 x(t) = 0. Bevis. För det första påståendet skriver vi Q(x) = x t Bx där B är symmetrisk. Då gäller att d dt Q(x(t)) = x (t) t Bx(t) + x(t) t Bx (t) = 2x (t) t Bx(t)

Analys av jämviktslägen till differentialekvationer 10 (11) eftersom x t By = x (By) = (By) t x = y t B t x. För att visa det andra påståendet, antag att Q(x(t)) c > 0. Då finns enligt Bolzano- Weierstrass sats en delsvit som konvergerar: x(t k ) m. Låt nu X(t) lösa differentialekvationen med starvärde m. Eftersom x(t k ) X(0) följer då att x(t k + s) X(s) för alla s och alltså att Q(X(s)) = lim k Q(x(t k + s)) = c, vilket motsäger att denna derivata ska vara negativ om inte X(s) = 0 för alla s. Därav följer påståendet. Sats 1 Antag att x är ett jämviktsläge till x = f(x) sådant att alla egenvärden till f (x ) har negativ realdel. Då är x ett asymptotiskt stabilt jämviktsläge till systemet. Bevis. Vi kan anta att jämviktsläget är origo. Det finns ett ɛ > 0 sådant att realdelen för alla egenvärden är mindre än ɛ och från lemmat har vi då att det finns en kvadratisk form Q sådan att Q(Ax, x) ɛq(x). Det finns då också en omgivning x < δ av origo sådan att Q(f(x), x) ɛq(x)/2 i denna. Från lemmat vet vi nu att d Q(x(t)) = 2Q(f(x(t)), x(t)) ɛq(x(t)) < 0. dt Vi ser alltså att t Q(x(t)) är en strängt avtagande funktion. Den andra delen av lemmat säger då att vi måste ha att x(t) 0 då t, dvs origo är ett asymptotiskt stabilt jämviktsläge. Genom att gå baklänges i tiden ser vi att det ur detta följer att om alla egenvärden till f (x ) har positiv realdel så är jämviktsläget instabilt för det icke-linjära systemet. Detta generaliseras i nästa sats. Med hjälp av dessa två lemman kan vi nu bevisa följande sats. Sats 2 Antag att x är ett jämviktsläge till x = f(x) sådant att något av egenvärdena till f (x ) har en positiv realdel. Då är x ett instabilt jämviktsläge till systemet. Bevis. Även nu antar vi att jämviktsläget är origo. Vi kan skriva R n = V + V där V + består av de egenvektorer som hör till egenvektorer med egenvärden som har positiv realdel. Låt A + vara restriktionen av den linjära avbildningen A till V 1. Om vi använder lemmat ovan på A + så finns en kvadratisk form Q + på V + sådan att Q + (x +, A + x + ) aq + (x + ), x + V + för något a > 0. Samtidigt finns det till varje γ > 0 en kvadratisk form Q på V sådan att Q (x, A x ) γq (x ), x V. Skriv nu Vi får då att G(x) = Q + (x + ) Q (x ), x = x + + x. Ġ f (x) 2(aQ + (x + ) γq (x )) +... = (a γ)(q + (x + ) + Q (x )) + (a + γ)g(x) +....

Analys av jämviktslägen till differentialekvationer 11 (11) Om vi tar γ < a och försummar högre ordningens termer så ser vi att om G(x) > 0 och x är liten, så är Ġf(x) > 0. Eftersom det finns punkter x godtyckligt nära origo med G(x) > 0 följer resultatet. Mer precist, låt K vara mängden där G(x) > 0 och låt K δ vara en liten delmängd runt origo sådan att olikheten för Ġf gäller i den. Då får vi för x K δ att d G(x(t)) αg(x(t)) dt som efter multiplikation med e αt leder till att G(x(t)) E(x(0))e αt. Om x(0) K följer att x(t) måste lämna K δ. Det kan bara ske i en punkt där x(t) = δ. Med andra ord, varje bana som börjar i K δ måste skära cirkeln x = δ. Det följer att origo inte kan vara ett stabilt jämviktsläge.