U.U.D.M. Project Report 206:2 Matrisexponentialfunktionen Neda Farzaneh Examensarbete i matematik, 5 hp Handledare: Martin Herschend Examinator: Jörgen Östensson Juni 206 Department of Mathematics Uppsala University
Matrisexponentialfunktionen Neda Farzaneh Uppsala Universitet
Innehåll. Introduktion 4 2. Grundläggande begrepp för vektorrum 4 3. Rummet av matriser 8 4. Matrisexponentialfunktionen 0 5. Beräkning av e X 4 6. Matrislogaritm 7 Litteraturförteckning 3
4 INNEHÅLL. Introduktion Arbetet handlar om matrisexponentialfunktionen. Inom matematiken är matrisexponentialfunktionen en utökning av exponentialfunktionen för komplexa tal till kvadratiska matriser, så att man får en matrisfunktion. Exponentialfunktionen för matriser denieras som e X = k! Xk. Serien konvergerar för alla kvadratiska matriser, X. I arbetet kommer vi att gå igenom några grundläggande begrepp, några egenskaper hos e X, beräkning av e X och matrislogaritmen. Exponentialfunktionen som till varje komplext tal z tillordnar e z har många viktiga egenskaper: e Xx+y = e x e y t ext x, y C. I det här arbetet ska vi utvidga denna funktion så även är denierad för kvadratiska matriser X. Vi går igenom grundläggande begrepp som; vektorrum, norm, normerat rum, Cauchyföljd och kompletta metriskt rum. Därefter bevisar vi några viktiga egenskaper för e X. Till exempel: rummet av n n-matriser är komplett, konvergens och absolutkonvergens av e X, derivatan av e X och matrislogaritmen. Sedan handlar arbetet om matrislogaritmen. Vilken är en inversfunktion till matrisexponentialen. Det vill säga för varje matris X är e X inverterbar. Lägg märke till att det bara är nollskilda tal som kan ha logaritm, ty e z aldrig kan vara noll. 2. Grundläggande begrepp för vektorrum Grundläggande egenskaper, denitioner och satser gällande gruppteori. Definition (Produktoperation). [3] En produktoperation, även kallad binär operation, på en mängd S är en avbildning som tilldelar till varje ordnat par av element av S ett unikt bestämt element av S. Det vill säga : S S S Observera att a, b S a b S, det vill säga denna operation är sluten. Definition 2 (Grupp). En grupp är en mängd G tillsammans med en binär opertion med följande egenskaper: () Associativ: För alla a, b, c G: a (b c) = (a b) c (2) Existens av identitetselement: Det existerar ett identitetselement, e, sådant att för alla a G: a e = e a = a
2. GRUNDLÄGGANDE BEGREPP FÖR VEKTORRUM 5 (3) Existens av invers: Det existerar för alla a G ett element, kallat för invers, a, sådant att a a = a a = e Definition 3 (Abelsk grupp). [3] En abelsk grupp, även kallat kommutativ grupp, är en grupp som även har den kommutativa egenskapen. Det vill säga: a, b G a b = b a För abelska grupper betecknas ofta grupp operationen med +. Lemma (Identitetselementet är unikt). Låt G vara en grupp och låt e, f G vara sådana att för alla g G: Isåfall så är e = f. e g = g e = g f g = g f = g Bevis. Eftersom, e är identitetselement, så har vi att e f = f men då vi även har denierat f som identitetselement, så har vi att Därav så har vi att e f = e e = e f = f Lemma 2 (Varje element i en grupp har en och bara en invers). Låt G vara en grupp, med e som identitetselement och g, h, k godtyckliga element i G. Antag att Isåfall så är h = k. g h = h g = e g k = k g = e Bevis. Vi vet att g h = g k = e. Utför vi produktoperationen på vänster sida med h så får vi h (g h) = h (g k). Enligt den associativa egenskapen så är (h g) h = (h g) k, vilket ger oss att e h = e k och h = k. Lemma 3 (Produkten av ett element och dess invers är kommutativ). Låt G vara en grupp, med e som identitetselement och g vara ett godtyckligt element i G. Antag att h G uppfyller antingen h g = e eller g h = e. Isåfall är h den unika inversen av g och både h g = e och g h = e är sanna. Bevis. För att visa att h är inversen till g så måste vi visa att både h g = e och g h = e är sanna. Antag att vi vet att h g = e är sant, då kan vi visa att detta implicerar g h = e. Eftersom h g = e så har vi att g (h g) = g e = g. Enligt den associativa egenskapen har vi därmed att (g h) g = g. Enligt denitionen av en
6 INNEHÅLL grupp så vet vi att gruppen har en invers, och låt oss kalla denna invers för g. Vi utför produktoperationen till höger med inversen g och vi får ((g h) g) g = g g = e (g h) ( g g ) = e (g h) e = e g h = e Motsvarande kan vi visa att ifall g h = e så innebär det att h g = e. Lemma 4 (Egenskaper för inverser). Låt G vara en grupp där e är dess identitetselement, där g och h är godtyckliga element av G, isåfall ( g ) = g () (g h) = h g (2) (3) Bevis.. e = e e = g g = ( g ) ( ) e = g ( g g ) = ( g ) ( (g ) ) e = g g } {{ } =e = ( g ) e = e g = ( g ) = g 2. Så Lemma 3 ger h g = (g h). 3. (h g ) (g h) = h ((g g) h) = h (e h) h h = e. e e = e e = e. Definition 4. (Vektorrum); [, s. 33] Ett komplext vektorrum är en abelsk grupp (V, +) med en operation C V V, (λ, x) λx där följande påstående gäller;
2. GRUNDLÄGGANDE BEGREPP FÖR VEKTORRUM 7.Assosiativitet : λ (µ x) = (λµ) x, 2.Distributivitet : (λ + µ) x = λ x + µ x, λ (x + y) = λ x + λ y, 3.Enhetselement : x = x. Definition 5. (Norm, normerat rum); [, s. 46] En norm på ett vektorrum V tillordnar varje vektor x ett ickenegativt reellt tal som betecknas x. För en norm ska följande uppfyllas; x = 0 x = 0, ax = a x, x + y x + y. Exempel. Om V = C n så är x = x 2 + x 2 2 + x 2 3 +... + x 2 n en norm. Om en norm är denierade på ett vektorrum då kallas det för normerat rum. [, s. 46] Definition 6. (metriskt rum)[, s. ] Ett metriskt rum är en mängd X med en funktion d : X X R, där följande vilkor gäller; d(x, y) = d(y, x), d(x, y) = 0 x = y, d(x, y) d(x, z) + d(z, y). Från ovanstående ser vi att avståndsfunktionen betecknas som d. Exempel 2. Om V är ett normerat rum så är en metrik på V. d(x, y) = x y Definition 7. (Cauchyföjld) [, s. 5] Betrakta en följd { xi } i= i ett metriskt rum (X, d). Ifall d(x n, x m ) går mot noll då m, n går mot oändligheten (oberoende av varandra) kallas följden en Cauchföljd. Mer precist gäller:
8 INNEHÅLL för varje ɛ nns det ett N att två godtyckliga element med index större än N har ett avstånd som är mindre än ɛ, det vill säga: För ett normerat rum (V, ) gäller; ɛ > 0 N ɛ, n, m > N ɛ, d(x n, x m ) < ɛ. Där d(x n, x m ) har ersatts med x n x m. ɛ > 0 N ɛ, n, m > N ɛ, x n x m < ɛ. Med kompletta metriskt rum menar man ett rum V där alla Cauchyföljder konvergerar. 3. Rummet av matriser Vi kommer i huvudsak studera det normerade rummet (V, ) där V = {alla komplexa n n matriser}, och A = aij 2, där A V. Sats. Rummet (V, ) av komplexa n n-matriser är komplett. Dessutom gäller A B A B. Bevis. Beviset för denna sats nns i [2, s. 28]. Sats 2. För alla A V gäller A k A k. Bevis. Vi använder induktion för att bevisa denna sats. Antag att Då har vi att: Antag att k =, (induktionbas). k =, A = A = A, OK. A k A k, (induktionantagandet). Om det gäller för k då ska det gälla även för k + : Alltså A k+ = A k A A k A A k A. A k+ A k+, (induktionsbevis).
Definition 8. (konvergens)[, s. 5] Låt och 3. RUMMET AV MATRISER 9 S = S n = A k n A k, där A k är n n-matriser, eller komplexa tal. Vi säger att S konvergerar om följden (S n ) konvergerar och skriver S = lim n S n. Definition 9. (absolutkonvergens)[2, s. 32] Vi säger att S = är absolutkonvergent om är konvergent. A k A k Sats 3. (absolutkonvergens av e X ) [2, s. 32] Betrakta serien S = och summan där A k är n n-matriser. S n = A k n A k, Om S är absolutkonvergent så är S konvergent. Bevis. Om S absolutkonvergerar så är S n en Cauchyföljd som konvergerar eftersom (V, ) är komplett. Att S n är en Cauchyföljd kan ses på följande vis: Antag att m n. Så är m m S m S n = A k A k som går mot noll om n. k=n+ k=n+ k=n+ A k
0 INNEHÅLL 4. Matrisexponentialfunktionen Vi ska nu visa att absolutkonvergerar. S = e X = k! Xk Exempel 3. Vi uppskattar serien k! Xk Eftersom bara är en konstant då kan vi ta ut det från absolut-tecknet: k! k! Xk = X k k! k! X k = e X <. Vi ser att serien är begränsad av konvergerar mot något tal nämligen e X vilket är mindre än oändligheten så serien absolutkonvergerar.. Sats 4. (konvergens av e X ) [2, s. 3] Serien e X = konvergerar. k! Xk Bevis. Om en serie är absolutkonvergent är den även konvergent, enligt Sats 3. Så från exemplet ovan ser vi att S är absolutkonvergens och alltså konvergerar. Enligt Sats 4 har vi alltså en funktion som till varje n n-matris X tillordnar matrisen e X. Vi kallar denna funktion för matrisexponentialfunktionen. Vi går nu igenom några viktiga egenskaper hos e X. Sats 5. [2, s. 29] Låt X och Y vara två godtyckliga n n matriser. Då har vi följande:.e 0 = I. 2.(e X ) = e X. 3.e X är inverterbar och (e X ) = e X. 4.e (α+β)x = e αx e βx för alla α och β i C. 5.Om C är inverterbar, då e X+Y = e X e Y = e Y e X. 6.Om C är inverterbar, då e CXC = Ce X C. 7. e X e X.
4. MATRISEXPONENTIALFUNKTIONEN Bevis.. Antag X = 0. Då är 2. e X = k! Xk = 0! X0 + }{{} k= =I k! Xk } {{ } =0 = I. 3. Eftersom Men Alltså 4. Eftersom 5. e X = k! (X ) k = 0! (X ) 0 +! (X ) + = 0! (X0 ) +! (X ) + = (X k ) = (e X ). X ( X) = ( X) X = X 2 så e X e X = e X+( X), enligt 5. e X+( X) = e X X = e 0 = I. (e X ) = e X. (αx)(βx) = αβx 2 = (βx)(αx), så e αx+βx = e αx e βx, enligt 5. ( ) ( ) e X e Y = k! Xk k! Y k ( = 0! X0 +! X + 2! X2 + ) ( 3! X3 +... 0! Y 0 +! Y + 2! Y 2 + ) 3! Y 3 +... Om vi väljer en term från första parantesen: m! Xm, och en term från andra parantesen: Y n, så ger det n! upphov till m! n! Xm Y n. Alltså är e X e Y = m! n! Xm Y n. m,n=0 Eftersom produkten är kommutativ, dvs XY = Y X, så är e X+Y = k! (X + Y )k = k! k j=0 ( k j) X j Y k j
2 INNEHÅLL enligt binomialstasen. Dessutom Alltså är ( ) k k! j e X+Y = = k! k! j!(k j)! = j!(k j)!. k j=0 j!(k j)! Xj Y k j, Om vi nu ersätter m = j och n = k j. Så är j!(k j)! Xj Y k j = m!n! Xm Y n. Alltså är 6. Eftersom så är e CXC = e Y e X = e X+Y. k! (CXC ) k. (CXC ) k = CX } C {{ C} X } C {{ C} XC = =I =I = CXIXI IXC = CX k C, e CXk C = k! CXC. Eftersom C är konstant vi tar ut den från summan, = C( k! Xk )C = Ce X C. 7. k! Xk k! Xk k! X k = e X. Sats 6. (Derivatan av e X ) [2, s. 30] Låt X vara en n n komplex matris. Då är f(t) = e tx en deriverbar funktion, och Speciellt, t etx = Xe tx = e tx X. etx t t=0 = X.
Bevis. vi vet att för k > 0 är Dessutom är t (t0 0! X0 ) = 0. Alltså har vi att där k = l + och l = k. Dessutom är 4. MATRISEXPONENTIALFUNKTIONEN 3 t (etx ) = t k! (tx)k = t ( t k = t t k k! Xk k! Xk ), t (tk k! Xk ) = kt k, k! Xk = t k k k! Xk = t k (k )! Xk. t (etx ) = k= t k (k )! Xk = t l l! Xl+ = l=0 l=0 ( ) ( t l = X l! Xl = l=0 l=0 l=0 t l l! Xl+, t l l! Xl X t l l! Xl ) X = Xe tx = e tx X. Därav har vi bevisat att t etx = Xe tx = e tx X. En tillämpning av derivatan av matrisexponentialfunktioner är att lösa ekvationen Y = XY. Sats 7. Ekvationen Y = XY, där Y = Y (t), har lösningar Y = e tx C där C är en konstant n n matris. Bevis. så Y = t Y (t) = t (etx C) ( ) = t etx C = X } e tx {{ C} = XY, enligt sats 6, Y Y = XY.
4 INNEHÅLL 5. Beräkning av e X Här anger vi metoder för beräkning av e X. Vi går igenom tre fall. Fall : X är diagonaliserbar. Anta att X är en komplex n n reell eller matris och att X är diagonaliserbar. Då existerar det en inverterbar komplex matris C så att X = CDC. Där λ 0 D =.... 0 λ n e D är diagonalmatrisen med egenvärden e λ,, e λn, och vi har e λ 0 e X = C... C, 0 e λn eftersom C e X C = e C XC = e D. Genom att diagonalisera X kan vi tydligt lösa ut e X. Exempel 4. Matrisen är given. Egenvektorer av X är [ i] och Alltså den inverterbara matrisen [ i ] X = 0 a a 0 med egenvärden ia och ia. C = i i och Vi beräknar C = [ 2 i 2 i 2 2 ], och e X = = 2 = 2 D = ia 0. 0 ia [ i e ia 0 i 0 e ia 2 i 2 i 2 2 e ia ie ia i ie ia e ia = i [ e ia + e ia ie ia + ie ia ie ia ie ia e ia + e ia = ] = ].
5. BERÄKNING AV e X 5 Vi vet att e ia + e ia = cos( a) + i sin( a) + cos(a) + i sin(a) = 2 cos a + 0 = 2 cos a, Så e X = 2 i(e ia e ia ) = i(cos( a) + i sin( a) cos(a) i sin(a)) [ e ia + e ia ie ia + ie ia ie ia ie ia e ia + e ia ] = 2 = i( 2i sin a) = 2 sin a. 2 cos a 2 sin a = 2 sin a 2 cos a [ cos a sin a sin a cos a ]. Notera att om X, och därav a, är reell då e X är reell. Fall 2: X är nilpotent. En n n matris X är nilpotent om X m = 0 för någon positivt tal m. Vidare om X m = 0, då X l = 0 för alla l > m. I detta fall efter de första termerna serien k! Xk avslutas och kan beräknas exakt. Exempel 5. Vi beräknar e X där X = 0 a b 0 0 c. 0 0 0 Notera att X 2 = 0 0 ac 0 0 0 0 0 0 och att X 3 = 0. Alltså e X = a b + ac 2 0 c. 0 0 Fall 3: X är godtycklig. En general matris X kan vara varken nilpotent eller diagonaliserbar. Men vi har följande sats: Sats 8. [2, s. 295] Låt A vara en komplex n n matris. Då existerar det ett unikt par (S, N) av matriser med föjande egenskaper:. A = S + N, 2. SN = NS, 3. S är diagonaliserbar och 4. N är nilpotent.
6 INNEHÅLL Så varje matris X kan skrivas i formen X = S + N, enligt Sats 8, med S diagonaliserbar och N nilpotent och SN = NS. Eftersom N och S kommuterar, har vi e X = e S+N = e S e N. Vi kan beräkna e S och e N som i fall och fall 2. Exempel 6. Matrisen är given. Då är X = X = a b 0 a a 0 + 0 a 0 b, 0 0 där S = a 0 0 a och N = 0 b 0 0 uppfyller vilkoren i Sats 8. Vi har alltså e X = e S e N = e a 0 b e a e 0 e a = a b 0 0 e a. Exempel 7. Låt a = 2 och b = 3. det vill säga vi har matrisen X = 2 3. 0 2 Lägg märke till att X = 2 3 2 0 0 3 = +, 0 2 0 2 0 0 }{{}}{{} =S =N där (S, N) är som i sats 8. e X = e S e N = e 2 0 0 e 2 e N : N = 0 3 0 0 N 2 = 0 0 = 0 0 0 e N = 0! I +! N + 2! N 2 + }{{} =0 0 0 3 3 = + = 0 0 0 0 e e X = e S e N 2 0 3 e 2 3e = 0 e 2 = 2 0 0 e 2.
6. MATRISLOGARITM 7 6. Matrislogaritm Matrislogaritm är en invers funktion till matrisexponentialen. Vi tittar på logaritmen av komplexa talen för att se vad är det som är rimligt att förvänta sig i matrisfallet. Eftersom e z aldrig kan vara noll, kan bara nollskilda tal ha en logaritm. Varje nollskild komplex tal kan skrivas som e z för någon z, men z är inte unik. Det nns inte någon kontinuerligt väg till att deniera logaritmen i mängden av alla nollskilda komplexa tal. Situationen är liknande för matriser. För varje matris X är e X inverterbar. Så det är bara inverterbara matriser som kan ha logaritm. Sats 9. [2, s. 32] Funktionen log z = m= m+ (z )m ( ) m är denierad och analytik i en cirkel med radien och centrum z =. För alla z med z <, gäller e log z = z. Bevis. Denna sats kan bevisas med analytisk utvidgning. se [2, s. 32], alltså Lemma 2.5. Definition 0. [2, s. 33] För en n n matris A denerar vi log A med (m+) (A I)m log A = ( ) m närhelst serien konvergerar. Eftersom serien har konvergensradie och eftersom kommer serien att konvergera om A I <. m= m= (m+) (z )m ( ) m (A I) m A I m, m= (m+) (A I)m ( ) m Sats 0. Låt A vara en godtycklig komplex n n matris. Då nns diagonaliserbara n n matriser A m m så att lim A m = A. m Bevis. Se [2, s. 59] avsnitt, alltså exercise 5.
8 INNEHÅLL Sats. [2, s. 34] Funktionen log A = m= m+ (A I)m ( ) m är denierad och kontinuerlig på uppsättningen av alla komplexa n n matriser A med A I <. För alla A med A I <, gäller Bevis. Eftersom och eftersom serien e log A = A. (A I) m (A I) m m= m= m+ (z )m ( ) m har konvergensradie, kommer serien m+ (A I)m ( ) m att absolutkonvergera för alla A med A I <. Vi visar exp(log A) = A för alla A med A I < genom två fall. Fall A är diagonaliserbar. Anta att med D diagonal. Då A = CDC, A I = CDC I = C(D I)C. Det följer att (A I) m är på formen (z ) m 0 (A I) m = C... C, 0 (z n ) m där z,, z n är egenvärden av A. Så Om A I <, då måste varje egenvärde z k av A uppfylla z k <. m= m+ (A I)m ( ) m log z 0 = C... C, 0 log z n
och Fall 2 A är inte diagonaliserbar. Välj A m m N enligt Sats 0 så att 6. MATRISLOGARITM 9 e log z 0 e log A = C... C = A. log zn 0 e och A m diagonaliserbar. lim A m = A m lim A m I = A I <. m Alltså nns det N > 0 så att för m N gäller A m I <, så för m N gäller och e log(am) = A m lim m elog(am) = lim A m = A men e log(limm Am) = e log A. Så e log A = A.
Litteraturförteckning [] B. Choudhary, Sudarsan Nanda, Functional Analysis with Applications, Wiley Easten Ltd, New Dehli, 989 [2] Brian C. Hall, Lie Groups, Lie algebras and Representations, Graduate Texts in Mathematics, Springer, 2003 [3] Jones, H.F Groups, representations and physics, Institute of Physics, 998