Derivationsformler för tensorfält Anders Källén MatematikCentrum LTH anderskallen@gmail.com Sammanfattning Derivation av vektorfält på en allmän mångfald är mer komplicerat än det verkar vid första anblick. Men i vektorrum är det inga problem, och i detta kapitel går vi igenom olika sätt att göra det på och vilka som generaliseras till allmännare tensorfält. Många av formlerna vi härleder gäller även på allmänna mångfalder, och ofta är bevisen desamma.
Derivationsformler för tensorfält 1 (17) 1 Introduktion I den här artikeln ska vi samla diverse formler som relaterar olika sätt att derivera tensorfält på en mångfald. För att förenkla diskussionen lite för vi den i ett allmänt vektorrum (av ändlig dimension). Det innebär att vi gör en koordinatfri analys i R n vilket leder till diverse relationer som kommer att ha direkta motsvarigheter på en orienterad mångfald. Detta därför att vi i varje punkt på en sådan kan välja en koordinatomgivning som liknar hur det ser ut i ett vektorrum (tangentrummet), s.k. normala koordinater, och där kan använda formlerna som diskuteras här. Fördelen med att göra analysen i ett vektorrum är att vi då kan arbeta med globala koordinater. Det finns tre närbesläktade, men ändå olika, sätt att derivera på en allmän mångfald, lite beroende på vad det är man ska derivera. Vi ska börja med att diskutera den kovarianta derivatan av ett allmänt tensorfält, d.v.s. hur vi kan definiera en derivata som inte beror på vilket koordinatsystem vi arbetar i. Eller snarare en riktningsderivata. Denna är nära relaterad inte bara till differentialoperatorn på differentialformer utan också till den s.k. Lie-derivatan. Vårt mål är att hitta koordinatoberoende beskrivningar av relationen mellan dessa olika derivationsoperatorer. Dessutom ska vi titta på deras adjunkta operatorer. Något om beteckningar. Vi kommer att arbeta i ett vektorrum V och elementen i detta kommer att kallas v, w,.... Ett vektorfält, alltså en avbildning på V, kommer att betecknas X, Y, Z,... medan allmänna tensorfält kommer att skrivas S, T,.... Slutligen betecknar vi skevsymmetriska tensorfält, alltså differentialformer, med små grekiska bokstäver α, β, ω,.... 2 Tensorfält Låt M vara en glatt mångfald av dimension n. Med ett vektorfält på M menas då en glatt avbildning X : M T M på dess tangentknippe, och med en 1-form en glatt avbildning α : M T M på dess kotangentknippe. Allmänt är ett (r, s)-tensorfält en glatt avbildning T : M T r,s (T M), där T r,s T M betecknar det vektornknippe på M vars fiber över x är T r,s (Tx M). Rummet av sådana avbildningar betecknar vi T r,s (M). s-argumenten sägs här vara kovarianta variabler medan r-argumenten sägs vara kontravarianta variabler. I den här artikeln kommer vi att betrakta T (x) som en avbildning T 0,s (T M) T M r, alltså som vektorvärda kovarianta tensorer. Vi kommer ofta att beskriva olika tensorer i lokala koordinater. Det betyder att vi i en omgivning av en punkt p M bestämmer ett ramverk e 1,..., e n för motsvarande del av tangentknippet. Dess duala ramverk för motsvarande del av kotangentknippet kommer vi då att beteckna med θ 1,..., θ n ; det betyder att θ i (e j ) = δ ij. När vi vill beskriva motsvarande ramverk för tensorfält använder vi multiindex-beteckningar, vilket innebär att om I = {i 1,..., i s } så sätter vi Ett element T T r,s (M) kan då skrivas e I = e i1... e is, θ I = θ i 1... θ is. T (x) = I,J TJ I (e I θ J ) = ( TJ I θ J )e I. I =r J =s
Derivationsformler för tensorfält 2 (17) Ofta börjar vi med basen för kotangentknippet, och ett typiskt sätt att göra det är att börja med att införa lokala koordinater x 1,..., x n runt p och sedan ta θ i = dx i. Ofta väljer vi här vårt koordinatsystem med omdömme, så att det blir så enkelt som möjligt att räkna i. Ett tensorfält T T r,s (M) kan p.g.a. multilinjäriteten uppfattas som en linjär avbildning av vektorfält på vektorfält, d.v.s som en avbildning som uppfyller T (x)(f(x)x 1 (x),..., X s (x)) =... = T (x)(x 1 (x),..., f(x)x s (x)) (1) = f(x)t (x)(x 1 (x),..., X s (x)) för alla vektorfält X 1,..., X s och skalära funktioner f på M. Omvänt, om en multilinjär avbildning (över skalärer) som avbildar vektorfält på vektorfält uppfyller (1) så är den ett tensorfält. Detta är alltså vad vi måste kontrollera för att verifiera att en funktion av vektorfält som vi konstruerat blir ett tensorfält. 3 Derivation av tensorfält - konnektioner Om f är en skalärvärd funktion på M och X är ett vektorfält på M, så kan vi uppfatta df(x) som riktningsderivatan av f i riktningen X som mäter hur mycket f ändrar sig i riktning av X. Att utvidga detta till ett motsvarande begrepp för vektorfält Y (och sedan allmännare tensorer) visar sig mer komplicerat. Detta beror på att Y (x) tar sitt värde i vektorrummet T x M, och problemet är att det finns ingen kanonisk identifikation av punkter i olika sådana rum, vilket krävs för att vi ska kunna definiera en derivata (som ju mäter ändring i Y när vi rör oss mellan närliggande tangentrum). Detta är inget problem om T M är ett trivialt tangentknippe: T M = M V, ty då kan vi uppfatta Y som en avbildning M V och där kan vi använda t.ex. den vanliga differentialoperatorn. För att lyckas på ett allmänt tangentknippe måste man hitta ett sätt att identifiera olika tangentrum. Exempel 1 Om M är en undermångfald till R n så kan ett vektorfält på M deriveras som vanligt, men resultatet behöver inte bli en tangentvektor till M. Men detta kan vi korrigera genom att ortogonalt projicera på tangentrummet. Processen derivation följd av ortogonal projektion bildar en derivationsoperator på vektorfält. Men här måste vi inte välja att göra en ortogonal projektion; vi kan använda andra projektioner vilket ger oss andra derivationsoperatorer på vektorfält på M. Låt X Y beteckna en tänkt riktningsderivata av Y i riktning av X. De två viktiga egenskaper vi vill att dessa ska ha är (2) X (fy ) = df(x)y + f X Y, fx Y = f X Y. En avbildning avbildar två vektorfält på ett vektorfält sådan att (X, Y ) = X Y uppfyller (2) kallas en konnektion på M. Vi kallar X Y kallas den kovarianta derivatan av Y i riktning av X. Notera att första villkoret i (2) medför att en konnektion inte är en tensor.
Derivationsformler för tensorfält 3 (17) Att ange en konnektion på en mångfald är att ge den extra struktur som väsentligen identifierar olika tangentrum i tangentknippet. Hur mycket kan två olika konnektioner på en mångfald skilja sig åt? Låt, vara två konnektioner och sätt A(X, Y ) = X Y XY. Då gäller uppenbarligen att A(fX, Y ) = fa(x, Y ), men också att A(X, fy ) = df(x)y + f XY df(x)y f X Y = fa(x, Y ), så A är ett (1, 2)-tensorfält på M. Givet en konnektion på M vill vi utvidga den till en derivation på allmänna tensorfält. Det vi kräver av en sådan derivation är att (3) X (S T ) = X S T + S X T. Dessutom vill vi att (4) X (Tr S) = Tr( X S). Den första regeln är Leibniz regel och naturlig. Den hjälper oss t.ex. att definiera X (Y Z) och därmed den kovarianta derivatan av godtyckliga T 2,0 (T M)-tensorer. Och på samma sätt den kovarianta derivatan av godtyckliga kontravariantan tensorer. Den andra kräver sin förklaring. Den behövs för att vi ska se hur vi ska kunna definiera den kovarianta derivatan av konvarianta tensorer från den kovarianta derivatan av kontravarianta tensorer. Vi vill först definiera vad vi ska mena med X α där α är en 1-form. Tag då S = α Y i (4) och använd (3) Detta kan vi skriva X (Tr(α Y )) = Tr( X (α Y )) = Tr( X α Y ) + Tr(α X Y ). (5) X (i(y )α) = i(y ) X α + i( X Y )α, Ur detta ser vi att vi ska definiera 1-formen X α genom ( X α)(y ) = X (α(y )) α( X Y ). När vi nu vet vad X α är så kan vi använda (3) för att definiera den kovarianta derivatan avn godtyckliga kontravarianta tensorer. Om T T 0,2 (T M) kan vi bestämma ett konkret uttryck för X T genom att använda (5) på följande sätt. Vi får X (T (Y, Z)) = X (i(z)i(y )T ) = i(z) X (i(y )T ) + i( X Z)i(Y )T som kan skrivas om som = i(z)(i(y ) X T + i( X Y )T )) + i( X Z)i(Y )T (6) ( X T )(Y, Z) = d(t (Y, Z))(X) T ( Z X, Y ) T (X, Z Y ). Genom att fortsätta denna process får vi X T för en godtycklig (r, s)-tensor T : s ( X T )(X 1,..., X s ) = X T (X 1,..., X s ) T (X 1,..., X X i,..., X s ).
Derivationsformler för tensorfält 4 (17) Anmärkning I klassisk tensorlitteratur placeras X i den sista positionen istället och föregås av ett komma. Om t.ex. T är en tensor av typ (2, 3) skrivs denna T ij klm och T blir då en tensor av typ (2, 4) som betecknas T ij klm,r. Notera här att T är en vektorvärd form, och X T (X 1,..., X s ) innehåller derivation m.a.p. baselement i V. Om vi betraktar T som en skalärvärd form på T M r T M s istället så blir S = T (X 1,..., X s ) en form på T M r och ( X S)(θ 1,..., θ r ) = X (T (θ 1,..., θ r )) r T (θ 1,..., X θ i,..., θ r ). Själva konnektionen definieras som den (r, s + 1)-tensor T som ges av Betrakta nu avbildningen ( T )(θ 1,..., θ r, X, X 1,..., X s ) = X T (θ 1,..., θ r, X 1,..., X s ) För den gäller att Θ(Y, X) = Θ(X, Y ) och Θ(X, Y ) = X Y Y X [X, Y ]. Θ(fX, Y ) = f X Y (df(y )X + f Y X) [fx, Y ] = fθ(x, Y ) eftersom [fx, Y ](g) = fx(y (g)) Y (fx(g)) = fx(y (g)) Y (f)x(g) fy (X(g)) = f[x, Y ](g) df(y )X(g). Det följer att Θ är en (1, 2)-tensor som kallas torsionen till konnektionen. Definition Man säger att konnektionen är symmetrisk (eller torsions-fri) om för alla vektorfält X, Y. X Y Y X = [XY ] 4 Upprepad derivation och krökningstensorn Vi börjar med att betrakta kommutator-operatorn [ X, Y ] = X Y Y X, vilken uppenbarligen är skevsymmetrisk i X och Y och uppfyller att [ fx, Y ] = f X Y Y (f X ) = fa(x, Y ) df(y ) X. Eftersom [fx,y ] = f[x,y ] df(y )X = f [X,Y ] df(y ) X följer att [ fx, Y ] [fx,y ] = f([ X, Y ] [X,Y ] ). Vi inför därför R(X, Y ) = [ X, Y ] [X,Y ]
Derivationsformler för tensorfält 5 (17) och noterar då att R(fX, Y ) = R(X, fy ) = fr(x, Y ). En direkträkning ger också att R(X, Y )(S T ) = (R(X, Y )S) T + S (R(X, Y )T ). Om vi låter R(X, Y ) operera på en funktion f får vi att R(X, Y )f = X (df(y )) Y (df(x)) df([x, Y ]) = X(Y (f)) Y (X(f)) [X, Y ](f) = 0. Om vi istället låter den operera på ett vektorfält så ger formeln ovan att Det betyder att avbildningen R(X, Y )(fz) = (R(X, Y )f)z + fr(x, Y )Z = fr(x, Y )Z. (X, Y, Z) R(X, Y )Z är en (1, 3)-tensor. Med andra ord, den definierar för varje x M en multilinjär avbildnign Definition (1, 3)-tensorn T x M T x M T x M T x M. (7) R(X, Y )Z = ([ X, Y ] [X,Y ] )Z kallas krökningstensorn på M och är skevsymmetrisk i (X, Y ). En grundläggande symmetri för krökningstensorn ges av Bianchis (första) identitet som säger att om konnektionen är symmetrisk så gäller att där C(R(X, Y )Z) = 0 C(f(u, v, w)) = f(u, v, w) + f(w, u, v) + f(v, w, u) är den symmetriska summan av de tre argumenten. Det finns också en motsvarande formel om konnektionen inte är symmetrisk, men vi överlåter diskussionen av dessa till ett annat sammanhang. Bevis. Ur definitionen har vi att Men här gäller att R(X, Y )Z + R(Y, Z)X + R(Z, X)Y = X Y Z Y X Z [X,Y ] Z + Y Z X Z Y X [Y,Z] X + Z X Y X Z Y [Z,X] Y = X ( Y Z Z Y ) + Y ( Z X X Z) + Z ( X Y Y X så vi har tre uttryck på formen [X,Y ] Z [Y,Z] X [Z,X] Y. Y Z Z Y = [Y, Z] + Θ(Y, Z) X ( Y Z Z Y ) [Y,Z] X = X Θ(Y, Z) + X [Y, Z] [Y,Z] X X Θ(Y, Z) + [X, [Y, Z]] + Θ(X, [Y, Z]) Tar vi den cykliska summan av detta försvinner mitt-termen och vi får att C(R(X, Y )Z) = C(Θ(X, [Y, Z]) + X Θ(Y, Z)). Här är naturligtvis högerledet noll då Θ = 0.
Derivationsformler för tensorfält 6 (17) Dessutom finns det en Bianchis andra identitet: för en Levi-Civita-konnektionen. X R(Y, Z) + Y R(Z, X) + Z R(X, Y ) = 0 Bevis. Låt vänsterledet operera på vektorfältet W och använd formeln (?) ovan. Vänsterledet blir då X (R(Y, Z)W ) + Y (R(Z, X)W ) + Z (R(X, Y )W ) R( X Y, Z)W R(Y, X Z)W R( Y Z, X)W R(Z, Y X)W R( Z X, Y )W R(X, Z Y )W R(Y, Z) X W R(Z, X) Y W R(X, Y ) Z W. Men här gäller att de tre raderna i mitten är lika med minus R( X Y Y X, Z) + R( Y Z Z Y, X) + R( Z X X Z, Y ) = R(Θ(X, Y ) + [X, Y ], Z) + R(Θ(Y, Z) + [Y, Z], X) + R(Θ(Z, X) + [Z, X], Y ). Vidare gäller att första raden är lika med X Y Z W X Z Y W + Y Z X W Y X Z W + Z X Y W Z Y X W X [Y,Z] W Y [Z,X] W Z [X,Y ] W = = Y Z X W Z Y X W + Z X Y W X Z Y W + X Y Z W Y X Z W [Y,Z] X W R(X, [Y, Z]) [X, [Y, Z]]W [Z,X] Y W R(Y, [Z, X]) [Y,[Z,X]] W [X,Y ] Z W R(Z, [X, Y ]) [Z,[X,Y ]] W = R(Y, Z) X W + R(Z, X) Y W + R(X, Y ) Z W R(X, [Y, Z])W R(Y, [Z, X]) R(Z, [X, Y ])W, där vi använt Jacobis identitet för kommutatorn. Det följer att vänsterledet i Bianchis andra identitet är lika med R(X, Θ(Y, Z)) + R(Y, Θ(Z, X)) + R(Z, Θ(X, Y )) och är alltså noll då Θ = 0. Istället ska vi nu titta på en upprepade konnektionsoperator 2 T = T vilken, om T är en (r, s)-tensor, är en (r, s + 2)-tensor. Vi har då följande formel 2 T (X, Y, Z 1,..., Z s ) = X ( Y T )(Z 1,..., Z s ) ( X Y )(Z 1,..., Z s ).
Derivationsformler för tensorfält 7 (17) Bevis. Vi har 2 T (X, Y, Z 1,..., Z s ) = ( T )(X, Y, Z 1,..., Z s ) s = X ( T (Y, Z 1,..., Z s )) T ( X Y, Z 1,..., Z s ) T (Y,..., X Z i,..., Z s ) + = X ( Y T (Z 1,..., Z s ) X Y (T (Z 1,..., Z s )) s s T (Z 1,..., X Y Z i,..., Z s ) ( Y T )(Z 1,..., X Z i,..., Z s ). = X ( Y T )(Z 1,..., Z s ) ( X Y T )(Z 1,..., Z s ). För ett vektorfält Z på M får vi nu direkt att alltså 2 Z(X, Y ) 2 Z(Y, X) = X ( Y Z) Y ( X Z) X Y Y XZ = X ( Y Z) Y ( X Z) [X,Y ] Z, 2 Z(X, Y ) 2 Z(Y, X) = R(X, Y )Z. Vi ser alltså att krökningstensorn utgör ett mått på hur symmetrisk andraderivatan av ett vektorfält är. Motsvarande gäller för 1-former i form av följande formel: Bevis. Vänsterledet kan skrivas 2 ω(x, Y, Z) 2 ω(y, X, Z) = ω(r(y, X)Z). X( Y ω(z)) Y ω( X Z) X Y (ω(z)) + ω( X Y Z) Y ( X ω(z)) + X ω( Y Z) + Y X(ω(Z)) ω( Y XZ) = ω( Y X Z X Y Z + [X,Y ] Z) + X( Y ω(z)) Y (ω( X Z) X Y (ω(z)) Y ( X ω(z)) + X(ω( Y Z)) + Y X(ω(Z)) = ω(r(y, X)Z) +X(Y (ω(z)) ω( Y Z)) Y (ω( X Z)) [X, Y ](ω(z)) Y (X(ω(Z))) ω( X Z))+X(ω( Y Z)) Ricci-tensorn är den (0, 2)-tensor som definieras av = ω(r(y, X)Z). Ric(X, Y ) = Tr(U R(U, X)Y ). Den är symmetrisk, Ric(X, Y ) = Ric(Y, X), så vi får en sektion av S 2 (T M). Den skalära krökningen definieras sedan av R = Tr Ric.
Derivationsformler för tensorfält 8 (17) 5 Derivation på metriska mångfalder Vi ska nu lägga mer struktur på vår mångfald M genom att förse den med en metrik, som inte nödvändigtvis behöver vara positivt definit. Det innebär att vi definierar en skalärprodukt i varje tangentrum T x M vilken varierar glatt med baspunkten x. Vi börjar med att diskutera skalärprodukter i ett allmänt vektorrum V. En skalärprodukt g(u, v) är en icke-singulär, bilinjär form på V, dvs om g(u, u) = 0 så måste u = 0, men behöver inte vara positivt definit. Med hjälp av denna skalärprodukt får vi en kanonisk identifikation mellan V och dess dual V. Mer precist, om vi definierar v (u) = g(u, v), så blir v en 1-form på V, alltså ett element i V. Eftersom skalärprodukten är icke-singulär definierar detta en isomorfism mellan V och V, vars inversa avbildning vi skriver α α. Om e 1,..., e n är en bas för V, skriver man ofta e i = e i. Denna s.k. musikaliska isomorfism kan utvidgas till mer allmänna multilinjära former. Om t.ex. S är en (0, 2)-tensor, så får vi en (1, 1)-tensor S genom relationen g(s (u), v) = S(u, v). Vi kan nu definierar en skalärprodukt på de olika tensorrummen också. På V definieras denna genom att (α, β) = g(α, β ) som också kan skrivas (α, β) = α(β ). Detta generalisers till till allmänna tensorer genom att vi definierar (S, e I J) = S(e J I ) och sedan använder linjäriteten i det andra argumentet för att få skalärprodukten (S, T ) för godtyckliga S, T. Vi kan notera att om {e i } är en ON-bas för V, så gäller att (S, T ) = I,J S(e J I )T (e I J). En metrik på M är nu en glatt avbildning g : M S 2 (T M) där g(x) är en metrik i T x M. Liksom ovan utvidgas den till metriker på T r,s (Tx M). För att från detta få en skalärprodukt på tensorfält på M behöver vi en orientering på M med tillhörande volymsform σ M. Vi kan då definiera (S, T ) = (S, T )σ M, S, T T r,s (M). M Vi ska nu se vilka konsekvenser metriken får för den kovarianta derivatan. Den första observationen är följande. Om X, Y, Z är vektorfält på M så gäller för en godtycklig konnektion att g(x, Y, Z) = ( X g)(y, Z) = dg(y, Z)(X) g( X Y, Z) g(y, X Z). Att g = 0 innebär då att (8) d(g(y, Z))(X) = g( X Y, Z) + g(y, X Z). Definition En konnektion sägs vara kompatibel med metriken om (5) gäller för alla vektorfält X, Y, Z.
Derivationsformler för tensorfält 9 (17) Följande observation är nu viktig: om konnektionen är kompatible med metriken och ω är en 1-form gäller att ( X ω) = X ω. Detta följer av att ( X ω)(y ) = dω(y )(X) ω( X Y ) = dg(ω, Y )(X) g(ω, X Y ) = g( X ω, Y ) + g(ω, X Y ) g(ω, X Y ) = g( X ω, Y ). Att en konnektion är kompatibel med metriken g medför att d(g(y, Z))(X) + d(g(z, X))(Y ) d(g(x, Y ))(Z) = g(z, X Y + Y X) + g(y, X Z Z X) + g(x, Y Z Z Y ). Om vi dessutom antar att konnektionen är symmetrisk kan vi skriva om högerledet här som 2g(Z, X Y ) g(z, [X, Y ]) + g(y, [X, Z]) + g([y, Z]), och vi får det som kallas Koszuls formel g( X Y, Z) = 1 (d(g(y, Z))(X) + d(g(z, X))(Y ) d(g(x, Y ))(Z)) 2 +g(z, [X, Y ]) g(y, [X, Z]) g(x, [Y, Z]). Men vi kan då vända på detta, vilket vi kan formulera som följer Sats 1 På en metrisk mångfald finns precis en konnektion som är både symmetrisk och förenlig med metriken. Den kallas Levi-Civita konnektionen. Bevis. Vi definierar naturligtvis konnektionen genom Koszuls formel. Vi måste visa att formeln definierar en konnektion som automatiskt blir symmetrisk och förenligt med metriken. Det överlåts åt läsaren. Anmärkning Den allmänna Koszuls formel, då konnektionens torsion inte är identiskt noll, är g( X Y, Z) = 1 (d(g(y, Z))(X) + d(g(z, X))(Y ) d(g(x, Y ))(Z))+ 2 g([x, Y ] + Θ(X, Y ), Z) g([x, Z] + Θ(X, Z), Y ) g([y, Z] + Θ(Y, Z), X). En annan användbar formel är följande: Vänsterledet är nämligen lika med d(x )(Y, Z) = 2g(Alt( X)(Y ), Z). Y (X )(Z) Z(X )(Y ) X ([Y, Z]) = Y (g(x, Z)) Z(g(X, Y )) g(x, [Y, Z]) = g( Y X, Z) g( Z X, Y ) + g(x, Y Z Z Y [Y, Z]) där den sista termen är noll och den första är högerledet ovan.
Derivationsformler för tensorfält 10 (17) 6 Riemanns krökningstensor Med hjälp av metriken kan vi ur krökningstensorn definiera det som kallas Riemanntensorn: Rm(X, Y, Z, W ) = g(r(x, Y )Z, W ). Alternativt: Rm = R. Denna ärver direkt två viktiga symmetrier från krökningstensorn: och, från Bianchis första identitet, Rm(X, Y, Z, W ) = Rm(Y, X, Z, W ) Rm(X, Y, Z, W ) + R(Y, Z, X, W ) + R(Z, Y, X, W ) = 0. Dessutom är den skevsymmetrisk i de två sista argumenten också: Rm(X, Y, Z, W ) = Rm(X, Y, W, Z). Detta följer av att Rm(X, Y, Z, Z) = 0 för alla Z (polarisering), vilket i sin tur följer som följer. Vi observerar först att varför g( X Y Z, Z) = X(g( Y Z, Z)) g( Y Z, X Z), 2g( X Z, Z) = X(g(Z, Z)), g(r(x, Y )Z, Z) = g( X Y Z, Z) g( Y X Z, Z) g( [X,Y ] Z, Z) = X(g( Y Z, Z)) Y (g( X Z, Z)) g( [X,Y ] Z, Z) = 1 (X(Y (f)) Y (X(f)) [X, Y ](f)) = 0, 2 där f = g(z, Z). Ur dessa symmetrier följer slutligen att Rm(X, Y, Z, W ) = Rm(Z, W, X, Y ). Med hjälp av Bianchis första identitet har vi nämligen att Rm(X, Y, Z, W ) = Rm(Z, X, Y, W ) Rm(Y, Z, X, W ) = R(Z, X, W, Y )+R(Y, Z, W, X) = Rm(W, Z, X, Y ) Rm(X, W, Z, Y ) Rm(W, Y, Z, X) Rm(Z, W, Y, X) = 2Rm(W, Z, Y, X)+Rm(X, W, Y, Z)+Rm(W, Y, X, Z) = 2Rm(W, Z, X, Y ) Rm(Y, X, W, Z), varur resultatet följer. Vi har också Bianchis andra identitet som säger att Rm(X, Y, Z, V, W ) + Rm(Y, Z, X, V, W ) + Rm(Z, X, V, W ) = 0. Bevis. Vi har att Rm(X, Y, Z, V, W ) = X Rm(Y, Z, V, W ) = X (Rm(Y, Z, V, W )) Rm( X Y, Z, V, W ) Rm(Y, X Z, V, W ) Rm(Y, Z, X V, W ) Rm(Y, Z, V, X W = X g(r(y, Z)V, W ) g( Sammanfattningsvis ser vi att Riemanntensorn är en symmetrisk bilinjärform på Λ 2 (T M), vilken uppfyller Bianchis första identitet. Med hjälp av den musikaliska isomorfismen får vi då en avbildning Rm : Λ 2 (T M) Λ 2 (T M) sådan att (Rm ω, η) = (ω, Rm η).
Derivationsformler för tensorfält 11 (17) 7 Den formella adjunkten till en konnektion Om X är ett vektorfält på M så är X en (1, 1)-tensor och om vi tar spåret av den, div X = Tr( X), får vi en funktion på M som vi känner igen som divergensen i den klassiska vektoranalysen: om E i är en ON-ram på T M så gäller att div X = j Ej X(E j ) = j θ j ( Ej X). Proposition Om σ M är volymsformen på M och X är ett vektorfält så gäller att d(i(x)σ M ) = (div X)σ M. Bevis. Låt {E i } vara en lokal ON-ram på T M och låt θ i vara den duala ramen på T M, sådan att σ M = θ 1... θ n. Då gäller att i(x)σ M = j ( 1) j 1 θ j (X)θ j. Det följer att d(i(x)σ M ) = i θ i Ei (i(x)σ) = i θ i Ei ( j ( 1) j 1 θ j (X)θ j ) = i,j ( 1) j 1 d(θ j (X))(E i )θ j = i θ i ( Ei X)σ M = (div X)σ M. Mer generellt, om T är en (r, s)-tensor definierar vi divergensen av T, div T som (r, s 1)- tensorn som ges av (div T )(Y 1,..., Y s 1 ) = Tr(X ( T ) (X,., Y 1,..., Y s 1 ), dvs vi tar spåret av den kovarianta derivatan av de två första kovarianta indexen. I koordinater (div T ) I J = g ij i TjJ. I i,j Notera att vi för ett vektorfält får att div X = div(x ). Med hjälp av detta får vi att om T är ett (r, s)-tensorfält och S ett (r, s + 1)-tensorfält, så gäller att ( T, S)σ M = (T, div S)σ M. M M Detta innebär att T = div T,
Derivationsformler för tensorfält 12 (17) d.v.s. den negativa divergensen är den formella adjunkten till. För att se påståendet, sätt P (X) = (T, i(x)s) = T (e I )S(X, e I ), I vilket är (T, S) betraktad som en 1-form. Då gäller att div P = ( T, S) + (T, div S). Men enligt Stokes sats är (div X)σ M = d(i(x)σ M ) = 0 M för varje vektorfält X, så resultatet följer av att div P = div P. Anmärkning Detta är lite luddigt. Mer explicit har vi i koordinater att P = I,J,j T J I SI jj θj, vilket betyder att div P = I,J,j M j (T J I S I jj) = I,J,j( j T J I )S I ji + T J I j S I jj = ( T, S) + (T, div S). Exempel 2 Vi har att om R är krökningstensorn så innebär Bianchis andra identitet att div R = d Ric, där d : S 2 (T M) Λ 2 (T M) T M definieras av d h(x, Y, Z) = h(x, Y, Z) (Y, Z, X. Vidare har vi att div Ric = 1 2 ds, där S är den skalära krökningen. För detta väljer vi ON-bas som är geodetisk i p (så att ei e j (p) = 0). Då gäller i p att g(div Ric, X) = i g(( ei Ric)e j, X) = i,j g( ej R(e j, e i )e i, X) = i,j g(( ej R)(e i, X)e j, e i ) = i,j ( g(( ei R)(X, e j )e j, e i ) g(( X R)(e j, e i )e j, e i ))) där vi använt Bianchis andra identitet. Detta är lika med = j g(( ej Ric)(X), e j ) X(S) = g(div(ric), X) X(S). Vi noterar också att Vi ser då att M T = div( T ) = Tr( 2 T ). ( T, S)σ M = ( T, S)σ M = (T, S)σ M, M M så är en självadjungerad operator. Den kallas den råa Laplaceoperatorn på M för konnektionen.
Derivationsformler för tensorfält 13 (17) 8 Liederivatan av tensorfält Låt X vara ett vektorfält på M (som vi inte specificerar någon metrik på i det här avsnittet). Detta definierar då ett flöde {Φ t } av diffeomorfismer på M genom att d dt Φ t(x) = X(Φ t (x)). Om S är en (0, s)-tensor på M definierar vi Lie-derivatan av S genom L X S = d dt Φ t S t=0. Den mäter vilken förändringshastighet S har då den rör sig med flödet. För en reellvärd funktion f på M ger detta att L X (f) = df(x). Lie-derivatan avbildar tensorer på tensorer samma typ och det är klart att Leibniz regel (9) L X (S T ) = L X S T + S L X T gäller (eftersom Φ t (S T ) = Φ t T Φ t T ). För att göra motsvarande infinitesimala beskrivning av hur ett vektorfält Y ändrar sig i riktning av ett annat vektorfält X tillgår lite annorlunda. Vi börjar då med att beräkna Y i punkten Φ t (x) varigenom vi får en vektor i den punkten. Sedan drar vi tillbaka denna vektor till x med hjälp av differentialen dφ t : Lie-derivatan ges nu i analogi med ovan av Φ t Y (x) = dφ t (Y (Φ t (x))). L X Y = d dt Φ t Y t=0. En allmän definition av Lie-derivatan för en godtycklig (r, s)-tensor får vi genom att kräva att Leibniz formel (9) gäller. Men härigenom har vi definierat både vad som menas med Φ t S för en godtycklig tensor på M samt dess infinitesimala beskrivning i form av Lie-derivatan L X S = d dt Φ t S t=0. Vi ska nu explicit beräkna L X Y för två vektorfält X och Y. Resultatet är ett vektorfält, och om vi ser detta som en differentialoperator på funktioner så ska det beräknas genom att vi beräknar derivatan av Φ t Y (f) = Φ t Y (Φ t f) i t = 0. P.g.a. linjäriteten har vi att Φ t Y (Φ t f) f = Φ t Y (Φ t f f) + (Φ t Y Y )(f) så en derivering ger att L X (Y (f)) = Y (L X f) + (L X Y )(f), vilket vi också kan skriva som X(Y (f)) = Y (X(f)) + L X Y (f). Med andra ord L X Y = [X, Y ].
Derivationsformler för tensorfält 14 (17) Jacobis identitet för kommutatorn innebär då att [L X, L Y ] = L [X,Y ]. Eftersom kommutatorn är skev-symmetrisk har vi att L X Y = L Y X och eftersom Φ t (fy ) = Φ t fφ t Y, följer genom en derivation att L X (fy ) = L X (f)y + fl X (Y ). Ur detta får vi att L fx Y = L Y (fx) = df(y )X fl Y X = df(y )X + fl X Y. Vi ser från detta att om vi vill uppfatta L X Y som en riktningsderivata, så räcker det inte att veta X:s värde i punkten ifråga, utan vi måste också känna dess värde i en omgivning av punkten Vi ska nu utnyttja detta till ytterligare analys av Lie-derivatan av (0, s)-tensorer S. Vi börjar då med att konstatera att Φ t (i(y )S) = i(φ t Y )Φ t S, och deriverar vi det m.a.p. t och sätter t = 0 får vi att Vi kan skriva det som att Om α är en 1-form följer ur detta att L X (i(y )S) = i(l X Y )S + i(y )L X S. i([x, Y ]) = [L X, i(y )]. L X α(y ) = L X (α(y )) α([x, Y ]). Formeln ovan kan vidareutvecklas till att ge oss en explicit formel för Lie-derivatan av allmänna (0, s)-tensorer. Vi har nämligen att (X, X 1,..., X s är alla vektorfält) L X (S(X 1,..., X s )) = L X (i(x s )... i(x 1 )S), och om vi använder formeln ovan på i(x k 1 )... i(x 1 )S får vi att L X (S(X 1,..., X s )) = S(X 1,..., X s 1, L X X s ) + (i(x s )L X S)(X 1,..., X s 1 ). Fortsätter vi på det sätter och flyttar om lite får vi slutligen att s (L X S)(X 1,..., X s ) = L X (S(X 1,..., X s )) S(X 1,..., [X, X i ],..., X s ). Exempel 3 En metrik g på M är en (symmetrisk) (0, 2)-tensor och vi har därför att (L X g)(y, Z) = dg(y, Z)(X) g([x, Y ], Z) g(y, [X, Z]). Kombinerar vi detta med ovanstående formler ser vi att (L X g)(y, Z) = g( Y X, Z) + g(y, Z X) = ( Y X) (Z) + ( Z X) (Y ) = Y X (Z) + Z X (Y ) = 2 Sym( X )(Y, Z) = 2g(Sym( X)(Y ), Z). Anmärkning Den allmänna formeln för en T r,s (M)-tensor blir (L X S)(θ 1,..., θ r, X 1,..., X s ) = L X (S(θ 1,..., θ r, X 1,..., X s )) r s S(θ 1,..., L X θ i,..., θ r, X 1,..., X s ) S(θ 1,..., θ r, X 1,..., [X, X i ],..., X s ).
Derivationsformler för tensorfält 15 (17) 9 Yttre differentialkalkyl Bland tensorfält av typ T 0,p (M) finns både underrrummet av symmetriska fält S p (M) och underrummet av skev-symmetriska fält, alltså rummet av k-former λ p (M). På detta senare rum ger oss kilprodukten en multiplikation : λ p (T M) λ q (T M) λ p+q (T M). Vidare har vi den yttre differentialoperatorn d : λ p (M) λ p+1 (M) som definieras av (10) dω(x 0,..., X p ) = p ( 1) j ( Xj ω)(x 0,..., ˆX j,..., X p ) = Alt( ω). i=0 Följande observation är viktig. Om vi förser M med en metrik och {E i } är en lokal ON-ram på T M och {θ i } den duala ON-basen på T M, så gäller för ω λ p (M) att dω = p θ i Ei ω. För att se att detta gäller observerar vi bara att X ω = i θ i (X) Ei ω, så vi har ur (10) att dω(x 0,..., X p ) = p ( 1) j j=0 n θ i (X j )( Ei ω)(x 0,..., ˆX j,..., X p ) vilket är precis i (θi Ei ω)(x 0,..., X p ). Ur definitionen av d får vi direkt räkneregler som d(ω η) = (dω) η + ( 1) p ω (dη), ω λ p (V ). Det följer också direkt ur definitionen av Lie-derivatan att L X är en funktion på λ p (V ) och att d L X = L X d, L X (ω η) = (L X ω) η + ω (L X η). Den vänstra likheten följer av differentialens invarians: Φ t dω = d(φ t ω) och den högra av att Φ t (ω η) = (Φ t ω) (Φ t η). En annan, djupare, relation mellan differentialen och Lie-derivatan ges i nästa sats. Sats 2 (Cartan-Weils formel) Om ω är en p-form och X ett vektorfält på V, så gäller att L X (ω) = i(x)dω + d(i(x)ω). Bevis. Antag först att ω = α dg där α är en p 1-form och g en funktion. Då gäller att L X (ω) = L X (α) dg + α L X (dg) = L X (α) dg + αd(x(g)),
Derivationsformler för tensorfält 16 (17) medan vi har att i(x)dω = i(x)(dα dg) = (i(x)dα) dg + ( 1) p (dα)x(g), d(i(x)ω) = d(i(x)α dg + ( 1) p 1 αx(g)) = d(i(x)α) dg + ( 1) p 1 ((dα)x(g) + ( 1) p 1 α d(x(g))). Lägger vi ihop de sista två likheterna får vi att i(x)dω) + d(i(x)ω) = (i(x)dα) + d(i(x)α)) dg + α d(x(g)). Vi ser att vi nu kan göra ett induktionsbevis. Vi vet att formeln är sann för 0-former (ty L X (f) = df(x) = i(x)df och i(x)f = 0). Antag att den är sann för alla p 1-former. Enligt vad vi sett ovan är den då också sann för alla p-former på formen ω = α dg. Men alla p-former kan fås som linjärkombinationer av sådana former, varför formeln är sann även för alla p-former. Exempel 4 Om σ M är volymselementet på en orienterad metrisk mångfald M så gäller för varje vektorfält X att L X σ M = d(i(x)σ M ) = (div X)σ M. Vi ska använda denna sats till att skapa explicita formler för den yttre differentialen uträknad med hjälp av vektorfält X i på V. Vi börjar med fallet när ω är en 1-form. Då gäller att dω(x, Y ) = i(y )i(x)dω = i(y )(L X (ω) d(i(x)ω) = (L X (ω) d(ω(x))(y ). Men vi vet från ovan att för en 1-form gäller att vilket ger att (L X ω)(y ) = L X (ω(y )) ω([x, Y ]) = X(ω(Y )) ω([x, Y ]) dω(x, Y ) = X(ω(Y )) Y (ω(x)) ω([x, Y ]). Detta är en oerhört användbar formel som ofta går under namnet Cartan s magiska formel. Den kan alternativt skrivas dω(x, Y ) = d(ω(y ))(X) d(ω(x))(y ) ω([x, Y ]). Antag nu istället att ω är en 2-form. Då får vi på motsvarande sätt dω(x, Y, Z) = i(z)i(y )i(x)dω = i(z)i(y )(L X (ω) d(i(x)ω)). Men nu vet vi från ovan att (L X ω)(y, Z) = L X (ω(y, Z)) ω([x, Y ], Z) ω(y, [X, Z]) och för 1-formen α = i(x)ω kan vi använda Cartans magiska formel. I den gäller att Y (α(z)) = Y (ω(x, Z)), Z(α(Y )) = Z(ω(X, Y )), α([y, Z] = ω(x, [Y, Z]).
Derivationsformler för tensorfält 17 (17) Sätter vi ihop detta får vi att för en 2-form gäller att dω(x, Y, Z) = X(ω(Y, Z)) Y (ω(x, Z)) + Z(ω(X, Y )) (11) ω([x, Y ], Z) ω(x, [Y, Z]) ω(y, [X, Z]). Om man fortsätter denna process får vi följande explicita uttryck för den yttre differentialen p dω(x 0,..., X p ) = ( 1) i X i (ω(x 0,..., ˆX i,..., X p )) i=0 ( 1) i+j ω([x i, X j ], X 0,..., ˆX i,..., ˆX j,..., X p ). i<j Som avslutning drar vi följande slutsats ur Cartan s magiska formel och dess motsvarighet (11): Om α är en 1-form gäller att d 2 α(x, Y, Z) = α(c[[x, Y ], Z]). Anmärkning Vi ser alltså att villkoret d 2 α = 0 är ekvivalent med Jacobis identitet för vektorfält. Som förberedelse noterar vi att (4) alternativt kan skrivas Bevis. Formeln ovan medför att och vi har att dω(x, Y, Z) = C(X(ω(Y, Z) ω([x, Y ], Z). d 2 α(x, Y, Z) = C(X(dα(Y, Z)) dα([x, Y ], Z)), X(dα(Y, Z)) = X(Y (α(z))) X(Z(α(Y ))) X(α([Y, Z])) Men den cykliska summan av X(Y (α(z))) X(Z(α(Y ))) blir lika med den cykliska summan av [X, Y ](α(z)), och vi har att vilket visar att dα([x, Y ], Z) = [X, Y ](α(z)) Z(α([X, Y ]) α([[x, Y ], Z]), d 2 α(x, Y, Z) = C([X, Y ](α(z)) X(α([Y, Z] ([X, Y ](α(z)) X(α([Y, Z]) α([[x, Y ], Z]))) = C(α([[X, Y ], Z])). Den formella adjunkten till d får vi t.ex. ur följande räkning: (d ω, η) = (ω, dη) = (ω, Alt( η))σ V = (ω, η) = ( div ω, η), så d = div. I en ON-ram betyder det att vi kan skriva M d ω = i i(e i ) Ei ω och den avbildar alltså p-former på (p 1)-former. För fullständighetens skull sätter vi d f = 0 för skalärvärda funktioner. Anmärkning Det finns ett alternativt uttryck för d i Hodges stjärnoperator, men vi tar inte upp det här.