KORT SAMMANFATTNING AV FLERVARIABELKURSEN LARS SVENSSON OCH ERIC NORENSTAM 1 Normer på vektorrum En avbildning V x x R från ett vektorrum över R (eller C) kallas en norm om λ R (eller C) x, y V (1) λx = λ x (2) x + y x + y (triangelolikheten) (3) x 0 (4) x = 0 x = 0 Ett vektorrum försett med en norm kallas ett normerat rum Låt oss som vanligt införa notationen B(p, r) = {x V : x p < r} för bollen med radie r och centrum i p Till ett normerat rum hör de vanliga topologiska begreppen som: om M V så är p inre punkt i M om B(p, r) M för något r > 0, p yttre punkt till M om p är inre punkt i V M, p randpunkt till M om p är varken inre punkt eller yttre punkt till M Mängden av inre punkter till M betecknas M och mängden av randpunkter M Unionen av M och dess rand kallas slutna höljet av M och betecknas M M kallas (1) öppen om M = M (2) sluten om M = M (3) begränsad om M B(0, r) för något r > 0 2 Konvergens En följd N n x n V säges konvergera mot x då n om ε > 0 N N n N x x n < ε 21 Cauchyföljder En följd N n x n V kallas Cauchy om ε > 0 N N n, m N x n x m < ε Som vi vet så konvergerar varje Cauchyföljd i R n eller C n, men detta är inte i allmänhet fallet om V är ett oändligtdimensionellt rum Vi har därför följande viktiga definition efinition 22 Ett normerat rum i vilket varje Cauchyföljd konvergerar kallas ett Banachrum 1
2 LARS SVENSSON OCH ERIC NORENSTAM Med denna definition så visade vi tidigare i kursen att mängden av kontinuerliga funktioner från en kompakt i R n till R med max-normen är ett Banachrum 3 Operatornorm och ekvivalenta normer Låt V och W vara två ändligtdimensionella vektorrum över R (eller C) Mängden L(V, W ) av linjära avbildningar från V till W är själv ett vektorrum genom additionen och multiplikationen med skalär, definierade enligt (S + λt )(x) = S(T ) + λt (X) för S, T L(V, W ), x V och λ R (eller C) Vi ska införa en norm på L(V, W ), men först ska vi titta lite på V Låt v 1,, v n vara en bas för V och låt K : V R n (eller C n ) vara koordinatavbildningen hörande till vår bas, dvs om K(v) = x = (x 1,, x n) så v = x 1v 1 + + x nv n Vi har då v x 1 v 1 + + x n v n som med Cauchys olikhet i R n ger v ( v 1 2 + + v n 2 ) 1/2 ( x 1 2 + + x n 2 ) 1/2 Om B = ( v 1 2 + + v n 2 ) 1/2 och x betecknar den Euklidiska normen i R n (eller C n ) så har vi alltså v B x etta visar också att avbildningen v V, x = K(v) R n x x 1v 1 + + x nv n R är kontinuerlig och således antar ett minimum, säg A, på den kompakta mängden {x R n : x = 1} = S Således har vi att A x 1v 1 + + x nv n x S Genom att skala x till godtycklig norm och notera att alla leden nedan är homogena under denna skalning ser vi att A x x 1v 1 + + x nv n = v B x x R n Övning 1 Visa med hjälp av ovan att alla ändligtdimensionella normerade rum över R (eller C) är Banachrum Övning 2 Visa också att om 1 och 2 är normer i ett vektorrum V av ändlig dimension, så existerar strikt positiva reella tal α och β sådana att α x 1 x 2 β x 1 x V Vi säger att alla normer på ett ändligtdimensionellt vektorrum är ekvivalenta då de ger upphov till samma konvergensbegrepp och samma topologiska begrepp Låt T L(V, W ) Eftersom enhetsbollen i V är kompakt (=sluten och begränsad för ändligtdimensionella normerade vektorrum) och V x
FLERVARIABEL 3 T (x) R är kontinuerlig så antar T (x) ett maximum där Vi definierar operatornormen enligt T = max T (x) x 1 Övning 3 Verifiera att är en norm Om V och W har dimension n och m respektive så har L(V, W ) dimensionen nm varför i detta fall även L(V, W ) blir ett Banachrum Övning 4 Låt T L(U, V ), S L(V, W ) där U, V och W är ändligtdimensionella normerade rum Visa att S T S T 4 Euklidiska normen på matriser Vi låter R n m (C n m ) beteckna mängden av alla reella (komplexa) n m-matriser På dessa har vi inre produkten R n m R n m R (A, B) sp B T A = B A Övning 5 Hur ser motsvarigheten ut i C n m? Inre produktens symmetri följer av A B = sp A T B = X i (A T B) ii = X i = X i Vi har följande variant på Cauchys olikhet Sats 41 Om A R n m och B R n m så X (A T ) ij(b) ji j X A ijb ij = sp B T A = B A j AB A B där C = (C C) 1/2 är den euklidiska matrisnormen Bevis AB 2 = X ((AB) ij) 2 = X X 2 A ik b kj ij ij k Cauchy på R n X X (A ik ) 2 X (B lj ) 2 ij = X (A ik ) 2 (B lj ) 2 = A 2 B 2 ijkl k l
4 LARS SVENSSON OCH ERIC NORENSTAM Anmärkning Förväxla inte den vanliga Cauchys olikhet, A B A B med olikheten i satsen då ju A B betecknar inre produkten medan AB betecknar matrisprodukten mellan A och B en förra är definierad bara då A och B är matriser av samma format 5 Kontinuitet En funktion f : V W mellan två normerade vektorrum kallas kontinuerlig i punkten a V om ε > 0 δ > 0 så att f(b(a, δ)) B(f(a), ε) V δ a > f > ε f(a) W Övning 6 Visa med hjälp av vårt tidigare resonemang om ekvivalenta normer att våra tidigare kända satser, om att kontinuerliga funktioner tar kompakter på kompakter och bågvisa sammanhängande mängder på dylika, gäller för ändligtdimensionella normerade vektorrum Övning 7 Låt f : R n R vara kontinuerlig överallt och att f(x) när x Visa att f antar ett minsta värde Övning 8 Låt f : R n R vara kontinuerlig överallt, f(x) 0 då x och att a R n med f(a) > 0 Visa att f antar ett största värde 6 erivation En avbildning f : V W mellan normerade rum säges vara deriverbar i a om det existerar en kontinuerlig linjär avbildning betecknad f (a) : V W sådan att f(a + h) = f(a) + f (a)(h) + o(h) där o(h) = h ε(h) för något ε : V W sådan att ε(h) 0 = ε(0) då n 0 Vi säger att f är deriverbar i Ω V om f (a) existerar för varje a Ω Således kan f uppfattas som en avbildning från Ω till L(V, W ) 7 Kedjeregeln Sats 71 Om f : U V är deriverbar i a och g : V W är deriverbar i b = f(a) så är g f deriverbar i a med derivata (g f) (a) = g (b) f (a)
FLERVARIABEL 5 Bevis Låt h V och sätt k = f(a + h) f(a) å går k mot noll då h går mot noll och k = f (a)(h) + o(h) Vi har nu (g f)(a + h) = g(b + k) = g(b) + g (b)(k) + o(k) = et räcker således att visa att Om k 0 och h 0 så har vi g (b)(o(h)) + o(k) h = (g f)(a) + (g (b) f (a))(h) + g (b)(o(h)) + o(k) g (b)(o(h)) + o(k) = o(h) g (b) o(h) h + o(k) k f (a) h + o(h) h som 0 då h 0 Om k = 0 är saken trivial eftersom vi då har (g f)(a + h) = (g f)(a) 8 Medelvärdesolikheten Sats 81 Om f : R n R m är deriverbar på segmentet [x, y] = {tx+(1 t)y : 0 t 1} och f (z) K då z [x, y] så gäller f(x) f(y) K x y och om m = 1 så existerar z [x, y] sådan att f(x) f(y) = f (z)(x y) Bevis Tag enhetsvektor e i R m och definiera g : [0, 1] R genom g(t) = f(tx + (1 t)y) e Av kedjeregeln följer att g (t) = (f (tx + (1 t)y)(x y)) e Av medelvärdessatsen på g följer då att θ (0, 1) sådan att g(1) g(0) = (f(x) f(y)) e = (f (θx + (1 θ)y)(x y)) e Således har vi (f(x) f(y)) e K x y för varje enhetsvektor e som ger att f(x) f(y) K x y Om m = 1 väljer vi bara e = 1 och får för z = θx + (1 θ)y att f(x) f(y) = f (z)(x y) Anmärkning Resultatet ovan gäller för godtyckliga normerade rum men beviset kräver något som vi väntar med Vi ska nu trimma vår olikhet en smula Låt f vara en deriverbar funktion från R n till R m och definiera för fixt y R n en funktion F genom F (x) = f(x) f(y) f (y)(x y) å är F (y) = 0 och av kedjeregeln har vi F (x) = f (x) f (y), varför medelvärdesolikheten ger F (x) F (y) max z [x,y] F (z) x y, dvs f(x) f(y) f (y)(x y) max z [x,y] f (x) f (y) x y Anmärkning enna olikhet gäller också för alla normerade rum om max ersätts med supremum
6 LARS SVENSSON OCH ERIC NORENSTAM 9 Matrisrepresentation av derivator Låt f : R n R m vara deriverbar i a R n och välj standardbasvektorer e i R n och e j R m efiniera g(t) = e j f(a + te i) och få enligt kedjeregeln g (0) = e j (f (a)(e i)) som är element på rad j och kolonn i i matrisrepressentationen för f (a) i standardbaserna för R n och R m respektive Vidare om f j(x) = e j f(x) så får vi att f j(x) x i = e j (f (a)(e i)) 10 Variabelnotation Om x och y är variabler i R n och R m respektive som är relaterade enligt y = f(x) för en deriverbar funktion f : R n R m så skriver vi ofta 2 3 f (x) = f(x) = dy dx = 6 d 4 2 6 d 4 y 1 y m x 1 x n 7 5 2 y 1 x 1 3 = 6 4 y m x 1 7 5 Kedjeregeln blir då med matrismultiplikation R n R m R k x y z dz dx = dz dy dy dx 11 Inversa funktionssatsen y 1 x n y m x n Sats 111 (Inversa funktionssatsen i normerad form) Låt f : R n R n vara kontinuerligt deriverbar i en omgivning av origo och antag att f(0) = 0 och f (0) = id = I å existerar två omgivningar U och V till origo samt en kontinuerligt deriverbar g : V U sådan att f g = id på V och g f = id på U Bevis å f är kontinuerlig i origo existerar r > 0 sådan att f (x) I 1 2 om x < r Fixera ett y R n med y < r/2 och definiera ϕ(x) = y + x f(x) Vi observerar att om x är en fixpunkt till ϕ, dvs ϕ(x) = x, så har vi att y = f(x), dvs x är inversa bilden av y under f Vi visar först att ϕ avbildar B(0, r ) in i sig själv om r = y 2 < r Så tag x r å har vi ϕ(x) = ϕ(x) ϕ(0)+ϕ(0) ϕ(x) ϕ(0) + y max z [0,x] ϕ (z) x 0 + y 1 2 r + 1 2 r = r Enligt Banachs fixpunktssats existerar ett unikt x = g(y) med x 2 y sådant att f(x) = y Vi ska nu 3 7 5
FLERVARIABEL 7 visa att g är kontinuerligt deriverbar i B(0, r/2) = V Vi visar först att g är deriverbar i origo med g (0) = id = I Om f(x) = f(0) + f (0)(x) + o(x) = x + o(x) = y så har vi x = g(y) = y o(x) men g(0) = 0 och o(x) y = o(x) x x y 2 o(x) x och om y 0 så x 0, så g är deriverbar i origo med g (0) = I Fixera nu x 0 = g(y 0) och sätt x = x 0 + s och definiera y = f(x) och F (s) = t = f (x 0) 1 (f(x 0 + s) y 0) å har vi F (0) = 0 och F (0) = f (x 0) 1 f (x 0) = I varför enligt ovan F har en lokal invers G som är deriverbar i origo med G (0) = I Vi har då G F (s) = s = x x 0 = G f (x 0) 1 (f(x) y 0) g(y) = x 0+G f (x 0) 1 (y y 0) Av kedjeregeln är högra ledet deriverbart i y = y 0 med derivatan G (0)f (x 0) 1 = f (x 0) 1 etta visar att g (y 0) existerar och att g (y 0) = f (x 0) 1 = f (g(y 0)) etta visar också att g är kontinuerlig eftersom g och f är kontinuerliga (Vi vet ju, sedan tidigare, att inverser till kontinuerliga avbildningar är kontinuerliga) Vi ska nu generalisera satsen en smula Sats 112 (Inversa funktionssatsen) Låt f vara en kontinuerligt deriverbar avbildning från en omgivning av a i R n till R m (i) Om f (a) är injektiv så existerar en kontinuerligt deriverbar avbildning g från en omgivning till f(a) sådan att g f är identiteten i närheten av a Vi säger att f har en lokal vänsterinvers (ii) Om f (a) är surjektiv så existerar en lokal högerinvers g till f i en omgivning av f(a) sådan att f g är identiteten i närheten av f(a) (iii) Om f (a) är bijektiv så har f en lokal invers Bevis (i) Låt A vara linjär : R m R n sådan att A f (a) = id = I på R m Bilda F (x) = A(f(a + x) f(a)) då har vi F (0) = 0 och F (0) = I Alltså existerar en kontinuerligt deriverbar G i närheten av origo med G(0) = 0 och G (0) = I sådan att x = G A(f(a + x) f(a)) dvs x a = G A(f(x) f(a)) om x ligger nära a, eller x = a+g A(f(x) f(a)) Sätt nu g(y) = a + G A(y f(a)) Så får vi g f(x) = x, som visar (i) (ii) Låt B : R m R n vara linjär sådan att f (a)b = id = I på R m Bilda F (x) = f(a+bx) f(a) då är F kontinuerligt deriverbar nära origo och F (0) = 0, F (0) = f (a)b = I Resten av beviset överlämnas som övning 12 Implicita funktionssatsen Låt f : R m R n R n vara kontinuerligt deriverbar i närheten av (a, b) R m R n och anta att derivatan av R n y f(a, y) R n
8 LARS SVENSSON OCH ERIC NORENSTAM är inverterbar i b å existerar en kontinuerligt deriverbar funktion ϕ definierad i en omgivning till a sådan att b = ϕ(a) och där f(x, ϕ(x)) = f(a, b) för x nära a Bevis Bilda R m R n F R m R n, (x, y) (x, f(x, y)) Om vi inför variabelnotation z = f(x, y)) och arbetar med kolonnvektorer fås» x d " # F z x x» x y Im 0 =» = z z = z z x x y x y d y där I m är identitetsmatrisen av formatet m m det F = det dz dy punkten (x, y) = (a, b) Således har F en lokal invers G Betrakta figuren 0 i y R n z = f(x, y) R n b ϕ F c a x R m Låt P beteckna projektionen och definiera G R m R n (s, t) t R n ϕ(x) = P G(x, c) för x nära a a x R m å har vi F G(x, c) = (x, c) dvs F (x, ϕ(x)) = (x, f(x, ϕ(x))) = (x, c) som visar att f(x, ϕ(x)) = c och att ϕ(a) = P G(a, f(a, b)) = P G F (a, b) = b 13 Parameteriserade mångfalder Låt f : Ω R n vara en deriverbar funktion där Ω är en öppen del av R m och där 1 m n Antag att f (x) är injektiv x Ω å kallas f(ω) en m-dimensionell mångfald (yta) i R n Om Ω a f(a) = p f(ω) = S så kallas p + Im f (a) = T ps för tangentrummet till S i p 14 Mångfalder som nivåytor Låt f : Ω R m vara deriverbar (m n) i Ω R n där f (p) är surjektiv för varje p i den öppna mängden Ω efiniera S = {x Ω : f(x) = 0}
FLERVARIABEL 9 Om p S så definieras T ps = {x R n : f (p)(x p) = 0} Vi ser att T ps = p + ker f (p) så T ps, som kallas tangentrummet till S i punkten p, är en affin mängd i R n av dimensionen n m Om m = 1 är S en hyperyta och om m > 1 är S skärningen av m stycken hyperytor Eftersom f (p) antogs vara surjektiv så har matrisen 2 3 y 1 x 1 f (p) = 6 4 y m x 1 y 1 x n y m x n 7 5 x=p,y=f(x) linjärt oberoende rader Men då kan vi välja ut m stycken kolonner, säg de m första, så att 2 3 y 1 y x 1 1 x m det 6 4 7 5 0 y m x 1 y m x m Men då följer av implicita funktionssatsen att variablerna x m+1,, x n kan lösas ut som funktion av x 1,, x m ur ekvationen f(x) = 0, nära a Säg att (x m+1,, x n) = ϕ(x 1,, x m) et betyder att S kan parameteriseras enligt lokalt nära a = (a 1,, a n) x=a (x 1,, x m) (x 1,, x m, ϕ(x 1,, x m)) 15 Taylors formel Antag att f : R m R är N gånger deriverbar i a R n och definiera för fixt h R n en avbildning g : R R genom g(t) = f(a + th) Kedjereglen ger då g (t) = f (a + th)(h) = x j h f x 1 (a + th) = h 1 1f(a + th) + + h n nf(a + th) = (h 1 1 + + h n n)f(a + th) där j = Låt oss införa notationen h = h 1 1 + + h n n i f x n (a + th) h som en linjär avbildning som tar kontinuerligt deriverbara funktioner (på R n ) till kontinuerliga funktioner Vi skriver då g (t) = (h )f(a + th) Genom att sätta f 1 = (h )f och g 1(t) = f 1(a + th) så ser vi att g (t) = g 1(t) = (h )f 1(a + th) = (h ) 2 f(a + th) Förfarandet itereras och ger g (k) (t) = (h ) k f(a + th)
10 LARS SVENSSON OCH ERIC NORENSTAM Men g(t) = g(0) + g (0)t + + Således har vi visat att f(a + h) = N 1 X k=0 1 (N 1)! g(n 1) (0)t N 1 + 1 N! g(n) (θt) 1 k! (h )k f(a) + 1 N! (h )N f(p) 16 Några olika skrivsätt Translatet T h f : R m R definieras av (T h f)(x) = f(x + h) Om f är oändligt deriverbar och om Taylorserien konvergerar överallt kan vi alltså skriva X 1 (T h f)(a) = k! (h )k f(a) eller om vi tar bort a eller om vi tar bort f T h f = T h = 0 X 0 X 0 0 1 k! (h )k f 1 k! (h )k et är också naturligt att definiera X e h 1 = k! (h )k Taylor formel får då utseendet T h = e h, Vackert va! et finns också ett annat sätt att skriva Taylors formel, nämnligen med sk multiindexnotation: En lista α = (α 1,, α n) N n kallas ett multiindex Om α, β N n så definieras summan och graden och fakulteten α + β = (α 1 + β 1,, α n + β n) α = α 1 + + α n α! = (α 1!)(α 2!) (α n!) Om x = (x 1,, x n) är en lista av variabler definieras x upphöjt till α av x α = x α 1 1 x α 2 2 x αn n
FLERVARIABEL 11 dvs ett monom av grad α Om = ( 1,, n) är listan av de partiella deriveringarna sätter vi α = ( α 1 1,, αn n ) Med ovanstående notation kan Taylors formel skrivas precis som i envariabelkursen f(a + th) = X 1 α! α f(a)h α + rest där för något p [a, a + h] Övning 9 Visa detta! (1) (2) α <N rest = X α =N 1 α! α f(p)h α (x 1, x 2, x 3, x 4) (1,2,0,3) = x 1x 2 2x 3 4, (1, 2, 0, 3)! = (1!)(2!)(0!)(3!) = 1 2 1 6 = 12 17 Max och min efinition 171 En punkt a kallas kritisk till f : R n R om f (a) = 0 Vi har omedelbart följande enkla sats Sats 172 Om f har ett lokalt min eller max i a så är a kritisk Bevis Sätt för en enhetsvektor e i R n g(t) = f(a+te) å har g lokalt max eller min i 0 så g (0) = f (a)e = 0 Men e var godtycklig så f (a) = 0 Låt nu f : R n R vara två gånger deriverbar Enligt Taylors har vi då f(a + h) = f(a) + f (a)h + 1 2 (h )2 f(p) för något p mellan a och a + h Men (h ) 2 f(x) = ( X i,j h ih j i j)f(x) = X i,j h i( i jf(x))h j = h T f (x)h där f (x) betecknar den sk Hessianen 2 3 1 1f(x) 1 nf(x) f 6 (x) = 4 7 5 n 1f(x) n nf(x) Alltså har vi f(a + h) = f(a) + f (a)(h) + 1 2 ht f (p)h
12 LARS SVENSSON OCH ERIC NORENSTAM Anmärkning Om = ( 1 n) så kan vi symboliskt skriva 2 3 f = T f = 6 4 1 n 7 5 1 n f 18 Karakterisering av kritiska punkter Låt a vara kritisk till f : R n R å har vi att f(a + h) = f(a) + 1 2 ht f (p)h, Vi har omedelbart följande p (a, a + h) Sats 181 Om f är positivt definit i en omgivning av a så har f ett lokalt minimum i a Om f (p) är negativt definit i en omgivning av a så har f ett lokalt maximum i a Anmärkning Om f är kontinuerlig i a och om f (a) är pos def resp neg def i a så är även f (p) pos def resp neg def i en omgivning av a på grund av kontinuiteten Vi har också Sats 182 Om f är kontinuerlig i a och om det f (a) 0 samt att f (a) har både strikt positiva och negativa egenvärden, dvs är indefinit, så har f en sadelpunkt i a (dvs varken lokalt max eller min) Bevis Övning Använd att egenvärdena till en matris varierar kontinuerligt med matrisens element Anmärkning I det fall att det A = 0 kräver en helt annan analys för bestämning av vilken karaktär en kritisk punkt har (A = f ) etta problem är mycket svårt och leder in i singularitetsteori och sk katastrofteori Om man ska avgöra om en symmetrisk n n-matris A är pos def, neg def eller indefinit så har man stor nytta av följande resultat, som vi visade i linjär algebra kursen 19 Positivt och negativt definita matriser Sats 191 Om A är en reell symmetrisk n n-matris och om k definieras som determinanten av matrisen [a ij] 1 i,j k så gäller att A är positivt definit precis om k > 0 k = 1, 2,, n Bevis Vi påminner om att en matris är positivt definit precis om h T Ah > 0 för alla nollskilda vektorer h i R n etta är också ekvivalent med att alla egenvärden till A är strikt positiva Antag först att A är pos def Betrakta underrummet E k = linspan{e 1,, e k } Om 0 h = h 1e 1 + + h k e k E k så har vi h T Ah = P k i,j=1 hiaijhj > 0 etta betyder att den matris vi
FLERVARIABEL 13 får om vi stryker alla rader och kolonner i A utom de k första är pos def Men då är alla egenvärden hos denna positiv och därmed dess determinant Antag nu omvänt k > 0 för alla k n Vi använder nu induktion över n och antar att satsen är visad för matriser av mindre format än n n (trivialt för 1 1) å är alltså A positivt definit på E n 1 Om A inte är positivt definit så måste minst två egenvärden till A vara negativa (eller ett med algebraisk multiplicitet minst 2) Låt L vara ett tvådimensionellt underrum i R n som spänns av motsvarande egenvektorer Eftersom dim L+ dim E n 1 > n så existerar en nollskild h L E n 1 Men då har vi en motsägelse eftersom h L h T Ah < 0 och h E n 1 h T Ah > 0 Om 1 < 0, 2 > 0, 3 < 0, så är A negativt definit (ty då är ju A positivt definit) I övriga fall, då n = det A 0 är A indefinit 20 Extremvärdesproblem med bivilkor Låt f, g 1,, g k vara kontinuerligt deriverbara funktioner från R n till R och anta att k < n Problem: maximera eller minimera f(x) då g 1(x) = = g k (x) = 0 Vi har nu följande användbara sats Sats 201 Om a R n är ett max eller min till f under bivillkoren g 1 = = g k = 0 så måste f (a), g 1(a),, g k(a) vara linjärt beroende Bevis Antag motsatsen, dvs att de är linjärt oberoende och definiera en hjälpfunktion H : R n R R k genom 2 3 f(x) R n g 1(x) x H(x) = 6 7 4 5 R Rk g k (x) Betrakta figuren b ( a ) R n H R f(x) [ ] e 0 R k g 1 (x) g k (x) Om f (a), g 1(a),, g k(a) är linjärt oberoende så är H (a) surjektiv Enligt inversa funktionssatsen 2 3 har då H en lokal högerinvers, G säg, 2 3i närheten av e e 0 0 H(a) Om 4 5 tillhör denna närhet så uppfyller b = G( 4 5) bivillkoren 0 g 1(b) = = g k (b) = 0 och f(b) = e Genom att välja e > f(a) respektive e < f(a) ser vi att a varken är max- eller minpunkt 0
14 LARS SVENSSON OCH ERIC NORENSTAM x 21 Frenets formler Låt R t x(t) R n vara en n gånger deriverbar kurva och låt e 1(t),, e n(t) vara den ortonormala bas för R n som ges av Gram-Schmidts ortogonaliseringsförfarande tillämpad på ẋ(t), ẍ(t), Vi antar härvid att ẋ(t), ẍ(t),, x (n) (t) är linjärt oberoende (det sk generiska fallet) Per konstruktion har vi att för 1 k n, linspan{x (t),, x (k) (t)} = linspan{e 1(t),, e k (t)} Vidare förjer av konstruktionen att (3) e 1(t) = λ 11(t)e 1(t) + λ 12(t)e 2(t) e 2(t) = λ 21(t)e 1(t) + λ 22(t)e 2(t) + λ 23(t)e 3(t) e k 1(t) = λ k 1,1 (t)e 1(t) + + λ k 1,k (t)e k (t) e n(t) = λ n1(t)e 1(t) + + λ nn(t)e n(t) Vidare följer av e i(t) e j(t) = δ ij att e i(t) e j(t) + e i(t) e j(t) = 0 i, j Men enligt (3) har vi även att e i(t) e j(t) = λ ji(t), där vi definierar λ ji(t) = 0 om 1 + j < i Alltså har vi λ ij(t) = λ ji(t) i, j och följdaktligen e 1(t) = λ 12(t)e 2(t) e 2(t) = λ 21(t)e 1(t) + λ 23(t)e 3(t) e k 1(t) = λ k 1,k 2 (t)e k 2 (t) + λ k 1,k (t)e k (t) e n(t) = λ n,n 1(t)e n 1(t) essa formler brukar kallas Frenet s Inför nu den ortogonala matrisen E(t) = [e 1(t),, e n(t)]
FLERVARIABEL 15 med e j(t) som den j:te kolumnen, och den antisymmetriska bandmatrisen 2 3 0 λ 12 0 0 0 0 λ 12 0 λ 23 0 0 0 0 λ 23 0 λ 34 0 0 Λ = 0 0 λ 34 0 0 0 6 7 4 0 0 0 0 0 λ n 1,n 5 0 0 0 0 λ n 1,n 0 Matrisen är bara nollskilld på sub och superdiagonalen Övning 10 Uttryck Frenets formel som en relation mellan matriserna E(t), E(t) och Λ(t) Anmärkning För fallet n = 3 brukar λ 12 = κ kallas krökning och λ 23 = τ torsion Λ får då formen 2 0 κ 3 0 4 κ 0 τ5 0 τ 0 För praktiskt bruk kan det vara enklare att använda formlerna för κ och τ som står i kursboken 22 Högre ordningens derivator Låt f : V W 0 vara en oändligt deriverbara funktion mellan ändligtdimensionella normerade rum Låt vidare L(V, W ) beteckna mängden av linjära avbildningar från V till W Vi inför också beteckningen L n(v, W ) för mängden av multilinjära avbildninngar från V n = V V V till W Vi har nu f (0) = f : V W 0 f (1) = f : V L(V, W 0) = W 1 f (1) = f : V L(V, W 1) = W 2 f (n) = f (n 1) : V L(V, W n 1) = W n Vi ska nu konstruera en kanonisk avbildning från W n till L n(v, W 0) och sedan ska vi visa att bilden av denna endast innehåller symmetriska multilinjära avbildningar Uppenbarligen är W 1 = L 1(V, W 0) = L(V, W 0) Antag vi har konstruerat en avbildning W n 1 L n 1(V, W 0) betecknad T T Vi ska nu definiera W n L(V, W 0) så tag T W n = L(V, W n 1)
16 LARS SVENSSON OCH ERIC NORENSTAM och (h 1, h 2,, h n) V n efiniera nu T genom T (h 1, h 2,, h n) = T (h n)(h 1, h 2,, h n 1) Övning 11 Verifiera att T är multilinjär Vi definierar nu n f genom ( n f)(x) = (f (n) (x)) och får alltså att n f : V L n(v, W 0) Övning 12 Visa att Taylorpolynomet av f i punkten a kan skrivas f(a + h) = f(a) + f(a)(h) + 1 2! 2 f(a)(h, h) + Vi ska nu visa att n f(a) är en symmetrisk multilinjär avbildning En multilinjär T : V n W kallas symmetrisk om för varje permutation π: T (h 1, h 2,, h n) = T (h π(1), h π(2),, h π(n) ) gäller för alla (h 1,, h n) i V n Vi börjar med ett lemma Lemma 221 Om f : R 2 R är sådan att alla partiella derivatorna 1f, 2f, 1 2f och 2 1f existerar i en omgivning av (a, b) och där 1 2f eller 2 1f är kontinuerlig i (a, b) så 1 2f(a, b) = 2 1f(a, b) Bevis Fixera h och k och definiera g(y) = f(a + h, y) f(a, y), F (h, k) = g(b + k) g(b) = f(a + h, b + k) f(a, b + k) f(a + h, b) + f(a, b) Av medelvärdessatsen följer då att F (h, k) = g (b + tk)k = ( 2f(a + h, b + tk) 2f(a, b + tk))k för något 0 < t < 1 Medelvärdessatsen ger vidare F (h, k) = 1 2f(a + sh, b + tk)kh för något 0 < s < 1 För hk 0 har vi alltså f(a + h, b + k) f(a, b + k) f(a + h, b) + f(a, b) = 1 2f(a+sh, b+tk) hk Låt nu för fixt k 0 h 0 Vi får då 1f(a, b + k) 1f(a, b) F (h, k) = lim k h 0 hk Låt nu k 0 och vi får F (h, k) 2 1f(a, b) = lim lim k 0 h 0 hk på samma sätt fås F (h, k) 1 2f(a, b) = lim lim h 0 k 0 hk
FLERVARIABEL 17 Men F (h, k) = 1 2f(a + sh, b + tk) 1 2f(a, b) om (h, k) (0, 0) hk eftersom 1 2f är kontinuerlig i (a, b) Således har vi visat att de bägge upprepade gränsvärdena sammanfaller, dvs att som visar lemmat 1 2f(a, b) = 2 1f(a, b) Sats 222 Om f : V W är två gånger kontinuerligt deriverbar i en omgivning av a V så är 2 f(a) en symmetrisk bilinjär avbildning från V V till W Bevis et räcker att visa att (f (a)(h))(k) = (f (a)(k))(h) h, k V Fixera h, k V och en linjär avbildning α : W R efiniera g : R R R genom g(x, y) = α f(a + xh + yk) å är g två gånger kontinuerligt deriverbar i närheten av (0, 0) och 1g(x, y) = α(f (a + xh + yk)h) 1g(0, y) = α(f (a + yk)h) = På samma sätt fås = α(f (a)h + f (a)(yk)(h) + o(yk)h) 2 1g(0, 0) = α(f (a)(k)(h)) 1 1g(0, 0) = α(f (a)(k)(h)) Men 1 2g(0, 0) = 2 1g(0, 0) ger då att α(f (a)(h)(k) f (a)(k)(h)) = 0 f (a)(h)(k) = f (a)(k)(h) h, k V α 23 Variabelsubstitution i multipelintegraler Låt och E vara öppna delmängder i R n sådana att och Ē är kompakta Antag att ϕ : Ē är en kontinuerlig deriverbar bijektion sådan att det ϕ > 0 i Antag vidare att f : Ē R är sådan att Riemannintegralerna f och f ϕ det E ϕ existerar (et skulle duga om f vore kontinuerlig) å gäller följande Sats 231 ϕ() f = f ϕ det ϕ
18 LARS SVENSSON OCH ERIC NORENSTAM Idén med vårt bevis är att först visa satsen för avbildningar ϕ som bara ändrar en av variablerna: Vi inför efinition 232 En avbildning ϕ : R n R n kallas enkel om ϕ(x 1, x 2,, x n) = (y 1, y 2,, y n) där y 1 = ψ(x 1, x 2,, x n) och y k = x k om 1 < k n (Eller om detta uppnås efter en omnumrering av variablerna) Vi noterar att det ϕ = 1ψ Lemma 233 Om ϕ är enkel så gäller sats 231 Bevis Låt oss först för en delmängd A R n definiera à = { x R n 1 : (x 1, x) A för något x 1 R} A( x) = {x 1 R : (x 1, x) A} R x 1 A( x) A E f = = y E y E x f(y 1, ỹ) dy 1dỹ = = {Fubini} = = x Ẽ R n 1 x f(y 1, y 2,, y n) dy 1dy 2 dy n = y 1 E( x) ỹ Ẽ y 1 E(ỹ) f(y 1, x) dy 1 d x f(y 1, ỹ) dy 1 dỹ = I den inre integralen, för fixt x, gör vi substitutionen y 1 = ψ(x 1, x) varvid dy 1 = 1ψ(x 1, x)dx 1 och y 1 E( x) (y 1, x) E (ψ(x 1, x), x) E ϕ(x 1, x) E (x 1, x) x 1 ( x) Alltså får vi f = f(ψ(x 1, x), x) 1ψ(x 1, x)dx 1 d x E = x x 1 ( x) (f ϕ) 1ψ = f ϕ det ϕ
FLERVARIABEL 19 Vi visar nu att om sats 231 gäller för ϕ 1 och ϕ 2 så gäller den för ϕ 1 ϕ 2 ty låt ϕ 2 ϕ 1 1 E vara bijektioner som i satsen Antag att ϕ 1 ( 1 ) f1 = 1 f 1 ϕ 1 det ϕ 1 och att f2 ϕ 2 = f2 () ϕ 2 det ϕ 2 för godtyckliga f 1 : E R och f 2 : 1 R å har vi om ϕ = ϕ 1 ϕ 2 och f : E R att f = f = f ϕ 1 det ϕ 1 = f ϕ 1 det ϕ 1 = E ϕ 1 ( 1 ) 1 ϕ 2 () f ϕ 1 ϕ 2((det ϕ 1) ϕ 2) det ϕ 2 dvs Men av kedjeregeln har vi ϕ (x) = (ϕ 1 ϕ 2) (x) = (ϕ 1 ϕ 2(x)) ϕ 2(x) det ϕ (x) = det(ϕ 1 ϕ 2(x)) det ϕ 2(x) Således har vi visat att f = ϕ() f ϕ det ϕ et som återstår att visa är att varje avbildning ϕ : R n R n kan skrivas som en sammansättning av högst n stycken enkla avbildningar etta visas med hjälp av implicita funktionssatsen et blir naturligtvis ett lokalt resultat och eventuellt måste vi omnumrera koordinaterna vilket naturligtvis inte spelar något roll eftersom satsen är trivial för permutationer Vi behöver Lemma 234 Låt ϕ = (ϕ 1, ϕ 2,, ϕ n) vara en kontinuerligt deriverbar funktion från en öppen omgivning av a R n till R n sådan att 1ϕ 1(a) 0 å kan ϕ faktoriseras enligt ϕ = α β där vi för x nära a har där y i = ϕ i(x) (x 1, x 2,, x n) β (y 1, x 2,, x n) α (y 1, y 2,, y n) Bevis et räcker att visa att (y 2,, y n) kan lösas ut som en kontinuerligt deriverbar funktion av (y 1, x 2,, x n) i närheten av vår punkt Betrakta därför avbildningen ((y 1, x 2,, x n), (x 1, y 2,, y n)) (ϕ 1(x) y 1,, ϕ n(x) y n) från R n R n med värden i R n å har vi att 2 3 1ϕ 1(x) 0 0 0 1ϕ 2(x) 1 0 0 (ϕ 1(x) y 1,, ϕ n(x) y n) = 1ϕ 3(x) 0 1 0 (x 1, y 2,, y n) 6 7 4 5 1ϕ n(x) 1 0 1
20 LARS SVENSSON OCH ERIC NORENSTAM är invertibel i vår aktuella punkt eftersom dess determinant, som är ( 1) n 1 1ϕ 1(a), är nollskilld Implicita funktionssatsen fullbordar beviset Genom ett kompakthetsresonemang, som lämnas som övning, kan man visa att vårat kan delas upp i ett ändligt antal mindre områden 1, 2,, N sådana att j = och i j saknar inre punkter om i j och sådana att ϕ på varje j kan skrivas som en sammansättning av enkla avbildningar således har vi f = f ϕ det ϕ j ϕ( j ) j som ger ϕ() f = X etta visar satsen ϕ( j ) f = X f ϕ det ϕ = j f ϕ det ϕ j 24 Volymer av parallellepipeder Om A är en n m-matris med kolonner a 1, a 2,, a m i R n och m n, så spänner dessa upp en parallellepiped som vi betecknar Ep(a 1,, a m) = { X t ia i : 0 t i 1} Vi vill nu definiera dess m-dimensionella volym Till detta väljer vi enhetsvektorer b m+1,, b n som är parvis ortogonala och som dessutom är ortogonala mot alla a i:na Bilda också n (n m)- matrisen B med kolonnerna b m+1,, b n Vi har då att, om C = [A, B] är den n n-matris vi får en kolonnerna a 1, a 2,, a m, b m+1,, b n, (det C) 2 = det C T det C = det(c T C) Men» C T A T C = A B = B T» A T A 0 0 I så (det C) 2 = det(a T A) är således oberoende av valet av b:na Vi definierar den m-dimensionella volymen av Ep(a 1,, a m) genom Vol m Ep(a 1,, a m) = (det A T A) 1/2 25 Ytor och deras areor Låt R m σ S R n vara en kontinuerligt deriverbar och bijektiv avbildning sådan att σ är injektiv i hela, där m n:
FLERVARIABEL 21 e n e m t σ e m σ(t) S e 1 e 1 Vi definierar den m-dimensionella volymen av S eller arean eller måttet kort och gott genom (4) ds = (det σ T σ ) 1/2 S Övning 13 Visa att integralen i (4) bara beror av S, dvs antag att om σ = σ α där α : är kont deriverbar så är ds = (det σ T σ ) 1/2 S Anmärkning Vi skriver lite formellt att det oriktade areamåttet ges av i parametriseringen ds = (det σ (t) T σ (t)) 1/2 dt 1 dt m (t 1,, t m) σ(t 1,, t m) S 26 Flödesintegralen Låt R n 1 σ S R n vara en parametrisering av hyperytan S och antag N : S S n 1 = {x R n : x = 1} är normal till S etta betyder att N(σ(u)) är ortogonal mot Im σ (u) för alla u i efinition 261 (Orientering) Vi säger att σ är en positiv parametrisering till ytan S med normal N om det[σ, N σ] > 0 i hela Låt oss föreställa oss en inkompressibel vätska som strömmar i R 3 och som vi tiden t och punkten x har hastigheten F (x, t) och att densiteten är konstant lika med ett överallt Hur mycket vätska strömmar då genom en tänkt yta S per tidsenhet om vi räknar vätskan som strömmar med positiv inre produkt med normalen som positivt flöde Vi resonerar nu först en smula heuristiskt Betrakta en infinitesimal parallellepiped u + Ep[e 1du 1,, e n 1du n 1] i enna avbildas, via σ, på epipeden σ(u) + Ep[σ (u)e 1du 1,, σ (u)e n 1du n 1]
22 LARS SVENSSON OCH ERIC NORENSTAM enna senare, som är en liten epiped på ytan S, flyttas av flödet under den infinitesimala tiden dt, vektorn F (σ(u), t)dt Men då blir flödet genom denna epiped under tiden dt lika med determinanten det[σ (u)e 1du 1,, σ (u)e n 1du n 1, F (σ(u), t)dt] Således verkar det inte helt orimligt att definiera flödet ut genom S med normal N per tidsenhet genom det[σ, F (σ(u), t)]du 1 du n 1 och flödet som passerar ytan S mellan tidpunkterna a och b blir b «det[σ, F (σ(u), t)]du 1 du n dt a Vi ska hör inte syssla med flöden som beror av tiden, utan bara med stationära flöden, då F är oberoende av t Vi definierar då flödet av vektorfältet F : R n R n ut genom hyperytan S med normal N genom det[σ, F σ] om σ är positiv parametrising Vi ska nu visa att denna integral är oberoende av val av positiv parametrisering Låt nämnligen R n 1 α σ S där vi antar det α > 0 och sätt σ = σ α Vi har då α( ) det[σ, F σ] = det[σ α, F σ α] det α =» α = = = det[σ α, F σ] det det[(σ α)α, F σ] = det[ σ, F σ] där α 0 0 1 betecknar en n n-matrisvärd funktion på 27 Gauß sats 0 0 1 Låt F : R n R n vara ett vektorfält och Ω en kropp i R n med en randyta S med utåtgående normal N efiniera ϕt(x) = x + tf (x) Enligt variabelsubstitutionsformeln har vi då att 1 = det(id +tf ) = Vol ϕ t(ω) ϕ t (Ω) Ω =
FLERVARIABEL 23 etta gäller åtminstonde för t litet eftersom det(id +tf ) 1 om t 0 Låt λ 1,, λ n vara egenvärdena till F å har id +tf egenvärdena 1 + tλ 1,, 1 + tλ n, varför det(id +tf ) = (1 + tλ 1) (1 + tλ n) = 1 + t(λ 1 + + λ n) + O(t 2 ) = 1 + t sp F + O(t 2 ) Alltså har vi för t = 0 att d dt Vol ϕt(ω) = Ω sp F efinition 271 ivergensen av vektorfältet div F är spåret av F div F = sp F Övning 14 Visa att d dt t=0 Vol ϕt() = det[σ, F σ] dvs flödet av vektorfältet F ut ur S Vi har således Sats 272 (Gauß) Flödet av ett vektorfält F ut ur en yta S som omsluter en kropp Ω i R n är lika med integralen av divergensen av F över Ω det[σ, F σ] = div F om R n 1 σ S och om det[σ, N σ] > 0, där N är den utåtgående normalen till ytan S Övning 15 Visa genom att tillämpa Gauß sats för n = 2 på vektorfältet» Q F = P den sk Greens formel P dx + Qdy = Γ Ω (Q x + P y)dxdy där Γ är en kurva i planet som ör positivt orienterad och omsluter 273 Specialfallet R 3 (Fysiknotation med vektorstreck) Låt S vara en tvådimensionell yta i R 3 som parametriseras enligt R 2 (u, v) r r(u, v) R 3 och låt F : R 3 R 3 vara vårt vektorfält givet at F = (P, Q, R) å har vi sp F = P x + Q y + R z, där koordinaterna i R 3 kallas (x, y, z) som vanligt Vi har också då att 2 3 x x det[σ, F σ] = det[ r u, r P v, F u v r] = det 4 y y Q5 u v = r u r «v F ( r(u, v)) z u z v R
24 LARS SVENSSON OCH ERIC NORENSTAM Vi inför då också d s = r det[σ, F σ] = där S F d s = r u u S dudv Gauß sats blir då F d s = div F dv = Ω F ( r(u, v)) r(u, v) u 28 Stokes sats Ω div F «r(u, v) dudv v Låt F = (P, Q, R) vara ett vektorfält R 3 R 3 å är F F T en antisymmetrisk avbildning med matrisrepressentationen 2 3 2 3 2 3 P x P y P z P x Q x R x 0 P y Q x P z Rx 4Q x Q y Q z 5 4P y Q y R y 5 = 4Q x P y 0 Q z R y 5 R x R y R z P z Q z R z R x P z R y Q z 0 Vi vet att kryssprodukter i R 3 kan representeras med antisymmetriska 3 3-matriser och viceversa 2 3 2 3 2 3 2 3 2 3 a x bz cy 0 c b x 4b5 4y5 = 4cx az5 = 4 c 0 a5 4y5 c z zy bx b a 0 z Således har vi att 2 3 ( F F R y Q z T ) v = 4P z R x 5 v Q x P y Vi definierar rotationen av vektorfälltet F som 2 3 2 3 rot F P R y Q z = rot 4Q5 = 4P z R x 5 R Q x P y Vi får att rot F inte beror av vårt speciella val av ON-system, eftersom F F T bara beror av vårt val av inre produkt, som behövs för definition av transponatet Sats 281 (Stokes) Låt F vara ett kontinuerligt deriverbart vektorfält på R 3 och låt S vara en orienterade slät yta med randkurva Γ och normaltfält N riktade på vanligt sätt (figur) å gäller N rot F d s = S Γ F d r S Γ
FLERVARIABEL 25 Bevis Enligt definitionen på integralen räcker det att visa satsen då S består av ett ändligt antal plana trianglar Kalla trianglarna S 1, S 2,, S m och deras respektive randkurvor Γ 1, Γ 2,, Γ m Eftersom rot F d s = X rot F d s S i S i och F d r = X F r Γ i Γ i Så det räcker att visa satsen för en triangel som vi kallar S å vidare rot F är oberoende av koordinatsystem, så länge det är ON, kan vi utan inskränkning anta att S ligger h i xy-planet Låt nu = {[ x xy i y ] R 2 : S} och kalla den positivt orienterade 0 randen till för C å parametriseras S enligt 2 3» x x 4y5 S y 0 och vi har 2 3 0 d s = 405 dxdy 1 varför rot F d s = (Q x(x, y, 0) P y(x, y, 0))dxdy Greens formel i planet ger då rot F d s = (Q x(x, y, 0) P y(x, y, 0))dxdy = S = P (x, y, 0)dx + Q(x, y, 0)dy = C = P dx + Qdy + Rdz = F d r som visar satsen E-mail address: eno@mathkthse Γ Γ