Uppsala Universitet Matematiska Institutionen Bo Styf Flervariabelanalys 5 hp, för STS 010-03-19 Genomgånget på föreläsningarna 6-11. Föreläsning 6, 14/4 010: Vi fortsatte med ett par exempel, där kedjeregeln används för att transformera en differentialekvation till nya variabler, så att den går att lösa. En teknik med användande av differentialoperatorer kan därvid göra jobbet enklare. Vi tittade lite på detta. Avslutningsvis började vi undersöka nablaoperatorn och gradientvektorn till en funktion. Detta studium (av gradientvektorer är förmodligen det viktigaste vi gör i denna kurs. Exempel. Differentialekvationen x z x y z x y = x3 y ( har lösningar på formen z = g(x y. Bestäm alla sådana lösningar. Lösning. Antag att z = g(t, där t = x y, är en lösning. Med kedjeregeln får vi då z x = g (t t x = g (t (xy = (xy g (t, z xx = (z x x = ((xy g (t x = (y g (t + (xy g (t(xy = = (4x y g (t + (y g (t, z xy = (z x y = ((xy g (t y = (x g (t + (xy g (t(x = = (x 3 y g (t + (x g (t. Vi stoppar in dessa uttryck i ( och får Alltså gäller x 3 y = x z xx y z xy = = x ((4x y g (t + (y g (t y ((x 3 y g (t + (x g (t = = xy g (t. g (t = x3 y xy = 1 x y = t. Denna enkla differentialekvation har lösningen ( g(t = t dt = C t 4 Motsvarande lösningar till ( är z = f (x, y = C x4 y 4. 1
Lös differentialekvationen x z x + xy z x y + y z y = x y 1, x, y > 0 ( genom att transformera den till de nya variablerna u = x, v = x y 1. Lösning. Av u = x, v = x y 1 följer att x = u, y = u v 1, så variabelbytet innebär en inverterbar avbildning av första kvadranten (x, y > 0 i xy-planet på första kvadranten (u, v > 0 i uv-planet. Mot varje hygglig funktion f (x, y svarar alltså en unik hygglig funktion g(u, v, sådan att f (x, y = g(x, x y 1 och g(u, v = f (u, u v 1. Kedjeregeln ger f x = g u u x + g v v x = g u + y 1 g v, f y = g u u y + g v v y = x y g v. Här kunde vi nu fortsätta med andraderivatorna f xx, f xy, f yy, men det lämnas åt läsaren. I stället tar vi upp något om differentialoperatorer (i två variabler. De två grundläggande differentialoperatorerna är D x och D y (om de båda oberoende variablerna betecknas med x och y som står för derivering med avseende på x respektive y, alltså D x f = f x D y f = f y för en godtycklig deriverbar funktion f (x, y. En allmän första ordningens operator A fås som A = ϕ(x, y D x + ψ(x, y D y, där ϕ, ψ är hyggliga funktioner (vilket betyder att de har så många kontinuerliga derivator som behövs. Operatorn appliceras på en funktion f (x, y enligt A f = ϕ(x, y f x (x, y + ψ(x, y f y (x, y Låt B = g(x, yd x + h(x, yd y vara en annan första ordningens operator. Summan A + B och produkten AB av dessa båda operatorer definieras då genom respektive (A + B f = A f + B f = ϕ f x + ψ f y + g f x + h f y = (AB f = A(B f = A(g f x + h f y = (ϕ + g f x + (ψ + h f y = ϕ (g f x + h f y x + ψ (g f x + h f y y = ϕ (g x f x + g f xx + h x f y + h f yx + ψ (g y f x + g f xy + h y f y + h f yy = (ϕ g x + ψ g y f x + (ϕ h x + ψ h y f y + ϕg f xx + (ϕ h + ψ g f xy + ψh f yy
där f (x, y är en hygglig funktion. Formeln för produkten av två första ordningens differentialoperatorer är därför där och (ϕ D x + ψ D y (g D x + h D y = I + II, I = (ϕ g x + ψ g y D x + (ϕ h x + ψ h y D y II = ϕg D x + (ϕ h + ψ g D x D y + ψh D y Uttrycket II är vad vi får om vi behandlar alla termerna i produkten (ϕ D x + ψ D y (g D x + h D y som tal, vilket ju framför allt D x och D y inte är. Vi måste därför addera uttrycket I för att få en korrekt identitet. I specialfallet då B = A får vi (ϕ D x + ψ D y = (ϕ ϕ x + ψ ϕ y D x + (ϕ ψ x + ψ ψ y D y + ϕ D x + ϕ ψ D x D y + ψ D y Högerledet är här det som fås med första kvadreringregeln tillämpad på (ϕ D x + ψ D y plus den korrigeringsterm I = (ϕ ϕ x + ψ ϕ y D x + (ϕ ψ x + ψ ψ y D y som behövs för att det är operatorer, inte tal, vi sysslar med. Man ska inte lära sig de här formlerna utantill. Det enda man behöver komma i håg är reglerna D x D y = D y D x, D x (g D x = g x D x + g D x, D x (g D y = g x D y + g D x D y, D y (g D x = g y D x + g D x D y, D y (g D y = g y D y + g D y. Exempelvis har vi (x D x + y D y = (x D x + y D y (x D x + y D y = x (D x (xd x + D x (yd y + y (D y (xd x + D y (yd y = x (D x + xd x + yd x D y + y (xd y D x + D y + yd y = xd x + yd y + x D x + xy D x D y + y D y. Vi återvänder nu till differentialekvationen (. Genom att i denna sätta z = f (x, y och skriva derivatorna som multiplikation av f med differentialoperatorer (ex.vis f yy = D y f så blir ekvationen (x D x + xy D x D y + y D y f = x y 1 Men enligt ovan gäller att så ekvationen kan skrivas x D x + xy D x D y + y D y = (x D x + y D y (x D x + y D y Ovan fick vi med kedjeregeln att (x D x + y D y f (x D x + y D y f = x y 1 (# D x f = f x = g u + y 1 g v = g u + u 1 v g v = (D u + u 1 vd v g D y f = f y = x y g v = u 1 v g v = u 1 v D v g 3
för funktioner f (x, y, g(u, v som är relaterade enligt f (x, y = g(x, x y 1 och g(u, v = f (u, u v 1, svarande mot variabelbytet u = x, v = x y 1, x = u, y = u v 1. Vi har därför operatorsambanden D x = D u + u 1 v D v D y = u 1 v D v vilket ger x D x + y D y = u (D u + u 1 v D v + u v 1 ( u 1 v D v = u D u + v D v v D v = u D u I de nya variablerna kan därför ekvationen (# skrivas u v = (u D u g (u D u g = u D u (u D u g u D u g = u (1 D u + u Du g u D u g = u Dug = u g uu Den transformerade differentialekvationen är alltså g uu = u 1 v, som vi löser i två steg: g u = (u 1 vdu = v ln u + ϕ(v, g(u, v = (v ln u + ϕ(vdu = uv ln u uv + uϕ(v + ψ(v, där ϕ(v och ψ(v är två godtyckliga funktioner av v. Den andra termen uv kan här inkorporeras i den tredje termen uϕ(v, vilket ger förenklingen g(u, v = uv ln u + uϕ(v + ψ(v. Lösningen till ( ges av z = g(x, x y 1, alltså z = f (x, y = x y 1 ln x + x ϕ(x y 1 + ψ(x y 1, där ϕ(t och ψ(t är två godtyckliga (men hyggliga envariabelfunktioner. Föreläsning 7, 19/4 010: Nablaoperatorn eller gradientoperatorn i R är = i x + j y Applicerar vi denna operator på en funktion f (x, y så får vi vektorn f = i f x + j f y som kallas för gradienten, eller gradientvektorn, av funktionen f i punkten (x, y. Exempel. Låt f (x, y = x + y. Vi har då f = i f x + j f y = i(x + j(y = (x i + y j = r, 4
där r = x i + y j är lägesvektorn för en godtycklig punkt (x, y. En riktning är en vektor u = u 1 i + u j med längden 1, d.v.s u 1 + u funktion f (x, y i en punkt (a, b i riktningen u definieras som = 1. Derivatan av en f (a + u D u f (a, b = 1 t, b + u t f (a, b lim = g (0, t 0 t där g(t = f (a + u 1 t, b + u t. D u f (a, b mäter hur fort funktionen f (x, y växer då (x, y rör sig från (a, b i u-riktningen. Om f är C 1 (betyder att f x och f y är kontinuerliga så följer direkt ur kedjeregeln att Sätter vi här t = 0 så fås g (t = f x (a + u 1 t, b + u t u 1 + f y (a + u 1 t, b + u t u D u f (a, b = g (0 = f x (a, b u 1 + f y (a, b u = u f (a, b = f (a, b cos ϕ, ( där ϕ är vinkeln mellan vektorn u och gradientvektorn av f i (a, b (0 ϕ π. Av ( kan vi dra flera slutsatser För riktningsderivatan D u f (a, b gäller olikheterna f (a, b D u f (a, b f (a, b Den maximala riktningsderivatan D u f (a, b = f (a, b fås då ϕ = 0, d.v.s då u pekar i gradientvektorns riktning, alltså då u = f (a, b 1 f (a, b. Den minimala riktningsderivatan D u f (a, b = f (a, b fås då ϕ = π, d.v.s då u pekar motsatt gradientvektorns riktning, alltså då u = f (a, b 1 f (a, b. D u f (a, b = 0 om och endast om u är en tangentvektor till nivåkurvan till f, f (x, y = f (a, b, som går genom (a, b. Vi kallar denna nivåkurva för Γ. Tangentlinjen till Γ i (a, b har en ekvation f x (a, b(x a + f y (a, b(y b = 0. Normallinjen till Γ i (a, b har en ekvation (x, y = (a, b + t( f x (a, b, f y (a, b. Exempel. (forts. Låt f (x, y = x + y. Vi har då f (a, b = (a i + b j Gradientvektorn till f (x, y = x + y i (a, b pekar alltså rakt ut från origo. D u f (a, b = a u 1 + b u Då u = (a + b 1 (a i + b j fås det maximala värdet f (a, b = a + b på D u f (a, b. Då u = (a + b 1 (a i + b j fås det minimala värdet f (a, b = a + b på D u f (a, b. Nivåkurvan till f (x, y = x + y som går genom (a, b har ekvationen x + y = a + b, vilket är cirkeln kring origo med radien a + b. Tangentlinjen till cirkeln i (a, b har ekvationen 0 = a(x a + b(y b, vilket kan omskrivas till ax + by = a + b. Normallinjen till cirkeln i (a, b har ekvationen (x, y = (a, b + t(a, b. 5
Exempel. För en C 1 -funktion f (x, y gäller att f (1, 1 = 1, D u f (1, 1 = 8 5 och D v f (1, 1 = 1, där u = 1 (, 1 och v = 1 (1,. 5 5 5 (a I vilken riktning och med vilken hastighet avtar f (x, y snabbast i punkten (1, 1? (b Bestäm ekvationer för tangent- och normallinjerna till nivåkurvan f (x, y = 1 i punkten (1, 1. (c Bestäm en ekvation för tangentplanet och en ekvation för normallinjen till ytan z = f (x, y i punkten (1, 1, 1. (d Bestäm alla enhetsvektorer w sådana att D w f (1, 1 = 3. Bestäm för varje sådan vektor även vinkeln mellan w och gradientvektorn till f i punkten (1, 1. (e Ange flera enkla funktioner som har egenskaperna hos f ovan. Lösning. Antag att f (1, 1 = A i + B j. Vi har då 8 5 = u f (1, 1 = 1 5 (A B 1 5 = v f (1, 1 = 1 5 (A + B, vilket ger oss ekvationssystemet {A B = 8, A + B = 1}, med den unika lösningen A = 3, B =. Alltså gäller f (1, 1 = 3 i j. (a Snabbaste avtagandet sker i riktningen ( 3 i + j/ 13 med farten 13. (b En ekvation för tangentlinjen är 3(x 1 (y 1 = 0. En ekvation för normallinjen är (x, y = (1, 1 + t( 3,. (c En ekvation för tangentplanet är En ekvation för normallinjen är z = 1 + 3(x 1 (y 1 = 3x y (x, y, z = (1, 1, 1 + t(3,, 1. (d Antag att w = w 1 i + w j. Vi har då w 1 + w = 1 och 3w 1 w = 3. Av den andra ekvationen får vi w = 3 (w 1 + 1, vilket sätts in i den första ekvationen: 1 = w 1 + 9 4 (w 1 + 1, 4 = 4w 1 + 9(w 1 + w 1 + 1, 13w 1 + 18w 1 + 5 = 0, med rötterna w 1 = 1 (w = 0 och w 1 = 5 13 (w = 1 13. De sökta vektorerna är alltså w = i och w = 5 13 i + 1 13 j. I båda fallen gäller att w f (1, 1 = 3, d.v.s 13 cos ϕ = 3, så i båda fallen är vinkeln ( 3 ϕ = arccos. 13 6
(e Vi väljer att söka f av formen f (x, y = c + ax + by + αx + βxy + γy, där c, a, b, α, β, γ är konstanter, vilket betyder att f skall vara ett polynom i x, y av grad högst två. Alla borde vara överens om att sådana funktioner kan klassificeras som enkla. Funktionerna vi söker skall ha egenskaperna f (1, 1 = 1, f x (1, 1 = 3 och f y (1, 1 =. Då f x = a + αx + βy och f y = b + βx + γy får vi ekvationerna 1 = c + a + b + α + β + γ, 3 = a + α + β = b + β + γ Efter att ha eliminerat a, b från den första ekvationen får vi c = α + β + γ, a = 3 α β b = β γ Funktionerna, i den klass vi valt, som uppfyller kraven är alltså alla f (x, y = (α + β + γ + (3 α βx + ( β γy + αx + βxy + γy, där α, β, γ är godtyckliga reella konstanter. Alltså finns det oändligt många funktioner i klassen av polynom i x, y, av högst andra graden, som uppfyller kraven. Den allra enklaste funktionen f (x, y = 3x y får vi om vi tar α = β = γ = 0. Vi visste att den funktionen skulle vara med eftersom tangentplanet till z = f (x, y i (1, 1, 1 är z = 3x y. Tar vi α = γ = 1, β = 0 får vi f (x, y = + x 4y + x + y = (x + 1 + (y 9 4, i vilket fall ytan z = f (x, y är en rotationsparaboloid. Kan du svara på följande frågor: Går det att välja α, β, γ så att a = b = c = 0? Hur ser ytan z = f (x, y ut om vi väljer α = 1, β =, γ = 1? Välj β = 0 och α, γ sådana att a = b = 0. Beskriv ytan z = f (x, y i detta fall. Föreläsning 8, 0/4 010: För en funktion f (x, y, z är grafen w = f (x, y, z en hyperyta i R 4. gradientvektorn för funktionen är f (x, y, z = i f x + j f y + k f z, 7
där = i x + j y + k z är nablaoperatorn, alternativt gradientoperatorn, i tre variabler. För en sammansatt funktion g(t = f (r(t = f (x(t, y(t, z(t får vi, med kedjeregeln g (t = dx dt f x + dy f dt y + dz f dt z = v f där v = r = (x (t, y (t, z (t. Speciellt då u = u 1 i + u j + u 3 k är en enhetsvektor och r(t = (a + u 1 t, b + u t, c + u 3 t så är g (0 riktningsderivatan av f i punkten (a, b, c i riktningen u. Alltså D u f (a, b, c = u f (a, b, c = f (a, b, c cos ϕ, där ϕ är vinkeln mellan u och f (a, b, c. D u f (a, b, c mäter hur fort f (x, y, z växer då (x, y, z rör sig från a, b, c i u-riktningen. Följande gäller För riktningsderivatan D u f (a, b, c gäller olikheterna f (a, b, c D u f (a, b, c f (a, b, c Den maximala riktningsderivatan D u f (a, b, c = f (a, b, c fås då ϕ = 0, d.v.s då u pekar i gradientvektorns riktning, alltså då u = f (a, b, c 1 f (a, b, c. Den minimala riktningsderivatan D u f (a, b, c = f (a, b, c fås då ϕ = π, d.v.s då u pekar motsatt gradientvektorns riktning, alltså då u = f (a, b, c 1 f (a, b, c. D u f (a, b, c = 0 om och endast om u tangerar f :s nivåyta f (x, y, z = f (a, b, c, i punkten (a, b, c. Vi kallar denna nivåyta för Σ och drar slutsatsen att f (a, b, c är vinkelrät mot Σ i punkten (a, b, c. Av föregående följer att tangentplanet till Σ i (a, b, c har en ekvation f x (a, b, c(x a + f y (a, b, c(y b + f z (a, b, c(z c = 0. Normallinjen till Γ i (a, b, c har en ekvation (x, y, z = (a, b, c + t( f x (a, b, c, f y (a, b, c, f z (a, b, c. Exempel. Bestäm tangentplanet och normallinjen till ellipsoiden 4x + 9y + 36z = 49 i punkten ( 1, 1, 1. Lösning. Låt f (x, y, z = 4x + 9y + 36z Vi har och alltså f = (8xi + (18yj + (7zk = (4xi + 9yj + 36zk f ( 1, 1, 1 = ( 4i + 9j + 36k En normalvektor till ellipsoiden i punkten ( 1, 1, 1 är därför n = 4i + 9j + 36k. Av detta följer omedelbart att ( 4(x + 1 + 9(y 1 + 36(z 1 = 0 är en ekvation för tangentplanet till ellipsoiden i punkten ( 1, 1, 1 och (x, y, z = ( 1, 1, 1 + t( 4, 9, 36, t R är en normallinje till ellipsoiden i punkten ( 1, 1, 1. 8
Vi tittade sedan på några problem för vars lösande implicita funktionssatsen behövs: En ekvation F(x, y = 0 beskriver i allmänhet en kurva i planet. Att denna kurva är en funktionskurva betyder att för varje x R finns det högst ett y R sådant att F(x, y = 0. För varje x där ett sådant y finns gäller alltså att y bestäms entydigt av x, alltså att y är en funktion av x, vilket skrivs som y = y(x. Om vi antar att F(x, y och y(x är hyggliga funktioner så kan vi, med användning av kedjeregeln, derivera båda leden i ekvationen F(x, y(x = 0 med avseende på x. Vi får då 0 = d dx F(x, y(x = F x(x, y + F y (x, y y (x y (x = F x(x, y F y (x, y, ( förutsatt att F y (x, y = 0 (y = y(x överallt. Vad implicita funktionssatsen säger är att om F(x, y är hygglig, F(a, b = 0 och F y (a, b = 0 så finns det positiva tal δ 1, δ och en funktion y = y(x, a δ 1 < x < a + δ sådan att F(x, y(x = 0, y(a = b och y(x är (minst lika hygglig som F(x, y. För att derivera y(x använder vi (. Exempel. Visa att för varje x R finns ett unikt y = y(x R sådant att y 3 + y = e x. Visa också att funktionen y(x är oändligt deriverbar och bestäm y(0, y (0, y (0. Lösning. Låt F(x, y = y 3 + y e x och fixera ett godtyckligt x R. Vi ska visa att det finns precis ett y-värde, y = y(x, sådant att F(x, y = 0. Då F y = 3y + 1 > 0, för alla y R, följer att F(x, y växer strängt, som funktion av y (glöm inte att x är fixt, då < y <. En strängt växande funktion har högst ett nollställe, så det finns alltså högst ett y sådant att F(x, y = 0. Å andra sidan har vi lim y F(x, y = och lim y F(x, y =. En kontinuerlig funktion som antar både positiva och negativa värden har minst ett nollställe, så det finns alltså minst ett y sådant att F(x, y = 0. Detta resonemang visar att det för varje x R finns precis ett y = y(x sådant att F(x, y = 0. Av implicita funktionssatsen följer att funktionen y(x är oändligt deriverbar överallt (eftersom F(x, y är det. Sätter vi in x = 0 i ekvationen 0 = y 3 + y e x får vi ekvationen 0 = y(0 3 + y(0, med den unika lösningen y(0 = 1 Deriverar vi ekvationen 0 = y 3 + y e x implicit med avseende på x får vi 0 = (3y + 1y e x y = ex 3y + 1, y (0 = e 0 3y(0 + 1 = 1 Deriverar vi nu ekvationen 0 = (3y + 1y e x implicit med avseende på x får vi 0 = (3y + 1y + 6y(y e x y = ex 6y(y 3y + 1, y (0 = 3 3 + 1 = 1 8. En ekvation F(x, y, z = 0 beskriver i allmänhet en yta i rummet. Att denna yta är en funktionsyta med avseende på (x, y betyder att för varje (x, y R finns det högst ett z R sådant att F(x, y, z = 0. För varje (x, y där ett sådant z finns gäller alltså att z bestäms entydigt av (x, y, alltså att z är en funktion av (x, y, vilket skrivs som z = z(x, y. Om vi antar att F(x, y, z och z(x, y är hyggliga funktioner så kan vi, med 9
användning av kedjeregeln, derivera båda leden i ekvationen F(x, y, z(x, y = 0 med avseende på x respektive y. Vi får då 0 = x F(x, y, z(x, y = F x(x, y, z + F z (x, y, z z x z x = F x(x, y, z F z (x, y, z, 0 = y F(x, y, z(x, y = F y(x, y, z + F z (x, y, z z y z y = F y(x, y, z F z (x, y, z. (# förutsatt att F z (x, y, z = 0 (z = z(x, y överallt. Vad implicita funktionssatsen säger är att om F(x, y, z är hygglig, F(a, b, c = 0 och F z (a, b, c = 0 så finns det en omgivning U till (a, b och en funktion z = z(x, y, (x, y U, sådan att F(x, y, z(x, y = 0, z(a, b = c och z(x, y är (minst lika hygglig som F(x, y, z. För att derivera z(x, y använder vi (#. Exempel. Visa att ekvationen x 3 xyz + z 3 + 3 = 0, för (x, y, z i en omgivning av (1, 1,, definierar z som en C -funktion z = z(x, y av x och y, sådan att z(1, 1 =. Beräkna även z(1, 1. Lösning. Låt F(x, y, z = x 3 xyz + z 3 + 3. Vi har då F(1, 1, = 0, F x = 3x y z, F y = x z, F z = xyz + 3z. Eftersom F z (1, 1, = 8 = 0 och F(x, y, z är C (har kontinuerliga derivator av alla ordningar följer existensen av funktionen z = z(x, y (med de angivna egenskaperna av implicita funktionssatsen. Slutligen har vi vilket ger z(1, 1 = 7 8 i + 1 j. Ett, linjärt eller olinjärt, ekvationssystem z x (1, 1 = F x(1, 1, F z (1, 1, = 7 8, z y (1, 1 = F y(1, 1, F z (1, 1, = 1, 0 = F(x, y, z 0 = G(x, y, z ( beskriver i allmänhet en kurva Γ i rummet. Att Γ är en funktionskurva med avseende på x betyder att för varje x R finns det högst en punkt (y, z R sådan att F(x, y, z = 0 och G(x, y, z = 0. För varje x där en sådan (y, z finns gäller alltså att (y, z bestäms entydigt av x, alltså att (y, z är en funktion av x, vilket skrivs som (y, z = (y(x, z(x eller y = y(x, z = z(x. Om vi antar att F(x, y, z, G(x, y, z, y(x och z(x är hyggliga funktioner så kan vi, med användning av kedjeregeln, derivera båda leden i ekvationssystemet ( med avseende på x. Vi får då 0 = F x (x, y, z + F y (x, y, z y (x + F z (x, y, z z (x 0 = G x (x, y, z + G y (x, y, z y (x + G z (x, y, z z (x (# 10
där y = y(x, z = z(x överallt. Vi kan se (# som ett ekvationssystem med y (x, z (x som obekanta. Skrivet på matrisform blir systemet ( Fy F z G y G z ( y (x z (x ( Fx = G x Lösningen till systemet ges av ( y (x z (x ( Fy F = z G y G z 1 ( Fx G x = F y G y F z G z 1 ( Gz F z G y F y ( Fx G x Vad implicita funktionssatsen säger är att om F(x, y, z och G(x, y, z är hyggliga, (F, G F(a, b, c = 0, G(a, b, c = 0 och (y, z = F y F z = 0 (a,b,c (a,b,c så finns det en omgivning U till a och funktioner y = y(x, z = z(x, x U, sådana att F(x, y(x, z(x = 0, G(x, y(x, z(x = 0, y(a = b, z(a = c och y(x, z(x är (minst lika hyggliga som F(x, y, z och G(x, y, z. För att derivera y(x, z(x använder vi (#. Exempel. En kurva Γ ges av ekvationssystemet 3 = y + z + e x+z = F(x, y, z 1 = x + z + e y+z = G(x, y, z Bestäm tangentriktningen till Γ i punkten (, 1, och avgör om Γ, i en omgivning av (, 1,, kan parametriseras med z som parameter. Lösning. Vi löser båda problemen samtidigt. Här ska x och y uttryckas som funktioner av z, i en omgivning av (, 1,. För att detta säkert skall vara möjligt måste (F, G (x, y = F x F y = 0. (, 1, (, 1, Eftersom F x = e x+z, F y = 1, F z = 1 + e x+z, G x = 1, G y = e y+z, G z = 1 + e y+z, F x (, 1, =, F z (, 1, = 3, G y (, 1, = och G z (, 1, = får vi F x G x F y G y G x G y = ex+z 1 (, 1, 1 e y+z = 1 (, 1, 1 = 3 = 0. Enligt implicita funktionssatsen existerar därför C -funktioner x(z, y(z, för z i en omgivning av, sådana att F(x(z, y(z, z = 3, G(x(z, y(z, z = 1, x( = och y( = 1. Derivatorna x (z, y (z ges av matrisekvationen ( Fx F y G x G y ( x (z y (z ( Fz = G z G y G z som har lösningen ( x (z y (z = F x G x F y G y 1 ( Gy F y G x F x ( Fz G z 11
Speciellt har vi ( x ( y ( = 1 1 1 ( 1 1 ( 3 = 1 3 ( 4 1 Γ har i en omgivning av (, 1, parametriseringen r(z = (x(z, y(z, z. En tangentvektor till Γ i (, 1, är därför r ( = (x (, y (, 1 = ( 4 3, 1 3, 1. Tangentriktningen går i samma, eller motsatt, riktning som r (. Föreläsning 9, 1/4 010: Vi påminner om att för en N + 1 gånger kontinuerligt deriverbar funktion f (x har vi, för godtyckligt a, Taylorutvecklingen f (a + h = f (a + f (ah + f (a Taylorpolynomet av ordning N i a är P N (h = f (a + f (ah + f (a h + + f N (a N! h + + f N (a N! h N + O(h N+1 Taylorpolynomet är unikt i den meningen att om Q(h är ett polynom av grad högst N sådant att f (a + h = Q(h + O(h N+1 så gäller Q = P N. För en tvåvariabelfunktion f (x, y inför vi beteckningen f (m,n (a, b för evalueringen i (a, b av den funktion som erhålls då vi deriverar f (x, y m gånger med avseende på x och n gånger med avseende på y. Om funktionens alla derivator är kontinuerliga, vilket vi antar, spelar det ingen roll i vilken ordningsföljd dessa m + n deriveringar utförs, så f (m,n (a, b är entydigt definierade. Taylorpolynomet för f (x, y, av ordning N i (a, b, definieras nu som Exempelvis har vi P N (h, k = m+n N P (h, k = f (a, b + f x (a, bh + f y (a, bk + f xx(a, b P 3 (h, k = P (h, k + f xxx(a, b h 3 + f xxy(a, b 6 P 4 (h, k = P 3 (h, k + H 4 (h, k, H 4 = f (4,0 (a, b 4 där h 4 + f (3,1 (a, b 6 f (m,n (a, b m! n! h m k n. h + f xy (a, b h k + f yy(a, b h k + f xyy(a, b h 3 k + f (, (a, b 4 h k + f yyy(a, b 6 h k + f (1,3 (a, b 6 Lägg märke till de fem potenserna, h 4, h 3 k, h k, h k 3, k 4, av grad 4. k 3 k, h k 3 + f (0,4 (a, b 4 Precis som i envariabelfallet är Taylorpolynomet en god approximation till funktionen nära den punkt man utvecklar kring. Närmare bestämt gäller f (a + h, b + k = P N (h, k + O((h + k N+1 1 k 4.
Taylorpolynomet är unikt i den meningen att om Q(h, k är ett polynom av grad högst N sådant att f (a + h, b + k = Q(h, k + O((h + k N+1 så gäller Q = P N. Exempel. Låt f (x, y = x 4 + e 4y 4x e y. Bestäm Taylorpolynomet av ordning två till f (x, y i (a (0, 0, (b (1, 0. Lösning. Vi behöver derivatorna upp till och med ordning två: f x = 8x 3 8x e y, f y = 4e 4y 4x e y, f xx = 16x 8x e y, f xy = 8x e y, f yy = 16e 4y 4x e y. f (0, 0 = 1, f x (0, 0 = 0, f y (0, 0 = 4, f xx (0, 0 = 8, f xy (0, 0 = 0, f yy (0, 0 = 16, f (1, 0 = 1, f x (1, 0 = 0, f y (1, 0 = 0, f xx (1, 0 = 8, f xy (1, 0 = 8, f yy (1, 0 = 1. (a Taylorpolynomet av ordning två i origo är P (h, k = 1 + 4k 4h + 8k. Derivatan av f i riktningen u = u 1 i + u j är D u f (0, 0 = 4u. I origo växer alltså funktionen strängt i riktningen j, medan den avtar strängt i den motsatta riktningen j. I riktningarna ±i är däremot funktionen stationär (varken växer eller avtar. Det betyder, som vi har sett, att ±i är tangentvektorer till nivåkurvan f (x, y = f (0, 0 = 1, som går genom origo. (b Taylorpolynomet av ordning två i (1, 0 är P (h, k = 1 + 4h 8hk + 6k. Då f x (1, 0 = f y (1, 0 = 0 är (1, 0 en stationär punkt. I närheten av en sådan bestäms normalt funktionens beteende av andragradstermerna i Taylorutvecklingen. Här gäller f (1 + h, k = 1 + 4h 8hk + 6k + O((h + k 3 = 1 + 4(h hk + 6k + O((h + k 3 = 1 + 4(h k + k + O((h + k 3 Andragradsuttrycket 4(h k + k är positivt för alla (h, k = (0, 0. Om vi bortser från resttermen O((h + k 3 betyder det att f (1 + h, k antar ett strikt minimum f (1, 0 = 1 då h = k = 0. Då (h, k ligger nära (0, 0 är resttermen O((h + k 3 så liten att f (1 + h, k = 1 + 4(h k + k + O((h + k 3 > f (1, 0 = 1 då (h, k = (0, 0 Alltså har vi ett strikt lokalt minimum 1 i (1, 0. 13
Resonemanget ovan kan generaliseras: Om (a, b är en stationär punkt till f (x, y, alltså så har vi kring (a, b Taylorutvecklingen f x (a, b = f y (a, b = 0, f (a + h, b + k = f (a, b + 1 ( f xx(a, b h + f xy (a, b h k + f yy (a, b k + O((h + k 3 = f (a, b + 1 (A h + B h k + C k + O((h + k 3, där A = f xx (a, b, B = f xy (a, b, C = f yy (a, b. Matrisen ( ( fxx (a, b f H f (a, b = H(a, b = xy (a, b A B = f xy (a, b f yy (a, b B C kallas för Hessianen (eller Hessianska matrisen i punkten (a, b. Följande gäller Om D = A B B C = AC B = 0 kan vi inte från Hessianen avgöra om (a, b är en lokal extrempunkt eller en sadelpunkt. Det måste avgöras på annat sätt! Om D < 0 så är (a, b är en sadelpunkt. Om D > 0 och A > 0 så är (a, b är en strikt lokal minimipunkt. Om D > 0 och A < 0 så är (a, b är en strikt lokal maximipunkt. I ovanstående exempel har vi H f (1, 0 = H(1, 0 = ( 8 8 8 1 vilket ger D = 3 > 0, A = 8 > 0 och alltså, även denna gång, ett strikt lokalt minimum i (1, 0. Exempel. Bestäm alla stationära punkter till f (x, y = x 4 + y 4 4xy och avgör deras karaktär. Lösning. De stationära punkterna ges av ekvationssystemet 0 = f x = 4x 3 4y y = x 3 0 = f y = 4y 3 4x x = y 3 Vi får x = y 3 = x 9, x 9 x = 0, x(x 8 1 = 0, så lösningarna är x = y = 0, x = y = 1, x = y = 1. De stationära punkterna är alltså (0, 0, (1, 1, ( 1, 1. Hessianen är ( ( fxx f H = xy 1x 4 = 4 1y Då H(0, 0 = ( 0 4 4 0 f xy f yy ( 1 4, H(1, 1 = H( 1, 1 = 4 1 drar vi slutsatsen att (0, 0 är en sadelpunkt (D < 0, medan (1, 1, ( 1, 1 är strikta lokala min-punkter (D > 0, f xx > 0. 14
Exempel. Bestäm alla stationära punkter till f (x, y = x 3 + x + 4x + 3x y + 3xy xy + y 3 + y 4y och avgör deras karaktär. Lösning. De stationära punkterna ges av 0 = f x = 3x + x + 4 + 6xy + 3y y 0 = f y = 3x + 6xy x + 3y + y 4 Subtraherar vi den andra ekvationen från den första så får vi 0 = 4x 4y + 8, alltså y = x +, som substitueras i den andra ekvationen: 0 = 3x + 6x(x + x + 3(x + + (x + 4 = 3x + 6x + 1x + 1x x + 3(x + 4x + 4 + x + 4 4 = 1x + 4x + 1 = 1(x + 1 Enda lösningen är x = 1, y = 1 + = 1. Vi har en unik stationär punkt ( 1, 1. Hessianen ges av ( ( ( fxx f H = xy 6x + + 6y 6x + 6y =, H( 1, 1 = 6x + 6y 6x + 6y + f xy f yy Vi har därför D = 4 4 = 0, så detta är ett fall då vi inte kan avgöra den stationära punktens karaktär genom att bara betrakta Hessianen. För att få en tydligare bild av vad som händer i närheten av ( 1, 1 gör vi substitutionen x = 1 + h, y = 1 + k och får f ( 1 + h, 1 + k = ( 1 + h 3 + ( 1 + h + 4( 1 + h + 3( 1 + h (1 + k Om vi här sätter k = h får vi Då h < 0 gäller därför Då h > 0 har vi Alltså är ( 1, 1 en sadelpunkt. + 3( 1 + h(1 + k ( 1 + h(1 + k + (1 + k 3 + (1 + k 4(1 + k = 4 + h hk + k + h 3 + 3h k + 3hk + k 3 = 4 + (h k + h 3 + 3h k + 3hk + k 3. f ( 1 + h, 1 + h = 4 + 8h 3. f ( 1 + h, 1 + h < 4 = f ( 1, 1. f ( 1 + h, 1 + h > 4 = f ( 1, 1. Föreläsning 10, 6/4 010: Här tog vi upp problemet att hitta extrempunkterna (max och min till en kontinuerlig funktion f (x, y (eller f (x, y, z, som är definierad på ett kompakt område D. Både maximum och minimum existerar, enligt sats. Om en extrempunkt ligger inuti området (ej på randen och funktionen är deriverbar så måste punkten vara stationär, dvs. f x = f y = 0 i punkten. Om den ligger på randen är det svårare. Exempel. Bestäm, om de existerar, extremvärdena av funktionen f (x, y = x 3 + xy 3x + y, då x + y. 15
Lösning. Både maximum och minimum existerar eftersom funktionen är kontinuerlig och x + y beskriver en kompakt cirkelskiva. En inre extrempunkt (x + y < måste vara stationär, alltså 0 = f x = 3x + y 3 0 = f y = xy + y = y(x + 1 Den andra ekvationen ger y = 0 eller x = 1. Om y = 0 ger den första ekvationen x = 1, x = ±1. Om x = 1 ger den första ekvationen y = 0, y = 0. De stationära punkterna är alltså (±1, 0. Vi lägger funktionsvärdena f (1, 0 =, f ( 1, 0 =, på minnet. Randen utgörs av cirkeln x + y =. För punkter på randen kan funktionen förenklas. Vi har där f (x, y = x(x + y 3x + ( x = x x = g(x, x. Då g (x = 1 x = (x + 1 gäller att g ( 1 = 0, g (x > 0 då x < 1 och g (x < 0 då 1 < x. Maximum av g(x är alltså g( 1 = 9 4 = f ( 1, ± 7 4, medan minimum av g(x är det minsta av värdena g(± =, alltså g( = = f (, 0. Jämförs nu funktionsvärdena i extrempunktskandidaterna (±1, 0, ( 1, ± 7 4 och (, 0 ser vi att maximum av f är 9 4 = f ( 1, ± 7 4 och minimum av f är = f (1, 0. Att vi klarade ovanstående exempel berodde mycket på att funktionen, på randen, kunde skrivas som en envariabelfunktion (y kunde elimineras. I allmänhet är inte detta så lätt. Vi har att finna max och min av en funktion f (x, y på en nivåkurva g(x, y = 0 till en annan funktion (g. Genom ett resonemang, som inte upprepas här, insåg vi att i en extrempunkt (a, b måste f (a, b vara vinkelrät mot nivåkurvan och därför parallell med g(a, b, vilket ger oss ekvationen 0 = f x f y g x Denna, tillsammans med ekvationen g(x, y = 0, ger oss ett, i allmänhet olinjärt, ekvationssystem med två ekvationer och två obekanta. Extrempunkterna hittar vi i lösningsmängden till ekvationssystemet (vilket förhoppningsvis är en ändlig mängd. Tillämpar vi denna metod på ovanstående exempel, där g(x, y = x + y, får vi 0 = f x f y g x g y = 3x + y 3 y(x + 1 x y = y x 1 x + x 1 = y 1 x 1 = 4y(x + 1 med samma lösningar, y = 0 eller x = 1, som vi fick förut. g y 16
Föreläsning 11, 9/4 010: På samma sätt kan vi förfara då vi letar efter extremvärden till f (x, y, x, under ett bivillkor g(x, y, z = 0 (de tillåtna punkterna ligger på en nivåyta till g. I en extrempunkt (a, b, c måste f (a, b, c vara vinkelrät mot ytan och därför parallell med g(a, b, c, som vi antar är en nollskild vektor. Alltså ska det finnas ett tal λ sådant att f (a, b, c = λ g(a, b, c. Detta kan även uttryckas som att f x g x = f y g y = f z g z eller 0 = f x g x f y g y = f x g x f z g z = f y i punkten (a, b, c. Vi får ett olinjärt ekvationssystem med tre ekvationer och tre obekanta, vilket normalt har ett ändligt antal punkter som lösning. Bland dessa punkter finns max- och minpunkterna. Exempel. Visa att funktionen f (x, y, z = x y z har ett största värde då x 0, y 0, z 0, x + y + z = 1 och bestäm detta. Lösning. De tillåtna punkterna utgör en kompakt triangel i första oktanten och funktionen är kontinuerlig. Enligt en känd sats om kontinuerliga funktioner har därför funktionen ett maximum. Eftersom f (x, y, z 0 i alla dessa punkter och f (x, y, z = 0 då x = 0, y = 0 eller z = 0, så måste maximum antas i en punkt där x > 0, y > 0, z > 0 och g(x, y, z = x + y + z 1 = 0. I maxpunkten är f parallell med g, vilket ger oss ekvationerna g y f z g z 1 x 1 y z 1 = x 1 z 1 = x 1 y z 1 Multiplicera nu alla leden med x 1 z 1 så erhålls yz = xz = 4xy, vilket ger y = x, z = 4x och 1 = x + x + 4x = 7x. Vi har därför den unika lösningen (x, y, z = ( 1 7, 7, 3 7, vilket måste vara max-punkten. Max-värdet är f ( 1 7, 7, 3 7 = 3 401 7. Ytterligare en variant är att vi söker extremvärden till en funktion f (x, y, z, där (x, y, z måste befinna sig på skärningskurvan Γ mellan två ytor g(x, y, z = 0 och h(x, y, z = 0. Med samma typ av resonemang som förut inser man att i en extrempunkt (a, b, c måste f (a, b, c vara vinkelrät mot Γ. Eftersom både g(a, b, c och h(a, b, c är vinkelräta mot Γ i (a, b, c ligger alltså alla tre vektorerna f (a, b, c, g(a, b, c och h(a, b, c i normalplanet till Γ i punkten (a, b, c. Från den linjära algebra vet vi att detta innebär att determinanten med de tre vektorerna som rader (eller kolonner försvinner. Alltså uppfyller extrempunkterna ekvationen 0 = f x f y f z g x g y g z h x h y h z Återigen får vi ett, i allmänhet olinjärt, ekvationssystem med tre ekvationer och tre obekanta, där extrempunkterna befinner sig bland lösningarna. Exempel. En behållare har formen av en rätvinklig parallellepiped (rektangulär låda med arean 3 dm och totala kantlängden 9 dm. Bestäm behållarens maximala volym.. 17
Lösning. Låt behållarens bredd, djup och höjd vara x, y respektive z (dm. Behållarens volym är då xyz. Arean är xy + xz + yz, medan totala kantlängden är 4x + 4y + 4z. Problemet är alltså att maximera funktionen f (x, y, z = xyz under bivillkoren g(x, y, z = xy + xz + yz 3 = 0 och h(x, y, z = x + y + z 9 4 = 0. Dessutom ska förstås x, y och z vara icke-negativa. Bivillkoren definierar en kompakt mängd i första oktanten så maximum existerar enligt sats. I en max-punkt gäller att f x f y f z 0 = g x g y g z h x h y h z = yz xz xy y + z x + z x + y 1 1 1 y(z x x(z y xy = z x z y x + y = (z x(z y(y x, 0 0 1 vilket inträffar då z = x, z = y eller y = x. Av symmetriskäl räcker det att behandla ett av dessa tre fall. Vi väljer fallet då y = x. Stoppar vi in detta i bivillkoren får vi 3 = x + xz + xz = x + xz 9 4 = x + x + z = x + z Den andra ekvationen ger z = 9 4 x. Substituerar vi detta i den första ekvationen får vi x 3 x + 1 = 0, med lösningarna x = 1 eller x = 1. En av punkterna (1, 1, 1 4, ( 1, 1 4, 5 4 är därför en max-punkt. Eftersom f (1, 1, 1 4 = 1 4 och f ( 1, 1, 5 4 = 5 16 så är den maximala volymen lika med 5 16 liter (dm3. 18