Analys 36 En webbaserad analyskurs Differentialkalkyl Differentierbara funktioner Anders Källén MatematikCentrum LTH anderskallen@gmail.com
Differentierbara funktioner 1 (16) Introduktion I det här kapitlet ska vi diskutera hur man deriverar funktioner som inte nödvändigtvis är funktioner av en variabel. Vi börjar med att repetera definitionen i endim. Sedan ska vi se hur vi naturligt generaliserar den definitionen till ett begrepp differentierbarhet för funktioner av flera variabler. Kopplat till det är en storhet, differentialen, som fungerar ungefär som derivatan i endim. Mer precist, derivatan f (a) i endim är riktningskoefficenten för tangenten i punkten a, medan differentialen är funktionen h f (a)h och beskriver hur mycket vi ändrar oss i y-led på tangenten då vi flyttar oss sträckan h från a i x-led. Denna differential kan generaliseras till flera variabler där den blir ett användbart redskap som svarar mot derivatan och som kan hantera att vi har många fler riktningar att gå i utifrån en punkt, Naturligtvis finns det i flerdim också koordinatspecifika derivator, s.k. partiella derivator, vilka är vanliga derivator i koordinataxlarnas riktningar. Vad differentialen gör är att den möjliggör för oss att beräkna vanliga derivator i godtyckliga riktningar, inte bara i koordinataxlarnas riktningar. Den kanske viktigaste egenskapen hos differentialen, som skiljer den från de partiella derivatorna, är att den egentligen inte beror av vilka koordinater man använder när man beskriver sin funktion, ett fenomen som kallas differentialens invarians. Derivatans definition och räknelagar Definitionsmässigt gäller att en funktion är differentierbar i en punkt a om vi kan skriva f(x) f(a) = A(x, a)(x a) där funktionen x A(x, a) är kontinuerlig i x = a. Dess värde A(a, a) i punkten a betecknas f (a) och kallas derivatan av f i punkten a. När f är en funktion av en variabel kan vi dividera med (x a) och får att A(x, a) = (f(x) f(a))/(x a), en s.k. differenskvot. Att vara differentierbar innebär då att följande gränsvärde existerar f f(x) f(a) (a) = lim, x a x a vilket innebär att vi bara infört ett nytt namn för deriverbarhet. Detta gäller i endim, i flerdim blir det lite annorlunda. Exempel 1 Som en första tillämpning av definitionen kan vi visa att f(x) = x inte är differentierbar i origo. Vi har nämligen att och alltså att f(x) f() = x = x (x ), x { A(x, ) = x x = 1 om x > 1 om x <, som uppenbarligen inte är kontinuerlig i origo.
Differentierbara funktioner 2 (16) Exempel 2 Vi ska använda definitionen till att visa att funktionen f(x) = x är deriverbar i varje punkt a >. Med hjälp av konjugatregeln får vi f(x) f(a) = x a = x a x + a så vi ser att A(x, a) = 1/( x + a), och den är kontinuerlig då x = a. Derivatan ges därför av A(a, a) = 1/2 a, d.v.s f (a) = 1 2 a. Om derivatan är en kontinuerlig funktion får vi ett explicit uttryck för A(x, a) med hjälp av insättningsformeln. Vi har nämligen att f(x) f(a) = x a f (t)dt = ( f (a + s(x a))ds)(x a), (1) där vi gjort variabelbytet t = a + s(x a) i den andra likheten. Det följer att A(x, a) = f (a + s(x a))ds, vilket är en kontinuerlig funktion [1] vars värde i a är f (a). Denna formel är mycket användbar i olika teoretiska sammanhang som vi ska illustrera längre fram i detta kapitel. En väldigt icke-snäll funktion kan trots allt vara deriverbar i en punkt som följande exempel visar. Exempel 3 Funktionen { om x är irrationellt eller ett heltal f(x) = 1/q 2 om x = p/q (förkortat) är diskontinuerlig i varje punkt a som är ett rationellt tal men inte ett heltal. Men vi har att att f(x) x 2 för alla x, från vilket det följer att f(x) då x, men också att f f(x) () = lim x x =. Funktionen är alltså deriverbar i origo. Följande observation är en självklarhet från definitionen
Differentierbara funktioner 3 (16) Sats 1 En funktion är kontinuerlig i de punkter den är deriverbar i. Bevis. Eftersom f(x) f(a) = A(x, a)(x a) när x ligger nära a, får vi att lim f(x) = f(a) + lim A(x, a)(x a) = f(a) + f (a) = f(a). x a x a Vi avslutar detta avsnitt med en annan observation. Från den endimensionella analysen vet vi att om derivatan är positiv i ett intervall, så gäller att funktionen är strängt växande i detta intervall. Däremot räcker det inte med att derivatan är positiv i en punkt för att funktionen ska vara växande i någon omgivning av den punkten, som nästa exempel visar. Exempel 4 Betrakta funktionen f(x) = x + x 2 sin( 1 ), x. x2 Om vi definierar den som noll i origo så blir den uppenbarligen kontinuerlig överallt. Att den är differentierbar överallt där x är självklart eftersom den är uppbyggd av elementära funktioner. Funktionen är dessutom differentierbar i origo med y f () = 1, vilket följer av att f(x) = A(x)x med A(x) = 1 + x sin(1/x 2 ) som är kontinuerlig i noll. För x har vi derivatan f (x) = 1 + 2x sin( 1 x 2 ) 2 x cos( 1 x 2 ). x Denna svänger kraftigt kring x = och det finns t.ex. punkter där derivatan är negativ godtyckligt nära origo. Så funktionen är definitivt inte växande i en omgivning av origo. Däremot gäller att om x > så är f(x) > x x 2 > = f(), och motsvarande då x <, så värden till höger om origo är större än värden till vänster om origo. Anmärkning Dock är det naturligtvis så att om derivatan är positiv i en punkt och dessutom kontinuerlig, så är derivatan positiv i en omgivning av punkten och då är funktionen strängt växande i denna omgivning. I exemplet är derivatan inte kontinuerlig.
Differentierbara funktioner 4 (16) Räkneregler för derivatan I detta avsnitt ska vi sammanfatta, och härleda, de viktigaste räknereglerna för derivatan i endim. Dessa är a) (f + g) (a) = f (a) + g (a), b) (fg) (a) = f (a)g(a) + f(a)g (a) c) (f g) (a) = f (g(a))g (a). Den sista av dessa kallas ofta kedjeregeln. För bevisen av dessa räkneregler använder vi beteckningen A f (x, a) för kvotfunktionen A(x, a) hörande till funktionen f i punkten a. Vi skriver nu om de olika differenserna på följande sätt: a) (f +g)(x) (f +g)(a) = (f(x) f(a))+(g(x) g(a)) = (A f (x, a)+a g (x, a))(x a) b) (fg)(x) (fg)(a) = g(x)(f(x) f(a)) + f(a)(g(x) g(a)) = (g(x)a f (x, a) + f(a)a g (x, a))(x a) c) f(g(x)) f(g(a)) = A f (g(x), g(a))(g(x) g(a)) = A f (g(x), g(a))a g (x, a)(x a). Låter vi x a i faktorn framför (x a) följer de olika räknereglerna. Eftersom 1/g(x) = f(g(x)) där f(x) = 1/x har derivatan f (x) = 1/x 2 får vi direkt ur kedjeregeln att ( 1 g ) (a) = g (a) g(a) 2, och från detta ger produktregeln att ( f g ) (a) = f (a)g(a) f(a)g (a) g(a) 2. Återstår problemet att bestämma derivatan till en invers funktion, uttryckt i den givna funktionen. Vi behöver en härledning som går att generalisera till högre dimensioner. Antag nu att funktionen f är kontinuerlig och injektiv nära en punkt a. Då har den en invers f 1, och vi ska visa att denna är deriverbar nära a och bestämma dess derivata. Vi utgår ifrån att f(x) f(a) = A(x, a)(x a), vilket medför att x a = A(x, a) 1 (f(x) f(a)). Skriver vi nu y = f(x) och b = f(a), så att x = f 1 (y) och a = f 1 (b), får vi att f 1 (y) f 1 (b) = A(f 1 (y), f 1 (b)) 1 (y b). Så om f 1 är kontinuerlig, vilket den är om f är det, ser vi att inversen uppfyller differentieringsvillkoret med B(y, b) = A(f 1 (y), f 1 (b)) 1. Eftersom har vi alltså B(b, b) = A(f 1 (b), f 1 (b)) 1 = A(a, a) 1 (f 1 ) (b) = f(a) 1. I flerdim ska detta tolkas som inversen av en matris.
Differentierbara funktioner 5 (16) Tangenter och differentialer Differenskvoten A(x, a) = (f(x) f(a))/(x a) kan tolkas som riktningskoefficienten för den räta linje som går genom punkterna (a, f(a)) och (x, f(x)). Det betyder att f (a) = A(a, a) kan tolkas som riktningkoefficienten för tangenten till kurvan y = f(x) i punkten (a, f(a)), vilket betyder att tangentens ekvation blir df(a) y f(a) = f (a)(x a). Till punkten (x, y) på tangenten kommer vi från (a, f(a)) genom att gå dx = x a steg i x-led och sedan dy = y f(a) i y-led. Vi skriver detta dy = f (a)dx. Man definierar nu differentialen av f i punkten a, df(a) = f (a)dx, (a, f(a)) dx vilket ska tolkas som en storhet som mäter hur mycket tangenten ändras i y-led när vi ändrar x-värdet från a med dx. Ett annat sätt att uttrycka detta blir användbart när man ska generalisera derivation till flera variabler. Vi säger att differentialen df(a) är den linjära funktion av h som definieras av df(a)[h] = f (a)h. Detta är faktiskt samma sak. Vi har nämligen att funktionen f(x) = x har differentialen dx[h] = h, så vi kan skriva df(a)[h] = f (a)dx[h], och tar vi bort h från beteckningen får vi formeln df(a) = f (a)dx. Algoritmen för hur vi bestämmer tangenten till grafen y = f(x) för en funktion f i punkten (a, f(a)) blir därför: y = f(x) dy = df(a) = f (a)dx y f(a) = f (a)(x a). Stegen är alltså: (1) differentiera och (2) ersätta dx med x a och dy med y f(a). När vi härledde räknereglerna för derivatan i föregående avsnitt, härledde vi egentligen motsvarande räkneregler för differentialen: a) d(f + g)(a) = df(a) + dg(a), b) d(fg)(a) = g(a)df(a) + f(a)dg(a), c) d(f g)(a) = df(g(a))[dg(a)]. Den sista formeln, som svarar mot kedjeregeln och kallas differentialens invarians, kan se konstig ut i denna form, men innebär bara att om vi ska beräkna d(f g)(a) ska vi först beräkna df(y) = f (y)dy. Sedan sätter vi y = g(x), och får då att df(g(x)) = f (g(x))dg(x) = f (g(x))g (x)dx. Differentialräkning har sina främsta fördelar just när man ska derivera sammansatta funktioner. Man gör då successiva variabelbyten som illustreras i nästa exempel.
Differentierbara funktioner 6 (16) Exempel 5 Vi ska beräkna differentialen av den sammansatta funktionen sin(x 2 ). Med kedjeregeln får vi då d(sin x 2 ) = d sin y = cos ydy = cos(x 2 )d(x 2 ) = cos(x 2 )2xdx. Naturligvis behöver vi inte skriva ut variabelbytet: d(sin x 2 ) = cos(x 2 )d(x 2 ) = 2x cos(x 2 )dx. Följande räkning illustrerar sammansättning av flera funktioner: d(e sin(x2) ) = d(e y ) = e sin(x2) d(sin(x 2 )) = e sin(x2) cos(x 2 )d(x 2 ) = e sin(x2) cos(x 2 )2x dx. Funktioner av flera variabler Vi övergår nu till flerdim och reellvärda funktioner av flera variabler, och vill definierar en derivata för sådana funktioner också. Faktum är att den grundläggande definitionen f(x) f(a) = A(x, a)(x a) för differentierbarhet fungerar även då, om vi bara tolkar högerledet rätt. Om x inte är ett reellt tal utan n-tuppel x = (x 1,..., x n ), som vi kan tolka som en vektor, så ska A(x, a) tolkas som en vektor bestående av n reellvärda funktioner A i (x, a), A(x, a) = (A 1 (x, a),..., A n (x, a)), och uttrycket A(x, a)(x a) är skalärprodukten mellan vektorn A(x, a) och vektorn x a = (x 1 a 1,..., x n a n ), d.v.s A(x, a)(x a) = n A k (x, a)(x k a k ). k=1 I det endimensionella fallet blir A(a, a) = f (a) derivatan av f, i det flerdimensionella fallet kallar vi A k (a, a) för den partiella derivatan av f m.a.p. x k och skriver den på något av nedanstående sätt: f x k (a), k f(a), f x k (a), f k(a). Den partiella derivatan m.a.p. x k är derivatan av funktionen f när man ser den som en funktion av endast variabeln x k, och alltså håller de andra variablerna fixa. Om vi t.ex. ska se vad definitionen av 1 f(a) innebär ska vi som x ta vektorn (x 1, a 2,..., a n ). Det betyder att x k a k = för k 1 och vi får att och alltså att f(x) f(a) = f(x 1 + a, a 2,..., a n ) f(a 1, a 2,..., a n ) = A 1 (x, a)(x 1 a 1 ) f(x 1, a 2,..., a n ) f(a 1, a 2,..., a n ) 1 f(a) = A 1 (a, a) = lim. x 1 a 1 x 1 a 1
Differentierbara funktioner 7 (16) Eftersom en partiell derivation är en endim-derivation, gäller naturligtvis räknelagarna för derivation i endim för dem också. Men i flerdim är det ofta behändigare att använda sig av det alternativa begreppet differential. Detta definieras på i princip samma sätt som i endim, genom df(a)[h] = n i=1 f x k (a)h k. Här är alltså h = (h 1,..., h n ) och vi får en linjär funktion h df(a)[h] för fixt a. Men, liksom i endim, gäller här att dx k [h] = h k, så vi kan skriva df(a) = n i=1 f x k (a)dx k. Anmärkning Att förstå denna storhet, differentialen, är i mycket nyckeln till att förstå differentialkalkyl i flera variabler. Det heter trots allt differentialkalkyl, och inte derivationskalkyl. Räknereglerna för differentialen som vi formulerade dem i föregående avsnitt gäller oförändrat i flerdim, men i praktiken består de av ett antal endim-räkningar som följande två exempel illustrerar. Exempel 6 Låt f(x, y) = x 2 x 2 y + y 2. Vi beräknar då dess differential genom att använda räknereglerna ovan: df(x, y) = d(x 2 ) d(x 2 y) + d(y 2 ) = 2xdx (d(x 2 )y + x 2 dy) + 2ydy = Om vi samlar dx och dy blir detta Uträknat i punkten (1, 2) har vi 2xdx (2xdx)y x 2 dy + 2ydy. df(x, y) = 2x(1 y)dx + (2y x 2 )dy. df(1, 2) = 2dx + 3dx och de partiella derivatorna i den punkten ges därför av 1 f(1, 2) = 2, 2 f(1, 2) = 3. Naturligtvis kan vi räkna ut dessa direkt genom att derivera m.a.p. en variabel i taget.
Differentierbara funktioner 8 (16) Exempel 7 Betrakta nu istället funktionen f(x, y) = ln(1 + xy). Då gäller att df(x, y) = d(1 + xy) 1 + xy = d(xy) 1 + xy = ydx + xdy 1 + xy. Om vi räknar ut detta i en punkt (a, b) så har vi Speciellt ser vi att df(a, b) = bdx + ady. 1 + ab 1 f(a, b) = b 1 + ab, 2f(a, b) = a 1 + ab. Kedjeregeln En viktig aspekt av differentialräkning är hur naturlig differentiering av sammansatt funktion är. Om vi har en reellvärd funktion f : R n R av x = (x 1,..., x n ) och sedan en funktion g : R m R n, alltså n stycken funktioner g i av t = (t 1,..., t m ), så differentierar vi den sammansatta funktionen h(t) = f(g(t)) på följande sätt. Först beräknar vi differentialen av f: df(x) = n k f(x)dx k. Sedan sätter vi in x = g(t) i detta uttryck, och använder att, får vi formeln dh(t) = k=1 dx k = dg k (t) = n k f(g(t))dg k (t) = k=1 m i g k (t)dt i, i=1 m n ( k f(g(t)) i g k (t))dt i. i=1 k=1 Vad detta betyder är det som är den egentliga kedjeregeln: i h(t) = n k f(g(t)) i g k (t), i = 1,..., m. k=1 Denna följer alltså av det ovan skisserade tvåstegsförfarandet, som ofta kallas differentialens invarians. Det innebär att differentialen av en funktion ser likadan ut oavsett vilka koordinater vi använder. Med den kunskapen behöver man egentligen aldrig lära sig kedjeregeln för partiell derivation. Nästa exempel visar att även formlerna för derivatan av en summa och en produkt av funktioner följer ur kedjeregeln.
Differentierbara funktioner 9 (16) Exempel 8 Funktionen F + (x, y) = x + y är differentierbar med differentialen df + (x, y) = dx + dy. Om f(t), g(t) är två deriverbara funktioner så gäller att (f + g)(t) = F + (f(t), g(t)), och differentialens invarians visar då att d(f + g)(t) = df(t) + dg(t). Vidare, funktionen F (x, y) = xy har differentialen df (x, y) = ydx + xdy, så vi ser på samma sätt att d(fg)(t) = g(t)df(t) + f(t)dg(t). En vanlig tillämpning (i varje fall i övningar) på kedjeregeln handlar om att man byter koordinater. Nästa exempel illustrerar hur det kan gå till. Exempel 9 Antag att vi har en differentierbar funktion f(x, y) i de två variablerna x, y. Vi vill istället införa nya variabler u = xy, v = x/y och betrakta f som en funktion av dessa nya variabler. Om vi betecknar denna nya funktion med g(u, v), så har vi alltså att f(x, y) = g(u(x, y), v(x, y)) = g(xy, x/y). Vi har nu att där högerledet kan skrivas dg(u, v) = 1 g(u, v)du + 2 g(u, v)dv 1 g(xy, x y )d(xy) + 2g(xy, x y )d(x y ) = 1g(xy, x y )(ydx +xdy)+ 2g(xy, x xdy )(ydx ) y y 2 (y 1 g(xy, x y ) + 1 y 2g(xy, x y ))dx + x( 1g(xy, x y ) 1 y 2 2g(xy, x y ))dy. Differentialens invarians säger nu att detta sista uttryck är precis df(x, y). Anmärkning Detta är begreppsmässigt lite konstigt, eftersom här ingår två funktioner, när det egentligen endast finns en funktion. Det är därför bättre här, och i många andra sammanhang tänka på följande sätt. Vi har en mätstorhet, som vi kallar för z, som tar olika värden i olika punkter i planet. Om vi använder ett koordinatsystem i planet med koordinater (x, y), så betyder det att z = f(x, y) för en viss funktion f. Om vi istället använder koordinaterna (u, v) för att beskriva punkter i planet, så gäller att z = g(u, v) för någon (annan) funktion g. Men samma punkt ger alltid samma värde på z, oavsett vilket koordinatsystem vi väljer. Relationen z = f(x, y)
Differentierbara funktioner 1 (16) leder nu till att dz = 1 f(x, y)dx + 2 f(x, y)dy enligt våra definitioner. Den berättar hur stor ändringen blir i z när vi gör små ändringar i x och y. Men här kan tillåta oss att inte skriva ut f, utan istället skriva dz = x zdx + y zdy, där vi med x z menar att vi tar den partiella derivatan av den funktion som definierar z som funktion av x och y. Om vi har det i minnet kan vi skriva dz = x zdx + y zdy = u zdu + v zdv. Om vi tillåter oss detta, blir räkningarna i föregående exempel lite tydligare som nästa exempel visar. Exempel 1 Med u = xy, v = x/y har vi att ydx xdy dz = u zdu + v zdv = u z(ydx + xdy) + v z y 2 Ur detta drar vi sedan slutsatsen att = (y u z + 1 y vz)dx + x( u z 1 y 2 vz)dy. x z = y u z + 1 y vz, y z = x( u z 1 y 2 vz). Anmärkning Det är viktigt att notera att vi gör samma sak i de två exemplen. Skillnaden är att i det andra exemplet undertrycker vi de faktiska funktionsuttrycken för z. Om partiella derivator och differentierbarhet Det är nu viktigt att skilja på att en funktion är sådan att dess partiella derivator finns och att den är differentierbar. Att de partiella derivatorna finns garanterar egentligen ingenting, som följande exempel visar. Exempel 11 Definiera f(x, y) = { 1 om x = eller y = annars. Då gäller att båda de partiella derivatorna 1 f(, ), 2 f(, ) existerar och är noll, men funktionen är inte kontinuerlig i origo.
Differentierbara funktioner 11 (16) Däremot har vi sett att om funktionen är differentierbar så finns de partiella derivatorna. Det finns en nästan -omvändning: Sats 2 Om f:s partiella derivator finns och är kontinuerliga i ett område är f differentierbar där. Bevis. Beviset, som vi bara behöver genomföra då n = 2, bygger på en endim-observationen vi gjorde i (1). Ur den följer att f(x) f(a) = f(x 1, x 2 ) f(a 1, x 2 )+f(a 1, x 2 ) f(a 1, a 2 ) = A 1 (x)(x 1 a)+a 2 (x)(x 2 a 2 ) där A 1 (x, a) = 1 f(a 1 + s(x 1 a 1 ), x 2 )ds, A 2 (x, a) = 2 f(a 1, a 2 + s(x 2 a 2 ))ds. Om de partiella derivatorna är kontinuerliga i a blir de två funktionerna x A i (x, a) kontinuerliga i x = a, vilket betyder att f är differentierbar i a. Vi inför nu en beteckning som är användbar vid formulering av många satser. Kom ihåg att för att en funktion ska kunna vara differentierbar i en punkt måste denna vara en inre punkt i funktionens definitionsområde. Definition 1 Om Ω är en öppen mängd, låter vi C 1 (Ω) beteckna mängden av reellvärda funktioner definierade i Ω och vars alla partiella derivator är kontinuerliga funktioner i Ω. Från derivationsreglerna ovan ser vi att om f, g C 1 (Ω) så gäller att f + g, fg C 1 (Ω), och satsen ovan säger att funktioner i C 1 (Ω) är differentierbara i Ω. Om felfortplantning Vi har sett ovan att vi approximativt har att en ändring i en funktion när vi går till en närbelägen punkt kan approximeras med dess differentials värde i motsvarande förflyttning. Mer precist, om det gäller att f(x) f(a) = A(x, a)(x a) för x nära a där x A(x, a) är kontinuerlig i x = a, så gäller för x = a + h för små h att f(a + h) f(a) A(a, a)h = df(a)[h]. För en funktion i två variabler, där vi skriver h = ( x, y), betyder det att f(a + x, b + y) f(a, b) 1 f(a, b) x + 2 f(a, b) y om f är differentierbar i (a, b) och x, y är små tal.
Differentierbara funktioner 12 (16) Exempel 12 Vi befinner oss på ett berg i en punkt som på kartan svarar mot punkten (1, 1). Vi är på höjden 2 har har bestämt de partiella derivatorna av höjdfunktionen i x respektive y-led till 1 respektive.5. Hur mycket högre/lägre ligger då den punkt som på kartan har koordinaterna (1.1,.9)? Approximationen ovan visar att höjdskillnaden är approximativt så det är uppför. 1 (1.1 1) + (.5)(.9 1) =.15, En viktig tillämpning av detta är felfortplantning. Antag att en storhet z beräknas med hjälp av två andra storheter x och y genom en formel z = f(x, y). Antag vidare att vi har gjort mätningar av x och y, där vi vet hur stora mätfelen kan vara. Mätfelet i z kan då approximativt beräknas till z = 1 f(x, y) x + 2 f(x, y) y och använder vi triangelolikheten på detta får vi att z 1 f(x, y) x + 2 f(x, y) y. Olikheten gäller enbart approximativt, men kan uppfattas som en felgräns för z när man känner felgränserna i x och y. Denna felgräns kallas maximalfelet och är ofta tämligen pessimistisk eftersom den inte låter några fel ta ut varandra (alla felkällor bidrar med samma tecken). Exempel 13 För att bestämma molvikten (M) för kloroform används formeln och följande data M = mrt P V storhet beteckning enhet mätvärde maximalfel invägd mängd m g 1.1.1 temperatur T K 384.1.5 lufttryck P atm 1.5.2 volym V L.279.1 R är den s.k. gaskonstanten och vi får värdet M = 12.3 g/mol. För att bestämma felet ska vi beräkna differentialen av funktionen mrt/p V. Detta görs enklast genom att vi först logaritmerar ekvationen ln M = ln m + ln R + ln T ln P ln V,
Differentierbara funktioner 13 (16) och sedan beräknar differentialen. Detta ger oss M M m m + T T P P V V. Vi får nu uppskattningen M M.1 1.1 +.5 384.1 +.2 1.5 +.1.279.16. Maximala relativa felet är därför 1.6%, vilket ger det maximala absoluta felet till.16 12.3 = 1.9 g/mol. Anmärkning Om man istället för kända felgränser har gjort upprepade mätningar a samma okända variabler x och y, kan man istället beräkna standardavvikelserna σ x och σ y för mätdata. Felet i z får då en standardavvikelse σ z som är sådan att σ 2 z ( 1 f(x, y)) 2 σ 2 x + ( 2 f(x, y)) 2 σ 2 y. Den blandade andraderivatan Naturligtvis kan vi beräkna högre ordningens derivator också. T.ex. gäller att 2 1f(a, b) = 1 ( 1 f)(a, b). Högerledet ska här tolkas som att vi tar funktionen f (x, y) och deriverar den m.a.p x, varefter vi sätter in värdena x = a, y = b. Men nu finns också blandade andraderivator: 2 12f = 1 ( 2 f) och 2 21f = 2 ( 1 f). Normalt sett är dessa dock lika. För att formulera detta ordentligt inför vi först en definition svarande mot den för C 1 (Ω). Definition 2 Mängden av reellvärda funktion som är två gånger deriverbara (m.a.p. alla koordinatkombinationer) och vars alla andraderivator är kontinuerliga funktioner på Ω betecknas C 2 (Ω). Det är klart att om f, g C 2 (Ω), så gäller att f + g, fg C 2 (Ω). Den viktiga observationen för stunden är nu att om de blandade andraderivatorna är kontinuerliga, så gäller att det inte spelar någon roll i vilken ordning vi deriverar. Resultatet blir detsamma.
Differentierbara funktioner 14 (16) Sats 3 Om Ω är en öppen delmängd av R n och f C 2 (Ω), så gäller att 2 ikf(x) = 2 kif(x), i k. Bevis. Det räcker att betrakta en funktion av två variabler och visa att den endast har en blandad andraderivata i en godtycklig punkt (a, b). För detta betraktar vi uttrycket Detta kan skrivas f(x, y) f(a, y) f(x, b) + f(a, b). A 1 (x, y)(x a) A 1 (x, b)(x a) = (A 1 (x, y) A 1 (x, b))(x a), där Då blir A 1 (x, y) = 1 f(a + s(x a), y)ds. A 1 (x, y) A 1 (x, b) = ( Vi ser alltså att vi kan skriva där ( 1 f(a + s(x a), y) 1 f(a + s(x a), b))ds = ( 2 21f(a + s(x a), b + t(y b))dt)ds(y b). f(x, y) f(a, y) f(x, b) + f(a, b) = Q(x, y)(x a)(y b), Q(x, y) = ( Men om integranden här är kontinuerlig gäller att Om vi nu börjar om, men istället skriver ( 2 21f(a + s(x a), b + t(y b))dt)ds. Q(x, y) 2 21f(a, b) då (x, y) (a, b). f(x, y) f(x, b) f(a, y) + f(a, b) = (A 2 (x, y) A 2 (a, y))(y b), där A 2 är integralen över den partiella derivatan m.a.p. y istället, så ser vi att uttrycket också kan skrivas på formen Q(x, y)(x a)(y b), där nu Q(a, b) = 12f(a, 2 b) i (a, b). Därmed har vi visat satsen. Följande exempel visar på en funktion för vilken de blandade andraderivatorna inte är lika i origo.
Differentierbara funktioner 15 (16) Exempel 14 Låt f(x, y) = xy(x2 y 2 ) x 2 + y 2, (x, y) (, ) med f(, ) =. Grafen för funktionen i en omgivning av origo ges i figuren till höger. Då gäller att 1 f(x, y) = y(x4 + 4x 2 y 2 y 4 ) (x 2 + y 2 ) 2 och vi får att 21 f(, ) = lim h 1 h 5 ( 1 f(, h) 1 f(, )) = lim = 1. h h h 5 Om vi istället gör det i andra ordningen får vi att 12 f(, ) = 1, vilket vi ser genom att funktionen är sådan att f(y, x) = f(x, y). Vi ser alltså att de två blandade derivatorna inte har samma tecken. Geometriskt betyder 21 f(, ) = 1 att om vi går från origo längs x-axeln, så kommer våra skor att luta brantare och brantare i y-riktning, medan 12 f(, ) = 1 betyder att om vi istället går längs y-axeln, så kommer skorna att luta brantare och brantare i den negativa x-axeln. Stationära punkter och lokala extrempunkter Lokala extrempunkter definieras likadant för funktioner av flera variabler som för funktioner av en variabel. Om vi t.ex. har en funktion av två variabler så är punkten (a, b) ett lokalt maximum om f(x, y) f(a, b) för alla (x, y) i en omgivning av (a, b) [2] Om funktionen är differentierbar i en lokal extrempunkt (a, b), så gäller att df(a, b) =. Att så är fallet inses på väsentligen samma sätt som i endim: om df(a, b) = Adx + Bdy och A > så leder en liten ökning av x (håll y oförändrad) till ett större värde; om A < leder en liten minskning av x till ett större värde. Alltså måste A =. På samma sätt inses att B =.
Differentierbara funktioner 16 (16) Vi ser därför att lokala extrempunkter för en differentierbar funktion av två variabler finns i punkter där differentialen är noll. Punkter där differentialen är noll kallas stationära punkter. Exempel 15 Vi ska bestämma alla stationära punkter till funktionen f(x, y) = x 2 x 2 y + y 2. Vi beräknade dess differential i Exempel 6 till df(x, y) = 2x(1 y)dx + (2y x 2 )dy. En stationär punkt är då en punkt där båda dessa koefficienter är noll, alltså de talpar (x, y) som uppfyller de två ekvationerna 2x(1 y) = 2y x 2 =. För att lösa det ser vi att den första ekvationen kräver att antingen är x = eller så är y = 1. Detta ger oss två fall: a) Om x = ser vi att y = ur den andra ekvationen. b) Om y = 1 ser vi att x 2 = 2 ur den andra ekvationen, en ekvation som har lösningarna ± 2. De stationära punkterna är därför de tre punkterna (, ), (± 2, 1). Dessa tre punkter är därför de enda punkter i planet där funktionen kan ha en lokal extrempunkt. Däremot behöver inte dessa punkter svara mot lokala extrempunkter! Men de är de enda kandidaterna. Noteringar 1. Integralen är kontinuerlig därför att f är kontinuerlig. Detta är mindre självklart än vad det ser ut att vara och ett bevis kräver en mer detaljerad undersökning av begreppet kontinuitet. 2. En omgivning är en liten cirkelskiva med (a, b) som medelpunkt och positiv radie.