Analys av stationära punkter

Relevanta dokument
Differentialens geometriska betydelse

5 Lokala och globala extremvärden

7 Extremvärden med bivillkor, obegränsade områden

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A. 1. En svängningsrörelse beskrivs av

2.5 Partiella derivator av högre ordning.

Lösningsförslag till tentamen Tisdagen den 10 januari 2017 DEL A

Primitiva funktioner i flerdim

Optimering med bivillkor

SF1626 Flervariabelanalys Tentamen Tisdagen den 12 januari 2016

Institutionen för Matematik, KTH Torbjörn Kolsrud

av envariabelfunktionen g(t) och flervariabelfunktionen t = h(x, y) = x 2 + e y.)

Institutionen för Matematik, KTH Torbjörn Kolsrud

III. Analys av rationella funktioner

Om att rita funktioner av två variabler

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Tentamen Tisdagen den 10 januari 2017

Optimering med bivillkor

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

x ( f u 2y + f v 2x) xy = 24 och C = f

Flervariabelanalys E2, Vecka 3 Ht08

SF1626 Flervariabelanalys Tentamen Måndagen den 16 mars 2015

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

= ( 1) xy 1. x 2y. y e

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

Lokala undersökningar

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Problem inför KS 2. Problem i matematik CDEPR & CDMAT Flervariabelanalys. KTH -matematik

Tentamen i tmv036c och tmv035c, Analys och linjär algebra C för K, Kf och Bt A =, = det(a λi) = e 2t + c 2. x(t) = c 1. = c 1.

För studenter i Flervariabelanalys Flervariabelanalys MA012B ATM-Matematik Mikael Forsberg

Optimering av funktioner, med och utan bivillkor

1 x. SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Repetitionsfrågor i Flervariabelanalys, Ht 2009

INGA HJÄLPMEDEL. Lösningarna ska vara försedda med ordentliga motiveringar. xy dxdy,

Tentamen i Flervariabelanalys, MVE , π, kl

Tentamen i TATA43 Flervariabelanalys

SF1626 Flervariabelanalys Tentamen Torsdagen den 20 augusti 2015

= 0. Båda skärningsvinklarna är således π/2 (ortogonala riktningsvektorer).

Tentamen i matematik. f(x) = ln(ln(x)),

Tentan , lösningar

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna

SF1626 Flervariabelanalys

Lösningsförslag till tentamen Onsdagen den 15 mars 2017 DEL A

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

TMV036 Analys och linjär algebra K Kf Bt, del C

LMA515 Matematik, del B Sammanställning av lärmål

Differentierbara funktioner

Analys av jämviktslägen till differentialekvationer

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

y + 1 y + x 1 = 2x 1 z 1 dy = ln z 1 = x 2 + c z 1 = e x2 +c z 1 = Ce x2 z = Ce x Bestäm den allmänna lösningen till differentialekvationen

SF1626 Flervariabelanalys Tentamen Torsdagen den 18 augusti 2016

1. Vi skriver upp ekvationssystemet i matrisform och gausseliminerar tills vi når trappstegsform,

MMA127 Differential och integralkalkyl II

(x + 1) dxdy där D är det ändliga område som begränsas av kurvorna

Tentamen i Analys B för KB/TB (TATA09/TEN1) kl 08 13

Optimalitetsvillkor. Optimum? Matematisk notation. Optimum? Definition. Definition

LUNDS TEKNISKA HÖGSKOLA MATEMATIK. LÖSNINGAR FLERDIMENSIONELL ANALYS, FMA kl 8 13

Övningar till Matematisk analys III Erik Svensson

SF1669 Matematisk och numerisk analys II Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Bedömningskriterier till tentamen Måndagen den 16 mars 2015

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A. e 50k = k = ln 1 2. k = ln = ln 2

SF1646 Analys i flera variabler Tentamen 18 augusti 2011, Svar och lösningsförslag

Övningstenta: Lösningsförslag

Uppsala Universitet Matematiska Institutionen Bo Styf

Lösning till kontrollskrivning 1A

1 Konvexa optimeringsproblem grundläggande egenskaper

Institutionen för matematik SF1626 Flervariabelanalys. Lösningsförslag till tentamen Måndagen den 5 juni 2017 DEL A

SF1626 Flervariabelanalys Tentamen Måndagen den 21 mars 2016

n : R vara en reell funktion av n variabler och P 0 en punkt i funktionens definitionsområde D.

SF1633, Differentialekvationer I Tentamen, torsdagen den 7 januari Lösningsförslag. Del I

Frågorna 1 till 6 ska svaras med sant eller falskt och ger vardera 1

6 Derivata och grafer

Funktionsstudier med derivata

Sätt t = (x 1) 2 + y 2 + 2(x 1). Då är f(x, y) = log(t + 1) = t 1 2 t t3 + O(t 4 ) 1 2 (x 1) 2 + y 2 + 2(x 1) ) 2 (x 1) 2 + y 2 + 2(x 1) ) 3

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

har ekvation (2, 3, 4) (x 1, y 1, z 1) = 0, eller 2x + 3y + 4z = 9. b) Vi söker P 1 = F (1, 1, 1) + F (1, 1, 1) (x 1, y 1, z 1) = 2x + 3y + 4z.

SF1626 Flervariabelanalys Tentamen Onsdagen den 15 mars 2017

8. Euklidiska rum 94 8 EUKLIDISKA RUM

Visa att vektorfältet F har en potential och bestäm denna. a. F = (3x 2 y 2 + y, 2x 3 y + x) b. F = (2x + y, x + 2z, 2y 2z)

SF1625 Envariabelanalys

Vektorgeometri för gymnasister

Matematik 4 Kap 3 Derivator och integraler

Tentamen i Flervariabelanalys F/TM, MVE035

Partiella differentialekvationer av första ordningen

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

AB2.4: Kurvintegraler. Greens formel i planet

Sammanfattning av ordinära differentialekvationer

MMA127 Differential och integralkalkyl II

Dagens ämnen. Kvadratiska former. Andragradskurvor. Matrisform Diagonalisering av kvadratiska former Max/min Teckenkaraktär

MAA7 Derivatan. 2. Funktionens egenskaper. 2.1 Repetition av grundbegerepp

SF1669 Matematisk och numerisk analys II Lösningsförslag till tentamen DEL A. r cos t + (r cos t) 2 + (r sin t) 2) rdrdt.

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

Tentamen TMA044 Flervariabelanalys E2

1. Bestäm definitionsmängden och värdemängden till funktionen f(x,y) = 1 2x 2 3y 2. Skissera definitionsmängden, nivålinjerna och grafen till f.

Matlab övningsuppgifter

Institutionen för Matematik, KTH Lösningar till tentamen i Analys i en variabel för I och K (SF1644) 1/ e x h. (sin x) 2 1 cos x.

Dagens ämnen. Entydighet hos Taylor- och Maclaurinpolynom

Tentamen SF1626, Analys i flera variabler, Svar och lösningsförslag. 2. en punkt på randkurvan förutom hörnen, eller

Transkript:

Analys 36 En webbaserad analyskurs Differentialkalkyl Analys av stationära punkter Anders Källén MatematikCentrum LTH anderskallen@gmail.com

Analys av stationära punkter 1 (17) Introduktion I det här kapitlet ska vi titta närmare hur en funktion ser ut i närheten av en stationär punkt. Detta i syfte att kunna avgöra när en sådan är en lokal extrempunkt. Vi vet från endim att man kan avgöra detta från andraderivatans tecken i punkten, så länge den inte är noll. Här ska vi reda ut varför, och hur man går vidare om andraderivatan är noll. Detta blir grunden för motsvarande analys i flerdim. För analysen använder vi Taylorutvecklingen av funktionen. Denna härleds lätt för flera variabler från envariabelversionen, så vi börjar med att diskutera den senare. Från den kan vi sedan avgöra vad det är vi måste studera i flerdim som svarar mot andraderivatan i endim, vilket visar sig vara en kvadratisk form. För att avgöra vilken typ en viss stationär punkt har, måste vi kunna avgöra vilka tecken denna kvadratiska form kan anta. Och då dyker det upp fler fall än som kan förekomma i endim: punkter som har lokala maxima i vilka riktningar men lokala minima i andra riktningar s.k. sadelpunkter. Slutligen ska vi diskutera hur man kan avgöra vilken typ en stationär punkt som är av, när funktionen är definierad på en kurva eller en yta som ges i ekvationsform. Med andra ord, typen av de stationära punkter som dyker upp vid optimering vid bivillkor. Maclaurinutvecklingar Från analysens huvudsats vet vi att det för varje differentierbar funktion f med en kontinuerlig derivata gäller att f(x) f() = x f (u) du = x f (xt)dt. Första likheten är analysens huvudsats, för den andra har vi gjort variablebytet u = xt. Men här kan vi skriva integranden som 1 f (xt) och partialintegrera med t 1 som primitiv funktion till funktionen som är 1 överallt: f (xt)dt = [(t 1)f (xt)] 1 Detta leder oss till resultatet (t 1)f (xt)xdt = f () + x f(x) = f() + xf () + x 2 (1 t)f (xt)dt. (1 t)f (xt)dt. Antag nu att origo är en stationär punkt, alltså f () =. Om vidare f () > och f är kontinuerlig, så gäller att det finns en omgivning av origo sådan att f (x) > då x ligger i denna omgivning. Men då är integranden också positiv och också därmed integralen. Det följer att f(x) > f() då x ligger i omgivningen, och origo är därför ett lokalt minimum. Ett liknande resonemang visar att om f () < så är origo ett lokalt maximum. Men vad gäller då när f () =? Det kan vi inte får reda på genom att titta på den formel vi plockat fram, eftersom vi inte vet vilket tecken integralen har. Vi partialintegrerar därför

Analys av stationära punkter 2 (17) en gång till: ] 1 f(x) = f() + xf (1 t)2 () + [ f (xt) 2 = f() + xf () + f () x2 2 + x3 2 (1 t)2 f (xt)xdt 2 (1 t) 2 f (xt)dt. Om nu f () = f () = och f () >, så ser vi att det finns en omgivning av origo sådan att f (x) > i denna, och integralen är då positiv i denna omgivning. Men denna multipliceras med x 3, som växlar tecken när vi går igenom origo, så högerledet går från att vara < då x < och i omgivningen ifråga till att vara > då x > i samma omgivning. Motsvarande gäller när f () <. Med andra ord, om f () = f () = men f (), så är origo en terrasspunkt. Men om f () = f () = f () = då? En partialintegration till ger oss att f(x) = f() + xf () + f () x2 2 + f () x3 6 + x4 6 (1 t) 3 f (4) (xt)dt. Upprepar vi resonemanget ovan ser vi att origo är ett lokalt minimum om f (4) () > och ett lokalt maximum om f (4) () <. Utvecklingen här, f(x) = f() + xf () + f () x2 2 + f () x3 6 + x4 6 kallas Maclaurinutvecklingen av ordning 3 av funktionen f. De fyra första termerna utgör Maclaurinpolynomet av ordning 3, medan integralen är en restterm. Naturligtvis kan man fortsätta processen ovan och få en Maclaurinutveckling av vilken ordning man vill, om bara funktionen har tillräckligt många kontinuerliga derivator. Tanken med dessa polynom är att de bättre och bättre ska approximera kurvan nära origo, vilket är det vi använder i resonemanget ovan. I fallet f(x) = e x gäller att alla derivator f (k) () = 1 och grafen nedan illustrerar hur Maclaurinpolynomen av ordning 1,2 och 3 bättre och bättre approximerar funktionen i en omgivning av origo. (1 t) 3 f (4) (xt)dt. y 7 6 5 4 3 2 1 y = 1 + x + x2 + x3 2 6 y = e x y = 1 + x + x2 2 y = 1 + x 1 1 2 x Analys av kvadratiska former Vi ska nu diskutera typ av stationära punkter till en speciell sorts enkla funktioner av en och flera variabler, nämligen de s.k. kvadratiska formerna. Av skäl som framgår i nästa avsnitt kommer vi nu att kalla variablerna h istället för x (och (h, k) istället för (x, y) m.m.).

Analys av stationära punkter 3 (17) I en dimension är funktionen vi är intresserad av Q(h) = ah 2. Denna har en stationär punkt i h = och ser ser att denna är ett minimum då a > och ett maximum om a <. Om a = är funktionen noll överallt. Motsvarande funktion i 2D kan skrivas Q(h, k) = ah 2 + 2bhk + ck 2, där a, b, c är konstanter. Att vi skriver en 2:a framför den blandade termen hk är av bekvämlighetsskäl som snart ska framgå. Detta är utseendet på en kvadratisk form i två variabler, och den har egenskapen Q(th, tk) = t 2 Q(h, k). Det är det mest allmänna polynom i h, k som uppfyller detta villkor. Vi kan skriva denna funktion ( ) a b Q(H) = H t BH där B =, H = b c Notera att B är en allmän symmetrisk 2 2-matrix. De stationära punkterna till Q bestäms av Q = 2(ah + bk) = h Q k = 2(bh + ck) = BH =. Vi ser alltså att vi har två alternativ: ( ) h. k a) Om B är inverterbar, alltså det B, så är enda stationära punkten origo (h = k = ) b) Om det B = gäller att alla punkter (h, k) sådana att ah + bk = är stationära punkter. Om inte alla konstanter är noll betyder det alla (h, k) som ligger på den räta linjen ah + bk =. För att få mer insikt i hur funktionen ser ut kvadratkompletterar vi. Antag först att a. Då får vi Q(h, k) = a(h + bk a )2 + (c b2 a )k2 = a 1 ((ah + bk) 2 + (ac b 2 )k 2 ). Om c kan vi alternativt skriva Q(h, k) = c 1 ((ck + bh) 2 + (ac b 2 )h 2 ). I fallet a = blir detta Q(h, k) = c 1 (ck + bh) 2 b 2 h 2 ). Om a = c = kan vi skriva Vi ser nu några fall: Q(h, k) = 2bhk = b 2 ((h + k)2 (h k) 2 ).

Analys av stationära punkter 4 (17) a) Om ac b 2 > har vi innanför parantesen en summa av två jämna kvadrater och båda dessa kan inte vara noll utan att (h, k) = (, ). Det betyder att antingen är Q(h, k) har samma tecken som a har i alla punkter utom origo. Det betyder att om a > har Q ett minimum i origo, medan om a < har Q(h, k) ett maximum i origo. b) Om ac b 2 < har vi innanför parantesen en skillnad av två jämna kvadrater (även nu kan inte båda vara noll utom i origo). Det betyder att Q kan anta både positiva och negativa värden. Det betyder att ytan är en sadelyta och vi säger att origo är en sadelpunkt. c) Om ac b 2 = ser vi att Q är antingen eller, men att det finns andra punkter än origo i vilka Q =. Detta betyder att grafen av ytan z = Q(h, k) nära origo ser ut som någon av nedanstående funktionsgrafer. FIGUR Låt oss nu generalisera detta till ett godtyckligt antal variabler och införa lite terminologi. Definition 1 En kvadratisk form i variablerna h = (h 1,..., h n ) är ett uttryck på formen där B är en symmetrisk n n-matris. Q(h) = h t Bh En kvadratisk form är alltid noll i origo, liksom dess differential. Origo är enda stationära punkten om B är inverterbar [1]. Vi säger att Q är positivt definit om Q(h) > för alla h. positivt semidefinit om Q(h) för alla h men att det finns h sådana att Q(h) =. negativt definit om Q(h) < för alla h. negativt semidefinit om Q(h) för alla h men att det finns h sådana att Q(h) =. indefinit om det finns h 1 sådant att Q(h 1 ) > och h 2 sådant att Q(h 2 ) <. För att avgöra av vilken typ Q är gör vi som i fallet med två variabler, vi kvadratkompletterar. Anmärkning Man inser ganska snabbt att om man bara kvadratkompletterat på ett systematiskt sätt så räcker det att räkna antalet kvadrater och deras tecken. För att den kvadratiska formen inte ska vara semidefinit ska det vara lika många kvadrater som variabler, och den är indefinit när det finns minst en positiv kvadrat och minst

Analys av stationära punkter 5 (17) en negativ kvadrat. Anmärkning Det är viktigt att veta hur många variabler som ingår i den kvadratiska formen. T.ex. gäller att h 2 1+h 2 2 definierar en positivt definit kvadratisk form om denna beror endast av variblerna h 1 och h 2, medan den endast är positivt semidefinit om den är en kvadratisk form av h 1, h 2, h 3. Taylorutvecklingar, även i flerdim Låt nu mer allmänt f vara en funktion som kan vara en funktion av flera variabler, och som i en omgivning av en punkt a har kontinuerliga derivator av all de slag som dyker upp nedan. Om x är en punkt nära a sådan att den räta linjen mellan dessa punkter ligger i omgivningen, kan vi definiera funktionen g(t) = f(a + t(x a)) som alltså är definierad i en omgivning av [, 1]. Dess Maclaurinutveckling definierar då det som kallas Taylorutvecklingen av f i en omgivning av punkten a. Vi ska nu se närmare på vad den blir. Det vi ska använda från diskussionen i föregående avsnitt är att vi har att g(1) = g() + g () + För en funktion av en variabel har vi att (1 t)g (t)dt. (1) g(1) = f(x), g() = f(a), g () = f (a)(x a), g (t) = f (a + t(x a))(x a) 2, så formeln kan alltså skrivas f(x) = f(a)+f (a)(x a)+(x a) 2 B(a, x a), där B(a, h) = Vi ser här att B(a, ) = så när x ligger nära a gäller att (1 a)f (a)dt = f (a), 2 f(x) f(a) + f (a)(x a) + f (a) (x a)2. 2 (1 t)f (a+th))dt. Polynomet i högerledet kallas Taylorpolynomet av ordning 2, och det är det vi vill använda för att avgöra om en stationär punkt är en extrempunkt. Vilket går om f (a), enligt diskussionen i föregående avsnitt. Nedanstående figur illustrerar Taylorpolynomet av ordning 2 kring tre punkter på kurvan y = sin x (det röda kurvstycket är polynomet kring π/12, de blå kring extrempunkterna ±π/2).

Analys av stationära punkter 6 (17) y.9.6.3 4 3 2 1 1 2 3 4 x.3.6.9 Liksom tidigare inser vi att om a är en stationär punkt till f i vilken f (a) <, så är a ett lokalt maximum, medan om f (a) >, så är det ett lokalt minimum. Vi övergår nu till att göra motsvarande diskussion i flerdim. Vi gör detta i det allmänna fallet först, för att i nästa avsnitt titta närmare på det två-dimensionella fallet. Vi utgår ifrån formeln (1) där g är definierad utifrån en funktion f av flera variabler. Då gäller att g (t) = df(a + t(x a))[x a] = n k f(a + t(x a))(x k a k ), k=1 från vilket det följer att g () = df(a)[x a] = n k f(a)(x k a k ). k=1 Nästa derivata av g blir g (t) = n k=1 d dt kf(a + t(x a))(x k a k ). Men d dt kf(a + t(x a)) = d( k f)(a + t(x a))[x a] = och alltså g (t) = n l ( k f)(a + t(x a))(x l a l ), l=1 n klf(a 2 + t(x a))(x k a k )(x l a l ). k,l=1 För att få ett mer kompakt skrivsätt, vilket underlättar diskussionen, inför vi matrisen f (x) = ( 2 ijf(x)) av andraderivator. Om dessa är kontinuerliga (vilket vi antar) så vet vi att 2 ijf = 2 jif, vilket betyder att matrisen f (x) är symmetrisk. Vi kallar den matrisen för Hessianen av f i punkten x.

Analys av stationära punkter 7 (17) Stoppar vi in detta i formeln ovan får vi att (här betraktar vi x a som en kolonnmatris och f (a) som en radmatris) där f(x) = f(a) + f (a)(x a) + (x a) t B(a, x a)(x a) B(a, h) = (1 t)f (a + th)dt är en symmetrisk matris som är lika med f (a)/2 då h =. Vi inser nu att om Q(h) = h t f (a)h är positivt definit, så gäller att B(a, h) > för alla h i en omgivning av a, och alltså att f har ett lokalt minimum i a. På samma sätt, om Q är negativt definit har f ett lokalt maximum i a. Om Q är indefinit, kan f inte ha en extrempunkt i a eftersom det finns riktningar i vilka f är större än f(a) men även andra riktning där f är mindre än f(a). Slutligen, om Q är semidefinit, men inte definit, kan vi inte dra några säkra slutsatser. Det finns då någon riktning h i vilken Q(h) = och det är kommande termer i Taylorutvecklingen som kommer att avgöra f ändrar sig i den riktningen. Dessa fall svarar mot fallet f (a) = i 1D. Exempel 1 Som illustration, betrakta f(x, y) = xy + x 4 + y 4 som har en stationär punkt i origo. Den kvadratiska formen i origo ges av Q(h, k) = hk och är alltså indefinit. Varför betyder detta att f inte kan ha en lokal extrempunkt i origo? Notera först att funktionsvärdet är noll i origo. Den kvadratiska formen är positiv då k = h, och om vi på samma sätt sätter y = x i funktionen får vi f(x, x) = x 2 + 2x 4 > om x. Det betyder att funktionen x f(x, x) har ett lokalt minimum i punkten. Den kvadratiska formen är negativ då k = h, och om vi på samma sätt sätter y = x i funktionen får vi f(x, x) = x 2 + 2x 4. Men denna har ett lokalt maximum i x =, vilket vi ser genom att beräkna dess andraderivata då x =. Bestämning av typen av en stationär punkt i 2D Vi ska nu titta på hur en funktion ser ut i en omgivning av en stationär punkt genom att studera dess kvadratiska form i en och två dimensioner. I en dimension är den kvadratiska formen till f helt enkelt funktionen Q(h) = f (a)h 2, vilket betyder att den bara kan vara positivt definit (om f (a) > ), negativt definit (om

Analys av stationära punkter 8 (17) f (a) < ) eller semidefinit (om f (a) = ). Detta är bakgrunden till varför vi ofta kan använda andraderivatan till att avgöra om en stationär punkt är en lokal extrempunkt i 1D. För en funktion av två variabler gäller att den kvadratiska formen hörande till f i punkten (a, b) ges av Q(a, b)[h, k] = 2 f x 2 (a, b)h2 + 2 2 f x y (a, b)hk + 2 f y 2 (a, b)k2. Detta uttryck ska beräknas och undersökas i alla stationära punkter (a, b) om vi vill ta reda på de stationära punkternas typ. Exempel 2 Vi ska bestämma alla lokala extrempunkter till f(x, y) = 2y 2 4xy x 4. Differentialen är df = 4(y + x 3 )dx 4(y + x)dy så de stationära punkterna ges av ekvationerna y + x 3 =, y + x =, och löser vi detta får vi punkterna (, ), (1, 1), ( 1, 1). Ytterligare derivation ger oss den allmänna kvadratiska formen Q(x, y)[h, k] = 12x 2 h 2 8hk 4k 2 vilken räknas ut i de tre stationära punkterna: a) Q(, )[h, k] = 8hk 4k 2 = 4((k + h) 2 h 2 ), vilken är indefinit, så origo är en sadelpunkt b) Q(1, 1)[h, k] = 12h 2 8hk 4k 2 = 4(k + h) 2 8h 2, vilken är negativt definit, så (1, 1) är ett lokalt maximum c) Q( 1, 1)[h, k] = Q(1, 1)[h, k], så även den punkten är ett lokalt maximum. Vi ser alltså att origo är en sadelpunkt, medan de övriga två är lokala maxima. Bilden nedan föreställer en nivåkurveplot för ytan i den relevanta delen med de stationära punkterna noterade som röda punkter.

Analys av stationära punkter 9 (17) Svar: Punkterna (1, 1) och ( 1, 1) är de enda lokala extrempunkterna och båda är lokala max. Exempel 3 De stationära punkterna till funktionen f(x, y) = (x y) 2 x 4 y 4 ges av { { { 2(x y) 4x 3 = 2(x y) 4x 3 = y = x 2(x y) 2 4y 3 = y 3 = x 3 4x(1 x 2 ) =. De stationära punkterna är alltså (, ), (1, 1) och ( 1, 1). Den kvadratiska formen i punkten (x, y) ges av Q(x, y)[h, k] = (2 12x 2 )h 2 4hk + (2 12y 2 )k 2. I punkterna ( 1, 1) och (1, 1) har vi därför a = 1, b = 2, c = 1 och b 2 = 4 < 1 = ac, vilket betyder att den kvadratiska formen i dessa punkter är negativt definit och punkterna därför lokala maxima. I origo får vi a = c = 2 och b = 2 och då har vi att b 2 = ac, vilket betyder att den kvadratiska formen är semidefinit där. Vi kan därför inte från den kvadratiska formen dra slutsatsen om huruvida origo är en extrempunkt eller ej. Om vi emellertid tittar närmare på funktionen nära origo ser vi att då y = x är funktionen lika med 2x 4 och alltså negativ utanför origo. Däremot gäller att när y = så blir funktionen x 2 x 4 = x 2 (1 x 2 ), som är positiv nära origo. Vi ser alltså att f godtyckligt nära origo kan anta både positiva och negativa värden, vilket betyder att origo inte är en lokal extrempunkt. Nivåkurveplotten nedan visar på att origo mest liknar en sadelpunkt.

Analys av stationära punkter 1 (17) Som avslutning på detta, låt oss ta ett exempel som illustrerar att situationen inte alltid behöver vara enkel kring en stationär punkt. Exempel 4 Funktionen f(x, y) = (y x 2 ) 2 x 5 har en stationär punkt i origo. Den kvadratiska formen där är Q(h, k) = k 2 och alltså semidefinit. Antag nu att vi lämnar origo längs linjen y = kx. Då gäller att f(x, kx) = (kx x 2 ) 2 x 5 = k 2 x 2 2kx 3 + x 4 x 5, och vi ser att denna alltid har ett lokalt minimum i origo (vi behöver studera fallen k och k = separat). Trots det är punkten inte ett lokalt minimum, ty längs parabeln y = x 2 har vi att f(x, x 2 ) = x 5 < då x >. I figuren nedan ser vi tydligt det kilformade område i vilket ytan går nedåt och genom vilket parabeln går.

Analys av stationära punkter 11 (17) Om att skissera ytor Genom att identifiera de stationära punkterna för en reellvärd funktion av en variabel som är kontinuerlig på ett intervall får vi goda möjligheter att att skissera den. Väsentligen noterar vi små lokala maxima och minima i sådana punkter och horisontella tangenter i terrasspunkter och drar sedan kurvan genom att förbinda dessa små kurvstycken. Exempel 5 Vill vill skissera grafen för funktionen f(x) = x 3 6x 2 + 9x + 1. För detta beräknar vi först alla stationära punkter och deras typ. Dessa är x = 1, som är ett lokalt maximum, och x = 3, som är ett lokalt minimum. Respektive funktionsvärde är 5 och 1. Vi ritar därför ut de små blå kurvstyckena i figuren till höger först, varefter vi förbinder dessa med på fri hand ritade kurvstycken (även om de i bilden är datorritade). Detta ger en skiss av hur kurvan ser ut. y x Att på motsvarande sätt försöka förstå hur en yta ser ut utifrån dess stationära punkter och dessas typ är svårare, men med lite god fantasi låter det sig göras. I det här avsnittet ska vi diskutera principerna för detta, och börjar med ett i detalj gå igenom ett typexempel. Exempel 6 Vi ska försöka identifiera ytan som är graf till funktionen f(x, y) = 4xy x 4 y 4. Vi börjar då med att analysera de stationära punkterna. Vi hoppar över räkningarna men sammanfattar resultatet i följande tabell: Stationär punkt Värde Kvadratisk form Typ (, ) 8hk sadelpunkt ±(1, 1) 2 12((h k/3) 2 + 26k 2 /9) lokalt maximum Med hjälp av denna information ska vi försöka skissera en nivåkurveplot över funktionen. Vi har alltså tre stationära punkter och det första vi gör är att rita ut ett koordinatsystem i vilket vi noterar dessa. I närheten av ett lokalt maximum har vi nivåkurvor som består av slutna kurvor som inte skär varandra och blir mer och mer ellipsliknande ju närmre man kommer den stationära punkten. I vårt fall kommer det att likna ellipsen (h k/3) 2 + 26k 2 = 1, förflyttad så att den stationära punkten ligger i origo. Det är cok inte lönt att försöka rekonstruera denna i detalj, utan vi nöjer oss med att rita några slutna kurvor runt de lokala maxima. Detta är gjort till vänster i figuren nedan.

Analys av stationära punkter 12 (17) y y x x Sedan ritar vi ut hur det ser ut nära en sadelpunkt. Här finns två intressanta linjer som ska markeras speciellt, nämligen de för vilka den kvadratiska formen är noll. I vårt fall är den kvadratiska formen 8hk och de två linjerna är h = och k =. Dessa svarar mot ett litet axelparallell kors i en lite omgivning av den stationära punkten, som för oss är origo. Vi kompletterar därför vår graf ovan med utseendet nära sadelpunkten, vilket vi gör i rött i figuren till höger ovan. Sedan gäller det att tänka ut hur ytan rimligen bör se ut. Det man måste komma ihåg då är att två olika nivåkurvor inte kan skära varandra (eftersom vi ritar en funktionsyta) och ingen av nivåkurvorna kan skära sig själv. Nivåkurvor får visserligen skära varandra i en punkt, men en sådan punkt måste vara en stationär punkt (i alla andra punkter finns endast en tangent). Tänker vi efter en stund bör vi komma fram till att nivåkurvorna bör se ut som i figuren nedan. Notera speciellt nivåkurvan för nivån noll, alltså den som går igenom sadelpunkten. Den har formen av en åtta. Metoden vi använde i exemplet för att skissera nivåkurvorna bygger på en observation som vi nu ska formulera som en sats. Vi behöver dock två definitioner först.

Analys av stationära punkter 13 (17) Vi säger att z är ett kritiskt värde för funktionen f om nivåkurvan f(x, y) = z innehåller (minst) en stationär punkt. Den andra definitionen är att vi säger attt två plana kurvor är topologiskt ekvivalenta om om det finns en bijektiv och bikontinuerlig avbildning av den ena på den andra (och därmed omvänt, med hjälp av avbildningens invers). Den sats vi ska visa är då Sats 1 Om intervallet [a, b] inte innehåller något kritiskt värde till funktionen f, så gäller att nivåkurvan f(x, y) = a är topologiskt ekvivalent med nivåkurvan f(x, y) = b. I exemplet betyder det att alla nivåkurvor som svarar mot höjder mellan (, 2) topologiskt ska se likadana ut: nämligen två slutna kurvor som går runt de två lokala extrempunkterna. Nivåkurvor för höjder < ska också vara topologiskt ekvivalenta, vilket betyder att en sådan ska vara en sluten kurva som innesluter alla de tre stationära punkterna. Varför denna sats är sann är värt att förstå. Vi ska definiera en kontinuerlig avbildning Φ från den nedre nivåkurvan till den övre nivåkurvan. För det tag en punkt (x, y) på den nedre och gå sedan upp längs ytan i den riktning i vilken det är brantast tills du skär den övre nivåkurvan. Skärningspunkten definierar vi som Φ(x, y). Att denna blir en kontinuerlig avbildning är lätt att tro på, men följer egentligen ur teorin för ordinära differentialekvationer. Den brantaste kurvan fås ju som lösningen på ett system av sådana, och lösningen till ett sådant system beror kontinuerligt på startpunkten. Notera att det är viktigt att ingen av dessa kurvor uppför kommer till en stationär punkt. Från en sådan finns det ingen entydigt bestämd väg vidare uppför (om det ens går uppför), vilket skapar problem när vi ska definiera Φ. Det är dock möjligt att uttala sig om vad som händer om det finns stationära punkter mellan de två höjderna. När man passerar en sådan höjd ändrar nivåkurvorna topologiskt utssende på ett sätt som bestäms av vilken typ av stationär punkt det är. Vi går dock inte in på den diskussionen här. Bestämning av typ av stationär punkt vid bivillkor I det här avsnittet ska vi se hur diskussionen ovan ska modifieras då vi ska optimera en funktion under bivillkor. Vi börjar diskussionen med det enklaste fallet: att optimera en funktion f(x, y) under ett bivillkor g(x, y) =. De stationära punkterna (a, b) för det problemet definieras av att de löser ekvationen (df dg)(a, b) =. Bivillkoret g(x, y) = definierar en kurva i planet och vi låter c(t) vara en parametrisering av kurvan i en omgivning av en stationär punkt c() = (a, b). Vi vet då att funktionen φ(t) = f(c(t)) har en stationär punkt i t =. För att undersöka vilken typ av stationär punkt det är ska vi använda andraderivatan. För att få den ska vi derivera φ (t) = f (c(t))c (t) =

Analys av stationära punkter 14 (17) k kf(c(t))c k (t): φ (t) = k (( k f(c(t)) c k(t)+ k f(c(t))c k(t)) = k,l 2 klf(c(t))c k(t)c l(t)+ k k f(c(t))c k(t), vilket i matrisform blir φ (t) = c (t) t f (c(t))c (t) + f (c(t))c (t). Deriverar vi istället relationen g(c(t)) = får vi att för t i en omgivning av gäller att c (t) t g (c(t))c (t) + g (c(t))c (t) =. I en stationär punkt gäller att df = λdg, vilket betyder att f (c(t))c (t) = λg (c(t))c (t) = λc (t) t g (c(t))c (t). Stoppar vi in det i uttrycket för φ (t) ser vi att φ (t) = c (t) t (f (c(t)) λg (c(t)))c (t). Vi ser nu att vilken typ av stationär punkt vi har i (a, b) = c() bestäms av tecknet på Q(v) = v t Λ (a, b)v där Λ(x, y) = f(x, y) λg(x, y) och v är en tangentvektor till kurvan g(x, y) = i punkten (a, b), alltså en vektor sådan att dg(a, b)[v] =. Typen av stationär punkt ges följaktligen av tecknet på v t Λ (a, b)v, där Λ(x, y) = f(x, y) λg(x, y) och v är en tangentvektor till kurvan g(x, y) = i punkten (a, b), t.ex. v = ( y g(a, b), x g(a, b)). Vi kan också uttrycka det som att typen bestäms av vilken typ den kvadratiska formen Q(h) = h t Λ(a, b)h på den räta linjen dg(a, b)[h] = (där h = (h 1, h 2 )). Exempel 7 Vi vill hitta alla lokala extrempunkter till f(x, y) = 8x 2 12xy + 17y 2 på enhetscirkeln g(x, y) = x 2 + y 2 1. Vi har då att df dg = 4(8xdx 6(xdy + ydx) + 17ydy) (xdx + ydy) = 3(2x 2 3xy 2y 2 )dx dy = 3(2x + y)(x 2y)dx dy. Detta är noll endast då x = 2y eller 2x + y = och dessa linjers skärning med enhetscirkeln ger oss de stationära punkterna ±(2, 1)/ 5, ±(1, 1)/ 5. Vi ska nu undersöka typen av dessa. För det första paret, där x = 2y, har vi att df = 1xdx + 5xdy = 5(2xdx + xdy) = 5dg. En vektor v sådan att dg(v) = löser nu 2xv 1 + xv 2 =, alltså v = (1, 2), och vi får att ( ) ( ) 3 6 1 v t h v = (1, 2) = 75 >, 6 12 2

Analys av stationära punkter 15 (17) vilket visar att dessa punkter är lokala minima på enhetscirkeln. För det andra paret av punkter får vi att de är lokala maxima. Anmärkning Om vi som tangentvektor tar v = ( y g(a, b), x g(a, b)) får vi ( ) ( ) 2 ( y g, x g) xx f xyf 2 y g xyf 2 yyf 2 = x g y g( xxf 2 y g+ xyf 2 x g)+ x g( xyf 2 y g+ yyf 2 x g)) vilket svarar mot utveckling efter första rad (eller kolonn) i den symmetriska determinanten x g y g x g xxf 2 xyf 2 y g xyf 2 yyf 2. Låt oss nu generalisera detta resonemang. Låt B R n vara den mängd som definieras av bivillkoren g i (x) =, i = 1,..., p. En stationär punkt för f vid dessa bivillkor är då en punkt a sådan att df(a) dg 1 (a)... dg p (a) =, vilket är ekvivalent med att df är en linjärkombination av dg i, i = 1..., p i punkten: df(a) = p λ i dg i (a). i=1 Betrakta nu funktionen, med dessa λ i, Λ(x) = f(x) p λ i g i (x). i=1 Den har då en stationär punkt i a. Låt dess kvadratiska form vara Q(h). Sedan definierar vi U som det underrum i R n som definieras av villkoren dg i (h) =, i = 1,..., p. Vi ska då se att typen av Q i underrummet U definierar vilken typ av stationär punkt vi har för f under bivillkoren (alltså på B). För detta låter vi x = c(t) vara en kurva i B sådan att c() = a. Sätt F (t) = Λ(c(t)) = f(c(t)) (andra likheten gäller därför att g i (c(t)) = för alla i). Enligt kedjeregeln gäller nu att F (t) = Λ (c(t))c (t), F (t) = c (t) t Λ (c(t))c (t) + dλ(c(t))[c (t)]. För t = får vi då att F () = f(a), F () =, F () = Q(c ()) eftersom dλ(a) =. Om det nu finns en kurva c(t) sådan att Q(c ()) > så gäller att kurvan f(c(t)) har ett lokalt minimum i origo, medan om det finns en kurva sådan att Q(c ()) <, så har f(t) ett lokalt maximum i origo. Med andra ord, om Q är indefinit på U så gäller att motsvarande stationär punkt inte är en lokal extrempunkt.

Analys av stationära punkter 16 (17) Om istället Q är positivt definit på U definierar vi Λ µ (x) = f(x) k λ k g k (x) + µ k g k (x) 2. Vi ser då att om a är en stationär punkt till bivillkorsproblemet gäller att dλ µ (a) = df(a) k λ k g k (a) + µ k 2g k (a)dg k (a) =, så a är en stationär till Λ µ för alla µ. Vi ska då visa att om µ är tillräckligt stor, så gäller att denna stationära punkt är ett lokalt minimum. Om vi vet det så måste restriktionen till B också ha ett lokalt minimum i a, men denna restriktion är precis f med bivillkoren. Vi börjar då med att konstatera att g i (a + h) = g i (a) + dg i (a)[h] +... = dg i (a)[h] +..., från vilket vi drar slutsatsen att den kvadratiska formen som tillhör Λ i a ges av n Q(h) + µ dg i (a)[h] 2. Följande observation fullbordar nu beviset. i=1 Lemma 1 Om L i, i = 1,..., p är linjära former på R n och U = {h; L i (h) =, i = 1,..., p}, och den kvadratiska formen Q(h) är positivt definit på U, så gäller att det finns ett tal µ sådant att den kvadratiska formen K(h) = Q(h)+µ i L i(h) 2 är positivt definit på hela R n. Bevis. Det räcker att visa att K(h) är strängt positiv på enhetssfären S. Sätt D = {x S; Q(h) }. Detta är en kompakt mängd, så Q antar sitt minsta värde på D, kalla det c. Av motsvarande skäl finns det ett d > sådant att i L i(h) 2 d på D, ty om d = skulle det finnas ett h D sådant att L i (h) = för alla i, alltså h U. Men om h U gäller att Q(h) >, vilket ger en motsägelse. Vi ser då att K(h) c + µd > om µ > c/d. På resten av S gäller att K(h) > eftersom Q(h) >. Därmed är lemmat bevisat. Exempel 8 Funktionen f(x, y, z) = x 2 + y 2 + z 2 har på ytan g(x, y, z) = 1 + 4xy z 2 = de stationära punkterna ±(1/2, 1/2, ) och ±(,, 1). Vi vill bestämma deras typ. Vi börjar då med att bestämma multiplikatorn i vart och ett av fallen, och därigenom Lagrangesfunktionen Λ(x, y, z). a) För a = ±(1/2, 1/2, ) har vi df(a) = ±(dx dy) och dg(a) = ±( 2dx+2dy), så λ = 1/2 och Λ(x, y, z) = x 2 + y 2 + z 2 ( 1)(1 + 4xy 2 z2 ) = 2 + (x + y) 2 + z2. Underrummet U ges av att dg(a)(h, k, l) = 2h + 2k = på vilket 2 den kvadratiska formen är Q(h, h, l) = 4h 2 + l 2 /2, som är positivt definit. Punkterna är alltså lokala minimipunkter. b) För a = ±(,, 1) har vi att df(a) = ±2dz och dg(a) = ±( 2dz), så λ = 1 och Λ(x, y, z) = 1 + x 2 + y 2 + 4xy. Underrummet U ges av dg(a)(h, k, l) = 2l =, alltså hk-planet. På den är den kvadratiska formen Q(h, k, l) = h 2 + k 2 + 4hk = (h + 2k) 2 3k 2 och allså indefinit. Dessa punkter är därför

Analys av stationära punkter 17 (17) inte lokala extrempunkter. Noteringar 1. För att beräkna differentialen av Q i en punkt a skriver vi från vilket det följer att Q(a + h) Q(a) = (a + h) t B(a + h) a t Ba = h t Ba + a t Bh + h t Bh dq(a)(h) = h t Ba + a t Bh. De stationära punkterna är alltså de där h t Ba + a t Bh =. Men h t Ba = (Bh) t a = a t Bh, så detta villkor innebär att h t Ba = för alla h, och alltså Ba =.