Optimering av funktioner, med och utan bivillkor

Relevanta dokument
Differentialens geometriska betydelse

Optimering med bivillkor

Optimering med bivillkor

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A. 1. En svängningsrörelse beskrivs av

x ( f u 2y + f v 2x) xy = 24 och C = f

SF1626 Flervariabelanalys Tentamen Torsdagen den 20 augusti 2015

Flervariabelanalys E2, Vecka 3 Ht08

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

7 Extremvärden med bivillkor, obegränsade områden

Repetition, Matematik 2 för lärare. Ï x + 2y - 3z = 1 Ô Ì 3x - y + 2z = a Ô Á. . Beräkna ABT. Beräkna (AB) T

Tentamen: Lösningsförslag

= 0. Båda skärningsvinklarna är således π/2 (ortogonala riktningsvektorer).

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Lösningsförslag till tentamen Torsdag augusti 16, 2018 DEL A

SF1626 Flervariabelanalys Tentamen Torsdagen den 18 augusti 2016

Lösningsförslag till tentamen Onsdagen den 15 mars 2017 DEL A

Tentamen SF1626, Analys i flera variabler, Svar och lösningsförslag. 2. en punkt på randkurvan förutom hörnen, eller

Institutionen för Matematik, KTH Torbjörn Kolsrud

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Kap Globala extremvärden, extremproblem med bivillkor.

SF1626 Flervariabelanalys Tentamen Tisdagen den 12 januari 2016

Optimering, exempel. Funktionens enda stationära punkt är alltså origo. Den ligger också i det inre av mängden.

Lösningar till tentamen i Matematik II, 5B1116, 5B1136 för Bio. E,I,K,ME, Media och OPEN, tisdagen den 13 april 2004.

Institutionen för Matematik, KTH Torbjörn Kolsrud

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1669 Matematisk och numerisk analys II Lösningsförslag till tentamen DEL A. r cos t + (r cos t) 2 + (r sin t) 2) rdrdt.

Tentan , lösningar

SF1626 Flervariabelanalys

Tentamen i tmv036c och tmv035c, Analys och linjär algebra C för K, Kf och Bt A =, = det(a λi) = e 2t + c 2. x(t) = c 1. = c 1.

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

x (t) = 2 1 u = Beräkna riktnings derivatan av f i punkten a i riktningen u, dvs.

(x + 1) dxdy där D är det ändliga område som begränsas av kurvorna

Lektion 3. Partiella derivator, differentierbarhet och tangentplan till en yta, normalen i en punkt till en yta, kedjeregeln

SF1626 Flervariabelanalys Tentamen Tisdagen den 7 juni 2016

1. För vilka värden på konstanterna a och b är de tre vektorerna (a,b,b), (b,a,b) och (b,b,a) linjärt beroende.

Bestäm ekvationen för det plan som går genom punkten (1,1, 2 ) på kurvan och som spänns

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Tentamen i TATA43 Flervariabelanalys

Problem inför KS 2. Problem i matematik CDEPR & CDMAT Flervariabelanalys. KTH -matematik

SF1626 Flervariabelanalys Tentamen Onsdagen den 15 mars 2017

1. Vi skriver upp ekvationssystemet i matrisform och gausseliminerar tills vi når trappstegsform,

SF1669 Matematisk och numerisk analys II Lösningsförslag till tentamen DEL A

av envariabelfunktionen g(t) och flervariabelfunktionen t = h(x, y) = x 2 + e y.)

LUNDS TEKNISKA HÖGSKOLA MATEMATIK. LÖSNINGAR FLERDIMENSIONELL ANALYS, FMA kl 8 13

Partiella differentialekvationer av första ordningen

har ekvation (2, 3, 4) (x 1, y 1, z 1) = 0, eller 2x + 3y + 4z = 9. b) Vi söker P 1 = F (1, 1, 1) + F (1, 1, 1) (x 1, y 1, z 1) = 2x + 3y + 4z.

För studenter i Flervariabelanalys Flervariabelanalys MA012B ATM-Matematik Mikael Forsberg

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Tentamen i matematik. f(x) = ln(ln(x)),

Figur 1: Postföretagets rektangulära låda, definitioner.

1 x. SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Om att rita funktioner av två variabler

SF1626 Flervariabelanalys

SF1646 Analys i flera variabler Tentamen 18 augusti 2011, Svar och lösningsförslag

. b. x + 2 y 3 z = 1 3 x y + 2 z = a x 5 y + 8 z = 1 lösning?

Lösningsförslag till tentamen Tisdagen den 10 januari 2017 DEL A

Tentamen TMA044 Flervariabelanalys E2

Lösning till kontrollskrivning 1A

Institutionen för matematik SF1626 Flervariabelanalys. Lösningsförslag till tentamen Måndagen den 5 juni 2017 DEL A

En normalvektor till g:s nivåyta i punkten ( 1, 1, f(1, 1) ) är gradienten. Lektion 6, Flervariabelanalys den 27 januari z x=y=1.

SF1626 Flervariabelanalys Tentamen Måndagen den 16 mars 2015

Kontrollskrivning 1A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

SF1626 Flervariabelanalys Tentamen Måndagen den 21 mars 2016

1. Beräkna hastigheten, farten och accelerationen vid tiden t för en partikel vars rörelse beskrivs av r(t) = (2 sin t + cos t, 2 cos t sin t, 2t).

Analys av stationära punkter

AB2.4: Kurvintegraler. Greens formel i planet

Repetitionsfrågor i Flervariabelanalys, Ht 2009

MVE035. Sammanfattning LV 1. Blom, Max. Engström, Anne. Cvetkovic Destouni, Sofia. Kåreklint, Jakob. Hee, Lilian.

SF1626 Flervariabelanalys Tentamen Tisdagen den 10 januari 2017

x f x + y f y x. 2 Funktionen f(x, y) uppfyller alltså given differentialekvation.

Primitiva funktioner i flerdim

Övningar till Matematisk analys III Erik Svensson

Uppsala Universitet Matematiska Institutionen Bo Styf

= 0 genom att införa de nya

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Övningstenta: Lösningsförslag

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

x +y +z = 2 2x +y = 3 y +2z = 1 x = 1 + t y = 1 2t z = t 3x 2 + 3y 2 y = 0 y = x2 y 2.

2. Avgör om x och z är implicit definierade som funktion av y via följande ekvationssystem. x 3 + xy + y 2 + z 2 = 0 x + x 3 y + xy 3 + xz 3 = 0

Inlämningsuppgift nr 2, lösningar

f(x, y) = ln(x 2 + y 2 ) f(x, y, z) = (x 2 + yz, y 2 x ln x) 3. Beräkna en vektor som är tangent med skärningskurvan till de två cylindrarna

1 Linjära ekvationssystem. 2 Vektorer

SF1626 Flervariabelanalys Tentamen 14 mars 2011,

Vektorgeometri för gymnasister

Tentamen i Flervariabelanalys, MVE , π, kl

6. Räkna ut integralen. z dx dy dz,

Visa att vektorfältet F har en potential och bestäm denna. a. F = (3x 2 y 2 + y, 2x 3 y + x) b. F = (2x + y, x + 2z, 2y 2z)

Viktiga begrepp, satser och typiska problem i kursen MVE460, 2015.

TMV036 Analys och linjär algebra K Kf Bt, del C

SF1626 Flervariabelanalys Bedömningskriterier till tentamen Tisdagen den 7 juni 2016

Tentamen : Lösningar. 1. (a) Antingen har täljare och nämnare samma tecken, eller så är täljaren lika med noll. Detta ger två fall:

1. Beräkna och klassificera alla kritiska punkter till funktionen f(x, y) = 6xy 2 2x 3 3y 4 2. Antag att temperaturen T i en punkt (x, y, z) ges av

TMV036 Analys och Linjär Algebra K Kf Bt, del C

u av funktionen u = u(x, y, z) = xyz i punkten M o = (x o, y o, z o ) = (1, 1, 1) i riktningen mot punkten M 1 = (x 1, y 1, z 1 ) = (2, 3, 1)

Institutionen för matematik KTH. Tentamensskrivning, , kl B1119, Vektoranalys, för Open.

Determinant Vi förekommer bokens avsnitt, som handlar om determinanter eftersom de kommer att användas i detta avsnitt. a 11 a 12 a 21 a 22

Sidor i boken f(x) = a x 2 +b x+c

Transkript:

Analys 360 En webbaserad analyskurs Differentialkalkyl Optimering av funktioner, med och utan bivillkor Anders Källén MatematikCentrum LTH anderskallen@gmail.com

Optimering av funktioner, med och utan bivillkor 1 (16) Introduktion I det här kapitlet ska vi diskutera optimering av (reellvärda) funktioner av flera variabler, med andra ord, att hitta det största och minsta värdet en sådan funktion kan anta i ett visst område. Det handlar alltså inte om att bestämma vilken typ olika stationära punkter är av, utan bara om att hitta vilka värden de ger. Att största och minsta värde verkligen finns för en kontinuerlig funktion på ett kompakt område är ett påstående som är kopplat till de reella talens egenskaper, och något vi bara antar (fast egentligen inte använder). De funktioner vi ska optimera på detta sätt är de som är differentierbara i alla punkter (med eventuellt något enstaka undantag) i sitt definitionsområde, vilket gör att vi kan hitta det största och minsta värde funktionen kan anta genom att bl.a. bestämma dess stationära punkter. Nytt jämfört med endim är hur området vi ska optimera på är definierat. Ibland kanske vi vill hitta största och minsta värde endast för punkter på en kurva eller yta eller något liknande. Om dessa kurvor/ytor/etc är givna genom ekvationer, har man vad man kallar ett optimeringsproblem med bivillkor. Att i sådana situationer bestämma stationära punkter kan göras på ett sätt som geometriskt kan beskrivas i 2D som att bivillkoret, som då är en kurva, ska tangera en nivåkurva i punkten. Det finns emellertid en mer algoritmisk, rent analytisk, metod att göra detta på som lättast beskrivs genom att vi inför en speciell operation, den s.k. kilprodukten. Optimering utan bivillkor Vi ska börja med att diskutera optimering på ett kompakt område som slutna höljet [1] av ett öppet område. Som vanligt håller vi oss framför allt till 2D, även om allt generaliseras naturligt till funktioner av fler variabler. Vi utgår ifrån två satser: a) En funktion som är kontinuerlig på ett kompakt område antar sitt största och minsta värde. b) En lokal extrempunkt som är en inre punkt i definitionsområdet är en stationär punkt om funktionen är differentierbar i den. Innebörden av detta är att för att hitta extrempunkterna ska vi a) Hitta alla stationära punkter i det inre av området. b) Hitta alla inre punkter i vilka funktionen inte är differentierbar. c) Undersöka randen. I endim gäller att det kompakta området typiskt är ett intervall [a, b], och vi ska då hitta alla punkter i ]a, b[ där funktionen antingen inte är deriverbar eller har derivatan noll. Dessutom ska vi undersöka värdet av funktionen på randen, vilket är de två ändpunkterna x = a och x = b. I flerdim är situationen mer komplicerad i två avseenden: a) För att hitta stationära punkter måste vi lösa ekvationssystem

Optimering av funktioner, med och utan bivillkor 2 (16) b) Att undersöka randen kan vara ett ganska omfattande problem. Vi börjar med ett relativt enkelt exempel. Exempel 1 Bestäm största och minsta värde av funktionen f(x, y) = x 2 +x(y 2 1) på cirkelskivan x 2 + y 2 1.Innan vi börjar analysen kan vi betrakta figuren nedan. Här är nivåkurvor ritade (även om nivåer inte är antydda) tillsammans med området (den gula cirkelskivan) över vilket vi ska optimera funktionen. Genom att studera denna figur kan vi få en viss uppfattning om vilka kandidatpunkter som finns. T.ex. ser vi att det finns en punkt inuti området som är omgiven av små slutna, närmast elliptiska, nivåkurvor, vilket betyder att den måste vara en lokal extrempunkt. Vi ser också några punkter på randen till området där detta tangerar nivåkurvor till f, vilket är den grafiska beskrivningen av hur en lokal extrempunkt måste se ut på randen (vi återkommer till det nedan). För optimeringen följer vi schemat som vi diskuterade ovan. Funktionen är differentierbar överallt, och de stationära punkterna ges av att { df(x, y) = (2x + (y 2 2x + y 2 1 = 0 1))dx + 2xydy = 0. 2xy = 0 Löser vi ekvationssystemet [2] ser vi att de stationära punkterna är (0, 1), (0, 1), ( 1 2, 0). Av dessa är det endast den sista som ligger i området, och värdet i den är 1/4. Det återstår att undersöka randen, som ges av ekvationen x 2 + y 2 = 1 och alltså är enhetscirkeln. Vi kan göra detta på flera sätt (ett till kommer i nästa avsnitt) men det enklaste är troligen att parametrisera den med de vanliga trigonometriska funktionerna: x(t) = cos t, y(t) = sin t. Stoppar vi in det i funktionen får vi g(t) = f(cos t, sin t) = cos 2 t + cos t(sin 2 t 1) = cos 2 t(1 cos t).

Optimering av funktioner, med och utan bivillkor 3 (16) Vi vill hitta största och minsta värde av denna på intervallet π t π. Men vi ser att g(t) = h(cos t), där h(x) = x 2 (1 x), så det gäller att hitta största och minsta värde av h då 1 x 1. Detta görs lätt som ett 1D optimeringsproblem (derivera etc), men kanske ännu enklare genom att man bara inser att största möjliga värde är 2, vilket vi får för x = 1, medan minsta möjliga värde är 0, vilket fås då x = 0 och x = 1. På randen antas alltså alla värden i intervallet [0, 2]. Om vi nu jämför vad vi fann inne i området och på randen, kan vi sammanfatta resultatet i att f min = 1 4, och f max = 2. Anmärkning Ett till synes enklare sätt att undersöka randen i detta fall är att sätta in y 2 = 1 x 2 i ekvationen och optimera den uppkomna funktionen x 2 x 3, 1 x 1. Det vi gör då är att vi delar upp randen i två delar, y = ± 1 x 2, 1 x 1 vilka vi parametriserar med x som parameter. Att funktionen beror på y i form av dess kvadrat gör att övre och undre halvcirkeln ger samma funktionsvärden. Området i föregående exempel var kompakt, och då vet vi att det måste finnas ett största och ett minsta värde. Om området inte är kompakt behöver det inte vara så. För att analysera situationen i sådana fall behöver vi typiskt kombinera metoden ovan med någon form av gränsvärdesberäkning. För att exemplifiera det tar vi först ett endim-exempel. Exempel 2 Vi vill hitta största och minsta värde av f(x) = xe x2 då x 0. Vi börjar då med att bestämma de stationära punkterna, alltså derivatans nollställen. Vi har f (x) = e x2 (1 2x 2 ) vilket är noll då x = ±1/ 2. Det finns alltså endast en stationär punkt i området, nämligen 1/ 2 och i den punkten är funktionsvärdet 1 2e. Återstår att undersöka randen. För att göra det betraktar vi funktionen på det begränsade intervallet [0, R] där R > 1. I ändpunkterna har vi f(0) = 0 och f(r) = Re R2 0 då R. Om vi därför tar R tillräckligt stort, så vet vi att i intervallet [0, R] är det största värdet 1/ 2e och det minsta värdet 0. Detta gäller för alla tillräckligt stora R, varför det också är sant på det ursprungliga definitionsområdet [0, ). Principen är densamma i flerdim, som följande 2D-exempel visar. Exempel 3 Vi ska avgöra om funktionen f(x, y) = (x + 2y)e x2 y 2

Optimering av funktioner, med och utan bivillkor 4 (16) har något största eller minsta värde i R 2. Liksom i föregående exempel börjar vi med att bestämma alla stationära punkter till f i området, alltså i hela planet. En del räknande visar att dessa ges av ekvationssystemet 2x(x + 2y) = 1, 2y(x + 2y) = 2. Dividerar vi ekvationerna med varandra ser vi att y = 2x, och stoppar vi in det i den första ekvationen, finner vi att de stationära punkterna är ±(1, 2)/ 10. Motsvarande funktionsvärden är ±5/ 10e. Vi tar sedan ett stort R och betraktar funktionen på cirkelskivan B R : x 2 + y 2 R 2. I det inre finns då precis två stationära punkter, de vi bestämde ovan. För att undersöka hur stor funktionen kan bli på randen använder vi polära koordinater: x = R cos θ, y = R sin θ. Vi vill alltså se hur stor/liten funktionen g R (θ) = f(r cos θ, R sin θ) = R(cos θ + 2 sin θ)e R2 kan bli då 0 θ 2π. Men här ser vi att g R (θ) 3Re R2 0 då R, så, löst uttryckt, f går mot noll då R går mot oändligheten. Om vi tar R tillräckligt stor vet vi därför att minsta värde är 5 10e och största är 5 10e i B R, och det oberoende av R. Eftersom det är sant hur stort vi än väljer R följer att i planet gäller att f max = 5/ 10e, f min = 5/ 10e. Anmärkning Ibland lönar det sig att titta på en given funktion i andra koordinater än de den är given i. Vi har sett att i polära koordinater blir funktionen f(r, θ) = (cos θ + 2 sin θ)re r2 och vi kan lika gärna bestämma dess största och minsta värde då r 0 och 0 θ 2π. Vilket i det här fallet är enkelt, ty med hjälp av hjälpvinkelsatsen har vi att f(r, θ) = 5 sin(θ + φ)re r2 för någon vinkel φ som vi inte behöver bestämma. Vi vet att re r2 har sitt största värde 1/ 2e i punkten r = 1/ 2 och att 1 sin(θ+φ) 1 (med likhet för lämpliga θ). Detta ger oss samma resultat som i exemplet. Optimering med bivillkor i 2D I 2D finns också problemet att optimera med bivillkor, dvs hitta största och minsta värde av en funktion som är definiera på en kurva i planet. Hur svårt detta är bestäms av

Optimering av funktioner, med och utan bivillkor 5 (16) hur kurvan är given. Om vi har en parametrisering c(t) av kurvan, så kan vi optimera funktionen f(x, y) genom att studera den sammansatta funktionen φ(t) = f(c(t)) av en variabel. De stationära punkterna ges då av villkoret φ (t) = df(c(t))[c (t)] = 0, som analyseras med 1D-metoder. Detta var den metod vi använde i Exempel 1 Geometriskt innebär villkoret df(c(t))[c (t)] att tangenten till kurvan är vinkelrät mot gradienten till f i en stationär punkt. Vi ska nu se hur vi kan formulera detta villkor när kurvan istället är given på formen g(x, y) = C för någon konstant C. Om tangeringspunkten är a, låt c(t) vara en parametrisering av kurvan i närheten av a = c(0), så att g(c(t)) = C för t nära 0. Då gäller att dg(c(t))(c (t)) = 0 för alla t, d.v.s. gradienten till g är normal till kurvans tangent i punkten a. I en stationär punkt måste därför dessa normaler (alltså gradienter) vara proportionella. Ett annat sätt att utttrycka det är att säga att differentialerna måste vara proportionella, d.v.s. det finns ett tal λ sådant att df(a, b) = λdg(a, b). grad g(a) f(x, y) = c grad f(a) g(x, y) = 0 Punkter (a, b) sådana att detta gäller sägs vara stationära punkter för optimeringsproblemet ovan, och för att en punkt ska vara en lokal extrempunkt till f på kurvan g(x, y) = 0 måste den alltså vara en stationär punkt. Eller en ändpunkt på kurvan. Vi illustrerar detta med att hitta ett alternativt sätt att undersöka randen i exempel 1. Exempel 4 Vi ska bestämma alla lokala extrempunkter till f(x, y) = x 2 +x(y 2 1) under bivillkoret x 2 + y 2 = 1. I bilden nedan är nivkurvorna till f utritade tillsammans med bivillkoret, som utgör den gröna cirkeln.

Optimering av funktioner, med och utan bivillkor 6 (16) Vi kan i denna figur geometriskt se det vi ovan påstår: att en lokal extrempunkt måste vara en stationär punkt enligt definitionen ovan. För att vi ska ha ett lokalt maximum i en punkt på cirkeln, måste vi först gå upp och sedan ner på funktionsytan, när vi rör oss genom punkten längs cirkeln. Det betyder att cirkeln måste tangera motsvarande nivåkurva i den punkten, vilket betyder att de har samma tangent. Men cirkeln är också en nivåkurva, nämligen till funktionen g(x, y) = x 2 + y 2, som alltså ska ha samma tangent som cirkeln i den punkten. För att bestämma de stationära punkterna beräknar vi differentialerna: df(x, y) = (2x + y 2 1)dx + 2xydy, dg(x, y) = 2xdx + 2ydy. De stationära punkterna (x, y) är då de punkter för vilka det finns ett tal λ sådant att { 2x + y 2 1 = 2λx. 2xy = 2λy Vi får alltså ett ekvationssystem bestående av två ekvationer men tre obekanta. Men det är enklare att lösa detta ekvationssystem genom att notera att villkoret är att det två gradientvektorerna grad f(x, y) = (2x + y 2 1, 2xy), grad g(x, y) = (2x, 2y) ska vara parallella, och att i två dimensioner innebär det att arean av det område som spänns upp av dessa vektorer ska vara noll, vilket den linjära algebran lär oss. Vi lär oss där också att detta i sin tur är ekvivalent med att deras determinant är noll: 2x + y 2 1 2x 2xy 2y = 2y(2x + y2 1 2x 2 ) = 0. Dessutom ska bivillkoret gälla, så de stationära punkterna ges av ekvationerna { { 2y(2x + y 2 1 2x 2 ) = 0 2xy(2 3x) = 0 x 2 + y 2 = 1 x 2 + y 2 = 1. Från detta ser vi att de stationära punkterna ges av Motsvarande värden är (±1, 0), (0, ±1), ( 2 3, ± 5 3 ). f(1, 0) = f(0, ±1) = 0, f( 1, 0) = 2, f( 2 3, ± 5 3 ) = 8 27. Vi får alltså att värdemängden är [0, 2], precis som tidigare. Man får inte glömma att villkoret (df dg)(a, b) = 0 betyder att de två differentialerna är proportionella, d.v.s. att det finns ett λ sådant att df(a, b) = λdg(a, b). Talet λ, som beror av (a, b), kallas Lagranges multiplikator, och har ibland en speciell betydelse.

Optimering av funktioner, med och utan bivillkor 7 (16) Exempel 5 Vi vill hitta största och minsta värde av funktionen f(x, y) = ax 2 + 2bxy + cy 2 på enhetscirkeln g(x, y) = x 2 + y 2 1 = 0. De stationära punkterna är då de för vilka det gäller att df(x, y) = λdg(x, y), alltså { ax + by = λx 2((ax + by)dx + (bx + cy)dy) = 2λ(xdx + ydy). bx + cy = λy Men om vi här multiplicerar den första ekvationen med x och den andra med y och adderar, får vi att ax 2 + 2bxy + cy 2 = λ(x 2 + y 2 ) f(x, y) = λ. I en stationär punkt gäller alltså att funktionsvärdet är lika med Lagranges multiplikator! Detta är ett resultat från linjära algebran. Multiplikatorn λ är sådant att ekvationssystemet (a λ)x + by = 0, bx + (c λ)y = 0 för (x, y) (0, 0). Det betyder precis att a λ b b c λ = 0. ( ) a b λ är med andra ord ett egenvärde till den symmetriska matrisen. Eftersom b c funktionen f har både ett största och ett minsta värde på enhetscirkeln följer att en symmetrisk 2 2-matrix alltid har ett reellt egenvärde. Kilprodukten av två differentialer Oavsett hur många variabler x = (x 1,..., x n ) som f är funktion av, så gäller att om vi vill optimera f på g(x 1,..., x n ) = 0 så gäller det att hitta punkter a sådana att df(a) = λdg(a) för något tal λ. Med hjälp av den s.k. kilprodukten översätts detta villkor mer eller mindre direkt till ett ekvationssystem utan λ. Vi börjar med att påminna oss att differentialen av en funktion i en punkt är egentligen en linjär funktion av en vektor v, vars färde är det som ofta kallas riktningsderivatan df(x)(v) (när v = 1). För att förenkla beteckningarna lite utelämnar vi x från dem. Differentialer av två funktioner f, g i en punkt är proportionella precis då [3] (df dg)(v, w) = df(v)dg(w) df(w)dg(v) = df(v) df(w) dg(v) dg(w) = 0 för alla v, w.

Optimering av funktioner, med och utan bivillkor 8 (16) Denna produkt av två differentialer kallas kilprodukten av df och dg, och är sådan att df och dg är parallella precis om df dg = 0. Detta villkor visar sig var ett behändigt sätt att bestämma de stationära punkterna. För det måste vi lära känna kilprodukten lite bättre. Exempel 6 I 2D har vi att (dx dy)(v, w) = dx(v) dy(v) dx(w) dy(w) = v 1 w 1 v 2 w 2 = v 1w 2 v 2 w 1. Från linjära algebran känner man kanske igen detta som arean av den parallellepiped som spänns upp av vektorerna v och w. Så genom att beräkna dx dy på ett par av vektorer v, w får vi arean av denna parallellepiped. Här är några egenskaper, vilka svarar mot determinantens egenskaper: a) Kilprodukten är linjär i de två argumenten v och w. En funktion av två variabler som är linjär i vart argument ensamt kallas en bilinjär funktion. b) Kilprodukten är skev-symmetrisk, d.v.s. det gäller att [4] Speciellt följer att df df = 0. df dg = dg df. c) Kilprodukten är linjär i f, dvs d(af 1 + bf 2 ) dg = adf 1 dg + bdf 2 dg. Som följd av skev-symmetrin är produkten naturligtvis linjär i g också. Dessa egenskaper följer direkt ur definitionen, och de innebär att för funktioner av två variabler kan vi beräkna kilprodukten på följande sätt: df dg = ( x fdx + y fdy) ( x gdx + y gdy) = x f x f(dx dx) + x f y g(dx dy) + x g y f(dy dx) + y g y g(dy dy). Men eftersom dx dx = dy dy = 0 och dx dy = dy dx, så följer ur detta att df dg = ( x f y g x g y f)dx dy. Koefficienten framför dx dy ges därför av determinanten xf x g y f y g som geometriskt är arean med tecken av den parallellogram som spänns upp av gradienten till f och gradienten till g. Detta gör det självklart att vi har parallella gradienter precis då df dg = 0. Men framför allt ger det en geometrisk tolkning av kilprodukten av två differentialer som en area av ett parallellogram, nämligen det som spänns upp av gradienterna till funktionerna.

Optimering av funktioner, med och utan bivillkor 9 (16) En observation som spelar stor roll inom flerdimensionell analys är följande. Om vi inför polära koordinater x = r cos θ, y = r sin θ, så gäller att dx dy = (cos θdr r sin θdθ) (sin θdr + r cos θdθ) = (r cos 2 θ + r sin 2 θ)dr dθ = rdr dθ. Egentligen ska vi skriva detta som dr (rdθ) för tolkningen av detta uttryck är som arean (med tecken) av dθ en liten rektangelliknande area med sidor dr och rdθ. r r + dr Vi kan nu sammanfatta denna diskussion kring optimering med bivillkor i två dimensioner på följande sätt: för att en funktion f ska ha en lokal extrempunkt i en punkt (a, b) under bivillkoret g(x, y) = 0 måste denna vara en stationär punkt, d.v.s uppfylla (df dg)(a, b) = 0. Exempel 7 Vi återvänder till randanalysen i exempel 1. Differentialerna av funktionerna f och g finns där uträknade och från dem får vi att df(x, y) dg(x, y) = ((2x + y 2 1)dx + 2xydy) (2xdx + 2ydy) = (2y(2x + y 2 1) 2x(2xy))dx dy = 2y(2x + y 2 1 2x 2 )dx dy. Dessutom ska bivillkoret gälla, så de stationära punkterna ges av ekvationerna. Detta ger oss samma ekvationssystem som tidigare. Vi avslutar 2D-fallet med ett ytterligare exempel. Exempel 8 Bestäm största och minsta avstånd från kurvan x 3 +y 3 = 1, x 0, y 0, till origo. Eftersom avståndet i kvadrat från (x, y) till origo enligt y Pytagorhas sats ges av f(x, y) = x 2 + y 2, är det denna funktion vi ska hitta största och minsta värde på under bivillkoret som ges av kurvan (lägg märke till att detta är en kurva med ändpunkter). Vi har att df dg = (2xdx + 2ydy) (3x 2 dx + 3y 2 dy) = 6xy(y x)dx dy, så de stationära punkterna ges av villkoren x xy(y x) = 0, x 3 + y 3 = 1, x > 0, y > 0.

Optimering av funktioner, med och utan bivillkor 10 (16) Den enda lösningen på detta är punkten 2 1 3 (1, 1), i vilken funktionen har värdet 2 1 3. Dessutom måste vi undersöka randpunkterna (1, 0) och (0, 1) på kurvan. Värdena i dessa punkter är båda 1. Vi ser alltså att avståndet varierar mellan 1 som minst och 2 1 6 som störst. Betrakta nu motsvarande problem i tre variabler. Vi vill alltså optimera en funktion f(x, y, z) på en yta g(x, y, z) = 0. Geometriskt innebär villkoret df(a) = λdg(a) då att i punkten a är normalen till f:s tangentplan parallell med normalen till g:s tangentplan (dvs de två tangentplanen sammanfaller i punkten a). Att två vektorer i rummet är parallella kan inte uttryckas med ett determinantvillkor. Däremot kan vi använda kilprodukten. Villkoret är ju ekvivalent med (df dg)(a) = 0, och med df(a) = x f(a)dx + y f(a)dy + z f(a)dz, och motsvarande för g, får vi df dg = ( x fdx + y fdy + z fdz) ( x gdx + y gdy + z gdz) = ( x f y g x g y f)dx dy + ( y f z g z f y g)dy dz + ( z f x g x f z g)dz dx. Exempel 9 Vi ska bestämma största värdet av f(x, y, z) = x+y 2 +z på enhetssfären x 2 + y 2 + z 2 = 1. Vi beräknar då df dg = (dx + 2ydy + dz) (2xdx + 2ydy + 2zdz) = (2y 4xy)dx dy + (4yz 2y)dy dz + (2z 2x)dx dz. En stationär punkt ska därför vara en lösning på följande fyra ekvationer 2y(1 2x) = 0, 2y(2z 1) = 0, 2(x z) = 0, x 2 + y 2 + z 2 = 1. För att lösa detta ser vi från den tredje ekvationen att z = x. Vidare ger den första att antingen är y = 0 eller x = 1/2. Vi har därför två fall: a) Om y = 0 och z = x, är de tre första ekvationerna uppfyllda och den sista ger att 2x 2 = 1, alltså x = ± 1 2. Punkterna är ± 1 2 (1, 0, 1) och motsvarande funtionsvärde är ± 2. b) Om x = z = 1/2 är de tre första ekvationerna uppfyllda och den sista ger att y 2 = 1. Detta ger oss punkterna ( 1, ± 1 2 2 2, 1 ), och motsvarande funktionsvärde 2 är 3/2 i båda punkterna.

Optimering av funktioner, med och utan bivillkor 11 (16) Anmärkning Även det här villkoret kan vi härleda från linjär algebran om vi vill. Vi har nämligen att koefficienterna i lämplig ordning ( y f z g z f y g, z f x g x f z g, x f y g x g y f, ) är inget annat än vektorprodukten grad f grad g, och vi vet att två vektorer i rummet är parallella precis då deras vektorprodukt är noll. Exempel 10 Vi vill bestämma den maximala volymen på ett rätblock som man stoppa in i en sfär med radien 2. Om vi låter sidlängderna vara 2x, 2y, 2z så betyder det att vi vill hitta det största värdet för funktionen f(x, y, z) = xyz då g(x, y, z) = x 2 + y 2 + z 2 4 = 0, x 0, y 0, z 0. (Vi lägger här koordinataxlara parallellt med rätblockets kanter.) Vi börjar med att bestämma de stationära punkterna: df dg = (yzdx + xzdy + xydz) (2xdx + 2ydy + 2zdz) = 2z(y 2 x 2 )dx dy + 2y(x 2 z 2 )dz dx + 2x(z 2 y 2 )dy dz och vi får därför tre ekvationer: z(y 2 x 2 ) = 0, y(x 2 z 2 ) = 0, x(z 2 y 2 ) = 0. Eftersom när någon av koordinaterna är noll så ligger vi på randen till ytan som definieras av bivillkoren, så följer ur detta att x 2 = y 2 = z 2 och stoppar vi in det i bivillkoret x 2 + y 2 + z 2 = 4 får vi att det ska gälla att x 2 = y 2 = z 2 = 4/3. Vidare ska koordinaterna vara positiva, så den enda stationära punkten är 2 3 (1, 1, 1) som ger volymen 8/9 3. Slutligen ser vi att på randen av området är volymen noll, så detta ger det störta värdet på volymen. Vi avslutar med ett exempel från ekonomin, där vi åter får en mening för Lagrangemultiplikatorn λ som är sådan att grad f(a) = λ grad g(a) när df(a) dg(a) = 0. Exempel 11 En person ska för ett kapital K kronor köpa n olika varor v 1,..., v n. Priset för vara v i är p i > 0 kronor per enhet, och vi antar att han köper x i enheter av vara v i. Då är p 1 x 1 + p 2 x 2 +... + p n x n = K. Han beräknar nu sin nytta av att köpa x i enheter av vara v i med en C 1 funktion U(x 1,..., x n ) (kallas nyttofunktionen). Den partiella derivatan i U(x) kallas gränsnyttan i punkten x. I en punkt a i vilken U är maximal under bivillkoret gäller att i U(a) = λp i, i = 1,..., n, där λ är Lagrangemultiplikatorn. Det följer att kvoten mellan gränsnyttan

Optimering av funktioner, med och utan bivillkor 12 (16) i en maximipunkt a och priset är detsamma för alla varor, och lika med Lagrangemultiplikatorn. Betrakta nu maximiproblemet ovan för olika värden på kapitalet K. Maximipunkten blir då en funktion av K, a(k), vilken vi antar är i C 1. Låt F (K) = U(a(K)). Enligt kedjeregeln är n F (K) = i U(a(K))a i(k). i=1 Derivatan F (K) brukar kallas kapitalets gränsnytta. Stoppar vi här in villkoret ovan för vad som gäller i en maximipunkte ser vi att F (K) = n N λp i a i(k) = λ( p i a i (K)). i=1 i=1 Men bivillkoret är att i p ia i (K) = K, så denna derivata är ett. Vi har alltså att kapitalets gränsnytta är F (K) = λ. Optimering när vi har två bivillkor Innan vi kan titta på fallet med två bivillkor g 1 (x, y, z) = 0, g 2 (x, y, z) = 0 måste vi utvidga kilprodukten. Vi vill göra det så att trippelprodukten av 1-former ges av df(u) df(v) df(w) (df dg dh)(u, v, w) = dg(u) dg(v) dg(w) dh(u) dh(v) dh(w). Detta var ju hur vi definierade kilprodukten av två differentialer i planet och borde därför vara vettigt. Notera att om vi byter ordning på funktionerna byter produkten tecken, och vi får tolkningen av trippelprodukten som volymen (med tecken) av den parallellepiped som definieras av de tre funktionernas gradienter i punkten. För att uppnå vårt mål utvecklar vi determinanten efter första raden.vi får då, om vi skriver ω = dg dh, (df ω)(u, v, w) = df(u)ω(v, w) df(v)ω(u, w) + df(w)ω(u, v). Att så är fallet följer tydligare om man skriver ut determinanten som definierar ω(u, v). Av linjäritetsskäl måste denna formel gälla även för allmänna 2-former ω, så vi använder den formeln till att definiera kilprodukten av en 1-form med en 2-form. Härigenom får vi trippelprodukten (df dg) dh definierad som 3 3-determinanten ovan. Vi ser också att om vi multiplicerar ihop de tre differentialformerna i den andra ordningen, df (dg dh), så får vi samma determinant. Det följer helt allmänt att df ω = ω df för 2-former ω. Vi ser direkt följande påstående: differentialerna df, dg, dh är linjärt beroende precis då df dg dh = 0. Vi återvänder nu till optimering med bivillkoren g 1 (x, y, z) = 0, g 2 (x, y, z) = 0. En sådan skärning är typiskt en kurva och om a är en punkt på denna kurva i vilken f

Optimering av funktioner, med och utan bivillkor 13 (16) har en lokal extrempunkt på kurvan, så ska kurvans tangent ligga i tangentplanet till nivåytan f(x, y, z) = f(a). Argumentet är samma som i 2D. Men kurvans tangentlinje är skärningen mellan tangentplanet till ytan g 1 (x, y, z) = 0 och tangentplanet till ytan g 2 (x, y, z) = 0. Gradienterna till de tre funktionerna f, g 1, g 2 måste då i punkten a vara ortogonala mot denna tangentlinje, vilket i sin tur betyder att de är linjärt beroende. Uttryckt i differentialen betyder det att df måste vara en linjärkombination av dg 1 och dg 2. Villkoret för stationära punkter är därför att df dg 1 dg 2 = 0. Anmärkning Ibland kan det hända att de två bivillkoren har samma tangentplan i en punkt, och skärningen blir då ingen linje. Men det ändrar inget. Exempel 12 Mellan vilka värden varierar z på kurvan som ges som skärning mellan enhetssfären x 2 + y 2 + z 2 = 1 och planet x + 2y + 2z = 0? Vi ska bestämma värdemängden för funktionen f(x, y, z) = z under bivillkoren g 1 (x, y, z) = x 2 + y 2 + z 2 1 = 0 och g 2 (x, y, z) = x + 2y + 2z 1 = 0. Vi börjar med att beräkna df dg 1 dg 2 = dz (2xdx + 2ydy + 2zdz) (dx + 2dy + 2dz) = dz (2xdx + 2ydy) (dx + 2dy) = (4x 2y)dz dx dy. De stationära punkterna ska därför lösa ekvationerna 4x 2y = 0 y = 2x x 2 + y 2 + z 2 = 1 5x 2 + z 2 = 1 x + 2y + 2z = 0 5x + 2z = 1 och ur detta får vi punkterna ± 5(2, 4, 5). Dessa ger största och minsta värde, så 15 z-komponenten varierar i intervallet [ 5, 5 ]. 15 15 Exempel 13 Vi ska bestäm värdeförrådet av funktionen f(x, y, z) = xyz på den kompakta mängd som definieras av de två ekvationerna x 2 + y 2 + z 2 = 4 och x 2 + y 2 z 2 = 0. Vi inför funktionerna g 1 (x, y, z) = x 2 + y 2 + z 2 4 och g 2 (x, y, z) = x 2 + y 2 z 2 och beräknar kilprodukten df dg 1 dg 2 = (yzdx + xzdy + xydz) (2xdx + 2ydy + 2zdz) (2xdx + 2ydy 2zdz) =

Optimering av funktioner, med och utan bivillkor 14 (16) 8(x 2 y 2 )z 2 dx dy dz = 0. För att hitta alla stationära punkter ska vi alltså lösa de tre ekvationerna (i 3 obekanta) 8(x 2 y 2 )z 2 = 0, x 2 + y 2 + z 2 = 4, x 2 + y 2 z 2 = 0. Det ena alternativet här är att z = 0, men då ger den tredje ekvationen att x = y = 0 och det motsäger den andra. Alltså måste x = ±y i vilket fall vi har dels att z 2 = 2x 2 ur den sista ekvationen och sedan att x 2 = 1 ur den andra. Det följer att de stationära punkterna är (±1, ±1, ± 2). Räknar vi ut värdena i dessa punkter finner vi att värdeförrådet blir [ 2, 2]. Diskussionen här har hållits för funktioner av tre variabler och med två bivillkor. Men villkoret är detsamma för funktioner av fler variabler och två bivillkor med i princip samma resonemang. Dessutom bör det stå klart hur man generaliserar till att optimera en funktion av n variabler med k bivillkor av typen g i = 0. Allt görs efter samma mönster! Lite mer om optimering under bivillkor En metod att göra optimering under bivillkor är att försöka lösa ut några av variablerna ur bivillkoren och därmed skapa ett optimeringsproblem utan bivillkor men i färre variabler. Anmärkningen efter Exempel 1 är ett enkelt exempel. Detta kan dock bli ganska komplicerat, men det är möjligt att använda idén för att få lite mindre ekvationssystem att lösa. Resonemanget bygger på att vi kan använda implicita funktionssatsen för att veta att det går att lösa ut vissa variabler som funktion av de övriga. Vi illustrerar metoden först med problemet att optimera f(x, y, z) under ett bivillkor g(x, y, z) = 0. I ett område där 1 g 0 kan vi då enligt implicita funktionssatsen införa nya variabler x = g(x, y, z), y = y, z = z, och skriva f(x, y, z) = F (g(x, y, z), y, z). (1) Då gäller att optimeringsproblemet övergår i att optimera G(y, z) = F (0, y, z), utan bivillkor. Detta ska göras genom att beräkna dess differential, vilket vi kan göra därför att df = 1 F dg + 2 F dy + 3 F dz, vilket medför att dg = df 1 F dg. För att bestämma 1 F deriverar vi (1) m.a.p. x och får att 1 F = 1 f/ 1 g. Det följer att dg = 1gdf 1 fdg. 1 g

Optimering av funktioner, med och utan bivillkor 15 (16) Exempel 14 Med data som i Exempel 10 ovan har vi (då x 0) dg = (yzdx+xzdy+xydz) yz 2x (2xdx+2ydy+2zdz) = 1 x (z(x2 y 2 )dy+y(x 2 z 2 )dz.) Koefficienten framför dx är noll, som sig bör. Från detta ser vi att de stationära punkterna ges av att z(x 2 y 2 ) = y(x 2 z 2 ) = 0, tillsammans med bivillkoret. Det är tre ekvationer i tre obekanta och lätt löst. Notera dock att vi måste anta att x 0, så vi får titta på fallet x = 0 separat. Motsvarande kan naturligtvis göras med två bivillkor, men vi kan inte vinna något på det eftersom vi redan hittat en metod som ger tre ekvationer i tre obekanta. Men vi ska se att ovanstående metod ger samma resultat. Med två bivillkor g 1 (x, y, z) = g 2 (x, y, z) = 0 inför vi nya variabler så att vi kan skriva f(x, y, z) = F (g 1 (x, y, z), g 2 (x, y, z), z). Motiveringen är samma som tidigare, inversa funktionssatsen, och den kräver då att en viss 2 2-matris är inverterbar. Vi ignorerar detaljerna och noterar att bivillkoren innebär att vi ska optimera funktionen G(z) = F (0, 0, z), utan bivillkor. Vi beräknar dess differential som ovan: dg = df 1 F dg 1 2 F dg 2. För att bestämma de okända koefficienterna här tittar vi på relationen df = 1 F dg 1 + 2 F dg 2 i endast dx och dy, vilket vi kan lösa genom att använda kilprodukten: df dg 2 = 1 F dg 1 dg 2, df dg 1 = 2 F dg 2 dg 1. Exempel 15 För att förtydliga, titta åter på Exempel 13, men lös ut x istället för z (varför?): df = yzdx + xzdy + xydz, dg 1 = 2xdx + 2ydy + 2zdz, dg 2 = 2xdx + 2ydy 2zdz. Identiteten vi talar om är då och lösningen är 1 F = xzdy + xydz = 1 F (2ydy + 2zdz) + 2 F (2ydy 2zdz) (xzdy + xydz) (2ydy 2zdz) (2ydy + 2zdz) (2ydy 2zdz) = ( 2xz2 2xy 2 )dy dz 4yzdy dz = x(z2 + y 2 ). 4yz Vi kan nu skriva upp differentialen dg. För detta noterar vi att dg dg 1 dg 2 = df dg 1 dg 2 df dg 2 dg 1 df dg 1 dg 2 = df dg 1 dg 2.

Optimering av funktioner, med och utan bivillkor 16 (16) Formellt får vi då dg = df dg 1 dg 2 dg 1 dg 2. Bättre uttryckt är detta (om man vill vara formellt korrekt) en kvot av två determinanter. Vi avhåller oss från det och konstaterar endast att vad där står är att G:s stationära punkter är precis de där df dg 1 dg 2 = 0 (plus bivillkor), liksom tidigare. Intressant är dock att uttrycket också ger oss ett uttryck för G som kan användas för att avgöra typ av extrempunkt. Exempel 16 I vårt exempel får vi dg = 8(x2 y 2 )z 2 4yz dx = 4 z(x2 y 2 ) dx y I princip kan vi sedan undersöka typ av stationär punkt genom att titta på funktionen som är koefficient framför dx, beräkna dess differential, först uttryckt i dx, dy, dz, men vi eliminierar de sista två av dessa genom att använda bivillkoren. Noteringar 1. Det slutna höljet av en mängd är den minsta slutna mängd som omfattar den. 2. För att göra det noterar vi att den andra ekvationen kräver att antingen är x = 0 eller y = 0 och vi stoppar sedan dessa i den första för att få lösningen. 3. Om de är proportionella gäller självklart att df dg = 0. Omvänt, om df(v)dg(w) = df(w)dg(v) för alla v, w har vi att df = λdg där λ = df(w)/dg(w). 4. Skevsymmetrin innebär att (df dg)(u, v) = (df dg)(v, u), men högerledet kan här skrivas (dg df)(u, v), vilket förklarar formeln.