Optimering med bivillkor Vi ska nu titta på problemet att hitta max och min av en funktionen f(x, y), men inte över alla möjliga (x, y) utan bara för de par som uppfyller ett visst bivillkor g(x, y) = 0. Vi har mött denna problemtyp tidigare i samband med undersökningar av max och min på randen till ett kompakt område. Om vi kan parametrisera bivillkoret explicit så att g(x, y) = 0 x = x(t) och y = y(t), t I. för några deriverbara funktioner x(t), y(t) och något intervall I så reduceras problemet till ett vanligt envariabelproblem, nämligen att optimera f(x(t), y(t)), t I. Det kan emellertid vara svårt eller omöjligt att hitta en sådan parametrisering. Det kan i många fall dessutom vara mycket intrikat att avgöra om max och min verkligen antas.
Ex 1. Bestäm de stationära punkterna till funktionen f(x, y) = x + y under bivillkoret x 3 + 3x 2 y + 2y 3 1 = 0. Även om vi inte kan beräkna parametriseringen explicit så finns det kraftfulla satser som garanterar existensen av en sådan under allmänna villkor. Vi antar därför nu att vi kan skriva x = x(t), y = y(t) och formulerar villkoret att f(x(t), y(t)) har en stationär punkt på ett sätt som inte använder parametriseringen: 0 = d dt (f(x(t), y(t)) = f T, där T = (x (t), y (t)) är kurvans tangentvektor. Å andra sidan är också g(x(t), y(t)) = 0, eftersom f(x(t), y(t)) är en parametrisering av bivillkoret, vilket ger 0 = d dt (g(x(t), y(t)) = g T. Eftersom tydligen både f och g är ortogonala mot T så måste de själva vara parallella. Vi får alltså följande
SATS. Om (a, b) är en extrempunkt till f i det inre av D f under bivillkoret g(x, y) så gäller att f och g är parallella. Ex 1. (forts.) f = (1, 1) och g = (3x 2 + 6xy, 3x 2 + 6y 2 ). Villkoret att vektorerna är parallella kan bekvämt formuleras med hjälp av en determinant: 0 = 1 1 3x 2 + 6xy 3x 2 + 6y 2 = = 3x 2 + 6y 2 3x 2 6xy = 6y(y x), dvs y = 0 eller x = y. Insatt i bivillkoret ger den första möjligheten y = 0 0 = g(x, 0) = x 3 1 x = 1, dvs vi får den kritiska punkten (1, 0). Den första möjligheten ger i stället x = y 0 = g(x, x) = 6x 3 1 x = 1, dvs vi får den kritiska punkten ( 1 3 6, 1 3 6 ). Av figuren framgår att (1, 0) är en maxpunkt. Att avgöra karaktären hos en kritiskt punkt under bivillkor kan vara besvärligt, och vi ska inte gå in på detaljer här.
Metoden kan lätt generaliseras till flera variabler än två: det blir fortfarande sant att stationära punkter karakteriseras av att f och g är parallella. Däremot går det inte att formulera detta villkor med hjälp av en determinant för fler än två dimensioner. Det klassiska (och i tillämpningarna det vanligaste) sättet att formulera villkoret använder den så kallade Lagrangefunktionen F. I tre variabler är F (x, y, z, λ) = f(x, y, z) + λg(x, y, z). SATS. Antag att g(a) 0. a i R 3 är möjlig extrempunkt för f under bivillkoret g = 0 endast om (a, λ) R 4 är stationär för F (utan bivillkor) för något tal λ. Observera att villkoret g(a) 0 i den här formuleringen måste kontrolleras separat. I två variabler är det inkluderat i determinanten. Satsen kan utan vidare generaliseras till n variabler. Beviset följer omedelbart om vi tar gradienten av definitionen av Lagrangefunktionen: F =
f + λ g. Villkoret F = 0 är tydligen ekvivalent med att f + λ g = 0, vilket i fallet g 0 är ekvivalent med att f och g är parallella! Ex 2. Bestäm stationära punkter till f(x, y, z) = x + y + z under bivillkoret xy + yz + zx = 1. Vi får Lagrangefunktionen F (x, y, z, λ) = x + y + z + λ(xy + yz + zx 1). För att hitta stationära punkter beräknar vi F x = 1 + λ(y + z) = 0, F y = 1 + λ(x + z) = 0. F z = 1 + λ(x + y) = 0, F λ = xy + yz + zx 1 = 0. Vi observerar först λ måste vara skilt från 0 om de första ekvationerna ska kunna uppfyllas. Det följer då ur dessa att x+y = y +z = x+y. Det följer direkt att x = y = z vilket insatt i bivillkoret ger 3x 2 = 1, dvs vi får punkterna ( 1 3, 1 3, 1 ) och ( 1, 1, 1 ). 3 3 3 3 Möjliga stationära punkter är även punkter där g = (y+z, x+z, x+y) = 0. Men detta är bara
uppfyllt i punkten (0, 0, 0) som inte uppfyller bivillkoret. Det går även bra att generalisera teorin till fallet med flera bivillkor: SATS. Möjliga extrempunkter till f(x, y, z) under de båda bivillkoren g(x, y, z) = 0, h(x, y, z) = 0, karakteriseras av att vektorerna f(x, y, z), g(x, y, z), h(x, y, z) ska vara linjärt beroende. Just i fallet med tre variabler kan detta formuleras som att ( ) det f, g, h = 0. För fyra eller fler variabler fungerar inte detta, men vi kan fortfarande använda en Lagrangefunktion: F (x, λ, µ) = f(x) + λg(x) + µh(x), och bestämma stationära punkter till F (x, λ, µ). Ex 3. Bestäm den maximala och minimala volymen av ett rätblock med den totala sid-arean 10 och kant-längden 16.