Konvexa mängder och funktioner

Storlek: px
Starta visningen från sidan:

Download "Konvexa mängder och funktioner"

Transkript

1 Den 7 juli 99 Konvexa mängder och funktioner Christer Kiselman Innehåll:. Inledning 2. Konvexa höljet av en mängd 3. Separerande hyperplan 4. Stödjande halvrum och stödjande hyperplan 5. Extremalpunkter 6. Carathéodorys sats 7. Den utvidgade reella axeln 8. Konvexa funktioner 9. Fencheltransformationen 0. Dualitet. Stödfunktionen 2. Spelteori och lineär programmering Litteratur. Inledning Avsikten med dessa anteckningar är att komplettera Lars-Åke Lindahls och Christer Borells bok Linjär och konvex optimering vad gäller konvexa mängder och funktioner, speciellt beträffande separationssatser och begreppet extremalpunkt. Separationssatserna leder till ett studium av dualitet i konvexitetsteorin, som uttrycks med hjälp av Fencheltransformationen och stödfunktionen. 2. Konvexa höljet av en mängd Två punkter a och b i R n definierar ett segment [a, b] = {( t)a + tb; 0 t } R n. Detta är en delmängd av hela linjen {( t)a + tb; t R}. Om a = b så blir både segmentet och linjen bara en punkt förstås. En mängd A i R n kallas konvex om den innehåller hela segmentet [a, b] så fort den innehåller a och b. En mängd kallas för ett affint delrum om den med a och b innehåller hela linjen genom a och b. Vi kallar K R n för en kon om för det första 0 K, för det andra tx tillhör K så fort x K och t är ett positivt tal. En kon K blir då konvex precis när den innehåller varje punkt sa + tb för alla a, b K och alla s, t 0. Slutligen kallar vi A för ett lineärt delrum av R n om det är så att 0 A och A innehåller sa + tb för varje a, b A och varje s, t R. Vi kan alltså sammanfatta alla kraven under den gemensamma implikationen a, b A sa + tb A, men med olika villkor på s, t: för konvexa mängder s 0, t 0 och s + t = ; för affina delrum s, t R och s + t = ; för koner s 0, t = 0; för konvexa

2 koner s, t 0; för lineära rum s, t R. Dessutom har vi olika krav vad gäller den tomma mängden: tydligen är Ø den minsta konvexa mängden och det minsta affina delrummet; medan {0} är den minsta konen, den minsta konvexa konen och det minsta lineära delrummet. (Här finns det naturligtvis ett visst godtycke: vi skulle kunna kräva att en konvex mängd är icke-tom; vi skulle kunna acceptera Ø som ett lineärt delrum. Men det är önskvärt att fastlägga en viss konvention, och den vi gjort verkar att fungera bra.) Vi har nu implikationerna: konvex mängd affint delrum kon konvex kon lineärt delrum Snittet av en familj av konvexa mängder är konvext. Det är lätt att se. Vi definierar det konvexa höljet av en godtycklig mängd X som snittet av alla konvexa mängder som innehåller X. Det betecknas cvx X, alltså cvx X = (A; A konvex och A X). Det är då klart att cvx X är en konvex mängd, och dessutom den minsta konvexa mängd som innehåller X. På samma sätt kan vi definiera höljen i flera andra fall. Så fort vi har en familj F av mängder så kan vi ju sätta (2.) h(x) = (A; A F och A X). Vi kallar h(x) för F-höljet av X. Det visar sig då att denna operation h alltid har följande tre egenskaper:. X h(x) (h är större än identiteten); 2. X Y medför h(x) h(y ) (h är växande); 3. h(h(x)) = h(x) (h är idempotent). Vi kan definiera till exempel det affina höljet till X på detta sätt: det är det minsta affina delrum som innehåller X. På samma sätt kan vi definiera det slutna höljet: då tar vi F som mängden av alla slutna mängder; det handlar här om topologi och inte om geometri, men de tre egenskaperna hos höljesoperationen är desamma. En intressant geometrisk höljesoperation får man om man tar F som mängden av alla slutna halvrum (se avsnitt 3). Då blir höljet av en mängd snittet av alla slutna halvrum som innehåller den. Vi skall visa att detta snitt är det slutna konvexa höljet. Således kan två olika familjer F definiera samma operation. Beskrivningen av ett hölje som ett oändligt snitt ger enkelt vissa egenskaper hos operationen, men är inte särskilt geometrisk: vi önskar därför en mer användbar representation. Följande sats ger en sådan. Sats 2.. Låt X vara en delmängd av R n. De olika höljena vi infört kan beskrivas på följande sätt med hjälp av lineärkombinationer (2.2) N λ j x j j= 2

3 där λ j R och x j X:. Det konvexa höljet är lika med mängden av alla lineärkombinationer (2.2) där N är ett heltal, λ j 0 och λ j =. (Sådana lineärkombinationer kallas konvexa.) 2. Det affina höljet är motsvarande mängd men med kravet N, λ j R och λj =. (De kallas affina lineärkombinationer.) 3. Det koniska höljet (konen som spänns av X) fås om N 0, λ 0 och λ j = 0 då j Det koniskt konvexa höljet får man om N 0 och λ j Det lineära höljet av X är lika med mängden av alla lineärkombinationer (2.2) där N är ett heltal 0, λ j R. Bevis. Notera först skillnaden i kraven på N. Om vi alltid kräver att N skall vara minst, så blir h(ø) = Ø; så har vi gjort för de affina och konvexa höljena. Men om vi däremot tillåter N = 0 i summan av alla lineärkombinationer (2.2) så kommer h(ø) att bli {0}; detta gäller för de koniska, koniskt konvexa och lineära höljena. Anledningen är att 0 = Ø = 0 kan bildas om vi tillåter N = 0, men inte om vi kräver N och X är tom. Vi gör endast beviset för det konvexa höljet; de andra fallen är likadana (eller ännu enklare). Sätt A lika med mängden av alla konvexa lineärkombinationer av punkter i X. Tydligen omfattar A mängden X: tag N = och λ =. Vidare är A konvex, ty om vi har två punkter a och b i A så finns framställningar a = N λ j x j ; b = M µ j y j för några punkter x j och y j i X. För att visa att A är konvex skall vi visa att en punkt c = ( t)a + tb tillhör A. Detta följer av att vi kan skriva c = ( t)a + tb = N ( t)λ j x j + M tµ j y j = N+M ν j z j, där vi infört z j = x j och ν j = ( t)λ j för j =,..., N, medan z j = y j N och ν j = tµ j N för j = N +,..., N + M. Man kontrollerar att νj = ( t) λ j + t µ j = ( t) + t =. Det betyder att A är konvex, och därför att A cvx X. Omvänt skall vi visa att A cvx X. Det följer om vi kan visa att varje konvex mängd Y som omfattar X också omfattar A. Vi skall alltså visa att varje konvex lineärkombination λ j x j tillhör Y om x j X. För N = är det klart; för N = 2 är det definitionen på konvexitet. Antag nu att N 3 och att vi redan visat resultatet för N. Om N λ j 0 så kan vi skriva N λ j x j = N λ j x j + λ N x N = ( N 3 ) N λ k λ j N λ k x j + λ N x N

4 N = ( λ N ) µ j x j + λ N x N = ( λ N )y + λ N x N. Här är µ j = så y = N µ j x j Y enligt induktionsantagandet. Och så tillämpar vi resultatet för N = 2 och får att ( λ N )y + λ N x N Y. Om å andra sidan N λ j = 0 så är N λ jx j = x N Y. Detta avslutar beviset. I beviset ser det ut som om talet N växer obegränsat: om a kan representeras med N punkter, och b med M, så kan den mellanliggande punkten c representeras med N + M punkter. Men kanske är talet N + M onödigt stort, kanske kan man reducera på något sätt. En intressant fråga är därför om det går att begränsa antalet N. Frågan är viktig bland annat av det skälet att vi vill ha slutna konvexa mängder. Låt K vara en kompakt mängd och fixera ett tal N. Då är det klart att mängden { N K N = λ j x j ; λ j 0, } λ j = och x j K j= är kompakt. Den är nämligen bilden av någon kompakt mängd under en kontinuerlig avbildning. Och det konvexa höljet av K är ju som vi sett unionen av alla K N då N =, 2, 3,.... En uppräknelig union av kompakter är emellertid inte alltid kompakt. Det är då intressant att veta att följden (K N ) är stationär, dvs. att det finns ett tal m sådant att unionen är lika med K m. I själva verket kan man ta m = n +, där n är dimensionen i rummet. Låt oss emellertid redan nu notera att om X är en ändlig mängd så blir cvx X kompakt: då räcker det att ta N lika med antalet element i X. Detta visar första delen av följande sats. Sats 2.2. Det konvexa höljet av en ändlig mängd är kompakt. Det koniskt konvexa höljet av en ändlig mängd är slutet. Notera att det koniskt konvexa höljet av en kompakt mängd inte säkert är slutet (exempel: ett klot med origo på randen). Bevis. Det återstår att visa att det koniskt konvexa höljet av en ändlig mängd är slutet. Vi gör induktion över antalet element. Uppenbarligen är resultatet sant då N = 0. Antag nu att resultatet är sant för N element, och låt K vara en konvex kon som genereras av N element. Tag ett element till, säg a. Då gäller det att visa att mängden K a av alla element av formen x + λa, där x K och λ 0, är sluten. Antag därför att y j = x j + λ j a y. Vi skall då visa att y K a. Om nu följden av λ j är begränsad så finns det en konvergent delföljd, säg λ jk λ, och man får då att motsvarande delföljd av x j konvergerar, ty x jk = y jk λ jk a y λa = x, och x K eftersom x jk K och K är sluten enligt induktionsantagandet. Alltså gäller att y = x + λa K a. Men det kan inträffa att följden (λ j ) är obegränsad, och då skall vi visa att K a är sluten med ett helt annat resonemang. Antag alltså att följden (λ j ) är obegränsad. Då finns det en delföljd (λ jk ) som går mot plus oändligheten, och vi kan skriva K x j k λ jk = y j k λ jk a a, 4

5 vilket visar att a K. Det medför att K a = K + Ra, dvs. vektorsumman av konen K och den räta linjen Ra. Nu kan vi använda induktionsantagandet för att se att K + Ra är sluten. Låt π: R n R n vara en lineär avbildning med nollrum π (0) exakt lika med Ra. Då är K +Ra = π (π(k)). Vidare är π(k) genererad av N element, så den är sluten, och K +Ra = π (π(k)) är sluten som urbild av en sluten mängd under en kontinuerlig avbildning. Detta visar satsen. 3. Separerande hyperplan Ett hyperplan är ett affint delrum av codimension. Det betyder att det ges av en enda ekvation ξ x = b, där ξ inte är noll. I koordinatform blir det H = {x R n ; ξ x + + ξ n x n = b}, där inte alla koefficienterna ξ j är noll. Codimensionen är den komplementära dimensionen, dvs. den är lika med dim R n dim H = n (n ) =. Ett hyperplan delar alltid in rummet R n i två halvrum : D + = {x R n ; ξ x b} och D = {x R n ; ξ x b}. Deras snitt D + D är förstås lika med hyperplanet H. Vidare är ränderna D + = D = H. Det inre av D + (betecknat (D + ) ) definieras av den strikta olikheten ξ x > b. Om vi vill vara mer precisa kallar vi D + för ett slutet halvrum och dess inre (D + ) för ett öppet halvrum. Vi har (D + ) = (D ) = H och (D + ) (D ) = Ø. Ett hyperplan bestämmer inte sin ekvation entydigt. Om vi i stället använder ekvationen ( ξ) x = b så byter D + och D plats, ty tecknet definieras ju med hjälp av ξ. Så H bestämmer inte vilket av halvrummen som skall vara D +. Nedanstående definition innehåller en sådan teckenkomplikation, men denna skapar knappast några problem. Definition 3.. Låt två mängder X och Y vara givna i R n, och låt H beteckna ett hyperplan med ekvationen ξ x = b. Man säger att H separerar X och Y om det gäller att ξ x b ξ y för alla x X, y Y. Vi säger att H separerar X och Y strikt om det gäller att ξ x < b < ξ y för alla x X, y Y. Vi kan slutligen säga (med ett mer tillfälligt uttryckssätt) att H separerar X och Y mycket strikt om det finns två tal b och b 2 sådana att ξ x b < b < b 2 ξ y för alla x X, y Y. Separation betyder alltså att X och Y ligger i varsitt halvrum, varvid vi arbetar med slutna halvrum för vanlig icke-strikt separation, och med öppna halvrum för den strikta separationen. Om Y = {y} består av bara en punkt säger vi förstås att H separerar X och y om H separerar X och {y}. Detta specialfall är i själva verket ekvivalent med 5

6 det allmänna. Beteckna med H b hyperplanet som definieras av ξ x = b. Man ser lätt att H b separerar X och Y för något tal b om och endast om H 0 separerar X Y = {x y; x X & y Y } och origo. För den strikta separationen blir det en aning annorlunda: om H b separerar X och Y strikt, så får vi bara att H 0 separerar X Y och origo (icke-strikt). Och om H 0 separerar X Y och origo strikt så separerar H b mängderna X och Y mycket strikt för något b. Det verkar kanske litet irriterande, men skillnaden mellan mycket strikt och strikt försvinner ofta. Om den ena mängden är kompakt så är det helt enkelt ingen skillnad. Vi är intresserade av att hitta många hyperplan tillräckligt många för att visa att varje sluten konvex mängd är ett snitt av slutna halvrum (sats 3.7), och tillräckligt många för att visa att varje konvex kompakt är det konvexa höljet av sina extremalpunkter (avsnitt 5). I konvexitetsteorin finns det två viktiga separationssatser: Sats 3.2. Om F är en sluten konvex mängd i R n hyperplan som separerar F och y mycket strikt. och y / F, så finns det ett Sats 3.3. Om A är en konvex mängd i R n och y / A, så finns det ett hyperplan som separerar A och y. Detsamma gäller om y A. Av dessa två satser så följer genast separationssatser för två mängder: Sats 3.4. Om F och K är två disjunkta slutna konvexa mängder i R n och K dessutom är begränsad, så finns det ett hyperplan som separerar F och K mycket strikt. Sats 3.4 följer av sats 3.2 genom att vi kan separera F K och origo strikt. Här ser man nämligen att F K är en sluten konvex mängd som inte innehåller origo. Sats 3.5. Om X och Y är två disjunkta konvexa mängder i R n så finns det ett hyperplan som separerar X och Y. Sats 3.5 följer av sats 3.3 genom att man bildar A = X Y som är en konvex mängd som inte innehåller origo. Farkas lemma i den form som det har hos Borell & Lindahl s. 7 är ett specialfall av den första separationssatsen. Den slutna mängden F är där en konvex kon som genereras av en ändlig mängd. Explicit har vi: Sats 3.6. Låt A vara en ändlig mängd i R n och låt y R n. Då gäller att y inte tillhör det koniskt konvexa höljet av A om och endast om det finns en lineärform ξ sådan att ξ(a) 0 för varje a A och ξ(y) < 0. Bevis. Vi tillämpar sats 3.2 på det koniskt konvexa höljet F av A; vi vet tack vare sats 2.2 att F är slutet. Vi får ξ(y) < b < ξ(λa) för varje a A och varje λ > 0. Om vi låter λ gå mot noll så ser vi att b 0 och att alltså ξ(y) < 0; om vi låter λ gå mot + så ser vi att ξ(a) 0. Detta visar satsen. Den geometriska betydelsen av sats 3.6 är att det koniskt konvexa höljet F av en ändlig mängd A kan beskrivas med hjälp av halvrum. Låt nämligen D ξ = {x R n ; ξ(x) 0} vara det halvrum som definieras av en lineärform ξ 0. Då säger sats 3.6 att y / F om och endast om det finns ett ξ sådant att D ξ A och y / D ξ. Ekvivalent med 6

7 detta är att F är snittet av alla D ξ med D ξ A, dvs. att det koniskt konvexa höljet av en ändlig mängd är snittet av alla halvrum som innehåller mängden och har origo på randen; jämför sats 3.7 nedan. (Ett oberoende bevis av Farkas lemma som hos Borell & Lindahl ger direkt att det koniskt konvexa höljet är slutet; med uppläggningen här bör man först visa detta, vilket vi gjort i sats 2.2, för att sedan tillämpa sats 3.2. Vägen här blir därmed något längre; å andra sidan har vi redan från början fått en allmännare sats.) En annan form av Farkas lemma är denna: ekvationssystemet n a jk x k = b j, j =,..., m, k= har en lösning med x k 0 om och endast om u j b j 0 för alla vektorer (u,..., u m ) med u j a jk 0 för k =,..., n. I den ena riktningen är detta ju lätt att visa: om det finns en lösning x med den angivna egenskapen så blir uj b j = u j a jk x k = j k k ( u j a jk )x k 0 så fort u j a jk 0. För att bevisa den andra riktingen skall vi anta att det inte finns någon lösning x med den angivna egenskapen och tillämpa sats 3.6. Titta på konen F i R m som består av alla vektorer y = (y,..., y m ) med y j = a jk x k för något x R n med x j 0. Mängden F är alltså det koniskt konvexa höljet av punkterna a k = (a k,..., a mk ) R m, k =,..., n, och kan för övrigt också beskrivas som bilden i R m av den positiva konen i R n under den lineära avbildning som definieras av matrisen (a jk ). Antagandet att det inte finns en lösning x med angiven positivitetsegenskap betyder just att b inte ligger i konen F. Enligt sats 3.6 finns det då en lineärform ξ sådan att ξ(b) < 0 och ξ( a jk x k ) 0 för alla x k 0. Nu måste ξ ha formen ξ(y) = u j y j för något val av u j. Slutligen konstaterar vi att uj a jk x k 0 för alla x k 0 är ekvivalent med att u j a jk 0 för alla k. Detta avslutar beviset av påståendet. Vi kan omformulera denna variant av Farkas lemma som följer. Vi betraktar de två systemen j (S) n a jk x k = b j, j =,..., m, x k 0, k =,..., n. k= och (S ) m u j a jk 0, k =,..., n, j= m u j b j < 0. j= I matrisform kan vi skriva (S) { Ax = b x 0 7

8 och (S ) { A T u 0 b T u < 0. (Vi använder här övre index T för att beteckna transponering.) Det vi visat betyder då att systemet (S) är lösbart om och endast om (S ) är olösbart. Hos Borell & Lindahl finns en hel serie av liknande påståenden, med strukturen att ett visst system av likheter och olikheter är lösbart precis då ett annat system, kallat det duala, är olösbart. Systemet (S) består av m likheter och n icke-strikta olikheter och definierar en sluten polyeder P i R n, medan (S ) består av n icke-strikta olikheter och en enda strikt olikhet och definierar en polyeder P i R m. Och resultatet säger att precis en av polyedrarna är tom. En viktig konsekvens av separationssatserna är att vi nu fått en ny beskrivning av det slutna konvexa höljet även av en oändlig mängd: Sats 3.7. Om X är en godtycklig mängd i R n så är dess slutna konvexa hölje cvx X lika med snittet av alla slutna halvrum som innehåller X. (Speciellt är slutna konvexa mängder lika med detta snitt.) Bevis. Snittet av alla slutna halvrum är en sluten konvex mängd, så det måste innehålla F = cvx X. Omvänt, om x / F så finns enligt sats 3.2 ett slutet halvrum D som innehåller F men inte x. Därför blir snittet lika med F. Man kan säga att sats 3.7 beskriver det slutna konvexa höljet utifrån, medan sats 2. beskriver det konvexa höljet inifrån. Vi skall nu bevisa separationssatserna. Bevis för sats 3.2. Vi kan anta att x = 0 (translatera) och att F Ø. Studera funktionen ϕ(x) = x = x x på F och dess infimum d = inf(ϕ(x); x F ). Det är tydligt att 0 < d < + : den första olikheten för att F är sluten och inte innehåller origo; den andra för att F är icke-tom. Vi vet att en kontinuerlig funktion och ϕ är kontinuerlig antar sitt infimum på en sluten begränsad mängd. Nu är F inte säkert begränsad, men det är inte farligt i detta fall. Vi kan nämligen bilda K = {x F ; x 2d}, som är kompakt, och då antar ϕ sitt infimum på K. Men detta infimum måste vara detsamma som infimum på F : värdena i F \K kan inte tävla med dem i K. Låt alltså a vara en punkt i F sådan att ϕ(a) = d. (I själva verket är a unik, men det behövs inte nu.) Denna punkt definierar ett hyperplan H genom ekvationen a x = b = a a och ett slutet halvrum D genom olikheten a x a a. Med andra ord är H helt enkelt det plan som är ortogonalt mot siktlinjen [0, a] från origo mot den närmaste punkten i F och som går genom denna punkt. Vi påstår nu att b a x för alla x F. Det betyder att 0 = a 0 < c < b a x 8

9 för varje x F och varje tal c med 0 < c < b, så att varje hyperplan a x = c med ett sådant c är strikt separerande. Vi skall alltså bevisa att F ligger i halvrummet D. Tag en godtycklig punkt x F. Då vet vi att hela segmentet [a, x] ligger i F, eftersom F är konvex. En punkt ( t)a + tx på detta segment måste ha avståndet minst d till origo enligt definitionen av d. Det betyder att d 2 = a 2 = ϕ(a) 2 ϕ(( t)a + tx) 2 = (( t)a + tx) (( t)a + tx) = ( t) 2 a 2 + 2( t)ta x + t 2 x 2. Studera funktionen f(t) = ϕ(( t)a + tx) 2. Den måste ha icke-negativ derivata i origo, ty om f (0) < 0 så följer att f(t) < f(0) för små positiva t, vilket alltså inte är möjligt. Men nu kan vi lätt räkna ut dess derivata: f (t) = 2( t)( ) a 2 + 2( )ta x + 2( t)a x + 2t x 2. Sätt in t = 0: det ger 0 f (0) = 2 a 2 + 2a x. Alltså gäller a x a 2, vilket är precis vad vi önskade. Kanske blir det lättare om man gör ett motsägelsebevis: om man antar att det finns ett x F med a x < a 2 så blir f(t) < f(0) för små positiva t. Rita en figur! Bevis av sats 3.3. Vi kan förstås anta att y = 0. Välj en uppräknelig tät mängd {x j } i A, och låt A m vara det konvexa höljet av den ändliga mängden {x,..., x m }. Eftersom A m är sluten (sats 2.2) och inte innehåller origo, så kan vi tillämpa sats 3.2 och får ett separerande hyperplan med ekvationen ξ m x = c m som separerar A m och origo (strikt). Motsvarande plan genom origo, med ekvationen ξ m x = 0, är då separerande i alla fall. Vad händer nu när m +? Om vi väljer ξ m som den närmaste punkten i A m så kan ju mycket väl ξ m gå mot noll och det är inte bra. Låt oss därför normalisera så att ξ m =. Då ligger alltså ξ m på enhetsfären S, som är en välkänd kompakt mängd, och vi vet att någon delföljd av (ξ m ) konvergerar. Låt ξ vara ett gränsvärde. Vi kan nu hoppas att hyperplanet H = {x; ξ x = 0} kommer att separera A från origo, dvs. att A ligger på ena sidan. Vi kan välja tecknen så att A m ligger i halvrummet D m = {x; ξ m x 0}, och skall då visa att ξ x 0 för alla x A. Antag att detta är fel, alltså att det finns x A så att ξ x < 0. Då finns punkter x k godtyckligt nära x och likaså ξ m godtyckligt nära ξ. Därför gäller också ξ m x k < 0 för lämpliga index m och k, och även för några sådana med m k, vilket motsäger konstruktionen att x k ligger i halvrummet D m då m k. Om nu y A så finns det punkter y k som inte ligger i A och så att y k y. Om vi tar halvrum D k som separerar y k från A så kan vi som i resonemanget nyss hitta en delföljd av sådana halvrum som konvergerar mot ett halvrum D som innehåller A och har y på randen. 4. Stödjande halvrum och stödjande hyperplan 9

10 Definition 4.. Låt A vara en konvex mängd i R n. Ett slutet halvrum D säges vara stödjande till A om A ingår i D och det finns en gemensam randpunkt i A och D. Ett hyperplan H säges vara stödjande till A om ett av de två slutna halvrummen som definieras av H är stödjande till A. Ett stödjande hyperplan karaktäriseras alltså av att mängden A ligger på ena sidan av H och att H innehåller någon randpunkt till A. Om vi tar ett hyperplan H som har A på ena sidan, säg att ξ a b för alla a A, och H inte är stödjande, så kan det hända att något hyperplan ξ x = b + ε är stödjande (konstanten b var helt enkelt för liten). Men det kan också hända att inget av halvrummen ξ x b + ε med ε > 0 innehåller A. Då finns det helt enkelt inget stödjande hyperplan med normal ξ. Ett exempel på detta är A lika med mängden av alla x R 2 med x > 0 och x x 2. Då är linjen x 2 = 0 ett hyperplan som inte är stödjande, men det finns inte heller något parallellt hyperplan som är stödjande. Ett slutet halvrum som innehåller en given konvex mängd behöver alltså inte gå att parallellförflytta så att det blir stödjande. Det blir därmed intressant att fråga om man i sats 3.7 kan nöja sig med att ta stödjande halvrum. Att svaret är jakande trots det nyss framlagda exemplet följer av det arbete vi redan lagt ned för att visa sats 3.2. Vi formulerar satsen så: Sats 4.2. Låt F vara en sluten konvex mängd. Då är F lika med snittet av alla stödjande halvrum till F. Bevis. Det är klart att snittet av alla stödjande halvrum innehåller F. Låt nu y / F. Enligt sats 3.2 finns det ett hyperplan som separerar F och y strikt. Ett sådant hyperplan behöver som vi sett inte vara stödjande, och kanske går det inte heller att parallellförskjuta det så att det blir stödjande. Men om vi tittar på beviset av sats 3.2 så ser vi att vi gjort någonting bättre. Den punkt a i F som vi hittade och som är den närmaste punkten i F sett från y definierar ett hyperplan som går genom a och har F på ena sidan, och som alltså är stödjande till F. Beviset för sats 4.2 är alltså redan gjort i beviset för sats Extremalpunkter Extremalpunkterna är konvexitetsteorins primtal. Vi påminner om att primtalen å ena sidan är tillräckligt många för att varje heltal skall vara en produkt av primtal, å andra sidan kan de inte själva sönderläggas som en produkt av heltal annat än på ett trivialt sätt (p = p = p = ( p) ( ) = ( ) ( p)). I konvexitetsteorin motsvaras produkten av de konvexa lineärkombinationerna, så att alla punkter på segmentet [a, b] framställs med hjälp av a och b, nämligen som x = ( t)a + tb. En framställning betraktas som trivial om x = a eller x = b. Detta inträffar om t = 0 eller t =, men också om a = b. Det som motsvarar ett primtal är alltså en punkt som inte kan framställas på ett icke-trivialt sätt. Denna analogi leder oss till följande definition: Definition 5.. Låt en konvex mängd X vara given. Då kallas en punkt x för extremalpunkt till X om x X och x inte kan framställas på ett icke-trivialt sätt med hjälp av punkter i X, dvs. om ekvationen x = ( t)a+tb kan gälla med a, b X och 0 t endast då x = a eller x = b. Vi skall skriva E(X) för mängden av alla extremalpunkter i X. 0

11 Vi ser genast att öppna konvexa mängder saknar extremalpunkter om dimensionen är positiv. Men även slutna halvrum i dimensioner högre än saknar extremalpunkter. Det är därför naturligt att endast studera slutna begränsade mängder. Och då visar det sig att extremalpunkterna är tillräckligt många för att kunna framställa hela mängden. Att varje heltal är en produkt av primtal motsvaras alltså av följande sats. Sats 5.2. Låt K vara en konvex kompakt. Då är konvexa höljet av E(K) lika med K. Bevis. Eftersom E(K) K och K är konvex så är det klart att cvx E(K) K. Vi gör nu induktion över dimensionen för att visa att cvx E(K) K. För n = 0 eller n = är det klart att satsen är sann. Om x är en godtycklig punkt i K så drar vi en rät linje genom x och träffar på två punkter x 0 och x som ligger på randen av K. (De kan sammanfalla; det gör inget.) Eftersom x [x 0, x ] så räcker det att visa att x 0, x cvx E(K). Genom x 0 går ett separerande hyperplan H enligt sats 3.3. Och induktionsantagandet säger att H K är en konvex kompakt som är det konvexa höljet av sina extremalpunkter, ty den ligger ju i H som har lägre dimension. Problemet är alltså att identifiera extremalpunkterna i H K. Jag påstår att E(H K) H E(K). (I själva verket gäller likhet, men vi behöver inte detta här.) Låt oss ta en punkt y som är extremal i H K. Vi skall visa att den då är extremal också i K. Om y ligger på ett segment [a, b] K så följer att a och b måste ligga på samma sida om H. De kan därför bara framställa punkten y på ett icke-trivialt sätt om de båda ligger i H. Men eftersom y är extremal i H K så finns ingen sådan icke-trivial framställning. Det innebär att y är extremal i K. Nu vet vi att E(H K) H E(K), och att x 0 ligger i det konvexa höljet av E(H K). Alltså ligger x 0 i det konvexa höljet av E(K). Detsamma gäller för x, och alltså också för varje punkt på segmentet [x 0, x ] som ju innehåller den godtyckligt givna punkten x K. 6. Carathéodorys sats Vi skall nu återvända till den fråga som lämnades öppen i diskussionen före sats 2.2, nämligen hur många punkter i X vi behöver för att bilda det konvexa höljet av X. Svaret är att antalet N beror på dimensionen hos rummet, och att det i R n alltid räcker med n + punkter. Resultatet är alltså denna sats: Sats 6.. (Carathéodorys sats.) Om X är en mängd i R n så har varje punkt a i det konvexa höljet av X en framställning där x j X, 0 λ j och λ j =. n+ a = λ j x j j= Bevis. Vi gör induktion över dimensionen, och skall utnyttja existensen av separerande hyperplan. Påståendet är säkert sant i R 0 = {0} (och lätt att visa också i R ). Antag att det är sant i R n. Om a är en godtycklig punkt i cvx X så vet vi enligt sats 2. att det finns en framställning a = N λ j x j

12 av önskad form utom att talet N kanske är för stort. Låt Y vara den ändliga mängden {x,..., x N }. Tydligen gäller att a cvx Y = K. Tag en punkt y Y. Om y = a är vi färdiga; om inte så drar vi ut en linje från y genom a och ut mot oändligheten. Eftersom K är kompakt (sats 2.2) måste denna linje innehålla någon punkt z K på andra sidan om a, så att a [y, z]. Eftersom z är en randpunkt i K så finns enligt sats 3.3 ett hyperplan H genom z med mängden K på ena sidan. Nu är H cvx Y = cvx(h Y ), ty om en punkt kan framställas som en konvex lineärkombination av punkter i Y, alltså på ena sidan om H, så måste alla de punkter som faktiskt används ligga i H. Det innebär att z cvx(h Y ), och som H Y är en mängd i rummet H av dimension n, finns enligt induktionsantagandet en framställning av z som konvex lineärkombination av n punkter i Y, säg y,..., y n. Slutligen ligger genom konstruktionen a på segmentet [y, z], så de n + punkterna y,..., y n och y räcker för att framställa a. Sats 6.2. Om K är kompakt i R n så är även cvx K kompakt. Bevis. Vi noterade redan före sats 2.2 att mängden { N K N = λ j x j ; λ j 0, } λ j = och x j K j= är kompakt eftersom den är bilden av en kompakt mängd under en kontinuerlig avbildning. Nu vet vi att cvx K = K n+. 7. Den utvidgade reella axeln När man sysslar med reellvärda funktioner gör man ofta operationer som leder utanför de reella talen, t. ex. supremumbildningar. Därför leds man till att betrakta också + och som tillåtna värden. Om man bara har en av oändligheterna så brukar detta inte vara så svårt, men om bägge förekommer så får man finna sig i att summan (+ )+( ) inte är väldefinierad, och detta leder till att man måste göra undantag i vissa utsagor, undantag som är svåra att komma ihåg. Det har därför ett visst intresse att skapa konventioner som gör det bekvämt att handskas med undantagen. En sådan konvention är införandet av den övre och undre additionen. Den utvidgade reella axeln betecknas [, + ] och består av alla reella tal och två nya element och +. Den ordnas genom förskriften att < x < + för alla x R. Därför blir supremum och infimum väldefinierade operationer, och vi har bl. a. sup f(x) =, x Ø inf f(x) = + x Ø för alla funktioner f: X [, + ], således även om till exempel f är identiskt +. Man kallar [, + ] för en tvåpunktskompaktifiering av R eftersom den är kompakt (varje punktföljd har en hopningspunkt) och uppstår genom tillägg av två punkter. (Det finns också en enpunktskompaktifiering av R, nämligen R { }, som uppstår genom tillägg av en enda ny punkt,. Den kan inte ordnas; man kan säga att den uppkommer ur [, + ] genom hopslagning av + och.) Den övre additionen definieras som den utvidgning av den vanliga additionen där + alltid vinner över, dvs. i fall av tvekan skall man välja +. Det innebär 2

13 att a + b = lim sup x + y [, + ], (a, b) [, + ]. (x,y) R 2 (x,y) (a,b) På motsvarande sätt definierar vi den undre additionen medelst limes inferior och får förstås a b = (( a) + ( b)). Slutligen skriver vi a + b för a + b om + a + b = a + b. Vi finner då att ingenting ändrats för de reella talen, att (+ ) + (+ ) = + och att ( ) + ( ) =. Vidare är (+ ) + ( ) = + medan (+ ) ( ) =. De två sista formlerna är alltså de enda där plustecken med + prick måste förekomma. Några regler för att hantera + och är dessa: vi har a b om och endast om + a ( b) 0, att a < b om och endast om a + ( b) < 0. Vidare gäller + (7.) inf x X (a + f(x)) = a + och (7.2) sup x X(a + f(x)) = a + inf f(x) x X sup f(x) x X utan undantag. (Beviset av dessa formler består av en kontroll i fallen a = +, a =, X = Ø.) För infimum i kombination med den undre additionen och supremum i kombination med den övre additionen är reglerna inte alls lika enkla, och för övrigt nästan omöjliga att komma ihåg. 8. Konvexa funktioner Definitionen av en konvex mängd är ju mycket enkel: om a, b A så ligger hela segmentet [a, b] i A. Vi skall definiera begreppet konvex funktion så att det blir lika enkelt. Därför vill vi till en funktion associera en mängd som är konvex precis när funktionen är konvex. Definition 8.. Om f: X [, + ] är en given funktion på en godtycklig mängd X så är dess epigraf mängden epi f = {(x, t) X R; t f(x)}. Definition 8.2. Om f: X [, + ] är en given funktion definierad i en mängd X i R n så kallar vi den konvex precis när dess epigraf är en konvex mängd (i R n+ ). Om vi utvidgar f till en funktion definierad på hela R n genom att sätta g(x) = f(x) då x X och g(x) = + då x R n \ X så ser vi att f och g är konvexa samtidigt: de har samma epigraf. Därför kan vi alltid anta att konvexa funktioner är definierade i hela rummet. Man ser att konstanterna + och är konvexa, ty deras epigrafer är Ø respektive hela R n+. Vidare ser man att max(f,..., f m ) är konvex om f,..., f m är konvexa: det svarar mot att den förstnämnda funktionens epigraf är snittet av det konvexa mängderna epi f j. För att till exempel visa att summan av konvexa funktioner är konvex är det emellertid bra att ha en olikhet att testa, den som säger att grafen hänger under kordan. 3

14 Proposition 8.3. En funktion f: R n [, + ] är konvex om och endast om (8.) f(( t)x 0 + tx ) ( t)f(x 0 ) + tf(x ) för alla x 0, x R n och alla tal t med 0 < t <. Om ett av värdena f(x 0 ) och f(x ) är + så innebär olikheten inget krav alls. Men om t. ex. f(x 0 ) = och f(x ) < + så säger olikheten att f(( t)x 0 +tx ) = för alla t med 0 < t <. Olikheten (8.) innebär naturligtvis i allmänhet starka restriktioner på funktionsvärdena. Men i vissa situationer är friheten mycket stor. Låt till exempel g vara en helt godtycklig funktion på enhetssfären. Då kan vi utvidga den till en konvex funktion f genom att sätta f(x) = g(x) då x =, f(x) = + då x > och f(x) = (eller lika med konstanten inf g) då x <. På sfären finns alltså inga som helst villkor som funktionsvärdena måste uppfylla. Speciellt behöver konvexa funktioner inte vara kontinuerliga. Om vi däremot tar en kub, så måste restriktionen av en konvex funktion vara konvex i varje sidoyta till kuben. Proposition 8.4. Om f, g: R n [, + ] är två konvexa funktioner så är även f + g konvex. Däremot behöver inte f + g vara konvex även om f och g är det. Definition 8.5. Om f, g: R n [, + ] är två konvexa funktioner så definierar vi deras infimalfaltning som f g(x) = inf y R n ( f(y) + g(x y) ), x R n. Den vanliga faltningen definieras av f g(x) = f(y)g(x y)dy, x R n. R n Infimalfaltningen har flera egenskaper som är desamma som eller analoga med den vanliga faltningens. I båda fallen är summan av argumenten för f och g lika med argumentet för faltningen. Ofta kan man jämföra e f e g med exp( (f g)): (exp( f) exp( g))(x) = exp( f(y) g(x y))dy R n sup y Approximationen sup är ibland förvånande god. exp( f(y) g(x y)) = (exp( (f g))(x). Proposition 8.6. Infimalfaltningen är kommutativ och associativ. Bevis. Kommutativiteten följer av att + är kommutativ. För associativiteten behövs räkneregeln (7.): ( (f g) h(x) = inf inf [f(z) + g(y z)] + h(x y) ) y z = inf inf ( ) f(z) + g(y z) + h(x y) y z ( = inf f(z) + inf [g(y z) + h(x y)] ) = f (g h)(x). z y 4

15 Infimalfaltningen är en generalisering av vektoradditionen (Minkowskiadditionen) av mängder. Vi har nämligen i X i Y = i X+Y där i X betecknar indikatorfunktionen för en mängd X; den definieras av att i X (x) = 0 om x X och i X (x) = + annars. Ett annat samband med vektoradditionen och som kan användas för att definiera infimalfaltningen fås om vi definierar den strikta epigrafen som epi s f = {(x, t) X R; t > f(x)}, alltså med strikt olikhet. Då gäller helt enkelt epi s (f g) = epi s (f) + epi s (g) med vektoraddition i R n+. Denna ekvation leder till en geometrisk tolkning av infimalfaltningen. Rita figurer! Exempel. Funktionen i {0} är identitet under infimalfaltningen: f i {0} = f för alla funktioner f. Exempel. Om g är en affin funktion så gäller f g = g + C för en konstant C = C f,g [, + ] (vilken?). Exempel. Sätt g k (x) = k x, x R n, där k är en positiv konstant, och studera infimalfaltningen f k = f g k. Vi antar för enkelhets skull att f är begränsad. Man kan lätt visa att f k är Lipschitzkontinuerlig med konstant k, dvs. att f k (x) f k (y) k x y, x, y R n, genom att använda att g k har denna egenskap. Det gör att den goda kontinuitetsegenskapen ärvs av faltningen f g k trots att f inte behöver ha den. Vidare gäller att f k f och att f k f då k + om f är kontinuerlig (i själva verket behöver f bara vara nedåt halvkontinuerlig; för definitionen av detta begrepp se sats 9.6). Vi får alltså en bekväm metod att approximera sådana funktioner med Lipschitzkontinuerliga. Exempel. Med en fysikaliskt inspirerat språk kan vi låta en partikel med läge λ j och spridning σ j representeras av funktionen f j (x) = 2σ j (x λ j ) 2, x R n. Då ger till exempel en direkt uträkning att f f 2 = f 3 där λ 3 = λ + λ 2 och σ 3 = σ + σ 2, dvs. läge och spridning adderas. Fallet σ = 0 svarar mot f = i {λ }, dvs. en skarp partikel. Detta bör jämföras med den vanliga faltningen av funktionerna g j = (2πσ j ) n/2 e f j som också kan få representera partiklar. Då gäller nämligen att g g 2 = g 3 med samma relationer för läge och spridning som förut. Den jämförelse mellan och som vi gjorde tidigare blir nu helt precis: den approximativa likheten exp( f ) exp( f 2 ) exp( (f f 2 )) = exp( f 3 ) blir den exakta likheten g g 2 = g 3 tack vare faktorerna (2πσ j ) n/2. Fallet σ = 0 svarar här mot Diracmåttet δ λ i punkten λ, återigen en skarp partikel. Faltningen g g 2 kan beräknas med Fouriertransformationen, liksom faltningen f f 2 kan beräknas med Fencheltransformationen som vi skall införa i nästa avsnitt. 5

16 Proposition 8.7. En funktion f: R n [, + ] är konvex om och endast om f s f t f s+t för alla s, t > 0, där f s (x) = sf(x/s) för x R n och s > 0. Vi kan notera att olikheten f s f t f s+t alltid gäller. De konvexa funktionerna är alltså de som löser funktionalekvationen f s f t = f s+t. Bevis. Om f är konvex så gäller f s (y) + f t (x y) = sf(y/s) + tf((x y)/t) (s + t)f ( y s + t + x y ) = fs+t (x). s + t Om vi nu låter y variera så följer att f s f t f s+t. Omvänt, antag att denna olikhet gäller. Då följer med beteckningen x t = ( t)x 0 + tx att f(x t ) = f (x t ) f t f t (x t ) f t (y) + f t (x t y) för alla y. Nu kan vi välja y = ( t)x 0 : f(x t ) f t (( t)x 0 ) + f t (x t ( t)x 0 ) = ( t)f(x 0 ) + tf(x ), vilket betyder att f är konvex. Sats 8.8. Om f och g är konvexa så är även h = f g det. Bevis. Man ser att (f g) s = f s g s. Alltså kan vi räkna på: h s h t = (f g) s (f g) t = (f s g s ) (f t g t ) = (f s f t ) (g s g t ) f s+t g s+t = (f g) s+t = h s+t. Här har vi använt associativitet och kommutativitet hos infimalfaltningen (proposition 8.6). Vi ser att satsen följer av karaktäriseringen i proposition Fencheltransformationen Alla affina funktioner x ξ x+c är konvexa. De är de enklaste konvexa funktionerna och det är naturligt att fråga sig om andra konvexa funktioner kan framställas med hjälp av dem. Ändliga suprema av affina funktioner har ju stor betydelse i lineär programmering en polyeder är en subnivåmängd till en sådan funktion och i konvex optimering blir det lika viktigt att studera icke nödvändigtvis ändliga suprema av affina funktioner. Vi frågar alltså om vi kan hitta en familj A av affina funktioner, dvs. av par (ξ, c), sådan att f(x) = sup (ξ x + c) (ξ,c) A för denna familj. Tydligen är då ξ x + c f(x) för alla x R n och alla (ξ, c) A, dvs. c f(x) ξ x, varav c inf x Rn(f(x) ξ x), (ξ, c) A. Man har inget intresse att ta c mindre än detta infimum, ty sådana c konkurrerar ju inte effektivt i supremumbildningen. Vi kan alltså inskränka oss till att ta c lika med infimum. Detta innebär som vi strax skall se att de enda intressanta affina minoranterna till f är de som har formen f ξ för någon lineär funktion ξ. Av vissa skäl som blir uppenbara om ett ögonblick är det praktiskt att i stället betrakta c. Alltså inför vi följande definition. 6

17 Definition 9.. Om f: R n [, + ] är en godtycklig funktion på R n så kallas (9.) f(ξ) = sup x R n ( ξ x f(x) ), ξ R n, för Fencheltransformen av f. Ett annat namn för f är Legendretransformen eller den till f konjugerade konvexa funktionen. Funktionen x f ξ(x) = ξ x f(ξ) är affin, minorerar f och är den största affina minorant till f vars lineära del är ξ. (Här betecknar ξ både en vektor och den lineära funktionen x ξ x.) Den geometriska tolkningen av transformen är denna. Fixera ξ och betrakta alla affina funktioner x ξ x + c som minorerar f. Tag den största, dvs. tryck upp grafen så långt det går utan att komma ovanför någon punkt i grafen av f. Då är f(ξ) = c, dvs. transformens värde är minus ordinatan i origo för hyperplanet. Rita figurer! Vi noterar att i (9.) spelar punkter där f(x) = + ingen roll: de kan aldrig bidra till supremum. Man definierar den effektiva definitionsmängden till f som (9.2) dom f = {x R n ; f(x) < + }, och ser att ( ) (9.3) f(ξ) = sup ξ x f(x) x M för varje mängd M sådan att dom f M R n. Med c = f(ξ) blir supremum av alla affina minoranter till f precis (9.4) sup ξ R n ( ξ x f(ξ) ) = sup ξ R n (f ξ)(x), x R n. Nu kan vi göra en intressant observation: supremumbildningen är precis Fencheltransformen av f. Alltså kan vi skriva vänsterledet i (9.4) som ( f ) = f. Frågan huruvida f är ett supremum av affina funktioner är alltså ekvivalent med frågan huruvida f = f. Vi skall snart besvara den, men låt oss först notera några enkla egenskaper hos transformationen. Proposition 9.2. Om f, g: R n [, + ] är två funktioner på R n med f g så är f och g konvexa och f g. Vidare är f supremum av alla affina minoranter till f: f(x) = sup ξ R n (f ξ)(x), x R n ; speciellt är f konvex och f f. Slutligen är den tredje transformen ( f ) = f alltid lika med f. 7

18 Notera att f aldrig antar värdet utom då f = identiskt; då är f = + identiskt. Olikheten f f följer av att (9.5) ξ x f(x) + f(ξ), x R n, ξ R n, som brukar kallas Fenchels olikhet. Vi skall genom några exempel visa hur man kan beräkna Fencheltransformer. Exempel. Om f(x) = ax 2 + bx + c för x R med a > 0 och b och c reella, så kan vi beräkna f med differentialkalkyl. Vi har nämligen f(ξ) = sup[ξx ax 2 bx c], ξ R, x R och det är klart att uttrycket som vi skall ta supremum av är en kontinuerlig funktion av x som går mot då x ±, vilket gör att supremum antas i någon punkt, och denna punkt kan hittas genom att vi sätter derivatan lika med noll. Derivatan är ξ 2ax b, och har ett enda nollställe, nämligen x = (ξ b)/2a. Nu sätter vi in detta värde på x i uttrycket och får f(ξ) = ξx ax 2 bx c = ξ ξ b 2a = ξ2 4a bξ 2a + b2 (ξ b)2 c = 4a 4a a(ξ b)2 4a 2 c. b ξ b 2a c Så f är också ett andragradspolynom. Vi kan från dess uttryck gissa några egenskaper hos transformationen som också är lätta att verifiera allmänt. Om g(x) = f(x) + c så är g(ξ) = f(ξ) c, dvs. om vi adderar en reell konstant till f så går den igenom och kommer ut med motsatt tecken. Detta är naturligtvis sant i alla dimensioner. Om g(x) = f(x)+α x så är g(ξ) = f(ξ α), dvs. om vi adderar en lineär funktion till f så kommer transformen att translateras med en vektor vars komponenter är precis den lineära funktionens koefficienter. Detta visas genom en lätt räkning: g(ξ) = sup[ξ x g(x)] = sup[ξ x f(x) α x] x x = sup[(ξ α) x f(x)] = f(ξ α). x Om å andra sidan g(x) = f(x a), så blir g(ξ) = f(ξ) + ξ a, dvs. om vi translaterar en funktion så motsvarar det addition av en lineär funktion till dess transform. Om vi multiplicerar en funktion med en positiv konstant, dvs. om g(x) = af(x) med a > 0, så blir transformen g(ξ) = a f(ξ/a). Detta visas också med en enkel räkning: g(ξ) = sup[ξ x af(x)] = a sup[(ξ/a) x f(x)] = a f(ξ/a). x x 8

19 Genom att använda dessa räkneregler (addition av konstant, addition av lineär funktion och multiplikation med positiv konstant) så ser vi att om vi känner transformen av f(x) = x 2 /2, x R, (den är f(ξ) = ξ 2 /2, alltså samma funktion), så kan vi sluta att f(x) = ax 2 + bx + c har transformen f(x) = (ξ b) 2 /4a c. Exempel. Om vi låter för en positiv konstant p, så blir f(x) = x +p + p, x R, f(ξ) = ξ +/p + /p, ξ R. Också detta kan lätt beräknas med differentialkalkyl då ξ 0, och för ξ = 0 är det självklart. Man kan visa att samma formel gäller även i R n. Exempel. Differentialkalkylen är inte alltid till hjälp. Om f(x) = x, x R, så blir f(ξ) = 0 då x och f(ξ) = + då x >. Detta inses genom att man tittar på uttrycket ξx x, och konstaterar att det är obegränsat uppåt då ξ >, medan det är begränsat uppåt då ξ, med supremum lika med 0. Alltså är f = i [,], indikatorfunktionen för intervallet [, ]. Om vi tar f som indikatorfunktionen för ett intervall [a, b], så ser vi att f(ξ) blir aξ för ξ 0 och bξ för ξ 0. Om intervallet är just [, ] så blir f(ξ) = ξ. Exempel. Om f(x) = x + x 2 /2, x R, så får vi använda en kombination av resonemanget i det sista exemplet och differentialkalkyl. Om nämligen ξ så ser man precis som i förra exemplet att f(ξ) = 0. Men om ξ > så kan vi söka maximum av uttrycket ξx x x 2 /2 med differentialkalkyl. Derivatan är för x > 0 lika med ξ x och har ett unikt nollställe x = ξ > 0 om vi antar att ξ >. Detta ger värdet ξx x x 2 /2 = 2 (ξ )2. Av symmetriskäl blir f( ξ) = f(ξ), så vi behöver inte titta speciellt på ξ < utan kan sammanfatta resultatet av undersökningen i formeln f(ξ) = 2( ) ( ξ ) + 2, ξ R. Både f och f är skarvade andragradspolynom, men skarvningen går till på olika sätt. Exempel. Om f(x) = x 3 så blir f(ξ) = + för alla ξ. Här finns inga affina minoranter. Exempel. Om f(x) = e x, x R, så kan vi räkna ut f med differentialkalkyl för ξ > 0 medan vi kan resonera mera direkt då ξ 0. Vi finner att ξ log ξ ξ, ξ > 0; f(ξ) = 0, ξ = 0; +, ξ < 0. Stirlings formel visar alltså att f(ξ) log(ξ!) då ξ 0: exp f(ξ) e ξx = sup = ξ ξ e ξ (2πξ) /2 ξ!, ξ > 0. x R e ex 9

20 Liknande approximativa likheter vi få genom att approximera supremum med en integral: exp f(ξ) e ξx + = sup e ξx ex dx = t ξ e t dt = (ξ )!, ξ > 0, x R e ex eller R + exp f(ξ) = sup t ξ e t t ξ e t dt = ξ!, ξ > 0. t>0 0 Inversionsformeln (se nedan sats 0.) ger att f = f och därmed e ex = exp f(x) = exp f(x) = sup exp(ξx f(ξ)) = sup ξ R ξ 0 0 e ξx ξ ξ e ξ k=0 e kx k! = e ex. Det enda som är förvånande här är att approximationen faktiskt är en exakt likhet. Finns det någon förklaring? Exempel. Sätt f(x) = 2 x2 + 3 x3 2 för x R 2, x 2 0; f(x) = + för x 2 < 0. Då är f(ξ) = 2 ξ ξ3/2 2 då ξ 2 0, och f(ξ) = 2 ξ2 då ξ 2 < 0. För ξ 2 > 0 kan vi finna detta med differentialkalkyl, ty gradienten av uttrycket ξ x 2 x2 3 x3 2 är ξ (x, x 2 2) som har ett enda nollställe x = (ξ, ξ 2 ) då ξ 2 > 0, x 2 > 0. Detta värde ger insatt i uttrycket ξ x 2 x2 3 x3 2 = ξ 2 +ξ 2 ξ2 2 ξ2 3 ξ3/2 2 = 2 ξ ξ3/2 2. Om däremot ξ 2 0 så ser vi att uttryckets supremum antas då x 2 = 0, och det handlar då om den redan välkända Fencheltransformen av 2 x2. Exempel. Om f(x) = 2 xj a jk x k där A = (a jk ) är en reell symmetrisk och positivt definit matris och x = (x,..., x n ) T en kolonnvektor, således med matrismultiplikation så blir f(x) = 2 xt Ax, x R n, f(ξ) = 2 ξa ξ T, ξ = (ξ,..., ξ n ). (Då n = får vi speciellt f(x) = 2 ax2, f(ξ) = 2 ξ2 /a.) Om A bara är positivt semidefinit så får man i stället { 2 f(ξ) = ξbξt då ξ tillhör radrummet till A + annars, där B är en symmetrisk kvasiinvers till A, dvs. ABA = A. Detta kan också formuleras så här: { f(x) då ξ = x f(ξ) T A för något x R n, = + om ξ inte är av formen x T A. Beviset är denna räkning: f(ξ) = f(x T A) = sup(x T Ay ( 2 yt Ay) = sup 2 xt Ax 2 (x y)t A(x y) ) = sup y y ( f(x) f(x y) ) = f(x) inf y y f(x y) = f(x) där den sista olikheten följer av att f(x y) 0 och antar värdet 0 då y = x. Vi ser alltså att problemet att beräkna f är ekvivalent med problemet att beräkna inversen till en symmetrisk matris i detta fall. 20

21 Proposition 9.3. För alla funktioner f, g: R n [, + ] gäller (f g) = f + g. Bevis. En lätt räkning tack vare räkneregeln (7.2). Notera att vi har undre addition i proposition 9.3. Vi vet att f + g är konvex. Det visar sig nu att f + g = f + g utom då f + g är konstant. Propositionerna 9.2 och 9.3 ger tillsammans en kedja av olikheter: (9.6) (f + g) ( f + g ) = ( f g ) f g. (Tillämpa proposition 9.3 på f och g.) I spelteorin vill man gärna ha likhet hela vägen här, dvs. man vill ha regeln (9.7) (f + g) = f g som är dual till proposition 9.3. Den gäller inte alltid, men vi kan notera följande resultat: Corollarium 9.4. Om f = f och g = g så gäller (f + g) = ( f g). Det kan mycket väl vara strikt olikhet på den sista platsen i (9.6) även under antagandena i detta corollarium: Exempel. Definiera två funktioner f, g: R 2 [, + ] genom föreskrifterna { 0 x = 0 f(x) = + annars; { 0 x = g(x) = + annars. Då blir f(ξ) = 0 då ξ 2 = 0 och + annars, medan g(ξ) = ξ då ξ 2 = 0 och + annars. Detta gör att f + g = + identiskt, medan f g(ξ) antar värdet då ξ 2 = 0. Därför blir (f + g) = ( f g) = identiskt, medan f g(ξ) = + då ξ 2 0. Det betyder att (9.7) inte gäller. Exempel. Andra exempel kan man konstruera med hjälp av indikatorfunktionen så här: låt f = i X och g = i Y (då är X och Y automatiskt slutna och konvexa). Då är f g = i X+Y och man kan visa (se sats 0. nedan) att ( f g) = i X+Y, indikatorfunktionen för det slutna höljet av X + Y. Nu kan vi ta X och Y slutna och konvexa men sådana att deras vektorsumma inte är sluten. Ett standardexempel på detta är X = {x R 2 ; x 2 > 0, x x 2 }, Y = {x R 2 ; x 2 = 0}, 2

22 X + Y = {x R 2 ; x 2 > 0}, X + Y = {x R 2 ; x 2 0}. Då blir f g ( f g ). Exempel. Om så blir f j (x) = 2σ j (x λ j ) 2, x R n, f j (ξ) = σ j 2 ξ2 + λ j ξ, ξ R n, och f + f 2 = f 3, där λ 3 = λ + λ 2, σ 3 = σ + σ 2. Alltså gäller (f f 2 ) = f + f 2 = f 3 varav följer att (f f 2 ) = ( f + f 2 ) = f 3. Vi har redan sett att f f 2 = f 3 i ett tidigare exempel. Man kan även visa direkt att f f 2 är kontinuerlig, vilket tillsammans med konvexiteten ger att f f 2 = (f f 2 ) = f 3 (sats 0. nedan). Jämför med Fourier- eller Laplacetransformen av g j = (2πσ j ) n/2 e f j. Detta illustrerar analogin mellan å ena sidan infimalfaltningen och Fencheltransformationen, å andra sidan faltningen och Fourier- eller Laplacetransformationen. Vi kan frigöra oss från den speciella formen hos f. Låt f j (x) = σ j f((x λ j )/σ j ) representera en partikel med läge λ j och spridning σ j, men där f nu är en allmän funktion. Då får man att f j (ξ) = σ j f(ξ) + λj ξ, så att vi återigen får f + f 2 = f 3 med samma relationer mellan läge och spridning som förut, förutsatt endast att f antar något annat värde än 0 och ± (så att σ j och λ j är bestämda av f j ). Om f är reellvärd och konvex så gäller att f f 2 = f 3 (jämför proposition 8.7). Vi konstaterade efter proposition 8.3 att en konvex funktion inte behöver ha någon som helst kontinuitetsegenskap. Emellertid var exemplet sådant att f antog värdet + i närheten av diskontinuitetspunkterna. Detta var ingen slump: vi skall se att konvexa funktioner är kontinuerliga i det inre av dom f (se (9.2)). Sats 9.5. Låt f: R n [, + ] vara konvex och låt Ω = (dom f) vara det inre av den mängd där f(x) < +. Då är f antingen konstant lika med i Ω eller en kontinuerlig reellvärd funktion i Ω. Bevis. Man konstaterar först att om f inte är konstant i Ω så måste f vara reellvärd där (se diskussionen efter proposition 8.3). Vi skall göra ett induktionsbevis. Satsen är säkert sann om dimensionen är lika med noll. Vi antar att vi visat den för n och skall använda olikheten (8.) på två sätt för att gå upp ett steg i dimension. Vi skriver variablerna som x = (x, x n ) där x R n (då n = skall vi helt bortse från x ). Antag att 0 Ω. Vi har för något tillräckligt litet positivt ε att f(0, ε) < + och f(x) ( λ)f(y, 0) + λf(0, ε) om y väljes så att x blir en konvex lineärkombination av (y, 0) och (0, ε): x = ( λ)(y, 0) + λ(0, ε). 22

Mer om kontinuitet. Kapitel K. K.1 Övre och undre gräns

Mer om kontinuitet. Kapitel K. K.1 Övre och undre gräns Kapitel K Mer om kontinuitet I detta kapitel bevisar vi Sats 3.1, som säger att en kontinuerlig funktion av typen R 2 R på ett kompakt område antar ett största och ett minsta värde. Vi studerar dessutom

Läs mer

1 Konvexa optimeringsproblem grundläggande egenskaper

1 Konvexa optimeringsproblem grundläggande egenskaper Krister Svanberg, april 2012 1 Konvexa optimeringsproblem grundläggande egenskaper Ett optimeringsproblem är i viss mening godartat om det tillåtna området är en konvex mängd och den målfunktion som ska

Läs mer

Mer om reella tal och kontinuitet

Mer om reella tal och kontinuitet Kapitel R Mer om reella tal och kontinuitet I detta kapitel formulerar vi ett av de reella talens grundläggande axiom, axiomet om övre gräns, och studerar några konsekvenser av detta. Med dess hjälp kommer

Läs mer

Om konvergens av serier

Om konvergens av serier Om konvergens av serier Anders Källén MatematikCentrum LTH anderskallen@gmail.com Sammanfattning I den här artikeln diskuteras några av de grundläggande satserna som hjälper oss att avgöra om en serie

Läs mer

MER TOPOLOGI OCH KONVERGENS

MER TOPOLOGI OCH KONVERGENS MER TOPOLOGI OCH KONVERGENS SVANTE JANSON 1. Kompakta mängder Definition. En delmängd av R n kallas kompakt om den är sluten och begränsad. Sats 1. Om K är en kompakt mängd i R n och {x i } är en följd

Läs mer

avbildning En avbildning är i matematiskt språk i regel detsamma som en funktion.

avbildning En avbildning är i matematiskt språk i regel detsamma som en funktion. Ordlista 1 1 Analysens grunder avbildning En avbildning är i matematiskt språk i regel detsamma som en funktion. Bolzano-Weierstrassegenskapen En delmängd M i ett metriskt rum har Bolzano- Weierstrass-egenskapen

Läs mer

Kontinuerliga funktioner. Ytterligare en ekvivalent formulering av supremumaxiomet

Kontinuerliga funktioner. Ytterligare en ekvivalent formulering av supremumaxiomet Kontinuerliga funktioner. Ytterligare en ekvivalent formulering av supremumaxiomet är följande: SATS. (Intervallinkapslingssatsen) Låt I k = [a k, b k ], k = 1, 2,... vara en avtagande följd av slutna

Läs mer

1 Analysens grunder. Ordlista för Funktionalanalys 1. avbildning (map) En avbildning är i matematiskt språk i regel detsamma som en funktion.

1 Analysens grunder. Ordlista för Funktionalanalys 1. avbildning (map) En avbildning är i matematiskt språk i regel detsamma som en funktion. Ordlista för Funktionalanalys 1 (28 augusti 2002) 1 Analysens grunder avbildning (map) En avbildning är i matematiskt språk i regel detsamma som en funktion. Bolzano-Weierstrassegenskapen En delmängd M

Läs mer

Kontinuitet och gränsvärden

Kontinuitet och gränsvärden Kapitel Kontinuitet och gränsvärden.1 Introduktion till kontinuerliga funktioner Kapitlet börjar med allmänna definitioner. Därefter utvidgar vi successivt familjen av kontinuerliga funktioner, genom specifika

Läs mer

Matematiska strukturer - Satser

Matematiska strukturer - Satser Matematiska strukturer - Satser April 2, 2018 I detta dokument har jag samlat och översatt de flesta satser som ingår i kursen Matematiksa Strukturer (FMAN65) från kursboken Set Theory and Metric Spaces

Läs mer

Doktorandkurs i flera komplexa variabler, vt 2010

Doktorandkurs i flera komplexa variabler, vt 2010 Doktorandkurs i flera komplexa variabler, vt 2010 Frank Wikström 10 februari 2010 Frank Wikström () Doktorandkurs i flera komplexa variabler, vt 2010 10 februari 2010 1 / 20 Dagens program Plurisubharmoniska

Läs mer

Optimalitetsvillkor. Optimum? Matematisk notation. Optimum? Definition. Definition

Optimalitetsvillkor. Optimum? Matematisk notation. Optimum? Definition. Definition Optimum? När man har formulerat sin optimeringsmodell vill man lösa den Dvs finna en optimal lösning, x, till modellen Nästan alltid: Sökmetoder: Stå i en punkt, gå till en annan (bättre Upprepa, tills

Läs mer

x f (x) dx 1/8. Kan likhet gälla i sistnämnda relation. (Torgny Lindvall.) f är en kontinuerlig funktion på 1 x sådan att lim a

x f (x) dx 1/8. Kan likhet gälla i sistnämnda relation. (Torgny Lindvall.) f är en kontinuerlig funktion på 1 x sådan att lim a Elementa Årgång 50, 967 Årgång 50, 967 Första häftet 2603. Låt ξ, ξ 2,..., ξ n vara stokastiska variabler med väntevärden E[ξ i ], i =, 2,..., n. Visa att E[max(ξ, ξ 2,..., ξ n )] max(e[ξ ], E[ξ 2 ],...,

Läs mer

Doktorandkurs i flera komplexa variabler, vt 2010

Doktorandkurs i flera komplexa variabler, vt 2010 Doktorandkurs i flera komplexa variabler, vt 2010 Frank Wikström 17 februari 2010 Frank Wikström () Doktorandkurs i flera komplexa variabler, vt 2010 17 februari 2010 1 / 26 Dagens program Konvexa och

Läs mer

1 Att läsa matematik.

1 Att läsa matematik. 1 Att läsa matematik. Precis som vid all annan läsning som betyder något skall matematik läsas aktivt. Detta innebär olika saker för olika personer. För en del kanske det betyder att visualisera de idéer

Läs mer

Hela tal LCB 1999/2000

Hela tal LCB 1999/2000 Hela tal LCB 1999/2000 Ersätter Grimaldi 4.3 4.5 1 Delbarhet Alla förekommande tal i fortsättningen är heltal. DEFINITION 1. Man säger att b delar a om det finns ett heltal n så att a Man skriver b a när

Läs mer

7 Extremvärden med bivillkor, obegränsade områden

7 Extremvärden med bivillkor, obegränsade områden Nr 7, 1 mars -5, Amelia 7 Extremvärden med bivillkor, obegränsade områden Största och minsta värden handlar om en funktions värdemängd. Värdemängden ligger givetvis mellan det största och minsta värdet,

Läs mer

1 Ickelinjär optimering under bivillkor

1 Ickelinjär optimering under bivillkor Krister Svanberg, maj 2012 1 Ickelinjär optimering under bivillkor Hittills har vi behandlat optimeringsproblem där alla variabler x j kunnat röra sig fritt, oberoende av varann, och anta hur stora eller

Läs mer

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning Matematik, KTH Bengt Ek november 207 Material till kursen SF679, Diskret matematik: Lite om kedjebråk 0 Inledning Talet π (kvoten mellan en cirkels omkrets och dess diameter) är inte ett rationellt tal

Läs mer

Vektorgeometri för gymnasister

Vektorgeometri för gymnasister Vektorgeometri för gymnasister Per-Anders Svensson http://homepage.lnu.se/staff/psvmsi/vektorgeometri/gymnasiet.html Fakulteten för teknik Linnéuniversitetet Linjära avbildningar I Innehåll En liten tillbakablick:

Läs mer

Mängder och kardinalitet

Mängder och kardinalitet UPPSALA UNIVERSITET Matematiska institutionen Erik Melin Specialkursen HT07 28 september 2007 Mängder och kardinalitet Dessa blad utgör skissartade föreläsningsanteckningar kombinerat med övningar. Framställningen

Läs mer

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna Uppsala Universitet Matematiska Institutionen Bo Styf LAoG I, 5 hp ES, KandMa, MatemA -9-6 Sammanfattning av föreläsningarna 3-7 Föreläsningarna 3 7, 8/ 5/ : Det viktigaste är här att du lär dig att reducera

Läs mer

MULTIPLIKATION AV MATRISER, BASER I RUMMET SAMT FÖRSTA MÖTET MED MATRISINVERSER = = =

MULTIPLIKATION AV MATRISER, BASER I RUMMET SAMT FÖRSTA MÖTET MED MATRISINVERSER = = = Matematiska institutionen Stockholms universitet CG Matematik med didaktisk inriktning 2 Problem i Algebra, geometri och kombinatorik Snedsteg 5 MULTIPLIKATION AV MATRISER, BASER I RUMMET SAMT FÖRSTA MÖTET

Läs mer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson Uppsala Universitet Matematiska Institutionen Thomas Erlandsson MATRISER MED MERA VEKTORRUM DEFINITION Ett vektorrum V är en mängd av symboler u som vi kan addera samt multiplicera med reella tal c så

Läs mer

Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 9 juni 2011 kl

Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 9 juni 2011 kl 1 Matematiska Institutionen KTH Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 9 juni 2011 kl 08.00-1.00. OBS: Inga hjälpmedel är tillåtna på tentamensskrivningen. Bonuspoäng

Läs mer

1 Att läsa matematik.

1 Att läsa matematik. 1 Att läsa matematik. Precis som vid all annan läsning som betyder något skall matematik läsas aktivt. Detta innebär olika saker för olika personer. För en del kanske det betyder att visualisera de idéer

Läs mer

Rita även upp grafen till Fourierseriens summa på intervallet [ 2π, 3π], samt ange summans värde i punkterna π, 0, π, 2π. (5) S(t) = c n e int,

Rita även upp grafen till Fourierseriens summa på intervallet [ 2π, 3π], samt ange summans värde i punkterna π, 0, π, 2π. (5) S(t) = c n e int, Institutionen för matematik KTH Tentamensskrivning, 003-08-5, kl. 14.00 19.00. 5B10/ Diff och Trans del, för F och T. Hjälpmedel: BETA, Mathematics Handbook. För godkänt betyg 3) krävs 18 poäng, medan

Läs mer

Bisektionsalgoritmen. Kapitel Kvadratroten ur 2

Bisektionsalgoritmen. Kapitel Kvadratroten ur 2 Kapitel 4 Bisektionsalgoritmen Vi ska konstruera lösningar till algebraiska ekvationer av formen f(x) = 0 med hjälp av bisektionsalgoritmen (intervallhalveringsmetoden). På samma gång ska vi se hur man

Läs mer

Definitionsmängd, urbild, domän

Definitionsmängd, urbild, domän 5B1493, lekt 5, HT06 Funktioner Definition av begreppet Definition: Låt X och Y vara två mängder. En funktion f av typ X Y är detsamma som en delmängd av X Y, sådan att 1. Om (x, y) och (x, z) f, så är

Läs mer

Vektorgeometri för gymnasister

Vektorgeometri för gymnasister Vektorgeometri för gymnasister Per-Anders Svensson http://homepage.lnu.se/staff/psvmsi/vektorgeometri/gymnasiet.html Fakulteten för teknik Linnéuniversitetet Linjära avbildningar IV Innehåll Nollrum och

Läs mer

Kompletteringsmaterial. K2 Något om modeller, kompakthetssatsen

Kompletteringsmaterial. K2 Något om modeller, kompakthetssatsen KTH Matematik Bengt Ek Maj 2008 Kompletteringsmaterial till kursen SF1642, Logik för D1 och IT3: K2 Något om modeller, kompakthetssatsen Vi skall presentera ett enkelt (om man känner till sundhets- och

Läs mer

1 Linjära ekvationssystem. 2 Vektorer

1 Linjära ekvationssystem. 2 Vektorer För. 1 1 Linjära ekvationssystem Gaußelimination - sriv om systemet för att få ett trappformat system genom att: byta ordningen mellan ekvationer eller obekanta; multiplicera en ekvation med en konstant

Läs mer

K2 Något om modeller, kompakthetssatsen

K2 Något om modeller, kompakthetssatsen KTH Matematik Bengt Ek Maj 2005 Kompletteringsmaterial till kursen 5B1928 Logik för D1: K2 Något om modeller, kompakthetssatsen Vi skall presentera ett enkelt (om man känner till sundhets- och fullständighetssatsen

Läs mer

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604 för D, den 5 juni 2010 kl

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604 för D, den 5 juni 2010 kl 1 Matematiska Institutionen KTH Lösning till tentamensskrivning på kursen Linjär algebra II, SF164 för D, den 5 juni 21 kl 9.- 14.. Examinator: Olof Heden. Hjälpmedel: Inga hjälpmedel är tillåtna på tentamensskrivningen.

Läs mer

Om existens och entydighet av lösningar till ordinära differentialekvationer

Om existens och entydighet av lösningar till ordinära differentialekvationer Om existens och entydighet av lösningar till ordinära differentialekvationer Anders Källén 11 maj 2016 1 Introduktion I det här kapitlet ska vi diskutera vad vi allmänt kan säga om lösningar till ett system

Läs mer

10.4. Linjära höljet LINJÄRA RUM

10.4. Linjära höljet LINJÄRA RUM 98 LINJÄRA RUM.4. Linjära höljet Definition.37. Mängden av alla linjärkombinationer av M = {v, v,...,v n } iett linjärt rum V kallas för linjära höljet av M betecknas [M], dvs [M] ={u V : u = λ v + λ v

Läs mer

Vectorer, spannet av vektorer, lösningsmängd av ett ekvationssystem.

Vectorer, spannet av vektorer, lösningsmängd av ett ekvationssystem. Vectorer, spannet av vektorer, lösningsmängd av ett ekvationssystem. Begrepp som diskuteras i det kapitlet. Vektorer, addition och multiplikation med skalärer. Geometrisk tolkning. Linjär kombination av

Läs mer

1 Kvadratisk optimering under linjära likhetsbivillkor

1 Kvadratisk optimering under linjära likhetsbivillkor Krister Svanberg, april 0 Kvadratisk optimering under linjära likhetsbivillkor I detta kapitel behandlas följande kvadratiska optimeringsproblem under linjära likhetsbivillkor: xt Hx + c T x + c 0 då Ax

Läs mer

Optimering med bivillkor

Optimering med bivillkor Optimering med bivillkor Vi ska nu titta på problemet att hitta max och min av en funktionen f(x, y), men inte över alla möjliga (x, y) utan bara för de par som uppfyller ett visst bivillkor g(x, y) =

Läs mer

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 1 1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta

Läs mer

Algebraiska egenskaper hos R n i)u + v = v + U

Algebraiska egenskaper hos R n i)u + v = v + U Underrum till R n, nollrum, kolonnrum av en matris, rank, bas, koordinater, dimension. Påminnelse om R n s egenskaper: Algebraiska egenskaper hos R n i)u + v = v + U v) c(u + v) = cu + cv ii) ( u + v)

Läs mer

Sidor i boken f(x) = a x 2 +b x+c

Sidor i boken f(x) = a x 2 +b x+c Sidor i boken 18-151 Andragradsfunktioner Här ska vi studera andragradsfunktionen som skrivs f(x) = ax +bx+c där a, b, c är konstanter (reella tal) och där a 0. Grafen (kurvan) till f(x), y = ax + bx +

Läs mer

Dagens program. Linjära ekvationssystem och matriser

Dagens program. Linjära ekvationssystem och matriser Dagens program Matriser Räkneoperationer och räknelagar Linjära ekvationssystem och matriser Matrisform av ekvationssystem Elementära radoperationer Trappstegsmatriser, rang och lösningsstruktur Matrisinvers,

Läs mer

Om ortonormerade baser i oändligtdimensionella rum

Om ortonormerade baser i oändligtdimensionella rum Analys 360 En webbaserad analyskurs Funktionsutvecklingar Om ortonormerade baser i oändligtdimensionella rum Anders Källén MatematikCentrum LTH anderskallen@gmail.com Om ortonormerade baser i oändligtdimensionella

Läs mer

8. Euklidiska rum 94 8 EUKLIDISKA RUM

8. Euklidiska rum 94 8 EUKLIDISKA RUM 94 8 EUKLIDISKA RUM 8. Euklidiska rum Definition 8.. En skalärprodukt på vektorrummet V är en funktion som till varje par av element u och v i V ordnar ett reellt tal u v eller u v med följande egenskaper:.

Läs mer

Om kontinuerliga funktioner

Om kontinuerliga funktioner Analys 360 En webbaserad analyskurs Analysens Grunder Om kontinuerliga funktioner Anders Källén MatematikCentrum LTH anderskallen@gmail.com Om kontinuerliga funktioner 1 (12) 1 Introduktion Vi ska nu diskutera

Läs mer

Grundidén är att våra intuitiva rationella tal (bråk) alltid kan fås som lösningar till ekvationer av typen α ξ = β, där α och β är tal Z och α 0.

Grundidén är att våra intuitiva rationella tal (bråk) alltid kan fås som lösningar till ekvationer av typen α ξ = β, där α och β är tal Z och α 0. 5B2710, lekt 4, HT07 Konstruktion av de rationella talen Q (AEE 2.3) Grundidén är att våra intuitiva rationella tal (bråk) alltid kan fås som lösningar till ekvationer av typen α ξ = β, där α och β är

Läs mer

Vektorgeometri för gymnasister

Vektorgeometri för gymnasister Vektorgeometri för gymnasister Per-Anders Svensson http://homepage.lnu.se/staff/psvmsi/vektorgeometri/gymnasiet.html Fakulteten för teknik Linnéuniversitetet Areor, vektorprodukter, volymer och determinanter

Läs mer

.I Minkowskis gitterpunktssats

.I Minkowskis gitterpunktssats 1.I Minkowskis gitterpunktssats Minkowskis sats klarar av en mängd problem inom den algebraiska talteorin och teorin för diofantiska ekvationer. en kan ses som en kontinuerlig, eller geometrisk, variant,

Läs mer

Vektorgeometri för gymnasister

Vektorgeometri för gymnasister Vektorgeometri för gymnasister Per-Anders Svensson http://w3.msi.vxu.se/users/pa/vektorgeometri/gymnasiet.html Institutionen för datavetenskap, fysik och matematik Linnéuniversitetet Vektorer i planet

Läs mer

DERIVATA. = lim. x n 2 h h n. 2

DERIVATA. = lim. x n 2 h h n. 2 DERIVATA Läs avsnitten 6.-6.5. Lös övningarna 6.cd, 6.2, 6.3bdf, 6.4abc, 6.5bcd, 6.6bcd, 6.7, 6.9 oc 6.. Läsanvisningar Allmänt gäller som vanligt att bevisen inte ingår i kursen, men det är mycket nyttigt

Läs mer

Anteckningar för kursen "Analys i en Variabel"

Anteckningar för kursen Analys i en Variabel Anteckningar för kursen "Analys i en Variabel" Simone Calogero Vecka 4 Viktig information. Dessa anteckningar är inte avsedda som en ersättning för kurs litteratur men bara som en kort sammanfattning av

Läs mer

Om plana och planära grafer

Om plana och planära grafer KTH Matematik Bengt Ek April 2006 Material till kursen 5B1118 Diskret matematik för CL3: Om plana och planära grafer I många sammanhang (t.ex. vid konstruktion av elektriska kretsar) är det intressant

Läs mer

Faltning av följder och funktioner

Faltning av följder och funktioner Den 28 augusti 2001 Faltning av följder och funktioner Christer O. Kiselman Innehåll: 1. Inledning 2. Faltning av följder 2.1. Beteckningar för följder 2.2. Faltningsprodukten av två följder 2.3. Faltningsekvationer

Läs mer

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A SF165 Envariabelanalys Lösningsförslag till tentamen 15-4-7 DEL A 1. Låt f(x) = arcsin x + 1 x. A. Bestäm definitionsmängden till funktionen f. B. Bestäm funktionens största och minsta värde. (Om du har

Läs mer

Övningar. c) Om någon vektor i R n kan skrivas som linjär kombination av v 1,..., v m på precis ett sätt så. m = n.

Övningar. c) Om någon vektor i R n kan skrivas som linjär kombination av v 1,..., v m på precis ett sätt så. m = n. Övningar Linjära rum 1 Låt v 1,, v m vara vektorer i R n Ge bevis eller motexempel till följande påståenden Satser ur boken får användas a) Om varje vektor i R n kan skrivas som linjär kombination av v

Läs mer

Armin Halilovic: EXTRA ÖVNINGAR

Armin Halilovic: EXTRA ÖVNINGAR ABSOLUTBELOPP Några exempel som du har gjort i gymnasieskolan: a) = b) 0 =0 c) 5 = 5 Alltså x 0 et av ett tal x är lika med själva talet x om talet är positivt eller lika med 0 et av x är lika med det

Läs mer

TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer

TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer Johan Thim 0 januari 207 Introduktion En differentialekvation (DE) i en variabel är en ekvation som innehåller både

Läs mer

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A. 1. En svängningsrörelse beskrivs av

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A. 1. En svängningsrörelse beskrivs av SF166 Flervariabelanalys Lösningsförslag till tentamen 13-3-1 DEL A 1. En svängningsrörelse beskrivs av ( πx ) u(x, t) = A cos λ πft där amplituden A, våglängden λ och frekvensen f är givna konstanter.

Läs mer

1 De fyra fundamentala underrummen till en matris

1 De fyra fundamentala underrummen till en matris Krister Svanberg, mars 2012 1 De fyra fundamentala underrummen till en matris 1.1 Definition av underrum En given delmängd M av IR n säges vara ett underrum i IR n om följande gäller: För varje v 1 M,

Läs mer

Repetitionsfrågor i Flervariabelanalys, Ht 2009

Repetitionsfrågor i Flervariabelanalys, Ht 2009 Repetitionsfrågor i Flervariabelanalys, Ht 2009 Serier 1. Visa att för en positiv serie är summan oberoende av summationsordningen. 2. Visa att för en absolutkonvergent serie är summan oberoende av summationsordningen.

Läs mer

Dagens ämnen. Linjära ekvationssystem: Successiv elimination Vektorer Definitionen Grundläggande räkneoperationer Bas och koordinater Ortsvektorer

Dagens ämnen. Linjära ekvationssystem: Successiv elimination Vektorer Definitionen Grundläggande räkneoperationer Bas och koordinater Ortsvektorer Dagens ämnen Linjära ekvationssystem: Successiv elimination Vektorer Definitionen Grundläggande räkneoperationer Bas och koordinater Ortsvektorer Linjära ekvationer Med en linjär ekvation i n variabler,

Läs mer

Isometrier och ortogonala matriser

Isometrier och ortogonala matriser Isometrier och ortogonala matriser (Delvis resultat som kunde kommit tidigare i kursen) För att slippa parenteser, betecknas linära avbildningar med A och bilden av x under en lin avbildn med Ax i stället

Läs mer

1 Positivt definita och positivt semidefinita matriser

1 Positivt definita och positivt semidefinita matriser Krister Svanberg, april 1 1 Positivt definita och positivt semidefinita matriser Inom ickelinjär optimering, speciellt kvadratisk optimering, är det viktigt att på ett effektivt sätt kunna avgöra huruvida

Läs mer

Gamla tentemensuppgifter

Gamla tentemensuppgifter Inte heller idag någon ny teori! Gamla tentemensuppgifter 1 Bestäm det andragradspolynom vars kurva skär x-axeln i x = 3 och x = 1 och y-axeln i y = 3 f(x) = (x 3)(x + 1) = x x 3 är en bra start, men vi

Läs mer

MVE035. Sammanfattning LV 1. Blom, Max. Engström, Anne. Cvetkovic Destouni, Sofia. Kåreklint, Jakob. Hee, Lilian.

MVE035. Sammanfattning LV 1. Blom, Max. Engström, Anne. Cvetkovic Destouni, Sofia. Kåreklint, Jakob. Hee, Lilian. MVE035 Sammanfattning LV 1 Blom, Max Engström, Anne Cvetkovic Destouni, Sofia Kåreklint, Jakob Hee, Lilian Hansson, Johannes 11 mars 2017 1 Partiella derivator Nedan presenteras en definition av partiell

Läs mer

SF1624 Algebra och geometri Tentamen med lösningsförslag onsdag, 11 januari 2017

SF1624 Algebra och geometri Tentamen med lösningsförslag onsdag, 11 januari 2017 SF64 Algebra och geometri Tentamen med lösningsförslag onsdag, januari 7. (a) För vilka värden på k har ekvationssystemet (med avseende på x, y och z) kx + ky + z 3 x + ky + z 4x + 3y + 3z 8 en entydig

Läs mer

Några viktiga satser om deriverbara funktioner.

Några viktiga satser om deriverbara funktioner. Några viktiga satser om deriverbara funktioner Rolles sats Differentialkalkylens medelvärdessats (=) 3 Cauchys medelvärdessats Sats Om funktionen f är deriverbar i en punkt x 0 så är f kontinuerlig i samma

Läs mer

Stora bilden av Linjära algebran. Vektorrum, linjära transformationer, matriser (sammanfattning av begrepp)

Stora bilden av Linjära algebran. Vektorrum, linjära transformationer, matriser (sammanfattning av begrepp) Stora bilden av Linjära algebran. Vektorrum, linjära transformationer, matriser (sammanfattning av begrepp) Linjär algebra består av tre grenar eller koncept: geometriska begreppet av vektorrum, analysbegreppet

Läs mer

TMV166/186 Linjär Algebra M/TD 2011/2012 Läsvecka 1. Omfattning. Innehåll 2012-01-20. Lay, kapitel 1.1-1.9, Linjära ekvationer i linjär algebra

TMV166/186 Linjär Algebra M/TD 2011/2012 Läsvecka 1. Omfattning. Innehåll 2012-01-20. Lay, kapitel 1.1-1.9, Linjära ekvationer i linjär algebra TMV166/186 Linjär Algebra M/TD 2011/2012 Läsvecka 1 Omfattning Lay, kapitel 1.1-1.9, Linjära ekvationer i linjär algebra Innehåll Olika aspekter av linjära ekvationssystem 1. skärning mellan geometriska

Läs mer

SKRIVNING I VEKTORGEOMETRI

SKRIVNING I VEKTORGEOMETRI SKRIVNING I VEKTORGEOMETRI 201-0-0 14.00-17.00 Om inget annat uttryckligen sägs, kan koordinaterna för en vektor i antas vara givna i en ON-bas. Baser i rummet kan dessutom antas vara positivt orienterade.

Läs mer

1. (a) (1p) Undersök om de tre vektorerna nedan är linjärt oberoende i vektorrummet

1. (a) (1p) Undersök om de tre vektorerna nedan är linjärt oberoende i vektorrummet 1 Matematiska Institutionen, KTH Lösningar till tentamensskrivning på kursen Linjär algebra, SF1604, för CDA- TE, CTFYS och vissa CL, fredagen den 13 mars 015 kl 08.00-13.00. Examinator: Olof Heden. OBS:

Läs mer

Lösningar till tentamen i Transformmetoder okt 2007

Lösningar till tentamen i Transformmetoder okt 2007 Lösningar till tentamen i Transformmetoder okt 7. Låt Y (s beteckna Laplacetransformen till funktionen y. Laplacetransformering av den givna ekvationen ger: varav följer att. (a För s > a är Y (s + s Y

Läs mer

Sammanfattning av ordinära differentialekvationer

Sammanfattning av ordinära differentialekvationer Sammanfattning av ordinära differentialekvationer Joakim Edsjö 1 Institutionen för teoretisk fysik, Uppsala Universitet Telefon: 018-18 32 50 eller 018-18 76 30 19 februari 1995 1 Första ordningens differentialekvationer

Läs mer

Institutionen för Matematik. SF1625 Envariabelanalys. Lars Filipsson. Modul 1

Institutionen för Matematik. SF1625 Envariabelanalys. Lars Filipsson. Modul 1 Institutionen för Matematik SF1625 Envariabelanalys Läsåret 2017-2018 Lars Filipsson Modul 1 1. MÅL FÖR MODUL 1 1. Reella tal. Känna till talsystememet och kunna använda notation för mängder och intervall

Läs mer

Fixpunktsiteration. Kapitel Fixpunktsekvation. 1. f(x) = x = g(x).

Fixpunktsiteration. Kapitel Fixpunktsekvation. 1. f(x) = x = g(x). Kapitel 5 Fixpunktsiteration 5.1 Fixpunktsekvation En algebraisk ekvation kan skrivas på följande två ekvivalenta sätt (vilket innebär att lösningarna är desamma). 1. f(x) = 0. En lösning x kallas en rot

Läs mer

Övningshäfte 3: Funktioner och relationer

Övningshäfte 3: Funktioner och relationer GÖTEBORGS UNIVERSITET MATEMATIK 1, MAM100, HT2014 INLEDANDE ALGEBRA Övningshäfte 3: Funktioner och relationer Övning H Syftet är att utforska ett av matematikens viktigaste begrepp: funktionen. Du har

Läs mer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson Uppsala Universitet Matematiska Institutionen Thomas Erlandsson LÄSANVISNINGAR VECKA 36 VERSION 1. ARITMETIK FÖR RATIONELLA OCH REELLA TAL, OLIKHETER, ABSOLUTBELOPP ADAMS P.1 Real Numbers and the Real

Läs mer

Tentamen i tmv036c och tmv035c, Analys och linjär algebra C för K, Kf och Bt A =, = det(a λi) = e 2t + c 2. x(t) = c 1. = c 1.

Tentamen i tmv036c och tmv035c, Analys och linjär algebra C för K, Kf och Bt A =, = det(a λi) = e 2t + c 2. x(t) = c 1. = c 1. Institutionen för matematiska vetenskaper Chalmers tekniska högskola Niklas Eriksen Tentamen i tmv6c och tmv5c, Analys och linjär algebra C för K, Kf och Bt Lösningar 9--6. Lös initialvärdesproblemet x

Läs mer

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A SF64 Algebra och geometri Lösningsförslag till tentamen 04-05-0 DEL A. Planet P innehåller punkterna (,, 0), (0, 3, ) och (,, ). (a) Bestäm en ekvation, på formen ax + by + cz + d = 0, för planet P. (

Läs mer

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 11-14, 16/11-28/

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 11-14, 16/11-28/ Uppsala Universitet Matematiska Institutionen Bo Styf Transformmetoder, 5 hp gy, IT, W, X 2011-10-26 Sammanfattning av föreläsningarna 11-14, 16/11-28/11 2012. Här lär vi oss använda transformer för att

Läs mer

SF1625 Envariabelanalys Tentamen Måndagen den 11 januari 2016

SF1625 Envariabelanalys Tentamen Måndagen den 11 januari 2016 SF625 Envariabelanalys Tentamen Måndagen den januari 206 Skrivtid: 08:00-3:00 Tillåtna hjälpmedel: inga Examinator: Lars Filipsson Tentamen består av nio uppgifter som vardera ger maximalt fyra poäng.

Läs mer

Analys o Linjär algebra. Lektion 7.. p.1/65

Analys o Linjär algebra. Lektion 7.. p.1/65 Analys o Lektion 7 p1/65 Har redan (i matlab bla) stött på tal-listor eller vektorer av typen etc Vad kan sådana tänkas representera/modellera? Hur kan man räkna med sådana? Skall närmast fokusera på ordnade

Läs mer

Föreläsningsanteckningar Linjär Algebra II Lärarlyftet

Föreläsningsanteckningar Linjär Algebra II Lärarlyftet Föreläsningsanteckningar Linjär Algebra II Lärarlyftet Per Alexandersson Föreläsning I Timme I: Repetition av matriser, linjära ekvationssystem Linjärt ekvationssystem: x + y + z 3w = 3 2x + y + z 4w =

Läs mer

TATA42: Föreläsning 9 Linjära differentialekvationer av ännu högre ordning

TATA42: Föreläsning 9 Linjära differentialekvationer av ännu högre ordning TATA42: Föreläsning 9 Linjära differentialekvationer av ännu högre ordning Johan Thim 4 mars 2018 1 Linjära DE av godtycklig ordning med konstanta koefficienter Vi kommer nu att betrakta linjära differentialekvationer

Läs mer

Lösningar av uppgifter hörande till övning nr 5.

Lösningar av uppgifter hörande till övning nr 5. Lösningar av uppgifter hörande till övning nr 5. H.7 a) Antag att p är ett polynom med grad p < n. Då kan p skrivas som en linjärkombination av ortogonalpolynomen p k, där k < n. Alltså är p c k p k, m

Läs mer

Lineära system av differentialekvationer

Lineära system av differentialekvationer Föreläsning 8 Lineära system av differentialekvationer 8.1 Aktuella avsnitt i läroboken (5.1) Matrices and Linear Systems. (5.2) The Eigenvalue Method for Homogeneous Systems. (5.3) Second-Order Systems

Läs mer

Subtraktion. Räkneregler

Subtraktion. Räkneregler Matriser En matris är en rektangulär tabell av tal, 1 3 17 4 3 2 14 4 0 6 100 2 Om matrisen har m rader och n kolumner så säger vi att matrisen har storlek m n Index Vi indexerar elementen i matrisen genom

Läs mer

Lösningsskisser för TATA

Lösningsskisser för TATA Lösningsskisser för TATA4 7-3-7. Funktionen f() 5 arctan + 4 arctan(/), med den föreskrivna definitionsmängden D f { R : > }, ar derivatan f () 5 + () + 4 ( / ) + (/) + 4 4 + + (4 + 6 ) ( + )( + 4 ) Detta

Läs mer

Block 1 - Mängder och tal

Block 1 - Mängder och tal Block 1 - Mängder och tal Mängder Mängder och element Venndiagram Delmängder och äkta delmängder Union och snittmängd Talmängder Heltalen Z Rationella talen Q Reella talen R Räkning med tal. Ordning av

Läs mer

Ht Läsanvisningar till Hilbertrum och partiella differentialekvationer. Del 1. Ur Anton, Rorres; Elementary Linear Algebra

Ht Läsanvisningar till Hilbertrum och partiella differentialekvationer. Del 1. Ur Anton, Rorres; Elementary Linear Algebra Ht-2010 Umeå universitet Institutionen för matematik och matematisk statistik PAB Läsanvisningar till Hilbertrum och partiella differentialekvationer Del 1 Ur Anton, Rorres; Elementary Linear Algebra 10.1-10.

Läs mer

2 Matematisk grammatik

2 Matematisk grammatik MATEMATISK GRAMMATIK Matematisk grammatik.1 Skriva matematik Matematisk grammatik, minst lika kul som det låter, och hur man skriver matematik är nästan lika viktigt som vad man skriver. En grammatisk

Läs mer

Metriska rum, R och p-adiska tal

Metriska rum, R och p-adiska tal Metriska rum, R och p-adiska tal Tony Johansson 1MA239: Specialkurs i Matematik II Uppsala Universitet VT 2018 När vi säger avståndet mellan punkt X och punkt Y där X och Y är punkter i planet (säg) är

Läs mer

Lösningsförslag till övningsuppgifter, del V

Lösningsförslag till övningsuppgifter, del V Lösningsförslag till övningsuppgifter, del V Obs! Preliminär version! Ö.1. (a) Vi kan lösa uppgiften genom att helt enkelt räkna ut avståndet mellan vart och ett av de ( 7 ) = 1 paren. Först noterar vi

Läs mer

6 Derivata och grafer

6 Derivata och grafer 6 Derivata och grafer 6.1 Dagens Teori När vi plottar funktionen f(x) = x + 1x 99x 8 med hjälp av dosan kan man få olika resultat beroende på vilka intervall man valt. 00000 100000-00 -100 100 00-100000

Läs mer

Frågorna 1 till 6 ska svaras med ett kryss för varje korrekt påstående. Varje uppgift ger 1 poäng.

Frågorna 1 till 6 ska svaras med ett kryss för varje korrekt påstående. Varje uppgift ger 1 poäng. ATM-Matematik Mikael Forsberg 34-4 3 3 Matematik med datalogi, mfl. Linjär algebra mag4 6 3 Skrivtid: 9:-4:. Inga hjälpmedel. Lösningarna skall vara fullständiga och lätta att följa. Börja varje ny uppgift

Läs mer

Tavelpresentation - Flervariabelanalys. 1E January 2017

Tavelpresentation - Flervariabelanalys. 1E January 2017 Tavelpresentation - Flervariabelanalys 1E January 2017 1 Innehåll 1 Partiella derivator 3 2 Differentierbarhet 3 3 Kedjeregeln 4 3.1 Sats 2.3.4............................... 5 3.2 Allmänna kedjeregeln........................

Läs mer

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A SF625 Envariabelanalys Lösningsförslag till tentamen 206-0- DEL A. Betrakta funktionen f som ges av f(x) = x 2 arctan x. A. Bestäm definitionsmängden till f. B. Bestäm de intervall där f är växande respektive

Läs mer

Övningar. MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Avd. Matematik. Linjär algebra 2. Senast korrigerad:

Övningar. MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Avd. Matematik. Linjär algebra 2. Senast korrigerad: MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Avd. Matematik Linjär algebra 2 Senast korrigerad: 2006-02-10 Övningar Linjära rum 1. Låt v 1,..., v m vara vektorer i R n. Ge bevis eller motexempel till

Läs mer

MATEMATIK GU. LLMA60 MATEMATIK FÖR LÄRARE, GYMNASIET Analys, ht 2014. Block 5, översikt

MATEMATIK GU. LLMA60 MATEMATIK FÖR LÄRARE, GYMNASIET Analys, ht 2014. Block 5, översikt MATEMATIK GU H4 LLMA6 MATEMATIK FÖR LÄRARE, GYMNASIET Analys, ht 24 I block 5 ingår följande avsnitt i Stewart: Kapitel 2, utom avsnitt 2.4 och 2.6; kapitel 4. Block 5, översikt Första delen av block 5

Läs mer