1 Att läsa matematik.

1 Att läsa matematik. Precis som vid all annan läsning som betyder något skall matematik läsas aktivt. Detta innebär olika saker för olika personer. För en del kanske det betyder att visualisera de idéer som framträder i texten. Att luta sig tillbaka i fåtöljen, sluta ögonen och fundera över konsekvenserna av givna påståenden. För en del betyder det att läsa med papper och penna vid sin sida. Så fort man når ett påstående lämnar man texten och försöker föreställa sig vilka konsekvenser det har. Är det en sats som ges, så försöker man att bevisa den själv innan man tittar på författarens bevis. Även om man misslyckas med att bevisa ett påstående, så lär man sig mycket av att försöka. Man är tvungen att tänka igenom givna definitioner och man kan få en uppfattning om vilka typer av problem man stöter på i ett bevisförsök. Läser man en definition så bör man så fort som möjligt försöka att konstruera en egen exempelsamling som anknyter till denna definition. Konstruera objekt som uppfyller villkoren i definitionen och försök att konstruera objekt som inte uppfyller de givna kriterierna. Detta gör att man förhoppningsvis kan bilda sig en uppfattning om var definitionens gränser går. Det är också nyttigt att försöka finna ekvivalenta formuleringar av givna påståenden. Detta innebär ju att man är tvungen att tänka igenom alla givna förutsättningar. Det är också ibland så att vissa formuleringar lämpar sig bättre än andra då man exempelvis vill generalisera ett påstående till mer allmänna, eller kanske helt andra, situationer. Underlåtenhet att bygga upp en lämplig exempelsamling har ibland lett till fullständigt absurda konsekvenser. Det har faktiskt, i enstaka fall, skrivits forskningsartiklar om objekt, vilka har varit så restriktivt definierade att man senare upptäckt att man faktiskt inte har kunnat konstruera ett enda exempel på något sådant objekt. I sådana artiklar har man alltså, utan att ha varit medveten om det, helt enkelt studerat den tomma mängden. Detta är självfallet inte speciellt smickrande för vare sig författaren eller övriga inblandade. För att illustrera råden givna ovan skall vi diskutera ett antal exempel i grundläggande analys. 1.1 Kontinuitet Den grundegenskap man vill åt vid definitionen av kontinuerlig funktion, är en funktion vilken lokalt är väsentligen konstant, eller med andra ord, en funktion vilken inte drastiskt ändrar värde då vi bara flyttar oss lite i definitionsmängden. Det har under årens lopp givits en mängd olika definitioner som har försökt att fånga denna grundidé, och den vi idag använder kan formuleras på följande sätt. Definition 1. Låt D vara en öppen mängd i R n och låt f : D R m vara en given funktion. Vi säger att f är kontinuerlig i en punkt a D omm det till varje ε 0 existerar ett δ 0 så att 1

f f x f a ε (1) x D x a δ Slutligen säger vi att en funktion är kontinuerlig om den är kontinuerlig i varje punkt i sin definitionsmängd. Vi noterar först att vi i definitionen ovan först väljer ε och sedan δ, och att δ tydligen i allmänhet sålunda beror av funktionen f med dess definitionsmängd D, punkten a och ε. Vi noterar sedan att kontinuitet är en lokal egenskap, i den mening att egenskapen att en funktion är kontinuerlig eller ej i en given punkt a D endast beror av funktionens värden nära a. Mer precist observerar vi att det inte är någon restriktion i definitionen ovan att anta att vi, givet ε 0, alltid söker δ 0 bland tal vilka är mindre än en på förhand bestämd positiv konstant. Vi ser omedelbart, till vår lättnad, att alla konstanta funktioner är kontinuerliga (kontrollera detta!). För att bygga upp en bank av exempel kan det vara lämpligt att börja med fallet m n 1 ovan. Vi börjar alltså att studera funktioner för vilka både definitionsmängd och värdemängd är delmängder av R. Eftersom både addition och multiplikation av reellvärda funktioner är definierade, börjar vi med att observera att om f och g båda är kontinuerliga, så gäller att f g, f g och f g är kontinuerliga där de är definierade. Vi noterar sedan att funktionen R x x R är kontinuerlig, vilket med hjälp av reglerna ovan medför att alla polynom är kontinuerliga. Ett enkelt exempel på en ickekontinuerlig funktion är Heavisides stegfunktion, R x H x, där H x 0 om x 0 och H x 1 om x 0. Om m n 1 ovan, det vill säga om funktionen f är reellvärd och definierad för en öppen delmängd av de reella talen, så kommer f s graf att vara en delmängd av R 2 och vi kan rita den. Intuitivt vill vi då att en funktion skall vara kontinuerlig omm vi kan rita dess graf utan att lyfta pennan. Detta formuleras lite mer exakt i satsen om mellanliggande värden. Sats 1. Om f : D R är kontinuerlig, a b D och om ξ är ett tal mellan f a och f b, så existerar det ett x a b sådant att f x ξ. Kommentar. Notera att denna sats inte är lätt att bevisa ens för allmänna polynom med heltalskoefficienter eftersom vi saknar generella algebraiska formler vilka ger rötter till dylika ekvationer och existensen av rötter i allmänhet är nära förknippad med de reella talens natur. Även för relativt enkla polynom är vi tvungna att hänvisa till topologiska egenskaper hos de reella talen för att bevisa påståendet i satsen. Vi kan anta att f a ξ f b, ty om f a f b är påståendet klart, och om f a b så kan vi istället betrakta funktionen f (eftersom f är kontinuerlig omm f är det). 2

Vi skall nu visa att ekvationen f x ξ har (minst) en lösning x a b. Genom intervallhalvering kan vi skaffa oss en svit av inkapslade intervall a k b k a k 1 b k 1 då k 1 2 3, med a 0 a, och b 0 b, med egenskapen att f a k ξ f b k ; k N och så att b k a k 0 då k. Sviten a k k 1 är sålunda växande och uppåt begränsad och sviten b k k 1 är avtagande och nedåt begränsad. Det verkar naturligt att sviten a k k 1 och sviten b k båda konvergerar mot ett gemensamt gränsvärde. Detta följer också i själva verket ifrån axiomet om övre gräns (se Persson Böiers), vilket beskriver en fundamental topologisk egenskap hos de reella talen. (Det fås också direkt ifrån fullständigheten hos R (se nedan) genom att verifiera att följden a k k 1 och följden b k k 1 bildar (ekvivalenta) Cauchyföljder.) Då Richard Dedekind i slutet av 1800 talet höll föreläsningar i grundläggande analys stördes han mycket av just axiomet om övre gräns. Han ansåg att det var ytterst otillfredställande att vara tvungen att hänvisa till oprecisa geometriska argument för att bevisa att varje uppåt begränsad och växande följd av reella tal konvergerar mot ett bestämt gränsvärde. Detta ledde honom till att fundera över de reella talens natur och slutligen till en precis definition av vad reella tal kan vara. Dedekind utgick väsentligen ifrån de naturliga talen och egenskaper för dessa. Från de naturliga talen är det lätt att logiskt precist konstruera de rationella talen. Dedekind konstruerade sedan utifrån de rationella talen de reella talen med hjälp av sina numera berömda Dedekindsnitt. En god vän till Dedekind, nämligen Georg Cantor, konstruerade mer eller mindre samtidigt med Dedekind ett annat, men ekvivalent, sätt att definiera de reella talen utifrån de rationella. Vi skall kort skissera Cantors metod och antyda hur axiomet om övre gräns följer som en konsekvens av Cantors defintioner. 1.2 De reella talen. q 2 2. p Det är ett klassiskt resultat att det inte finns heltal p och q sådana att Mer allmänt är det lätt att visa den så kallade Gissningssatsen. Sats 2. Låt P vara ett polynom med heltalskoefficienter, P x a n n x a n 1x n 1 a 1 x a 0. p Om P q 0, där p q Z är relativt prima (och q 0 så klart), så gäller att q delar a n och p delar a 0. q 0 med q n och titta efter. p Multiplicera ekvationen P Det är nu lätt att ge exempel på mängder av polynomekvationer (för polynom med heltalskoefficienter) vilka saknar rationella rötter. 3

Exempel 1. Ekvationen x 2 2 0 saknar rationella rötter. Detta följer av gissningssatsen genom att räkna upp de, enligt satsen, enda möjliga rationella rötterna och sedan medelst direkt insättning i ekvationen verifiera att dessa ej löser den. Sagt och gjort, för en möjlig rationell rot p q, med p och q relativt prima, måste enligt satsen p dela 2 och q dela 1. Detta ger följande lista av de fyra enligt satsen tänkbara rötterna : 1 2. Ingen av dessa duger, vilket alltså medför att ekvationen saknar rationella lösningar. Tal vilka, likt 2, är lösningar till polynomekvationer med heltalskoefficienter kallas för algebraiska tal. Exempelvis är alla rationella tal algebraiska (ett rationellt tal p q löser ju polynomekvationen qx p 0), men som vi sett med hjälp av gissninssatsen så finns det mängder av algebraiska tal vilka är irrationella. Icke algebraiska reella tal kallas för transcendenta tal. Exempel på transcendenta tal är π och e. Transcendensen av π bevisades först 1882 av den tyske matematikern Lindemann. Frågan kvarstår dock, vad är ett reellt tal egentligen? Om vi försöker lösa exempelvis ekvationen x 2 2 0 med någon numerisk metod med hjälp av dator, så skapar vi en följd av rationella tal, vilka försöker konvergera mot en lösning till ekvationen. Frågan är alltså om följden lyckas konvergera, eller snarare, mer precist, om det existerar något tal att konvergera mot. Cantors lösning var att ta själva följden som definition av just detta gränsvärde, eller mer precist, ta samtliga föjder vilka försöker konvergera mot ett tänkt gränsvärde som definition av just detta gränsvärde. För att klargöra detta något behöver vi införa ett par nya begrepp. Vi tänker oss nu ett litet tag att världen endast består av rationella tal. Definition 2. Följden a n n 1, där N k a k Q, konvergerar mot a Q omm till varje ε 0 (med ε Q så klart) existerar ett N N så att a n a ε om n N Problemet är, som vi sett ovan, att varje följd av rationella tal som försöker konvergera (i Q) inte säkert lyckas med detta. Vi inför nu ett namn på de följder av rationella tal vilka försöker konvergera. Definition 3. Följden N k a k Q kallas en Cauchyföljd omm till varje ε 0 (med ε Q så klart) existerar ett N N så att a n a m ε om n m N Följder vilka lyckas konvergera är naturligtvis Cauchyföljder. Detta följer direkt ur definitionerna och triangelolikheten. 4

Sats 3. Om Q a n a Q då n, så gäller att a n a n a m a n a a m a n 1 är en Cauchyföljd. Vi måste också tala om vad vi menar med att två Cauchyföljder försöker konvergera mot samma tal. Vi kallar sådana följder för ekvivalenta. Definition 4. Cauchyföljderna a n n 1 och b n n 1 kallas ekvivalenta omm till varje ε 0 (med ε Q så klart) existerar ett N N så att a n b n ε om n N Cantor tog nu familjer av ekvivalenta Cauchyföljder (i Q) som definition av reella tal och visade sedan att alla de vanliga räknereglerna och operationerna gäller för dessa nya objekt. Han kunde också visa att vi i någon mening nått vägs ände topologiskt genom att visa att varje Cauchyföljd av reella tal (med lämplig justering av definitionen) verkligen alltid lyckas konvergera (i R). Den topologiska egenskapen att varje Cauchyföljd är konvergent kallas för fullständighet. Mängden av reella tal är alltså till skillnad från mängden av rationella tal fullständig. Cantor kunde nu enkelt visa axiomet om övre gräns som en sats genom att visa att varje uppåt begränsad följd av reella tal faktiskt bildar en Cauchyföljd och därför, på grund av fullständigheten hos R, konvergerar. 1.3 Åter till kontinuitet. Medelvärdesegenskapen hos reellvärda kontinuerliga funktioner på R följer som sagt enkelt ifrån definitionerna och fullständigheten hos R. Ett mått på hur väsentlig medelvärdesegenskapen är inom analys, fås genom det faktum att medelvärdesegenskapen faktiskt till relativt nyligen (fram till förra sekelskiftet) ibland togs som definition av kontinuitet. Att detta var mindre lyckat inses t. ex. genom följande (kanoniska) exempel på en funktion vilken uppfyller medelvärdesegenskapen i varje intervall, men vilken vi helst skulle vilja slippa kalla kontinuerlig i origo. Exempel 2. Låt 1 sin x om x 0 f x : 0 om x 0 (2) Vi skall nu kort beröra en viktig topologisk egenskap hos mängder, vilken i analys ofta samspelar fruktbart med begreppet kontinuitet. Egenskapen är kompakthet. 5

Definition 5. En mängd M i R är sluten omm M a k a R n a M. Definition 6. En mängd M i R är kompakt omm den är sluten och begränsad. Vi har då följande användbara karaktärisering av kompakta mängder, uppkallad efter två av den rigorösa matematiska analysens grundare. Sats 4. En mängd i R är kompakt omm den har Bolzano Weierstrass egenskapen. Definition 7. En mängd M i R har Bolzano Weierstrass egenskapen omm varje följd a k k 1 i M har en delföljd a k j k j 1 vilken konvergerar mot ett element i M. Bevisskiss. Att en kompakt mängd har Bolzano Weierstrass egenskapen följer genom att notera att egenskapen att mängden är begränsad ger att den är innehållen i ett intervall. Sedan görs intervallhalvering varvid man noterar att vid varje halvering kommer något av delintervallen att fortfarande innehålla oändligt många element ur följden. Detta ger en mängd inkapslade intervall vars snitt med M är icketomt och vars längd krymper mot noll. Fullständigheten hos R tillsammans med det faktum att M är sluten avslutar beviset. Omvändningen är enklare och görs exempelvis med motsägelseargument. Det väsentliga sambandet mellan kontinuitet och kompakthet är följande resultat. Sats 5. Låt f C R och låt M R vara en kompakt mängd. Då följer att bilden f M av M under avbildningen f är kompakt. Bevisskiss. Vi visar att f bildmängden M f M har Bolzano Weierstrass egenskapen. Tag en j 1 i. Då finns det punkter m j 1 2 M, j så att f m j n j. följd n j Eftersom m j m jk j 1 är en följd i M och M är kompakt kan vi finna en delföljd k 1 vilken konvergerar i M. På grund av kontinuiteten hos f följer att f m j k konvergerar i f M. Denna sats tillsammans med medelvärdesegenskapen ger direkt följande korollarium. Korollarium 1. Låt f C R och låt I R vara ett kompakt intervall. Då följer att bilden f I av I under avbildningen f är ett kompakt intervall. Bland annat gäller alltså att f har såväl ett största som ett minsta värde i intervallet. I själva verket är det faktum att en kontinuerlig funktion avbildar kompakta mängder på kompakta mängder, fundamental vid lösandet av de flesta optimeringsproblem. Vi avslutar med att visa en mängd så kallade medelvärdessatser. Vi börjar med den klassiska integralkalkylens medelvärdessats. 6 k 1

Sats 6. Låt f C R och I a b R. Då existerar det ett ξ I så att 1 b f ξ b a f x dx a Det är klart att medelvärdet, f I : 1 I I f dx, av f över intervallet I ligger emellan f s största och minsta värde i intervallet. Enligt medelvärdesegenskapen finns alltså ett ξ I så att f ξ f I. Använder vi denna sats tillsammans med analysens huvudsats (vilken kopplar ihop integration och derivation och vilken för övrigt lätt visas med hjälp av just medelvärdessatsen) på derivatan av en funktion så får vi differentialkalkylens medelvärdessats. 1 Sats 7. Låt f C R och I a b R. Då existerar det ett ξ I så att f ξ f b f a b a Ett annat användbart resultat, som följer direkt av integralkalkylens medelvärdessats och huvudsats, är den så kallade Cauchys medelvärdessats. Sats 8. Låt f 1 g C R och I a b R. Då existerar det ett ξ I så att f ξ g b g a g ξ f b f a Använd integralkalkylens medelvärdessats på funktionen a b x g a g x f b f a f x g b. 7