Linjär Algebra, Föreläsning 2 Tomas Sjödin Linköpings Universitet
Geometriska vektorer, rummen R n och M n 1 En (geometrisk) vektor är ett objekt som har storlek och riktning, men inte någon naturlig startpunkt. Om vi i ett plan har två punkter P och Q, då låter vi den riktade sträckan från P till Q, ritad som en pil som startar i P och slutar i Q, betecknas PQ. Vi låter nu mängden av alla sådana riktade sträckor med samma storlek och riktning (det är alltså underförstått att vi kan mäta detta) betecknas [ PQ]. Detta tar vi som definition av vektorer i planet. Givetvis kan motsvarande också göras i ett tredimensionellt rum. (För de som vet vad en ekvivalensrelation är kan vi säga att ha samma storlek och riktning är en ekvivalensrelation, och en vektor är helt enkelt en ekvivalensklass av riktade sträckor). Notera att det för varje vektor u och punkt P finns en unik punkt Q sådan att u = [ PQ]. En speciell vektor är nollvektorn, som har längd noll (och alltså inte kan sägas ha någon riktning). Denna betecknas 0, och vi har 0 = [ PP].
Vi inför även för en vektor u = [ PQ] längden/normen u att vara avståndet mellan punkterna P och Q.
För dessa vektorer inför man nu två operationer. Addition av två vektorer, samt multiplikation med skalär (=reellt tal). Addition av två vektorer u = [ PR] och v = [ RQ] definieras som u + v = [ PR] + [ RQ] = [ PQ]. Multiplikation med skalär definieras så att ku är den unika vektor som uppfyller ku = k u och ku har samma riktning som u om k > 0, ku har motsatt riktning om k < 0. Om k = 0 är ku = 0. Vi inför även beteckningen u := 1u, d.v.s. den vektor som har samma storlek men motsatt riktning.
Det är lätt att inse att följande räknelagar gäller: Sats För alla vektorer u, v, w (i ett plan eller rum) och skalärer λ, µ gäller följande: (a) u + v = v + u, (b) u + (v + w) = (u + v) + w, (c) u + 0 = u, (d) u + v = 0 u = v, (e) 1u = u, (f) λ(µu) = (λµ)u, (g) (λ + µ)u = λu + µu, (h) λ(u + v) = λu + λv. Tack vare lag (b), (f ) ovan kommer vi skriva u + v + w, λµu eftersom det inte spelar någon roll i vilken ordning vi tar dessa operationer.
Nu har vi den geometriska definitionen av vektorer klar, och den viktigaste algebraiska strukturen för dessa klara. Vektorerna i planet/rummet med denna struktur utgör exempel på vad som kallas vektorrum som är den typ av rum som linjär algebra handlar om. Det vi nu vill göra är att på något systematiskt sätt införa siffror för vektorer för att överföra dessa geometriska konstruktioner till algebra. Den idé som Descartes (även kallad Kartesius) fick var att införa koordinataxlar för att kunna ge punkter koordinater (därför kallas dessa koordinatsystem för kartesiska koordinater). Vad vi behöver göra är först och främst att fixera någon punkt i vårt plan/rum där axlarna kan utgå ifrån. Vi kallar denna punkt origo och betecknar den O. Sedan inför vi koordinataxlar som i figuren nedan i planet respektive rummet. Till varje axel x i placerar vi också ut en vektor e i i dess riktning.
I detta och nästa kapitel kommer vi alltid anta att detta gjorts på ett sådant sätt att alla e i har längd 1 samt att dessa vektorer alla är parvis ortogonala mot varandra (d.v.s. vinkel π/2 mellan dem). En sådan bas kallar man för ortonormal, eller ON-bas. Vidare är det viktigt att axlarna är orienterade som i denna figur. De utgör vad som kallas ett högersystem, men mer om detta senare när vi talar om kryssprodukten i rummet. Notera att vi alltså här är lite mindre allmänna än kursboken där generella baser behandlas. Vi väntar dock med diskussion kring allmänna baser till senare när vi talar om allmänna vektorrum.
Det är nu så att vi till varje punkt P i planet (rummet) kan införa koordinaterna (a 1, a 2 ) ((a 1, a 2, a 3 )) där dessa fås genom att projicera ortogonalt på axlarna. Om vi nu har en vektor u så vet vi att det finns en unik punkt P sådan att u = [ OP]. Notera att detta innebär att ( ) u = a 1 e 1 + a 2 e 2 respektive u = a 1 e 1 + a 2 e 2 + a 3 e 3. Denna uppdelning av u som en summa av vektorer parallella med e i :a är unik. D.v.s. varje vektor u kan på entydigt sätt skrivas på formen ( ) som ovan. Därför säger vi att e = (e 1 e 2 ) (e = (e 1 e 2 e 3 )) utgör en bas till planet (rummet). Det är tack vare att en bas till planet (rummet) består av två (tre) vektorer som vi säger att ett plan är två-dimensionellt och ett rum tre-dimensionellt.
Vi kommer införa följande beteckning: ( ) a 1 a1 u = e respektive u = e a a 2, 2 a 3 ( ) a 1 a1 och kolumnmatrisen ( a a 2 ) kallas för u:s koordinater i 2 a 3 basen e. Motiveringen till denna notation kommer senare i kursen när vi börjar med matrisräkning, men för tillfället är det bara en notation för att beteckna vektorer.
Nu kan vi komma till hela poängen. Varje vektor u i planet kan på entydigt sätt skrivas på formen ( ) a1 u = a 1 e 1 + a 2 e 2 = e, och dessutom är för varje par a 1, a 2 R detta uttryck en vektor i planet. På samma sätt kan varje vektor u i rummet skrivas som a 2 a 1 u = a 1 e 1 + a 2 e 2 + a 3 e 3 = e a 2, a 3 och återigen för varje taltrippel a 1, a 2, a 3 R utgör detta uttryck en vektor i rummet. Alltså kan varje vektor i planet/rummet identifieras med talpar/taltrippler på detta sätt. Givetvis beror dessa på valet av basvektorer, men vi antar alltså nu att vi redan fixerat dessa, samt fixerat origo.
När det gäller de algebraiska operationerna vi har infört blir dessa mycket enkla om vi uttrycker alla vektorer i samma bas: ( ) ( ) ( ) ( ) ( ) a1 b1 a1 + b u+v = e +e = e 1 a1 ka1, ku = ke = e, a 2 b 2 a 2 + b 2 a 2 ka 2 respektive a 1 b 1 a 1 + b 1 u+v = e a 2 +e b 2 = e a 2 + b 2, a 3 b 3 a 3 + b 3 a 1 ka 1 ku = ke a 2 = e ka 2 a 3 ka 3 Det vill säga för att addera två vektorer adderar vi bara deras koordinater, och för att multiplicera en vektor med en skalär multiplicerar vi bara varje koordinat med denna skalär. Det är ganska lätt att övertyga sig om att detta stämmer överens med den geometriska definitionen av addition och multiplikation med skalär som vi införde ovan.
Rummen R n och M n 1 Vi har ovan sett att om vi väljer origo och en bas så har vi att varje punkt P i ett plan kan identifieras med sina ( koordinater ) (a 1, a 2 ), a1 och varje vektor u med sina koordinater, samt att vi hade enkla uttryck för våra algebraiska operationer så fort vi uttryckt allt i denna fixa bas. Samma sak kan sägas även i tre dimensioner, och man kan givetvis tänka sig att man gjorde motsvarande även i högre dimensioner, även om det givetvis inte går att visualisera på samma sätt. Detta leder till följande definition: a 2
Definition Mängden av alla tal n-tupler (a 1, a 2,..., a n ), där a 1, a 2,..., a n R, betecknas R n. På samma sätt betecknar vi mängden av alla kolumnmatriser med M n 1. a 1 a 2. a n Vårt främsta motiv för att införa dessa rum redan här är att det gör att vi enklare kan formulera satser gemensamt för två och tre dimensioner, och behöver inte behandla dessa separat. Det är än så länge främst n = 2, 3 vi är intresserade av.
Vi inför också följande operationer på R n respektive M n 1. (a 1, a 2,..., a n ) + (b 1, b 2,..., b n ) = (a 1 + b 1, a 2 + b 2,..., a n + b n ), k(a 1, a 2,..., a n ) = (ka 1, ka 2,..., ka n ), a 1 b 1 a 1 + b 1 a 2. + b 2. = a 2 + b 2., a n b n a n + b n a 1 ka 1 a 2 k. = ka 2.. a n ka n
Rummen R n och M n 1 tillsammans med ovanstående operationer är exempel på det man kallar vektorrum som vi ska definiera allmänt senare i kursen. Här kanske det är värt att notera att då vi jobbar med geometriska problem är det givetvis viktigt att skilja på punkter och vektorer, och vi använder främst element i R n för att beteckna punkter och element i M n 1 (egentligen med e framför för att beteckna basen om man ska vara noga) som vektorer. Då kan det ju tyckas konstigt att vi inför addition och multiplikation med skalär för punkter. Nu är det så att det bara är i dessa geometriska problem (som handlar om linjer och plan i två och tre dimensioner främst) som vi kommer tala om punkter, annars kommer vi enbart i kursen tala om vektorer.
Det finns en uppenbar 1 1 korrespondens mellan punkter och motsvarande vektor som startar i origo. Dessutom om vi identifierar (a 1, a 2,..., a n ) med a 1 a 2. a n, så är ju rummen ovan helt ekvivalenta på alla sätt. Anledningen till att vi vill ha båda är att R n är det i särklass vanligaste rummet i matematiklitteraturen, men när vi sedan räknar med matriser är det rätta sättet att skriva vektorer som kolumnmatriser. I princip skulle det kanske vara bättre att göra detta rakt igenom i kursen och skippa R n, men det som talar starkt för R n är att det är betydligt smidigare att skriva dessa vektorer, samt att det är mer standardiserat.
Nedan kommer vi formulera alla begrepp/satser enbart för R n, och givetvis finns det en direkt motsvarighet för M n 1. Dessa fall lämnas åt läsaren att formulera, och vi kommer hämningslöst använda dessa motsvarande satser senare i kursen. Notera också att jämfört med kursboken vänder vi till stor del upp och ner på materialet, för vi inför våra operationer nedan på R n, och ger sedan geometriska tolkningar av dem, medan boken ger geometriska definitioner och visar räknelagarna utifrån dessa. Det är också värt att notera att rent geometriskt betyder det att vi lägger ut våra basvektorer e i så att e 1 = (1, 0,..., 0), e 2 = (0, 1, 0,..., 0),..., e n = (0, 0,..., 0, 1), och dessa kallas standardbasen till R n. Vidare lägger vi origo O i punkten (0, 0,..., 0).
Skalärprodukt Vi kommer nu i R n införa den så kallade skalärprodukten mellan två vektorer. R n tillsammans med denna utgör då ett exempel på ett så kallat Euklidiskt rum som vi ska definiera mer allmänt senare i kursen. Namnet skalärprodukt kommer av att den tar två vektorer och ger en skalär (alltså inte en vektor)! (a 1, a 2,..., a n ) (b 1, b 2,..., b n ) := a 1 b 1 + a 2 b 2 +... + a n b n. Vi definierar även längden av en vektor (a 1, a 2,..., a n ) via (a 1, a 2,..., a n ) := a1 2 + a2 2 +... + a2 n. Igen är det enkelt att se via Pythagoras sats att detta verkligen överensstämmer med längden av motsvarande geometriska vektor om vi infört säg ett koordinatsystem i planet som ovan. Men detta beror på både att våra basvektorer har längd 1 och att de är ortogonala mot varandra!
Följande sats gäller för skalärprodukten: Sats Om u, v, w R n och λ R så gäller: (a) u v = v u, (b) u (v + w) = u v + u w, (c) u (λv) = (λu) v = λ(u v), (d) u u = u 2, (e) u u = 0 u = 0.
Följande viktiga olikheter gäller för skalärprodukten: Schwarz olikhet: x ȳ x ȳ. Speciellt gäller x ȳ x ȳ x ȳ. Triangelolikheten: x + ȳ x + ȳ.
Geometrisk tolkning av skalärprodukten Antag att vi har två nollskilda vektorer u, v i R n, då definierar vi vinkeln θ mellan dessa att vara den unika vinkel i intervallet [0, π] sådan att u v = u v cos(θ). För att se att detta stämmer överens geometriskt antag att de två vektorerna ligger i ett plan där vi infört koordinataxlar som ovan, ( ) a1 och antag för enkelhets skull att den ena har koordinaterna a ( ) 2 1 där a 1, a 2 > 0 och den andra (d.v.s. vektorn e 0 1 ). Vad ovanstående då säger är att vinkeln θ mellan dessa ges av cos(θ) = a 1 / a1 2 + a2 2, d.v.s. närliggande sida genom hypotenusan, vilket vi ju känner igen att det stämmer.
Vi säger också att två vektorer u, v är ortogonala, skrivet u v, om vinkeln mellan dem är π/2, d.v.s. om u v = 0.
Ortogonal projektion av en vektor på en annan vektor (linje)
Om vi som i bilden ovan har två vektorer u, v där v 0 då kan vi på entydigt sätt skriva u på formen u = u v + u v, där u v är ortogonal mot v, och u v är parallell med v. Detta betyder att u v = kv och u v = u kv. Så (u kv) v = 0, vilket ger k = u v. v 2 Eller u v = u v v 2 v.