Kvadratiska former Definition Definition En kvadratisk form i variabler är ett polynom i variabler av typen q (x, y) = ax + bxy + cy, a, b, c konstanter Definition En kvadratisk form i 3 variabler: q (x, y, z) = ax + bxy + cxz + +dy + eyz + fz a, b, c, d, e, f konstanter Definition 3 En kvadratisk form i n variabler: q (x) = a jk x j x k j,k= där x = (x,x,..., x n ) Anm. Polynom i flera variabler där alla termer har samma gradtal, som t.ex. p (x, y, z) =4x 5 + x 3 y 7xy 4 ( sammanlagda gradtalet räknas!) kallas homogena polynom. Därför skulle man kunna säga: en kvadratisk form är ett homogent polynom av grad Definition 4 Homogena polynom av grad som t.ex. kallas linjära former. x +5y 3z Betydelse Varför är (linjära och) kvadratiska former intressanta? På samma sätt som y = x är den näst viktigaste funktionen efter y = kx, så är de kvadratiska formerna näst viktigast efter de linjära formerna, när det gäller funktioner R n R. En huvudidé med differentialkalkyl är att deriverbara funktioner kan lokalt approximeras med sin tangent: f (x) f (a)+f (a) (x a) då x a Om funktionen är gånger deriverbar kan man få ännu noggrannare approximation med ett andragradspolynom : f (x) f (a)+f (a) (x a)+ f (a) (x a) (specialfall av Taylors formel) Motsvarigheten för en funktion av variabler är För små h, k är f (a + h, b + k) f (a, b)+ +f (a, b) h + f (a, b) k + + f (a, b) h +f (a, b) hk + f (a, b) k Högerledet är ett uttryck av formen konstant + + linjär form i h, k + + kvadratisk form i h, k Om vi vet hur linjära och kvadratiska former uppför sig, så vet vi ungefär vad en godtycklig olinjär funktion gör lokalt. (Homogena polynom av grad 3 som t.ex. x 3 +3x y y 3 skulle kunna kallas ternära former, men förekommer sällan.)
Matrisbeskrivning Matrisräkning visar att x x x 3 a a a 3 a a a 3 y y a 3 a 3 a 33 y 3 = a x y + a x y + a 3 x y 3 + a x y + a x y + a 3 x y 3 + +a 3 x 3 y + + a 3 x 3 y + a 33 x 3 y 3 och analogt i andra dimensioner än 3. Kvadratiska former kan därför representeras med matriser. Om n =3, q (x, y, z) = ax + bxy + cxz + +dy + eyz + fz = x y z a b/ c/ b/ d e/ x y c/ e/ f z På samma sätt i n variabler, med x x = x... x n q (x) = x t Qx med Q symmetrisk q,q,..., q nn ger koeff. framförx,x,..., x n q ij = q ji q ij + q ji ger koeff. förx i x j då i 6= j Det finns andra möjligheter för Q-matrisen, men konventionen är att använda symmetrisk Q, ochdåärmatrisenentydigtbestämd.. Skriv på matrisform de kvadratiska formerna (a) (b) x +3x +4x 3 x x + x x 3 +4x x 3 Svar: x x x 3 b) x x x 3 x x + x x 3 + x 3 x / 3 / 4 / / / / / / x x x 3 x x x 3. Om man seriekopplar n st. identiska fjädrar med fjäderkonstant k och inför x,x,x,..., x n = ändpunkternas avvikelser från resp. jämviktsläge, så att förlängningen (räknat med tecken) av fjäder nr. j ges av x j x j, så blir den totala potentiella energin för systemet V = j= k (x j x j ) en kvadratisk form i (x,x,..., x n ). Vilken matris representerar denna form? Svar: k........ 3. Varje vektor x =(x,x,..., x n ) bestämmer ett polynom Funktionen p x (t) =x + x t + x 3 t +... + x n t n f (x) = Z p x (t) dt blir då en kvadratisk form i x och kan representeras med en symmetrisk n n-matris H n f (x) =x T H n x Vad är H n?
Basbyte Om vi i polynomet gör variabelbytet q (x,x ) = x x µ / som motsv. av Q = / x = bx + bx Diagonalisering Definition 5 Atthittaettvariabelbytesomöverför matrisen för en kvadratisk form till en diagonalmatris, S T QS = diagonalmatris, q (x) = d bx + d bx +... + d n bx n för några reella tal d,d,..., d n så transformeras q till x = bx bx bq = bx bx µ som motsv. av bq = Vi tänker på polynomen q och bq (resp. Q och bq) som två olika beskrivningar av en och samma funktion på R n :en och samma kvadratiska form ger upphov till olika polynom/matriser beroende på hur man väljer bas i R n så vi använder i fortsättningen samma bokstav q för alla polynom som kan överföras i varandra genom ett linjärt variabelbyte av ovanstående typ. Allmänt: Under ett linjärt variabelbyte transformeras ett homogent polynom av grad tillettannathomogent polynom av grad. Hur transformeras matrisen för en kvadratisk form vid ett linjärt koordinatbyte? Om x = Sbx, så x T Qx = bx T S T QSbx kallas att diagonalisera den kvadratiska formen. 5. Kontrollera att matriserna µ S = µ S = båda diagonaliserar den kvadratiska formen q (x, y) =x +xy + y Kvadratiska former kan (till skillnad mot linjära avbildningar) alltid diagonaliseras! Minst två diagonaliseringsmetoder är tänkbara: d.v.s. Q övergår i S T QS. (Obs. Underförstått vid koordinatbyten, är att S existerar, så att till varje x svarar ett precis ett bx, och tvärtom.) Jämför transformationsformeln för kvadratiska former med den för linjära avbildningar: linjära avbildningar : A övergår i S AS kvadratiska. former : Q övergår i S T QS 4. Storheten ac b kallas diskriminant till den kvadratiska formen ax + bxy + cy. Den är intressant därför att den är invariant vid ONkoordinatbyten och dess tecken är invariant även vid allmänna koordinatbyten. Visa detta! Bevis: ac b =detq det S QS = detq det S T QS = (dets) det Q 3
Med kvadratkomplettering Varje kvadratisk form kan diagonaliseras med kvadratkomplettering, se Persson&Böiers, Analys i flera variabler, sid.9-9. Exempel: 3x +y +3z xy yz samla föst alla termer som innehåller x = 3 µx 3 xy +y yz +3z = µ = 3 x µ 3 y 3 3 y +y yz +3z = titta nu på resterande termer som innehåller y µ = 3 x 3 y + 5 3 y yz +3z = 5 yz +3z = µ = 3 x 3 y + 5 µ y 3 3 5 z 3 5 z +3z = µ = 3 x 3 y + 5 µ y 3 3 µ = 3 x 3 y + 5 µ y 3 3 5 z + 5 z Kvadratkompletteringsräkningarna visar sig allmänt vara identiska med Gausselimination utan rad- eller kolonnbyten : 3 3 addera (ekv ) till ekv. 3 3 5/3 3 addera 3 (ekv ) till ekv. 3 5 3 5/3 /5 Nu är diagonalelementen 3, 5/3, /5 precis de koefficienter som skall stå framför kvadraterna efter kvadratkompletteringen! Spanne, sid.3 Koordinatbytet överför bx = x 3 y by = y 3 5 z bz = z överför 3x +y +3z xy yz i 3bx + 5 3 by + 5 bz Med ON-koordinatbyte Kvadratiska former kan alltid diagonaliseras med ett ortonormerat koordinatbyte! Följer av spektralsatsen: Eftersom Q är symmetrisk, så finns en ortogonal S, sådan att S QS = diagonal med Q:s reella egenvärden λ,..., λ n i diagonalen. Men S ortogonal S = S T 6. Bestäm ett ortogonalt koordinatbyte som överför den kvadratiska formen q (x, y) =x +4xy y på diagonalform. Ange även diagonalformen. Ettmöjligtsvar: µ x y = 5 µ q (bx, by) = bx 3by µ bx by 4
Klassifikation Kvadratiska former indelas i positivt definita : q (x) >, för alla x 6= positivt semidefinita : q (x), för alla x, men med likhet för ngt x 6= negativt definita negativt semidefinita indefinita såväl q (x) > som q (x) < inträffar 7. Ibland kan typfrågan avgöras direkt ur definitionen. Matriser av typ A T A är positivt semidefinita, eftersom x T A T Ax = (Ax) T (Ax) = (längden av vektorn Ax) = = Ax för alla x Typindelningen kan relateras till frågan om vad egenvärdena till Q har för tecken : positivt definit alla egenvärden är > positivt semidefinit alla egenvärden är och är ett egenvärde negativt definit alla egenvärden är < negativt semidefinit alla egenvärden är och är ett egenvärde indefinit såväl positiva som negativa egenvärden För att avgöra typ räcker det med kvadratkomplettering. 8. Är en positivt definit symmetrisk matris alltid inverterbar? Svar: Ja. Om en kvadratisk matris A inte är inverterbar, så finns x 6=, sådan att Ax =. Därmed har vi 9. x T Ax =för något x 6= vilket säger att A inte är definit. A positivt definit symmetrisk? A positivt definit symmetrisk Sant eller falskt? Svar: Sant. i) A är inverterbar enligt föregående fråga. ii) A är symmetrisk enl. fråga??. iii) Egenvärdena till A är de inverterade värdena till A, alltså också positiva allihop och därmed är A positivt definit.. Låt A vara en positivt definit symmetrisk n n- matris. och b konstant n -matriser, c konstant. Visa att följande två problem har samma lösning: i) Bestäm den n -matris x som minimerar ii) Lös ekvationssystemet xt Ax b T x+c Ax = b Behövs positivt definit-antagandet?. Sant eller falskt? (a) En kvadratisk matris K är positivt definit om alla dess element är >? (b) Om den kvadratiska matrisen K är positivt definit, så måste alla dess diagonalelement vara >? Definition 6 Man kallar en symmetrisk matris positivt definit, positivt semidefinit, etc., om motsvarande kvadratiska form är av resp. typ: n n-matrisen A kallas positivt definit, om x T Ax för alla x 6= Etc. 5
Max- och minprinciper För en symmetrisk matris A (och symmetriska matriser dominerar i tillämpningarna!) kan man få intressant information om matrisen och speciellt dess egenvärden, genom att betrakta motsvarande kvadratiska form x T Ax. Wahde, övn.536 3. Låt Q vara en symmetrisk matris. Visa att följande två problem har samma lösning: i) Bestäm x T Qx min x6= x T x samt de x för vilka minimum antas. ii) Bestäm minsta egenvärdet till Q samt motsvarande egenvektorer. 4. Låt A vara en symmetrisk n n-matris vars största egenvärde är λ och näst största egenvärde är λ. Visa att λ = max x6= x T Ax x T x λ = minλ (y), där λ (y) = x T Ax max x6=, x y x T x Tröghetsindex & tröghetslagen Ännu precisare uttalanden är möjliga: Anta att i någon bas. Definiera q (x) =d x + d x +... + d n x n σ + = antalet positiva tal bland d,d,..., d n σ = antalet negativa tal bland d,d,..., d n (n σ + σ = antalet nollor bland d,d,..., d n.) Tröghetslagen för kvadratiska former säger att antalen σ + och σ är desamma oavsett hur diagonaliseringen gått till Obs! Själva talen d,d,..., d n blir i allmänhet olika vid olika diagonaliseringar det är deras tecken som (löst uttryckt) håller sig konstant i ovannämnda mening. En ekvivalent karaktärisering av talen σ + och σ, som visar att de enbart beror på den kvadratiska formen q i sig och inte på basvalet: σ + = den största möjliga dimensionen av ett underrum på vilket q är positivt definit σ = den största möjliga dimensionen av ett underrum på vilket q är negativt definit T.ex. är q (x, y, z) =x +y 3z positivt definit på det -dimensionella underrmmet z =, men inte på hela R 3, därför σ + =. Den är negativt definit på underrummet x = y =, men inte på något större underrum, därför σ =. Definition 7 Talparet kallas tröghetsindex för q. (σ +, σ ) 5. Bestäm tröghetsindex för den kvadratiska formen (i 6 variabler) ux + vy + wz Observera att ux = 4 (u + x) (u x) 4 och analogt för övriga två termer. u ± x, v ± y och w ± z kan tas som nya variabler (ty u, x, v, y, w, z kan entydigt lösas ut ur dem). Med dem är formen diagonaliserad och (σ +, σ )=(3, 3) 6
Spektrumklyvning Iochmedattd k :na=egenvärdena λ k till Q i en möjlig diagonalisering med ON-bas av egenvektorer till Q så kan kvadratkomplettering/gausselimination utnyttjas till att Bestämma antalet egenvärden iettgivetintervall(a, b): Förutsätt att inga egenvärden råkar vara = a eller b. Kvadratkomplettera Q ai och räkna antalet kvadrater med + = antalet egenvärden >a Gör på samma sätt med Q bi. Differensen mellan de erhållna antalen ger antalet egenvärden i intervallet (a, b). Kvadratkompletteringen kan göras effektivt med Gausselimination. 6. Visa att alla egenvärden till n n-matrisen (nollor överallt utom i och strax under och över diagonalen)........................... är negativa, genom att betrakta motsvarande kvadratisk form. Matrisen svarar mot den kvadratiska formen x x... x n +x x +x x 3 +... +x n x n Försök att skriva om som en summa av kvadrater: x (x x ) (x x 3 ) (x 3 x 4 )... (x n x n ) x n 7. För vilka värden på k är alla egenvärden till matrisen nedan positiva? 4k 6 4k 6 4k 9 Tips: Kvadratkomplettera uttrycket för den kvadratiska form matrisen representerar. x +4xy +4xz + +(4k ) y +( 8k) yz +9z = (x + y + z) + +4 (k ) y +7z +8( k) yz 4(k ) y +7z +8( k) yz = 4(k ) y yz +7z = 4(k ) (y z) +( 4k) z Observera dock att koefficienterna framför kvadraterna, som vi är intresserade utav också fås som pivotelementen (diagonalelementen) efter genomförd Gausselimination på matrisen, utan rad- eller kolonnbyten : 4k 6 4k 6 4k 9 4k 4 4 4k 4 4k 7 addera andra raden till den tredje 4k 4 4 4k 4k Matrisens egenvärden är all positiva om och endast om den kvadratiska formen är positvt definit, vilken den är då och endast då koeffcienterna framför kvadraterna efter kvadratkompletteringen är allihop > : > 4k 4 > 4k > <k< 4 och likhet kan inträffa endast när alla x j =. Alltså är den kvadratiska formen negativt definit, vilket betyder att alla egenvärden är negativa. 7
8. För vilka reella värden på a är samtliga egenvärden till C nedan? C = 3 4 8 4 6 8 a Obs. att matrisen C är symmetrisk. Kvadratkomplettera den kvadratiska formen hörande till C I och se efter hur många kvadrater som har ickenegativa koefficienter enligt tröghetslagen är detta också lika med antalet ickenegativa egenvärden till C I (räknade med multiplicitet), d.v.s. antalet egenvärden till C : 4 8 4 5 8 a 4 8 7 4 4 a 33 4 8 7 4 a 6 Samtliga diagonalelement är icke-negativa om och endast om a 6, och det är då alla egenvärden till C I är ickenegativa. 9. Låt A = Avgör med ovan skissade metod hur många egenvärden A har i intervallet [.5,.5] Kontrollera med Matlab.. Låt a vara ett givet reellt tal och sätt a...... A = 3... 4......... n Visa att den symmetriska matrisen A har högst ett negativt egenvärde. Visa också att för stora värden på n har A precis ett negativt egenvärde. (Betrakta den till A hörande kvadratiska formen.) Den kvadratiska formen är ax +x x +x x 3 +... +x x n +x +3x 3 +... + nx n Para ihop kvadraterna på andra raden med var sin dubbla produkt och kvadratkomplettera, så kan summan skrivas Efter variabelbytet ax + ³ + x x +x + ³ +3 x x 3 +x 3 + 3 +... + ³ +n x x n +x n n = ax + ³ + x + x x + ³ +3 x 3 + x 3 3 x + +... + ³ +n x n + x n n x + µ = a 3... x n ³ + x + x + ³ +3 x 3 + x + 3 +... + ³ +n x n + x n bx = x bx = x x bx 3 = x 3 3 x... bx n = x n n x har vi alltså en summa av kvadrater, där minst n st. har positiva koefficienter. Enligt tröghetslagen hade vi fått lika många positiva/negativa koefficienter, om vi diagonaliserat med egenvektorer. Då skulle koefficienterna varit = egenvärdena. Alltså: A har minst n positiva egenvärden, högst negativt. För tillräckligt stora n blir a 3... n < För dem har vi exakt negativt egenvärde, resten positiva. 8
. Låta varaettreellttal>. och n ett positivt heltal. Vad kan du säga om egenvärdena till... 4... A n =...... n... a genom att kvadratkomplettera den kvadratiska form på R n som definieras av A n? Kontrollera några specialfall med dator!. Låt A = (a) Avgör om A är diagonaliserbar. (b) Bestäm summan av alla egenvärden till A. (c) Är ett egenvärde till A? (d) Är någon av vektorerna u =(,,, ) eller v =(,,, ) egenvektor till A? Vad är i så fall motsvarande egenvärde? (e) Hur många positiva och hur många negativa egenvärden har matrisen? a) Ja, eftersom A är symmetrisk. b) Summan av egenvärdena är = summan av diagonalelementen (gäller alla, inte enbart symmetriska, matriser) =+++=6 c) Produkten av egenvärdena är lika med matrisens determinant (återigen: gäller alla matriser). Alltså är ett egenvärde om och endast om determinanten är =. Determinanten är (subtrahera första raden från den andra) = = = = addera multiplar av tredje raden 3 5 = = = ( 3 5) = 6 Svar : Nej. d) = Au 6= λu för något tal λ = Av = 4v 4 4 4 4 Alltså är u inte någon egenvektor, medan v är en egenvektor med egenvärdet 4. e) Undersök pivotelementen vid Gausselimination: 5/ 3/ 3/ 5/ 5/ 3/ 6/ Tre positiva (, 5/ och 8/5) och ett negativt ( ) pivotelement innebär att matrisen har tre positiva och ett negativt egenvärde, förutsatt att man räknar med multiplicitet. 9
Andragradskurvor En kurva i planet som, med lämpligt val av ON-koordinatsystem, kan beskrivas av en ekvation av formen x a + y b =, a,b konstanter, kallas ellips x a y b =, a,b konstanter, kallas hyperbel y = ax,akonstant, kallas parabel (Persson&Böiers: Analys i flera variabler, sid.9-.) Gemensamt namn för dessa är andragradskurvor: uttrycken består av termer av grad i x och y. Men hur ser t.ex. kurvan x 4xy +5y =5? Den borde också klassificeras som andragradskurva.) 3. Skriv vänsterledet som en matrisprodukt: x 4xy +5y = x y µ µ a b x b c y µ a b Kalla för A b c (Genom att kräva att A är symmetrisk, blir A entydigt bestämd, annars finns oändligt många möjligheter.) Vad skall a, b, c. vara? Svar: µ A = 5 4. Vad händer nu om vi gör ett ortogonalt koordinatbyte (vrider och/eller speglar koordinataxlarna): µ µ x x = P y y P ortogonal matris Matrisprodukten i högerledet ovan övergår då i µ bx by ba bx =...bx by +...bxby +...by medenviss -matris b A Hur får man A b ur matriserna A b och P? Svar: ba = P T AP 5. Kan P väljas så att bxby-termen försvinner? Tänk på spektralsatsen! Svar: Låt en ON-bas av egenvektorer till A utgöra kolonnerna i P. (Möjligt, enligt spektralsatsen för reella symmetriska matriser.) Då är P T = P µ P T AP = P λ AP = λ λ, λ = egenvärdena till A 6. Genomför räkningarna i det konkreta exemplet. Hurservårkurvaut? Svar: Egenvektorer är (notera: sinsemellan ortogonala!): (, ) med egenvärde 6 (, ) med egenvärde Tar vi dessa riktningar till nya koordinataxlar, så antar ekvationen formen 6bx + by =5 d.v.s vi har en ellips med halvaxlar p 5/6 och 5 :.5 - - -.5-7. Wahde, kap.5.7, övn. 53-534 a)-d) (Maskin för beräkningarna rekommenderas.) 8. Låt a> och M = (x, y) :x + y + xy a ª Beräkna förhållandet mellan radierna för den minsta cirkel som innehåller hela M och den största cirkel som är helt innehållen i M. µ / / Lösningsskiss: Diagonalisering ger att M är det inre av en ellips med medelpunkt i origo. Åskådligt är det klart att de omtalade cirklarna måste ha sin medelpunkt i ellipsens medelpunkt. Det sökta förhållandet är förhållandet mellan ellipsens halvaxlar, som är = 3.
Andragradsytor Låt q vara en kvadratisk form R 3 R och c en fix konstant. För ett givet val av origo betraktar vi mängden av punkter P vars ortsvektorer u = OP uppfyller q (u) =c Enligt diagonaliseringssatsen finns en ON-bas ˆx, ŷ, ẑ sådan att ekvationen blir av formen Följande fall kan inträffa: λ ˆx + λ ŷ + λ 3 ẑ = c Se länkarna på sidan http://mathworld.wolfram.com/quadraticsurface.html där man kan rotera figurerna med musen. λ, λ, λ 3 > λ, λ >, λ 3 < λ 3 = c> : ellipsoid ˆx-, ŷ-, ẑ-axlarna kallas ellipsoidens huvudaxlar c = : en punkt, (,, ) c< : mängden är tom c> : enmantlad hyperboloid (Tänk på att skärningarna med planen ˆx =samt ˆx = är hyperbler.) Om λ = λ är ytan rotationssymmetrisk kring ˆx 3 -axeln och kallas därför rotationshyperboloid c = : kon c< : tvåmantlad hyperboloid (Hyperbelgrenarna är nu vridna 9 jämfört med fallet c>.) Övriga fall med alla λ j 6=, återföres på föregående genom multiplikation med. Ytan genereras av en andragradskurva som translateras parallellt med ˆx 3 -axeln. samt några urartningsfall. Allmänna andragradskurvor En helt allmän andragradskurva i planet är mängden av punkter, vars koordinater (x, y) uppfyller en ekvation av typen Ax + By + Cxy + Dx + Ey + F =, A, B, C, D, E givna konstanter Genom att translatera koordinatsystemet, d.v.s. införa nya koordinater (u, v) genom u = x x v = y y med lämpligt valda (x,y ), så kan de lineära termerna elimineras: A (u + x ) ++B (v + y ) + +C (u + x )(v + y )+ +D (u + x )+E(v + y )+F = Au + Buv + Cv + +(Ax + Cy ) u +(Cx +By ) v + +Ax + By + Cx y Allmänna andragradsytor Definieras av en ekvation av formen a jk x j y k + j,k= b i x i = c i= Efter ett ortonormerat koordinatbyte x = Tˆx som överför q på diagonalform fås λ iˆx i + i= ˆbiˆx i = c i= Om alla egenvärden λ i 6=, kan man kvadratkomplettera: à λ i ˆx i + ˆb! i = c λ i i= Efter förflyttning av origo till punkten à ˆb, ˆb, ˆb! 3 λ λ λ 3 har vi alltså samma typ av ekvation som ovan. Om däremot något egenvärde är =, t.ex. λ 3 =fås λ ˆx + λ ˆx + ˆb 3ˆx 3 = c, ˆb3 6= samt några urartningsfall.
9. Beskriv den yta i R 3, som definieras av ekvationen 3x +3y +z +xz +yz =? För att spara tid, får du egenvektorer till den relevanta matrisen (Vilken är den? Hur kontrollerar du att informationen är riktig?) (,, ) med egenvärdet 4 (,, ) med egenvärdet 3 (,, ) med egenvärdet Lösning : Matrisen som svarar mot den kvadratiska formen i vänsterledet är 3 3 Det är den som har ovannämnda egenvektorer, t.ex. 3 3 =4 Som förväntat från spektralsatsen, är egenvektorerna sinsemellan ortogonala: (,, ) (,, ) =, etc. Väljer vi ett koordinatsystem med samma origo, men med de nya ˆx-, ŷ-, ẑ-axlarna pekandes i ovannämnda egenvektorers riktning, så antar ekvationen formen 3. Beskriv den yta i R 3 som definieras av ekvationen xy +xz +yz = Den relevanta matrisen har egenvektorerna (,, ) med egenvärdet (,, ) och (,, ) med egenvärdet Matrisen svarande mot den kvadratiska formen i vänsterledet är Resonemang som i föregående. Efter införande av nya koordinataxlar som pekar i egenvektorernas riktning ser ekvationen ut så här: ˆx ŷ ẑ = En s.k. tvåmantlad rotationshyperboloid. Fås genom att rotera hyperbeln ˆx ŷ =kring ˆxaxeln. (I och med att ŷ och ẑ förekommer enbart i kombinationen ŷ +ẑ =(avståndet till ˆx-axeln) så blir ytan rotationssymmetrisk kring ˆx-axeln. Hade vi haft olika positiva koefficienter framför ŷ resp. ẑ, hade vi sagt: tvåmantlad elliptisk hyperboloid.) 4ˆx +3ŷ +ẑ = 4-5 En ellipsoid med halvaxlar /, / 3 resp. : -.5.5-4 -.5 5 4 - -4 -.5.5 -.5.5 -.5
3. Bestäm typ och symmetriaxlar för ytan Vänsterledet kan skrivas x + yz = x + 4 (y + z) (y z) 4 Med kvadratkomplettering går det alltid att avgöra ytans typ, däremot inte, i allmänhet, symmetriaxlarnas riktningar. Men här är det så enkelt att basbytet ˆx ŷ = x y ẑ z är ortogonalt, om än ej normerat. För normering dividera rader och 3 med. Obs. att matrisen är inversen (och alltså efter normering: transponatet) till den matris som innehåller de nya basvektorerna som kolonner. De nya axlarna ˆx, ŷ, ẑ har alltså riktningarna 34. Låt A =(a jk )=matrisen för ortogonal projektion på ett plan Π genom origo i R 3. Karaktärisera ytan Låt 3X a jk x j x k = j,k= e, e = två sinsemellan ortogonala vektorer som spänner upp Π e 3 = enhetsnormal till Π Då är {e, e, e 3} en ON-bas av egenvektorer till projektionsmatrisen A. Egenvärdena är, resp.. I denna bas antar ytans ekvation formen bx + by = d.v.s. vi har en cylinder med radie och planets normallinje genom origo som axel. (,, ) (,, ) (,, ) Ytan är en enmantlad hyperboloid. 3. Bestäm typ och symmetriaxlar för x +xy +xz = har egenvektorerna (,, ) med egenvärde (,, ) med egenvärde (,, ) med egenvärde Alltså en hyperbolisk cylinder. 33. Wahde, kap.5.7, övn. 53-534 e)-i) (Dator rekommenderas.) 3
35. Visa att ekvationen 7x +7y +5z =36xy i ett rätvinkligt koordinatsystem representerar en kon och beräkna konens toppvinkel. Räknehjälp (då man i praktiska fall skulle tillgripa en dator i ett sådant problem) : En av (,, ), (,, ), (,, ) är egenvektor till den matris som man skulle kunna räkna med här du får dock själv avgöra vilken. Diagonalisera den kvadratiska formen q (x, y, z) =7x +7y +5z 36xy som har matrisen 8 7 7 8 5 och 8 7 7 8 5 s s t = 5s 5s 5t Alltså: Om vi vrider koordinataxlarna (origo fast) till ett nytt ON bxbybz-system, så att bz-axeln pekar i riktning (,, ), så ser ekvationen ut = 5bx +5by bz r 5 p bz = bx + by vilket är ekvationen för en kon med toppvinkel r 5 arctan med karaktäristiskt polynom p (λ) =λ 3 39λ +75λ +6875 Iochmedatt 8 7 7 8 5 = = så är (,, ) en egenvektor med egenvärde λ =. Det karaktäristiska polynomet kan faktoriseras : λ 3 39λ +75λ +6875 = (λ +) λ 5λ +65 = = (λ +)(λ 5) Det andra nollstället är dubbelt, men det måste ändå finnas ett helt plan av egenvektorer, eftersom matrisen är symmetrisk och de matriserna har alltid tillräckligt många egenvektorer för en bas. Vidare vet vi att egenvektorer till symmetriska matriser hörande till olika egenvärden är ortogonala. Alltså: de övriga egenvektorerna de med 5 som egenvärde är de som är ortogonala mot (,, ). Kontroll: (x, y, z) (,, ) x + y = z = godtycklig = t y = godtycklig = s x = s 4
36. Betrakta en enmantlad hyperboloid H x a + y b z c = Visa att det genom varje punkt på H går två olika räta linjer som helt ligger i H. (En illustration till detta resultat finns på http://www.amherst.edu/~amcastro/ MathMedia/galleries/Surfaces/Hyperb.html Tips (för att förenkla räkningarna): Det är ingen inskränkning att anta att a = b = c =. Varför? Vi skall visa att till varje (x,y,z ) som uppfyller hyperboloidens ekvation, finns två icke-parallella riktningar (α, β, γ) sådana att alla punkter (x, y, z) av formen x = x + tα y = y + tβ z = z + tγ, t R uppfyller hyperboloidens ekvation. (M.a.o. handlar det här om att stoppa in räta linjens ekvation i hyperboloidens ekvation och se att det går att välja riktningsvektorn (α, β, γ) så att ekvationen blir uppfylld för alla t.) Att det går bra att sätta a = b = c =följer av att de räta linjerna får ekvationer av samma form, om vi gör koordinatbytet x = x/a y = y/b z = z/c Kan minska skrivarbetet genom att skriva räta linjens och hyperboloidens ekvationer på matrisform x = x + tn med n = α β γ x T Hx = med H = Sätter in den första i den andra: (x + tn) T H (x + tn) = x T Hx + tn T Hx + x T Htn+tn T Htn = tx T Hn + t n T Hn = Det här gäller för alla t om och endast om ½ x T Hn = n T Hn = x + y z = x α + y β z γ = α + β γ = Kan anta att γ =. x + y z = x α + y β = z α + β = (α, β) bildar vinkeln arccos ±p x + y p x + y (ett av tecknen gäller) Iochmedatt med (x,y ) < ±p x + y p < x + y så finns exakt två riktningar (α, β) som uppfyller detta. 37. Betrakta en tvåmantlad hyperboloid H x a + y b z c = Visa att en sådan aldrig innehåller tre olika punkter på en linje. Om hyperboloiden innehåller tre olika punkter på en rät linje, så måste den innehålla hela linjen. Detta eftersom (x + tn) T H (x + tn) = är en andragradsekvation i t, ochfler än två rötter finns endast om de båda leden är lika för alla t. Så det räcker att övertyga sig om hyperboloiden inte innehåller någon rät linje i sin helhet. Detta är väl åskådligt klart, men vi kan också se det ur räkningarna som i föregående fråga. Som där kommer man till Men här är x + y z = x α + y β = z α + β = (α, β) bildar vinkeln arccos ±p x + y p + med (x x + y,y ) ± p x + y p + x + y > och därmed finns ingen lösning. 5
Samtidig diagonalisering Givet två kvadratiska former i n variabler, med matriser K och M, så är det ibland önskvärt att kunna diagonalisera dem samtidigt, d.v.s. hitta inverterbar S så att S T KS och S T MS båda är diagonala I ett viktigt specialfall är detta alltid möjligt: om den ena av dem är positivt definit. Visar sig fungera som vanlig diagonalisering, fast med den positivt definita matrisen, säg att den är M, i stället för enhetsmatrisen I : Bestäm nollställena till det (K λm) För varje nollställe λ j : Bestäm icke-trivial lösning s j till (K λ j M) s j = s j :na bildar kolonnerna i S Matrisnormer För x =(x,x,..., x n ), låt som vanligt q x = x + x +... + x n Givet en matris A, låt kak beteckna det minsta talet (om det nu finns ett sådant) med egenskapen att Ax kak x,för alla kolonnvektorer x 38. För vilka matriser A är kak =? 39. Vad är kik då I = enhetsmatrisen (identitetsmatrisen)? 4. Vad är kak då A = a a... a n, d.v.s. en n-matris? 4. Är det säkert att talet kak är väldefinierat för alla matriser A? Kan det inte tänkas att (a) inget tal är tillräckligt stort för att duga? (b) det inte finns något minsta tal, d.v.s. att t.ex. Ax ( + ε) x för alla x och alla ε >, men Ax > x för något x? 4. Visa att q Ax kak =max = λ max (A x6= x T A) där λ max A T A betecknar största egenvärdet till A T A. 43. Visa att, om A är inverterbar, så är A = p λmin (A T A) 44. Visa att (vänsterledet är det s.k. konditionstalet, vars betydelse avhandlas på nästa sida) kak A för alla A med likhet då och endast då A är en skalär multipel av en ortogonal matris. 6
Störningsanalys och konditionstal Definition 8 Talet 45. Betrakta det linjära ekvationssystemet Ax = b där A är en n n matris, x och b kolonnvektorer En naturlig fråga i sammanhanget är: Om man ändrar högerledet b litet grann, kommer då också lösningen x att ändras litet eller kan den bli helt annorlunda? Säg nu att b ändras till b + δb och x till x + δx (δb och δx kolonnvektorer som b och x). Ett sätt att precisera frågan är då följande: Är kvoten relativ ändring i x relativ ändring i b = δx / x δb / b liten eller stor? Visa att (om vi antar att inversen existerar) δx / x δb / b kak A 46. Som föregående, men i stället för att ändra högerledet ändrar vi litet grann på koefficienterna imatrisena : matrisen ändras till A + δa, och lösningen ändras då till x + δx. I analogi med ovan betraktar vi kvoten Visa att denna är δx / x kδak / kak. kak A Med. menas att man får approximera på lämpligt sätt. kak A kallas konditionstalet för matrisen A och är alltså ett mått på hur känsligt ekvationssystemet i värsta fall kan vara för störningar i indata. Allmän tumregel vid numeriska beräkningar: akta dig för matriser med stort konditionstal! Andra normer och konditionstal Egentligen kan man tänka sig många andra sätt att mäta vektorers storlek, t.ex. kxk = x + x +... + x n kxk =max( x, x,..., x n ) Dessa två s.k. vektornormer är, liksom den vanliga s.k. euklidiska normen kxk = ³ x + x +... + x n / specialfall av kxk p =( x p + x p +... + x n p ) /p, p > (Om p<, gäller inte längre triangelolikheten.) Definitionen av matrisnorm är meningsfull även då vi byter ut... motenannanvektornorm. Vi kan definiera och på liknande sätt använda t.ex. kaxk kak =max x6= kxk kaxk kak =max x6= kxk 47. Hur kan man ur elementen i A beräkna kak? 48. Som föregående, för kak. Varje norm ger upphov till ett konditionstal. När vi använder den euklidiska -normen får vi norm--konditionstalet. MATLAB: cond. 7
Kovariansmatriser 49. Har man att göra med n st. stokastiska variabler X,X,..., X n, kan det vara intressant att betrakta den s.k. kovariansmatris C där på rad r och kolonn k står kovariansen mellan X r och X k. Kovariansen av två stokastiska variabler X och Y fås som Cov [X, Y ]=E [(X E [X]) (Y E [Y ])] där E [X] betecknar väntevärdet av X. att (a) Förklara varför C är symmetrisk. (b) Visaatt,omviinför X x =., m = X n E [X ]. E [X n ] Observera och tolkar E [en matris] som att vi tar väntevärdet av varje element, att vi kan skriva C = E h(x i m)(x m) T (c) E kan sägas vara en linjär operator vad menas med det? (d) Tillordningen (X, Y ) 7 Cov [X, Y ] å sin sida fungerar nästan som en skalärprodukt vad menas med det? (e) Visa att C är positivt semidefinit, förslagsvis genom att betrakta Cov a j X j, a j X j j= j= för olika talvektorer (a,a,..., a n ) samt utnyttja skalärproduktegenskaperna hos Cov (f) C är positivt definit, såvida inte någon av de stokastiska variablerna är helt beroende av de övriga, d.v.s. såvida inte X k = X j6=k c j X j + d för något k och några konstanter c j och d. Förklara! a) Helt enkelt därför att multiplikation är kommutativ: (X E [X]) (Y E [Y ]) = (Y E [Y ]) (X E [X]) så Cov[X, Y ]=Cov [Y,X] b) Elementet på rad j, kolonn k i (x m)(x m) T är (X j E [X j ]) (X k E [X k ]) och väntevärdet av det är just Cov [X j,x k ] c) För alla stokastiska variabler X och Y samt tal a, gäller E [X + Y ] = E [X]+E[Y] E [ax] = ae [X] d) Jfr. med [A, sid.43, Def.9.] : Cov[X, Y ] = Cov [Y,X] Cov [X + X,Y] = Cov [X,Y]+Cov [X,Y] Cov [ax, Y ] = acov [X, Y ] följer ur lineariteten hos E. Cov [X, X] är en konsekvens av att väntevärdet av en ickenegativ stokastisk variabel, här (X E [X]), inte kan bli negativt. Det enda som skiljer från skalärprodukt är att Cov [X, X] =; X = utan Cov [X, X] = variansen hos X =, d.v.s. X är i själva verket en deterministisk storhet. e) Vi ska visa att a T Ca d.v.s. X C jk a j a k j,k där C jk = Cov[X j,x k ] för alla a = Vi har att Cov a j X j, a j X j = = j= j= j= " # a j Cov X j, a k X k = j= a j V.S.B. n X k= k= a k Cov[X j,x k ] 8
f) Likhet i a T Ca får vi endast om Cov a j X j, a j X j = j= j= a j X j = b = konstant j= Härärdåantingenallaa j =, eller om, säg a k 6=, då X k = b a k j6=k a j a k X j vilket är en likhet av den anförda typen. 5. (Från Bishop: Neural Networks...) Givet en positiv definit kovariansmatris C, kallar man q 4 (x, y) = (x y) T C (x y) (efter en indisk statistiker) Mahalanobis-avståndet från x till y. Att man använder ordet avstånd måste betyda att den här storheten uppför sig likt vårt vanliga avståndsbegrepp, framför allt att den s.k. triangelolikheten gäller 4 (x, z) 4 (x, y)+4 (y, z) Men varför skulle den gälla? Och till att börja med: för att det hela ska vara väldefinierat, får inte uttrycket under rottecknet bli <. Är det klart att så är fallet? Att (x y) T C (x y) följer av att C är positivt definit. Obs. att det som är givet är att C är positivt definit, men det medför att även C är positivt definit, enl. föregående fråga. Bildningen hx, yi = x T C y fungerar som skalärprodukt lika väl som x T y iden meningen att hx, yi = hy, xi hx + x, yi = hx, yi + hx, yi hcx, yi = c hx, yi hx, xi och det är endast dessa egenskaper hos x T y som utnyttjas när Spanne bevisar triangelolikheten på sid.6-7. (Jfr. Andersson, kap.9.7-9.8) 9
5. (Forts. på föreg.) Enl. Bishop är nivåkurvorna (m konstant, x variabel här) (x m) T C (x m) =konstant hyperellipsoider med medelpunkt i m och huvudaxlar vars riktningar ges av egenvektorerna till C. Hyperellipsoidens halvaxlar förhåller sig som p λ j, där λ j,j=,,...,n, är egenvärdena till C. Kanduverifiera detta? Vi inför nya koordinater y enl. x m = Sy där S = matris med C:s egenvektorer som kolonner. IochmedattC är symmetrisk, så kan vi anta att S är ortogonal. (x m) T C (x m) = (Sy) T C Sy = = y T S C Sy Obs. nu att C har samma egenvektorer som C, fast med /λ j som egenvärden. Därför och S CS = diag (λ, λ,..., λ n ) men µ S C S = diag,,..., λ λ λ n = y T S C Sy yk λ k k= I dimensioner är y + y = c = konst. λ λ en ellips med halvaxlar cλ resp. cλ. I 3 dimensioner är y + y + y3 = c = konst. λ λ λ 3 en ellipsoid med halvaxlar cλ, cλ resp. cλ 3. Motsvarigheten i flera dimensioner kallar man hyperellipsoider.
5. Läs Persson&Böiers, Analys i flera variabler, kap.8.5 53. I den matematiska statistiken arbetar man med Fouriertransformer av frekvensfunktioner, fast de kallas där karaktäristiska funktioner. Här kommer en slags Fouriertransformintegral, karaktäristiska funktionen av en kvadratisk form K i n st. normalfördelade stokastiska variabler: Z (π) n/ e jvx T Kx e (x m)t C (x m) dx...dx n det C R n C och K symmetriska n n-matris, C positivt definit (de stokastiska variablernas kovariansmatris), j = komplexa enheten, j =, v= godtyckligt reellt tal, motsvarar Fouriertransformens ω. Antag nu att det går att räkna med j:et som med ett reellt tal och visa ovanstående är = p exp µ ³ mt C I (I jvck) m det (I jvck) Kvadratkomplettera i exponenten: (x m)t C (x m)+jvx T Kx = xt C x + m T C x mt C m + jvx T Kx = = xt C jvk x + x T C m mt C m = Inför nu a så att detta blir = (x a)t C jvk (x a)+ + at C jvk a mt C m För det krävs att x T C jvk a = x T C m C jvk a = C m C (I jvck) a = C m a = (I jvck) m Då blir at C jvk a = at C (I jvck) a = Vet att för positivt definita A (Persson&Böiers) Z e xt Ax dx R n = (π)n/ det A [variabelbyte] Z R n e (x m) Vidare är allmänt T C (x m) dx = det C = det C (π) n/ det C Vårt givna uttryck är (den exponentialfaktor som inte innehåller x kan brytas ut ur integralen): e mt C (I (I jvck) )m Z (π) n/ e (x a)t (C jvk)(x a) dx det C Den andra faktorn är = (π) n/ (π) n/ p det C det (C jvk) p det (C (C jvk)) = och = mt (I jvck) C m = = ³ C (I jvck) m T m = = C m ³ T (I jvck) m = = mt C (I jvck) m at C jvk a mt C m = ³ mt C C (I jvck) m = = mt C ³ I (I jvck) m = p det (I jvck) We also point out that the problems at the end of each chapter, except the first, are exercises for the serious reader and, as for the 958 edition, nosolutionsmanualisavailable. Wilbur B.Davenport, Jr. & William Root i förordet till 987 års återtryck av deras An Introduction to the Theory of Random Signals and Noise