School of Science and Technology SE-701 8 Örebro, Sweden Algebrans fundamentalsats Ett linjäralgebraiskt bevis Andreas Thore
Örebro Universitet Akademin för naturvetenskap och teknik Matematik C, 61 75 poäng Algebrans fundamentalsats Ett linjäralgebraiskt bevis Andreas Thore Oktober 008 ÖU Nat Ex Mat01C 01 08 Handledare: Holger Schellwat Examensarbete, 0p Matematik, C nivå, 61 75p 1
Innehåll 1 Förord Förberedelser 3 3 Beviset 6 1 Förord Denna uppsats bygger uteslutande på ett bevis av algebrans fundamentalsats publicerat 003 i tidskriften American Mathematical Monthly (se [1]). Bevisets författare är Harm Derksen, som vid tiden för dess publicering var adjunkt vid University of Michigan i Ann Arbor, Michigan, USA. 1 Uppgiften har bestått i att till beviset addera ett antal slutledningssteg som Derksen låtit bli att redovisa, och att korrigera några smärre felaktigheter. Dessutom har två lemman som ursprungligen inte fanns med i beviset tillförts, lemma 3 och 4, ämnade att kasta ljus över slutsatser dragna i lemma 7 och 8. Algebrans fundamentalsats säger att varje komplex polynomekvation p(x) 0 av grad n 1 har minst en komplex rot. En ekvivalent formulering är att varje kvadratisk matris med komplexa element har en egenvektor, och detta visar Derksen genom att sluta sig till det något starkare resultatet att varje mängd kommuterande kvadratiska matriser med komplexa element har en gemensam egenvektor. Bortsett från satsen om mellanliggande värden som det refereras till i lemma 1 och som springer ur den matematiska analysen, ligger beviset helt inom ramen för linjär algebra. Till skillnad från de flesta andra algebraiska bevis av algebrans fundamentalsats krävs här varken Galoisteori eller symmetriska polynom. Notera att det nedan inte görs någon åtskillnad mellan en linjär avbildning och dess standardmatris, så de avbildningar som förekommer skall ses som multiplikation mellan deras respektive standardmatriser och de vektorer som avses bli avbildade. 1 Se http://www.math.lsa.umich.edu/ hderksen/cv/cv.html
Förberedelser För beviset behövs följande elementära egenskaper hos reella och komplexa tal. Lemma 1. Varje polynom av udda grad med reella koefficienter har ett reellt nollställe. Bevis.Det är tillräckligt att visa att ett moniskt polynom P (x) x n + a 1 x n 1 + + a n, med a 1,..., a n R och n udda, har ett reellt nollställe (ett moniskt polynom är ett polynom där koefficienten för potensfunktionen med högst grad är 1). Sätt x (n a i ) 1/i, där (n a i ) 1/i är det största talet i mängden {n a 1, (n a ) 1/, (n a 3 ) 1/3,..., (n a n ) 1/n } och a i 0. Då gäller att x (n a i ) 1/i x i n a i a i x i 1 n. Vidare gäller att ( P (x) x n 1 + a 1 x + a x + + a ) n x n och att ( 1 + a 1 x + a x + + a ) ( n x n 1 a 1 x a x a ) ( n x n 1 n ) 1 n, så tillsammans med det faktum att n är udda så att x n ändrar tecken när x gör det, fås att P (x) > 0 då x (n a i ) 1/i och P (x) < 0 då x (n a i ) 1/i. Enligt satsen om mellanliggande värden finns ett reellt tal λ i intervallet [ (n a i ) 1/i, (n a i ) 1/i ] sådant att P (λ) 0, vilket därmed visar lemmat. Lemma. Varje komplext tal har en kvadratrot. Bevis. Betrakta z : α + βi, där α och β är reella. Om β 0, sätt w : (γ + α)/ + i (γ α)/ och γ : α + β. Då gäller att vilket ger γ α + β β γ α, ( ) γ + α γ α w + i γ + α + i( γ + α)( γ α) ( γ α ) α + i( γ + α)( γ α) α + i (γ + α)(γ α) α + i γ α α + βi. 3
Om β < 0, sätt istället w : (γ + α)/ i (γ α)/, men låt γ vara definierat som ovan. Då är vilket ger β γ α, ( ) γ + α γ α w i α i γ α α + βi. Alltså har z en kvadratrot både då β 0 och då β < 0. Lemma 3. Låt V : C { v (a + bi) : a, b R}, och definiera addition och multiplikation med skalär på följande vis: + : V V V ; (a + bi, c + di) (a + bi) + (c + di) (a + c) + (b + d)i : R V V ; (λ, a + bi) λ(a + bi) λa + λbi Då är V ett -dimensionellt reellt vektorrum. Bevis. Vektorerna i V har följande egenskaper: Eftersom (a + c) + (b + d)i V, ordnar operatorn + till varje vektorpar ( u, v) V en tredje vektor u + v V. Operationen addition är alltså definierad på V. Eftersom λa + λbi V (där λ R), kan varje vektor u V multipliceras med ett godtyckligt reellt tal λ, så att λ u V. Således är även operationen multiplikation med skalär definierad på V. Låt nu λ, µ R och u, v, w V vara godtyckliga. Då gäller att (i) u + v v + u, eftersom u + v (a + bi) + (c + di) (a + c) + (b + d)i (c + a) + (d + b)i v + u (c + di) + (a + bi) (c + a) + (d + b)i (ii) ( u + v) + w u + ( v + w), eftersom ( u+ v)+ w ((a+bi)+(c+di))+(e+f i) ((a+c)+(b+d)i)+(e+f i) ((a + c) + e) + ((b + d) + f)i (a + c + e) + (b + d + f)i u+( v+ w) (a+bi)+((c+di)+(e+f i)) (a+bi)+((c+e)+(d+f)i) (a + (c + e)) + (b + (d + f))i (a + c + e) + (b + d + f)i (iii) Det existerar ett element 0 V sådant att u + 0 u. 4
Bevis. Sätt c : 0, d : 0 och v c + di. Då är u + v (a + bi) + (c + di) (a + bi) + (0 + 0i) (a + 0) + (b + 0)i (a + bi) (iv) Det existerar ett element u V sådant att u + ( u) 0. Bevis. u (a + bi) V a, b R a, b R x : ( a bi) V. Då är u + x (a + bi) + ( a bi) (a a) + (b b)i 0, så att x u (v) λ(µ u) (λµ) u, eftersom λ(µ u) λ(µ(a + bi)) λ(µa + µbi) λµa + λµbi (λµ)(a + bi) (vi) 1 u u. Bevis. Sätt λ : 1. Då är λ u 1 u 1(a + bi) 1a + 1bi a + bi u (vii) λ( u + v) λ u + λ v, eftersom λ( u + v) λ((a + bi) + (c + di)) λ((a + c) + (b + d)i) λ(a + c) + λ(b + d)i λ u + λ v λ(a + bi) + λ(c + di) (λa + λbi) + (λc + λdi) (λa + λc) + (λb + λd)i λ(a + c) + λ(b + d)i (viii) (λ + µ) u λ u + µ u, eftersom (λ + µ) u (λ + µ)(a + bi) (λ + µ)a + (λ + µ)bi λ u + µ u (λa + λbi) + (µa + µbi) (λa + µa) + (λb + µb)i (λ + µ)a + (λ + µ)bi Följaktligen är V ett reellt vektorrum, så det som återstår är att visa dess dimension. Vektorerna e 1 1 och e i är linjärt oberoende eftersom ekvationen λ 1 1 + λ i 0 + 0i, där λ 1, λ R, har en lösning endast då både λ 1 och λ 0. Dessutom gäller att varje vektor v V kan skrivas som 5
u a1 + bi a e 1 + b e ( e 1 och e spänner alltså tillsammans upp V ), så S { e 1, e } utgör en bas för V. Och då en bas med n vektorer spänner upp ett n-dimensionellt vektorrum, gäller att dim V. Lemma 4. Om V är ett ändligtdimensionellt vektorrum bestående av komplexa vektorer, gäller att dim R V dim C V, där V i vänsterledet betecknar V som ett reellt vektorrum och i högerledet som ett komplext vektorrum. Bevis. Eftersom varje ändligtdimensionellt komplext vektorrum är isomorft till C n för något något n Z +, kan man utan inskränkning av allmängiltigheten sätta V : C n { v (a 1 + b 1 i, a + b i,..., a n + b n i) : a k, b k R}. Låt V vara ett komplext vektorrum, d.v.s. ett vektorrum över de komplexa talen. Då utgör vektorerna e 1 (1, 0, 0,..., 0), e (0, 1, 0,..., 0),..., e n (0, 0, 0,..., 1) en bas S för V, eftersom de är linjärt oberoende och varje vektor v V kan skrivas som v (a 1 + b 1 i) e 1 + (a + b i) e + + (a n + b n i) e n, d.v.s. som en linjärkombination av e 1, e,..., e n där koordinaterna med avseende på basvektorerna är komplexa. Med n vektorer i S är dim C V n. Låt nu istället V vara ett reellt vektorrum. Då gäller för V att koordinaterna med avseende på en godtycklig bas P för V är reella. En bas för V utgörs då av vektorerna e 1 (1, 0, 0,..., 0), e 1 (i, 0, 0,..., 0), e (0, 1, 0,..., 0), e (0, i, 0,..., 0),..., e n (0, 0, 0,..., 1), e n (0, 0, 0,..., i), eftersom de är linjärt oberoende och varje vektor v V kan skrivas som v a 1 e 1 + b 1 e 1 + a e + b e + + a n e n + b n e n. Det inses därför lätt att dim R V dim C V. 3 Beviset Låt K vara en kropp, och låt d och r vara positiva heltal. Betrakta nu följande påstående: P(K, d, r): Varje mängd med r kommuterande endomorfier A 1, A,..., A r på ett n-dimensionellt vektorrum V över K, där d inte delar n, har en gemensam egenvektor. Lemma 5. Om P(K, d, 1) är sant, gäller att P(K, d, r) är sant för alla r 1. Bevis. Lemma 5 bevisas genom induktion över r. 6
P(K, d, 1) är givet. Antag att P(K, d, r 1) är sant, och låt A 1, A,..., A r vara kommuterande endomorfier på ett n-dimensionellt vektorrum V över K, där d inte delar n. Genom induktion över n kan visas att A 1, A,..., A r har en gemensam egenvektor, vilket är enkelt i det fall då n 1. Låt A k (a k ), där 1 k r. Då gäller att och med fås att vilket slutligen ger A k X λ k X (A k λ k I)X 0, det(a k λ k I) 0 a k λ k 0 λ k a k, A k X λ k X a k x a k x (a k a k ) x 0 x t, där t K och t 0. En gemensam egenvektor är därför x 1. Eftersom P(K, d, 1) är sant, har A r en egenvektor x r (så x r 0) med ett tillhörande egenvärde λ r K. Låt W : ker(a r λ r I) { x V : (A r λ r I) x 0} och Z : im(a r λ r I) { y V : (A r λ r I) x y för något x V } (observera att 0 x r W, så dim W 1). Både W och Z är slutna under A 1, A,..., A r, vilket visas nedan. Låt x W och A l {A 1, A,..., A r }. Då är (A r λ r I)(A l ) x (A r A l λ r IA l ) x (A l A r λ r A l I) x (A l A r A l λ r I) x A l (A r λ r I) x A l 0 0. Alltså är W slutet under A l (eller, ekvivalent: A l är en endomorfi på W ). Låt y Z. Då gäller att det finns en vektor x V sådan att (A r λ r I) x y. Vidare är då A l y A l (A r λ r I) x (A r λ r I)A l x, där A l x V, vilket alltså innebär att A l y Z. Således är Z slutet under A l. Låt W V, d.v.s. låt W vara ett äkta underrum i V. Då är dim W < dim V n (se [], sats 5.4.7, s. 6), och eftersom A r har en egenvektor v V (så att v W ), följer att 1 dim W n 1. Således är också 1 dim Z n 1. Eftersom dim W + dim Z dim V (se [], sats 8..3, s. 404) och d inte delar dim V, gäller att d inte delar dim W eller att d inte delar dim Z. Det står klart att A 1, A,..., A r är kommuterande endomorfier både på W och Z, 7
så antag nu att P (K, d, r) är sant för W eller Z (d.v.s. att A 1, A,..., A r har en gemensam egenvektor x i W eller Z) för alla dimensioner 1 m n 1. Eftersom dim V n och V W + Z, gäller i sådana fall att P (K, d, r) är sant för n, så att x V är en gemensam egenvektor till A 1, A,..., A r. Och då det ovan visats att P (K, d, r) är sant för n 1, måste P (k, d, r) vara sant för n, så att (P (K, d, r), n 1) och (P (K, d, r), n ) tillsammans ger att P(K,d,r) är sant för n 3 och så vidare. Alltså är P (K, d, r) sant för alla n. I det återstående fallet är W V. Eftersom P(K, d, r 1) är sant, har A 1, A,..., A r 1 en gemensam egenvektor v V. Då gäller att v W, vilket betyder att A r v λ r v (bortsett från nollvektorn är varje vektor i W nämligen en egenvektor till A r ), och alltså är v en gemensam egenvektor till A 1, A,..., A r. Lemma 6. P(R,, r) är sant för alla r, d.v.s. om A 1, A,..., A r är kommuterande endomorfier på ett uddadimensionellt reellt vektorrum, så har de en gemensam egenvektor. Bevis. Enligt lemma 5 är det tillräckligt att visa att P(R,, 1) är sant. Om A är en endomorfi på ett uddadimensionellt reellt vektorrum, så är det (xi A) ett polynom av udda grad med reella koefficienter. Enligt lemma 1 har det (xi A) därför ett reellt nollställe λ. Således är λ ett reellt egenvärde till A. Lemma 7. P(C,, 1) är sant, d.v.s. varje endomorfi på ett uddadimensionellt komplext vektorrum har en egenvektor. Bevis. Låt A : C n C n vara en komplex linjär avbildning med n udda och låt V vara det reella vektorrum som utgörs av mängden av alla hermitiska n n- matriser, d.v.s. V Herm n (C) (en hermitisk matris A är en matris för vilken det gäller att A A : A t, d.v.s. att A är lika med transponatet av sitt komplexa konjugat). Då är och L 1 (B) : AB + BA AB BA L (B) : i två kommuterande endomorfier på V (observera att B V ), då det gäller att ( (AB + BA (L 1 (B)) ) ) (AB) + (BA ) B A + AB BA + AB AB + BA L 1 (B) L 1 (B) Herm n (C) 8
och ( (AB BA (L (B)) ) ) ((AB) (BA ) ) i i och dessutom att och (BA AB) i L 1 (L (B)) (L 1 L )(B) 1 AB BA i ( A (AB BA ) i L (B) L (B) Herm n (C), + (AB ) BA ) A i 1 4i ((AAB ABA ) + (ABA BA A )) 1 4i ((AAB A(AB) )+ L (L 1 (B)) (L L 1 )(B) 1 i + (A(AB) B(AA) )) 1 4i (AAB B(AA) ) ( A (AB + BA ) 1 4i ((AAB + ABA ) (ABA + BA A )) (AB + ) BA ) A 1 4i ((AAB + A(AB) ) (A(AB) + B(AA) )) 1 4i (AAB B(AA) ), d.v.s. att L 1 och L kommuterar. Eftersom huvuddiagonalen i en hermitisk matris utgörs endast av reella element, och övriga element i detta specifika fall är komplexa, har B en frihetsgrad i huvuddiagonalen och två frihetsgrader ovanför. En reell bas för V består därför av n(n 1) + n n vektorer, så att dim R V n. Enligt lemma 6 är P(R,, ) sant, vilket, eftersom dim R V är udda, implicerar att L 1 och L har en gemensam egenvektor B V. Då är L 1 (B) λb och L (B) µb, där λ och µ är reella. Detta ger att (L 1 + il )(B) AB + BA + AB BA AB (λb + iµb) (λ + µi)b, d.v.s. att varje kolonnvektor i B som inte är nollvektorn är en egenvektor till matrisen A. Lemma 8. P(C, k, r) är sant för alla positiva heltal k och r. Bevis. Lemmat visas genom induktion över k. Från lemma 7 och 5 följer att fallet då k 1, d.v.s. P(C,, r), är sant. Antag att P(C, l, r) är sant för l < k. 9
Lemma 5 ger vid handen att det är tillräckligt att visa att P(C, k, 1) är sant för att visa att P(C, k, r) är det. Låt A : C n C n vara en linjär avbildning, där n är delbart med k 1 men inte med k, och låt V vara det komplexa vektorrum som utgörs av mängden av alla skevsymmetriska n n-matriser med komplexa matriselement, d.v.s. V Skew n (C) (en skevsymmetrisk matris A är en matris för vilken det gäller att A A). Då är och L 1 (B) : AB + BA L (B) : ABA två kommuterande endomorfier på V, då det gäller att och (L 1 (B)) (AB + BA ) (AB) + (BA ) B A + AB (AB + BA ) L 1 (B) L 1 (B) Skew n (C) (L (B)) (A(BA )) (BA ) A AB A A( B)A och dessutom att ABA L (B) L (B) Skew n (C), och L 1 (L (B)) (L 1 L )(B) A(ABA ) + (ABA )A AABA + AB(AA) L (L 1 (B)) (L L 1 )(B) A(AB + BA )A AABA + AB(AA), d.v.s. att L 1 och L kommuterar. En bas för V är 0 1 0 0 1 0 0 0 (a 1 + b 1 i). 0 0.. 0 +... 0 0 0 0 10
0 0 1 0 0 0 0 0 +(a + b i). 1 0.. 0 +... 0 0 0 0 0 0 0 0 0 0 1 0 +(a 3 + b 3 i). 0 1.. 0 + +... 0 0 0 0 0 0 0 0 0 0 0 0 +(a n(n 1)/ + b n(n 1)/ i). 0 0...,.. 1 0 0 1 0 så dim C V n(n 1)/. Det gäller att k 1 n n k 1 m, där m är ett heltal. Eftersom (k 1) 1 är n jämnt, och tillsammans med n k k m k m k n implicerar att inte delar m, d.v.s. att m är udda. Slutligen är dim C V n(n 1) k 1 k k 1 m(n 1) k m(n 1), där m(n 1) är udda och alltså inte delbart med. Detta försäkrar att k 1 inte delar dim C V. Enligt P(C, k 1, ) (l (k 1) och r i antagandet ovan), har L 1 och L en gemensam egenvektor B, så L 1 (B) λb och L (B) µb, där λ och µ är komplexa (eftersom V är ett komplext vektorrum). Det följer att L (B) µb ABA A(L 1 (B) AB) A(λB AB) λab A B µb 0 (A λa + µi)b 0. 11
Låt v vara en kolonnvektor i B som inte är nollvektorn. Då är (A λa + µi) v 0. Enligt lemma har varje komplext tal en kvadratrot, varför det finns ett tal δ C sådant att δ λ 4µ. Med α : (λ + δ)/ och β : (λ δ)/ kan polynomet x λx + µ skrivas som (x α)(x β), eftersom (x α)(x β) x xβ αx + αβ x x(β + α) + αβ ( ) (λ δ) x (λ + δ) x + + αβ x (λ + δ)(λ δ) λx + 4 Då gäller att x λx + λ δ x λx + 4µ 4 4 x λx + µ. (A αi) w 0, där w (A βi) v. Om w 0 är v en egenvektor till A med egenvärdet β, och om w 0 är w en egenvektor till A med egenvärdet α. Eftersom k inte delar dim C n, följer lemmat. Teorem 9. Om A 1, A,..., A r är kommuterande endomorfier på ett ändligtdimensionellt komplext vektorrum V som inte är nollrummet, så har de en gemensam egenvektor. Bevis. Låt V vara ett n-dimensionellt vektorrum. Då existerar minst ett heltal k sådant att k inte delar n, oavsett värde på n. Eftersom P(C, k, r) är sant enligt lemma 8, följer teoremet. (Observera att lemma 8 uttrycker en något svagare proposition än teorem 9 därav behovet av detta bevis.) Korollarium 10 (algebrans fundamentalsats). Om P (x) är ett icke-konstant polynom med komplexa koefficienter, så existerar det ett tal λ C sådant att P (λ) 0. Bevis. Det är tillräckligt att bevisa satsen för moniska polynom. Sätt Då är P (x) det(xi A), där P (x) x n + a 1 x n 1 + a x n 1 + + a n. 0 0 0 a n 1 0 0 a n 1 A 0 1 0 a n,..... 0 0 1 a 1 1
eftersom upprepad utveckling efter första kolonnen av det(xi A) ger x 0 0 a n 1 x 0 a n 1 det(xi A). 0 1.. an..... 0 0 1 x + a 1 0 x 0 xa n 1 + a n 1 x 0 a n 1. 0 1.. an..... 0 0 1 x + a 1 x a j+a 1j utv. efter kolonn 1 x 0 0 xa n 1 + a n 1 x 0 a n ( 1)( 1) 3. 0 1.. an 3..... 0 0 1 x + a 1 0 x 3 0 x a n + xa n 1 + a n 1 x 0 a n. 0 1.. an 3..... 0 0 1 x + a 1 utv. efter kolonn 1 x a j+a 1j x 3 0 0 x a n + xa n 1 + a n 1 x 0 a n 3 ( 1)( 1) 3. 0 1.. an 4.......... 0 0 1 x + a 1 xn 1 x n a + x n 3 a 3 + + xa n 1 + a n 1 x + a 1 (x n 1 )(x + a 1 ) (x n a + x n 3 a 3 + + xa n 1 + a n )( 1) x n + a 1 x n 1 + a x n + a 3 x n 3 + + a n 1 x + a n 13
Teorem 9 implicerar att A k {A 1, A,..., A r } har ett komplext egenvärde, varför A, som kan ses som en kommuterande endomorfi på minst ett komplext vektorrum, har ett egenvärde λ C. Följaktligen är P (λ) 0, vilket visar satsen. Referenser [1] Harm Derksen, The Fundamental Theorem of Algebra and Linear Algebra, American Mathematical Monthly, 110 (003), 60 63. [] Howard Anton, Elementary Linear Algebra, 9 th ed., John Wiley and Sons, New York, 1973. [3] Lars V. Ahlfors, Complex Analyis, 3 rd ed., McGraw Hill, Auckland, 1979. 14