Matematik, KTH Bengt Ek november 207 Material till kursen SF679, Diskret matematik: Lite om kedjebråk 0 Inledning Talet π (kvoten mellan en cirkels omkrets och dess diameter) är inte ett rationellt tal (dvs inte kvoten av två heltal), men det kan approximeras godtyckligt nära med rationella tal Tex är 22 = 3, 428, 333 = 3, 4509, 355 = 3, 459292, 7 06 3 vilka kan jämföras med π = 3, 459265 Vi skall se hur man på ett systematiskt sätt kan finna goda rationella approximationer till reella tal och också se varför just 355 ligger så nära π, i 3 förhållande till sin nämnare ( π 355 < 3 3 0 7, medan > 8 3 0 3 ) Kedjebråk (eng continued fractions), som det handlar om, ansluter nära till Euklides algoritm och är inte alls bara intressanta för approximation Som ytterligare ett exempel skall vi se hur de kan användas för att ganska enkelt visa existensen av transcendenta reella tal, dvs tal som inte är algebraiska (inte löser någon (icke-trivial) polynomekvation med heltalskoefficienter) Beteckningar: N är mängden av alla naturliga tal, N = {0,, 2, } (i Biggs: N 0), Z är mängden av alla heltal, Z = {, 2,, 0,, 2, }, Z + är mängden av alla positiva heltal, Z + = {, 2, 3, } (i Biggs: N), Z n är (för n Z) mängden av alla heltal som är n, Z n = {n, n+, n+2, }, Q är mängden av alla rationella tal, Q = { m m Z, n Z n +}, A är mängden av alla (komplexa) algebraiska tal, R är mängden av alla reella tal, R = {0, 7, 237, π, 5 + 3 6, π e, }, 88 2 C är mängden av alla komplexa tal, C = {a + b i a, b R} Kommentar: Med kedjebråk avses här det som ibland kallas enkla kedjebråk, med bara :or i täljarna (se nästa avsnitt)
2 Rationella tal har ändliga kedjebråk Vi inför kedjebråk enligt: Definition : För α R fås elementen i α:s kedjebråksutveckling, a 0, a,, rekursivt: α = a 0 + s 0, med a 0 Z och 0 s 0 < (så a 0 är heltalsdelen av α och s 0 = α a 0) för i N: om s i > 0: s i = a i+ + s i+, med a i+ Z + och 0 s i+ <, om s i = 0: a j, s j inte definierade för j > i Om s n = 0 för något n N, sägs α ha en ändlig kedjebråksutveckling, vilket betecknas α = [a 0 ; a, a 2,, a n ] = a 0 + Då måste, om α / Z, tydligen a a + n 2 a 2 + Exempel på ett ändligt kedjebråk: + a För α = 47 n fås 23 α = 47 = 3 + 02, så a 23 23 0 = 3, s 0 = 02 23 s 0 = 23 = + 2, så a 02 02 =, s = 2 02 s = 02 = 4 + 8, så a 2 2 2 = 4, s 2 = 8 2 s 2 = 2 = + 3, så a 8 8 3 =, s 3 = 3 8 s 3 = 8 = 6 + 0, så a 3 4 = 6, s 4 = 0 s 4 = 0, så a j, s j är inte definierade för j > 4 Då man betraktar räkningarna i Euklides algoritm för 47 och 23: 47 = 23 3 + 02, 23 = 02 + 2, 02 = 2 4 + 8, 2 = 8 + 3, 47 23 = [3;, 4,, 6] = 3 + + 4 + + 6 8 = 3 6 + 0 ser man att kedjebråksberäkningen är densamma, fast skriven med kvoter a i :na, elementen i kedjebråksutvecklingen, är kvoterna i Euklides algoritm (som man inte behöver när man bestämmer sgd:n) Detta gäller tydligen allmänt (inte bara i vårt exempel), så eftersom Euklides algoritm för varje par av heltal tar slut i ett ändligt antal steg, har varje kvot av heltal (dvs varje rationellt tal) en ändlig kedjebråksutveckling Omvänt är värdet av ett ändligt kedjebråk alltid ett rationellt tal (induktion över längden n, [a 0; a,, a n] = a 0 + [a ;a 2,,a n] ) Det ger: Sats (ändliga kedjebråk): Mängden av reella tal α som har ändliga kedjebråksutvecklingar är precis de rationella talen, alla α Q
3 2 Irrationella tal har oändliga kedjebråk Hur är det då med α R Q? Kan de bestämmas av sina (oändligt många) element a 0, a,? Vi skall se att svaret på den frågan är ja Definition 2: Värdet av den oändliga kedjebråksutvecklingen med element a 0 Z och a i Z + för i =, 2, är [a 0 ; a, a 2, ] = lim n [a 0 ; a, a 2,, a n ] Talen [a 0 ; a,, a n ], n N, kallas konvergenter för ett (ändligt eller oändligt) kedjebråk [a 0 ; a, ] (med a n definierat) Vi visar snart att gränsvärdet ovan alltid (dvs för alla sådana {a i} i N ) existerar Inför v k = (, p k ) för k Z 2 enligt { v 2 = (q 2, p 2 ) = (, 0), v = (q, p ) = (0, ), v k = (, p k ) Z + Z, där p k = [a 0 ; a,, a k ], sgd(, p k ) =, för k N v k är alltså för k N en heltalsvektor i högra halvplanet som entydigt representerar den k:e konvergenten, vars värde ges av v k :s riktningskoefficient För att beräkna [a 0 ; a,, a k ] verkar det naturligt att börja från slutet (med a k + a k = a k a k a k etc) Men det kan göras enklare, enligt följande viktiga { p k = a k p k + p k 2 = a k + 2 Sats 2: För k N gäller v k = a k v k + v k 2, dvs och = q 0 q < q 2 <, speciellt lim n q n = Ty: Låt [a ; a 2,, a k ] = p k (en (k ):a konvergent) Enligt definitionen av p k är p k = a 0 + q { k p k = a 0 p k, så + = p k, för k =, 0,, p k ((q, p ) = (0, ), (q 2, p 2) = (, 0) Att sgd(q k, p k ) = sgd(p k, a 0p k + q k ) = och p k då k 0 och a (ses av uttrycket för [a ; a 2,, a k ]) har använts) Satsen visas nu med induktion över k Bas: För k = 0 påstås att v 0 = a 0 v + v 2 = (, a 0 ) Stämmer, ty p 0 q 0 = a 0 Steg: Antag att påståendet är sant (för alla ändliga kedjebråk) för k = s N Då är p s+ = a 0 p s + q s = a 0 (a s+ p s + p s 2) + (a s+ q s + q s 2) = = a s+ (a 0 p s + q s ) + (a 0 p s 2 + q s 2) = a s+ p s + p s och q s+ = p s = a s+ p s + p s 2 = a s+ q s + q s Antagandet gav att påståendet är sant för k = s + Det bevisar satsen (v s = a s+ v s + v s 2 eftersom p s q s Exempel på beräkning av ett ändligt kedjebråk: [3;, 4,, 6] kan enligt satsen beräknas som till höger (tex är [ 57 4 ] = 6 [ 23 6 ] + [ 9 ]) 5 Så [3;, 4,, 6] = 57 4 = [a ; a 2,, a s+], med a s+ (inte a s) som sista element) 47 (som är förkortat) 23 k 2 0 2 3 4 a k 3 4 6 p k 0 3 4 9 23 57 0 5 6 4
4 Sats 3 (samband mellan olika konvergenter): Om k Z + respektive k Z 2 och a 0 Z, a, a 2,, a k Z + är element i ett kedjebråk, gäller för dess konvergenter och p k p k = ( )k, p k 2 2 p k = a k ( ) k 2 p 0 q 0 < p 2 q 2 < p 4 q 4 < < p 5 q 5 < p 3 q 3 < p q Ty: Låt (v i, v j ) beteckna matrisen med v i och v j som kolonner, dvs ( p i p j q i q j ) Då är för k N p k p k = det (v k, v k ) = det (v k, a k v k + v k 2 ) = = det (v k 2, v k ) = = ( ) k det (v, v 2 ) = ( ) k, vilket ger den första likheten Den andra följer från det (v k 2, v k ) = det (v k 2, a k v k + v k 2 ) = a k det (v k 2, v k ) = a k ( ) k Det ger olikheterna mellan konvergenterna, ty q i då i 0 och a i då i 2 För oändliga kedjebråk ger olikheterna i sats 3 att följderna av udda respektive jämna konvergenter konvergerar (satsen om konvergens av begränsade monotona följder) och eftersom lim k ( p k p k ) = 0 är deras gränsvärden lika, så hela följden av konvergenter konvergerar Det ger följande sats Sats 4 (konvergens för oändliga kedjebråk): För varje följd {a n } n N, (a 0 Z, a n Z + för n Z +) finns ett entydigt värde för dess kedjebråk [a 0 ; a, a 2, ] = lim n [a 0 ; a,, a n ] Sats 3 visar mer om hur konvergenterna närmar sig kedjebråkets värde: Sats 5 (avstånden mellan konvergenterna och kedjebråkets värde): Låt a 0, a,, a n vara element i ett (ändligt eller oändligt) kedjebråk med värde α Då ligger α mellan p k och p k för k n (α = p k qk omm a k+ inte existerar) och α p k < α p k och, om a k+ existerar, (sträng olikhet till höger omm a k+2 existerar) Ty: Att α ligger mellan p k ( ++ ) < α p k + och p k följer av olikheten i sats 3 Om a k är det sista elementet i kedjebråket är α = p k Annars finns p k+ + och (α mellan p k och p k+ +, p k+ + α p k p k p k+ + = + a k+ + p k mellan α och p k ) = p k p k+ + α p k Likhet gäller i de yttre olikheterna omm α = p k+ +, men då är a k+ 2, så strikt olikhet gäller i den mellersta olikheten
Den första olikheten i sista raden är klar om α = p k+ + (då är α p k qk = 5 + ), annars fås den av att p k+p k+ ++ ( α) ligger mellan α och p k (följden p k+i p k+ +i + går monotont från p k till p k+2 +2 då i = 0,,, a k+2 och om a k+2 = existerar a k+3, så då är α p k+2 +2 ) och p k p k+p k+ ++ = = det(v k,v k+ ) ( ++ ) Den andra olikheten i sista raden visades ovan, vid den första raden 3 Kedjebråksutvecklingar är entydiga Vi införde i definition kedjebråksutvecklingen för ett godtyckligt α R och visade i sats 4 att alla oändliga kedjebråk konvergerar mot ett reellt tal, men det återstår att visa att α:s kedjebråk konvergerar mot just α Sats 6 (kedjebråksutvecklingar existerar för alla reella tal): För varje α R konvergerar dess kedjebråksutveckling mot α Ty: Låt α R ha kedjebråkselementen a 0, a, (enligt definition ) Om α Q och a 0, a,, a n är dess kedjebråkselement (ändligt antal då α Q) är α = [a 0 ; a,, a n ] enligt avsnitt (kan också visas med induktion över n) Om α R Q visar vi för n Z + med induktion påståendet P n : α ligger mellan p n q n och pn q n p Det ger ju att α = lim n n q n = [a 0 ; a, ] (bara ett reellt tal ligger i alla intervallen) α = a 0 + s 0, där s 0 har elementen a, a 2, och [a ; a 2,, a k+ ] kallas p k Bas: s 0 > 0, s 0 = a + s > a (ty a 2 är definierad) ger 0 < s 0 < a, så p 0 q 0 = a 0 < α = a 0 + s 0 < a 0 + a = p q Så P sant Steg: Antag P k sant, k Z + Det ger att s 0 ligger mellan p k och p k, så s 0 mellan q k och q p k och α mellan a k p 0 + q k = p k p k+ k + och a 0 + q k = p p k k, P k+ sant Så P n är sant för alla n Z + och satsen sann också för α R Q Sats 7 (kedjebråksutvecklingar är entydiga): Om α R, b 0 Z, b i Z + då i Z + och α = [b 0 ; b, ] eller α = [b 0 ; b,, b n ] med b n > om n 0, är b 0, b, elementen i α:s kedjebråksutveckling Ty: Vi visar med induktion för n N påståendet Q n : Om [a 0 ; a, ] = [b 0 ; b, ], är a n = b n eller a n, b n båda odefinierade Bas: [a 0 ; a, ] = [b 0 ; b, ] a 0 = b 0, ty a 0 är heltalsdelen av [a 0 ; a, ] Steg: Antag Q k för ett k N Om [a 0 ; a, ] = [b 0 ; b, ] Z är a, b och alla följande a i, b i odefinierade Annars gäller [a 0 ; a, ] = [b 0 ; b, ] [a ; a 2, ] = [b ; b 2, ], så (enligt antagandet) a k+ = b k+ (eller odefinierade), så P k+ sant Q n är alltså sant för n N och enligt sats 6 är satsen visad Varje reellt tal har alltså en entydigt bestämd kedjebråksutveckling Utvecklingarna ger en representation av reella tal som är mer kanoniska än tex decimalbråk, eftersom de inte innehåller något godtyckligt val av talbas De lämpar sig dock inte för beräkningar, eftersom det inte i allmänhet är enkelt att uttrycka c i :na i a i :na och b i :na då α = [a 0 ; a, ], β = [b 0 ; b, ], γ = [c 0 ; c, ] och γ = α + β eller γ = α β
6 4 Konvergenter som bästa approximationer I inledningen nämnde vi approximation av reella tal med rationella Nu ska vi beskriva hur det hänger ihop med kedjebråk Definition 3: Ett rationellt tal p med p Z, q Z q + och sgd(p, q) = sägs vara en bästa approximation till α R omm α p q α p q, p Z, q Z + { p = p, q = q, eller q > q Bland alla rationella tal som har högst lika stor nämnare som p q approximerar det alltså α bäst Sambandet med kedjebråk ges av Sats 8 (konvergenter som bästa approximationer): För alla n Z + och varje α R är konvergenterna pn q n för α bästa approximationer till α Ty: Det räcker att betrakta α med 0 < α < (eftersom den n:e konvergenten för M + α är M + pn q n (M Z) (med samma nämnare som pn q n ), där pn q n är den n:e konvergenten för α, och heltal bara approximeras bäst av sig själva) Vi ska med hjälp av figurerna nedan se att v n är en bästa approximation till α (inte i figuren, men den (dvs en linje med riktningskoefficient α) ligger mellan v n och v n ) l n jämnt: l 2 a b c l 3 v n v n a n udda: l 3 a c l 2 b l v n a v n Fig v n är en bästa approximation (I figurerna innehåller linjerna l, l 2, l 3 inte sina ändpunkter (0, 0), v n, (0, 0) och områdena a, b, c är öppna, dvs de innehåller inte punkter på l i:na) Alla gitterpunkter i a eller på l approximerar α sämre än v n gör (sats 5) I b finns inga gitterpunkter, ty vektorerna v n och v n spänner upp en parallellogram vars area är Den har inga gitterpunkter andra än hörnen (den skulle annars kunna delas upp i minst tre trianglar av area minst ) 2 I c och på l 2 är alla nämnare (dvs x-koordinater) större än q n (här används att n, så q n > 0 och l 2 (som är parallell med v n ) inte är vertikal) På l 3 är v n den med minst nämnare (eftersom sgd(p n, q n ) = ) Det visar att v n är en bästa approximation Bästa approximationer behöver inte vara konvergenter, men man kan visa (liknande beviset ovan) att de alla ges av v n +i v n, för några n Z +, i = 0,,, a n
7 5 Några exempel på kedjebråksutvecklingar Man vet att π = [3; 7, 5,, 292,,,, 2, ] och vi får de första konvergenterna k 2 0 2 3 4 5 a k 3 7 5 292 p k 0 3 22 333 355 03 993 04 348 0 7 06 3 33 02 33 25 Att konvergenten p 3 q 3 = 355 är en så bra approximation förklaras av att (sats 3 5) a 4 (och därmed q 4 ) är så stor: Med siffror och p 3 q 3 q 3 (q 3 +q 4 ) < π p 3 q 3 < q 3 q 4 > π (eftersom 3 är udda) ger det 355 < π < 355, 3 3 3302 3 3 3325 dvs 3, 45926530 < π < 3, 459265393 I själva verket är π = 3, 459265359 (Detta var förstås inte ett sätt att beräkna ett bra värde för π, vi hämtade ju a 0,, a 4 ur ärmen Men det visar att konvergenterna är bra (i vanlig mening) approximationer) 2 Man kan visa (se tex på internet) att e = [2;, 2,,, 4,,, 6,,, 8, ] och det fortsätter (i motsats till π:s kedjebråk) med ett tydligt mönster 3 Vad är kedjebråket för 2 +? Jo, 2 + = 2 + ( 2 ) = 2 + 2+, så 2 + = [2; 2, 2, 2, ] har ett oändligt kedjebråk Det bevisar att 2 + och därmed 2 är irrationellt Antikens grekiska matematiker kände väl till kedjebråk och visste att alla rationella tal har ändliga kedjebråk En del historiker tror att det var kedjebråket som ledde dem till insikten att 2 inte är rationellt 4 Vad är värdet av x = [; 2, 3, 3, 3, ]? Jo, x = + där y = [3; 3, 3, ] å sin sida uppfyller y = 3+, så y 2 + [3; 3, 3, ] y 2 3y = 0 och y = 3+ 3 (eftersom y > 3) Det ger x = = (5 + 3) 2 6 De oändliga kedjebråk som från ett visst element är periodiska är precis de irrationella lösningarna till andragradsekvationer med heltalskoefficienter (men det visar vi inte här)
8 2 Algebraiska tal Vi skall nu se hur man kan använda kedjebråk för att visa att det finns reella tal som inte är algebraiska Definition 2: α C kallas ett algebraiskt tal, skrivet α A, omm det finns n Z +, a 0,, a n Z, a n 0 sådana att polynomet f(x) = a n x n + + a x + a 0 har nollstället α, dvs f(α) = 0 α sägs vara av grad n omm n är den lägsta graden för ett sådant f(x) α C kallas transcendent omm det inte är algebraiskt, α C A Exempel algebraiska tal av grad är precis de rationella talen och de av grad 2 är precis irrationella rötter till andragradsekvationer med heltalskoefficienter Sats 2 (Liouvilles sats, om approximation av algebraiska tal): För varje irrationellt algebraiskt tal α av grad n finns C > 0 sådant att för alla p Z, q Z + : α p q > C q n Ty: Om α är ett nollställe till f(x) som ovan, är f(x) = (x α)g(x) för ett polynom g(x) av grad n och g(α) 0 (annars vore f(x) = (x α) 2 h(x) för ett polynom h(x), så f (α) = 0 och α av grad högst n ) g är kontinuerlig, så det finns δ > 0 sådant att x α δ g(x) 0 Om α p δ är g( p ) 0, så q q p q α = f(p ) q g( p ) = a np n + + a pq n + a 0 q n q q n g( p ) q Täljaren i hl är ett heltal och eftersom α / Q är den 0 (g(x) 0 då x α δ) Om M > g(x) då x α δ (ett sådant M finns eftersom g är kontinuerlig), fås α p q > M q n Om α p > δ är q α p q > δ q n Med C = min( M, δ) gäller den sökta olikheten för alla p q Irrationella algebraiska tal kan alltså inte approximeras riktigt bra av rationella tal, men vi kan med hjälp av kedjebråk visa att det finns reella tal som approximeras bättre än så Det beskrivs i nästa avsnitt
9 22 Transcendenta tal existerar Enligt sats 2 är α R Q transcendent om det för varje C > 0 och n Z + finns p Z, q Z + med α p q C q n Sats 22 (det finns reella transcendenta tal): R A, dvs reella transcendenta tal existerar Ty: Tag a 0 Z godtyckligt och, givet a,, a k Z +, a k+ >, där p k = [a 0 ; a,, a k ] Då är för α = [a 0 ; a, a 2, ] och k Z + α p k < < < q = k, + a k+ qk 2 + k k där den första olikheten gäller enligt sats 5 och den andra enligt sats 2 (+ = a k+ + > a k+ ) Eftersom då k visar det enligt resonemanget före satsens formulering att α är transcendent Senare i kursen skall vi se ett helt annat bevis för att det finns transcendenta tal k 23 De algebraiska talen är en algebraiskt sluten delmängd till C Vi skall se att A, som enligt föregående avsnitt är en äkta delmängd till C, har flera egenskaper gemensamma med C Man kommer nämligen inte utanför A genom att addera, multiplicera och dividera element i A (A är sluten under räkneoperationerna) och nollställen till polynom med koefficienter i A ligger också i A (A är algebraiskt sluten) Sats 23 (A är sluten under +, och invers): α, β A, r Q α + β, α β, rα A och α A {0} α A Ty: Låt α, β A ha grad m respektive n och f(α) = g(β) = 0, f(x), g(x) polynom av grad m, n med heltalskoefficienter a i, b i Mängden K = { d ij α i β j d ij Q}, 0 i<m, 0 j<n som vi betecknar K = α i β j ; i = 0,,, m, j = 0,,, n eller bara α i β j är då en delmängd till C, som innehåller α k och β k för alla k Z (ty α m = a m a m α m a 0 a m och α = am a 0 α m a (a a 0 0, ty annars 0 vore f(x) ett polynom av grad m med nollstället α), motsvarande för β n, β ) x Med γ = α + β, α β, rα, α gäller då γ k K för alla k N K är ett vektorrum över Q (dvs med skalärer Q) av dimension högst m n, så {, γ,, γ mn } är en linjärt beroende mängd i K, så mn i=0 c iγ i = 0 för några c 0, c,, c mn Q (inte alla 0) Det visar att γ A (och har grad m n) Att A är algebraiskt sluten visas på nästan samma sätt,
0 Sats 24 (A är algebraiskt sluten): Om γ 0, γ,, γ n A, γ n 0, α C och γ n α n + γ n α n + + γ 0 = 0, så är α ett algebraiskt tal, α A Ty: K = α i γ j 0 0 γn jn (0 i < m, 0 j k < p k, där m, p k är graderna för α, γ k ) är då av ändlig dimension ( s = m p 0 p n ), så {, α,, α s } är en linjärt beroende mängd i K och α A som ovan