Vilken rät linje pssr bäst till givn dtpunkter? Anders Källén MtemtikCentrum LTH nderskllen@gmil.com Smmnfttning I det här dokumentet diskuterr vi minst-kvdrtmetoden för skttning v en rät linje till dt. Som bieffekt v den diskussionen får vi en v de viktigste olikhetern inom nlysen Cuchy-Schwrtz olikhet som vi därför diskuterr lite kort. Båd dess diskussioner hndlr om kvdrtkomplettering, så vi vslutr med ytterligre en sådn, den ritmetisk-geometrisk olikheten.
Vilken rät linje pssr bäst till givn dtpunkter? 1 (6) Introduktion En v de viktigste nlytisk metodern när mn rbetr med dt är tt sktt funktioner (eller snrre, prmetrr som definierr funktioner) till givn dt. Den mest nvänd metoden för dett klls minst kvdrtmetoden, som vi sk titt på här, när funktionen vi sk sktt är en rät linje. Det är nämligen i mycket en tillämpning v kvdrtkomplettering. En resistensmätning För tt mät resistensen i ett motstånd bestämmer mn strömstyrkn I vid olik spänningr U. Mn fick följnde tbell: U (V): 4 6 8 10 1 14 16 18 I (ma): 1.0.5 3..9 3.8 5.0 5.3 6.1 7.9 Spänningen är lltså bestämd, mätningen är I. Från ellärn vet vi tt U = RI där R är motståndets resistens. Men här hr vi mätningr v strömstyrkn, inte den exkt strömstyrkn. Så vi knske inte hr en exkt reltion. Dett illustrers i nednstående figur, som också illustrerr en linjär pproximtion genom origo till dt. I 10 5 10 0 U Ekvtionen för linjen är I = U, och från Ohm s lg följer då tt = 1/R. Vi ser lltså tt lutningen på linjen hjälper oss tt få en br skttning på resistensen som nvänder ll dt. Men hur sk vi bestämm? Ett rimligt sätt tt resoner är tt mät vståndet i vertikl riktning melln uppmätt punkt och motsvrnde värde på linjen. För tt skriv ner formler övergår vi till tt låt spänningsmätningrn beteckns x 1,..., x n, där n = 9 i vårt speciell fll, medn strömstyrkemätningrn beteckns y 1,..., y n. Det vi hr plottt är lltså de nio punktern (x i, y i ) och den rät linjen hr en ekvtion y = x för någon riktningskoefficient. För ett visst gäller då tt vertiklt vstånd melln punkt och linje för punkten (x i, y i ) ges v y i x i,
Vilken rät linje pssr bäst till givn dtpunkter? (6) och en nturlig sk vore då tt bestämm det som gör summn v dess så liten som möjligt. Men bsolutbelopp är besvärlig tt räkn med (eftersom de inte är deriverbr i ll punkter), och därför väljer mn tt istället titt på kvdrten v vståndet. Om linjen hr riktningskoefficienten gäller då tt summn v ll kvdrerde vstånd ges v Q() = (y i x i ). Bäst skttningen på blir då det som gör Q() så litet som möjligt. Det är det som gör tt den rät linjen pssr optimlt till dt i minst-kvdrtmening. Dett kn vi bestämm gnsk enkelt, ty Q() är ett ndrgrdspolynom i. Vi hr ju tt (y i x i ) = y i x i y i + x i, och tr vi summn v ll dess får vi tt Q() = yi x i y i + x i = A B + C, där vi i sist likheten stt A = x i, B = x i y i, C = yi. I vårt fll kn vi beräkn dess tl till A = 1140, B = 466.4, C = 193.05. För tt hitt minst värdet kvdrtkompletterr vi Q() = A( B A ) + C B A. Eftersom A > 0 hr dett ett minimum i punkten = B/A, vilket i vårt fll ger skttningen = 466.4 1140 = 0.4091. Den rät linjen i figuren är därför linjen I = 0.4091U, vilket i sin tur betyder tt resistensen vi söker är R = 1/ =.44kΩ. Anmärkning Som en biprodukt v denn diskussion får mn en olikhet som går under nmnet Cuchys olikhet. Vi vet ju nämligen tt Q() 0 för ll och eftersom det minst värdet är C B /A måste dett vr 0 (kom ihåg tt A > 0). Utskrivet blir dett ( x i y i ) x i yi. Vi sk återkomm till den längre frm.
Vilken rät linje pssr bäst till givn dtpunkter? 3 (6) Linjär regression I föregående vsnitt skttde vi en rät linje som gick genom origo till dt. Nu sk vi se hur mn kn sktt en rät linje som inte nödvändigtvis går genom origo till dt. Följnde dt representerr löneutvecklingen för en skoldjunkt född 194 under åren 1969-1988. Lönen är ngiven i 1988 års penningvärde. år: 1969 1970 1971 197 1973 1974 1975 1976 kkr: 18.3 18.7 17.4 16.7 15.7 17. 17.1 17.0 år: 1977 1978 1979 1980 1981 198 1983 1984 kkr: 17.8 16.5 16.6 15.9 15.1 14.4 14. 14.0 år: 1985 1986 1987 1988 kkr: 14.0 14.4 14.1 14.0 Vi vill se hur mycket en sådn lärre förlorde i köpkrft under denn tid. Dess dt finns ritde i figuren nedn tillsmmns med en rät linje. lön(kkr) 0 15 10 70 80 90 årtionde Även denn linje är bestämd med hjälp v minst kvdrtmetoden. Vi sk nu se hur. Skillnden mot föregående exempel är tt den rät linjen hr ett intercept (d.v.s. går inte nödvändigtvis genom origo), och ges därför v en ekvtion y = x + b. Det betyder tt vi får en funktion v två vribler som vi vill minimier: Q(, b) = (y i x i b). Vi kn nu hitt de punkter (, b) som minimerr dett genom tt kvdrtkompletter, men det blir lite enklre rent räknemässigt om vi börjr med tt inför ny vribler u i = x i x, v i = y i ȳ där x är medelvärdet [1] v ll x i :n och motsvrnde för ȳ. Finnessen med tt subtrher medelvärdet är tt u i = v i = 0.
Vilken rät linje pssr bäst till givn dtpunkter? 4 (6) Om vi nu stoppr in y i = ȳ + u i och x i = x + v i i uttrycket för kvdrtsummn får vi Q(, b) = (v i u i c), där c = b + x ȳ. Här kn kvdrten utveckls som (v i u i c) = (v i u i ) c(v i u i ) + c, och summerr vi över i och utnyttjr tt i (v i u i ) == i v i i u i = 0 så får vi tt Q(, b) = (v i u i ) + n(b + x ȳ). Här inser vi nu tt ovsett vd är, så blir Q(, b) som minst om vi väljer b så tt b + x ȳ = 0, lltså b = ȳ x. Men hur vi sk välj lärde vi oss ovn: = B A där A = u i, B = Om vi utför beräkningrn finner vi tt u i v i. A = 665, B = 159.85, och därför tt = 0.404. Från dett får vi sedn tt ekvtion för linjen är vilket i vårt fll visr tt y = x + ȳ x, y = ȳ + (x x), lön (kkr) = 15.955 0.404 (årtl 1978.5) Det betyder tt en djunkt under ifrågvnde tidsperiod förlorde 40 kr/mån i bruttolön, omräknt till 1988 års penningvärde. Cuchy-Schwrtz olikhet En biprodukt v ovnstående är det som vi kllde Cuchys olikhet. Vi sk nu se närmre på den. I diskussione ovn dök det upp ett ntl summor bserde på en svit v tlpr (x i, y i ), i = 1,..., n. En v dess (som vi kllde B) sk vi ge en lterntiv beteckning nu: x, y = x i y i Inom den linjär lgebrn klls den för sklärprodukten v de två vektorern x = (x 1,..., x n ) och y = (y 1,..., y n ) i R n. Vidre sätter vi x = x, x = x i, i
Vilken rät linje pssr bäst till givn dtpunkter? 5 (6) som vi kllr normen v tlföljden x 1,..., x n. Cuchys olikhet säger då tt x, y x y. Beviset kn vi skriv på följnde sätt (det är identiskt med det vi redn gett, br lite ny beteckningr) x + ty = x + ty, x + ty = x + t x, y + t y = y (t + och eftersom vänsterledet är 0, följer tt olikheten måste gäll. x, y ) + x x, y y y Men resonemnget kn generlisers. Om f, g är kontinuerlig funktioner kn vi definier f, g = f(x)g(x)dx (kom ihåg tt integrler är en sorts generliserde summor). Då får vi tt f, f = f(x) dx och exkt smm bevis som ovn visr tt f, g f g. Utskrivet står här Cuchy- Schwrtz olikhet för integrler: ( f(x)g(x)dx) f(x) dx Den ritmetisk-geometrisk olikheten g(x) dx. En nnn viktig olikhet som också följer genom kvdrtkomplettering är den ritmetiskgeometrisk olikheten. För två positiv tl säger den tt vilket följer v b + b, (1) 0 ( b) = b + b. En geometrisk beskrivning v olikheten (1) finns i figuren till höger. Här hr vi en cirkel med dimeter + b deld vinkelrät v en kord med totl längd c. Enligt koordstsen gäller tt c = b +b c och eftersom c är rdien, som är ( + b)/, så följer tt (1) måste gäll. Vänsterledet i (1) klls det geometrisk medelvärdet v tlen, b och generlisers till ett godtyckligt ntl positiv tl x 1,..., x n som G = n x 1 x... x n. b c
Vilken rät linje pssr bäst till givn dtpunkter? 6 (6) Högerledet är det ritmetisk medelvärdet v tlen, b, vilket generlisers till A = x 1 +... + x n. n Det den ritmetisk-geometrisk olikheten säger är tt för ll ändlig följder v tl. G A För tt se tt så är fllet, noter först tt vi för två tl hr tt och betrkt sedn fllet n = 4. Då hr vi ( x1 + x x 1 x ) ( ) ( ) ( x1 + x x3 + x 4 x1 + x (x 1 x )(x 3 x 4 ) = ) x3 + x 4 ( [ 1 x1 + x + x ]) 4 3 + x 4 = ( ) x1 + x + x 3 + x 4. Olikhetern här är båd den ritmetisk-geometrisk olikheten för två tl. Från dett får vi sedn olikheten för tre tl. Låt nämligen x 1, x, x 3 vr givn och sätt x 4 = (x 1 + x + x 3 )/3. Då hr vi fyr tl och vi hr vist tt x 1 x x 3 x 4 ( ) 4 1 4 (x 1 + x + x 3 + x 4 ) = x 4 4 x 1 x x 3 x 3 4, vilket fktiskt är den ritmetisk-geometrisk olikheten för tre tl. För tt vis olikheten för ll n kn vi generliser det vi gjort. ) Vis den först för ll n = m på smm sätt som vi visde den för n = 4. Lättst genomför mn ett induktionsbevis. b) För tt vis den för ett n < m som inte är på smm form, gör vi som i fllet med n = 3 ovn. Vi lägger till så mång ritmetisk medelvärden som behövs för tt få m tl och upprepr resonemnget ovn. Detljern lämns till läsren.