Vilken rät linje passar bäst till givna datapunkter?

Relevanta dokument
SF1625 Envariabelanalys

SF1625 Envariabelanalys

Trigonometri. 2 Godtyckliga trianglar och enhetscirkeln 2. 3 Triangelsatserna Areasatsen Sinussatsen Kosinussatsen...

14. MINSTAKVADRATMETODEN

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson


1 e x2. lim. x ln(1 + x) lim. 1 (1 x 2 + O(x 4 )) = lim. x 0 x 2 /2 + O(x 3 ) x 2 + O(x 4 ) = lim. 1 + O(x 2 ) = lim = x = arctan x 1

LINJÄR ALGEBRA II LEKTION 1

Användande av formler för balk på elastiskt underlag

Sammanfattning, Dag 9

KOMPLETTERANDE MATERIAL TILL KURSEN MATEMATIK II, MATEMATISK ANALYS DEL A VT 2015

TATA42: Föreläsning 4 Generaliserade integraler

TATA42: Föreläsning 4 Generaliserade integraler

9. Bestämda integraler

TMV151/TMV181. Fredrik Lindgren. 19 november 2013

Volum av rotationskroppar. Båglängd, rotationsytor. Adams 7.1, 7.2, 7.3

GEOMETRISKA VEKTORER Vektorer i rummet.

x = x = x = x=3 x=5 x=6 42 = 10x x + 10 = 15 x = = 20 x = 65 x + 36 = 46

ORTONORMERAT KOORDINAT SYSTEM. LÄNGDEN AV EN VEKTOR. AVSTÅND MELLEN TVÅ PUNKTER. MITTPUNKT. TYNGDPUNKT. SFÄR OCH KLOT.

Analys 360 En webbaserad analyskurs Grundbok. Integralkalkyl. MatematikCentrum LTH

Polynominterpolation av kontinuerliga

TATA42: Tips inför tentan

Läsanvisningar för MATEMATIK I, ANALYS

Finaltävling den 20 november 2010

Volym och dubbelintegraler över en rektangel

============================================================ V1. Intervallet [a,b] är ändligt, dvs gränserna a, b är reella tal och INTE ±.

Skriv tydligt! Uppgift 1 (5p)

Kvalificeringstävling den 2 oktober 2007

13 Generaliserade dubbelintegraler

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 16-17, 2010:

Exponentiella förändringar

Uppsala Universitet Matematiska Institutionen T Erlandsson

Induktion LCB 2000/2001

GEOMETRISKA VEKTORER Vektorer i rummet.

ORTONORMERADE BASER I PLAN (2D) OCH RUMMET (3D) ORTONORMERAT KOORDINAT SYSTEM

19 Integralkurvor, potentialer och kurvintegraler i R 2 och R 3

PASS 1. RÄKNEOPERATIONER MED DECIMALTAL OCH BRÅKTAL

Sfärisk trigonometri

Uppgiftssamling 5B1493, lektionerna 1 6. Lektion 1

Tentamen 1 i Matematik 1, HF dec 2016, kl. 8:00-12:00

Sats 3: Egenskaper. (a) (b) f(x) dx = 2 f(x) dx. (c) (Af(x) + Bg(x))dx. g(x) dx = A. (d) (e) Om a b och f(x) g(x) (f) Triangelolikheten: Om a b

Analys o 3D Linjär algebra. Lektion 16.. p.1/53

Associativa lagen för multiplikation: (ab)c = a(bc). Kommutativa lagen för multiplikation: ab = ba.

Gör slag i saken! Frank Bach

Generaliserade integraler

24 Integraler av masstyp

V1. Intervallet [a,b] är ändligt, dvs gränserna a, b är reella tal och INTE ±. är begränsad i intervallet [a,b].

Matematiska uppgifter

Analys grundkurs B lab 1. Stefan Gustafsson Per Jönsson Fakulteten för Teknik och Samhälle, 2013

============================================================ V1. Intervallet [a,b] är ändligt, dvs gränserna a, b är reella tal och INTE.

Mat Grundkurs i matematik 1, del III

Analys 360 En webbaserad analyskurs Grundbok. X. Integralkalkyl. MatematikCentrum LTH

V1. Intervallet [a,b] är ändligt, dvs gränserna a, b är reella tal och INTE ±. är begränsad i intervallet [a,b].

HF1703, Inledande matematik (Byggproduktion) DEN TRIGONOMETRISKA ENHETSCIRKELN OCH TRIGONOMETRISKA FUNKTIONER

Integraler och statistik

Svar till uppgifter 42 SF1602 Di. Int.

Matris invers, invers linjär transformation.

Definition. En cirkel är mängden av de punkter i planet vars avstånd till en given punkt är

Preliminär version 2 juni 2014, reservation för fel. Tentamen i matematik. Kurs: MA152G Matematisk Analys MA123G Matematisk analys för ingenjörer

Studieplanering till Kurs 3b Grön lärobok

Tentamen i Analys B för KB/TB (TATA09/TEN1) kl 08 13

Om konvergens av funktionsföljder

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 5-7.

TATA42: Föreläsning 12 Rotationsarea, tyngdpunkter och Pappos-Guldins formler

Mängder i R n. Funktioner från R n till R p

Spelteori: En studie av hur pokerproblemet delvis lösts. Mika Gustafsson

Integraler. 1 Inledning. 2 Beräkningsmetoder. CTH/GU LABORATION 2 MVE /2013 Matematiska vetenskaper

Läsanvisningar till kapitel

TATA42: Föreläsning 11 Kurvlängd, area och volym

Definition. En cirkel är mängden av de punkter i planet vars avstånd till en given punkt är (*)

9. Vektorrum (linjära rum)

KTH Teknikvetenskap Fotografi-lab 3

6 Formella språk. Matematik för språkteknologer (5LN445) UPPSALA UNIVERSITET

Lösningsförslag till deltentamen i IM2601 Fasta tillståndets fysik. Torsdagen den 15 mars, Teoridel

Lösningsförslag till fråga 5

Några integraler. Kjell Elfström. x = f 1 (y) = arcsin y. . 1 y 2 Vi låter x och y byta roller och formulerar detta resultat som en sats: cos x = 1

Lösningsförslag till tentamen i SF1683 och SF1629 (del 1) 23 oktober 2017

1. (6p) (a) Använd delmängdskonstruktionen för att tillverka en DFA ekvivalent med nedanstående NFA. (b) Är den resulterande DFA:n minimal? A a b.

Rationella uttryck. Förlängning och förkortning

Tillämpning av integraler

Kontinuerliga variabler

Löpsedel: Integraler. Block 4: Integraler. Lärobok. Exempel (jfr lab) Exempel (jfr lab) Integrering i Matlab

Frågor för tentamen EXTA50 Samhällsmätning, 9 hp, kl januari, 2015.

Tillämpning - Ray Tracing och Bézier Ytor. TANA09 Föreläsning 3. Icke-Linjära Ekvationer. Ekvationslösning. Tillämpning.

Topologi och konvergens

Numerisk Integration En inledning för Z1

Kontrollskrivning 3 till Diskret Matematik SF1610, för CINTE1, vt 2019 Examinator: Armin Halilovic Datum: 2 maj

XIV. Elektriska strömmar

Föreläsning 10, Numme K2, GNM Kap 6 Integraler & GNM 8:3C Richardsonextrapolation

Grundläggande matematisk statistik

Area([a; b] [c; d])) = (b a)(d c)

TATA42: Envariabelanalys 2 VT 2018

SF1626 Flervariabelanalys Tentamen 8 juni 2011, Svar och lösningsförslag

Uttryck höjden mot c påtvåolikasätt:

ENVARIABELANALYS - ETT KOMPLEMENT

Några partiella differentialekvationer med

Derivata och integral tolkning av definitionerna med hjälp av Maxima. Per Jönsson, Malmö högskola

Byt till den tjocka linsen och bestäm dess brännvidd.

Föreläsning 7: Trigonometri

Evighetskalender. 19 a) nyårsdagen var år 2000 b) julafton kommer att vara på år 2010 c) de första människorna landade på månen, 20 juli 1969

Transkript:

Vilken rät linje pssr bäst till givn dtpunkter? Anders Källén MtemtikCentrum LTH nderskllen@gmil.com Smmnfttning I det här dokumentet diskuterr vi minst-kvdrtmetoden för skttning v en rät linje till dt. Som bieffekt v den diskussionen får vi en v de viktigste olikhetern inom nlysen Cuchy-Schwrtz olikhet som vi därför diskuterr lite kort. Båd dess diskussioner hndlr om kvdrtkomplettering, så vi vslutr med ytterligre en sådn, den ritmetisk-geometrisk olikheten.

Vilken rät linje pssr bäst till givn dtpunkter? 1 (6) Introduktion En v de viktigste nlytisk metodern när mn rbetr med dt är tt sktt funktioner (eller snrre, prmetrr som definierr funktioner) till givn dt. Den mest nvänd metoden för dett klls minst kvdrtmetoden, som vi sk titt på här, när funktionen vi sk sktt är en rät linje. Det är nämligen i mycket en tillämpning v kvdrtkomplettering. En resistensmätning För tt mät resistensen i ett motstånd bestämmer mn strömstyrkn I vid olik spänningr U. Mn fick följnde tbell: U (V): 4 6 8 10 1 14 16 18 I (ma): 1.0.5 3..9 3.8 5.0 5.3 6.1 7.9 Spänningen är lltså bestämd, mätningen är I. Från ellärn vet vi tt U = RI där R är motståndets resistens. Men här hr vi mätningr v strömstyrkn, inte den exkt strömstyrkn. Så vi knske inte hr en exkt reltion. Dett illustrers i nednstående figur, som också illustrerr en linjär pproximtion genom origo till dt. I 10 5 10 0 U Ekvtionen för linjen är I = U, och från Ohm s lg följer då tt = 1/R. Vi ser lltså tt lutningen på linjen hjälper oss tt få en br skttning på resistensen som nvänder ll dt. Men hur sk vi bestämm? Ett rimligt sätt tt resoner är tt mät vståndet i vertikl riktning melln uppmätt punkt och motsvrnde värde på linjen. För tt skriv ner formler övergår vi till tt låt spänningsmätningrn beteckns x 1,..., x n, där n = 9 i vårt speciell fll, medn strömstyrkemätningrn beteckns y 1,..., y n. Det vi hr plottt är lltså de nio punktern (x i, y i ) och den rät linjen hr en ekvtion y = x för någon riktningskoefficient. För ett visst gäller då tt vertiklt vstånd melln punkt och linje för punkten (x i, y i ) ges v y i x i,

Vilken rät linje pssr bäst till givn dtpunkter? (6) och en nturlig sk vore då tt bestämm det som gör summn v dess så liten som möjligt. Men bsolutbelopp är besvärlig tt räkn med (eftersom de inte är deriverbr i ll punkter), och därför väljer mn tt istället titt på kvdrten v vståndet. Om linjen hr riktningskoefficienten gäller då tt summn v ll kvdrerde vstånd ges v Q() = (y i x i ). Bäst skttningen på blir då det som gör Q() så litet som möjligt. Det är det som gör tt den rät linjen pssr optimlt till dt i minst-kvdrtmening. Dett kn vi bestämm gnsk enkelt, ty Q() är ett ndrgrdspolynom i. Vi hr ju tt (y i x i ) = y i x i y i + x i, och tr vi summn v ll dess får vi tt Q() = yi x i y i + x i = A B + C, där vi i sist likheten stt A = x i, B = x i y i, C = yi. I vårt fll kn vi beräkn dess tl till A = 1140, B = 466.4, C = 193.05. För tt hitt minst värdet kvdrtkompletterr vi Q() = A( B A ) + C B A. Eftersom A > 0 hr dett ett minimum i punkten = B/A, vilket i vårt fll ger skttningen = 466.4 1140 = 0.4091. Den rät linjen i figuren är därför linjen I = 0.4091U, vilket i sin tur betyder tt resistensen vi söker är R = 1/ =.44kΩ. Anmärkning Som en biprodukt v denn diskussion får mn en olikhet som går under nmnet Cuchys olikhet. Vi vet ju nämligen tt Q() 0 för ll och eftersom det minst värdet är C B /A måste dett vr 0 (kom ihåg tt A > 0). Utskrivet blir dett ( x i y i ) x i yi. Vi sk återkomm till den längre frm.

Vilken rät linje pssr bäst till givn dtpunkter? 3 (6) Linjär regression I föregående vsnitt skttde vi en rät linje som gick genom origo till dt. Nu sk vi se hur mn kn sktt en rät linje som inte nödvändigtvis går genom origo till dt. Följnde dt representerr löneutvecklingen för en skoldjunkt född 194 under åren 1969-1988. Lönen är ngiven i 1988 års penningvärde. år: 1969 1970 1971 197 1973 1974 1975 1976 kkr: 18.3 18.7 17.4 16.7 15.7 17. 17.1 17.0 år: 1977 1978 1979 1980 1981 198 1983 1984 kkr: 17.8 16.5 16.6 15.9 15.1 14.4 14. 14.0 år: 1985 1986 1987 1988 kkr: 14.0 14.4 14.1 14.0 Vi vill se hur mycket en sådn lärre förlorde i köpkrft under denn tid. Dess dt finns ritde i figuren nedn tillsmmns med en rät linje. lön(kkr) 0 15 10 70 80 90 årtionde Även denn linje är bestämd med hjälp v minst kvdrtmetoden. Vi sk nu se hur. Skillnden mot föregående exempel är tt den rät linjen hr ett intercept (d.v.s. går inte nödvändigtvis genom origo), och ges därför v en ekvtion y = x + b. Det betyder tt vi får en funktion v två vribler som vi vill minimier: Q(, b) = (y i x i b). Vi kn nu hitt de punkter (, b) som minimerr dett genom tt kvdrtkompletter, men det blir lite enklre rent räknemässigt om vi börjr med tt inför ny vribler u i = x i x, v i = y i ȳ där x är medelvärdet [1] v ll x i :n och motsvrnde för ȳ. Finnessen med tt subtrher medelvärdet är tt u i = v i = 0.

Vilken rät linje pssr bäst till givn dtpunkter? 4 (6) Om vi nu stoppr in y i = ȳ + u i och x i = x + v i i uttrycket för kvdrtsummn får vi Q(, b) = (v i u i c), där c = b + x ȳ. Här kn kvdrten utveckls som (v i u i c) = (v i u i ) c(v i u i ) + c, och summerr vi över i och utnyttjr tt i (v i u i ) == i v i i u i = 0 så får vi tt Q(, b) = (v i u i ) + n(b + x ȳ). Här inser vi nu tt ovsett vd är, så blir Q(, b) som minst om vi väljer b så tt b + x ȳ = 0, lltså b = ȳ x. Men hur vi sk välj lärde vi oss ovn: = B A där A = u i, B = Om vi utför beräkningrn finner vi tt u i v i. A = 665, B = 159.85, och därför tt = 0.404. Från dett får vi sedn tt ekvtion för linjen är vilket i vårt fll visr tt y = x + ȳ x, y = ȳ + (x x), lön (kkr) = 15.955 0.404 (årtl 1978.5) Det betyder tt en djunkt under ifrågvnde tidsperiod förlorde 40 kr/mån i bruttolön, omräknt till 1988 års penningvärde. Cuchy-Schwrtz olikhet En biprodukt v ovnstående är det som vi kllde Cuchys olikhet. Vi sk nu se närmre på den. I diskussione ovn dök det upp ett ntl summor bserde på en svit v tlpr (x i, y i ), i = 1,..., n. En v dess (som vi kllde B) sk vi ge en lterntiv beteckning nu: x, y = x i y i Inom den linjär lgebrn klls den för sklärprodukten v de två vektorern x = (x 1,..., x n ) och y = (y 1,..., y n ) i R n. Vidre sätter vi x = x, x = x i, i

Vilken rät linje pssr bäst till givn dtpunkter? 5 (6) som vi kllr normen v tlföljden x 1,..., x n. Cuchys olikhet säger då tt x, y x y. Beviset kn vi skriv på följnde sätt (det är identiskt med det vi redn gett, br lite ny beteckningr) x + ty = x + ty, x + ty = x + t x, y + t y = y (t + och eftersom vänsterledet är 0, följer tt olikheten måste gäll. x, y ) + x x, y y y Men resonemnget kn generlisers. Om f, g är kontinuerlig funktioner kn vi definier f, g = f(x)g(x)dx (kom ihåg tt integrler är en sorts generliserde summor). Då får vi tt f, f = f(x) dx och exkt smm bevis som ovn visr tt f, g f g. Utskrivet står här Cuchy- Schwrtz olikhet för integrler: ( f(x)g(x)dx) f(x) dx Den ritmetisk-geometrisk olikheten g(x) dx. En nnn viktig olikhet som också följer genom kvdrtkomplettering är den ritmetiskgeometrisk olikheten. För två positiv tl säger den tt vilket följer v b + b, (1) 0 ( b) = b + b. En geometrisk beskrivning v olikheten (1) finns i figuren till höger. Här hr vi en cirkel med dimeter + b deld vinkelrät v en kord med totl längd c. Enligt koordstsen gäller tt c = b +b c och eftersom c är rdien, som är ( + b)/, så följer tt (1) måste gäll. Vänsterledet i (1) klls det geometrisk medelvärdet v tlen, b och generlisers till ett godtyckligt ntl positiv tl x 1,..., x n som G = n x 1 x... x n. b c

Vilken rät linje pssr bäst till givn dtpunkter? 6 (6) Högerledet är det ritmetisk medelvärdet v tlen, b, vilket generlisers till A = x 1 +... + x n. n Det den ritmetisk-geometrisk olikheten säger är tt för ll ändlig följder v tl. G A För tt se tt så är fllet, noter först tt vi för två tl hr tt och betrkt sedn fllet n = 4. Då hr vi ( x1 + x x 1 x ) ( ) ( ) ( x1 + x x3 + x 4 x1 + x (x 1 x )(x 3 x 4 ) = ) x3 + x 4 ( [ 1 x1 + x + x ]) 4 3 + x 4 = ( ) x1 + x + x 3 + x 4. Olikhetern här är båd den ritmetisk-geometrisk olikheten för två tl. Från dett får vi sedn olikheten för tre tl. Låt nämligen x 1, x, x 3 vr givn och sätt x 4 = (x 1 + x + x 3 )/3. Då hr vi fyr tl och vi hr vist tt x 1 x x 3 x 4 ( ) 4 1 4 (x 1 + x + x 3 + x 4 ) = x 4 4 x 1 x x 3 x 3 4, vilket fktiskt är den ritmetisk-geometrisk olikheten för tre tl. För tt vis olikheten för ll n kn vi generliser det vi gjort. ) Vis den först för ll n = m på smm sätt som vi visde den för n = 4. Lättst genomför mn ett induktionsbevis. b) För tt vis den för ett n < m som inte är på smm form, gör vi som i fllet med n = 3 ovn. Vi lägger till så mång ritmetisk medelvärden som behövs för tt få m tl och upprepr resonemnget ovn. Detljern lämns till läsren.