Repetition DMI, m.m. Några begrepp. egenskap d. egenskap1

Relevanta dokument
Sensorer, effektorer och fysik. Analys av mätdata

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

Sensorer och elektronik. Analys av mätdata

Föreläsningsanteckningar till Linjär Regression

Lycka till och trevlig sommar!

4.2.3 Normalfördelningen

LINJÄR ALGEBRA II LEKTION 4

Linjär Algebra. Linjära ekvationssystem. Ax = b. Viktiga begrepp. Linjära ekvationssystem. Kolumnerna i A. Exempel. R (A) spänns upp av t.ex.

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

Formler och tabeller i statistik

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

f(x i ) Vi söker arean av det gråfärgade området ovan. Området begränsas i x-led av de två x-värdena där kurvan y = x 2 2x skär y = 0, d.v.s.

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

Korrelationens betydelse vid GUM-analyser

Borel-Cantellis sats och stora talens lag

REGRESSIONSANALYS S0001M

F15 ENKEL LINJÄR REGRESSION (NCT )

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Grundläggande matematisk statistik

Geodetisk och fotogrammetrisk mätnings- och beräkningsteknik

Fyra typer av förstärkare

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

Orderkvantiteter vid begränsningar av antal order per år

Specialfall inom produktionsplanering: Avslutning Planerings- Le 8-9: Specialfall (produktval, kopplade lager, cyklisk planering, mm) system

Något om beskrivande statistik

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Uppgift 3. (1p) Beräkna volymen av pyramiden vars hörn är A=(2,2,2), B=(2,3,4), C=(3,3,3) och D=(3,4,9).

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Strukturell utveckling av arbetskostnad och priser i den svenska ekonomin

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Kap. 1. Gaser Ideala gaser. Ideal gas: För en ideal gas gäller: Allmänna gaslagen. kraft yta

Tentamen STA A15 delkurs 1 (10 poäng): Sannolikhetslära och statistisk slutledning 3 november, 2005 kl

θx θ 1 om 0 x 1 f(x) = 0 annars

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

101. och sista termen 1

Geodetisk och fotogrammetrisk mätnings- och beräkningsteknik

1. BERÄKNING AV GRÄNSVÄRDEN ( då x 0 ) MED HJÄLP AV MACLAURINUTVECKLING. n x

F10 ESTIMATION (NCT )

5. Linjer och plan Linjer 48 5 LINJER OCH PLAN

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Introduktion till statistik för statsvetare

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

Tentamen i Linjär Algebra, SF december, Del I. Kursexaminator: Sandra Di Rocco. Matematiska Institutionen KTH

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Tenta i MVE025/MVE295, Komplex (matematisk) analys, F2 och TM2/Kf2

F7 PP kap 4.1, linjära överbestämda ekvationssystem

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

S0005M V18, Föreläsning 10

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Informationsåtervinning på webben Sökmotorernas framtid

Sida 1 av 12. vara ett inkonsistent system (= olösbart system dvs. ett system som saknar lösning). b =.

Formelsamling Ljud i byggnad och samhälle

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Normalfördelningar (Blom Kapitel 8)

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Tentamen i Sannolikhetsteori III 13 januari 2000

ÖPPNA OCH SLUTNA MÄNGDER. KOMPAKTA MÄNGDER. DEFINITIONSMÄNGD. INLEDNING. Några viktiga andragradskurvor: Cirkel, ellips, hyperbel och parabel.

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Föreläsning G70 Statistik A

1. Test av anpassning.

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Fördelningen för populationen som stickprovet togs ifrån är känd så nära som på ett antal parametrar, t.ex: N med okända

Formelblad Sannolikhetsteori 1

Trigonometriska polynom

Lycka till! I(X i t) 1 om A 0 annars I(A) =

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Tentamen 1 i Matematik 1, HF1903, Fredag 14 september 2012, kl

Tentamen i Elektronik, ESS010, del 2 den 14 dec 2009 klockan 14:00 19:00.

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Enkel slumpvandring. Sven Erick Alm. 9 april 2002 (modifierad 8 mars 2006) 2 Apan och stupet Passagesannolikheter Passagetider...

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

Centrala gränsvärdessatsen

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

EKVATIONER MED KOMPLEXA TAL A) Ekvationer som innehåller både ett obekant komplext tal z och dess konjugat z B) Binomiska ekvationer.

Föreläsning 10: Kombinatorik

Armin Halilovic: EXTRA ÖVNINGAR

Linjär Algebra, Föreläsning 9

Drivsystemelektronik \ Drivsystemautomation \ Systemintegration \ Service. Handbok. Tillverkning av kablar Kablar för synkrona servomotorer

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 26, 9/2 2011: y + ay + by = h(x)

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Övning 3 - Kapitel 35

Kontrollskrivning 3 i SF1676, Differentialekvationer med tillämpningar. Tisdag kl 8:15-10

Föreläsning 2: Punktskattningar

4. Uppgifter från gamla tentor (inte ett officiellt urval) 6

Flexibel konkursriskestimering med logistisk spline-regression

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Jag läser kursen på. Halvfart Helfart

Fourierserien. fortsättning. Ortogonalitetsrelationerna och Parsevals formel. f HtL g HtL t, där T W ã 2 p, PARSEVALS FORMEL

H1009, Introduktionskurs i matematik Armin Halilovic. använder vi oftast induktionsbevis.

Stången: Cylindern: G :

Datorövning 2 Fördelningar inom säkerhetsanalys

Transkript:

Repetto DMI, m.m. I. ermolog och Grudproblem II. Ljär algebra III. Optmerg IV. Saolkhetslära V. Parameterestmerg Några begrepp Möstervektor (egeskapsvektor/data) lsta med umerska värde som beskrver möstret. Brukar heta. egeskap egeskap 2 = M egeskap d varje egeskap ses som e koordat ett d-dmesoellt rum 2 Börvärde. Ofta vektor (eg. target vector, el. desred output) de vektor som hör hop med. brukar heta t, y eller d. Mösterrum v betraktar ett möster,, som e pukt ett vektorrum med dmeso d. E: 2 (vkt)........ perso. perso 2 (lägd) 3

Grudproblem DMI Klassfcerg (förk. klassg ) syoym: möstergekäg ästa syoym: detekto Regresso ästa syoym: fuktosappromato Kodg effektv represetato av data 4 För detta krävs... Mägd med trägseempel (trägsmägd) syoymer: desgeempel, trägsdata atge (a) X = {, t..., N, t N} eller (b) X = {,..., N } Ilärg syoymer: träg, parameterestmerg ka var övervakad (supervsed, fall (a)) eller oövervakad (usupervsed, fall (b)) 5 Övervakad lärg rägsdata X = {, t..., N, t N} Målet är att, baserat på trägsdata, skapa e fukto som, gvet, predkterar t. Valg vd klassfcerg att låta t vara e s.k. dkatorfukto? tˆ skattg/estmat/ appromato t 0 M = 0 M på pos. om C 0 aars 6 2

Oövervakad lärg rägsdata X = {,..., N } Mål: fa (oftast kompakt) represetato av, dvs koda eller komprmera syfte att: Förekla lösge av problem som ka beskrvas som övervakad lärg. Vsualsera (Kode y har typskt ma 3 dmesoer. Ka då plotta möstre som pukter sprdgsdagram.)? y? ˆ y har lägre dmeso ä ˆ 7 Eempel på oövervakad lärg Va prcpalkompoetaalys (PCA). Kode är kotuerlg. Olka former av klustrg. Kode är dskret (heltal) Herarksk klustrg K-meas clusterg (KMC) Kombatoer av PCA och klustrg 8 Flera begrepp Dskrmatfuktoer. förekommer vd klassfcerg. E fukto per klass (udatag ev. för 2-klassproblem) Beräkar poäg för ett möster,. g ( ) g ( 2 ) M g C () ma beslut 9 3

Beslutsområde ett område som assoceras tll e vss dskrmatfukto (klass) beslutsområdet för klass C är det område mösterrummet där g ( ) > g j ( ) för alla j Beslutsgräs/beslutsyta gräse mella två beslutsområde pukter på beslutsgräse deferas av ekv: g ( ) = g ( ) j 0 5 4 Data frå två klasser samt klassfcerares beslutsytor Beslutsomr. klass Data klass Data klass 2 beslutsyta 3 2 E: 2 0 - Beslutsomr. klass 2 Beslutsomr klass 2-2 -2-0 2 3 4 5 II. Ljär algebra Hur ma läser matrs/vektor-uttryck lättare Deftoer: eller W = y y = M, = y ( w L w ) u Dessutom U = u m d där w M m d M w = M w k mk och k radvektorer av dmeso d w W = M wm L L w w d M md 2 4

Hur ma läser... (a) Matrs/vektorprodukt sett som e vktad summa av kolumvektorer y = W = d k = w k k (b) Matrs/vektorprodukt sett som e sere skalärprodukter u y = U = M um 3 Hur ma läser... (c) Matrs/matrs-produkt sett som e sere matrs/vektor-produkter Blda Y = ( y y ), X = ( L ) Y = WX = L N N ( W L ) W N Egevärde (evä) och egevektorer (eve) Def. A = λ evä eve A är kvadratsk matrs 4 Avädbart verktyg : spåret (trace) av e matrs def: A) = ( A), tr(, egeskaper (se utdelat papper) Erbjuder ofta ett kompakt skrvsätt för uttryck som ehåller summor e: Krterefukto vd ljär regresso (OLS) 2 J ( W) = y yˆ = ( y W ) ( y W ) k k k dvs summa av dagoalelemete ka skrvas J ( W) = tr ( Y WX) ( Y WX) Y = ( y y ), X ( L ) med = ( ) L N N 5 5

Problem: mmera * söker vektor = III. Optmerg f () arg m Lokalt mmum deferas av m.a.p, dvs v f ( ) f f f ( ) = 0, där f ( ) = samt att H > 0 2 M Hessae 6 Metoder för optmerg gradetmetode (steepest descet) Newtos metod: Ide appromera fuktoe (lokalt) med e aylorutvecklg upp tll kvadratska termer. Mmera seda dea kvadratska fukto. Fördel: Mkt sabb koverges ära ett mmum Problem: Kräver att Hessae är pos. def. om dmesoe för är stor, stora beräkgar 7 Optmerg uder bvllkor * söker = arg m f ( ), b.v. c ( ) = 0, för =,..., Elgt Lagrage: Om är ett lok. m. tll f(.) (och uppfyller bvllkore) så esterar * λ,..., λk sådaa att och λ,..., λ K L(, λ,..., λk ) = 0 c ( ) = 0, λ 0 för alla L, λ,..., λ ) = f ( K ( ) λc( ) uppfyller ekv. K 8 6

IV. Saolkhetslära saolkhet assoceras med utsagor, te A= det regar Skövde I=vår bakgrudsformato A I) utläses: saolkhet att utsaga A är sa, gvet att I är sa. Egeskap: 0 A) Räkeregler för saolkheter Produktregel: A,B I)=A B,I)B I) och gvet att 9 Räkeregler, forts Summaregel: A eller B I)=A I)+B I)- A,B) Kosekves av produktregel: Bayes sats Gäller att P ( A, B I) = B, A I) P ( A B, I) B I) = B A, I) A I) A B, I) B I) P ( B A, I) = A I) Specalfall av summaregel: Om A och B är uteslutade (ka ej ske samtdgt) A eller B I)=A I)+B I), ty A,B I)=0 20 äthetsfördelg (pdf) för skalär, Beteckas p(). Egeskap p( ) 0. E b fukto såda att E: pdf för Normalfördelade 0.4 P ( a b) = p( ) d a 0.35 0.3 0.25 p() 0.2 0.5 Area=0.5 < <.5) 0. 0.05 0-3 -2-0 2 3 2 7

äthetsfördelg (pdf) för vektor, Beteckas p(). Egeskap: p( ) 0. betydelse : p ( ) = p(, 2,..., d ). Produktregel gäller, dvs = ( ),..., p (, 2,..., d ) = p( 2,..., d ) p( 2,..., d ). osv. Bladg av dskreta och kotuerlga varabler möjlgt, te p, klasstllhörghet C ) = p(, C ) = p( C ) C ) ( d förkortat skrvsätt 22 llämpg av shtslära om MI Ata att dras frå olka klasser med a pror-saolkheter P C C,...,C c C ) ( ),..., c Olka pdf:er, p( C),..., p( Cc), för varje klass Mmerg av felsaolkhet leder tll de optmala beslutsregel: väljc om C ) C j ) för alla j a-posterorsaolkhetera C ) fås va Bayes sats p( C ) C ) C ) = måste val. p( ) skattas 23 Några vktga begrepp: Vätevärde m = E[ ] = p( ) d =... p( ) dd... d2d 2 d ka tolkas som e tygdpukt för e massfördelg, p(). Kovarasmatrs ' [( m)( m) ] = ( m)( C = E m)' p( ) d ger formato om fördelges sprdg aalyseras m.h.a prcpalkompoetaalys 24 8

Betgad pdf, E: y och är skalärer. De har smultaa pdf:e p(,y) p(y ) beteckas p(y ) täthetsfördelge för y då är låst. Betgat vätevärde m y = E[ y ] = y p( y )dy y ygdpukte lägs dea lje 2003-08-22 Sgaler & System 25 Valgt e på vektorvärd pdf, ormalfördelge: kovarasmatrs p() = e (2π ) d / 2 C / 2 d=dmeso 2003-08-22 vätevärde ( m ) ' C ( m ) 2 determat Sgaler & System 26 V: Parameterskattg Problem: V har data X = {,..., N } som atas vara draga frå pdf p() som har käd parametrsk form. Parametraras värde är dock okäda. e: V atar att är ormalfördelad med vätevärde m och kovaramatrs C. vå (besläktade) prcper för parameterskattg: Mamum lkelhood (ML) Mamum a posteror (MAP) 2003-08-22 Sgaler & System 27 9

ML: MAP: Låt θ betecka e vektor som ehåller alla okäda parametrar θˆ θˆ ML = arg ma p( X θ ) = arg ma p( θ X ) MAP = s.k. lkelhoodfukto arg ma p( X θ ) p( θ ) s.k. pror Obs: om p(θ ) är relatvt kostat för θ ett stort område så sammafaller ML- och MAPskattgara 28 0