Samverkande Expertnät



Relevanta dokument
5 Kontinuerliga stokastiska variabler

Summor av slumpvariabler

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Avd. Matematisk statistik

Diskussionsproblem för Statistik för ingenjörer

Storräkneövning: Sannolikhetslära

Tentamen MVE300 Sannolikhet, statistik och risk

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

Tentamen MVE265 Matematisk statistik för V,

ARIMA del 2. Patrik Zetterberg. 19 december 2012

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Steg 4. Lika arbeten. 10 Diskrimineringslagen

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

FÖRELÄSNING 1 ANALYS MN1 DISTANS HT06


Föreläsning 9: Hypotesprövning

Inference in multiplicative pricing

Tidsserier och Prognoser

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Flera kvantifierare Bevis Direkt bevis Motsägelse bevis Kontrapositivt bevis Fall bevis Induktionsprincipen. x y (x > 0) (y > 0) xy > 0 Domän D = R

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Kunna beräkna medelantal kunder för alla köer i ett könät med återkopplingar. I denna övning kallas ett kösystem som ingår i ett könät oftast nod.

Hantering av urvalsbias i KPI

Reglerteori, TSRT09. Föreläsning 4: Kalmanfiltret & det slutna systemet. Torkel Glad. Reglerteknik, ISY, Linköpings Universitet

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

TAIU07 Matematiska beräkningar med Matlab

Tentamen i Matematisk statistik Kurskod S0001M

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Wienerprocesser. Finansiell statistik, vt-05. Enkel slumpvandring. Enkel slumpvandring. Varför: model för aktiekurs (dock med aber...

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Kapitel IV. Partikeltalet som termodynamisk variabel & faser

Basbyte (variabelbyte)

Problem: BOW Bowling. Regler för Bowling. swedish. BOI 2015, dag 1. Tillgängligt minne: 256 MB

CRAMO INSTANT STATISKA BERÄKNINGAR MODULTYP C40 KARLSTAD Tommy Lindvall

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Omtentamen i DV & TDV

Lösningsförslag

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

TATA42: Föreläsning 10 Serier ( generaliserade summor )

Tentamen i Matematisk statistik Kurskod S0001M

Industriell matematik och statistik, LMA /14

Föreläsning 8: Konfidensintervall

Västsvenska paketet Skattning av trafikarbete

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Kalibreringsrapport. Utländska doktorander

Artificiell intelligens Probabilistisk logik

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Monte Carlo-simulering. EG2205 Föreläsning 15 18, vårterminen 2015 Mikael Amelin

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Övningar för finalister i Wallenbergs fysikpris

Elektromagnetiska fält och Maxwells ekavtioner. Mats Persson

MODELLERING AV DYNAMISKA SYSTEM OCH INLUPP 2

Dekomponering av löneskillnader

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

AMatematiska institutionen avd matematisk statistik

Så undviker du att få höra klyschor en miniguide för dig som rekryterar

Regressionsanalys av huspriser i Vaxholm

Resultat. Principalkomponentanalys för alla icke-kategoriska variabler

1 Cirkulation och vorticitet

Utbudsidan Produktionsteori

Årsrapport Huvudman Landstinget i Uppsala län UPPSALA. 2 Årsrapport 2011

Fingerprint Matching

STYRNING AV PORTFÖLJER MED FLERA TILLGÅNGAR

TMS136. Föreläsning 1

2. Komma igång Skapa grupper och elever Skriv också ut sidan 13 så att eleverna har en snabbguide till programmet.

Repetitionsuppgifter i Matematik inför Basår. Matematiska institutionen Linköpings universitet 2014

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: minuter beroende på variant Material: TI-82/83/84 samt tärningar

Matematisk statistik för B, K, N, BME och Kemister

Ekonomisk styrning Delkurs Finansiering

Introduktion. Exempel Övningar Lösningar 1 Lösningar 2 Översikt

TSRT09 Reglerteori. Sammanfattning av Föreläsning 3. Sammanfattning av Föreläsning 3, forts. Sammanfattning av Föreläsning 3, forts.

STATISTISKA CENTRALBYRÅN

Olle gillar hållbarhet! Några tankar om hur man kan arbeta med hållbarhet på många nivåer.

Att göra spel med Game Maker. Rum. Grundläggande delar. Gamemaker, dagens föreläsning. Programmeringsmodell

Föreläsning 11. Giriga algoritmer

Europeiska unionens råd Bryssel den 11 maj 2015 (OR. en)

24 oktober 2007 kl. 9 14

Spänning. Sluten krets, kopplingsschema, seriekoppling, parallellkoppling.

Problemet löd: Är det möjligt att på en sfär färga varje punkt på ett sådant sätt att:

Träningssplan: vecka 1-6

Manual. Logga in. OBS! Kontrollera så att korrekt epostadress finns ifyllt. Ändra inga andra uppgifter!

Linjär regressionsanalys. Wieland Wermke

Resultatet läggs in i ladok senast 13 juni 2014.

Träd. Sats. Grafer. Definition. En fullständig graf har en båge mellan varje par av noder. Definition

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

6.2 Partikelns kinetik - Tillämpningar Ledningar

Välkomna till KUSK utbildningsprojekt. Kunskap, utveckling, statistik, kommunikation

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) kl 08-13

Facit till Några extra uppgifter inför tentan Matematik Baskurs. x 2 x

Transkript:

1 Samverkande Expertnät 2 3 1 2 3 Parallella nätverk Sammanvägning av svaren Två olika fördelar Utjämna egenheter hos nätverken Låt nätverken specialisera sig Egenskaper hos ett enkelt nätverk Överträning kan undvikas genom att avbryta inlärning i förtid Ger upphov till ett systematiskt fel Övertränade nät undviker detta men ger stor varians Medelvärdet av flera nät minskar variansen

Ensemble Averaging Träna flera nät Samma nätstruktur Samma träningsdata Olika startvärden för vikterna Överträna gärna näten Använd nätens medelsvar Näten tenderar att hamna i olika lokala minima Medelvärdet jämnar ut variationerna

1 2 3 Träna flera nätverk på olika uppsättningar träningsexempel Sekvensiell approach Använd tidigt tränade nät för att hitta besvärliga träningsexempel Träna senare nät i första hand på de besvärliga exemplen genom Klassisk (Schapire, 1990) 1 Träna nät 1 2 Filtrera träningsexemplen genom nät 1 Behåll lika många exempel där nät 1 svarar fel som när det svarar rätt 3 Träna nät 2 på dessa filterade exempel 4 Filtrera fram de träningsexempel där nät 1 och nät 2 svarar olika 5 Träna nät 3 med dessa exempel genom filtrering kräver många träningsexempel Onödigt många exempel kastas bort Alternativa metoder viktar istället om sannolikheten/vikten för olika träningsexempel Svaret från kommittémaskinen sätts samman som medelvärdet eller majoritetssvaret från de tre näten. Adaptive (Freund och Schapire, 1996) Batch learning Styr aktivt sannolikheten att de olika exemplen används Exempel som klassas fel får större sannolikhet i nästa nät Grindnätet viktar nätens svar beroende på hur bra de olika näten blev AdaBoost 1 Starta med att alla exempel är lika sannolika 2 Upprepa för i = 1..n: 1 Träna nät i 2 Mät hur ofta nätet gör fel ɛ i 3 β i = ɛi 1 ɛi 4 Minska sannolikheten för alla rätt klassade exempel med faktorn β i 3 Vikta nätens svar med log 1 β i

1 2 3 Statisk sammanvägning Dynamisk sammanvägning Modell av verkligheten Data kan höra till flera olika kategorier Varje kategori har data med en enkel fördelning Olika kategorier förekommer med olika sannolikhet Enkelt Mixture-of-Experts nät Expertnäten Enlagers linjära enheter y k = w T k x Idé: nätverken ska vara experter för var sin kategori grindnätet väljer vilken expert som har rätt Grindnätet Viktande enligt SoftMax y = k y k φ( a k T x) där φ(u k) = eu k i eu i Gradientföljning Träning av ett Mixtures-of-Experts nät Gradientföljning Maximera Log-Likelihood för observerade data Funktion av nätens vikter Experternas vikter justeras i proportion till hur mycket grindnätet tror på experten Grindnätets vikter uppdateras så att det bättre svarar mot hur väl experterna beskrev träningsdata

Betrakta kategorierna som icke observerbara variabler Upprepa 1 Skatta sannolikheten för olika kategorier för varje mönster 2 Uppdatera parametrarna för kategorin så att de stämmer med skattningen E-steget Räkna ut sannolikheten för att ett mönster x hör till kategorin u givet parametrarna ˆΘ P(u x, ˆΘ) M-steget Beräkna nya parametrar Θ som maximerar förväntad likelihood Θ = argmax Θ P(u x, ˆΘ) log P(x, u Θ) u Klassiskt EM-problem Mix av två normalfördelningar Bestäm centrum för båda fördelningarna < µ 1, µ 2 > Q i,j = P(u i x j, < µ 1, µ 2 >) = e (x j µ i ) 2 /2σ 2 k e (x j µ k ) 2 /2σ 2 µ i = 1 m m Q i,j x j j=1