Analys av DNA-kopietal med dolda markovmodeller
|
|
- Ove Lind
- för 7 år sedan
- Visningar:
Transkript
1 -kopietal Analys av -kopietal med dolda markovmodeller Lund, 8 juni 2011
2 -kopietal Disputerade den 22 oktober 2010 i matematisk statistik vid Matematikcentrum, Lunds Universitet Modelling Allelic and Copy Number Variations using Continuous-index Hidden Markov Models Handledare: Tobias Rydén
3 -kopietal Normalt har vi människor 46 kromosomer formade i 23 par En kopia i varje par kommer från vardera föräldern Ibland förekommer vissa segment av en kromosom i er eller färre kopior än två - kopietalsförändringar Har mest studerat cancerceller, men kopietalsförändringar förekommer även hos personer med tex autism eller schitzofreni
4 -kopietal En extra kopia
5 -kopietal En kopia saknas
6 -kopietal Data Array Comparative Genomic Hybridization (acgh) Test- märks med en uorescerande färg och referens- märks med en annan uorescerande färg Test- och referens- delas i små bitar, blandas och hybridiseras på en microarray där varje prob motsvarar en kort -sekvens Arrayer bestrålas med laser och intensiteten i de två emmiterade strålarna mäts och jämförs med varandra Intensitetskvoten är 2/2 om provet är normalt, 1/2 om det saknas en kopia, 3/2 om det har en extra kopia, osv Kvoten transformeras med log 2, vilket gör att normalnivån 2/2 hamnar på 0.
7 -kopietal Data log 2 ratio Base pairs x 10 7
8 -kopietal Markovkedjor Låt X = {X 0, X 1,..., X n } vara en stokastisk process som antar värden i ett diskret tillståndsrum Markovvillkoret: P(X k+1 = j X 0 = x 0, X 1 = x 1,..., X k 1 = x k 1, X k = i) = P(X k+1 = j X k = i) för alla i, j, x 0,..., x k 1. Övergångssannolikheter p ij = P(X k+1 = j X k = i), samlas i en övergångsmatris, P.
9 -kopietal Denition av dolda markovmodeller Vi observerar Y = {Y 0, Y 1,..., Y n } Underliggande markovkedja, X Y är betingat oberoende givet X Y k beror enbart på X k Antar en fördelning för mätfelet, dvs för Y k X k = i
10 -kopietal Markovkedjor och kopietal Varje kromosom modelleras med en Markovkedja. Möjliga utfall är antalet kopior av test-t: 0, 1,..., m Intilligande prober har ofta lika många kopior, dvs markovkedjan stannar ofta kvar i samma tillstånd. Intilligande prober kan även ha olika många kopior och markovkedjan byter då tillstånd, "hoppar".
11 -kopietal acgh-data log 2 ratio Base pairs x 10 7 Data innehåller olika typer av mätfel, så det vi observerar är inte de logaritmerade kopietalen Lämplig modell är därför dolda markovmodeller (Hidden Markov Models, HMM)
12 -kopietal Dolda markovmodeller och acgh-data Vi observerar de uppmätta log 2 -kvoterna Y Vi vill veta kopietalen, X. En vanlig modell är att Y k X k = i N(µ i, σ 2 ) Idealt µ i log 2 -kvoten av ett heltal dividerat med 2, men passar ofta dåligt på grund av systematiska fel, såsom normalinblandning
13 -kopietal Framåt - bakåt Vill hitta den mest troliga Markovprocessen, X, utifrån de mätningar vi har av Y-processen. Smoothing- fördelningen P(X k = i y 0,..., y n ) Vanligaste och enklaste metoden är framåt-bakåt-algoritmen α k (i) = P(X k = i, y 0,..., y k ) β k (i) = P(y k+1,..., y n X k = i)
14 -kopietal Framåt - bakåt Låt täthetsfunktionen för Y k X k = i vara g k (i) α och β kan beräknas rekursivt α k (j) = r p i=1 ijg k (j)α k 1 (i) β k (i) = r j=1 p ijg k+1 (j)β k+1 (j) α och β bör normeras då de annars kan växa/avta exponentiellt P(X k = i y 0,..., y n ) α k (i)β k (i)
15 -kopietal Skatta parametrar Framåt-bakåt-algoritmen förutsätter att parametrarna är kända Oftast är parametrarna okända Parametrar som behöver skattas: Övergångssannolikheterna P = [p ij ] Medelnivåerna µ = µ 1,..., µ m, Mätfelets varians σ 2 Den vanligaste metoden för att att skatta parametrar till en dold markovmodell är EM-algoritmen
16 -kopietal EM-algoritmen EM-algoritmen är en iterativ metod för att hitta MLE av parametrarna θ E-steg: Väntevärdet E θ [log p(x, y; θ ) y] beräknas M-steg: Maximering av väntevärdet ger θ EM-algoritmen är designad för maximering av likelihood då det nns en icke-observerbar vaiabel. Passar bra till dolda markovmodeller och kombineras då med framåt-bakåt variablerna För att rekonstruera Markovprocessen utifrån de skattade parametrarna och data används ofta Viterbi-algoritmen.
17 -kopietal Egenskaper hos data Data från tiling BAC-arrayer Långa mätningar Mätningarna är ojämnt spridda över genomet Mätningarna har olika längd Mätningarna kan överlappa Data från oligonuclotide-arrayer Korta mätningar Mätningarna är ojämnt spridda över genomet Markovkedja som är diskret i observationerns är ingen bra modell Diskret i basparen skulle teoretiskt fungera, men svårt numeriskt Bättre med en Markovprocess med kontinuerligt index
18 -kopietal Markovprocess med kontinuerligt index Markovprocess: X = X (t), t = 0 : T Markovvillkoret: P(X (t n+1 = i n+1 ) X (t n ) = i n, X (t n 1 ) = i n 1,..., X (t 0 = i 0 )) = P(X (t n+1 = i n+1 X (t n ) = i n ) för alla i 0,..., i n+1 och alla tidpunkter t 0 t 1 t n+1. Övergångsintensiteter, q ij, denieras som P(X (t + h) = j X (t) = i) = q ij h + o(h) q i = j i q ij
19 -kopietal BAC-data log 2 ratio Base pairs x 10 7
20 -kopietal BAC-data Längd: kbp, kan överlappa Modell: Dold markovprocess med kontinuerligt index Maximalt fem tillstånd ( Y k X (t) N t stop k 1 t start k t stop k t start k µ X (t) dt, σ 2 ) Inferensmetod: MCEM dvs EM-algorimen där E-steget approximeras med Monte Carlo-simuleringar av Markovprocessen
21 -kopietal BAC-data
22 -kopietal BAC-data log 2 ratio Base pairs x 10 7
23 -kopietal Hopptidpunkt Antag att X (T 1 ) = i, X (T 2 ) = j Tätheten för hopptidpunkten blir då proportionell mot: q ij exp( q i (t T 1 ))exp( q j (T 2 t)) k g(y k x) Alternativt kan denna uppskattas utifrån Monte-Carlo-simuleringarna
24 -kopietal Hopptidpunkt log 2 ratio Base pairs x 10 7
25 -kopietal Kontinuerligt utfallsrum Om det är många tillstånd så blir det för många hoppintensiteter för att de ska kunna skattas bra. Fem tillstånd ger 20 hoppintensiteter Alternativ modell Kontinuerligt utfallsrum för Markovprocessen Normaltillstånd µ 0 En intensitet γ för hopp till normaltillståndet från ett icke-normalt tillstånd. En intensitet λ för hopp till något icke-normalt tillstånd antingen från normaltillståndet eller från ett annat icke-normalt tillstånd. De icke-normala tillstånden har täthet κ. Tidsreversibel process
26 -kopietal Modell för mätfelen Y k = µ k + σɛ k BAC-data: µk = 1 t stop k t start k Oligonukleotid-data t stop k t start k X (t) dt Probernas längd är försumbar; t k = (t stop k µ k = X (t k ) t start k )/2 ɛ k är oberoende, likafördelade stokastiska variabler som representerar mätfelet och E(ɛ k ) = 0, V(ɛ k ) = 1.
27 -kopietal Skattningar Baysiansk modell, där vi antar apriori-fördelningar för alla parametrar Parametrarna, σ 2, µ 0, (ν), γ, λ, ρ, skattas med hjälp av MCMC-metoder (Gibbs sampling, Metropolis-Hastings). För att rekonstruera Markovprocessen använder vi en MCMC-metod designad för den här modellen. För oligonukleotid-data kan även en varaint av EM-algoritmen användas
28 -kopietal Jämförelse av metoder log 2 ratio Base pairs x 10 8
29 -kopietal SNP-data Antag att det nns två varianter av varje allel; A och B. I friska celler nns då de möjliga genotyperna AA, AB och BB. I sjuka celler kan det nnas för många eller för få kopior av den ena eller av båda allelerna. Exempel är LOH, då de enda möjligheterna är AA och BB. SNP data innehåller en A-intensitet och en B-intensitet. Vid basparsposition t kc, är de uppmätta intensiteterna y kc = (y Akc, y Bkc ).
30 -kopietal (A 0kc +2A 1kc, B 0kc), (A 0kc +A 1kc, B 0kc +B 1kc), (A 0kc, B 0kc +2B 1kc)
31 -kopietal Modell Låt X c (t) vara en Markovprocess för kromosom c med tillstånd: Tillstånd Genotyper Tillstånd Genotyper 1 {AA, AB, BB} 9 {AAA, AAB, ABB, BBB} 2 { } 10 {4A, 3AB, A3B, 4B} 3 {A, B} 11 {5A, 4AB, A4B, 5B} 4 {AA, BB} 12 {6A, 5AB, A5B, 6B} 5 {AAA, BBB} 13 {4A, 2A2B, 4B} 6 {4A, 4B} 14 {5A, 3A2B, 2A3B, 5B} 7 {5A, 5B} 15 {6A, 4A2B, 2A4B, 6B} 8 {6A, 6B} 16 {6A, 3A3B, 6B} Beteckna tillstånd 1, {AA, AB, BB}, normaltillstånd och övriga är då icke-normaltillstånd.
32 -kopietal Väntevärdet för prob k i kromosom c om den tillhör tillstånd i och genotyp j. µ kcij = (µ Akcij, µ Bkcij ) = (A 0kc + g Aij A 1kc, B 0kc + g Bij B 1kc) där g Aij och g Bij är antalet kopior av de två allelerna. Vi antar att f Ykc X c(t kc )=i(y) = j w kcij f (y X c (t kc ) = i, S kc = j), där S kc är genotypen och f ( S kc = j, X c (t kc ) = i) är en bivariat normalfördelning med väntevärde µ kcij och kovariansmatris Σ kcij och w kcij är Hardy-Weinberg-vikter som också skattas från normalproven.
33 -kopietal Inblandning av normal-celler Det är svårt att vid biopsier plocka ut enbart vävnad från tumörceller utan oftast kommer lite av omgivande celler med också. Låt γ vara andelen normalvävnad, då är 1 γ andelen cancervävnad. (g γ A, g γ B ) = ((1 γ)g A + γg N A, (1 γ)g B + γg N B ). För LOH, med genotyper AA och BB blir de olika genotyperna vid normalinblandning 2A, (2 γ)aγb, γa(2 γ)b och 2B.
34 -kopietal Resultat Markov state Base pairs Base pairs x 10 Copy number x 10
35 A allele A allele -kopietal B allele B allele (1 + γ)a, Aγ B, γ AB, (1 + γ)b AA, AB, BB
36 -kopietal Referenser HMM och kopietal: Stjernqvist (2010) Modelling Allelic and Copy Number Variations using Continuous-idex Hidden Markov Models Fridlyand et al (2004) Hidden Markov models approach to the analysis of array CGH data HMM Cappe et al (2005) Inference in Hidden Markov Models Data: Jönsson et al (2007) High-resolution genomic proles of breast cancer cell lines assessed by tiling BAC array comparative genomic hybridization Greenman et al (2010) PICNIC: an algorithm to predict absolute allelic copy number variation with microarray caner data
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
Läs merMarkovkedjor. Patrik Zetterberg. 8 januari 2013
Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)
Läs merFöreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Läs merSF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Läs merSF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh
SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag Jörgen Säve-Söderbergh Väntevärde för en funktion av en stokastisk variabel Om
Läs merMatematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk
Läs merFORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Läs merMatematisk statistik 9hp Föreläsning 7: Normalfördelning
Matematisk statistik 9hp Föreläsning 7: Normalfördelning Anna Lindgren 29+3 september 216 Anna Lindgren anna@maths.lth.se FMS12/MASB3 F7: normalfördelning 1/18 Kovarians, C(X, Y) Repetition Normalfördelning
Läs merFöreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Läs merSF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på
Läs mer1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5
LÖSNINGAR TILL Matematisk statistik Tentamen: 29 7 kl 8 3 Matematikcentrum FMSF45 Matematisk statistik AK för D,I,Pi,F, 9 h Lunds universitet MASB3 Matematisk statistik AK för fysiker, 9 h. För tiden mellan
Läs merStokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Läs merPROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 3 Markovprocesser 13 April 2016 Johan Westerborn Markovprocesser (1) Föreläsning 3 Föreläsningsplan 1 Förra Föreläsningen 2 Markovprocesser
Läs merTAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65
Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................
Läs merFORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 8 Johan Lindström 9 oktober 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F8 1/26 process Johan Lindström - johanl@maths.lth.se FMSF45/MASB3
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merMatematisk statistik KTH. Formel- och tabellsamling i matematisk statistik
Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 3 Markovprocesser 16 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 3 Föreläsningsplan 1 Förra Föreläsningen 2 Markovprocesser
Läs merLycka till!
VK Matematiska institutionen avd matematisk statistik TENTAMEN I 5B1555 DATORINTENSIVA METODER ONSDAGEN DEN 24 MAJ 2006 KL 14.00 19.00. Examinator: Gunnar Englund, tel. 7907416. Email: gunnare@math.kth.se
Läs merFöreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Läs merKapitel 5 Multivariata sannolikhetsfördelningar
Sannolikhetslära och inferens II Kapitel 5 Multivariata sannolikhetsfördelningar 1 Multivariata sannolikhetsfördelningar En slumpvariabel som, när slumpförsöket utförs, antar exakt ett värde sägs vara
Läs merKurssammanfattning MVE055
Obs: Detta är enbart tänkt som en översikt och innehåller långt ifrån allt som ingår i kursen (vilket anges exakt på hemsidan). Fullständiga antaganden i satser kan saknas och fel kan förekomma så kontrollera
Läs merSF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018
SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 11 INTERVALLSKATTNING. Tatjana Pavlenko 24 april 2018 PLAN FÖR DAGENS FÖRELÄSNING Vad är en intervallskattning? (rep.) Den allmänna metoden för
Läs merSannolikheter och kombinatorik
Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 9 Johan Lindström 16 oktober 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 1/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03
Läs merF9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
Läs merStatistiska metoder för säkerhetsanalys
F7: Bayesiansk inferens Klassisk vs Bayesiansk Två problem Klassisk statistisk inferens Frekventistisk tolkning av sannolikhet Parametrar fixa (ofta okända) storheter Skattningar och konfidensintervall
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 5 Markovprocesser 24 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 5 Föreläsningsplan 1 Förra Föreläsningen 2 Poissonprocessen
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 5 Markovprocesser 2 Maj 2016 Johan Westerborn Markovprocesser (1) Föreläsning 5 Föreläsningsplan 1 Förra Föreläsningen 2 Poissonprocessen
Läs merMatematisk statistik 9hp Föreläsning 2: Slumpvariabel
Matematisk statistik 9hp Föreläsning 2: Slumpvariabel Anna Lindgren 6+7 september 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F2: Slumpvariabel 1/23 Begrepp Samband Grundläggande begrepp Utfall
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merFöreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
Läs merOm Markov Chain Monte Carlo
Om Markov Chain Monte Carlo Gunnar Englund Matematisk statistik KTH Ht 2001 1 Inledning Markov Chain Monte Carlo MCMC är en modern teknik att simulera komplicerade fördelningar som har fått stora tillämpningar
Läs merExtrauppgifter i matematisk statistik
Extrauppgifter i matematisk statistik BT 2014 1. Mängden A är dubbelt så sannolik som B. Hur förhåller sig P(A B) till P(B A)? 2. Två händelser A och B har sannolikheter skilda från noll. (a) A och B är
Läs merTvå parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge
Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 28-9-3 Normalfördelningen, X N(µ, σ) f(x) = e (x µ)2 2σ 2, < x < 2π σ.4 N(2,).35.3.25.2.5..5
Läs merFormler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Läs mer1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.
Tentamenskrivning för TMS63, Matematisk Statistik. Onsdag fm den 1 juni, 16, Eklandagatan 86. Examinator: Marina Axelson-Fisk. Tel: 7-88113. Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik
Läs merLINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1
LINKÖPINGS UNIVERSITET Matematiska institutionen EXAM TAMS 5 / TEN januari 08, klockan 4.00-8.00 Examinator: Jörg-Uwe Löbus (Tel: 0709-6087) Tillåtna hjälpmedel är en räknare, formelsamling i matematisk
Läs merDemonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Läs merSF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 5. Kovarians, korrelation, väntevärde och varians för summor av s.v.:er, normalfördelning (del 1) Jan Grandell & Timo Koski 15.09.2008 Jan Grandell &
Läs merTMS136. Föreläsning 5
TMS136 Föreläsning 5 Två eller flera stokastiska variabler I många situationer är det av intresse att betrakta fler än en s.v. åt gången Speciellt gör man det i statistik där man nästan alltid jobbar med
Läs mer4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
Läs merMatematisk statistik TMS064/TMS063 Tentamen
Matematisk statistik TMS64/TMS63 Tentamen 29-8-2 Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof
Läs merTMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
Läs merFinansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 4 Markovprocesser 20 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 4 Föreläsningsplan 1 Förra Föreläsningen 2 Innbäddade
Läs merEnvägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Läs merTentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd
Läs merSF1911: Statistik för bioteknik
SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion
Läs merSF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 4 7 november 2017 1 / 29 Idag Förra gången Viktiga kontinuerliga fördelningar (Kap. 3.6) Fördelningsfunktion (Kap. 3.7) Funktioner av stokastiska
Läs merMarkov Chain Monte Carlo, contingency tables and Gröbner bases
Markov Chain Monte Carlo, contingency tables and Gröbner bases Diaconis, P., Sturmfels, B. (998. Algebraic algorithms for sampling from conditional distributions. Gunnar Englund Annals of Statistics Vol.
Läs merJörgen Säve-Söderbergh
SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 8 Binomial-, hypergeometrisk- och Poissonfördelning Exakta egenskaper Approximativa egenskaper Jörgen Säve-Söderbergh Binomialfördelningen
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
Läs merFöreläsning 2, FMSF45 Slumpvariabel
Föreläsning 2, FMSF45 Slumpvariabel Stas Volkov 2017-09-05 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F2: Slumpvariabel 1/23 Begrepp Samband Grundläggande begrepp och beteckningar Utfall resultatet
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merSF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 7 15 november 2017 1 / 28 Lite om kontrollskrivning och laborationer Kontrollskrivningen omfattar Kap. 1 5 i boken, alltså Föreläsning
Läs merFÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Läs merMatematisk statistik för D, I, Π och Fysiker
max/min Matematisk statistik för D, I, Π och Fysiker Föreläsning 5 Johan Lindström 25 september 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F5 1/25 max/min Johan Lindström - johanl@maths.lth.se
Läs merTENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL
Avd. Matematisk statistik TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL 8.00 13.00. Examinator: Björn-Olof Skytt tel. 790 86 49 Kursansvarig: Björn-Olof Skytt tel. 790 86 49 Tillåtna
Läs merFöreläsningsanteckningar till kapitel 8, del 2
Föreläsningsanteckningar till kapitel 8, del 2 Kasper K. S. Andersen 4 oktober 208 Jämförelse av två väntevärden Ofte vil man jämföra två eller fler) produkter, behandlingar, processer etc. med varandra.
Läs merTAMS79 / TAMS65 - vt TAMS79 / TAMS65 - vt Formel- och tabellsamling i matematisk statistik. TAMS79 / TAMS65 - vt 2013.
Formel- och tabellsamling i matematisk statistik c Martin Singull 2 Innehåll 3.3 Tukey s metod för parvisa jämförelser.................... 14 1 Sannolikhetslära 5 1.1 Några diskreta fördelningar.........................
Läs merBayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 3 - Överanpassade modeller, regularisering, informationskriterium, modelljämförelse, Markov chain Monte Carlo (MCMC) Bertil Wegmann STIMA, IDA, Linköpings universitet
Läs merTMS136. Föreläsning 5
TMS136 Föreläsning 5 Två eller flera stokastiska variabler I många situationer är det av intresse att betrakta fler än en s.v. åt gången Speciellt gör man det i statistik där man nästan alltid jobbar med
Läs merLÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp
LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.
Läs merTentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.
Läs mer4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler
Föreläsning 2 4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler Stokastiskavariabler Stokastisk variabel (eng: random variable) En variabel vars värde
Läs merFMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, 8-5-4 EXEMPEL: Hur mycket kunder förlorar vi om vi höjer biljettpriset?
Läs merExempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Läs merP =
Avd. Matematisk statistik TENTAMEN I SF297 (f d 5B157) TILLFÖRLITLIGHETSTEORI LÖRDAGEN DEN 2 OKTOBER 21 KL 1. 18.. Examinator: Gunnar Englund, tel. 79716, e-postadress: gunnare@math.kth.se Tillåtna hjälpmedel:
Läs merFöreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
Läs merHärledning av Black-Littermans formel mha allmänna linjära modellen
Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs merProblemdel 1: Uppgift 1
STOCKHOLMS UNIVERSITET MT 00 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, CH 8 februari 0 LÖSNINGAR 8 februari 0 Problemdel : Uppgift Rätt svar är: a) X och X är oberoende och Y och Y
Läs merhistogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 4, 28-3-27 EXEMPEL: buss. Från en busshållplats avgår en buss var 2 min (inga
Läs merFACIT: Tentamen L9MA30, LGMA30
Göteborgs Universitetet GU Lärarprogrammet 20 FACIT: Tentamen L9MA0, LGMA0 Matematik för lärare, åk 7-9, Sannolikhetslära och statistik, Matematik för gymnasielärare, Sannolikhetslära och statistik 20-0-2
Läs merTentamen i FMS180/MASC03 Markovprocesser
Matematisk statistik Matematikcentrum Lunds Universitet Tentamen i FMS80/MASC03 Markovprocesser 009-05-5 Lösningsförslag. Följande är en möjlighet. 6 5 3 4 Här är tillstånden, och 3 transienta, tillstånd
Läs merSF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski
SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 2 Markovprocesser 4 April 2016 Johan Westerborn Markovprocesser (1) Föreläsning 2 Föreläsningsplan 1 Förra Föreläsningen 2 Absorption
Läs merMarkovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 2 Markovprocesser 30 Mars 2015 Johan Westerborn Markovprocesser (1) Föreläsning 2 Föreläsningsplan 1 Förra Föreläsningen 2 Absorption
Läs merKap 2. Sannolikhetsteorins grunder
Kap 2. Sannolikhetsteorins grunder Olika händelser och deras mängbetäckningar Sats 2.7 Dragning utan återläggning av k element ur n (utan hänsyn till ordning) kan ske på ( n ) olika sätt k För två händelser
Läs merhistogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF5: Matematisk statistik för L och V OH-bilder på föreläsning 4, 27--8 EXEMPEL: buss. Från en busshållplats avgår en buss var 2 min (inga
Läs merFinansiell statistik FÖRELÄSNING 11
Finansiell statistik FÖRELÄSNING 11 Slumpvandring Brownsk rörelse 4 maj 2011 14:52 Pär och Pål Pär och Pål spelar ett hasardspel mot varandra upprepade gånger. Pär vinner = Pål betalar en krona. Pål vinner
Läs merUppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion
Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
Läs merDel I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...
Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för
Läs merSF1901: Sannolikhetslära och statistik
SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska
Läs merStokastiska processer och simulering I 24 maj
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd. Matematisk statistik 24 maj 2016 Lösningar Stokastiska processer och simulering I 24 maj 2016 9 14
Läs merTAMS79: Föreläsning 10 Markovkedjor
TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.
Läs merFÖRELÄSNING 7:
FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merEXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):
Läs merSF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde
Läs mer