Cocktailnålar i kemikaliehöstackar
|
|
- Niklas Nilsson
- för 7 år sedan
- Visningar:
Transkript
1 Cocktailnålar i kemikaliehöstackar - en statistikers irrfärder i toxikologins värld... Erik Lampa Arbets- och miljömedicin Institutionen för medicinska vetenskaper Uppsala Universitet
2 Introduktion Påverkas människor av kemikalier? En titt i PubMed...
3 Introduktion Det traditionella synsättet Vi är exponerade för många ämnen samtidigt Traditionell riskbedömning fokus på ett ämne i taget Nästan aldrig tillämpbart i verkligheten
4 Introduktion Kemiska cocktails (mixtures) Shaken, not stirred... Produkter som innehåller > 1 kemikalie Kemikalier som släpps ut gemensamt, ex. avgaser Kemikalier som finns samtidigt i miljön
5 Varför bry sig? Introduktion Backhaus T et al. The single substance and mixture toxicity of quinolones to the bioluminescent bacterium Vibrio fischeri, Aquatic Toxicology, 49(1-2), 49-61, 2000
6 Introduktion Två sidor av samma mynt Independent Action Kemikalierna verkar oberoende av varandra Oftast orimligt antagande Concentration Addition Kemikalierna verkar beroende av varandra Interaktionseffekter
7 Några kunskapsluckor Introduktion CA kräver kända dos-respons-samband Kunskap om mekanismer hos människor Verktyg för att identifiera / predicera mixtureeffekter
8 Mission impossible? Introduktion Identifiera relevanta kemikalier Hitta interaktioner bland många kemikalier Identifiera icke-linjära effekter... utan några egentliga hypoteser (!!)
9 Några metoder som inte fungerar så bra En titt i verktygslådan Vanlig regression N << p Stegvis regression multipla jämförelser, samt N << p Pre-conditioning med LASSO Skapa modellmatrisen, icke-linjära termer, standardisering, tolkning
10 En titt i verktygslådan Regressionsträd Hanterar stökiga interaktioner Ej känsliga för monotona transformationer av förklarande variabler Ej känsliga för outliers hos förklarande variabler Hanterar bortfall hos förklarande variabler Hanterar mixade variabeltyper Enkla att tolka Dålig prediktiv förmåga Dålig hantering av kontinuerliga variabler För mycket fokus på interakioner?
11 En titt i verktygslådan Exempel Prediktion av ozonnivåer 1 temperature < 82.5 >= wind 9 wind >= 7.15 < 7.15 >= 10.6 < radiation 11 temperature < 79.5 >= temperature < 88.5 >= 88.5 < 77.5 >= 77.5 Node 4 (n = 18) Node 6 (n = 32) Node 7 (n = 18) Node 8 (n = 9) Node 10 (n = 7) Node 12 (n = 13) Node 13 (n = 14)
12 En titt i verktygslådan Stokastisk gradientboosting Hastie T., Tibshirani R., Friedman J. (2008) The Elements of Statistical Learning, kapitel 10 Anpassar en additiv modell M F(x) = β m b(x; γ m ) m=0 med mål att minimera en förlustfunktion L(y, F(x)) b(x; γ m ) är oftast regressionsträd
13 En titt i verktygslådan Generell boostingalgoritm 1 Välj L[y, F(x)] 2 Sätt F 0 (x) till en konstant 3 För m=1 till M 1 Dra ett stickprov med storleken η L[y,F (x)] 2 Beräkna r = F (x) Fm(x)=F m 1 (x) och anpassa ett regressionsträd g(x) till r 3 Uppdatera F m (x) = F m 1 (x) + ɛβ m g(x) 4 Repetera många gånger 0 < ɛ 1 är en regulariseringsparameter som begränsar varje träds inflytande på F (x) och reducerar överanpassning. β är steglängden längs gradienten. M kan väljas mha korsvalidering.
14 En titt i verktygslådan Minsta kvadratboosting 1 Börja med F 0 (x) = ȳ och residual r = y ȳ, m = 0 2 m m Anpassa ett regressionsträd g(x) till r 4 Uppdatera F m (x) = F m 1 (x) + ɛβ m g(x) r r ɛβ m g(x) och repetera steg 2 4 många gånger
15 En titt i verktygslådan Variabelbetydelse och partiella beroenden Boostade modeller är svåra att tolka Betydelsen av variabler är relaterade till antalet split fler split, större betydelse Partiella beroendefunktioner kan ge en visuell bild av effekter och används för att utvärdera interaktioner P-värden, konfiensintervall?
16 Interaktioner En titt i verktygslådan Friedman J.H., Popescu B. E. (2008) Predictive learning via rule ensembles The Annals of Applied Statistics, Vol. 2, No. 3, Om x j och x k inte interagerar så är det partiella beroendet F jk (x j, x k ) = F j (x j ) + F k (x k ) Definiera H som ett mått på interaktion, 0 H 1 ( ) Fjk F j F k H = f F jk Generaliserar till interaktioner av högre ordning
17 En titt i verktygslådan Referensfördelning för H Skapa referensfördelning för H (H 0 ) mha boostrapvariant Beräkna upprepade H 0 från artificiella data {ỹ, x} N 1 genererade från riktiga data genom ỹ = F A (x) + [y p F A (x p )] eller Pr(ỹ = 1) = [1 + exp( F A (x))] 1 p är en permutering av 1,..., N. F A (x) är en funktion bestående av träd innehållande en variabel ("stumps"). RuleFit - Träd + Linjära termer + LASSO
18 Mjukvara En titt i verktygslådan R gbm, mboost, GAMboost, bst, CoxBoost, GMMBoost,... SAS SAS Enterprise Miner STATA boost Salford Systems TreeNet
19 En enkel simulering Simulering Skapa y = F(x) + ɛ där F(x) = 11 4 exp( 3(1 s(x i )) 2 ) 1.3sin 2 (π s(x 5 )) i=1 och ɛ N(0, σ 2 ) och σ väljs så att signal to noise ratio är 2, 1, 0.5 och 0.1 x är fem olika kemikalier (pcb170, dde, mmp, cd och ) simulerat från verkliga data innehållande 37 kemikalier, N = 1000.
20 Simulering En enkel simulering Medelvärden av 100 repitioner av 10-faldig korsvalidering i varje punkt SNR = 2 SNR = 1 Squared error loss Squared error loss Tree size Tree size SNR = 0.5 SNR = Squared error loss Squared error loss Tree size Tree size
21 En enkel simulering Variabelbetydelse Simulering SNR = 2 SNR = 1 Variable influence Variable influence cd pcb170 mmp dde pcb169 pcb153 pcb126 mn pcb209 cd mmp pcb170 dde pcb126 pcb169 mn mibp pcb209 SNR = 0.5 SNR = 0.1 Variable influence Variable influence cd dde mmp pcb170 pcb126 mn pcb169 pb mibp cd dde mn mmp pcb170 pcb126 pb tnk mibp
22 En enkel simulering Interaktioner då SNR = 0.5 Simulering Total interaction strength SNR = way interactions with Cd Interaction strength Interaction strength cd mmp dde pcb170 mn pcb126 pcb169 mibp pb mmp dde pcb170 mn pcb126 pcb169 mibp pb 3 way interactions with Cd and MMP 4 way interactions with Cd, MMP and DDE Interaction strength Interaction strength dde pcb170 mn pcb126 pcb169 mibp pb pcb170 mn pcb126 pcb169 mibp pb
23 En enkel simulering Interaktioner då SNR = 0.1 Simulering Total interaction strength SNR = way interactions with DDE Interaction strength Interaction strength cd dde pcb170 mmp mn pcb126 pb mibp pcb169 cd pcb170 mmp mn pcb126 pb mibp pcb169 3 way interactions with DDE and PCB170 3 way interactions with DDE and MMP Interaction strength Interaction strength cd mmp mn pcb126 pb mibp pcb169 cd pcb170 mn pcb126 pb mibp pcb169
24 En enkel simulering Interaktionen mellan Cd och PCB170 Simulering True relationship SNR = cd cd pcb pcb170 SNR = 0.5 SNR = cd 6 cd pcb170 pcb170
25 Simulering En enkel simulering Icke-linjärt samband SNR = 2 SNR = Predicted response Predicted response SNR = SNR = Predicted response Predicted response
26 Riktiga data PIVUS Prospective Investigation of the Vasculature in Uppsala Seniors 1016 st 70-åringar i Uppsala län Läkarundersökning, blodprov kemikalier uppmätta i blod Uppföljning 75 år och 80 år Finns det något samband mellan kemikalier och åderförkalkning?
27 Typisk artär Riktiga data Källa: mmlee/webproject2.html
28 Riktiga data Ultraljudsmått i en halspulsåder IMT Kärlväggens tjocklek IM-GSM Kärlväggens ekogenicitet. Gråskala, relaterad till kompositionen i kärlväggen. "Klassiska" riskfaktorer: rökning, kolesterol, blodtryck, blodsocker, vikt, triglycerider, (kön)
29 Strategi Riktiga data L = 1 2 [y F(x)]2 Bestäm optimal storlek på träden samt M mha 10-faldig korsvalidering upprepad 100 gånger Om optimal trädstorlek > 1, Bestäm H för de 10 mest betydelsefulla variablerna och utvärdera interaktioner
30 IMT Riktiga data Squared error loss Variable importance Tree size sbp weight cd glucose pcb126 ldl dbp pcb209 tg hdl
31 Riktiga data IMT Partiella beroenden IMT IMT Systolic blood pressure Fasting blood glucose IMT IMT Cd PCB126
32 IM-GSM Riktiga data Squared error loss Variable importance Tree size mmp mehp mibp tg ni dde weight pcb126 bpa
33 Riktiga data IM-GSM Interaktioner Total interaction strength Two way interactions with MiBP mehp tg ni dde weight pcb126 bpa mmp mehp mibp tg ni dde weight pcb126 bpa mmp mehp tg ni Adjusted H dde weight pcb126 bpa Adjusted H Adjusted H Three way interactions with MMP and MiBP Adjusted H Three way interactions with MeHP and MiBP mmp tg ni dde weight pcb126 bpa
34 Riktiga data IM-GSM Partiella beroenden MMP MiBP interaction MeHP MiBP interaction mibp 60 mibp mmp mehp
35 Till slut Summering Hittar vi nålarna? Mixtureeffekter = interaktioner mellan kemikalier Boostade regressionsträd kan hitta komplexa interaktioner Andra (enklare) metoder? Biologisk relevans?
36 Tack till... Till slut Monica Lind, Uppsala Universitet Lars Lind, Uppsala Universitet Anna Bornefalk Hermansson, UCR
Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1
Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β
Läs merUpprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merFormler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Läs merFinansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Läs merÄR EXPONERING FÖR MILJÖGIFTER EN BIDRAGANDE ORSAK TILL UPPKOMST AV VÅRA STORA FOLKSJUKDOMAR?
ÄR EXPONERING FÖR MILJÖGIFTER EN BIDRAGANDE ORSAK TILL UPPKOMST AV VÅRA STORA FOLKSJUKDOMAR? Monica och Lars Lind Uppsala Universitet what we have to face is not an occasional dose of poison which has
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merRegression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
Läs merMultivariabel statistik
Multivariabel statistik beware of the wolf Johan Lindbäck Uppsala Clinical Research Center Kvalitetsregisterforskningskonferens Arlanda 26 maj 2015 J Lindbäck (UCR) Multivariabla modeller 26/5 2015 2/36
Läs mer732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29
732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann
Läs mera) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal
Läs merRegressions- och Tidsserieanalys - F3
Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när
Läs merHöftledsdysplasi hos dansk-svensk gårdshund
Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merExempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Läs merBild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Läs merFinansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Läs merFöreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merEnlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät
Artificiella Neuronnät 1 Karaktäristiska egenskaper Användningsområden Klassiska exempel Biologisk bakgrund 2 Begränsningar Träning av enlagersnät 3 Möjliga avbildningar Backprop algoritmen Praktiska problem
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merTentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14
STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Läs merRegressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Läs merMatematisk statistik 9 hp Föreläsning 4: Flerdim
Matematisk statistik 9 hp Föreläsning 4: Flerdim Johan Lindström 3+4 september 26 Johan Lindström - johanl@maths.lth.se FMS2 F4: Flerdim /5 Transformer Inversmetoden Transformation av stokastiska variabler
Läs merLösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se
Läs merTentamen Tillämpad statistik A5 (15hp)
Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik
Läs merSkrivning i ekonometri lördagen den 25 augusti 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE31 Sannolikhet, statistik och risk 218-1-12 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Läs merLösningsförslag till tentamen i SF1861 Optimeringslära för T. Torsdag 28 maj 2010 kl
Lösningsförslag till tentamen i SF86 Optimeringslära för T. Torsdag 28 maj 2 kl. 4. 9. Examinator: Per Enqvist, tel. 79 62 98. (a) Inför variablerna x = (x sr, x sm, x sp, x sa, x sd, x gr, x gm, x gp,
Läs merF11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Läs merStokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Läs merFöreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs mer732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 9 Bertil Wegmann IDA, Linköpings universitet December 1, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B December 1, 2016 1 / 20 Metoder för att analysera tidsserier Tidsserieregression
Läs merANOVA Faktoriell (tvåvägs)
ANOVA Faktoriell (tvåvägs) Faktoriell ANOVA (tvåvägs) Två oberoende variabel ( tvåvägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser.
Läs merD. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.
1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.
Läs merRegressions- och Tidsserieanalys - F7
Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys
Läs mer8.1 General factorial experiments
Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter.
Läs merMatematisk statistik kompletterande projekt, FMSF25 Övning om regression
Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse
Läs merTENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merF16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data
Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merMULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla
Läs merSambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.
PM315 HT016 Emma äck Formelsamling Centralmått Typvärde T Median Md ritmetiska medelvärdet Det mest frekventa värdet Det mittersta värdet i en rangordnad fördelning = n Spridningsmått Variationsvidd (Range)
Läs merVarför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov
Summer Science Camp, Tjärnö, 8 August 2012 Varför statistik? Serik Sagitov http://www.math.chalmers.se/ serik/ Avdelningen för matematisk statistik Matematiska Vetenskaper Chalmers Tekniska Högskola och
Läs merMälardalens Högskola. Formelsamling. Statistik, grundkurs
Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken
Läs merViktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.
Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Frida Eek
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merSkrivning i ekonometri lördagen den 29 mars 2008
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan
Läs merObligatorisk uppgift, del 1
Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten
Läs merStatistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merLösningsförslag till tentamen Torsdag augusti 16, 2018 DEL A
Institutionen för matematik SF1626 Flervariabelanalys Torsdag augusti 16, 2018 DEL A 1. Givet funktionen f(x, y) = ln(x 2 y 2 ). a) Bestäm definitionsmängden D för f. Rita även en bild av D. (2 p) b) Bestäm
Läs merStokastiska vektorer
TNG006 F2 9-05-206 Stokastiska vektorer 2 Kovarians och korrelation Definition 2 Antag att de sv X och Y har väntevärde och standardavvikelse µ X och σ X resp µ Y och σ Y Då kallas för kovariansen mellan
Läs merRegressions- och Tidsserieanalys - F3
Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion
Läs merTenta i Statistisk analys, 15 december 2004
STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.
Läs merFöreläsning 9: Linjär regression del II
Föreläsning 9: Linjär regression del II Johan Thim (johan.thim@liu.se) 29 september 2018 No tears, please. It s a waste of good suffering. Pinhead Vi fixerar en vektor u T = (1 u 1 u 2 u k ), där u i kommer
Läs mer729G43 Artificiell intelligens (2016) Maskininlärning 2. Marco Kuhlmann Institutionen för datavetenskap
729G43 Artificiell intelligens (2016) Maskininlärning 2 Marco Kuhlmann Institutionen för datavetenskap Förra gången: Gradientsökning tangentens lutning i punkt θ steglängdsfaktor Översikt Introduktion
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs mer5B1817 Tillämpad ickelinjär optimering. Metoder för problem utan bivillkor, forts.
5B1817 Tillämpad ickelinjär optimering Föreläsning 5 Metoder för problem utan bivillkor, forts. A. Forsgren, KTH 1 Föreläsning 5 5B1817 2006/2007 Lösningar För en given metod blir en lösning den bästa
Läs merI. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
Läs merPreliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merMatematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Läs merEnkel linjär regression. Enkel linjär regression. Enkel linjär regression
Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs merLösningsförslag till tentamen i SF1861 Optimeringslära för T. Onsdag 25 augusti 2010 kl
Lösningsförslag till tentamen i SF86 Optimeringslära för T. Onsdag 25 augusti 2 kl. 4. 9. Examinator: Per Enqvist, tel. 79 62 98. (a) Vi har ett nätverksflödesproblem med 5 noder. Låt x = (x 2, x 3, x
Läs merLösningar till SPSS-övning: Analytisk statistik
UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt
Läs merFöreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B
Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7
Läs merI en deterministisk omgivning beror nästa tillstånd bara av agentens handling och nuvarande tillstånd.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merLycka till!
Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och
Läs merArtificiella Neuronnät
Artificiella Neuronnät 2 3 4 2 (ANN) Inspirerade av hur nervsystemet fungerar Parallell bearbetning Vi begränsar oss här till en typ av ANN: Framåtkopplade nät med lagerstruktur 3 4 Fungerar i princip
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 120113 För att bli godkänd på inlämningsuppgiften krävs att man
Läs merTentamen i Beräkningsvetenskap II, 5.0 hp,
Uppsala universitet Institutionen för informationsteknologi Beräkningsvetenskap Stefan Engblom, tel. 471 27 54, Per Lötstedt, tel. 471 29 72 Tentamen i Beräkningsvetenskap II, 5.0 hp, 2016-03-16 Skrivtid:
Läs merST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?
ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test? Mikael Eriksson Specialistläkare CIVA Karolinska Universitetssjukhuset, Solna Grund för hypotestestning 1. Definiera noll- och alternativhypotes,
Läs merSamhällsvetenskaplig metod, 7,5 hp
Samhällsvetenskaplig metod, 7,5 hp Provmoment: Individuell skriftlig tentamen kvantitativ metod, 2,0 hp Ladokkod: 11OA63 Tentamen ges för: OPUS kull H13 termin 6 TentamensKod: Tentamensdatum: Fredag 24
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs merUppgift a b c d e f (vet ej) Poäng
TENTAMEN: Statistisk modellering för I3, TMS161, måndagen den 9 januari 2006 kl 8.30-11:30 på V. Jour: Magnus Karlsson, tel: 772 42 91. Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd
Läs merMULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?
MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.
Läs merTillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.
UPPSALA UNIVERSITET Matematiska institutionen Erik Broman, Jesper Rydén TENTAMEN I MATEMATISK STATISTIK Sannolikhet och statistik 1MS5 214-1-11 Skrivtid: 8.-13.. För betygen 3, 4 resp. 5 krävs 18, 25 resp.
Läs merFORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
Läs merMissing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21
Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.
Läs merInstruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet
1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 130114 För att bli godkänd på inlämningsuppgiften krävs att man
Läs merFöreläsning 7: Stokastiska vektorer
Föreläsning 7: Stokastiska vektorer Johan Thim johanthim@liuse oktober 8 Repetition Definition Låt X och Y vara stokastiska variabler med EX = µ X, V X = σx, EY = µ Y samt V Y = σy Kovariansen CX, Y definieras
Läs merlokalt vårdprogram för hälso- och sjukvården i södra Älvsborg
Bilaga 6 200-0-09 8 Behandlingsprogram - livsstilsgrupper Bakgrund Övervikt och fetma är ett stort och växande samhällsproblem. I Sverige har antalet personer med fetma nästan fördubblats under de senaste
Läs merMSG830 Statistisk analys och experimentplanering
MSG830 Statistisk analys och experimentplanering Tentamen 8 juni 2015, 8:30-12:30 Examinator: Staan Nilsson, telefon 073 5599 736, kommer till tentamenslokalen 9:30 och 11:30 Tillåtna hjälpmedel: Valfri
Läs merAnalytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs mer