MVE235 Matematisk Orientering Matematisk statistik med tillämpningar från AI till forensik

Relevanta dokument
Sammanställning av kritiken mot medicinska åldersbedömningar år 2017 och framåt

Bayes i praktiken. exempel och reflektioner från en forskarutbildningskurs. Ralf Rittner, Arbets och Miljömedicin

Kurser inom profilen Teknisk matematik (Y)

Statistiska metoder för säkerhetsanalys

Citation for the original published paper (version of record): N.B. When citing this work, cite the original published paper.

Kvalitetsgranskning av knäbedömningar i medicinska åldersbedömningsärenden

MVE051/MSG Föreläsning 7

Tentamen MVE301 Sannolikhet, statistik och risk

Bayesiansk statistik, 732g43, 7.5 hp

Filoson bakom Bayesiansk statistik med tillämpningar inom hjärnavbildning och budgivningar på ebay

Probabilistisk logik 1

Tentamen MVE301 Sannolikhet, statistik och risk

Bayesiansk statistik utan tårar

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 7. Statistikens grunder.

Regression med Genetiska Algoritmer

Bayesiansk statistik, 732g43, 7.5 hp

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

NAMAS, Masterprogram i matematisk statistik, 120 högskolepoäng Master Programme in Mathematical Statistics, 120 credits

Föreläsning 12: Regression

Markov Chain Monte Carlo, contingency tables and Gröbner bases

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Tentamen MVE302 Sannolikhet och statistik

7.5 Experiment with a single factor having more than two levels

Vad är risk? Exempel misslyckande. Olika synsätt och möjligheter för undersökning och efterbehandling. Vad är riskbaserad beslutsanalys?

b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)

Hantering av osäkerheter vid riskbedömningar

Probabilistisk logik 2

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

de var svåra att implementera och var väldigt ineffektiva.

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Demonstration av laboration 2, SF1901

Differentiell psykologi

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Bayesiansk statistik, 732g43, 7.5 hp

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen MVE300 Sannolikhet, statistik och risk

Hur måttsätta osäkerheter?

Medicinsk åldersbedömning. så här går det till

F3 Introduktion Stickprov

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

MVE051/MSG Föreläsning 14

Lektionsanteckningar 11-12: Normalfördelningen

Vad beror benägenheten att återvinna på? Annett Persson

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Föreläsning 11: Mer om jämförelser och inferens

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

NATURVETENSKAPLIGA FAKULTETEN

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Coalescent trees in phylogenetic inference

Medicinsk Informatik VT 2005

Optimeringslara = matematik som syftar till att analysera och. Optimeringslara ar en gren av den tillampade matematiken.

Utbildningsplan för Masterprogram i matematiska vetenskaper (N2MAT)

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Valresultat Riksdagen 2018

2 Dataanalys och beskrivande statistik

Lycka till!

Kvalitativ metodik. Varför. Vad är det? Vad är det? Varför och när använda? Hur gör man? För- och nackdelar?

PROGRAMFÖRKLARING III

NAMAS, Masterprogram i matematisk statistik, 120 högskolepoäng Master Programme in Mathematical Statistics, 120 credits

Laboration 3: Hierarkiska binomialmodeller i R

Stokastiska processer med diskret tid

Sannolikhetslära och statistik, grundkurs

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

ÄMAD04, Matematik 4, 30 högskolepoäng Mathematics 4, 30 credits Grundnivå / First Cycle

Lärmål Sannolikhet, statistik och risk 2015

STATISTISK ANALYS AV KOMPLEXA DATA

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 1: Introduktion

Datorövning 1: Fördelningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Regressionsmodellering inom sjukförsäkring

Statistikens grunder HT, dagtid Statistiska institutionen

Dnr Komm2018/01085/S 1985:A. Oklarheter kring medicinska åldersbedömningar i asylprocessen

GÖTEBORGS UNIVERSITET Naturvetenskapliga fakultetsnämnden. Utbildningsplan för Matematikprogrammet (N1MAT) 1. Beslut om fastställande. 2.

SF1901: Medelfel, felfortplantning

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Studieplan för utbildning på forskarnivå i datalogi

Statistiska metoder för säkerhetsanalys

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Matematisk statistik för D, I, Π och Fysiker

FÅ FRAM INDATA. När inga data finns!? Beslutsfattarens dilemma är att det är svårt att spå! Särskilt om framtiden!

Om Markov Chain Monte Carlo

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Optimering och simulering: Hur fungerar det och vad är skillnaden?

Metod och teori. Statistik för naturvetare Umeå universitet

Föreläsning 5. Kapitel 6, sid Inferens om en population

Transkript:

MVE235 Matematisk Orientering 2018-12-05 Matematisk statistik med tillämpningar från AI till forensik Petter Mostad Chalmers December 9, 2018 1 / 35

Innehåll Matematisk statistik. Bayesiansk statistik. Tillämpningsområde: AI och maskinlärning. Tillämpningsområde forensisk statistik: Medicinsk åldersbedömning DNA-tester för släktsskap Andra exempel på forensiska tillämpningar Vetenskapsteori. 2 / 35

Matematisk statistik Statistik är sammanställning och uppsummering av data. Matematisk statistik är att använda probabilistiska modeller och data för att göra probabilistiska prediktioner. Det finns olika paradigmer för hur man gör detta bäst (e.g. frekventistisk och Bayesiansk statistik). Hur man gör prediktioner baserad på data är nåt många i dag förbinder med maskininlärning, neurala nät och Artificiell Intelligens. Grunderna i dessa teknologier kan sägas vara probabilistiska modeller, och speciellt Bayesiansk statistik. 3 / 35

Stokastiska modeller och Bayesiansk staistik En stokastisk (eller probabilistisk) modell är en samling slumpvariabler som representerar observerbara delar av någon begränsad del av verkligheten. De variablerna som representerar nåt som inte är observerad ger då en probabilistisk prediktion av detta. Hur tar man fram en stokastisk modell från data? De vanligaste sätten är frekventistisk och Bayesiansk. Det frekventistiska sättet är att presentera en modell med vissa parametrar θ, och sen estimera parametrarna från data. Det Bayesianska sättet är att presentera en modell där både θ, data, och det man vill predikera ingår som slumpvariabler. Man tar sen fram den betingade modellen där data-variablerna har de observerade värdena. 4 / 35

Exempel: Modellering av oljereservoar 5 / 35

Enklare exempel Anta du gentar liknande oberoende försök 8 gångar. Antag sannolikheten för success är θ i varje försök. Antag 3 av 8 försök gav success. Vad är sannolikheten för success i nionde försöket? Frekventistisk lösning: 3/8. Bayesiansk lösning: En apriori sannolikhetsfördelnign för θ etableras, baserat på kontexten försöken görs i. En posteriori sannolikhetsfördeling för θ tas fram, betingat på observerade data. En prediktion för nionde försöket görs baserad på posteriorifördelningen för θ. 6 / 35

Bayesiansk vs. frekventistisk Filosofi: Vad är sannolikhet? (Existerar den objektivt eller bara subjektivt?) Frekventister: Den Bayesianska lösningen är inte vetenskaplig, då den baserar sig på annat än data. Speciellt: Man kan faktiskt få villket resultat som hellst baserat på hur man väljer prior. Bayesianer: Man vill faktiskt anpassa prediktionen till kontexten. Till exempel: Om prediktionen skulle vara sannolikhet 0/8 för success, så passar denna prediktionen ofta inte med det man annars tror, från kontexten. I dag: De flesta är agnostiker, och använder metoder som de tycker passar till uppgiften. 7 / 35

Grundläggande verktyg i Bayesiansk statistik Analytiska beräkningar (bara för enklaste modeller). Numeriska beräkningar (e.g., numerisk integration...) Simuleringar: Markov Chain Monte Carlo (MCMC), Sequential Monte Carlo, etc. Några nyare approximativa metoder, oftast för mera speciella modeller. Några kurser (där jag är lärare): MVE550 Stokastiska processer och Bayesiansk inferens MVE187 Beräkningsmetoder för Bayesiansk statistik Exempel (från MVE550): Kryptografiproblem löst med MCMC. 8 / 35

Tillämpning: Artificiell Intelligens och maskinlärning Detta är en grupp teknologier som är mycket omtalade nu. Exempel: AlphaGo Zero. Ingredienser som gör AI-framgångarna möjliga: Datorkapasitet. Sensorer / kommunikation. Metoder för processering av stora datamängder. Teoretiska / matematiska modeller för hur lärning kan göras. Några matematiska modeller som används: Neurala nät (kan sägas vara en generalisering av logistisk regression). Generellt: Stokastiska modeller, ofta med Bayesiansk uppdatering. Optimal inlärning, kan vara baserat på Bayesiansk beslutsteori. Optimeringsteori. 9 / 35

AI vid Chalmers och Matematiska Vetenskaper Ett antal nya forskningsprojekt inom matematik för AI har startats denna hösten. Stöd av Wallenbergfondet. Sammarbete mellan datalogerna och matematikerna. Många nya doktorander. Några exempel på projekt: Optimal transport. Kopplingar till teoretisk fysik. Inlärning med fel i data. Jag: Ett nytt projekt om modellval för neurala nät. Doktorand: Anton Johansson. Ett äldre projekt om exakt inferens för Bayesianska nätverk. 10 / 35

Exakt inferens för grafiska nätverk θ τ0 θi θc θs τ1 xij xc,j xs,j H Bilderna viser Bayesianska nätverk (BN): En viktig representation av stokastiska modeller. För många BN så är inferensmetoderna 1 approximativa: Baserad på simulering. Vi har jobbat på att utöka klassen av BN där beräkningar kan göras exakt eller effektivt med hjälp av numerisk integration. Del av doktorandprojekt för Ivar Simonsson. 11 / 35

Forensisk statistik Definition: Användning av statistik som verktyg inom forensiska vetenskaper, alltså vetenskap använt på juridiska frågeställningar. Några exempel: DNA-spår i kriminalfall: Hur kan man hitta rätt match? Hur vad är beviskraften i en match? Andra spår i kriminalfall. DNA testing av släktskapsförhållanden. Bestämning av dödstidspunkt vid dödsfall. Åldersbedömning av asylsökande. En generell fråga är om Bayesiansk eller frekventistisk paradigm används. Inom Bayesiansk paradigm kan man använda teori för beslut under osäkerhet. På Nationalt Forensisk Center (NFC) i Linköping används i ökande grad Bayesiansk tänk. Men det varierar mycket mellan olika tillämpningsområden. 12 / 35

Exempel: Medicinsk åldersbedömning Observation av medicinska karakteristika ( indikatorer ) som ändras vid hyfsat fasta åldrar. Exempel: Tänder Olika delar av skelettet Pubertetsindikatorer, vikt, längd,... Psyko-social mognad DNA-data, e.g., telomerlängd. Många olika syften Välj indikatorer som ändras mycket runt åldern relevant för syftet. Syftet här: Bedöma över/under 18 år. Ofta använda indikatorer: Tänder, handledsmognad, nyckelbensmognad. 13 / 35

Exempel: Visdomständer Man tittar på rötternas utveckling, och använder röntgenbilder. Klassificeringsschema: Demirjian (finns även andra) Speciellt visdomständer ändrar sig till sin mogna form (H) i slutet av tonåren. Åldern då en person får mogna visdomständer varierar med ett par-tre år. Åldern beror även på kön. Beroenden på genetisk bakgrund och uppväxtvillkor diskuteras. 14 / 35

Exempel: Knän Man använder NMR undersökning, inte röntgenbilder. Undersökning av distal femur, och dens tillväxtzon. Metoder varierar. Åldern för mognad är oftast i sena tonåren. Variation, och beroenden på kovariater som kön, genetisk bakgrund, och uppväxtvillkor är inte mycket undersökt. 15 / 35

Åldersbedömning av asylsökare i Sverige Under 2014-15 ansökte 244.178 personer om asyl i Sverige. Bland dessa: 42.418 ensamkommande. För 2016-17 sjönk siffrorna till 52.667 och 3435. Behandling av en asylansökan är starkt beroende av om personen är över eller under 18 år. Juridiskt åligger det asylsökaren att styrka sin identitet, inkluderat ålder. Personer från Afghanistan/Somalia/... saknar ofta dokumentation som intyger ålder. Om dokumentation finns så anses den inte trovärdig av Migrationsverket. Några asylsökare tog tidigare själva initiativ till medicinsk åldersbedömning. 16 / 35

Standardiserad åldersbedömning via Rättsmedicinalverket Sedan 2017 erbjuds asylsökare standardiserad åldersbedömning via Rättsmedicinalverket (RMV) som alternativ till att Migrationsverket fastställer åldern. Andra åldersbedömningar accepteras inte. RMV outsourcer insamling av data till olika laboratorier: Röntgenbilder av visdomständer och NMR av knän. Experter, två för varje datatyp, bestämmer om åldersindikatorn är mogen, inte mogen, eller inte bedömbar. Båda experter behöver bedöma indikatorn som mogen för att den skall anses vara mogen. Åt andra hållet så bedöms personen vara över 18 år om minst en av indikatorna är mogen (gäller killar). MÄRK: RMV producerar olika textliga konklutioner i några olika fall. Migrationsverkets beslut görs dock i regel bara på grundlag denna konklutionen, och på ett sätt som motsvarar beskrivningen över. 17 / 35

Problemer med denna beslutsprocedur Oftast ser man bort från all osäkerhet i metoden. Beslut om ålder baseras bara på RMVs konklution. Ingen annan information i fallet tas hänsyn till. Metodens egenskaper som beslutsregel är högst oklara: Ingen valideringsstudie, där metoden har använts på personer med känd ålder, har publicerats. Ett antal gångar har det framkommit information som gör det naturligt att ifrågasätta RMVs egen beskrivning av metodens egenskaper. T.ex.: Bedömning av tjejer. Second-opinion värdering av knä-data gav nytt resultat i 55% av 137 fall. Antalet killar med moget knä och omogen tand är 4-5 gångar så många som antalet med omoget knä och mogen tand. Svårt att förklara om, som RMV har angett, tänder mognar tidigare än knän. 18 / 35

Kan statistiska metoder öka kunskapen om egenskaperna till RMVs metod? Jag önskade ta reda på hur mycket det går att säga om metoden, och om undersökta asylsökares ålder, med den information som finns. Tillgängliga data: Klassificeringsdata för killar, 2017: Moget knä Omoget knä Inga data SUMMA Mogen tand 4176 348 187 4711 Omogen tand 1735 1087 83 2905 Inga data 1364 237 63 1664 SUMMA 7275 1672 333 9280 I tillägg all information som finns i literaturen om åldersindikatorerna. Jag ansökte Juni 2017 om mera specifika data från RMV. Jag har mottagit data november 2018. Mostad, Tamsen: Error Rates for Unvalidated Medical Age Assessment Procedures publicerat i International Journal of Legal Medicine. Link 19 / 35

Mognad av en åldersindikator som funktion av ålder Parametrar θ k = (θ k1, θ k2, θ k3, θ k4 ) beskriver relationen mellan kronologisk ålder x och åldersindikator k (k = 1: tand, k = 2: knä). ( p k1 (x) = (1 p k3 (x)) Φ x θk1 P(mogen) ( ( )) p k2 (x) = (1 p k3 (x)) 1 Φ x θk1 θ k2 P(omogen) p k3 (x) = θ k3 + θ k4 (x 20) P(inga data) Below: θ 11 = 19.5, θ 12 = 2, θ 13 = 0.1, and θ 14 = 0.01. θ k2 ) An age indicator model: θ 13 No observation Probability 0.0 0.4 0.8 Immature θ 11 θ 12 θ 11 θ 11 +θ 12 Mature 16 18 20 22 24 26 Age 20 / 35

Modellvariabler θ = (θ 1, θ 2 ) = ((θ 11,..., θ 14 ), (θ 21,..., θ 24 )): Parametrar för modeller för åldersindikatorer. ψ = (ψ 1,..., ψ 100 ): Sannolikhetsvektor med sannolikheter att testade personer har specifika åldrar x 1,..., x 100. (x i [15, 30]). τ = {τ ij }, i = 1,..., 100; j = 1,..., 9: Antal personer med ålder x i klassificerat av RMV till kategori j: (mogen/mogen, mogen/omogen,..., inga data / inga data) y = (y 1,..., y 9 ): Observerade data, alltså det totala antalet personer klassificerat av RMV till vaje kategori 1,...,9. 21 / 35

Stokastisk modell π(y, τ, ψ, θ) = π(y τ)π(τ ψ, θ)π(ψ)π(θ) π(y τ) är deterministisk: Summerar över åldrarna. π(τ ψ, θ) är Multinomialfördelad, eftersom ψ och θ tillsammans specificerar sannolikheten för varje kategori. π(θ) är trunkert multivariat normalfördelad, anpassad med data från ett antal publikationer. π(ψ) är Dirichlet-fördelad. Vi sprider åldrarna x 1,..., x 100 ojämnt över intervallet [15, 30] så att den mest sannolika åldersfördelningen är en Gamma(4, 1) fördelning försjutet så den startar vid 15 och är trunkerad vid 30. Stor möjlig variation runt denna åldersprofil används. 22 / 35

Parameterestimater från literaturen Tand-parametrar estimeras från följande publikationer / databaser: DARL: https://www.dentalage.co.uk/rds-uk-caucasian Lucas et al (2016) Dental age estimation:... Mincer et al (1993) The ABFO study... Haglund et al (2018) A systematic review and meta-analysis... DARL Lucas Mincer Haglund Prior θ 11 19.5 18.6 19.9 20.9 19.5 θ 12 1.6 0.8 2.2 2.5 1.6 Knä-parametrar estimeras från följande publikationer: Soc.s.:Socialstyrelsen (2018) Om magnetkamera vid bedömning av ålder. Ottow et al (2017) Forensic age estimation by magnetic resonance imaging of the knee... Adj. Ott.: Using adjusted data from Ottow et al. Soc.s. Ottow Adj. Ott. Prior θ 21 18.5 18.5 17.7 18.5 θ 22 1.3 1.5 1.4 1.4 23 / 35

A priori och posteriori ålderfördelning: ψ Probability 0.0 0.2 0.4 0.6 0.8 1.0 Population prior Probaility 0.0 0.2 0.4 0.6 0.8 1.0 Population posterior 16 18 20 22 24 26 16 18 20 22 24 26 Age Age Figurerna visar kumulativ åldersfördelning: Apriori till vänster och posteriori till höger. De inre banden visar ett 50%-ig kredibilitetsintervall. De yttra banden visar ett 95%-ig kredibilitetsintervall. 24 / 35

A priori och posteriori parametrar θ för åldersindikatormodeller Prior age indicator models Posterior age indicator models Probability 0.0 0.2 0.4 0.6 0.8 1.0 Probability 0.0 0.2 0.4 0.6 0.8 1.0 16 18 20 22 24 26 Age 16 18 20 22 24 26 Age Figurerna visar a priori (vänster) och posteriori (höger) åldersindikatormodeller. I varje plot reprecenterar höger heltrukna linje tänder medan vänster heltrukna linje representerar knän. De stiplade linjerna representerar möjliga modeller simulerade under varje fördelning. 25 / 35

Skattade resultat för killar och män testade under 2017 Klass. som vuxna Klass. som barn Inte klass. SUMMA Vuxna 7260 (5908 7794) 581 (116 1305) 59 (49 63) 7900 (6102 8570) Barn 550 (16 1902) 826 (102 1291) 4 (0 14) 1380 (133 3379) SUMMA 7810 1407 63 9280 Tabellen visar den mest troliga siffran i varje grupp. Parenteserna visar 95%-iga kredibilitetsintervaller. Sensitivitet 93% (CI: 86-98), specificitet 67% (CI: 39-94), Positivt prediktivt värde 93% (CI: 76-100), Negativt prediktivt värde 59% (CI: 7-92). 26 / 35

Andel barn i varje klassificeringsgrupp Moget knä Omoget knä Inga data knän SUMMA Mogna tänder 1 (0 8) 24 (8 78) 2 (0 9) 3 (0 12) Omogna tänder 19 (1 64) 63 (8 95) 28 (2 70) 36 (4-74) Inga data tänder 5 (0 17) 48 (4 88) 7 (0 22) 11 (1 27) SUMMA 6 (0 23) 53 (6 90) 9 (1 26) 15 (1 34) Procentandel barn i varje kategori (95%-iga kredibilitetsintervaller in parenteserna). Cellerna med grå bakgrund representerar de där RMVs procedur klassificerar killar/män som vuxna. 27 / 35

Konsekvenser av posteriorifördelningen för θ Probability for classification as adult Probability 0.0 0.2 0.4 0.6 0.8 1.0 16 18 20 22 24 26 Age De med ålder mellan 17 och 18 blir klassificerade som vuxna med sannolikhet 41%. Ett 95%-ig kredibilitetsintervall för denna siffran är 12%-70%. 28 / 35

Knän mognar före tänder Posterior densities Density 0.0 1.0 0.5 1.0 1.5 2.0 2.5 3.0 tooth maturation age minus knee maturation age RMV har gjort uttalanden om att knän generellt mognar efter tänder. Den kraftiga linjen över viser posteriori fördelning för differensen mellan åldern då 50% av pojkar har fått mogna tänder och åldern då 50% av pojkar har fått mogna knän. De andra linjerna representerar resultat om man använder alternativa apriorifördelningar: Vi har testat ett antal alternativer för att utvärdera robustheten av våra konklutioner. 29 / 35

Kommentarer om beräkningarna Vi använder en MCMC (Markov chain Monte Carlo) algoritm för att simulera från posteriorifördelningen. Mera specifikt använder vi Gibbs sampling över de tre parametrarna θ, ψ och τ, med en random-walk förslagsfunktion för θ och direkt sampling från betingade fördelningar för ψ och τ. Konvergens var långsam, och därmed användes långa simuleringskädjor. En burn-in på 20.000 iterationer från totalt 1.000.000 iterationer blev använd för beräkningar av resultat. Ett antal kontroller blev gjort för att utforska robustheten i resultaten i relation till ändringar i apriorifördelningen. 30 / 35

Viktigaste konklutioner om RMVs åldersbedömningar Stokastisk modellering gör det möjligt att få viss information både om hur åldersbedömningen fungerar, och åldern till de åldersbedömda. Några utvalda resultat: 85% (66-92) av åldersbedömda killar under 2017 var över 18. Bland de som bedömts som vuxna därför att de hade mogna tänder och omogna knän så var 24% barn (8-78). Bland 17-åringar var sannolikheten för att bedömas som vuxen 41% (12-70). Knän mognar generellt ungefär 1-1.5 år innan tänder. Tolknig och användning av RMVs bedömnignar har baserats på information från RMV om deras procedur. Delar av denna information har vi visat är felaktig. Detta har skapat en rättsosäker situation för asylsökare. 31 / 35

Beviskraft vid DNA-tester för släktsskap Frågeställning: Givet DNA test data (för vissa DNA-markörer ), vad är relativ beviskraft för olika släktsskapshypoteser, så som kusiner, orelaterade, farbror, etc. Beräkningar involverar modellering av arv (enligt Mendel s lagar), populationseffekter, association och linkage mellan markörer, mutationer, och observationsfel. Den enklaste tillämpningen är faderskapssaker. Men mera avancerade frågor inkluderar t.ex. sök efter saknade personer. 32 / 35

Några resultat för släktskapstesting Programmet Familias för Windows (www.familias.no) och som R paket (www.familias.name). Boken Relationship Inference with Familias and R. Exempel på användningsområde: Spårning av släkt till bortförda barn i Argentina. 33 / 35

Några andra forensiska tillämpningar Dödstidsbestämmningar: Syndromövervakning: 34 / 35

Vetenskapsteori Hur tar man reda på och kommer överens om vad som är sanning? Vetenskaplig metod är helt centralt som grundlag för att ta fram sanningen. Är vi överens om vad vetenskaplig metod är? En formalisering av hur vetenskaplig metod fungerar kan (och bör tycker jag) använda matematisk statistik, och speciellt Bayesiansk statistik och beslutsteori, som ramvärk. Min åsikt: Vetenskapsteori, som matematiserad vetenskap, är underutvecklad, och ett viktigt framtida forskningsområde. 35 / 35