FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

Relevanta dokument
Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Bridging the gap - state-of-the-art testing research, Explanea, and why you should care

FK Electrodynamics I

Ämnesområden. Examensarbete inom datavetenskap (1DV41E) Martin Fredriksson

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. ANALYTICS COACHING

Beijer Electronics AB 2000, MA00336A,

LARS. Ett e-bokningssystem för skoldatorer.

Datavetenskapligt program, N1COS

Falls and dizziness in frail older people

Module 6: Integrals and applications

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Lösningar till SPSS-övning: Analytisk statistik

Health café. Self help groups. Learning café. Focus on support to people with chronic diseases and their families

SweLL & legal aspects. Elena Volodina

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Informasjon som redder liv. Stefan Ohlsson Healthcare Industry leader, Nordic

Sri Lanka Association for Artificial Intelligence

Measuring child participation in immunization registries: two national surveys, 2001

Enterprise App Store. Sammi Khayer. Igor Stevstedt. Konsultchef mobila lösningar. Teknisk Lead mobila lösningar

2.1 Installation of driver using Internet Installation of driver from disk... 3

TRENDERNA SOM FORMAR DIN VERKLIGHET 2014 ÅRETS IT AVDELNING

Ersättningsprinciper i primärvården svenska erfarenheter. 23 maj 2016

Prediktiv modellering

Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

Second handbook of research on mathematics teaching and learning (NCTM)

The present situation on the application of ICT in precision agriculture in Sweden

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Arbetsmiljö för doktorander

Grafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions:

En ny typ av statistikutbildning med komponenter från datainsamling till rapportering. Lars Rönnegård

Gradientbaserad Optimering,

Module 1: Functions, Limits, Continuity

Urban Runoff in Denser Environments. Tom Richman, ASLA, AICP

GeoGebra in a School Development Project Mathematics Education as a Learning System

Grafisk teknik IMCDP. Sasan Gooran (HT 2006) Assumptions:

Förbundsutskott 32, broar och tunnlar

Adding active and blended learning to an introductory mechanics course

Säkerhetsfunktioner rstå varandra? Finns behov av att avvika från normal säkerhetsfunktion s vissa betingelser under uppstart, ändringar i processen

Kurser inom Datavetenskapligt kandidatprogram och Computer Science Master s programme våren 2010

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Copyright 2003, SAS Institute Inc. All rights reserved.

Learning study elevers lärande i fokus

12.6 Heat equation, Wave equation

Stad + Data = Makt. Kart/GIS-dag SamGIS Skåne 6 december 2017

openbim Stockholm 22 april 2013 Kraven på BIM är här

SAS VIYA JOHAN ELFMAN ROLAND BALI

Programinformation VT 2012 för

Isolda Purchase - EDI

sociology Unit B1: Introduction to correlation and regression 3/3 Brendan Halpin May

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

Methods to increase work-related activities within the curricula. S Nyberg and Pr U Edlund KTH SoTL 2017

Normalfördelning. Modeller Vi har alla stött på modeller i olika sammanhang. Ex:

Genusstudier i Sverige

Kausalitet Kausalitet. Vad är kausal inferens? Seminariets agenda. P(Y a=1 =1) P(Y a=0 =1) Kausal effekt för en individ i:

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Acceleration at heart Strategy in mind

Grafisk teknik. Sasan Gooran (HT 2006)

Exam Molecular Bioinformatics X3 (1MB330) - 1 March, Page 1 of 6. Skriv svar på varje uppgift på separata blad. Lycka till!!

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Preschool Kindergarten

En skola på vetenskaplig grund gränsöverskridande mellan akademi, lärarutbildning och skolpraktik

Mönster. Ulf Cederling Växjö University Slide 1

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Daniel Karlsson, univ.lektor, Institutionen för medicinsk teknik

Swedish framework for qualification

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR

Arbetsmiljö för doktorander

Alla Tiders Kalmar län, Create the good society in Kalmar county Contributions from the Heritage Sector and the Time Travel method

Support Manual HoistLocatel Electronic Locks

Taking Flight! Migrating to SAS 9.2!

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Peak Car. Anne Bastian, Maria Börjesson och Jonas Eliasson. Associate Professor Transport Systems Analysis, KTH. Director Centre for Transport Studies

DI Studio nyheter

The Arctic boundary layer

S0005M, Föreläsning 2

Elektronisk patientjournal

Hur fattar samhället beslut när forskarna är oeniga?

Writing with context. Att skriva med sammanhang

SharePoint 2010 licensiering Wictor Wilén

Propensity Scores. Bodil Svennblad UCR 16 september 2014

MILJÖBEDÖMNING AV BOSTÄDER Kvarteret Nornan, Glumslöv

STATISTICA 10 ökar farten BIT

Kvalitetsarbete I Landstinget i Kalmar län. 24 oktober 2007 Eva Arvidsson

Perception och Maskininärning i Interaktiva Autonoma System. Michael Felsberg Institutionen för systemteknik Linköpings universitet

Support for Artist Residencies

Validering av data för energimätning

Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET

Lektion 3. Anteckningar

Hammer & Hanborgs Kompetensprofil

Webbregistrering pa kurs och termin

1/17/18. Dr. Ross Avilla

RADIATION TEST REPORT. GAMMA: 30.45k, 59.05k, 118.8k/TM1019 Condition D

TS CASESKOLA B. Asplund, CJ och Bengtsson, L. LTH

Barn och läkemedelssäkerhet

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Perspektiv på programmering, #13, Karlstad HISTORISKT OCH UNDERVISNING

Supplemental Instruction (SI) - An effective tool to increase student success in your course

Som man ropar i skogen får man svarkonsten att fånga, sammanfatta och tolka resultat/mätningar

Transkript:

FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

VEM ÄR JAG?

VAD SKA VI GÖRA? Pimafolket Vilka då? Diabetes Typ 2 Regressionsanalys Machine Learning

PIMAFOLKET AKIMEL O OTHAM FLODFOLKET

PIMAFOLKET AKIMEL O OTHAM FLODFOLKET Bor i södra och centrala Arizona Antal: 15 25 000 enligt 2010 års skattning Pima ~ pi mac till européerna Kända för Pimarevolten 1751, under ledning av Luis Oacpicagigua Källa: Wikipedia

PIMAFOLKET KÄNDISAR

PIMAFOLKET KÄNDISAR

PIMAFOLKET AKIMEL O OTHAM FLODFOLKET Högst prevalens av typ 2-diabetes i världen Sannolikt kostrelaterat Deras kamrater av samma folk i Mexico har inte samma prevalens Kuriosa: Från 10 års ålder till äktenskap får de inte uttala sina egna namn. Genomsnittlig ålder för första bröllop i Sverige (SCB 2014) Kvinnor: 33,2 år (samkönat: 34,6) Män 35,7 (samkönat: 42,3)

PIMAFOLKET AKIMEL O OTHAM FLODFOLKET Detta har vi data på! Tack till UCI Machine Learning Repository, Pima Indians Diabetes Data Set, donerat av National Institute of Diabetes and Digestive and Kidney Diseases och Applied Physics-laboratoriet vid Johns Hopkins University 8 x-variabler, 1 utfallsvariabel 768 observationer Visst missing data Kvinnor över 21 (Från 1990 )

PIMAFOLKET VARIABLER I DATA Number of times pregnant Plasma glucose concentration a 2 hours in an oral glucose tolerance test Diastolic blood pressure (mm Hg) Triceps skin fold thickness (mm) 2-Hour serum insulin (mu U/ml) Body mass index (weight in kg/(height in m)^2) Nollvärden?! Diabetes pedigree function Age (years) Class variable (0 or 1)

MACHINE LEARNING OCH PREDIKTIV MODELLERING

MACHINE LEARNING OCH PREDIKTIV MODELLERING Min erfarenhet Bra på frågan Varför? Black box och skrämselhicka Kombinationen!

MACHINE LEARNING OCH PREDIKTIV MODELLERING PARLÖR FÖR STATISTIKER Svenska Y-värde Variabel Transformering Intercept Machine Learning Label Feature eller attribute Feature creation Bias

MACHINE LEARNING - AN INTRODUCTION WHAT IS MACHINE LEARNING? Wikipedia: Machine learning, a branch of artificial intelligence, concerns the construction and study of systems that can learn from data. SAS: Machine learning is a method of data analysis that automates analytical model building. Using algorithms that iteratively learn from data, machine learning allows computers to find hidden insights without being explicitly programmed where to look.

WHAT IS MACHINE LEARNING? MACHINE LEARNING - AN INTRODUCTION Complicated methods, consumable results

MACHINE LEARNING - AN INTRODUCTION MULTIDISCIPLINARY NATURE OF DATA ANALYSIS Statistics Pattern Recognition Computational Neuroscience Data Science Data Mining Machine Learning AI Databases Information Retrieval

MACHINE LEARNING - AN INTRODUCTION WHEN TO USE MACHINE LEARNING? When the predictive accuracy of a model is more important than the interpretability of a model. When traditional approaches are inappropriate, e.g. when you have: more variables than observations many correlated variables unstructured data fundamentally nonlinear or unusual phenomena

MACHINE LEARNING - AN INTRODUCTION WHERE IS MACHINE LEARNING USED? A few examples: Recommendation applications Fraud detection Predictive maintenance Text analytics Pattern recognition Self driving cars Getty Images, 509261913

PIMAFOLKET DEMO!

PIMAFOLKET PARAMETERESTIMAT OCH ODDSKVOTER FÖR STEPWISE LOGISTISK REGRESSION