Regression med Genetiska Algoritmer
|
|
- Kjell Håkansson
- för 7 år sedan
- Visningar:
Transkript
1 Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer
2 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet ett antal olika variabler är något som många vill kunna, men som ofta innebär mer eller mindre chansningar. En svårighet är att verkligheten ofta innebär många olika variabler, och att de interagerar med varandra på oförutsedda sätt. I denna rapport utvärderas ett eget program i försök att hitta de modeller som bäst passar givna data med två eller flera linjära och- eller ickelinjära variabler. Programmet hämtar idéer från analytisk regression och genetiska algoritmer. Regression Inom statistik används regressionsanalys för att finna den modell som har det minsta felet givet de data som används. Modellerna kan sedan användas för att förutsäga resultat givet de variabler som används. Ett exempel är att observerade data kan finnas för hur väl någon presterar på något prov givet variabeln timmars träning. Modellen kan enklast beskrivas som en matematisk funktion med ett antal oberoende (förklarande) variabler som ger ett resultat på en beroende variabel. Formeln uttrycks principiellt som: Ŷ = α + βx En vanlig distinktion är att göra mellan modeller som är linjärar och icke-linjära. Skillnaden mellan dessa två är enkelt uttryckt hur modellen kan ritas ut är modellen linjär är det en rak linje som ritas ut i ett koordinatsystem, och är modellen icke-linjär har den en annan form. Linjär regression Den enklaste typen av regression kallas enkel linjär regression. Modellen använder sig endast av en oberoende variabel. Nedan ses exempel på detta. Ŷ = α + βx Ŷ = 5 + 2x
3 Ofta är enkel linjär regression alltför enkel för att förklara en beroende variabel bra genom endast en oberoende. En mer komplex modell använder två eller fler variabel eller så kallad multipel regression. Liksom enkel regression ger modellen en linjär funktion. Multipel regression uttrycks som: Ŷ = α + β 1 x 1 + β 2 x 2 + β n x n Ŷ = 1 + 2x 1 + 3x 2. Icke-linjär regression Långt från alla observerade data passar bra med linjära funktioner. Det är möjligt att en variabel har störst verkan vid ett viss värde. Nedan visas exempel på en icke-linjär modell såväl matematiskt uttryckt som grafiskt. Ŷ = α + f(x) Ŷ = 5-2x 2 Icke-linjära modeller kan vara mycket komplexa då det finns otaliga möjliga former en kurva kan ta, och därför svåra att skapa. Error, ε Det är mycket ovanligt med modeller utan någon typ av fel. Alltså modeller där alla oberoende variabler ger den beroende variabelns observerade värde. Detta fel i modellen gör att vi kan uttrycka formeln som:
4 Ŷ = α + βx + ε Felet mellan en modell och observerade data illusteras i bilden nedan där punkterna är observerade data och modellen är linjen. Felet ger möjlighet att värdera hur bra modellen är mot de observerade datan som använts. Att påpeka är att denna metod inte tar hänsyn till variationer i de observerade datan. Det vill säga att outliers och liknande problem måste tas hänsyn till innan en analys genomförs. Skillnaden i hur bra olika modeller passar på observerade data illustreras nedan. Där visas observerade data som punkter och modellerna som linjer. Målet är, som tidigare nämnts, att hitta en modell med minsta möjliga fel som kan beskriva de observerade datan. Genom att välja den modell som har minst fel kan vi vara mer säkra på att estimerade värden stämmer. Ett vanligt sätt att beräkna fel är att använda sig av minsta kvadratfel-principen. Principen innebär att summera kvadraten av felet som ett y-värde faktiskt har subtraherat med det y- värde som modellen ger. Formelns fel = Σ (Y n - modellens Y) 2. Ett exempel följer nedan.
5 Observerade Data Ŷ = 5 + 4x y x Ŷ ε ε * 1 = = -2 (-2) 2 = Fel = = 90 Genetiska algoritmer Genetiska algoritmer bygger på evolutionsteorin där goda anlag (DNA) i en omgivning förs vidare till nya generationer. De bästa individerna paras och får avkommor med delar av föräldrarnas DNA. Detta tillsammans med mutation av föräldrarnas dna används för att försöka finna den bästa lösningen till ett problem. Cross-over innebär att ta delar av föräldrarnas DNA och sätta ihop dessa till nya individer som testas i en ny generation. Det finns olika sätt att bestämma var DNA-sekvensen ska brytas och sammanföras med annan DNA-sekvens. En vanlig lösning är att ta halva DNAsekvensen från var och en av föräldrarna. Detta visas i exemplet nedan (tabell 1). Mutation innebär att ta en eller flera delar av föräldern och förändra på något sätt. Detta ger en ökad variation i generationens population. En enkel mutation av föräldrarna X och Y visas i tabell 1. Förälder X Förälder Y Cross-over Barn XY Cross-over Barn YX Mutation X Mutation Y Tabell 1: Cross-over & Mutation Eftersom det endast är de bästa anlagen för omgivningen som är intressanta att föra vidare krävs någon typ av värdering av DNA-sekvenserna. En viktig poäng med genetiska algoritmer är att de inte garanterar en optimal lösning, men att de kan användas för att få fram relativt goda lösningar snabbt. Metod Ett program skrevs genom idéer från regression och genetiska algoritmer. Syftet med programmet var att utvärdera genetiska algoritmer för att göra regressionsanalys. Programvara
6 Python 2.7 användes för att skriva koden för att få fram den modell som bäst passar givna data. Data hämtas in som en given csv fil som innehåller y-värdet i första kolumnen och sedan de givna oberoende variablerna i följande kolumner. (Se appendix.) Indata Programmet tar in fyra argument. Det första är namnet på datafilen. De följande tre är frivilliga. Det första av dessa argument är antalet generationer som programmet genomför, och har ett standardvärde på Det andra är att förutom addition och subtraktion även tillåta multiplikation och division där standardvärdet är False. Det sista argumentet anger om programmet ska kunna använda sig av decimaltal eller inte, och standard är endast heltal. Regression( filnamn.csv, antal generationer, alla operatorer, decimaltal) Regression( testfil.csv, 1000, True, False) Implementerade funktioner Functions Klassen Functions skapades för att hålla information om varje oberoende variabel. Klassen har attribut såsom betavärde, operator och funktion. Dessa tre attribut kan ändras, vilket möjliggör mutationer. Exempelvis kan en mutation innebära byte av operator. Beroende på argument vid start så används vissa operatorer samt möjliggör eller begränsar decimaltalsberäkningar. Ett begränsat antal funktioner lades in för att kunna utvärdera resultatet av programmet. Bland dessa var: βx βx 2 β/x) βe x Regression En annan klass programmet använder sig av är Regression. Den tar en fil som indata och ger en modell som utdata. Klassen hanterar instanser av Functions och beräknar modellen enligt principen: Ŷ = α + f 1 (x 1 ) + f 2 (x 2 ) + f n (x n ) Klassen väljer ut de två bästa individerna i varje generation enligt minsta kvadratfel-principen och muterar dessa en gång vardera i operator, betavärde eller funktionstyp. En crossover genomförs även av de två bästa individerna genom att klyva modellens DNA-sekvens på
7 mitten och sätta ihop dessa till nya individer. Klassen skriver även ut den hittills bästa funna modellen. Implementerade begränsningar Ett antal begränsningar lades in i programmet. Dessa var att endast använda operatorerna addition och subtraktion. Ytterligare begränsning är att programmet endast använder heltal. Båda begränsningarna kan tas bort genom argument när programmet körs. Att använda begränsningarna kan ge sämre modeller men ge approximativ information. En ytterligare begränsning är att den csv-fil som används måste vara formaterad korrekt. Det vill säga att den har den beroende variabeln i första kolumnen, och resterade oberoende variabler följer. Inga. Ytterligare krävs att decimaltal använder punkt, vilket annars ger upphov till felmeddelande, Alfa- och beta-värden är för närvarande begränsade till att vara mellan -2 och 2. De kan ökas genom multiplikation då mutation genomförs och minskas med division. Om detta är ett bra sätt att arbeta är mycket säkert. En utvärdering av hur detta bör se ut bör göras. CSV-filer Fyra olika CSV-filer skapades för att testa programmet. Två av dem hade kända modeller och två hade obestämda. Alla testades med programmet. Resultat Test 1 Indata: Testfil 1 Utdata: Current Best Model: x+1.0x**2 Mean Squared Error: 0.0 R Square = 1.0 Test 3 Indata: Testfil 3 Utdata: Current Best Model: x Mean Squared Error: R Square = Test 2 Indata; Testfil 2 Utdata: Current Best Model: x-1.0x**2+1.0e**x Mean Squared Error: e-18 R Square = 1.0 Test 4 Indata: Testfil 4 Utdata: Current Best Model: x+1.0x-3.0x+2.0x Mean Squared Error: 3.9 R Square = Test 1 och 2 hittade de förutbestämda modellerna. Test 3 använde data inspirerade av funktionen Y = 1.0x. En manuell beräkning av data från test 3 visade att den bästa modellen
8 som kan fås är x, vilket kan jämföras med programmets x. Test 4 grundade sig på helt slumpartade data med fyra oberoende variabler. Diskussion De fyra körningarna gav gott resultat och visar på att genetiska algoritmer kan lösa regressionsanalys. Problem och möjliga förbättringar Under flera testkörningar visade det sig att e x misstogs för x 2. Ett alternativ vore att endast en exponentiell funktion finns att tillgå. Färre funktionstyper kan ge snabbare resultat men ge ett större fel. Detta är en avvägning som får utvärderas. Ytterligare typer av funktioner bör implementeras för att hitta andra typer av kurvor. Exempelvis naturlig logaritm. Att ha i åtanke är att ju fler funktioner som finns att tillgå desto fler generationer kan krävas. En möjlig förbättring är att dela upp programmet i två delar: ett för att först hitta de funktioner som bäst passar in på datan, och sedan använda dem för att bestämma funktionernas alpha- och beta-värden. Möjligen ger detta bättre resultat. Ett problem som upptäcktes i programmet var att när csv-filen lästes in och innehöll decimaltal så gavs felmeddelanden. Det är därför viktigt att filen delar av decimaler från heltal med punkt. Dessutom är.csv-filer idag inte ett vanligt format. Att ge möjligheten att arbeta med andra filtyper såsom.xls och/eller.spss vore underlättande. Ytterligare en möjlig förbättring av programmet är att det inte endast tar hänsyn till en fil utan ger användaren möjlighet att välja fler filer och oberoende variabler. Att ge möjligheten att hämta och namnge variabler från olika filer. Detta för att ge mer flexibilitet och säkerhet åt användaren. Under programmets utveckling märktes att en funktion i python gav felaktiga resultat. Funktionen är eval(), vilken tar en sträng som argument och beräknar den. Att använda sig av denna funktion bör undersökas vid komplexa beräkningar så inga fel dyker upp. Särskilt kan detta tänkas hända vid operationer som involverar division och multiplikation. Ett problem som förblivit olöst är de fall där x = 0 och ett tal försöker divideras med x. Detta ger i normalfall ett resultat av inf, och hanteras inte av programmet. Ytterligare en funktion som skulle kunna finnas vore en som visar den differens som finns mellan Ŷ och Y. Denna funktion skulle visa en okänd variabel och hur felen varierar med en modell.
9 APPENDIX Datafil 1: Y = 2*X1 + (X2) Datafil 2: Y = x-1.0x e x Datafil 3: Y = 1.0x + error
10 Datafil 4: Y = okänd
Föreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merGrundläggande Idéer Algoritmens komponenter Numerisk optimering Genetisk Programmering. Genetiska Algoritmer
Genetiska Algoritmer 1 Grundläggande Idéer 2 3 4 Exempel Parallell optimering inspirerad av biologisk evolution Parallell optimering inspirerad av biologisk evolution Population av hypoteser Urvalprocess
Läs merF11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs mera = a a a a a a ± ± ± ±500
4.1 Felanalys Vill man hårddra det hela, kan man påstå att det inte finns några tal i den tillämpade matematiken, bara intervall. Man anger till exempel inte ett uppmätt värde till 134.78 meter utan att
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merFöreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
Läs merExtramaterial till Matematik Y
LIBER PROGRAMMERING OCH DIGITAL KOMPETENS Extramaterial till Matematik Y NIVÅ TVÅ Taluppfattning och tals användning ELEV Det finns många olika programmeringsspråk. I den här uppgiften ska du få bekanta
Läs merTAIU07 Matematiska beräkningar med Matlab
TAIU07 Matematiska beräkningar med Matlab Laboration 3. Linjär algebra Namn: Personnummer: Epost: Namn: Personnummer: Epost: Godkänd den: Sign: Retur: 1 Introduktion 2 En Komet Kometer rör sig enligt ellipsformade
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merÖvningsuppgifter till föreläsning 2 Variabler och uttryck
Sid 1 (5) Övningsuppgifter till föreläsning 2 Variabler och uttryck Syfte Syftet med övningsuppgifterna är att träna på: Aritmetik, variabler, tilldelning, scanf och printf Generellt Diskutera gärna uppgifterna
Läs merHöftledsdysplasi hos dansk-svensk gårdshund
Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merKovarians och kriging
Kovarians och kriging Bengt Ringnér November 2, 2007 Inledning Detta är föreläsningsmanus på lantmätarprogrammet vid LTH. 2 Kovarianser Sedan tidigare har vi, för oberoende X och Y, att VX + Y ) = VX)
Läs merSidor i boken 110-113, 68-69 2, 3, 5, 7, 11,13,17 19, 23. Ett andragradspolynom Ett tiogradspolynom Ett tredjegradspolynom
Sidor i boken 110-113, 68-69 Räkning med polynom Faktorisering av heltal. Att primtalsfaktorisera ett heltal innebär att uppdela heltalet i faktorer, där varje faktor är ett primtal. Ett primtal är ett
Läs merTENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Läs merFinansiell statistik. Multipel regression. 4 maj 2011
Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi
Läs merFel- och störningsanalys
Fel- och störningsanalys 1 Terminologi Antag att x är ett exakt värde och x är en approximation av x. Vi kallar då absoluta felet i x = x x, relativa felet i x = x x x. Ofta känner vi inte felet precis
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merEnkel och multipel linjär regression
TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0
Läs merFel- och störningsanalys
Fel- och störningsanalys Terminologi Antag att x är ett exakt värde och x är en approximation av x. Vi kallar då absoluta felet i x = x x, relativa felet i x = x x x. Ofta känner vi inte felet precis utan
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merInstuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merKomponentvisa operationer,.-notation Multiplikation (*), division (/) och upphöj till (ˆ) av vektorer följer vanliga vektoralgebraiska
Matlab-föreläsning 3 (4), 17 september, 2015 Innehåll Sekvenser (från förra föreläsningen) Upprepning med for-slingor och while-slingor Villkorssatser med if - then -else - Logik Sekvenser - repetion från
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 10 Johan Lindström 27 september 2017 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F10 1/26 Repetition Linjär regression Modell Parameterskattningar
Läs merÖvningshäfte 6: 2. Alla formler är inte oberoende av varandra. Försök att härleda ett par av de formler du fann ur några av de övriga.
GÖTEBORGS UNIVERSITET MATEMATIK 1, MAM100, HT2005 MATEMATISK BASKURS Övningshäfte 6: Syftet med övningen är att utforska strukturen hos talsystemen under addition respektive multiplikation samt sambandet
Läs mer34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
Läs merMatematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression
Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression
Läs merFöreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merSkolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Läs mer7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00
Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 5Hp 41I12B KINAF13, KINAR13, KINLO13,KMASK13 7,5 högskolepoäng Tentamensdatum: 30 oktober
Läs merRegressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Läs mer1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli
Läs merMatematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Läs mer732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20
732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta
Läs merStatistiska samband: regression och korrelation
Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel
Läs merAlla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.
Att förstå variabler Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata. Vad är en variabel? En variabel är en plats att lagra information. Precis
Läs merExtramaterial till Matematik Y
LIBER PROGRAMMERING OCH DIGITAL KOMPETENS Extramaterial till Matematik Y NIVÅ ETT Taluppfattning och tals användning ELEV Det finns många olika programmeringsspråk. Ett av dem är Python, som du ska få
Läs merFöreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merAntag att b är förgreningsfaktorn, d sökdjupet, T (d) tidskomplexiteten och M(d) minneskomplexiteten.
OS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merGrunderna i stegkodsprogrammering
Kapitel 1 Grunderna i stegkodsprogrammering Följande bilaga innehåller grunderna i stegkodsprogrammering i den form som används under kursen. Vi kommer att kort diskutera olika datatyper, villkor, operationer
Läs merNumeriska Metoder och Grundläggande Programmering för P1, VT2014
Numeriska Metoder och Grundläggande Programmering för P1, VT2014 Föreläsning 2: Styrstrukturer & Programmeringsstrategi (Kap. 3 4 i MATLAB Programming for Engineers, S. Chapman) January 21, 2014 Innehåll:
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merAnvändarhandledning Version 1.2
Användarhandledning Version 1.2 Innehåll Bakgrund... 2 Börja programmera i Xtat... 3 Allmänna tips... 3 Grunderna... 3 Kommentarer i språket... 4 Variabler... 4 Matematik... 5 Arrayer... 5 på skärmen...
Läs merI en deterministisk omgivning beror nästa tillstånd bara av agentens handling och nuvarande tillstånd.
OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna ges 1 poäng för korrekt svar och 0,5 poäng om skillnaden mellan antalet korrekta svar och antalet
Läs merInStat Exempel 4 Korrelation och Regression
InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och
Läs merLaboration: Whitebox- och blackboxtesting
Tilda11 höstterminen 2011 Laboration: Whitebox- och blackboxtesting Mål med laborationen Du ska lära dig begreppen white-box testing och black-box testing Du ska öva dig på att konstruera testfall Du ska
Läs merKompletterande lösningsförslag och ledningar, Matematik 3000 kurs A, kapitel 4. b) = 3 1 = 2
Kapitel.1 101, 102 Exempel som löses i boken 10 a) x= 1 11+ x= 11+ 1 = 2 c) x= 11 7 x= 7 11 = 77 b) x= 5 x 29 = 5 29 = 6 d) x= 2 26 x= 26 2= 1 10 a) x= 6 5+ 9 x= 5+ 9 6= 5+ 5= 59 b) a = 8a 6= 8 6= 2 6=
Läs merÖvningshäfte till kursen Regressionsanalys och tidsserieanalys
Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs merFöreläsning 10, del 1: Icke-linjära samband och outliers
Föreläsning 10, del 1: och outliers Pär Nyman par.nyman@statsvet.uu.se 19 september 2014-1 - Sammanfattning av tidigare kursvärderingar: - 2 - Sammanfattning av tidigare kursvärderingar: Kursen är för
Läs merFORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:
Läs merTANA17 Matematiska beräkningar med Matlab
TANA17 Matematiska beräkningar med Matlab Laboration 1. Linjär Algebra och Avbildningar Namn: Personnummer: Epost: Namn: Personnummer: Epost: Godkänd den: Sign: Retur: 1 Introduktion I denna övning skall
Läs merObjektorienterad programmering i Java I. Uppgifter: 2 Beräknad tid: 5-8 timmar (OBS! Endast ett labbtillfälle) Att läsa: kapitel 5 6
Laboration 2 Objektorienterad programmering i Java I Uppgifter: 2 Beräknad tid: 5-8 timmar (OBS! Endast ett labbtillfälle) Att läsa: kapitel 5 6 Syfte: Att kunna använda sig av olika villkors- och kontrollflödeskonstruktioner
Läs merRegressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Läs merFORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs merTATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer
TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer Johan Thim 0 januari 207 Introduktion En differentialekvation (DE) i en variabel är en ekvation som innehåller både
Läs merTDDC77 Objektorienterad Programmering
TDDC77 Objektorienterad Programmering Föreläsning 3 Sahand Sadjadee IDA, Linköpings Universitet Hösttermin 2018 Outline Operatorer Java Standard Library Inmatning Operatorer operatorer En operator är en
Läs merStudieplan och bedömningsgrunder i Matematik för åk 7 Moment Bedömningsgrunder för uppnåendemålen Begreppsbildning Tal och räkning
Moment Begreppsbildning Mätningar och enheter Algebra och ekvationer Studieplan och bedömningsgrunder i Matematik för åk 7 Bedömningsgrunder för uppnåendemålen känna igen naturliga tal kunna positiva heltal:
Läs mer732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15
732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på
Läs merGenetisk programmering i Othello
LINKÖPINGS UNIVERSITET Första versionen Fördjupningsuppgift i kursen 729G11 2009-10-09 Genetisk programmering i Othello Kerstin Johansson kerjo104@student.liu.se Innehållsförteckning 1. Inledning... 1
Läs merLösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se
Läs merExplorativ övning 7 KOMPLEXA TAL
Explorativ övning 7 KOMPLEXA TAL Övningens syfte är att bekanta sig med komplexa tal. De komplexa talen, som är en utvidgning av de reella talen, kom till på 1400 talet då man försökte lösa kvadratiska
Läs merTentamen för kursen. Linjära statistiska modeller. 27 oktober
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merObligatorisk uppgift: Numerisk kalkylator
Informationsteknologi Tom Smedsaas 22 augusti 2018 Obligatorisk uppgift: Numerisk kalkylator Programmet skall läsa in aritmetiska uttryck samt beräkna och skriva ut deras värden. Programmet ska läsa från
Läs merIntroduktion till programmering D0009E. Föreläsning 5: Fruktbara funktioner
Introduktion till programmering D0009E Föreläsning 5: Fruktbara funktioner 1 Retur-värden Funktioner kan både orsaka en effekt och returnera ett resultat. Hittills har vi ej definierat några egna funktioner
Läs merArbetsblad 1:1. Tiondelar på tallinjen 0,9 1,1 0,8. 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4
Arbetsblad 1:1 Tiondelar på tallinjen 1 Skriv rätt tal på pilarna. 0,9 0 1 2 0 1 3 1,1 1 2 4 0,8 0 1 2 3 5 1 2 3 4 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4 0 1 7 Sätt ut pilar som pekar
Läs merArbetsblad 1:1. Tiondelar på tallinjen. 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4
Arbetsblad 1:1 Tiondelar på tallinjen 1 Skriv rätt tal på pilarna. 0 1 2 0 1 3 1 2 4 0 1 2 3 5 1 2 3 4 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4 0 1 7 Sätt ut pilar som pekar på talen:
Läs merArbetsblad 1:1. Tiondelar på tallinjen 0,1 0,5 0,9 0,2 0,8 0,3 0,8 1,1 1,5 1,6 2,1 2,4 1,1 1,4 2,6 3,2 3,8
Arbetsblad 1:1 Tiondelar på tallinjen 1 Skriv rätt tal på pilarna. 0,1 0,5 0,9 1,2 0 1 2 0,3 0,8 1,1 1,5 0 1 3 1,1 1,6 2,1 2,4 1 2 4 5 0,2 0,8 1,4 2,6 0 1 2 3 1,4 2,6 3,2 3,8 1 2 3 4 6 Sätt ut pilar som
Läs merMultipel tilldelning. Introduktion till programmering D0009E. Föreläsning 6: Iteration. while-satsen. Kom ihåg. Snurror kontra rekursion
Introduktion till programmering D0009E Föreläsning 6: Iteration Multipel tilldelning Helt ok att tilldela en variabel flera gånger: bruce = bruce, bruce = 7 bruce Output: 7 Som tillståndsdiagram: bruce
Läs merUppgift 1 ( Betyg 3 uppgift )
2008-03-12.kl.14-19 Uppgift 1 ( Betyg 3 uppgift ) Du skall skriva ett program som läser igenom en textfil som heter FIL.TXT och skriver ut alla rader där det står ett decimaltal först på raden. Decimaltal
Läs merTentamen för kursen. Linjära statistiska modeller. 13 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merInnehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)
Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3
Läs merApproximation av funktioner
Vetenskapliga beräkningar III 8 Kapitel Approximation av funktioner Vi skall nu övergå till att beskriva, hur man i praktiken numeriskt beräknar funktioner I allmänhet kan inte ens elementära funktioner
Läs merUttryck, satser och strömhantering
Linköpings Universitet Institutionen för datavetenskap (IDA) UPP-gruppen 2018-09-06 Mål Uttryck, satser och strömhantering I denna laboration ska du lära dig Formaterad inläsning och utskrift Vanliga repetitions-
Läs merLokala mål i matematik
Lokala mål i matematik År 6 År 7 År 8 År 9 Taluppfattning (aritmetik) förstår positionssystemets uppbyggnad med decimaler ex: kan skriva givna tal adderar decimaltal ex: 15,6 + 3,87 subtraherar decimaltal
Läs merKoda ett mattetest 3 av 5. Lektionen handlar om att göra en variabel i programmet för ett multiplikationstest. Koda ett mattetest 3 av 5
Lektionen handlar om att göra en variabel i programmet för ett multiplikationstest. Lektionsförfattare: Christer Sjöberg Till läraren 1. Skapa en variabel för poäng 2. Nollställ räknaren En digital lektion
Läs merFöreläsning 15, FMSF45 Multipel linjär regression
Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n
Läs merFallstudie: numerisk integration Baserad på läroboken, Case Study 19.9
Fallstudie: numerisk integration Baserad på läroboken, Case Study 19.9 Beräkningsvetenskap DV Institutionen för Informationsteknologi, Uppsala Universitet 30 september, 2013 Att beräkna arbete Problem:
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-03-24 DATORLABORATION 1: TIDSSERIER. I Tarfala har man under en lång följd av
Läs merLABORATION 2. Trapetsregeln, MATLAB-funktioner, ekvationer, numerisk derivering
SF1518,SF1519,numpbd15 LABORATION 2 Trapetsregeln, MATLAB-funktioner, ekvationer, numerisk derivering - Genomför laborationen genom att göra de handräkningar och MATLAB-program som begärs. Var noga med
Läs merMatematisk statistik KTH. Formel- och tabellsamling i matematisk statistik
Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =
Läs merLaboration 1. Utgåva 1 Gäller från
Programering SPO2 Repetition från grundläggande programmering I denna laboration ska vi titta närmare på aritmetiska operatorer, typkonvertering, in- och utmatning av text samt if- och switch-satser. Tänk
Läs merTentamen för kursen. Linjära statistiska modeller. 22 februari
STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merSpridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Läs merTentamen i. för D1 m fl, även distanskursen. lördag 28 maj 2011
1 of 7 Örebro universitet Akademin för naturvetenskap och teknik Thomas Padron-McCarthy (thomas.padron-mccarthy@oru.se) Tentamen i Programmering grundkurs och Programmering C för D1 m fl, även distanskursen
Läs merExtramaterial till Matematik Y
LIBER PROGRAMMERING OCH DIGITAL KOMPETENS Extramaterial till Matematik Y NIVÅ TRE Taluppfattning och tals användning ELEV Det finns många olika programmeringsspråk. I den här uppgiften ska du få bekanta
Läs merIntroduktion till MATLAB
29 augusti 2017 Introduktion till MATLAB 1 Inledning MATLAB är ett interaktivt program för numeriska beräkningar med matriser. Med enkla kommandon kan man till exempel utföra matrismultiplikation, beräkna
Läs merKonsten att lösa icke-linjära ekvationssystem
Konsten att lösa icke-linjära ekvationssystem Andreas Axelsson Vi beskriver här de grundläggande teknikerna för att lösa icke-linjära ekvationssystem. Detta är en nödvändig kunskap för att kunna lösa diverse
Läs merIntroduktion till programmering SMD180. Föreläsning 5: Fruktbara funktioner
Introduktion till programmering Föreläsning 5: Fruktbara funktioner 1 Retur-värden Funktioner kan både orsaka en effekt och returnera ett resultat. Hittills har vi ej definierat några egna funktioner med
Läs mer1/15/2013. DD1310/DD1314/DA3009 Programmeringsteknik. Lärandemål... Vilka läser kursen? ...fler lärandemål VARFÖR? Föreläsning 1
Skolan för Datavetenskap och kommunikation DD1310/DD1314/DA3009 Programmeringsteknik Föreläsning 1 Kursinfo Diagnostiskt prov Python-intro: print variabler reserverade ord input kommentarer beräkningar
Läs merDD1314 Programmeringsteknik
Skolan för Datavetenskap och kommunikation DD1314 Programmeringsteknik Föreläsning 1 o print o variabler o reserverade ord o input o kommentarer o beräkningar o datatyper o if-satser Kursinformation Programmering:
Läs merMatlabövning 1 Funktioner och grafer i Matlab
Matlabövning 1 Funktioner och grafer i Matlab I den här övningen ska vi titta på hur man konstruerar funktioner i Matlab och hur man kan rita funktionsgrafer. Läs först igenom PM:et. Gå sedan igenom exemplen
Läs mer