Stokastisk Modellering av Finansiella Tidsserier

Storlek: px
Starta visningen från sidan:

Download "Stokastisk Modellering av Finansiella Tidsserier"

Transkript

1 Stokastisk Modellering av Finansiella Tidsserier -en kvantitativ studie av högfrekvenshandel Kandidatarbete inom civilingenjörsutbildningen vid Chalmers Niklas Andersson Karl Berg Johanna Juhl Institutionen för matematiska vetenskaper Chalmers tekniska högskola Göteborgs universitet Göteborg 2011

2

3 Stokastisk Modellering av Finansiella Tidsserier -en kvantitativ studie av högfrekvenshandel Kandidatarbete i matematik inom civilingenjörsprogrammet Teknisk Fysik vid Chalmers Niklas Andersson Johanna Juhl Kandidatarbete i matematik inom civilingenjörsprogrammet Maskinteknik vid Chalmers Karl Berg Handledare: Examinator: Patrik Albin Carl-Henrik Fant Institutionen för matematiska vetenskaper Chalmers tekniska högskola Göteborgs universitet Göteborg 2011

4

5 Sammanfattning Dagens finansmarknad är elektronisk vilket möjliggör en ny typ av handel, högfrekvenshandel, där finansiella instrument kan köpas och säljas inom loppet av mikrosekunder. Kandidatprojektet syftar till att konstruera, utvärdera och implementera matematiska modeller för finansiella tidserier med fokus på kortare tidsspann. Finansiella tidsserier klassas som stokastiska processer och modeller som beskriver sådana processer kan designas. Lågfrekvent data har traditionellt modellerats med hjälp av Bachieler-Samuelsons prisbelönade aktieprismodell, som beskriver aktiekursers utveckling. Modellen evaluerades och förbättrades. Därefter anpassades den numera förbättrade modellen till högfrekevensdata. Därpå undersöks högfrekventa valutapar, vars process skiljer sig från aktiekursers. Erfarenheter från denna undersökning används för att förbättra handelstrategier för valutapar på uppdrag av ett finansbolag i Stockholm. De kompletta handelsstrategierna för valutapar kan slutligen användas och utvärderas på den verkliga marknaden med fiktiva investeringar. Abstract Todays financial market is electronic which has enabled a new feature of trading, highfrequency trading, where financial instruments can be bought and sold in a matter of microseconds. The purpose of this bachelor thesis is to construct, evaluate and implement mathematical models for financial time series with focus on a shorter time span. Financial time series are classed as stochastic processes, models of such processes can be constructed. Low frequency data has traditionally been modeled using the award-winning Bachieler- Samuelsons share price model, which describes the development of share prices. Initially this model is evaluated and improved to be adapted to high-frequency data. Thereafter high-frequency currency pairs are examined, these processes differ vastly from share prices. Experience from this survey are used to improve trading strategies for the currency pairs on behalf of a finance company in Stockholm. The strategies are finally executed and evaluated on the market with fictional investments. i

6 Förord Vi vill rikta ett stort tack till vår handledare Patrik Albin, docent vid Matematiska Vetenskaper på Chalmers, som väglett oss under arbetets gång. Vi vill även passa på att tacka de företag som samarbetat med oss, SIX Telekurs som bistått med högfrekvensdata, Dukascopy som tillhandahållit en plattform att testa våra implementerade modeller på och det finansbolag i Stockholm som gav oss möjlighet att utvärdera och förbättra befintliga handelsstrategier. För övrigt har det varit otroligt givande, både akademiskt och socialt, att arbeta med detta projekt. Det är med stor stolthet vi presenterar detta kandidatarbete och blickar framåt mot nya möjligheter. Gemensamt arbete Vi har samarbetat så mycket som varit möjligt med detta projekt och alla har tagit del av hela projektet. Huvudansvar för projektet har delats enligt: Niklas Andersson Niklas Andersson har under detta kandidatarbete haft ansvar för företagskontakten och verifiering av data. Det är även han som ansvarat för förbättringarna av strategierna samt programkod skriven i Python och Java. Karl Berg Karl Berg har under detta kandidatarbete ansvarat för studien av autoregressiva processer, programkod skriven i Matlab och det redaktionella huvudansvaret. Johanna Juhl Johanna Juhl har under detta kandidatarbete ansvarat för studien av Bachieler-Samuelsons modell, förbättring av modellen och anpassningen till högfrekvensdata samt för programkod skriven i Mathematica. Disposition Upplägget är till en början av uppslagskaraktär, med en teoridel, ämnad till läsare utan statistisk bakgrund. De läsare med djupare kunskap inom området gynnas även av detta, då dessa slipper läsa grunddefinitioner och direkt kan gå till metod, implementering och resultat. Ansvar för texten har delats enligt: 1. Inledning - Niklas Andersson, Karl Berg och Johanna Juhl (a) Bakgrund - Niklas Andersson och Karl Berg (b) Syfte - Karl Berg och Johanna Juhl (c) Avgränsningar - Karl Berg 2. Teori (a) Fördelningar i. Normalfördelning - Johanna Juhl ii. Binomial- och poissonfördelning - Karl Berg ii

7 iii. Empirisk fördelning - Karl Berg (b) Metoder och funktioner i. Kovarians - Johanna Juhl ii. Korrellation - Johanna Juhl iii. Sannolikhetsvärde - Johanna Juhl iv. Kvantil - Karl Berg v. Momentgenererande funktion - Karl Berg vi. Maximum likelihood-metoden - Niklas Andersson vii. Minsta kvadratmetoden - Niklas Andersson viii. Statistisk hypotestestning - Johanna Juhl ix. Kolmogorov-Smirnovtest - Johanna Juhl x. Autokorrellationstest - Karl Berg (c) Processer i. Stationär process - Karl Berg ii. Svagt stationär process - Karl Berg iii. Lévyprocess - Johanna Juhl iv. Wienerprocess - Johanna Juhl v. Moving average-process - Niklas Andersson 3. Metod - Karl Berg (a) Arbetsgång - Niklas Andersson i. Litteraturstudier - Niklas Andersson och Johanna Juhl ii. Införskaffande av data - Niklas Andersson och Johanna Juhl iii. Analys och verktyg - Niklas Andersson och Karl Berg 4. Högfrekvensmodell för aktier (a) Bachieler-Samuelsons modell för lågfrekvensdata - Karl Berg och Johanna Juhl (b) Evaluering av Bachieler-Samuelsons modell - Johanna Juhl (c) Förbättrad modell - Johanna Juhl i. Devolatilisering av de logaritmerade inkrementen - Johanna Juhl ii. Passning av process till volatilitet - Johanna Juhl iii. Passning av process till logaritmerade inkrementen - Johanna Juhl (d) Anpassning till högfrekvensdata - Johanna Juhl 5. Högfrekvensmodell för valutapar (a) Implementering av strategi 1 - Niklas Andersson i. Bollingerband - Niklas Andersson ii. Köp och säljsignaler - Niklas Andersson iii. Utvärdering av modell - Niklas Andersson och Karl Berg (b) Autoregressiv process - Karl Berg i. Yule-Walkers ekvationer - Karl Berg ii. Passning av en Autoregressiv process - Karl Berg iii. Verifiering av koefficienter till en autoregressiv process - Karl Berg iv. Implementering i Dukascopy - Niklas Andersson och Karl Berg (c) Implementering av strategi 2 - Niklas Andersson i. Exponentiell moving average - Niklas Andersson iii

8 ii. Relativt styrkeindex - Niklas Andersson iii. Moving Average Convergence/Divergence - Niklas Andersson iv. Utvärdering av modell - Niklas Andersson och Karl Berg (d) Paraboliskt SAR - Niklas Andersson 6. Resultat (a) Aktiekurser i. Förbättring av Bachieler-Samuelsons modell - Johanna Juhl ii. Den anpassade förbättrade modellen - Johanna Juhl (b) Valutahandel i. Strategi 1 - Niklas Andersson och Karl Berg ii. Strategi 2 - Niklas Andersson och Karl Berg 7. Diskussion - Niklas Andersson, Karl Berg och Johanna Juhl 8. Slutsats - Niklas Andersson, Karl Berg och Johanna Juhl iv

9 Innehåll 1 Inledning Bakgrund Syfte Avgränsningar Teori Fördelningar Normalfördelning Binomial- och poissonfördelning Empirisk fördelning Metoder och funktioner Kovarians korrelation Sannolikhetsvärde Kvantil Momentgenererande funktion Maximum likelihood-metoden Minsta kvadratmetoden Statistisk hypotestestning Kolmogorov-Smirnovtest Autokorrelationsfunktionen Processer Stationär process Svagt stationär process Lévyprocess Wienerprocess Moving average-process Metod Arbetsgång Litteraturstudier Införskaffande av data Analys och verktyg Högfrekvensmodell för aktier Bachieler-Samuelsons modell för lågfrekvensdata Evaluering av Bachieler-Samuelsons modell Förbättrad modell Devolatilisering av de logaritmerade inkrementen Passning av process till volatilitet Passning av process till logaritmerade inkrementen Anpassning till högfrekvensdata Högfrekvensmodell för valutapar Implementering av strategi Bollingerband Köp- och säljsignaler Utvärdering av modell Autoregressiv process Yule-Walkers ekvationer Passning av en Autoregressiv process Verifiering av koefficienter till en autoregressiv process Implementering i Dukascopy Köp och säljsignaler för den autoregressiva indikatorn Utvärdering av en autoregressiv indikator v

10 5.3 Implementering av strategi Exponentiell moving average Relativt styrkeindex Moving Average Convergence/Divergence Köp- och säljsignaler Utvärdering av strategi Paraboliskt SAR Resultat Aktiekurser Förbättring av Bachieler-Samuelsons modell Den anpassade förbättrade modellen Valutahandel Strategi Strategi med en autoregressiv process som indikator Prediktionstest av en autoregressiv process anpassad till historiska data Strategi Strategi 2 med paraboliskt SAR Diskussion 38 8 Slutsats 39 9 Referenser 40 A Resultat för Ericsson, lågfrekvensmodell 43 B Resultat för Ericsson, högfrekvensmodell 45 C Kod för att evaluera och förbättra Bachieler-Samuelsons modell 48 D Kod för att evaluera AR-process 55 E Kod för implementering av AR-process 59 F Kod för implementering av strategi 1 69 G Kod för implementering av förbättrad strategi 1 74 H Kod för implementering av strategi 2 79 I Kod för implementering av förbättrad strategi 2 86 J Kod för att hämta hem högfrekvent aktiedata 94 vi

11 Nomenklatur [BB] [PMF] [CDF] [PDF] [I.I.D.] [MGF] [ACF] [AR] [MA] [SMA] [MACD] [RSI] [MLE] Bollingerband från engelskans bollinger band Sannolikhetsfunktion från engelskans probability mass function Kumulativ fördelningsfunktion från engelskans cumulative distribution function Täthetsfunktion från engelskans probability density function Oberoende och likafördelade från engelskans independent and identically distributed Momentgenererande funktion från engelskans moment generating function Autokorrellationsfunktion från engelskans auto-correllation function Autoregressiv från engelskans auto regression Glidande medelvärde från engelskans moving average Enkelt glidande medelvärde från engelskans simple moving average Glidande medelvärde konvergens/divergens från engelskans moving average convergence/divergence Relativt styrkeindex från engelskans relative strength index Maximum likelihood-metoden från engelskans maximum likelihood estimation Finansordlista Avkastning Procentuellt mått som beskriver vinst i förhållande till kapitalinsats och tid. Pips Lång Kort Position Pips är en angivelse på de minsta kursrörelser ett instrument rör sig med. För valutor sker handel oftast på 4:e decimalen och är därför det som varje pip motsvaras av. Exempel: går 1 valutapar upp/ner USD motsvarar detta+/- 1 pip. Att gå lång definieras som att en förtjänst kommer att göras om det underliggande instrumentet ökar i värde. Att gå kort definieras som att en förtjänst kommer att göras om det underliggande instrumentet minskar i värde. När ett instrument köps kallas att det att innehavaren har en position där tills dess att instrumentet sålts av det igen. Valutapar Växelkursen mellan två valutor, exempelvis USD/SEK, där den sistnämnda valutasymbolen är basvalutan (SEK). Option Termin Aktie En option ger innehavaren rätten, men inte skyldigheten, att till 1 förutbestämt pris på en förutbestämd tidpunkt (i framtiden) köpa eller sälja det underliggande instrumentet. Utställaren, det vill säga motsatsen till innehavaren, tar ut en avgift för dettaoch hoppas på så vis att innehavaren aldrig avser utnyttja sin rättighet. Samma som en option med den skillnaden att överenskommelsen är bindande för båda avtalsparterna. En aktie utgör en ägarandel i ett företag och är det vanligaste instrumentet som privatpersoner handlar med. Instrument Generell benämning på en typ av värdepapper, exempelvis valuta, aktie, option etc. 1

12 Volatilitet Beskriver hur mycket priset på en finansiell tillgång svänger eller varierar över tid. Volatilitet mäts vanligen som standardavvikelsen hos instrumentets avkastning. Hävstång Hävstång är ett samlingsbegrepp för att använda olika finansiella instrument för att avsevärt öka avkastningen som kan ges på en investering. Typiska instrument som används är optioner, terminer och marginalkonton. ett vanligt begrepp för hävstång är engelskans leverage. Marginalkonto Ett bankkonto där banken lånar ut pengar till klienten för att göra investeringar. Bankerna använder oftast olika mekanismer för att försäkra sig om att kunden inte utsätter sig för förstora risker, exempelvis genom att automatiserat stänga klientens positioner om en för hög risknivå skulle uppfyllas. 2

13 1 Inledning Dagens kapitalmarknad är mycket likvid i den mening att stora volymer av värdepapper kan köpas och säljas, vilket i kombination med dess digitalisering möjliggör handel av stora volymer på kort tid. Genom att implementera matematiska modeller som automatiserade algoritmer är det möjligt att avsluta mångmiljardaffärer på mikrosekunder. Kravet på en sådan matematisk modell är att kunna prediktera ett framtida värde med tillräcklig precision relaterad till den ekonomiska risk som föreligger. Det blir också relevant att undersöka hur tidsspannet påverkar modellerna då diskret data övergår till kontinuerlig - det vill säga, hur väl en lågfrekvensmodell kan användas med högfrekvensdata. Inledningsvis studeras Bachieler-Samuelsons 1 akiteprismodell för modellering av lågfrekvent data. Modellen är akademiskt erkänd och väletablerad på finansmarknaden [1]. Resultatet av undersökningen används till att förbättra modellen, och studera kompatibliteten med högfrekvent data. En begränsning för högfrekvensdata till aktier är det glapp som uppstår när börsen är stängd. Denna begränsning uppstår inte i samma utsträckning vid analys av valutapar vars marknad är öppen dygnet runt med undantag för helgen. Som nästa steg i projektet undersöks därför möjligheten att passa en stationär process med högre upplösning till valutapar. De lärdomar som erhålls under dessa undersökningar av matematiska modeller för ekonomiska tidserier ger resultat som används för att utvärdera och förbättra handelsstrategier som erhållits genom ett samarbete med ett finansbolag 2 i Stockholm. 1.1 Bakgrund Under början av 1900-talet började akademiker intressera sig för hur de analytiskt kunde konstruera matematiska modeller för handel med värdepapper. Akademikernas inträde på börsen var ett faktum 1997 då Robert C. Merton och Myron S. Scholes belönades med Sveriges Riksbanks Pris i Alfred Nobels minne "for a new method to determine the value of derivatives" [1]. Kortfattat eliminerade deras upptäckt risken med hjälp av dynamiska hävstångseffekter, vilket kom att utnyttjas av ett kommersiellt bolag LTCM 3 som anställde akademiker, inklusive de två nobelpristagarna, för att implementera matematiska modeller. Det som liknade en framgångssaga med 40% värdeökning per år blev efter fyra år, mellan 1994 och 1998, en mardröm i samband med Asiens finansiella kris under det föregående året. LTCM återhämtade sig aldrig och det amerikanska folket fick betala kostnaden medan Merton och Scholes teorier sågades, mer eller mindre rättvist, i det offentliga rummet. Merril Lynch 4 observerade 1998 i sin årliga rapport att matematiska riskmodeller "may provide a greater sense of security than warranted; therefore, reliance on these models should be limited." [3]. Ett tidigare kandidatarbete [4] har behandlat optimering av Bachieler-Samuelsons modell för lågfrekvensdata med framgång, varför avsnitt 4.1 och 4.2 beskriver en analog undersökning. Högfrekvenshandel är ett nytt, växande och högst omdiskuterat fenomen på världens finansmarknader. Det innebär att affärerna snabbt och helt automatiserat utförs av datorer, vilka beslutar och genomför affärer efter givna instruktioner. Automatiserad handel ger en rad fördelar, bland annat kan tusentals investeringsbeslut och transaktioner utföras i ett och samma ögonblick. Detta fenomen har öppnat upp för en helt ny handelsgren, högfrekvenshandel, där kapitalisering på extremt kortvariga affärsmöjligheter kan utföras - något som tidigare varit helt omöjligt. Kritiker hävdar att högfrekvenshandel är oetiskt, eller till och med olagligt, eftersom det ger dem med snabbast datorer tillgång till börspåverkande information före andra [5]. Förespråkarna hävdar istället att det ger ökad likviditet, minskar skillnaden mellan köp- och säljkurs samt bidrar till mer perfekta marknader [6]. Högfrekvenshandelns lönsamhet har lett till stor efterfrågan på matematiska modeller inom detta område [7]. I Sverige är högfrekvenshandeln centrerad i Stockholm där ett fåtal aktörer utövar denna typ av handel. En av dessa aktörer är det finansbolag som inlett samarbete med denna kandidatgrupp. Finansbolaget i fråga högfrekvenshandlar med valuta och använder således högfrekvensmodeller. 1 Även kallad Black-Scholes. 2 Finansbolaget föredrar, på grund av sekretess, anonymitet. 3 Long-Term Capital Management 4 Ett amerikanskt finans och försäkringsbolag, numera uppköpt av Bank of America. Tidningen Fortune som ges ut av CNN rankade 1998 bolaget som det 24:e största i USA [2] 3

14 Finansbolaget tillhandahåller två av sina välbeprövade strategier, dessa återfinns i avsnitt 5.1 och avsnitt Syfte Syftet med detta kandidatarbete är att konstruera, utvärdera och implementera matematiska modeller för ekonomiska tidserier med fokus på korta tidsspann. 1.3 Avgränsningar Ekonomiska eller marknadsanalytiska effekter förbises. Tiden då börsen är stängd sker ingen modellering vilket innebär en diskontinuitet i aktiedatan då värdet mellan stängning och nästkommande öppning skiljer sig. Enligt praxis backtestas högfrekvensmodeller två år innan de används vilket inte sker i detta kandidatarbete på grund av bristande erfarenhet för en sådan analys och den stora datamängden som skulle kräva lång beräkningstid. 4

15 2 Teori Matematisk teori som behandlas i grundkurser i matematisk statistik och stokastiska processer nedtecknas här i uppslagsform för den läsare som är obekant med dylika kurser eller litteratur. 2.1 Fördelningar En fördelningar ger en beskrivning för hur sannolika olika utfall tillhörande utfallsrummet är Normalfördelning En fördelning kallas normalfördelad om dess PDF beskrivs som ekvation (1) enligt [8]. Där väntevärdet µ = E [X], och variansen σ 2 = Var [X], en fördelning som är normalfördelad anges N ( µ; σ 2). Standard normalfördelningen anges N (0; 1). f X (x) = 1 σ 2π e (x µ) 2 2σ 2 (1) En normalfördelad kurva är perfekt symmetriskt kring sitt medelvärde [9]. Kurtosis är ett värde på hur plan eller spetsig en kurva är jämfört med normalfördelningen [9]. Leptokurtisk beskriver en spetsig fördelning och platykurtisk en plan fördelning [9]. Kurtosisen Γ beräknas som ekvation (2) enligt [9], där {X i } N i=1 är mängden som skall undersökas och N är antal element. Ekvation (3) beskriver standardfelet för kurtosisen enligt [9]. [ N (N + 1) N ( ) ] 4 Xi µ 3 (N 1) 2 Γ = (N 1) (N 2) (N 3) σ (N 2) (N 3) i=1 24N (N 1) SE Γ = (N 2) (N 3) (N + 5) (N + 3) γ = N (N 1) (N 2) (2) (3) N ( ) 3 Xi µ (4) i=1 6N (N 1) SE γ = (N 2) (N + 1) (N + 3) Skevhet är ett begrepp som beskriver en fördelnings horisontella symmetri. En fördelnings skevhet γ beräknas som ekvation (4) enligt [9]. Ett positivt värde för γ beskriver högerskevhet där fördelningen är koncentrerad till vänster om en normalfördelnings symmetrilinje. På samma sätt beskriver ett negativt värde för γ en vänsterskevhet, alltså där fördelningen är koncentrerad till höger om symmetrilinjen för en normalfördelning. Ekvation (5) beskriver standardfelet för skevheten enligt [9] Binomial- och poissonfördelning En binomialfördelning beskriver frekvensen av n oberoende försök med sannolikheten p för ett lyckat 5 utfall. Sannolikheten att x lyckade oberoende försök inträffar beskrivs av (6) enligt [10]. ( ) n P (X = x) = p x (1 p) n x (6) x Binomialfördelningen är en diskret fördelning med väntevärde µ = np och varians σ 2 = np (1 p). 5 Lyckat i detta avseende är godtyckligt och inte ett subjektivt uttryck. σ (5) 5

16 Poissonfördelningen är en approximation av binomialfördelningen då antalet oberoende försök n är stort och sannolikheten p för lyckat utfall är liten. Parametern λ = np > 0 används då för att beskriva distributionen som (7) enligt [10]. P (X = x) = λx x! e λ (7) Väntevärdet ges då som µ = λ och variansen som σ 2 = λ, enligt [10] Empirisk fördelning Den empiriska distributionen F emp är en CDF (8) med direkt beroende till en sorterad datamängd X = {x 1, x 2,..., x m } sådan att x 1 < x 2 < < x m enligt [11]. 0 för x < x 0 n F emp (x) = m för x n x < x n+1 n = 1,..., m 1 (8) 1 för x m x F emp (x) har således följande egenskaper: 1. 0 n m 1 för n = 1,..., m 1 2. m 1 n m n=1 = 1 för n = 1,..., m Metoder och funktioner Här redovisas de typiska statistiska metoder och funktioner som används för att analysera,testa eller manipulera data Kovarians Låt (X, Y ) vara kontinuerliga och bivariata stokastiska variabler ges kovariansen av ekvation (9), där µ x = E [X] och µ y = E [Y ], enligt [12]. Cov (X, Y ) = σ XY = E [(X µ x ) (Y µ y )] (9) Om Cov (X, Y ) = 0 är (X, Y ) okorrellerade. Om (X, Y ) är oberoende medför detta att (X, Y ) är okorrellerade, enligt [12] korrelation Låt (X, Y ) vara kontinuerliga och bivariata stokastiska variabler. Då kan det linjära beroendet mellan (X, Y ) studeras genom att beräkna korrelationskoefficienten som ekvation (10) enligt [12], där σ x = Var [X] och σ y = Var [Y ]. ρ x,y = Cov(X, Y ) σ x σ y = E [(X µ x)(y µ y )] σ x σ y (10) Där 1 ρ x,y 1. Vid ρ x,y = 0 är (X, Y ) okorrelerade men inte nödvändigtvis oberoende. { ρ x,y < 0 visar på ett negativt linjärt beroende (11) ρ x,y > 0 visar på ett positivt linjärt beroende Sannolikhetsvärde P (X x) beskriver sannolikheten att en stokastisk variabel X antar ett värde större än eller lika med det observerade värdet x [13], kallas även p-värde. 6

17 2.2.4 Kvantil Givet en CDF F X definieras dess kvantil som det minsta värdet på X som ger F X p, som (12) enligt [14]. Q X (p) = F 1 X (p) = inf [x : F X (x) p] (12) 0<p<1 Speciellt kallas Q X (25%) undre kvartil, Q X (50%) median och Q X (75%) övre kvartil. Vid jämförelse av två CDF:er F X och G X används en så kallad Quantile-Quantile plot (qq-plot), kvantilkvantilgraf, som ritar F 1 X mot G 1 X. Då F ( X (x) = G x µ ) X σ måste F 1 X (p) = µ + σg 1 (p) vilket innebär att kvantilerna har ett linjärt förhållande. Det medför att två distributioner av samma typ men med olika position får en qq-plot i form av en linje Momentgenererande funktion Den momentgenererande funktionen beskrivs som ekvation (13) enligt [15], för en icke-negativ stokastisk variabel ξ Maximum likelihood-metoden f (s) = f ξ (s) = E { e sξ} för R (s) 0 (13) Maximum likelihood-metoden (MLE) är en metod som används för att skatta parametrar till en statistisk modell givet en dataserie. Metoden utgår ifrån att skatta de värden på parametrarna som maximerar sannolikheten av värdena i dataserien. Givet en dataserie X(t) är det möjligt bilda ett mått på sannolikheten för X(t) givet parametrarna θ för vald fördelning, vilken för oberoende data ser ut som ekvation (14) enligt [16], där f är en så kallad täthetsfunktion för den valda teoretiska fördelningen. L(θ x 1,..., x n ) = f(x 1, x 2,..., x n θ) = n f(x i θ) (14) Genom att maximera funktionen f med avseende på parametrarna θ erhålls de parametrar för vilket det observerade utfallet är mest sannolikt (exempelvis µ och σ för en normalfördelning) [16] Minsta kvadratmetoden Minsta kvadratmetoden är ett sätt att approximera lösningar till överbestämda ekvationssystem. Med en given datamängd (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) där funktionen som skall bestämmas är y n = f(x n, b) där b är en koefficientvektor. Vidare minimeras b som ekvation (15) Statistisk hypotestestning i=1 n [y i f(x i, b)] 2 (15) i=1 En statistisk hypotes beskriver ett antagande om sannolikhetslagarna för stokastiska variabler. Om det finns en testmängd (X 1, X 2,..., X n ) med PDF f (x; Θ). Θ = Θ 0 önskas testas mot antagandet Θ = Θ 1. Hypotesen H o ansätts för resultatet att Θ = Θ 0 och hypotesen H 1 ansätts till resultatet Θ = Θ 1 [17]. H 0 : H 1 : Nollhypotes Alternativ hypotes Testning är en process för att bestämma en hypotes validitet. Ett sådant test innehåller en så kallad acceptansregion då x R 0 och en kritisk region x R 1. Om x tillhör acceptansregionen accepteras nollhypotesen, om x tillhör den kritiska regionen förkastas nollhypotesen och den alternativa hypotesen antas. P-värdet för ett sådant tests felbeslut ges av [17]: 7

18 p 1 : p 2 : P (x R 1 : H 0 ) Acceptera H 1 när H 0 är sann P (x R 0 : H 1 ) Acceptera H 0 när H 1 är sann p 1 = α kallas signifikansnivån och p 2 = β, där styrkan i testen benämns som (1 β) enligt [17] Kolmogorov-Smirnovtest Kolmogorov-Smirnovtestet ger ett värde för hur bra en mängd mätdata passar till ett antagande. Om det finns en mängd mätdata X 1, X 2,..., X n av oberoende och likafördelade, I.I.D., stokastiska variabler, med CDF F (x) [18]. Denna data kan passas till en parametrisk modell med CDF ˆF (x). Den empiriska fördelningsfunktionen F emp (x) för mätdatan beräknas som ekvation 8. Under nollhypotesen att ˆF (x) och F emp (x) har samma fördelning går det att utföra ett klassiskt Kolmogorov-Smirnovtest, som utförs som ekvation (16) enligt [18]. T n sup n ˆF (x) Femp (x) = ( n ˆF (x), Femp (x)) (16) x R Kolmogorov-Smirnovavståndet,, beskrivs som ekvation (17), avståndet visar på bäst passning om (16) är lika med noll enligt [18]. ( ) ˆF (x), Femp (x) = sup ˆF (x) F emp (x) (17) x R P-värdet för testet kan beräknas med hjälp av den kumulativa Kolmogorov-Smirnovfördelningen P ( n x) =1. Med hjälp av detta kan p-värdet för testet beräknas. Vanligtvis sätts signifikansnivån α = 0,05, när p < α förkastas nollhyptesen att fördelningarna är likadana enligt [19] Autokorrelationsfunktionen Autokorrelationsfunktionen (ACF) beskrivs som (18) enligt [21]. Denna beskriver variblers beroende och baseras på korrelation, ekvation (10). r X1 (s, t) = Cov {X 1 (s), X 1 (t)} Var {X 1 (s)} Var {X 1 (t)} (18) Speciellt är r X1 (t, t) = Var {X 1 (t)}. Stationära förhållanden beskrivs i avsnitt 2.3.1, vilket i kombination med ekvation (18) ger upphov till ekvation (19), med X t 1 = 1 X 1 (i). 2.3 Processer r X1 (h) = r X1 (t, t + h) t+1 i=0 = Cov {X 1 (t), X 1 (t + h)} Var {X 1 (t)} (t + 1) t h ( X1 (i) X ) ( 1 X1 (i + h) X ) 1 i=0 ˆr X1 (h) = (19) (t h + 1) t ( X1 (i) X ) 2 1 En stokastisk process i matematisk mening är en tidsberoende slumpprocess. Hädanefter skrivs process för enkelhet Stationär process En stokastisk process {X (t)} t T är strikt stationär om {X (t 1 ),..., X (t n )} och {X (t 1 + h),..., X (t n + h)} är likafördelade stokastiska variabler för n N, t 1, t 2,..., t n T och h R är sådant att t 1 + h, t 2 + h,..., t n + h T [20]. i=0 8

19 2.3.2 Svagt stationär process I en praktisk applikation används svag stationäritet vilket gäller för den stokastiska process {X (t)} t T som har väldefinierade väntevärde- och autokorrelationsfunktioner, m X (t) respektive r X (t, t + τ) som är oberoende av tiden t T [22] Lévyprocess En process {X (t)} t 0 kallas en Lévyprocess enligt [23] om {X (t)} t 0 har oberoende stationära inkrement Wienerprocess En process {X (t)} t 0 kallas Wienerprocess enligt [24] om: {X (t)} t 0 har stationära oberoende inkrement. Inkrementet X (t h) X (t), h > 0 är normalfördelat. E [X (t)] = 0. X (0) = Moving average-process En moving average-process (MA-process) är som namnet antyder ett (oviktat) glidande medelvärde baserat på n tidigare värden och definieras som ekvation (20), där X(t) är dataserien vid en given tidpunkt t och n antalet tidsperioder bakåt som är intressanta. t 1 n X(i) MA(t) = i=t n X(t) t > n t n Mindre svängningar filtreras bort så att analysen kan koncentreras på verkliga, större svängningar. Denna typ av MA-process kallas SMA, Simple Moving Average, och är en eftersläpande indikator [25]. (20) 9

20 3 Metod Metodiken baseras på en kvantitativ analys med inslag av empiriska studier. Den kvantitativa analysen grundas i den data som inhämtats i kandidatarbetets början, det finns därför en stark korrelation mellan den kvantitativa analysens slutsats och den inhämtade datan. Fokus har initialt legat på kvantitativ analys genom insamling av stora mängder data och vidare med hjälp av statistiska metoder försökt hitta genomgående samband. Arbetsgången följer vår handledares instruktioner som uppdaterades i samband med att företagskontakten etablerades. 3.1 Arbetsgång Kunskaper specifika för det aktuellla ämnet inhämtas genom litteraturstudier, handledarsamtal och kontakt med finansbolaget i Stockholm. Därefter införskaffas data som valideras, analyseras och implementeras i nya modeller med målet att beskriva finansiella instruments kursrörelser både bakåt och framåt i tiden med så god precision som möjligt. Arbetsgången beskrivs i detalj i avsnitt Litteraturstudier Då ingen av rapportförfattarna tidigare studerat finansämnet akademiskt, har målet initialt varit att ta sig igenom litteratur med inriktning mot högfrekvenshandel. En del av gruppen har heller inte studerat matematisk statistik i någon större omfattning, varför kursen Basic Stochastic Processes (MSG800/MVE170), lästes in och tenterades parallellt med kandidatarbetet. Följande litteratur har studerats: Probability, Random Variables and Random Processes - Hsu H Time Series: Theory and Methods - Brockwell P.J. Davis R.A. High Frequency Trading - Irene Aldrige Quantitative Trading - Ernest P. Chan Fourier Transform Methods in Finance - U. Cherubini, S. Mulinacci, P. Rossi and G. D. Lunga Technical Analysis of The Financial Markets - John J. Murphy Stokastiska Processer - Patrik Albin Införskaffande av data Dygnsdata för aktier i USD erhålls via Google Finance och Yahoo Finance, för data i SEK används NASDAQ OMX Nordic och Avanza. Data med högre upplösning är mer svåråtkomlig. Till detta ändåmål utvecklades ett program i Python som automatiskt laddar ner och sparar undan högfrekvensdata 6 från en välkänd nätmäklare i Sverige. Längre fram under kandidatarbetet kontaktades SIX Telekurs 7 och de valde att inleda ett samarbete där de tillhandahåller högfrekvensdata för utvalda aktier gratis för detta kandidatarbets del. Valutadata har erhållits från Dukascopy, vilket är en Schweizisk bank inriktad mot valutahandel vars kontakt inletts via finansbolaget i Stockholm. All data har verifierats mot minst en motsvarande källa och på så vis har dess trovärdighet säkerställts. Dygnsdata för aktier i USD har verifierats genom jämförelser mellan Yahoo Finance och Google Finance. För aktiedata i SEK har värden från NASDAQ OMX Nordic jämförts med data från Avanza. Högfrekvensdatan för aktier har jämförts mellan det egenhändigt byggda programmet och data från SIX Telekurs. Valutadatan från Dukascopy har verifierats genom jämförelser med data från SIX Telekurs. 6 Med upplösningen tre värden i minuten. 7 SIX Telekurs är ett företag som säljer börsinformation. 10

21 3.1.3 Analys och verktyg I huvudsak har Mathematica använts för att utvärdera och analysera matematiska modeller. Matlab har också använts i de fall det ansetts mer lämpligt eller för att verifiera och säkerhetsställa vissa resultat erhållna från Mathematica. Både Matlab och Mathematica är välkända verktyg och anses pålitliga såväl inom industri- som forskarvärlden [27]. För utvärderingen av att förutspå framtida kursrörelser för valutapar med kravet att även kunna kapitalisera på densamma har Dukascopys Java API och deras JForex klient använts. För implementering av själva matematiken i Java används biblioteket Jama, vilket är ett matematikbibliotek som National Institute of Standards and Technology tillhandahåller och ger ut helt fritt [28]. Med hjälp av dessa två verktyg går det att effektivt simulera en riktig handelsdag med fiktiva pengar och på så vis få ut vilken avkastning som erhålls om handeln varit verklig. Dukascopy är en av Schweiz största banker inriktade mot valutahandel och har en allmänt välrespekterad plattform. 11

22 4 Högfrekvensmodell för aktier I detta avsnitt presenteras lösningsgången för hur Bachieler-Samuelsons modell optimeras för att sedan anpassas till högfrekvensdata. 4.1 Bachieler-Samuelsons modell för lågfrekvensdata Modellen som blev belönad med nobelpriset i ekonomi 1997 beskrivs som ekvation (21), där {N (t)} t 0 är en stokastisk tidsberoende process, enligt [26]. S (t) = S (0) e N(t)+µt (21) Valet av process anpassas för att likna det verkliga marknadspriset. Standardvalet för processen är enligt: N (0) = 0. N (t) har oberoende inkrement, det vill säga: N (t 1 ) N (t 0 ),..., N (t n ) N (t n 1 ) är oberoende för 0 t 0... t n. N (t) har stationära inkrement, det vill säga fördelningen N (t + h) N (t) beror inte på t. Det innebär att processen är overksam vid tidpunkten noll samt har obereonde och stationära inkrement. Dessa egenskaper kännetecknar en Lévyprocess, som beskrivs i avsnitt 2.3.3, och begränsar valet av modell. Standardantagandet för inkrementen N (t + h) N (t) är att de är normalfördelade med medelvärde 0 och varians σ 2 h 1 enligt: N (t + h) N (t) N ( 0, σ 2 h ) (22) En Lévyprocess som uppfyller (22) kallas för en Wienerprocess, som beskrivs i avsnitt [26] Evaluering av Bachieler-Samuelsons modell För att förbättra Bachieler-Samuelsons modell (21) undersöks eventuella brister i grundmodellen. Evaluering sker genom att undersöka de antaganden som gjorts för processen {N (t)}, där N (t) N(0; σ 2 h), h = 1 beskriver steglängden en dag. ABB:s, Astra-Zeneca:s och Ericssons stängingskurser under perioden 2010/04/ /05/14 laddas ned från Google Finance. Kursen för ABB under perioden 2010/04/ /05/14 visas i figur (1). Figur 1: ABB:s stängningskurs till , källa: För att undersöka processen {N (t)} i ekvation (21) beräknas de logaritmerade inkrementen enligt ekvation (23). { ( )} S(n) {L(n) L(n 1)} n 1 = ln = {N(n) N(n 1) + µ} S(n 1) n 1 (23) n 1 12

23 Enligt Bachieler-Samuelsons antagande skall dessa logaritmerade inkrement vara normalfördelade. En normalfördelning skall ha en PDF som ser ut enligt (1), kurtosis Γ = 0 och skevhet γ = 0. För att jämföra logaritmerade inkrementens fördelning med en normalfördelning beräknas µ och σ med hjälp av maximum likelihood-metoden (MLE) som beskrivs som ekvation (14), även skevheten, ekvation (4) och kurtosisen, ekvation (2) beräknas. Dessa värden ges i tabell (1). Ett rimligt antagande efter resultatet i tabell (1) är att de logaritmerade inkrementen inte är normalfördelade. Kurs µ σ Γ γ ABB Astra-Zeneca Ericsson Tabell 1: De logaritmerade inkrementens väntevärde µ, varians σ, kurtosis Γ och skevhet γ för aktiekurserna ABB, Astra-Zeneca och Ericsson under perioden till , värden är nedladdade i USD. Med en qq-plot, som beskrivs i avsnitt 2.2.4, kan de logaritmerade inkrementens fördelning jämföras grafiskt med normalfördelningen. Testet jämför kvantiler 8 ur fördelningarna och om de logaritmerade inkrementens fördelning är densamma som normalfördelningen kommer en linje som följer den streckade att ritas. ABB:s logaritmerade inkrement gav resultat enligt figur (2), ett glatt histogram för logaritmerade inkrementen jämfördes med ett glatt histogram för normalfördelning. Figur 2: En qq-plot och ett glatt histogram av ABB:s logaritmerade inkrement, den streckade linjen är den förväntade normalfördelningen. Eftersom linjen för ABB:s logaritmerade inkrementen inte följer den streckade linjen dras slutsatsen att de logaritmerade inkrementen inte är normalfördelade. detta ses tydligt på de svansar som uppträder ytterst på plotten. Analys av det glatta fördelningshistogrammet styrker denna slutsats. Det andra antagandet som undersöks är de logaritmerade inkrementens beroende. Bachieler- Samuelsons modell antar att de logaritmerade inkrementen är oberoende. De logaritmerade inkrementens beroende undersöks med hjälp av autokorrelationsfunktionen (ACF) i avsnitt som används till ett autokorrelationstest som redovisas nedan. Korrelationskonstanten beräknas enligt ekvation (10), utifrån detta kan autokorrelationsfunktionen (ACF) beräknas enligt ekvation (18). Om processen som undersöks antas vara stationär beror ACF:en endast på tidslagget h. Då kan ACF:en skattas enligt ekvation (24), där h beskriver tidslagget, L (i) logaritmerade inkrementen som ekvation (23), t tiden, µ mängdens väntevärde och σ mängdens varians enligt [30]. 8 Se avsnitt ˆr (h) = t h i=1 (L(i) µ) (L(i + h) µ) (t h + 1) σ 2 (24) 13

24 Om mängden är oberoende gäller ekvation (25). lim nˆrx1 (h) N (0, 1) (25) n För att analysera det linjära beroendet går det med hjälp av ekvation (25) att införa ett 95%- konfidensintervall, som ekvation (26) enligt [30]. ˆr (h) 1.96 n (26) Vid tillräckligt stort n antas linjärt beroende. Den skattade ACF:en beräknas för de logaritmerade inkrementen samt för de kvadrerade och logaritmerade inkrementen. I figur (3) kan resultetet för autokorrelationstestet ses. Figur 3: ABB:s logaritmerade inkrements ACF samt ABB:s logaritmerade inkrements kvadrerade ACF, mot ett 95%-konfidensintervall. Utifrån figur (3) dras slutsatsen att de kvadrerade och logaritmerade inkrementen uppvisar positivt linjärt beroende. De kvadrerade och logaritmerade inkrementen beskriver amplituden för förändringar i aktiepriset, även kallat volatilitet. I Bachieler-Samuelsons modell antas volatiliteten vara konstant, men undersökningen för korrelationen leder till slutsatsen att volatiliteten inte är konstant utan en beroende process, alltså medför antagandet om konstant volatilitet brister i Bachieler- Samuelsons modell. 4.2 Förbättrad modell Insikterna från undersökningen av Bachieler-Samuelsons modell ger att volatiliteten inte är konstant utan en process som beror av tiden t. Detta medför att Bachieler-Samuelsons modell kan förbättras till ekvation (27), där volatiliteten σ (t) är en process som beror av tiden t. S (t) = S (0) e σ(t)n(t)+µt (27) Devolatilisering av de logaritmerade inkrementen För att tydliggöra hur volatiliteten ser ut för de logaritmerade inkrementen devolatiliseras dessa. Volatiliteten kan brytas ut ur de logaritmerade inkrementen, då volatiliteten antas vara en långsammare process än den Wienerprocess som tidigare antagits för de logaritmerade inkrementen, enligt ekvation (28). L(n) L(n 1) = σ (n) N(n) σ (n 1) N(n 1) + µ (28) Under en kort period, k dagar, kan σ (t) antas vara konstant. Då erhålls ekvation (29). L(n) L(n 1) = σ (n) N(n) σ (n 1) N(n 1) + µ σ (n) (N(n) N(n 1)) + µ (29) Härmed kan σ (t) skattas som standardavvikelsen ˆσ (x) till {L(n) L(n 1)} t n=t k+1, k väljs till 20 och den skattade volatiliteten beräknas [26]. 14

25 För att devolatilisera de logaritmerade inkrementen följs modell (30). L(n) L(n 1) σ (t) µ = N(n) N(n 1) σ (t) N(n) N(n 1) (30) På dessa devolatiliserade inkrement utförs ett statistiskt hypotestest, som beskrivs i avsnitt 2.2.8, där: H 0 : H 1 : De devolatiliserade, logaritmerade inkrementen är normalfördelade De devolatiliserade, logaritmerade inkrementen är inte normalfördelade Resultatet för de devolatiliserade och logaritmerade inkrementens autokorrelation kan ses i figur (4). De devolatiliserade, kvadrerade och logaritmerade inkrementen har inte samma positiva linjära beroende som de icke-devolatiliserade. Figur 4: ABB:s logaritmerade inkrementens ACF samt ABB:s kvadrerade logaritmerade inkrementens ACF efter devolatilisering, mot ett 95%-konfidensintervall. Figur 5: Jämförelse mellan ABB:s devolatiliserade logaritmerade inkrementen fördelning mot normalfördelningen, en qq-plot. Om normalfördelad skall linjen följa den streckade linjen. Histogram över fördelning för de devolatiliserade logaritmerade inkrementen mot streckad blå normalfördelning. De devolatiliserade och logaritmerade inkrementen följer den streckade linjen och är således närme normalfördelningen, enligt figur (5), de glatta fördelningarna visar även dessa på ett mer normalt beteende. Ett annat sätt att undersöka hur bra fördelningarna passar är att göra ett så kallat Kolmogorov- Smirnovtest. De passade, devolatiliserade och logaritmerade inkrementens CDF:er ˆF beräknas liksom normalfördelningens empiriska fördelningsfunktion F emp enligt ekvation (8). Med hjälp av ekvationerna (16) och (17) beräknas Kolmogorov-Smirnovavståndet och p-värdet för den devolatiliserade fördelningen enligt ett Kolmogorov-Smirnovtest som beskrivs i avsnitt Resultatet kan ses i tabell (2). Om signifikansnivån α väljs till 0,05 inses att resultatet för en del av p-värdena för den devolatiliserade datan leder till acceptans av nollhypotesen. Även om nollhyptesen i vissa fall fortfarande förkastas visar alla p-värden på att den devolatiliserade datan passar bättre 15

26 med normalfördelningen. Kolmogorov-Smirnovavståndet,, som visar på bättre passning desto mindre det är, vittnar om bättre passning efter devolatilisering i samtliga fall. Efter ovanstående analys accepteras nollhypotesen om att de devolatiliserade, logaritmerade inkrementen är normalfördelade, till skillnad från de icke-devolatiliserad, logaritmerade inkrementen. Aktiekurs p 1 p ABB 0, , , , Astra-Zeneca 0, , , , Ericsson 0, , , , Tabell 2: p 1 beskriver p-värdet för logaritmerade inkrementens pasning till normalfördelningen, p 2 de devolatiliserade logaritmerade inkrementens p-värde till normalfördelningen, 1 logaritmerade inkrementens Kolmogorov-Smirnovavstånd till normalfördelningen, 2 de devolatiliserade logaritmerade inkrementens Kolmogorov-Smirnovavstånd Passning av process till volatilitet För att hitta en lämplig process för volatiliteten σ(t), visar det sig lämpligt att passa en moving average-process (MA-process). En MA-process kan ansättas som ekvation (31) där {e(t)} tɛz är I.I.D. stokastiska variabler, a 0,..., a q ɛr. För tɛz gäller då ekvation (31). X(t) = q a i e (t i) (31) i=0 Kovariansfunktionen för ekvation (31) ges av ekvation (32). För att modellera {σ(t)} skattas r(t) med hjälp av kovariansfunktionen (32). r(t) m t 1 (σ(n) ˆσ)(σ(n + t ) ˆσ) (32) m t n=1 Storleken på q bestäms utifrån att kovariansen skall vara så nära noll som möjligt, samt att negativa koefficienter är oönskade, här väljs q = 20. Med hjälp av ovanstående funktioner finns q + 1 ekvationer för att hitta q + 1 koefficienter. Detta betyder att koefficienterna a 0,....a q kan lösas ut med hjälp av minsta kvadratmetoden. Minsta kvadratproblemet som skall lösas ser ut enligt ekvation (15), där y i beskriver den empiriska kovariansen, f(x i, b) den teoretiska med koefficientvektor b = a 0,....a q. Problemet löses med villkoret att a 0,....a q 0. Den passade kovariansfunktionen mot den empiriska kan ses i figur (6). Figur 6: Den empiriska kovariansen mot den passade kovariansen. Vad som återstår för MA-processen är att hitta en lämplig fördelning. Brusprocessen e (t) modelleras som en diskret fördelning med möjliga värden { 0, w K, 2w K,..., w} med sannolikheterna {p 0, p 1,..., p K } [26]. Övrigt så gäller att: 16

27 e (t) 0 ( q i=0 a i) E {e (0)} = σ, alltså E {e (0)} = σ q i=0 ai K i=0 p i = 1 För att hitta e (t) används en ickeparametrisk metod där den empiriska momentgenererande funktionen (MGF) jämförs med den teoretiska. Om mängden {X i } observationer är känd kan den empiriska MGF:en beräknas enligt ekvation (33). ϕ x (t) = 1 n exp (tx i ) (33) n i=1 Den teoretiska MGF:en för brusprocessen beräknas enligt ekvation (34). [ ( )] ( q q q K ( ) ) ai tkw E exp t a i e ( i) = ϕ e (a i t) = p k exp (34) K i=0 i=0 För att sedan lösa ut intressanta värden {p k } som beskriver ett överbestämt ekvationssytem, används minsta kvadratmetoden, med inskränkningen att w = max[σ(t)] 2E[a i]q och K = 1. Minsta kvadratproblemet ser ut enligt ekvation (15), där y i beskriver den empiriska MGF:en för volatiliteten och f(x i, b) den teoretiska för MA-processen med en koefficitentvektor b = p 0,...,p K med villkoret att K i=0 p i = 1, Den passade MGF:en mot den empiriska MGF:en kan ses i figur (7), p-värdet för passningen är 0, i=0 k=0 Figur 7: Den passade MGF:en mot den empiriska MGF:en för volatilitetsprocessen Passning av process till logaritmerade inkrementen För att kunna beskriva den förbättrade modellen (27), behövs en process för de logaritmerade inkrementen. Tillvägagångssättet påminner om det för MA-processen. Modellen för de logaritmerade inkrementen kan ses i ekvation (35), där m R, s 2 0, b 1,..., b n R, n N, konstanter, Z 1,..., Z n oberoende, stokastiska, poissonfördelade variabler med λ i > 0 för i = 1,..., n och Y N(0; h), h = 1 ger steglängd en dag enligt [26]. m + s 2 Y + För ekvation (35) beräknas den teoretiska MGF:en enligt ekvation (36). E [e t(m+s2 Y + n bizi)] i=1 = e tm+ t2 s 2 2 n i=1 n b i Z i (35) i=1 ϕ Zi (b i t) = e tm+ t2 s n e λi(eb i t 1) (36) i=1

28 På samma sätt som för MA-processen återstår nu att hitta m, s, b 1,..., b n, n och λ 1,..., λ n. Detta görs via minsta kvadratmetoden. Problemet ser ut enligt ekvation (15), där y i beskriver den empiriska MGF:en för logaritmerade inkrementen och f(x i, b) den teoretiska MGF:en för de passade logaritmerade inkrementen, där b är en koefficientvektor innehållandes b 1,..., b n, λ 1,..., λ n, m och s. Villkoren för minsta kvadratproblemet är att λ 1,..., λ n 0. Passningen för de logaritmerade inkrementen syns i figur 8. Här används summan av fyra poissonfördelningar det vill säga n = 4, p-värdet för passningen är 0, Figur 8: Den passade MGF:en för logaritmerade inkrementen mot den empiriska MGF:en för de logaritmerade inkrementen. Alla verktyg för att simulera lågfrekvensmodellen är nu klara. 4.3 Anpassning till högfrekvensdata Möjligheten att beskriva högfrekvensdata med den förbättrade Bachieler-Samuelsons modellen undersöks genom att den förbättrade modellen används för att beskriva aktiekursers rörelser under kortare tidsperioder. Högfrekvent data för ABB, Aztra-Zeneca och Ericsson laddas ned i olika upplösning, timme och minut. Datan hämtas via ett egenbyggt Python-program. Data med 1-minuts upplösning kan typiskt se ut enligt figur (9). Figur 9: ABB:s kurs under 2011/05/04, källa: För att anpassa modellen till högfrekvensdata, tas Bachieler-Samuelsons grundantagande om att volatiliteten är konstant tillbaka, dock endast under en dag. Volatilitetsprocessen tas fram med hjälp utav lågfrekvensdata på samma sätt som för lågfrekvensmodellen, data som används sträcker sig över ett år. ABB:s, Astra-Zeneca:s och Ericssons stängingskurser under perioden 18

29 till laddas ned från NASDAQ OMX Nordic, då dessa värden önskas erhållas i SEK. Även de logaritmerade inkrementens process tas fram med hjälp utav lågfrekvensmodellen. Skillnaden ligger i simuleringen av modellen. Modellen simuleras dag för dag, under vilken volatiliteten har ett och samma värde. De logaritmerade inkrementen för lågfrekvensmodellen simuleras enligt ekvation (37), där t är tiden, Y N(0; 1) och Z i P (λ i ) slumpas fram. L l (t) = m + s 2 Y + n b i Z i (37) När de högfrekventa, logaritmerade inkrementen simuleras fram används en modell för 24 timmar 1 enligt (38), där t är tiden, Y N(0; 24τ ) och Z i P ( ) λ i 24τ slumpas fram. Tiden τ bestämmer den simulerade modellens frekvens, alltså τ = 1 för ett värde per timme. i=1 L h1 (t) = m 24τ + s2 Y + n b i Z i (38) Dock har börsen endast öppet 9 timmar per dygn och därefter stängt 15. För att anpassa de logaritmerade inkrementen till detta tas de stängda timmarnas värden bort enligt modellen som beskrivs i ekvation (39), där d = 9, timmar under en dag och n = 15, timmar under en natt. Natttimmarna tas bort ur vektorn som innehåller de logaritmerade inkrementen. {L h2 (t)} m t=0 = L h1 (nτ),..., L h1 (nτ + dτ), (39) i=1 L h1 (2nτ + dτ),..., L h1 (2nτ + 2dτ),..., L h1 (mnτ + (m 1)dτ),..., L h1 (mnτ + mdτ) Nu kan högfrekvensmodellen simuleras och jämföras med nedladdade högfrekvensvärdena. 19

30 5 Högfrekvensmodell för valutapar Högfrekvensmodellerna formuleras som strategier. Strategierna baseras på minst en indikator som beskriver kursrörelsen. Baserat på indikatorns attribut kan då en sälj eller köpsignal utformas för att bedriva handel. Indikatorn samspelar på så vis med köp och säljsignalen vilket gör att de ofta är väldigt beroende. De indikatorer som används är ett simpelt glidande medelvärde SMA, en autoregressiv process AR och ett relativt styrkeindex RSI. Samtliga modeller implementeras i Dukascopy som strategier under avsnitt Implementering av strategi 1 Strategin formuleras med bollingerband (BB) som baseras på SMA som utgör indikatorn. För att avgöra köp- och säljsignaler används de övre och undre banden som beskrivs nedan Bollingerband Bollingerband (BB) är en modell som utvecklades av John Bollinger på 80-talet och beskriver relativt en dataseries lägsta och högsta värde. Ett BB består av tre band som definieras enligt följande: Ett mittenband som är en n-periodisk SMA Ett övre band som är k gånger en n-period standardavvikelse σ över mittenbandet, SM A+ kσ Ett undre band som är k gånger en n-period standardavvikelse σ under mittenbandet, SMA kσ Enligt definitionen är värdena högre i det övre bandet och lägre i det undre bandet. Denna definition kan användas som stöd i mönsterigenkänning och på så vis användas som indikator för upp- och nedåtgående trender i en given dataserie. Typiska värden för k är 2 och för n beroende på vilken tidsram som är av intresse [29] Köp- och säljsignaler Genom att observera valutaparet i tiominutersperioder realiseras strategin för att gå lång när marknadspriset överstiger det övre bandet och gå kort när slutkursen understiger det undre bandet. Vidare stängs positionen vid 9 pip med en stopploss på 75 pip. Positionen stängs också om slutkursen korsar mittbandet i någon riktning. Denna strategi lämpar sig bäst för valutapar där volatiliteten är relativt hög och där inkrementen är stationära, exempelvis EUR/CHF [32]. Enligt uppgift från finansbolaget i Stockholm har EUR/CHF inte haft detta beteende under våren 2011 varför fokus för utvärderingen gjorts under erhållna datum hösten Med SMA20 som underliggande grund för BB och med ett k-värde inställd på 1,9, vilket kan tolkas som bredden på banden, blir resultatet för en handelsdagen enligt figur (10). 20

31 Figur 10: Visar bollingerband för valutaparet EUR/CHF Resultaten från Matlab verifieras av implementeringen på Dukascopys plattform i Java, vilken reovisas i figur 11 tillsammans med alla köp och säljsignaler i tabell (3). Figur 11: Implementering av strategi 1 i Dukascopy för EUR/CHF

32 Riktning Startpris Slutpris Pips Öppnad Stängd Lång :01 01:00 Lång :00 01:24 Lång :24 01:48 Lång :48 04:11 Kort :53 06:13 Kort :26 06:37 Kort :37 06:52 Lång :04 07:15 Lång :15 07:15 Lång :15 07:58 Lång :58 09:29 Kort :04 11:17 Kort :17 11:20 Kort :20 13:17 Kort :17 13:39 Lång :44 13:44 Lång :44 13:46 Lång :46 13:46 Lång :46 13:51 Lång :51 16:32 Lång :08 18:37 Lång :37 19:06 Lång :47 00:00 Tabell 3: Transaktioner under EUR/USD exekverade av strategi Utvärdering av modell Bollingerband byggs utifrån en normalfördelningsapproximation och ett första steg är hitta en alternativ, förhoppningsvis bättre, modell var att hitta en annan process till att använda som indikator. Ett kvalificerat antagande av Patrik Albin gav misstankar om att införandet av en autoregressiv (AR)-process bör medföra förbättringar av modellen. Därför undersöks en ARprocess som både enligt teorin 9 ska passa bättre för stationära dataserier men också säga mer om själva fördelningen framåt än vad bollingerbanden gör. Implementeringen av AR-processen görs i hopp om att finna en god indikator till en ny strategi. 5.2 Autoregressiv process En AR-process är en självreglerande process i den mening att det framtida processvärdet beror på ett antal p historiska processvärden, det autoregressiva sambandet tecknas som (40) enligt [33], där ε t betecknar vitt brus och a 1, a 2,..., a p betecknar processens parametrar. Processen skrivs nu AR (p) och utläses som en autoregressiv process av ordning p Yule-Walkers ekvationer X t = ε t p a i X t i (40) För att passa en AR (p)-process till verklig data används Yule-Walker s ekvationer (41) där r X betecknar den teoretiska kovariansfunktionen och a 1,..., a p är AR (p)-processens parametrar 9 Enligt Patrik Albin. i=1 22

33 enligt [34]. { r X (k) + a 1 r X (k 1) + + a p r X (k p) = 0 för k = 1,..., p r X (0) + a 1 r X (1) + + a p r X (p) = σ 2 (41) Yule-Walkers matrisformulerade ekvationer ger a-koefficienterna som lösningen till ekvation 42 enligt [35]. a 1 a 2. a p r X (0) r X (1) r X (p) = r X (1) r X (0) r X (p 1) r X (p) r X (p 1) r X (0) Passning av en Autoregressiv process 1 r X (1) r X (2). r X (p) För att passa en autoregressiv process av ordning p enligt ekvation (40) till valutakursen X (t) måste koefficienterna a 1, a 2,..., a p beräknas. Yule-Walkers ekvationer på matrisform (42) ger sambandet mellan a-koefficienterna och autokovariansfunktioerna r X. I passningen approximeras N r X enligt (43) med det empiriska medelvärdet ˆm X = 1 N X (i) enligt [35]. r X (k) ˆr X (k) = 1 N N k i=1 i=1 (42) [X (i) ˆm X ] [X (i + k ) ˆm X ] (43) Approximationen används i Yule-Walkers matrisformulerade ekvationer enligt [35] ger (44). a 1 a 2. a p ˆr X (0) ˆr X (1) ˆr X (p) = ˆr X (1) ˆr X (0) ˆr X (p 1) ˆr X (p) ˆr X (p 1) ˆr X (0) 1 ˆr X (1) ˆr X (2). ˆr X (p) Eftersom ˆr X (0) = Var [X (t)] enligt [36] är hela högerledet i ekvationen ovan känt vilket ger a- koefficienterna. Brustermen ε t från (40) beräknas som differensen mellan det uppskattade värdet och det verkliga felet. Detta kan tolkas som en återkoppling i den mening att felet i approximationen mäts och används för att korrigera nästa approximation. I praktiken innebär detta att ε t fås som väntvärdet av den empiriska distributionen (45). ( E [F emp X (t) ˆX )] (t) (45) (44) E [F emp (t)] = N p i x i ε t = [ ] p 1 p 2 p N i= Verifiering av koefficienter till en autoregressiv process x 1 x 2. x N (46) Verifiering av a-koefficienterna krediterar AR(p)-processens prediktioner. För att skapa en AR (p)- process simuleras mängden {X (t)} N n 0 rekursivt för ett n 0 > 0. Bruset i den autoregressiva processen (40) simuleras som I.I.D. pseudoslumptal. De första värdena i {X (t)} N n 0 ansätts med µ = E [ε t ] som (47). X ( n 0 ) = X ( n 0 + 1) = = X ( n 0 + p) = p µ (47) a k k=0 23

34 Original koefficient Beräknad koefficient Differens 0, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , Tabell 4: Jämförelse mellan originalkoefficienterna och de approximativt beräknade koefficienterna Hädanefter ges värdena {X (t)} N p n 0 rekursivt enligt (40). För ett tillräckligt stort n 0 blir processen {X (t)} N 0 stationär varpå ekvation (43) och (44) ger beräknade a-koefficienter. De beräknade a-koefficienterna bör därför vara lika med de ursprungliga, ansatta, a-koefficienterna med tillräcklig noggrannhet för att AR (p)-processen skall vara värd att implementera på verklig data. En simulering enligt ovanstående metodik med ordning p = 20 renderar figur (12) och tabell (4). Den största differensen var 0,0047 vilket gör en implementering intressant original approximation 0.04 storlek koefficientindex Figur 12: Storlek på beräknade a-koefficienter från simulering baserad på originalkoefficienter 24

35 5.2.4 Implementering i Dukascopy För implementeringen av AR-processen i Dukascopy används matematikbiblioteket Jama [28] vilket används för lösning av linjära ekvationssystem, matrismultiplikation och dylikt. Metoder för statistiska funktioner såsom medelvärde, varians, empirisk CDF med Kaplan-Meier uppskattning skrivs helt på egen hand då bara kommersiella Javabibliotek för detta hittades. AR-processen gav mycket lovande prediktioner men att implementera rimliga köp och säljsignaler återstår. Helt baserat på erfarenhet tenderar den autoregressiva processen att härma den verkliga signalen med en tidsförskjutning, denna förskutning använd därför som en köp och säljsignal. Detta förfarandet är inte fullt utvecklat och endast testat för de av företaget givna datumen. Resultatet var gott och detaljer återfinns under avsnitt Figur 13: Implementering av AR-processen i Dukascopy för EUR/CHF AR-processen behöver ca 100 värden innan den har stabiliserat sig, varför kurvan i figur 13 initialt är väldigt brusig Köp och säljsignaler för den autoregressiva indikatorn Då det senaste brusvärdet befann sig mellan 0 och under nio på varandra följande värden gavs en säljsignal. Analogt gavs en köpsignal då brusvärdet befann sig mellan 0 och under nio på varandra följande värden Utvärdering av en autoregressiv indikator Genom att använda en autoregressiv process som indikator kunde enkla köp och säljsignaler utformas. Den förbättrade strategin ger ojämna men överlag mycket goda ekonomiska resultat. Det återstår emellertid att utvärdera ett större antal dagar och djupanalysera orsaken till det ojämna resultatet. 5.3 Implementering av strategi 2 Strategi 2 baseras på indikatorn ett glidande konvergent/divergent medelvärde MACD samt ett enkelt glidande medelvärde SMA, ett exponentiellt viktat glidande medelvärde EMA och ett relativt styrkeindex RSI vilka utgör säljsignal. Notera att MACD baseras på EMA. 25

36 5.3.1 Exponentiell moving average Exponentiell MA (EMA) är en viktad variant av SMA där störst hänsyn tas till de mest närliggande tidpunkterna. Vikterna avtar exponentiellt, därav namnet [37]. EMA definieras enligt ekvation (48). { αx(t 1) + (1 α)ema(t 1) t > 2 EMA(t) = (48) X(t) t 2 Koefficienten α representerar graden av viktminskningen, vilket är en konstant mellan 0 och 1. Standarddefinitionen för α är enligt ekvation (49), där n liksom för SMA är antalet tidsenheter bakåt som EMA-processen skall baseras på [38]. α = 2 n + 1 (49) Relativt styrkeindex Relativt styrkeindex (RSI) är ett index mellan 0 och 100 som jämför storleken av en dataseries avvikelse uppåt och nedåt under en given tidsperiod n [39]. Modellen bygger på en form av MAprocess, i detta fall EMA. Den relativa styrkan, RS, definieras enligt ekvation (50), där U och D medelvärdet av ökningen i dataserien för avvikelsen uppåt respektive nedåt och n är antalet tidsperioder. RS = EMA (U, n) EMA (D, n) Indexet definieras sedan som ekvation (51) enligt [38]. RSI = RS (50) (51) Moving Average Convergence/Divergence Moving Average Convergence/Divergence (MACD) utvecklades av Gerald Appel i slutet av talet och har sedan dess använts som en indikator för att avgöra styrka, riktning, momentum och varaktighet av ett finansiellt instruments priser [31]. MACD är en beräkning på skillnaden mellan två EMA:s och utgörs av tre huvudkomponenter, där X (t) är dataserien vid en given tidpunkt t, n i tidsperioderna som sätts till n 1 = 12, n 2 = 26 samt n 3 = 9 [31]. 1. MACD(t) = EMA (X (t), n 1 ) EMA (X (t), n 2 ) 2. MACD Signal (t) = EMA (MACD (t), n 3 ) 3. MACD Histogram (t) = MACD (t) MACD Signal (t) Köp- och säljsignaler Köpsignalen utfärdas när SMA5 > SMA14, RSI > 50 MACD > 0, MACD Signal > 0 och MACD Histogram > 0. Säljsignalen sker vid motsatta villkor. Vidare stängs postionen om någon av signalerna avviker från att gå lång eller kort med undantag för MACD Histogram [32]. De numeriska beräkningarna av SMA optimeras tidsmässigt enligt ekvation (52), då skillnaden i processen endast utgörs av det första och sista värdet. SMA(t) = SMA(t 1) X(t n) n + X(t) n Genom att titta på när SMA14 skär SMA5 och tvärtom erhålls en god indikator för i vilken riktning den fortsatta kursrörelsen kommer att ske. (52) 26

37 Figur 14: Visar två SMA med period n 1 = 5 respektive n 2 = 14 för valutaparet EUR/USD Grunden i MACD för tre olika EMAs enligt teorin med olika tidsperioder. En implementering av detta gav resultat enligt figur (15). Figur 15: Visar tre EMA med n 1 = 9, n 2 = 12 samt n 3 = 26 som är valda efter angivelserna från finansbolaget i Stockholm. Valutaparet är EUR/USD MACD Histogram håller sig hela tiden om den sida om nollan varefter riktningen på kursen utvecklas. Denna används inte vid stängning av positioner då den kan hoppa över/under nollan hastigt vid temporära svängningar i kursen, se exempelvis i figur (16) mellan tidsperioder. 27

38 Figur 16: Visar MACD, MACD Signal och MACD Histogram för valutaparet EUR/USD Då RSI används med 14 tidsperioder erhålls figur (17) som visar hur RSI växer med en uppgående och sjunker för en nedåtgående trend. Figur 17: Visar RSI av ett valutapar EUR/USD Utvärdering av strategi 2 Implementation för strategin i Dukascopy utvärderas på olika datum erhållna av finansbolaget i Stockholm, samtliga under våren Strategin fungerar bäst när valutaparet trendar vilket gör EUR/USD till en lämplig kandidat enligt en representant från företaget. EUR/USD är också det mest omsatta valutaparet vilket gör att många och stora affärer kan utföras på kort tid, vilket lämpar sig bra för högfrekvenshandel. Närmre analys av köp-/säljsignalerna genererade av strategi 2 leder till slutsatsen att det blir många små förlustaffärer när någon av indikatorerna, framförallt RSI och MACD History, låg och vacklade kring 50 respektive nollan vilket de gör när volatiliteten på valutaparet är låg. Detta föranleder undersökningen av en volatilitetsindikator i avsnitt 5.4 Se exempelvis orderhistorik i tabell (5) för strategi 2 under , vilken innehåller många småaffärer som endast varar några sekunder. 28

39 Riktning Startpris Slutpris Pips Öppnad Stängd Kort :51 05:01 Lång :11 07:11 Lång :42 07:51 Lång :11 09:15 Lång :11 14:11 Lång :21 14:21 Lång :21 17:22 Lång :01 20:01 Tabell 5: Orderhistorik för strategi 2 under Paraboliskt SAR En lämplig volatilitetsindikator är ett paraboliskt SAR, där SAR står för stop and reverse och används vid avslutande av positionerna istället för MACD History och RSI. Ett paraboliskt SAR är en metod som utvecklades av J. Welles Wilder Jr. för att hitta trender i marknadspriser. Indikatorn beräknas ett tidssteg före i tiden hela tiden, och definieras enligt SAR n+1 = SAR n + α(ep SAR n ) (53) Där SAR n och SAR n+1 representerar föregående respektive nästa i tidsserien. EP är extrempunkten som definieras som det max- eller minivärde under en given uppåt- eller nedåtgående trend. α kallas för acceleration och sätts vanligen inom valutahandel till 0,02. Accelerationen α ökas sedan med initialvärdet för varje nytt EP-värde, och tillåtas maximalt växa till 0,2 [40]. Det finns ett undantagsfall då den rekursiva ekvationen (53) inte fortsätter iterativt. Det gäller när SAR n+1 ligger inom nästa tidsssteg riktiga marknadspris, då indikeras en ny trend och SAR värdet måste byta sida. Det är på vilken sida om marknadspriset SAR värdet ligger på som avgör om vi är i en uppåt- eller nedåtgående trend. Figur (18) nedan visar ett paraboliskt SAR för EUR/USD , och är som synes nästintill alltid en stabil trendindikator. Figur 18: Visar ett paraboliskt SAR på EUR/USD Förbättringen redovisas i tabell (6) som kan jämföras med tabell (5). Riktning Startpris Slutpris Pips Öppnad Stängd Kort :51 05:00 Lång :57 06:21 Lång :42 08:12 Lång :12 12:20 Lång :20 19:00 Tabell 6: Transaktioner utförda av den förbättrade modellen för strategi 2 under

40 6 Resultat Resultaten presenteras nedan för respektive modell. 6.1 Aktiekurser I detta avsnitt uppvisas resultat för ABB. För att se ytterliggare resultat hänvisas läsare till appendix B och C. De initiala undersökningarna har gjorts i USD, dock har undersökningar för högfrekvenshandel skett i SEK Förbättring av Bachieler-Samuelsons modell För att evaluera den förbättrade modellen simuleras data för ett år upp, även data för Bachieler- Samuelsons modell simuleras. Dessa modeller ritas upp mot verklig data. I figur (19) kan resultat för ABB:s simulering ses. Resultat för Ericsson kan studeras i appendix B. Genom att ytligt studera graferna kan en hypotes om att den förbättrade modellen är bättre än Bachieler-Samuelsons modell göras. För att styrka detta antagande utförs ytterligare analys. Figur 19: Resultat för vår förbättrade modell mot verklig data och Bachieler-Samuelsons, den verkliga datan kommer från ABB. I figur (20) ses fördelningarna för de simulerade modellerna gentemot fördelningen för verklig data. Även här styrks antagandet om att den förbättrade modellen är bättre. Figur 20: Fördelningen för den förbättrade modell mot verklig data, samt fördelningen för Bachieler-Samuelsons modell mot verklig data. För att kunna acceptera hypotesen om att den förbättrade modellen är bättre tabuleras p-värden och Kolmogorov-Smirnovavstånd till simulerade modeller för ABB, Ericsson och Astra- Zeneca mot den verkliga datan, dessa värden kan ses i tabell (7). Denna analys giver ytterligare styrka åt antagandet att den förbättrade modellen är bättre än Bachieler-Samuelsons modell. 30

41 ABB Ericsson Astra-Zeneca Modell p Bachieler-Samuelsons modell 5, ,2233 Förbättrad modell 1, ,04537 Modell p Bachieler-Samuelsons modell 8, Förbättrad modell 1, Modell p Bachieler-Samuelsons modell 1, Förbättrad modell Tabell 7: P-värde och Kolmogorov-Smirnovavstånd för Bachieler-Samuelsons modell mot den verkliga datan samt p-värde och Kolmogorov-Smirnovavstånd för den förbättrade modellen mot den verkliga datan Den anpassade förbättrade modellen Den förbättrade modellen används enligt metoden som beskrivs i avsnitt 4.3 för att sedan simulera upp högfrekventa värden. Lågfrekvensmodellen som används kan ses mot Bachieler-Samuelsons i figur (21). Eftersom att den förbättrade modellen är bättre används denna för analys av högfrekvensdata. Ytterligare resultat för högfrekvensmodellen kan studeras i appendix C. Figur 21: ABB under perioden Värden för de sista 20 dagarna som är intressanta visas i den övre bilden i figur (22). Då detta är de sista värden under året är differensen mellan modellen och verklig data tyvärr ganska stor. För att simulationen med högfrekvensdata börjar simuleringen på det första värdet under dessa 20 dagar. Högfrekvensmodellen simuleras med ett beroende av de logaritmerade inkrementens medel och steglängden för att öka volatiliteten. Resultatet jämförs med högfrekvensdata, denna simulering ses i figur (22), denna passning erhåller en p-värde lika med 0, , de streckade linjerna visar dagar. Upplösningen för högfrekvensmodellen är ett värde per timme. Ytterligare simuleringar och analys behövs göras för att kunna dra konkreta slutsatser, speciellt för volatiliteten. 31

42 Figur 22: ABB:s simulering under de 20 sista dagarna under perioden till , mot verklig data, högfrekvensmodellen är i upplösning 1 värde per timme. CDF:ernas fördelningar kan ses i figur (23) för upplösningen ett värde per timme. Figur 23: Fördelningarnas CDF:er till ABB under de 20 sista dagarna under perioden till , högfrekvensmodellen är i upplösning 1 värde per timme. I figur (24) kan resultat för upplösningen ett värde per minut ses. 32

43 Figur 24: ABB:s simulering under de 20 sista dagarna under perioden , mot verklig minutdata. Figur 25: ABB:s simulerings CDF under de 20 sista dagarna under perioden till , mot den verklig minutdatans CDF. 6.2 Valutahandel Resultaten för valutahandeln tas fram med hjälp av Dukascopys backtestningsfunktion, som simulerar en riktig handelsdag och tillåter investeraren att testa sin strategi med fiktiva pengar. En hävstångseffekt på 1:100 användes vid framtagandet av resultaten och varje genomförd affär bidrar till det totala kapitalet, vilket återinvesteras i varje ny position. Resultatet ges tabell 8,9,12 och Strategi 1 I tabell 8 visas resultaten från strategi 1 som baseras på bollingerband. Strategin levererar positiv avkastning på samtliga av de utvalda datumen av finansbolaget i Stockholm. Valutapar Datum Startkapital (USD) Slutkapital (USD) Avkastning EUR/CHF % EUR/CHF % EUR/CHF % EUR/CHF % EUR/CHF % % Tabell 8: Avkastning från strategi 1 med bollingerband som indikator 33

44 6.2.2 Strategi med en autoregressiv process som indikator Passningen av AR-processen blir väldigt god och möjliggör enkla köp- och säljsignaler. Modellen bör användas som indikator i kombination med andra och på så vis få ut en stabilare modell, det återstår emellertid att göras. Trots att den används som ensamstående indikator är modellen den med godast ekonomiskt resultat under de testdagar företaget i Stockholm föreslog. Valutapar Datum Startkapital (USD) Slutkapital (USD) Avkastning EUR/CHF % EUR/CHF % EUR/CHF % EUR/CHF % EUR/CHF % % Tabell 9: Avkastning ifrån strategin med en autoregressiv indikator Figur 26: Strategi 1 respektive strategin med den autoregressiva indikatorn. Bilden till höger visar differensen mellan strategierna Prediktionstest av en autoregressiv process anpassad till historiska data För att undersöka den autoregressiva processens kapacitet att utgöra en indikator testades dess förmåga att prediktera historiska processvärden. Data insamlades från valutakursen EUR/CHF som innehåller 1320 valutakurser med en minuts upplösning. Metodiken från (5.2.2) användes för att prediktera 500 framtida värden baserat på en AR (5)-process med hjälp av Matlab D. Felet mellan AR (5)-processen och den verkliga kursen redovisas i tabell (10) och illustreras av figur (27). Notera att området är ett godtyckligt urval av prediktionerna. 34

45 EUR/CHF Kursvärde AR (5) prediktion Differens 1,3133 1,3133 4,0961e-06 1,3133 1,3134-0, ,313 1,3144-0, ,3135 1,3139-0, ,3142 1,3141 5,533e-05 1,3138 1,3146-0, ,3133 1,3138-0, ,313 1,3128 0, ,3126 1,3131-0, ,3127 1,3132-0, ,3126 1,3124 0, ,3128 1,3117 0, ,3122 1,312 0, ,3128 1,3116 0, ,3124 1,3124 5,8583e-07 1,3127 1,3121 0, ,314 1,3125 0, ,3141 1,3131 0, ,3133 1,3143-0, ,3129 1,3133-0, ,3124 1,3131-0, ,3123 1,3137-0, ,3126 1,3133-0, ,3132 1,3125 0, ,3137 1,3125 0, ,3141 1,3129 0, ,3137 1,3137-2,8177e-05 1,3142 1,3139 0, ,3145 1,3147-0, ,3145 1,3152-0, ,3154 1,3153 0, Tabell 10: 1 urval av AR (5)-processens predikterade värden relaterat till det faktiska värdet X(t) AR approx kurs EUR/CHF minut Figur 27: Kursvärdet EUR/CHF relaterat till en passad AR (5) process Värt att nämna som referens är de 500 övriga prediktionernas maximala fel. Det absolut största felet fås för första uppskattningen då den empiriska distributionsfunktionen för felet enligt (46) inte ännu etablerats och därför ger ε t = 0 som medför det i särklass största felet i 35

46 serien. Position EUR/CHF Kursvärde AR (5) prediktion Differens Kommentar 1 1,3118-1,2822 2,5940 ε t = 0 initialt 2 1,3117 1,3116 9,8371e-05 Processen stabiliseras direkt då ε 0 7 1,3130 1,3114 0,0016 Det maximala felet då ε 0 Tabell 11: Speciella prediktioner från AR (5)-processen Strategi 2 I tabell 12 visas resultaten från strategi 2 som baseras på SMA, RSI och MACD. Strategin har ett blandat resultat på utvalda datum och landar till slut på en negativ total avkastning. Valutapar Datum Startkapital (USD) Slutkapital (USD) Avkastning EUR/USD % EUR/USD % EUR/USD % EUR/USD % EUR/USD % EUR/USD % % Tabell 12: Avkastning ifrån strategi 2 baserad på RSI, SMA och MACD Strategi 2 med paraboliskt SAR Utvecklingen av strategi 2 till att ta hänsyn av ett paraboliskt SAR vid stängning av positioner gav ett gott resultat, se 1312 som jämför före och efter den utvecklade varianten. Den utvecklade varianten presterar bättre på alla datum givna av finansbolaget i Stockholm förutom på två, på den ena dock endast 1.82% sämre. Sett över samtliga datum summerat är det dock en stor förbättring. Valutapar Datum Startkapital (USD) Slutkapital (USD) Avkastning EUR/USD % EUR/USD % EUR/USD % EUR/USD % EUR/USD % EUR/USD % % Tabell 13: Avkastning från förbättringen av strategi 2 med tillägget paraboliskt SAR 36

47 Figur 28: Strategi 2 respektive strategi 2 med ett paraboliskt SAR. Bilden till höger visar differensen mellan strategierna. 37

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Blandade problem från elektro- och datateknik

Blandade problem från elektro- och datateknik Blandade problem från elektro- och datateknik Sannolikhetsteori (Kapitel 1-10) E1. En viss typ av elektroniska komponenter anses ha exponentialfördelade livslängder. Efter 3000 timmar brukar 90 % av komponenterna

Läs mer

Användbara indikatorer

Användbara indikatorer Användbara indikatorer Teknisk analys består egentligen av två delar: grafisk analys (chartism) och numerisk analys. Den första baseras på en direkt observationer av kurserna och volymerna, och formationer

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Finansmatematik II Kapitel 2 Stokastiska egenskaper hos aktiepriser

Finansmatematik II Kapitel 2 Stokastiska egenskaper hos aktiepriser STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. för Matematisk statistik Thomas Höglund Version Finansmatematik II Kapitel Stokastiska egenskaper hos aktiepriser Finansmatematik II För att kunna

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6): EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer

Läs mer

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tid: Måndagen den 2015-06-01, 8.30-12.30. Examinator och Jour: Olle Nerman, tel. 7723565, rum 3056, MV, Chalmers. Hjälpmedel: Valfri

Läs mer

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk) Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0

Läs mer

Sannolikheter och kombinatorik

Sannolikheter och kombinatorik Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter

Läs mer

Analys av egen tidsserie

Analys av egen tidsserie Analys av egen tidsserie Tidsserieanalys Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 9 december 25 3 25 Antal solfläckar 2 15 1 5 5 1 15 2 25 3 Månad Inledning Vi har valt att betrakta

Läs mer

TMS136. Föreläsning 13

TMS136. Föreläsning 13 TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra

Läs mer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-08-31 Tid:

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.

Läs mer

Del A: Begrepp och grundläggande förståelse

Del A: Begrepp och grundläggande förståelse STOCKHOLMS UNIVERSITET FYSIKUM KH/CW/SS Tentamensskrivning i Experimentella metoder, 1p, för kandidatprogrammet i fysik, /5 01, 9-14 Införda beteckningar skall förklaras och uppställda ekvationer motiveras

Läs mer

SF1911: Statistik för bioteknik

SF1911: Statistik för bioteknik SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1. Avd. Matematisk statistik TENTAMEN I SF9, SF95 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 2:E JANUARI 25 KL 4. 9.. Kursledare: Gunnar Englund, 73 32 37 45 Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Turbowarranter. För dig som är. helt säker på hur. vägen ser ut. Handelsbanken Capital Markets

Turbowarranter. För dig som är. helt säker på hur. vägen ser ut. Handelsbanken Capital Markets Turbowarranter För dig som är helt säker på hur vägen ser ut Handelsbanken Capital Markets Hög avkastning med liten kapitalinsats Turbowarranter är ett nytt finansiellt instrument som ger dig möjlighet

Läs mer

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs. Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 31:E MAJ 2012 KL 08.00 13.00. Examinator: Tobias Rydén, tel 790 8469. Kursledare: Tatjana Pavlenko, tel 790 8466.

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat. Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Ytterligare begrepp Viktiga

Läs mer

Föreläsning 8: Konfidensintervall

Föreläsning 8: Konfidensintervall Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga

Läs mer

Del 2 Korrelation. Strukturakademin

Del 2 Korrelation. Strukturakademin Del 2 Korrelation Strukturakademin Innehåll 1. Implicita tillgångar 2. Vad är korrelation? 3. Hur fungerar sambanden? 4. Hur beräknas korrelation? 5. Diversifiering 6. Korrelation och Strukturerade Produkter

Läs mer

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,

Läs mer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4) Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative

Läs mer

TMS136: Dataanalys och statistik Tentamen

TMS136: Dataanalys och statistik Tentamen TMS136: Dataanalys och statistik Tentamen 013-08-7 Examinator och jour: Mattias Sunden, tel. 0730 79 9 79 Hjälpmedel: Chalmersgodkänd räknare och formelsamling (formelsamling delas ut med tentan). Betygsgränser:

Läs mer

Föreläsning 3, Matematisk statistik Π + E

Föreläsning 3, Matematisk statistik Π + E Repetition Kvantil Presentation Slumptal Transformer Inversmetoden Föreläsning 3, Matematisk statistik Π + E Sören Vang Andersen 13 november 2014 Sören Vang Andersen - sva@maths.lth.se FMS012 F3 1/19 Repetition

Läs mer

Tenta i Statistisk analys, 15 december 2004

Tenta i Statistisk analys, 15 december 2004 STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Del 1 Volatilitet. Strukturakademin

Del 1 Volatilitet. Strukturakademin Del 1 Volatilitet Strukturakademin Innehåll 1. Implicita tillgångar 2. Vad är volatilitet? 3. Volatility trading 4. Historisk volatilitet 5. Hur beräknas volatiliteten? 6. Implicit volatilitet 7. Smile

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F3: Slumpvariaber och fördelningar Diskret Kontinuerlig Slumpvariabler Slumpvariabler = stokastiska variabler = random variables = s.v. Heter ofta X, Y, T. Diskreta kan anta ändligt eller uppräkneligt

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

PROGRAMFÖRKLARING III

PROGRAMFÖRKLARING III Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING III Matematisk statistik, Lunds universitet stik för modellval och prediktion p./22 Statistik

Läs mer

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Hjälpmedel:'Valfri'räknare,'egenhändigt'handskriven'formelsamling'(4''A4Esidor'på'2'blad)' och'till'skrivningen'medhörande'tabeller.''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

8 Inferens om väntevärdet (och variansen) av en fördelning

8 Inferens om väntevärdet (och variansen) av en fördelning 8 Inferens om väntevärdet (och variansen) av en fördelning 8. Skattning av µ och Students T-fördelning Om σ är känd, kan man använda statistikan X µ σ/ n för att hitta konfidensintervall för µ. Om σ inte

Läs mer

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I 5B1504 MATEMATISK STATISTIK GRUNDKURS FÖR E3 LÖRDAGEN DEN 30 AUGUSTI 2003 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 7416. Tillåtna hjälpmedel : Formel- och

Läs mer

Mer om slumpvariabler

Mer om slumpvariabler 1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde

Läs mer

TMS136. Föreläsning 10

TMS136. Föreläsning 10 TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer Information om laborationerna I andra halvan av MASA01 kursen ingår två laborationer.

Läs mer

Facit till frågorna i grundkursen

Facit till frågorna i grundkursen Facit till frågorna i grundkursen Texten som är markerad med fet stil i facit visar svaret på frågan. Har du svarat enligt detta erhåller du poäng. Efter svaret i fet stil har vi ibland lagt till kommentarer

Läs mer

Regressionsmodellering inom sjukförsäkring

Regressionsmodellering inom sjukförsäkring Matematisk Statistik, KTH / SHB Capital Markets Aktuarieföreningen 4 februari 2014 Problembeskrivning Vi utgår från Försäkringsförbundets sjuklighetsundersökning och betraktar en portfölj av sjukförsäkringskontrakt.

Läs mer

Prissättning av optioner

Prissättning av optioner TDB,projektpresentation Niklas Burvall Hua Dong Mikael Laaksonen Peter Malmqvist Daniel Nibon Sammanfattning Optioner är en typ av finansiella derivat. Detta dokument behandlar prissättningen av dessa

Läs mer

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1 LINKÖPINGS UNIVERSITET Matematiska institutionen EXAM TAMS 79 / TEN 1 augusti 14, klockan 8.00-12.00 Examinator: Jörg-Uwe Löbus Tel: 28-1474) Tillåtna hjälpmedel är en räknare, formelsamling i matematisk

Läs mer

Finansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant

Finansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant Finansiering Föreläsning 6 Risk och avkastning BMA: Kap. 7 Jonas Råsbrant jonas.rasbrant@fek.uu.se Föreläsningens innehåll Historisk avkastning för finansiella tillgångar Beräkning av avkastning och risk

Läs mer

Valutacertifikat KINAE Bull B S

Valutacertifikat KINAE Bull B S För dig som tror på en stärkt kinesisk yuan! Med detta certifikat väljer du själv placeringshorisont, och får en hävstång på kursutvecklingen i kinesiska yuan mot amerikanska dollar. Certifikat stiger

Läs mer

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 3, HT -06 MATEMATISK STATISTIK FÖR F, PI OCH NANO, FMS 012 MATEMATISK STATISTIK FÖR FYSIKER, MAS 233 Laboration 3: Enkla punktskattningar,

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 (2015-04-29) OCH INFÖR ÖVNING 8 (2015-05-04)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 (2015-04-29) OCH INFÖR ÖVNING 8 (2015-05-04) LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB ÖVNING 7 (25-4-29) OCH INFÖR ÖVNING 8 (25-5-4) Aktuella avsnitt i boken: 6.6 6.8. Lektionens mål: Du ska kunna sätta

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Gamla tentor (forts) ( x. x ) ) 2 x1

Gamla tentor (forts) ( x. x ) ) 2 x1 016-10-10 Gamla tentor - 016 1 1 (forts) ( x ) x1 x ) ( 1 x 1 016-10-10. En liten klinisk ministudie genomförs för att undersöka huruvida kostomläggning och ett träningsprogram lyckas sänka blodsockernivån

Läs mer

Tentamen i Matematisk Statistik, 7.5 hp

Tentamen i Matematisk Statistik, 7.5 hp Tentamen i Matematisk Statistik, 7.5 hp Distanskurs 15 januari, 2011 kl. 9.00 13.00 Maxpoäng: 30p. Betygsgränser: 12p: betyg G, 21p: betyg VG. Hjälpmedel: Miniräknare samt formelsamling som medföljer tentamenstexten.

Läs mer

Laboration 4: Hypotesprövning och styrkefunktion

Laboration 4: Hypotesprövning och styrkefunktion LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR L, FMS 032, HT-07 Laboration 4: Hypotesprövning och styrkefunktion 1 Syfte I denna laboration

Läs mer

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p) Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 27:E OKTOBER 2014 KL 08.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66, Björn-Olof Skytt, 08-790 86 49.

Läs mer

Examinationsuppgift 2014

Examinationsuppgift 2014 Matematik och matematisk statistik 5MS031 Statistik för farmaceuter Per Arnqvist Examinationsuppgift 2014-10-09 Sid 1 (5) Examinationsuppgift 2014 Hemtenta Statistik för farmaceuter 3 hp LYCKA TILL! Sid

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

1 10 e 1 10 x dx = 0.08 1 e 1 10 T = 0.08. p = P(ξ < 3) = 1 e 1 10 3 0.259. P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0.

1 10 e 1 10 x dx = 0.08 1 e 1 10 T = 0.08. p = P(ξ < 3) = 1 e 1 10 3 0.259. P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0. Tentamen TMSB18 Matematisk statistik IL 091015 Tid: 08.00-13.00 Telefon: 036-10160 (Abrahamsson, Examinator: F Abrahamsson 1. Livslängden för en viss tvättmaskin är exponentialfördelad med en genomsnittlig

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 12 oktober 2015 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametsriska metoder. (Kap. 13.10) Det grundläggande

Läs mer

(A -A)(B -B) σ A σ B. på att tillgångarna ej uppvisar något samband i hur de varierar.

(A -A)(B -B) σ A σ B. på att tillgångarna ej uppvisar något samband i hur de varierar. Del 2 Korrelation Innehåll Implicita tillgångar... 3 Vad är korrelation?... 3 Hur fungerar sambanden?... 3 Hur beräknas korrelation?... 3 Diversifiering... 4 Korrelation och strukturerade produkter...

Läs mer

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = 1 0.34. ξ = 2ξ 1 3ξ 2

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = 1 0.34. ξ = 2ξ 1 3ξ 2 Lösningsförslag TMSB18 Matematisk statistik IL 101015 Tid: 12.00-17.00 Telefon: 101620, Examinator: F Abrahamsson 1. Varje dag levereras en last med 100 maskindetaljer till ett företag. Man tar då ett

Läs mer

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:

Läs mer

Jordbävningar en enkel modell

Jordbävningar en enkel modell 9 september 05 FYTA Simuleringsuppgift 3 Jordbävningar en enkel modell Handledare: André Larsson Email: andre.larsson@thep.lu.se Telefon: 046-34 94 Bakgrund Jordbävningar orsakar fruktansvärda tragedier

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

5B Portföljteori och riskvärdering

5B Portföljteori och riskvärdering B7 - Portföljteori och riskvärdering Laboration Farid Bonawiede - 89-09 Alexandre Messo - 89-77 - Beräkning av den effektiva fronten för en portfölj Uppgiften går ut på att beräkna de portföljer som ger

Läs mer

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik A1, 15 hp Antal uppgifter: 6 Krav för G: 13 Lärare:

Läs mer

Diskussionsproblem för Statistik för ingenjörer

Diskussionsproblem för Statistik för ingenjörer Diskussionsproblem för Statistik för ingenjörer Måns Thulin thulin@math.uu.se Senast uppdaterad 20 februari 2013 Diskussionsproblem till Lektion 3 1. En projektledare i ett byggföretaget ska undersöka

Läs mer

Strukturakademin Strukturinvest Fondkommission LÅNG KÖPOPTION. Värde option. Köpt köpoption. Utveckling marknad. Rättighet

Strukturakademin Strukturinvest Fondkommission LÅNG KÖPOPTION. Värde option. Köpt köpoption. Utveckling marknad. Rättighet Del 11 Indexbevis Innehåll Grundpositionerna... 3 Köpt köpoption... 3 Såld köpoption... 3 Köpt säljoption... 4 Såld säljoption... 4 Konstruktion av Indexbevis... 4 Avkastningsanalys... 5 knock-in optioner...

Läs mer

under en options löptid. Strukturakademin Strukturinvest Fondkommission

under en options löptid. Strukturakademin Strukturinvest Fondkommission Del 1 Volatilitet Innehåll Implicita tillgångar... 3 Vad är volatilitet?... 3 Volatility trading... 3 Historisk volatilitet... 3 Hur beräknas volatiliteten?... 4 Implicit volatilitet... 4 Smile... 4 Vega...

Läs mer

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera) KLEINLEKTION Område statistik. Lämplig inom kurserna Matematik 2b och 2c. Centralt innehåll i Matematik 2b och 2c: Statistiska metoder för rapportering av observationer och mätdata från undersökningar

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,

Läs mer

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P. Stat. teori gk, ht 2006, JW F6 STOKASTISKA VARIABLER (NCT 5.4-5.6) Binomialfördelningen Används som modell i situation av följande slag: Ett slumpförsök upprepas n gånger (oberoende upprepningar). Varje

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer

Läs mer

Föreläsning 7. Statistikens grunder.

Föreläsning 7. Statistikens grunder. Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande

Läs mer

Påbyggnad/utveckling av lagen om ett pris Effektiv marknad: Priserna på en finansiell marknad avspeglar all relevant information

Påbyggnad/utveckling av lagen om ett pris Effektiv marknad: Priserna på en finansiell marknad avspeglar all relevant information Föreläsning 4 ffektiva marknader Påbyggnad/utveckling av lagen om ett pris ffektiv marknad: Priserna på en finansiell marknad avspeglar all relevant information Konsekvens: ndast ny information påverkar

Läs mer

4.1 Grundläggande sannolikhetslära

4.1 Grundläggande sannolikhetslära 4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer