Strategiskt spelande för en positiv avkastning
|
|
- Rickard Dahlberg
- för 9 år sedan
- Visningar:
Transkript
1 Strategiskt spelande för en positiv avkastning Sebastian Demmler & Jesper Wallman Handledare: Björn Holmquist STAH11, Examensarbete statistik kandidatnivå 15 hp, HT 2011
2 Sammanfattning Denna studie sammanställer totalt 5 statistiska modeller för att kunna predicera sannolika utfall vid fotbollsmatcher i den tyska fotbollsligan, Bundesliga. Modellerna bygger på kvantitativa historiska data från 1683 matcher och uppskattar sannolikheter för utfallen hemmavinst (1), oavgjort (X) och bortavinst (2) i respektive match. Studiens syfte är att se om en mer korrekt prediktion erhålles när mer historiska data tillförs modellerna. Utifrån detta undersöks om dessa statistiska modeller kan överträffa sannolikheterna framtagna av spelbolaget Digibet. Slutligen undersöker studien om dessa modeller genom strategiskt spelande kan generera positiv avkastning. Modellerna grundar sig på en ordered-probit regression med 13 variabler. En slutsats är att mer historiska data leder till en modell med bättre prediktion. Studien kan inte påvisa att det går att skapa sannolikheter bättre än Digibets men att positiv avkastning kan genereras genom modellen när strategiskt spel tillämpas. Nyckelord: Bundesliga, Ordered-probit, Odds, Sannolikhet, Predicera och Strategiskt spelande 2
3 Abstract This study compiles a total of five statistical models of how to predict the probable outcome in football games in the German football league, the Bundesliga. The models are based on quantitative historical data from 1683 games and estimate probabilities of the outcomes home win (1), draw (X) and away win (2). The purpose of the study is to test whether a more accurate prediction can be formulated with increased historical data added to the models. From this we examine if these statistical models can outperform the probabilities generated by the gambling company Digibet. It is further tested whether the models through strategic gambling may generate a positive return. The models used are based on an ordered-probit regression with 13 variables. In conclusion, the study shows that more historical statistical data results in a more appropriate model for prediction. However, there is no evidence to demonstrate that the statistical models can predict probabilities better than Digibet. A final conclusion is that applying strategic gambling in accordance with the model can generate a positive return. Keywords: Bundesliga, Ordered-probit, Odds, Probability, Predict and Strategic gambling 3
4 Innehållsförteckning 1. INLEDNING Bakgrund Frågeställningar Syfte Avgränsningar Disposition DATA Tysk fotboll, Bundesliga Odds Oddssättning och nya spelmarknader Tidigare forskning Ordered-Probit Modell Signifikans METOD Modellvariabler Kritik mot metod Insamling av data Modeller Strategier ANALYS Modeller Strategier och avkastning RESULTAT Resultatdiskussion Vidare forskning REFERENSER BILAGA
5 1. Inledning 1.1 Bakgrund Varför är spelbolag i behov av att ha modeller för att predicera odds? Industrin för spel och vadslagning under ordnade former har under och 2000-talet ökat explosionsartat. Bland de många spelformer som utvecklats är vadslagning vid fotbollsmatcher en av de marknader som trots globala ekonomiska svängningar stått sig stark (Lotteriinspektionen 2011). Aktörer som figurerar på internet och befinner sig i skattemässigt gynnsamma länder har kunnat ta sig in på spelmarknaden. Med fler aktörer och större tillgänglighet har spelet kunnat växa på ett naturligt sätt. Accelererad konkurrens och högre kännedom hos privatpersoner har trappat upp rivaliteten på spelmarknaden. Denna konkurrens har medfört att spelbolag måste kunna förutspå sannolika utfall på ett korrekt sätt, då en felaktig prediktion kan leda till förluster. Med anledning av ovanstående har användandet av statistisk modellering ökat frekvent bland spelbolagen. En studie av Forrest et al (2005) presenterar en regressionsmodell med historiska variabler som antas påverka utfallet i framtida matcher. I undersökningen visas att mer data leder till en starkare prediktion. Studien ifråga genomfördes på den engelska spelmarknaden, varför en liknande analys på andra länders spelmarknader är av intresse för att kunna förstärka argumentet om att mer statistisk data ger en starkare prediktion. Trots detta påvisar Forrest et al (2005) att deras modell i slutet av undersökningsperioden inte genererade positiv avkastning. Med högre kännedom hos spelbolag har Milliner et al (2008) utifrån tillgängliga modeller försökt skapa strategier för hur spel ska genomföras. Detta gör det intressant att med givna strategier och starkare modeller se om det går att överträffa spelbolagen. Monopolet på den tyska spelmarknaden genomgick under 2011 en avreglering. Avregleringen har inneburit att etablering är lättare och fler aktörer kan idag därför erbjuda spel på den tyska spelmarknaden (Lotteriinspektionen 2011). Detta har gjort den tyska högsta ligan i fotboll, Bundesliga, till en av de mest attraktiva spelmarknaderna i Europa (Gambling Kingz 2011). Att Tyskland så sent som föregående säsong också slog rekordet för publiksnitt gör ligan högaktuell (Matthews 2011). Fler aktörer, bättre odds, rika databaser 5
6 och lite forskning på Bundesliga motiverar vårt beslut att undersöka strategiskt spel med en prediktionsmodell. 1.2 Frågeställningar Med ovan nämnda bakgrund i åtanke formuleras följande frågeställningar: Blir en statistisk modell säkrare i sin prediktion när data från fler säsonger adderas? Kan man med tillgänglig statistik skapa en statistisk modell som överträffar sannolikheter/odds hos ett spelbolag? Kan denna statistiska modell blandas med strategiskt spel för att generera positiv avkastning? 1.3 Syfte Syftet med den här uppsatsen är att undersöka hur kvantitativa historiska data påverkar precisionen vid prediktion av fotbollsresultat. Vi vill se om det går att generera sannolikheter och odds med högre precision än spelbolagen. Dessa sannolikheter ska sedan på ett strategiskt sätt användas vid spelande för att kunna generera positiv avkastning. 1.4 Avgränsningar Uppsatsen avgränsar sig till matcher spelade i Bundesliga. Vi har samlat in data för matcher spelade under säsong 2006/2007 till nuvarande säsong, 2011/2012. Datamängden motsvaras totalt av 1683 matcher. Matcherna utgör grunden för prediktionen av de 153 referensmatcherna som hittills spelats under säsongen 2011/2012. För att rangordna matcherna används en klassisk 1X2-modell där 1:a är lika med hemmavinst, X innebär ett oavgjort resultat och en 2:a innebär bortavinst. Ingen hänsyn tas till matcher spelade utanför ligafotbollen, som exempelvis den inhemska cupen och eventuella europeiska cuper. Detta på grund av att de valda variablerna vid dessa matcher har en annan karaktär. Ingen hänsyn har heller tagits till matchens betydelse, exempelvis om det gäller upp- eller nedflyttning. 6
7 1.5 Disposition Uppsatsen inleds med att ge en kort presentation över tysk fotbollshistoria och grunderna för spel i tyska Bundesliga. Vidare förklaras begreppen odds och ordered-probit. Slutligen kommer detta avsnitt att gå igenom tidigare studier inom området. Metoddelen är en breddning av modellen där vi ingående beskriver hur vi gått tillväga för att tolka våra variabler. I denna går vi igenom variablerna för en ordered-probit modell och ger en motivering till valet av dessa variabler. I detta avsnitt diskuteras även strategiskt spelande. All denna information lägger sedan grunden för analysen och slutsatsen, i vilka vi ämnar svara på frågeställningarna och motivera nya studier. 7
8 2. Data 2.1 Tysk fotboll, Bundesliga Den 28 juli 1962 skapades fotbollshistoria i Tyskland. Det var nämligen dagen och året som Bundesliga fick sitt namn. Bundesliga, fotbollens finrum i Tyskland, består av 18 lag. Varje lag spelar 34 matcher vilka är fördelade på en hemmamatch och en bortamatch mot respektive lag. För en vunnen match erhåller ett lag 3 poäng, för ett oavgjort resultat 1 poäng och för en förlust 0 poäng. I slutet av säsongen vinner det laget som har flest poäng. De två sista lagen blir direkt degraderade till andra divisionen (2. Bundesliga) och det tredje laget från botten spelar en kvalmatch hemma och en borta mot det lag som slutar på tredje plats i 2. Bundesliga (Statto 2012). Om två lag efter någon av följande premisser fortfarande befinner sig på samma poäng avgör följande faktorer (i kronologisk ordning): 1. Målskillnad, 2. Gjorda mål, 3. Inbördes möten och 4. Målskillnad vid inbördes möten. Om det även efter detta är oavgjort spelar lagen en avgörande match på neutral plan, vilket hittills aldrig skett i Bundesliga (Oleole 2009, Statto 2012 & Stoltz 2009). 2.2 Odds I vadslagningssammanhang är odds relaterade till sannolikheten att vinna. Oddset symboliserar det man får tillbaka vid en eventuell vinst sett till vad man satsat (Wolfram Alpha 2012). Som tabell 2.1 och tabell 2.2 visar är odds omräknade sannolikheter. Odds kan representeras på olika sätt, bland annat genom den europeiska principen vilken är den mest vedertagna i Tyskland (och i Sverige). Vid 1X2 matcher representeras oddsen (enligt den europeiska principen) på följande sätt: Bayern München Oavgjort Hertha Berlin Matchutfall 1 X 2 Odds 1,2 6,7 14 Sannolikhet (1/odds) 0,834 0,149 0,071 Summa sannolikheter: 1,054 Tabell 2.1 Odds och sannolikhet från Digitbet i matchen mellan Bayern München-Hertha Berlin omgång 9 för säsong 2011/
9 Om 100 svenska kronor (kr) exempelvis satsas på Bayern München skulle detta ge en total avkastning på 120 kr, det vill säga en vinst på 20 (20%) kr. Vid en förlust uppgår förlusten till hela det satsade beloppet, således 100 kr. Den totala sannolikheten som endast kan vara lika med ett, summerar här upp till cirka: 1,054. Det beror på att företaget Digibet i detta läge tar ut en premie på deras spel vilken uppgår till 5,4 %. Denna premie skiftar mellan olika spelföretag och olika spelformer. Som spelare är det negativt om ett spelbolag har en hög premie då detta innebär att avkastningen för vinst blir lägre. Med denna premie kan vi räkna fram de korrekta sannolikheterna med hänsyn till de sannolikheter som spelbolagen förutspått. Dessa presenteras i tabellen nedan: Omräknade Odds Bayern München Oavgjort Hertha Berlin Matchutfall 1 X 2 Odds * 1,054 1,265 7,062 14,756 1 / (Odds * 1,054) 0,790 0,142 0,068 Summa sannolikheter 1 Tabell 2.2 Omräknade sannolikheter för ovanstående match. Ganska naturligt blir oddsen under detta scenario 5,4 % högre än tidigare. Vi ser också att de sannolikheter som vi fått fram här summerar till ett. 2.3 Oddssättning och nya spelmarknader Formen 1X2-bet är fortfarande den mest populära typen av spel vid fotbollsmatcher (Popular Football Bets 2012). Det finns två olika typer av oddssättning, fasta och rörliga odds. I dagsläget är det vanligt att spelföretag annonserar ett odds innan en fotbollsmatch där oddset sedan kan komma att justeras. Oddsen kan komma att ändras på grund av exempelvis skadad fotbollsspelare, men ändringen sker då endast marginellt (Spela Spel 2009). En representant på referensföretaget Digibet bekräftar att de också arbetar med denna typ av oddssättning (Digibet emejlintervju 2012). Denna typ av semifixerade odds gör det intressant för spelare att kunna överträffa spelmarknaden (Dixon & Coles 1997). Utvecklingen på spelmarknaden har lett till nya spelformer. Betfair med deras unika spelform låter spelare köpa och sälja spel på en handelsplats där utbud/efterfrågan styr oddsprissättningen (Betfair 2012). Dock är det fortfarande privatägda bolag med semifixerade odds som dominerar majoriteten av spelmarknaden. 9
10 2.4 Tidigare forskning Inom den statistiska akademin är spelteori ett centralt inslag. När det kommer till beräkning av utfall i fotbollsmatcher har en uppsjö av modeller tagits fram. Bland dessa studier finns det framförallt två stycken modeller som bidragit till stora akademiska genomslag. Dessa modeller är i sin huvudsak vidareutvecklingar från tidigare studier men där författarna hittat nya variabler och infallsvinklar, vilket lett till bättre prediktion (Milliner et al 2008). En studie från Lancaster University (Dixon & Coles 1997) förutspår genom en poissonmodell hur många mål respektive lag kommer att producera i en specifik match. Som grund till studien har 6629 cup- och ligamatcher sammanställts från säsongerna 1992/1993, 1993/1994 och 1994/1995. Modellen räknar sedan ut sannolikheter som appliceras på referenssäsongen 1995/1996. Slutsatsen pekar på att modellen tar fram sannolikheter som genom strategiskt spel ger positiv avkastning. Den andra modellen är en ordered-probit modell framtagen av Forrest et al (2005). Modellen baseras på beroendevariabeln: hemmavinst(1), oavgjort(x) eller bortavinst(2). Detta i kontrast till poissonmodellen, där en sannolikhetsfördelning används för att beskriva antalet mål som produceras. En uppsamling av nära matcher applicerade på variablerna 1. Spelat i högsta ligan senaste två säsongerna, 2. Senaste matchresultat, 3. Matchens betydelse (chans till ligavinst/ risk för nedflyttning), 4. Involvering i Cup-spel, 5. Geografisk distans och 6. Publiksnitt (för genomgång av ordered-probit se avsnitt 2.5). Slutsatsen i artikeln var att modellen rent initialt kunde generera vinster genom strategiskt spel i symmetri med modellen. Vidare förklarar författarna att den ökade konkurrensen på marknaden och spelbolagens ökade användning av statistisk modellering gjort att vinstchanserna minskat eller försvunnit. En viktig slutsats från studien är att sammanställning av mer statistik (upp till 15 säsonger) ger en mer adekvat modell. Goddard (2005), som också deltog i ovan nämnda studie, undersökte skillnaden mellan ordered-probit- och poissonmodellerna. Slutsatsen blev att båda modellerna predicerar på ett likvärdigt sätt. Ordered-probit modellen är däremot mindre komplex än poissonmodellen. Detta tillsammans med att Forrest et al (2005) pekar på att mer kvantitativa data ska tillföras i skapandet av en bättre modell, gör att vi fortsättningsvis kommer att studera ordered probit modellen. 10
11 2.5 Ordered-Probit Modell Borooah (2002) beskriver ingående ordered-probit modellen genom att anta att en latent variabel är en linjär funktion av ett antal deterministiska variabler. Den latenta regressionen vilken använts i en ordered-probit modell ser ut enligt följande: Formel 2.1 I formeln 2.1 är koefficienterna för variablerna och är feltermen. En ökning av en faktor med en positiv koefficient ger ett högre värde på den latenta variabeln. Det motsatta gäller för en negativ koefficient, som vid en ökning av faktorn leder till ett lägre värde på den latenta variabeln. Den latenta variabeln kommer alltså att påverka sannolikheterna för utfallen hemmavinst, lika resultat och bortavinst. Där ett högt värde på den latenta variabeln innebär en högre sannolikhet för bortavinst och ett lägre värde innebär en högre sannolikhet för hemmavinst. Problemet vid uträkningen av regressionen ovan är att den exakta graden för en fotbollsmatch inte går att observera, istället klassificerar man utfallet som för hemmavinst, för oavgjort och för bortavinst. Observera tillika att kodningen endast representerar intervallsgränser i en normalfördelning och är med andra ord inte ordnade efter storlek. Utfallen av dessa värden är implicit baserade på den latenta variabeln i förbindelse med värdena för cut-off parametrarna och som båda estimeras med. Utfallet för matchens resultat beror på värdet för den latenta variabeln, eller rättare sagt inom vilket intervall denna befinner sig så att: Hemmavinst om Formel 2.2 Oavgjort om Formel 2.3 Bortavinst om Formel
12 Härifrån bestäms sannolikheterna för de olika utfallen där i en normalfördelningsfunktion. representerar sannolikheten Sannolikheten för hemmavinst: ( ) ( ) Formel 2.5 Sannolikheten för oavgjort: ( ) ( ) ( ) Formel 2.6 Sannolikheten för bortavinst: ( ) ( ) Formel 2.7 Beräkningen av sannolikheterna förutsätter att man antar att feltermen, är normalfördelad, vilket Borooah (2002) och Greene (2003) gör i sina beskrivningar av modellen. 12
13 2.6 Signifikans För att testa om en koefficient är skilda från noll sätts följande hypotes upp: Utifrån en standard normalfördelning bestäms de kritiska punkterna i intervallet. Om absolutbeloppet för koefficienten är större än det kritiska värdet i högersvansen på fördelningen förkastas nollhypotesen (Wooldbridge 2009). De signifikansnivåer vi har valt förklaras i punktform nedan: Enstjärnig signifikans från 5-1 % Tvåstjärnig signifikans från 1-0,1 % Trestjärnig signifikans < 0,1 % 13
14 3. Metod 3.1 Modellvariabler De variabler som vi vill undersöka skiljer sig från de som Forrest et al (2005) tagit med. Vår uppfattning är nämligen att en del relevanta variabler inte finns med i deras modell. Variablerna som valts är av historisk karaktär. När spelbolagen sätter sina odds tas dagsaktuella effekter som skadade spelare, avstängda spelare och matchens betydelse i beaktning. Tidigare studier har visat att prediktioner med statistisk modellering kan överträffa spelbolagen trots att man bortser från dagsaktuella effekter (Forrest et al 2005, Dixon & Coles 1997). Nedan följer en genomgång av våra variabler där respektive avsnitt förutom avsnitt representerar två variabler. Avsnitt räknar ut differensen mellan två variabler och bildar därmed endast en variabel Poäng senaste 5 matcherna hemma- och bortalag Det är relevant att undersöka antalet poäng ett lag tagit under de senaste 5 omgångarna. Detta kan på ett bra sätt beskriva lagets aktuella form. Om laget vunnit många matcher finns det en god anda i laget vilket gör att de kan spela på ett mer avslappnat och självsäkert sätt. Den raka motsatsen råder om lagets form är dåligt, då press från media och omgivning kan prägla lagets insatser (Milliner et al 2008). Som rubriken antyder har vi valt att studera antalet poäng som hemma- och bortalag tagit under de senaste 5 omgångarna där vinst ger 3 poäng, oavgjort 1 poäng och förlust 0 poäng. Om ett lag exempelvis vunnit 2, spelat 2 oavgjorda och förlorat 1 match skulle deras poängskörd uppgå till 8 poäng. Detta kan summeras enligt följande formler: Formel 3.1 Poäng senaste 5 matcherna hemmalag Formel 3.2 Poäng senaste 5 matcherna bortalag 14
15 I detta fall representerar N vilken omgång som ska spelas. Vid de fem första omgångarna (N=1 till N=5) går vi tillbaka till de senaste (sista) omgångarna från föregående säsong Uppflyttat hemma- och bortalag Ett lag som nyligen flyttats upp från en lägre division har ofta sämre ekonomi och således också i många fall en sämre spelartrupp (Forrest et al 2005). Dessa faktorer kan tänkas påverka hur laget kommer prestera under säsongen. Därför införs här en dummy-variabel där lag som avancerat till Bundesliga från säsongen innan tilldelas värdet 1. Lag som tidigare spelade i den högsta divisionen senaste säsongen tilldelades alltjämt värde Tabellplacering hemma- och bortalag Tabellplaceringen innan omgång N är relevant för utfallet i matchen. Ju högre upp i tabellen ett lag ligger desto bättre form antas laget ha (se diskussion under avsnitt 3.1.1). Tabellplaceringen avläses innan varje spelad omgång och införs som variabel med ett värde mellan 1-18 eftersom det totala antalet lag uppgår till 18. Om en match blir uppskjuten tas ingen hänsyn till detta förrän den uppskjutna matchen har spelats (Läs mer om detta i avsnitt 3.2 Kritik mot metod) Totala poäng hemma- och bortalag Den totala mängden poäng är en viktig faktor. Trots att lag ligger nära varandra i tabellen kan det skilja kraftigt mellan dem i poäng. Poängen räknas ihop omgång för omgång vilket innebär att under omgång 1 är denna variabel nollställd eftersom inget lag då har tagit några poäng. Poängen räknas ihop enligt följande formler: Formel 3.3 Totala poäng hemmalag Formel 3.4 Totala poäng bortalag 15
16 3.1.5 Målskillnad hemma- och bortalag Målskillnad visar på hur mycket mål ett lag är kapabelt att göra och hur många mål laget vanligtvis släpper in. Målskillnaden räknas logiskt ut genom summan av hur många mål ett lag har gjort minus summan av antalet mål som laget släppt in. Modellen för uträkningen ser ut enligt följande och räknas ut för hemma- respektive bortalag (M=antal gjorda mål, I=antal insläppta mål): Formel 3.5 Målskillnad hemma- och bortalag Poängskillnad inbördes möten 5 senaste matcherna Att lag kan ha olika svårt för varandra är känt. Vi räknar ihop hur många poäng de två lag som ska mötas har samlat ihop under de senaste 5 inbördes mötena. Likt totalt antal poäng de senaste 5 matcherna summeras detta ihop. Om hemmalaget vunnit 3, spelat 1 oavgjord och förlorat 1 match innebär detta att hemmalaget samlat ihop 10 poäng. Bortalagets facit är då 1 vinst, 1 oavgjord och 3 förluster, det vill säga totalt 4 poäng. Differensen av detta blir naturligtvis 6 poäng till hemmalaget och kan räknas ut genom följande formel: Formel 3.6 Poängskillnad inbördes möten 5 senaste matcherna Om lagen tidigare inte mött varandra 5 gånger används den mån av statistik som finns. Om lagen exempelvis spelat tre matcher mot varandra används detta som mätvärde Slutplacering föregående säsong hemma- och bortalag Den sista variabeln som används är slutplacering för föregående säsong. Detta är ett relativt mått där en högre tabellplacering ger en högre vinstsumma från föregående år. Vidare blir TV-intäkter och sponsorintäkter generellt sett större om ett lag placerar sig högre upp i tabellen. De två (tre om ett lag tar sig upp genom kval) rangordnas efter hur de placerade sig föregående säsong. Om inget kvalande lag exempelvis tar sig upp placeras den som kommer först i 2. Bundesliga på plats 17 och den som kommer tvåa på plats 18. Om ett kvalande lag 16
17 tar sig upp placeras de på plats 18 varpå den som kommer tvåa placeras på plats 17 och ettan placeras på plats Kritik mot metod I den tidigare studien av Forrest et al (2005) fokuserar författarna på en del variabler som i denna undersökning valdes bort. Bland dessa återfinns variabeln geografiskt avstånd mellan olika matcher. Forrest et al (2005) bygger sin hypotes på att ju längre ett lag behöver resa till en match, desto sämre presterar det resande laget. Under analysen för de två första säsongerna hade vi med den variabeln som visade på ett högt p-värde. Anledningen till detta kan vara att många lag i Bundesliga valt att flyga till längre bortamatcher (Lufthansa 2012) och att variabeln därmed inte påverkar resultatet i matcherna. Slutligen har vi i denna studie valt bort variabeln publiksnitt då det inte finns tillgänglig statistik för publikgenomsnittet innan säsong (ESPN 2012). Som avgränsningen antyder finns inget fokus på matcher spelade utanför Bundesliga. Fokus i uppsatsen ligger istället rakt igenom på ligamatcher. Frågeställningar och syfte fokuserar på att undersöka Bundesliga och prediktionen för odds inom denna. Detta står därmed som förklaring till varför matcher utanför Bundesliga inte återfinns i vår undersökning. Poäng för hemma- och bortalag i de senaste fem matcherna varje säsong räknas med fjolårets säsong i beaktande. Huruvida ett lags matcher från fjolårssäsongen påverkar den nuvarande formen kan ifrågasättas. Anledningen till att vi använder detta tillämpningssätt är för att få en symmetrisk modell med konsekvent räknande. Uppflyttade lag behandlas genom principen resultatet från de fem senaste matcherna då de senast befann sig i Bundesliga. Om laget tidigare inte spelat i Bundesliga utgår variabeln från noll för omgång 1. Nyuppflyttade lag kan genom just befordran ha fått köpkraft att värva spelare av hög rang. Om så är fallet kan nyuppflyttade lag ha ett bättre slagläge än många etablerade lag. Detta kan göra dummy-variabeln missvisande men av tradition brukar nyuppflyttade lag ha det svårare än etablerade lag, varför vi anser att variabeln är viktig. Hur ett lag ligger till rent tabellmässigt tar inte hänsyn till om laget ifråga råkat ut för en uppskjuten match förrän denna match har spelats. På grund av utfallet i matchen hade prediktionen därmed sett annorlunda ut. Under de sex säsonger som återfinns i studien blev 17
18 endast fyra matcher uppskjutna vilket vi tolkar som tillräckligt lågt för att inte ge något signifikant utslag. Slutligen konstateras att tabellplacering längre in på säsongen kommer ge en starkare stabilitet åt prediktionen. Totalt antal poäng hemma- och bortalag kan också påverkas negativt i början av en säsong. Om ett lag möter traditionsenligt starka lag kommer deras sannolika utfall för vinst att sänkas utan att det för den delen går att anta att de tidigt in i säsongen är ett sämre lag. Trots detta konstaterar Forrest et al (2005) och Dixon & Coles (1997) att dessa variabler är signifikanta och i sin helhet påverkar framtida utfall. Målskillnad mellan lagen är också en variabel som kan få negativa konsekvenser inte minst om ett lag släpper in många mål tidigt på säsongen. Dixon & Coles (1997) bygger hela sin modell på benägenheten att göra mål (och att släppa in mål). Vi tycker därför att denna variabel är intressant för regressionen. Över en hel säsong borde också denna variabel bli representativ. De fem senaste inbördes mötena kan vara missvisande om lagen inte mötts på flera år. Stora delar av lagen kan ha bytts ut varför det går att ifrågasätta hur väl detta representerar kommande resultat. Trots detta spelar de flesta lagen i vår undersökning 5 matcher med en frekvens på 3-4 år vilket vi anser vara tillräckligt ofta för att variabeln ska vara av nytta. Det bör påpekas att denna variabel fokuserar på interna bundesligamöten och alltså inte om lagen har mött varandra i lägre divisioner eller vid cupspel. Variabeln slutplacering ska vara en god indikator för hur laget kommer prestera. Stora ändringar i spelartruppen kan göra denna indikator missvisande. Valet av variabeln är att slutplacering påverkar vilka intäkter laget får och därmed således det sportsliga resultatet. 3.3 Insamling av data Historiska data som samlades in för de ovan nämnda 13 variablerna hämtades från Statto (2012), vilka tillhandahåller statistik för spelade matcher i Bundesliga. Vidare har resultat och datum för respektive omgång hämtats från Deutscher Fussball-Bund (2012). Detta gjordes för att kontrollera att omgångarna spelades på utsatt datum (att en match inte blev inställd). Med en total insamling av 1683 matcher skapades sannolikheter för de 153 spelade referensmatcherna säsongen 2011/2012. Dessa sannolikheter lade grunden för en 18
19 spelstrategi, där utfallet med högst sannolikhet per match indikerar en spelsignal. Som hjälpmedel för att ta fram sannolikheterna används statistiskmjukvaran STATA. Varje spel jämförs sedan med det faktiska utfallet i matchen. Sannolikheter som predicerats genom modellen har jämförts med företaget Digibets och om spelet går in beräknas avkastning enligt Digibets odds. På grund av att Digibet erbjuder en stor databas på historiska spel var detta ett bra alternativ. En snabb jämförelse mellan Digibet och andra klienter visade inte på några kraftiga skillnader i odds och därför bestämde vi oss för att fokusera på odds från detta företag. 3.4 Modeller Totalt sammanställs 5 ordered-probit modeller vilka är av olika karaktär vad gäller säsongsdata från tidigare säsonger. Modellerna sammanfattas i en punktlista nedan: Modell 1- Estimeras av en säsong 2010/2011 Modell 2- Estimeras av två säsonger 2009/2010 och 2010/2011 Modell 3- Estimeras av tre säsonger 2008/2009, 2009/2010 och 2010/2011 Modell 4- Estimeras av fyra säsonger 2007/2008, 2008/2009, 2009/2010 och 2010/2011 Modell 5- Estimeras av fem säsonger 2006/2007, 2007/2008, 2008/2009, 2009/2010 och 2010/2011 Med statistikprogrammet STATA har de olika modellerna genererat skattningar på koefficienterna för respektive variabel. Med dessa skattningar har sannolikheterna för utfall i de 153 spelade referensmatcherna under säsongen skattats. 3.5 Strategier För att generera positiv avkastning användes tre stycken strategier för hur spel skall utföras. Den första strategin utvecklas utifrån Forrest et al (2005). Strategi 2 och 3 är vidareutvecklingar av strategi 1. Strategi 1 innebär spel på utfallet som enligt modellen ger den maximala sannolikheten av de tre utfallen i varje match. I formlerna nedan är den predicerade sannolikheten för 19
20 hemmaseger, den predicerade sannolikheten för lika resultat och den predicerade sannolikheten för bortaseger. Spel på hemmavinst om: { } { } Formel 3.7 Spel på lika resultat om: { } { } Formel 3.8 Spel på bortaseger om: { } { } Formel 3.9 I strategi 2 väljs enbart spel på de matcher där den predicerade sannolikheten överstiger Digibets modifierade sannolikheter. I formlerna nedan är Digibets modifierade sannolikhet för hemmavinst, Digibets modifierade sannolikhet för lika resultat och Digibets modifierade sannolikhet för bortaseger. Spel på hemmavinst om: { } { } { } Formel 3.10 Spel på lika resultat om: { } { } { } Formel 3.11 Spel på bortalaget om: { } { } { } Formel
21 Strategi 3 utvecklas från Milliner et al (2008). I denna strategi sker spel enbart på bortaseger i de matcher där de predicerade sannolikheterna överstiger Digibets för just utfallet bortaseger. Formeln som används vid denna strategi ges av formel
22 4. Analys 4.1 Modeller Vid användandet av ordered-probit regression fås nedanstående betavärden för de olika modellerna: Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 Poäng senaste 5 matcherna -0,016-0,037* -0,032* -0,034* -0,036** hemmalag Poäng senaste 5 matcherna 0,006 0,021 0,009 0,000 0,007 bortalag Uppflyttat hemmalag 0,295 0,053 0,020 0,094 0,108 Uppflyttat bortalag 0,056-0,012 0,004-0,004 0,052 Tabellplacering hemmalag -0,006 0,014 0,019 0,009 0,001 Totala poäng hemmalag 0,001 0,007 0,000 0,000-0,004 Målskillnad hemmalag -0,014-0,011-0,005-0,006-0,006 Tabellplacering bortalag -0,019-0,014-0,018-0,018 0,000 Totala poäng bortalag -0,005-0,012-0,004-0,002 0,001 Målskillnad bortalag 0,003 0,004 0,002 0,004 0,006 Poängskillnad inbördes möten -0,012-0,021* -0,023** -0,020** -0,020** 5 senaste matcherna Slutplacering föregående -0,004-0,006 0,008 0,013 0,012 säsong hemmalag Slutplacering föregående -0,018-0,022-0,013-0,011-0,014 säsong borta -0,656-0,639-0,390-0,455-0,341-0,104 0,029 0,282 0,226 0,344 Prob>chi2 0,1189 0,0000 0,0000 0,0000 0,0000 Tabell 4.1 Ordered-Probit regressions modell (* - innebär signifikans mellan 5-1 %, ** - innebär signifikans på 1-0,1 %). Ett Prob>chi2 värde under 0,00001 indikerar att åtminstone en av koefficienterna i modellen är signifikant. 22
23 Regressionen för modell 1, som innefattar data för ett år bakåt i tiden avger inga signifikanta variabler. I modell 2 fås två signifikanta variabler. Dessa är Poäng senaste 5 matcherna hemmalag och Inbördes möten senaste 5 matcherna. Ett tydligt mönster kan följas från modell 2 till modell 5, där variablerna blir mer signifikanta. I modell 2 till modell 4 är variablerna enstjärnigt signifikanta. I den avslutande modellen, modell 5 kan vi utläsa en tvåstjärnig signifikans på variablerna. Det negativa värdet på variabeln, Poäng senaste 5 matcher hemmalag innebär vid senare prediktion ett lågt värde på den latenta variabeln. Detta i sin tur leder till en ökad sannolikhet för hemmavinst, vid en ökning av poängen för hemmalagets senaste fem matcher. Vid positiv skillnad på inbördes möten har hemmalag en bättre historisk vinstprocent. Då koefficienten är negativ kommer detta vid prediktion leda till ett negativt värde på den latenta variabeln vilket också leder till högre sannolikhet för hemmavinst. Det motsatta gäller när skillnaden för inbördes möten är negativt. Då modell 1 inte har några signifikanta variabler kommer denna modell inte att analyseras vidare. Anledningen till detta är att de predicerade sannolikheterna skulle vara alltför slumpartade. 4.2 Strategier och avkastning Avsnittet beskriver de olika strategierna. De referensmatcher som prediktionen utgår ifrån innefattas av 153 spelade matcherna under säsong I tabellerna nedan redogörs för antalet rätt vilket är den andel spel som gått in. Vidare går det att utläsa vilken strategi som tillämpas samt vilken avkastning denna ger. Avkastningen skrivs ut i kronor och procent för att relativt kunna jämföra olika modeller och strategier med varandra. I den första strategin kommer spel läggas på de utfall där den predicerade sannolikheten är som högst. I tabellen nedan visas resultatet med 1 kronas insats per match enligt denna typ av strategi. 23
24 Antal rätt / Spelade matcher Avkastning (kr) Procentuell avkastning (%) Modell 2 70/153-10,01-6,54 Modell 3 73/153-6,71-4,39 Modell 4 73/153-3,06-2 Modell 5 74/153-1,91-1,25 Tabell 5.2 Antal rätt och avkastning av spelen enligt strategi 1 Alla modeller genererar en negativ avkastning, men det anmärkningsvärda är att prediktionen blir bättre ju mer historiska data modellen innehåller. Modell 2 som innefattar 2 säsonger bakåt i tiden ger 70 korrekta prediktioner med en total negativ avkastning på 10,01 kr för de 153 referensmatcherna. Modell 5 som innefattar 5 säsonger bakåt i tiden ger 74 korrekta prediktioner och en negativ avkastning på 1,91 kr, vilket är en kraftig förbättring. Vid spel baserade på Digibets högsta sannolikheter kommer 76 av de totalt 153 matcherna vara korrekta, dock med en negativ avkastning på 8,91 kr. Under strategi 2 väljs som tidigare nämnts spel på de matcher där vår modell estimerar en högre sannolikhet än Digibet. Modellen antyder en underskattning av utfallet och därmed finns utrymme för ett strategiskt spel. Det kommer innebära att strategin väljer bort spel på de matcher vilka uppvisar osäkrare spel. Resultatet för denna strategi ges i tabellen nedan: Antal rätt / Spelade matcher Avkastning (kr) Procentuell avkastning (%) Modell 2 39/99-5,8-5,86 Modell 3 40/87 5,37 6,17 Modell 4 35/86 1,39 1,62 Modell 5 34/82 3,86 4,71 Tabell 5.3 Antal rätt och avkastning av spelen enligt strategi 2 Denna strategi visar på en negativ avkastning med modell 2. Samtliga andra modeller ger en positiv avkastning. Avkastningen blir 6,17 % för modell 3, 1,62 % för modell 4 och 4,71 % för modell 5. 24
25 Sista strategin bygger på antaganden av Milliner et al (2008). I likhet med föregående strategi spelar den på matcher där modellen antas predicera bättre än Digibet. Skillnaden med denna strategi är att spel endast sker på bortavinster. Resultatet för denna strategi presenteras i tabellen nedanför: Antal rätt / Spelade matcher Avkastning (kr) Procentuell avkastning (%) Modell 2 17/52-5,07-9,75 Modell 3 15/37 2,25 6,08 Modell 4 10/28 0,35 1,25 Modell 5 9/23 2,35 10,22 Tabell 5.4 Antal rätt och avkastning av spelen enligt strategi 3 För denna typ av strategi kommer negativ avkastning ges med modell 2. För de övriga modellerna kommer positiv avkastning ges på 6,08 % för modell 3, 1,25 % för modell 4 och 10,22 % för modell 5. 25
26 5. Resultat 5.1 Resultatdiskussion I följande analyssammanställning besvaras och summeras de tre problemformuleringarna. Genom att använda en tidigare välkänd modell för att predicera sannolikheter upprättades fem stycken ordered-probit modeller. Dessa modeller visade sig ge en starkare signifikans ju mer data som tillades. Däremot blev inga variabler signifikanta med modellen där endast historik för en säsong bak i tiden användes. Från den modell baserad på två eller flera säsonger visade samtliga modeller på signifikanta värden för variablerna poäng senaste 5 matcher hemmalag och inbördes möten senaste 5 matcherna. Vad som kan urskiljas vid adderande av mer historiska data är större signifikans för majoriteten av variablerna. Därmed styrks argumentet att modellen blir säkrare i sin prediktion ju mer historiska data som adderas. Målet att testa om en statistisk modell kan överträffa ett spelbolags sannolikheter har undersökts. Det finns vidare inget bevis för att någon av våra modeller predicerar sannolikheter vilka överträffar Digibets. Detta eftersom att samtliga modeller ger färre antal rätt sett till strategin som innebär spel på utfallet med den högsta sannolikheten. Trots detta kan vi se att den negativa avkastningen minskar med mer historiska data. Detta är ett tecken på att mer statistisk data ger en mer adekvat modell. Detta styrks inte minst eftersom att mer data ger en modell med fler antal rätt. Däremot ger spel på Digibet enligt ovan nämnda strategi hela 76 rätt. Den bästa modellen i studien gav 74 rätt, vilket ytterligare är ett argument till svårigheten att predicera bättre än Digibet (och övriga spelbolag). När det kommer till strategiskt spelande kan vi påvisa att positiv avkastning kan genereras. Däremot kan en negativ avkastning utläsas för modell 2 då strategi 2 tillämpas. Slutsatsen av detta är att modell 2 inte innehåller tillräckligt med historiska data för att kunna ge en bra prediktion. Vi kan utläsa att avkastningen i strategi 2 är som bäst för modell 3. Vidare sjunker avkastningen i modell 4 för att igen öka i modell 5. Vi tolkar det som att avvikelsen i modell 3 beror på slumpen snarare än en bättre prediktion. Även strategi 3 genererar en negativ avkastning för modell 2. Däremot ger de övriga modellerna i denna strategi en positiv avkastning där spel baserat på modell 5 är bäst. Slutsatsen av detta är att om strategiskt spelande appliceras på vår modell går det att generera en metod med positiv avkastning. 26
27 5.2 Vidare forskning Som slutsatsen antyder går en positiv avkastning att genereras enligt strategiskt spel applicerat på vår modell. Däremot bör det understrykas att modellerna som upprättats endast prövats på en referenssäsong omfattande 153 matcher. Därför skulle en liknande undersökning på andra referensmatcher kunna utföras för att stärka argumentet i att strategiskt spel enligt vår modell genererar positiv avkastning. Vidare skulle det också vara intressant att undersöka om mer historiska data tillsammans med strategiskt spel medför en högre avkastning än i denna studie. 27
28 Referenser Tryckta källor Borooah K.V. (2002), Logit and Probit Ordered and Multinomial Models, Sage, California. Dixon M.J. & Coles S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market, Applied Statistics 46, Forrest D., Goddard J. & Simmons R. (2005), Odds-Setters as forecasters: The case of English football, International of Forecasting 21, Goodard J. (2005), Regression models for forecasting goals and match results in association football, International Journal of Forecasting 21, Greene H.W. (2003), Econometric Analysis (5th edn.), Pearson Education, New Jersey. Milliner I., White P. & Webber D.J. (2009), A Statistical Development of FIxed Odds Betting Rules in Soccer, Journal of Gambling Business and Economics vol.3-1, Wooldbridge J.M. (2009), Introductory Econometrics (4th edn.), South-Western Cengage Learning, Canada. Elektroniska källor Betfair (2011), About us, Länk: ( ) Deutscher Fussball-Bund (2012), Bundesliga Archiv, Länk: ( ) Digibet (2012), Sport: Past Results,, Länk: ( ) ESPN (2012), Soccernet German Bundesliga Stats: Team Attendance, Länk: ( ) Gambling Kingz (2011), Bundesliga, Länk: ( ) Lotteriinspektionen (2011), Spelmarknadens utveckling I Sverige och internationellt, Länk: 20och%20internationellt% pdf ( ). 28
29 Lufthansa (2012), Lufthansa Flyer Behind The Scenes Of Lufthansa s New Commercial Featuring FC Bayern Munich, Länk: Behind-The-Scenes-Of-Lufthansa8217s-New-Commercial-Featuring-FC-Bayern- Munich/596460/1 ( ) Mattews L. (2011), Bundesliga breaks historical attendance record, Länk: ( ) Oleole (2008), Bundesliga, Länk: ( ) Popular Football Bets (2012), Match Betting, Länk: ( ) Spela Spel (2009), Så sätter spelbolagen oddsen, Länk: ( ) Statto (2012), German Bundesliga, Länk: ( ) Stoltz S. (2009), The Bundesliga: A True Success story, Länk: ( ) Wolfram Alpha (2012), Odds, Länk: ( ) Intervjuer Digibet emejlintervju (2012), Representant på Kundsupport på Digibet ( ) 29
30 Bilaga Bilaga 1.1 Kodning i Excel för den 34:e omgången säsongen 2010/2011 i Bundesliga.
Oddssättning. - utvärdering av modeller för skattning av matchodds i Svenska Superligan i innebandy
Örebro universitet Handelshögskolan Statistik C, Uppsats Handledare: Niklas Karlsson Examinator: Nicklas Pettersson VT 2015 Oddssättning - utvärdering av modeller för skattning av matchodds i Svenska Superligan
Det här är ett system där vi tjänar pengar på ett av de lagen vi spelar på gör mål, gärna många mål!
System - Mera Mål! Copyright 2013 Digital Solutions AB www.fotbollspengar.se www.inzideinfo.com www.inthemoneysystem.com Vi vill ha mål, mål, mål mera mål Och mål det kommer det att bli Vi vill ha mål,
För spel på Asiatiskt handikapp inom svenska Basketligan
Örebro Universitet Handelshögskolan Statistik C - Examensuppsats, 15 hp Handledare: Niklas Karlsson Examinator: Sune Karlsson VT 16 Oddsmodellering - För spel på Asiatiskt handikapp inom svenska Basketligan
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
[HUR MAN VINNER ÖVER SPELBOLAGEN]
2014 ÖREBRO UNIVERSITET STATISTIK C - Examensuppsats VT14 Handledare: Niklas Karlsson Examinator: Panagiotis Mantalos Lars Carlsson 880612 [HUR MAN VINNER ÖVER SPELBOLAGEN] Detta är ett examensarbete i
F19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Går det att slå spelbolagen? - En undersökning av effektiviteten på oddsmarknaden för fotboll i Italien
Går det att slå spelbolagen? - En undersökning av effektiviteten på oddsmarknaden för fotboll i Italien Petter Ehn Wingårdh Kandidatuppsats i statistik (15 HP) Handledare: Jonas Wallin HT 2016 Abstract
Regressionsanalys av NHL-statistik
Regressionsanalys av NHL-statistik Av Gustav Hedén gheden@kth.se Examensarbete inom teknisk fysik, grundnivå SA104x KTH Matematisk statistik Handledare Fredrik Armerin 1 Innehållsförteckning Sammanfattning:...
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):
EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
a) Facit till räkneseminarium 3
3.1 Fig 1. Sammanlagt 30 individer rekryteras till studien. Individerna randomiseras till en av de fyra studiearmarna (1: 500 mg artemisinin i kombination med piperakin, 2: 100 mg AMP1050 i kombination
SPEL PÅ ENGELSKA LEAGUE ONE - en optimerande ansats
Örebro Universitet Handelshögskolan Statistik C Kandidatuppsats 15 hp Handledare: Niklas Karlsson Examinator: Nicklas Pettersson VT 16 SPEL PÅ ENGELSKA LEAGUE ONE - en optimerande ansats Robert Salerian,
Copema Supertoto, manual
Copema Supertoto, manual Innehåll Sidan Bättre vinstchanser 2 Starta programmet 3 Create system, exempel 1 4 exempel 2 7 exempel 3 10 Ladda upp systemet 12 Rätta systemet 12 Odds 14 Print 15 Supertoto
Effektiv simulering av fotbollsmatcher
Effektiv simulering av fotbollsmatcher Författare: Johan Hansson & Jesper Wallman Handledare: Björn Holmquist STAM 01 Examensarbete HT 2013 Sammanfattning Denna studie sammanställer en beprövad statistisk
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
OBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Copyright 2013 Digital Solutions AB - Mikael Eriksson SYSTEMET förklarat:
Copyright 2013 Digital Solutions AB - Mikael Eriksson Inga delar av detta material får kopieras i någon form utan speciellt tillstånd från ansvarig utgivare. Detta material är skyddat av upphovsrättslagen.
Hur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Regression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Uppgift 1 (14p) lika stor eller mindre än den förväntade poängen som efterfrågades i deluppgift d? Endast svar krävs, ingen motivering.
Uppgift 1 (14p) I en hockeymatch mellan lag A och lag B leder lag A med 4-3 när det är en kvart kvar av ordinarie matchtid. En oddssättare på ett spelbolag behöver bestämma sannolikheten för de tre matchutfallen
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl
Karlstads Universitet Avdelningen för Nationalekonomi och Statistik Tentamen i Statistik, STG A0 och STG A06 (3,5 hp) Torsdag 5 juni 008, Kl 4.00-9.00 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
diskriminering av invandrare?
Kan kvinnliga personalchefer motverka diskriminering av invandrare? ALI AHMED OCH JAN EKBERG Ali Ahmed är fil. lic i nationalekonomi och verksam vid Centrum för arbetsmarknadspolitisk forskning (CAFO)
F22, Icke-parametriska metoder.
Icke-parametriska metoder F22, Icke-parametriska metoder. Christian Tallberg Statistiska institutionen Stockholms universitet Tidigare när vi utfört inferens, dvs utifrån stickprov gjort konfidensintervall
Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl
Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 1 januari 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel-
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
1. Inledning...1. 2. Bakgrund...4. 3. The possession scoring system...9. 4. Logistisk regression...10
Sammanfattning På spelmarknaden har spelbolagen fördelarna på sin sida, men denna teoretiska fördel är betydligt mindre på marknaden för amerikansk basket jämfört med exempelvis europeisk fotboll. Eftersom
STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. Matematisk statistik Anders Björkström
STOCKHOLMS UNIVERSITET 2001-10-22 MATEMATISKA INSTITUTIONEN Avd. Matematisk statistik Anders Björkström GRUNDLÄGGANDE MATLAB-TRÄNING för den som aldrig har arbetat med Matlab förut A. Matlabs allmänna
Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
Att med multinomial logistisk regression förklara sannolikheter i fotbollsmatcher
Att med multinomial logistisk regression förklara sannolikheter i fotbollsmatcher Sebastian Rosengren Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 212:6
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Kort historik
Kort historik 1928-2009 Tranemo IF bildades officiellt den 28 november 1928, men det första protokollet skrevs faktiskt redan den 19 november 1928, vilket ni kan se på bilden nedan. De första sektionerna
Ökat personligt engagemang En studie om coachande förhållningssätt
Lärarutbildningen Fakulteten för lärande och samhälle Individ och samhälle Uppsats 7,5 högskolepoäng Ökat personligt engagemang En studie om coachande förhållningssätt Increased personal involvement A
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Uppgift 1. Produktmomentkorrelationskoefficienten
Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
ÖVNINGSUPPGIFTER KAPITEL 8
ÖVNINGSUPPGIFTER KAPITEL 8 SAMPEL KONTRA POPULATION 1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår
TUT1.4 Seriespelsförslag
TUT1.4 Seriespelsförslag Bakgrund I samband med att TUT tillsattes fick vi ett antal uppdrag. Ett uppdrag var att se över seriespelet och uppdraget begränsades till förbundsserierna. Uppdraget från Svenska
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp
Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.
Squash gruppspel i Spånga
Squash gruppspel i Spånga Spelform: Gruppspel, nio spelare i varje grupp, alla möter alla en gång under 9 veckor. Varje spelare har en spelledig vecka. Rak räkning till 11, efter 10-10 gäller vinst med
OBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-09-28 Tillåtna
Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.
KOD: Kurskod: PC1244 Kursnamn: Metod Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2014-11-08 Tillåtna hjälpmedel: Miniräknare Tentan består av 13 frågor, totalt 40 poäng. Det krävs
FACIT (korrekta svar i röd fetstil)
v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng
Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-08-31 Tid:
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )
TENTMEN Kurs: Plats: Dataanalys och statistik 2 distans 7,5 hp HiG sal 5:525 B eller annan ort Datum: 2 6 9 Tid: 9: 4: Lärare: Tommy Waller ( tel: 26-64 89 65 eller 74 3 86 3 ) Hjälpmedel: Miniräknare
Laboration 3 HI1024, Programmering, grundkurs, 8.0 hp
Laboration 3 HI1024, Programmering, grundkurs, 8.0 hp Dataingenjörsprogrammet, elektroingenjörsprogrammet och medicinsk teknik KTH Skolan för Teknik och Hälsa Redovisning: Se Kurs-PM om hur redovisningen
Större ytterzoner kontra målproduktion
Svenska Ishockeyförbundet Elitkurs Större ytterzoner kontra målproduktion Fredrik Glader Handledare: Göran Lindblom 2016-05-11 Sammanfattning Uppsatsen har undersökt vilka effekter de nya större ytterzonerna
Spelmarknaden Ett test av effektiviteten på den svenska spelmarknaden
NATIONALEKONOMISKA INSTITUTIONEN Uppsats Fortsättningskurs C Författare: Handledare: Lennart Berg VT 2005 Spelmarknaden Ett test av effektiviteten på den svenska spelmarknaden Ett test av effektiviteten
Linjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen
Uwe Menzel, 2017 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Syfte: o statistiska test om parametrar för en fördelning o förkasta eller acceptera hypotesen hypotes: = 20 (väntevärdet är 20)
OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER
STOCKHOLMS UNIVERSITET Statistiska institutionen Termeh Shafie OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2012-04-16 Skrivtid: 15.00-20.00 Hjälpmedel: Miniräknare utan lagrade formler eller text,
Examinationsuppgift 2014
Matematik och matematisk statistik 5MS031 Statistik för farmaceuter Per Arnqvist Examinationsuppgift 2014-10-09 Sid 1 (5) Examinationsuppgift 2014 Hemtenta Statistik för farmaceuter 3 hp LYCKA TILL! Sid
Föreläsninsanteckningar till föreläsning 3: Entropi
Föreläsninsanteckningar till föreläsning 3: Entropi Johan Håstad, transkriberat av Pehr Söderman 2006-01-20 1 Entropi Entropi är, inom kryptografin, ett mått på informationsinnehållet i en slumpvariabel.
Psykologi som vetenskap
Psykologi som vetenskap Begrepp och metoder Forskningsetik Av Jenny Wikström, KI till Psykologprogrammet HT10 Kurslitteratur: Myers Psychology, Kap.1 Kurs: Introduktion till psykologi 7,5 hp Psykologi
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Föreläsning G60 Statistiska metoder
Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel
Stockholms Universitet Statistiska institutionen Termeh Shafie
Stockholms Universitet Statistiska institutionen Termeh Shafie TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2012-03-16 Skrivtid: 9.00-14.00 Hjälpmedel: Miniräknare utan lagrade formler eller text, bifogade
Repetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Hypotestestning och repetition
Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik A1, 15 hp Antal uppgifter: 6 Krav för G: 13 Lärare:
Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)
Kursens upplägg v40 - inledande föreläsningar och börja skriva PM 19/12 - deadline PM till examinatorn 15/1- PM examinationer, grupp 1 18/1 - Forskningsetik, riktlinjer uppsatsarbetet 10/3 - deadline uppsats
TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng
Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:
Tema Förväntat värde. Teori Förväntat värde
Tema Förväntat värde Teori Förväntat värde Begreppet förväntat värde används flitigt i diskussioner om olika pokerstrategier. För att kunna räkna ut det förväntade värdet så tar du alla möjliga resultat,
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Leder pengar till framgång?
Leder pengar till framgång? En studie av hur kostnaderna och spelarköpen i de Allsvenska fotbollsklubbarna påverkar lagens tabellplacering Sanna Lundquist Sanna Lundquist VT 2012 Kandidatuppsats 15 hp
Analys av betygsstatistik från KTH
Martin Möllberg mollberg@kth.se Alexei Zaitsev alexeiz@kth.se SA104X Examensarbete i teknisk fysik, grundnivå Avdelningen för matematisk statistik 17 maj 2011 Författarnas tack Vi vill särskilt tacka två
FC Barcelonas olika uppställningar Ett anfallsspel med flexibilitet. Andreas Engelmark
FC Barcelonas olika uppställningar Ett anfallsspel med flexibilitet Andreas Engelmark GYMNASTIK- OCH IDROTTSHÖGSKOLAN Kurs TR5 HT-2009 Handledare: Mårten Fredriksson INNEHÅLLSFÖRTECKNING 1 INLEDNING...
Antal hörnor i Premier League-matcher En modell för att uppskatta antalet hörnor i fotbollsmatcher
KANDIDATUPPSATS Hösten 2013 Statistiska institutionen Uppsala Antal hörnor i Premier League-matcher En modell för att uppskatta antalet hörnor i fotbollsmatcher Handledare: Rolf Larsson Författare: Erik
Regressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
SANNOLIKHET OCH SPEL
SANNOLIKHET OCH SPEL I ÖVNINGEN INGÅR ATT: Formulera, analysera och lösa matematiska problem samt värdera valda strategier, metoder och resultat (MA) Tolka en realistisk situation och utforma en matematisk
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Taktik/spelanalys. Snabba uppspel i Svenska Basketligan. Juan Alonso
Taktik/spelanalys Snabba uppspel i Svenska Basketligan Juan Alonso GYMNASTIK- OCH IDROTTSHÖGSKOLAN Träningslära II, Ht-09 Handledare: Mårten Fredriksson Innehållsförteckning 1 Taktik/spelanalys... 3 1.1
Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Analytisk statistik. Tony Pansell, optiker Universitetslektor
Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
Fråga nr a b c d 2 D
Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Hjälp och manual till Webbprogrammet
Hjälp och manual till Webbprogrammet BombSt@tion Bäste kund. Detta program är utvecklat som en webbklient att kunna användas på vilken dator som helst, oberoende vart du är. Programmet är mycket enkelt
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Innehåll. Standardavvikelse... 3 Betarisk... 3 Value at Risk... 4 Risknivån i strukturerade produkter... 4
Del 22 Riskbedömning Innehåll Standardavvikelse... 3 Betarisk... 3 Value at Risk... 4 Risknivån i strukturerade produkter... 4 Vid investeringar i finansiella instrument följer vanligen en mängd olika
Utdrag ur SvFF:s och BFF:s bestämmelser för 2015 fastställda
Utdrag ur SvFF:s och BFF:s bestämmelser för 2015 fastställda 2015-03-31 17.1 BFF: s bestämmelser Förening som nödgas lämna w.o. ska kontakta kansli eller TK-ledamot INNANw.o. lämnas. Uteblir förening två
Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap
Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap Syns du, finns du? - En studie över användningen av SEO, PPC och sociala medier som strategiska kommunikationsverktyg i svenska företag
Sänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Artificial Intelligence
Omtentamen Artificial Intelligence Datum: 2013-01-08 Tid: 09.00 13.00 Ansvarig: Resultat: Hjälpmedel: Gränser: Cecilia Sönströd Redovisas inom tre veckor Inga G 10p, VG 16p, Max 20p Notera: Skriv läsbart!