Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Relevanta dokument
Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Lektionsanteckningar 11-12: Normalfördelningen

4 Diskret stokastisk variabel

Några extra övningsuppgifter i Statistisk teori

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Samplingfördelningar 1

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

TMS136. Föreläsning 4

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Lärmål Sannolikhet, statistik och risk 2015

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

bli bekant med summor av stokastiska variabler.

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

1.1 Diskret (Sannolikhets-)fördelning

Tentamen MVE301 Sannolikhet, statistik och risk

Demonstration av laboration 2, SF1901

Statistiska begrepp och metoder som används i Successivprincipen

FÖRELÄSNING 8:

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Föreläsning G60 Statistiska metoder

4.1 Grundläggande sannolikhetslära

Kap 3: Diskreta fördelningar

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Mer om slumpvariabler

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

TMS136. Föreläsning 7

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

StaM-Bladet. Informationsblad för medlemmar i StaM (Statistisk Metodik), sektion inom SFK, Svenska Förbundet för Kvalitet

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Statistik 1 för biologer, logopeder och psykologer

Introduktion och laboration : Minitab

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Diskussionsproblem för Statistik för ingenjörer

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Jörgen Säve-Söderbergh

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Introduktion till statistik för statsvetare

Binomialfördelning, två stickprov

TMS136. Föreläsning 11

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning 5: Hypotesprövningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

TMS136. Föreläsning 10

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Uppgift a b c d e Vet inte Poäng

MVE051/MSG Föreläsning 7

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

LKT325/LMA521: Faktorförsök

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

TENTAMEN I STATISTIKENS GRUNDER 2

Statistiska metoder för säkerhetsanalys

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Stokastiska processer med diskret tid

Föreläsning 12: Repetition

Föreläsning 12: Regression

LABORATION 1. Syfte: Syftet med laborationen är att

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Gamla tentauppgifter i kursen Statistik och sannolikhetslära (LMA120)

0 om x < 0, F X (x) = c x. 1 om x 2.

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

SF1901 Sannolikhetsteori och statistik: HT 2014 Lab 1 för CSAMHS, CINEKI, och CL

Lösningar tentamensskrivning i stokastik MAGB64 den 7 juni 2013

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Våra vanligaste fördelningar

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

Tentamen MVE301 Sannolikhet, statistik och risk

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

1 Förberedelser. 2 Teoretisk härledning av värmeförlust LABORATION 4: VÄRMEKRAFTVERK MATEMATISK STATISTIK AK, MAS 101:A, VT-01

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

DATORÖVNING 2: SIMULERING

Beskrivande statistik

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

F3 Introduktion Stickprov

Transkript:

EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer om processen 'antal mål' Resultatet beskrivs med hjälp av en Poissonfördelning eftersom 'mål' kan beskrivas som 'händelser per tidsenhet' (På hemsidan wwwindstatse under knappen [Arkiv] finns 'StaM-Bladet', en enkel skrift som gavs ut av SFK-StaM (Svenska Förbundet för Kvalitet, Statistisk Metodik) Nummer 1 och nummer 9 diskuterar på ett liknande sätt data från VM 1990 och VM 1994) Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6): 1 Histogram över antal mål i en match 2 Histogram över tid mellan mål 3 En Pure birth -process 4 Alla mål på ett 90-minutersintervall 5 Oavgjort 6 Simulering diagram över medelvärde mot varians 7 Sammanfattning 1 Histogram över antal mål i en match Nedanstående histogram visar totalt antal per match, dvs summan av de två lagens mål under 2x45 minuter Förlängning och straffar är inte medräknade Eftersom summan består av två termer, båda antages vara Poissonfördelade, blir summan också Poissonfördelad (Om man adderar fler och fler termer kommer summan att närma sig en normalfördelning eller egentligen en Poissonfördelning som blir mer symmetrisk och klockformad) Som en bästa skattning av fördelningens parameter (lambda) användes totalmedelvärdet och histogrammet visar verkligt utfall och den teoretiska sannolikhetsfördelningen baserad på det beräknade lambda: Det verkar vara en god anpassning mellan verkligt och teoretiskt utfall För en Poissonfördelning gäller att förhållandet mellan väntevärde och varians är 1 För fotbollsresultatet är denna siffra 106 (grön markering), alltså en god överensstämmelse Ing-Stat wwwing-statnu Rev A 2012-07-06 1(1)

2 Histogram över tid mellan mål Ett annat sätt att titta på en händelseprocess i tiden är att beräkna tidsavståndet mellan händelserna Om händelser uppträder enligt en Poissonprocess på tidsaxeln så är tidsavstånden mellan händelserna exponentialfördelade Nedanstående histogram visar dessa tidsavstånd och eftersom det fanns 76 mål i EM 2012 så finns det 75 tidsavstånd Teoretisk gäller för en exponentialfördelning att väntevärde och standardavvikelse är exakt samma I detta utfall blev resultatet 365 respektive 303: Det verkar vara en god anpassning mellan verkligt och teoretiskt utfall Om man ritar resultatet som en vanlig 'probability plot' får man följande resultat (minuter): Ing-Stat wwwing-statnu Rev A 2012-07-06 2(2)

3 En Pure birth -process Inom teorin för stokastiska processer skulle mål i en fotbollsmatch betraktas som en pure birth - process där varje mål alltså är en birth (In en Birth and death -process sker det händelser in och händelser ut tex nya felrapporter in och åtgärdade felrapporter ut) Om man ritar alla matchernas resultat i en lång tidserie (31 x 90 min) får man följande diagram där lutningen är den genomsnittliga målintensiteten För varje mål blir det ett steg uppåt på Y-axeln: Diagrammet visar antal mål som en 'pure birth'-process 4 Alla under 90 min Om man ritar varje mål som en händelse på tidsaxeln 0 90 minuter får man följande diagram Här skulle man kanske kunna se uttunning av processen då det närmar sig halvtidsvila eller slutet på matchen men ingen tydlig sådan effekt kan skönjas: Ing-Stat wwwing-statnu Rev A 2012-07-06 3(3)

5 Oavgjort Givet ett visst värde på parametern lambda och att lambda är konstant mellan lagen, kan vi beräkna sannolikheten för en oavgjord match Detta är i grunden en enkel sannolikhetsberäkning (I tabellen nedan sker beräkningen tom resultatet 10-10, högre är väldigt osannolikt): Resultat Sannolikhet 0 0 00863 00863 = 00074 1 1 02114 02114 = 00447 2 2 02590 02590 = 00671 summa: 0185 Sannolikheten att en fotbollsmatch slutar i oavgjort är alltså 0185 (baserat på att 'antal mål' följer en Poissonfördelning med parametern 245) Resultatet från de 31 matcherna i EM 2012 visar att det blev 7 matcher som blev oavgjorda Detta ger proportionen 7/31 = 0223 Nu är det en viss skillnad på 0185 och det verkliga utfallet 0223 men är det en systematisk eller en slumpmässig skillnad? Vi kan göra en enkel hypotesprövning men kanske en simulering kan ge en bättre beskrivning Vi har alltså en situation vars utfall kan bäst beskrivas med binomialfördelningen där n = 31 (fotbollsmatcher) och p = 0185 Nedan finns ett histogram över resultatet från 10000 partier Varje resultat har dividerats med 31 för att få den observerade felkvoten: Simulering av 10000 partier om n = 31 och p = 0185 (10000 partier kan alltså ses som 10000 EM-slutspel) Den röda triangeln visar resultatet från EM-2012 och det är inte speciellt avvikande Det finns knappast underlag att påstå att resultatet 0223 avviker signifikant, dvs nollhypotesen förkastas inte Ing-Stat wwwing-statnu Rev A 2012-07-06 4(4)

6 Simulering diagram över medelvärde mot varians Om man simulerar ett stort antal EM-turneringar kan man plotta medelvärdena mot varianserna: Simulering av 10000 EM-turneringar med lambda = 245 För varje 'turnering' beräknades medelvärde och varians Den svarta linjen går genom punkterna y = x dvs att teoretiskt är väntevärdet lika med variansen i en Poissonfördelning Observera att fördelningen av variansen är (typiskt) en aning skev - för ett givet medelvärde är det fler punkter ovan linjen än under linjen 7 Sammanfattning Detta dokument visar några sätt att med olika diagram åskådliggöra resultaten från EM-fotbollen 2012 Det genomsnittliga antal mål blev 245 (för VM-fotbollen 1990 respektive 1994 blev motsvarande värde 221 respektive 267) I ovanstående framställning har lambda betraktats som en konstant I mer seriösa och kanske mer komplicerade fall kan man ansätta att lambda följer en slumpmässig fördelning Man menar då, applicerat på fotboll, att lagens lambda kan anses vara dragna från en definierad sannolikhetsfördelning som man valt på olika grunder Man skulle också kunna diskutera spelarnas individuella lambda (något som man gärna gör på sportsidorna), men summan av dessa blir ju dock lagets lambda Ingemar Sjöström Ing-Stat wwwing-statnu Rev A 2012-07-06 5(5)