Cirkulära data och dess statistiska tillämpningar

Relevanta dokument
Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Föreläsning G04: Surveymetodik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

a) Beräkna E (W ). (2 p)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

1. Test av anpassning.

Introduktion till statistik för statsvetare

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

S0005M V18, Föreläsning 10

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

θx θ 1 om 0 x 1 f(x) = 0 annars

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Genomsnittligt sökdjup i binära sökträd

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Datorövning 2 Fördelningar inom säkerhetsanalys

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

TMS136: Dataanalys och statistik Tentamen med lösningar

F10 ESTIMATION (NCT )

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Tillämpad biomekanik, 5 poäng Plan rörelse, kinematik och kinetik

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Uppgifter 3: Talföljder och induktionsbevis

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

================================================

2. Konfidensintervall för skillnaden mellan två proportioner.

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

101. och sista termen 1

Föreläsning G70 Statistik A

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Grundläggande matematisk statistik

Lösningar och kommentarer till uppgifter i 1.1

Borel-Cantellis sats och stora talens lag

Resultatet av kryssprodukten i exempel 2.9 ska vara följande: Det vill säga att lika med tecknet ska bytas mot ett plustecken.

Lycka till! I(X i t) 1 om A 0 annars I(A) =

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Föreläsning 2: Punktskattningar

Inledande matematisk analys (TATA79) Höstterminen 2016 Föreläsnings- och lekionsplan

b 1 och har för olika värden på den reella konstanten a.

Avd. Matematisk statistik

Räkning med potensserier

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

4.2.3 Normalfördelningen

Tentamenskrivning, , kl SF1625, Envariabelanalys för CINTE1(IT) och CMIEL1(ME ) (7,5hp)

H1009, Introduktionskurs i matematik Armin Halilovic POLYNOM, POLYNOMDIVISION, ALGEBRAISKA EKVATIONER, PARTIALBRÅKSUPPDELNING. vara ett polynom där a

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Jag läser kursen på. Halvfart Helfart

Jag läser kursen på. Halvfart Helfart

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

REGULJÄRA SPRÅK (8p + 6p) 1. DFA och reguljära uttryck (6 p) Problem. För följande NFA över alfabetet {0,1}:

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Egna funktioner. Vad är sin? sin är namnet på en av många inbyggda funktioner i Ada (och den återfinns i paketet Ada.Numerics.Elementary_Functions)

Kompletterande kurslitteratur om serier

Trigonometriska polynom

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Ekvationen (ekv1) kan beskriva en s.k. stationär tillstånd (steady-state) för en fysikalisk process.

Datorövning 2 Fördelningar inom säkerhetsanalys

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 26, 9/2 2011: y + ay + by = h(x)

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Befolkning per födelseland Reviderad metod vid framskrivningar. Version: 2

TNA001- Matematisk grundkurs Tentamen Lösningsskiss

Fourierserien. fortsättning. Ortogonalitetsrelationerna och Parsevals formel. f HtL g HtL t, där T W ã 2 p, PARSEVALS FORMEL

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Föreläsning G70 Statistik A

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Lösningar till tentamensskrivning i kompletteringskurs Linjär Algebra, SF1605, den 10 januari 2011,kl m(m + 1) =

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

MS-A0409 Grundkurs i diskret matematik I

Handbok i materialstyrning - Del F Prognostisering

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Övning 3 - Kapitel 35

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Digital signalbehandling Fönsterfunktioner

Om komplexa tal och funktioner

Transkript:

U.U.D.M. Project Report 2017:5 Cirkulära data och dess statistiska tillämpigar Erik Persso Examesarbete i matematik, 15 hp Hadledare: Jesper Rydé Examiator: Jörge Östesso April 2017 Departmet of Mathematics Uppsala Uiversity

Sammafattig I dea uppsats ges e itroduktio till cirkulära data och dess statistiska tillämpigar. De mest grudläggade verktyge ödvädiga för tolkig av cirkulära data redovisas, såsom beräkig av medelvärde och spridig. Äve metoder för att utföra tester preseteras. Avslutigsvis exemplifieras dessa statistiska redskap geom ett eget exempel med data frå Trasportstyrelse.

Iehållsförteckig 1. Iledig... 1 2. Ett stickprovs medelvikel a och spridig... 1 2.1 Kofidesitervall för medelvikel... 3 2.2 Spridig... 4 3. Mediavikel... 5 3.1 Testa för symmetri rut mediavikel... 5 4. Axiell data... 5 4.1 Medelvärdet av medelviklar för axiella data... 6 5.Testa för cirkulär likformighet... 7 5.1 Rayleighs test... 7 5.2 V-testet, ett modifierat Rayleigh test... 7 5.3 Ett-stickprovstest för medelvikel... 8 5.4 Hodges-Aje testet för likformighet... 8 5.5 Batschelettestet, ett modifierat Hodges-Aje test... 9 6. Goodess of fit test för cirkulära data... 9 6.1 Chi två test... 9 6.2 Watsos U 2 test för ett stickprov... 10 7. Problemlösig... 11 7.1 Exempel: Svårt skadade i trafikolyckor åre 2006-2012... 11 8. Refereser... 15

1. Iledig Vi aväder oss utav cirkulära data daglige uta att äga ågo större take åt sake. Exempelvis stöter vi på det i och med att vi avläser aktuell tid på ett ur, läser av e kompass för att udvika att gå vilse eller för de oritologiitresserade som vill udersöka flyttfåglars migratiosmöster. Det dyker äve upp i flera veteskapliga fält såsom biologi, geografi, geofysik, medici, meteorologi och oceaografi. 1 Hur vi ä aväder oss utav cirkulära data har de ågra gemesamma egeskaper som defiierar dem. Cirkulära data sakar tydlig ollpukt och höga och låga värde är godtyckliga, i exemplet med kompass fis det iget som fysiskt berättigar att orr ska bli tilldelad grad 0 (eller 360) och iget som tyder på att e riktig av 180 är större ä e på 90. Äve tide på dyget är uta ollpukt och har därför tilldelats e ollpukt vid midatt. E timme motsvarar 15 på e cirkel och följaktlige motsvaras e grad av fyra miuter. All cirkulära data ka översättas till grader vilket ofta är ödvädigt då det represeteras grafiskt med fördel utav just e cirkel och med atige pukter eller staplar. Ytterligare e egeskap som följd av godtycklig ollpukt är att, som i exemplet med årets måader, jauari (första måade på året) ligger lika ära februari (r två) som december (r tolv). Huvudkälla i detta arbete har varit Zar (2010), då framför allt kapitel 26 och 27 om cirkulära data. I slutet av arbetet redovisas ett exempel som baseras på data frå Trasportstyrelse. 2. Ett stickprovs medelvikel a och spridig När ma behadlar cirkulära data fis det ett atal viktiga verktyg ma behöver ha till sitt förfogade. Att kua beräka medelvikel på ett stickprov är ödvädigt för att kua tolka materialet. Eftersom de cirkulära skala har e godtycklig ollpukt är vissa grudläggade metoder ej applicerbara. Ta, till exempel, tre riktigar på e kompass: 5, 15 och 355. Då hade medelvikel, beräkad som aritmetiskt medelvärde, blivit (5 +15 +355 )/3 = 125. Detta ger mycket dålig förklarig för datamaterialet ty de tre viklara pekar orr på e kompass meda medelvärdet har e sydöstlig riktig. Det ma istället bör aväda sig av är ett mått som tar häsy till de cirkulära skalas egeskaper och ger e bättre förklarig av stickprovet. Säg att ma har ett stickprov med stycke viklar, a1, a2, a3,...,a. För att beräka medelvikel a behöver ma först beräka medelvikels rektagulära koordiater, X och Y, eligt följade: X = i=1 cos a i, Y = i=1 si a i ( 1 ), ( 2 ) 1 Fisher, s 1. 1

Ofta är cirkulära data grupperade, för att ta häsy till detta gör ma e altererig till ekvatio (1) och (2) geom att helt ekelt multiplicera med frekvese (fi) av varje vikel: X = i=1 f i cos a i, Y = i=1 f i si a i ( 3 ), ( 4 ) Med dessa två kompoeter (X och Y) ka ma seda beräka r, lägde av medelvektor, som beskriver hur väl medelvikel tillika medelvektor beskriver datamaterialet (r är alltså ett mått på stickprovets kocetratio): r = X 2 + Y 2 ( 5 ) Ytterligare e aspekt att begruda är ma behadlar grupperade data är att det därefter beräkade r-värdet blir e aig skevt. För att korrigera detta bör ma, om fördelige är uimodal, multiplicera sitt r med e korrektioskoefficiet c: r c = cr ( 6 ) där rc är det korrigerade r-värdet och c fås eligt: c = dπ 360 si( d 2 ) ( 7 ) där d är itervallägde av datamaterialets grupper, till exempel 30 för måadsvis data. Om d <30 blir korrigerige oväsetlig. Därefter ka ma få fram medelvikel a med hjälp av: cos a = X r, si a = Y r ( 8 ), ( 9 ) 2

Det fis edast e vikel som har ovaståede värde på cosius och sius. De erhåller ma eklast med hjälp utav arccos och arcsi. Ytterligare e trigoometrisk likhet mella medelvikel och dess rektagulära koordiater är: ta a = si a cos a = X Y ( 10 ) Om r = 0 fis ej ågo medelriktig ty medelvikel är odefiierad. 2.1 Kofidesitervall för medelvikel Kofidesgräsera och kofidesitervallet för medelvikel ka uttryckas eligt följade: a ± d ( 11) eller [a d, a + d] ( 12 ) där d beräkas eligt följade för 8 och r 0,9: d = cos 1 2(2R2 χ 2 α,1) 4 χ 2 α,1 R ( 13 ) ( ) och för 8 och r 0,9: d = cos 1 ( 2 ( 2 R 2 )e χ 2 α,1 / R ) ( 14 ) 3

där R = r ( 15 ) 2 och kallas Rayleighs R, återkommer till detta seare. I ekvatio (13) och (14) iebär χ α,1 chitvåfördelig med e frihetsgrad och kofidesgrad α. 2.2 Spridig Ett medelvärde (eller medelvikel i vårt fall) säger ite mycket om ett stickprov uta ett mått på spridige. Dels ka ma defiiera stickprovets spa som vikel på de mista cirkelbåge som iehåller all data. Till exempel om vi har ett stickprov iehållades följade riktigar 23, 41 och 355 är spaet mista avstådet mella de yttersta riktigara. I vårt exempel blir det alltså avstådet mella 355 och 41 som är 46. Ett aat sätt att mäta spridig på cirkulära data är geom att beräka värdet på de ova ämda variabel r. Värdet på r ka variera mella 0, där spridige på stickprovet är så pass stor att ågo medelvikel ej existerar, och 1. Har r värdet 1 är alla observatioer kocetrerade i e pukt. E amärkig vid fallet r = 0 är att de ej medför att det är e likformig distributio uta det ka vara så att hälfte av observatioera är kocetrerade vid 180 och adra hälfte vid 0 varvid ma erhåller ett värde på r ära 0. Som ämt ova så beäms variabel r iblad som lägde av medelvektor då de beskriver hur väl medelvektor beskriver stickprovet geom att ata e ehetslös lägd mella 0 och 1. Ma ka tolka äde av medelvektor, alltså lägde av r, i medelvikels riktig som mittpukte för stickprovets tygd. Om alla observatioer har samma vikt och placeras i utkate av e disk, eligt respektives agiva vikel, kommer diske kua balasera på positioe av äde av medelvektor. Eftersom r är ett mått av kocetratio får ma helt aalogt ett mått av spridig geom följade ekvatio, som är e defiitio av cirkulär varias: S 2 = 1 r ( 16 ) där ett värde på S 2 ära 1 tyder på stor spridig och brist utav spridig beskrivs av ett värde rut 0. Ett aat mått på spridig är vikelvarias och defiieras eligt följade: s 2 = 2(1 r) ( 17 ) 4

Detta ases av vissa vara e bättre beskrivig av spridig och bättre motsvara valig lijär varias. De seare ekvatioe ka ata värde mella 0 och 2. E amärkig är att, på likade vis som kocetratio, ett värde av S 2 = 1 eller s 2 = 2 leder ödvädigtvis ite till att ma ka dra slutsatse att stickprovet är likformigt fördelat trots att det är fullkomligt utspritt på de cirkulära skala. Ytterligare ett mått av spridig ka beräkas, dea gåg med hjälp av aturlig logaritm: s 0 2 = 2 l r ( 18 ) Detta mått ka ata värde frå 0 till. Att det sakar e övre gräs skiljer det frå de två adra spridigsmåtte. Eftersom det är lättare att tolka ett spridigsmått på ett begräsat itervall (till exempel frå 0 till 2) kommer s 2 i fortsättige att avädes vid tillfälle där ett stickprovs spridig skall beräkas. 3. Mediavikel För att bestämma mediavikel på ett stickprov behöver ma först hitta diameter som delar upp observatioera i två lika stora grupper. Mediavikel är de radie på diameter som är ärmast majoritete av observatioera. Om atalet observatioer är udda kommer mediavikel oftast vara beläge vid e av datapuktera eller mittemot (180 ) e. Däremot om atalet observatioer är jämt kommer mediavikel vara placerad halvvägs mella två datapukter, helt aalogt med lijära data. Det är möjligt, dock ovaligt, att det ka förekomma fler ä e mediavikel. Då bör ma, eligt kovetio, beräka ett medelvärde av de befitliga mediaviklara. 3.1 Testa för symmetri rut mediavikel Symmetri krig mediavikel ka testas geom att aväda Wilcoxos teckeragtest. För varje observerad vikel, ai, beräkar vi differese till mediavikel. Vi beämer differese di = ai media. Då ka vi förslagsvis ställa upp H0: stickprovets fördelig är symmetrisk rut mediavikel mot H1: ej symmetrisk. Därefter fortsätter ma som ett valigt Wilcoxo teckeragtest med att ta fram dessa differeser (di) och ragorda absolutbeloppet av dem ( d i ). Addera seda ihop absolutbeloppe av de positiva respektive de egativa differesera till två statistiska variabler, T+ och T-. Slutlige jämför ma T+ och T- med kritiskt tabellvärde av T (som e fuktio av α och ) för att se om ma ka förkasta ollhypotese. 4. Axiell data Iblad stöter ma på cirkulära data som är bimodal ( tvåvägsdata ), alltså data som är uppdelad i två grupper, ofta motsatta riktigar. Ett exempel på detta hittar vi iom biologi, 5

ärmare bestämt i limologi och ett experimet med vadrade fisk. Om ma släpper fri fisk i e flod i sydöstlig ordvästlig riktig ka det vara utav itresse att udersöka ifall fiske vadrar till grudare vatte, i ea riktige, eller djupare vatte, adra riktige. Då får ma apassa beräkig av medelvikel ty om ma skulle aväda tidigare ämda formel får ma e skev bild av stickprovsfördelige. Det ma istället gör är att dubbla alla observatioers viklar (så att ai, där i= 1,2,...,, blir 2ai) och beräkar de modulo 360. Om ma dubblar e vikel ai >180 resulterar det i att ma subtraherar 360 frå de dubblade vikel. Exempelvis vikel 190 blir, efter dubblerig och modulo 360, 20. Därefter beräkar ma medelvikel eligt kovetio förutom det att ma avslutigsvis dividerar vikel med två. Detta eftersom ma egetlige får fram 2a. Medelvikel ma u fått fram beskriver ej stickprovet väl me e lije frå de beräkade a till a + 180 kommer geerera e cirkeldiameter som löper mella de två datagruppera och är de eftersökta axel av de bimodala data. 4.1 Medelvärdet av medelviklar för axiella data Om ma beräkar e medelvikel för varje grupp av data i e bi- eller multimodal distributio ka det vara utav itresse att ta fram ett medelvärde för dea uppsättig medelviklar, e så kallad huvudmedelvikel. Dock ka ma ite betrakta varje grupps medelvikel som e observatiosvikel och seda fortsätta att beräka e huvudmedelvikel med de valiga metode. Då skulle ma ata att varje medelvikel har ett r-värde på 1,0 vilket är högst osaolikt. Det ma bör göra är att ta fram huvudmedelvikels rektagulära koordiater eligt följade: X = k j=1 X j k, Y = k j=1 Y j k ( 19 ), ( 20) Med k stycke grupper av data och Xj respektive Yj erhålles som tidigare. När ma fått fram X och Y ka ma beräka huvudmedelvikel med de valiga formel. Om ma skulle saka värde på X och Y för varje grupp me istället har a och r så ka ma aväda: X = k j=1 r j cos a j k k, Y = j=1 r j si a j k ( 21 ), ( 22 ) När ma ska beräka huvudmedelvikel med dea metod är det rekommederat att alla grupper har lika måga observatioer, 1 = 2 =... = j, fastä olika storlekar på grupperas stickprov ej påverkar resultatet allvarligt. Dea metod att dubblera (eller tripplera etc.) vikel är lämplig att aväda geerellt vid statistiska tester och aa statistik ivolverade bi- eller multimodala data. 6

5. Testa för cirkulär likformighet 5.1 Rayleighs test Ju högre r-värde ma får desto bättre beskriver medelvikel stickprovet, ekvivalet gäller för s-värde (spridig) fast där ger lägre värde bättre beskrivade a. Ett lämpligt test att geomföra för att avgöra om es stickprov är likformigt fördelat, alltså sakar medelvikel, är Rayleightestet. Då ställer vi upp hypotesera H0: Populatioe är likformigt fördelad rut e cirkel mot H1: Populatioe är ej likformigt fördelad. Testet cetreras rut hur stort r-värdet måste vara för att säkerställa e icke likformig distributio. Detta utförs med hjälp av det så kallade Rayleighs R, som ämts tidigare får ma det av produkte av atal observatioer och r-värdet (R = r). Rayleighs R ka seda yttjas för att räka ut Rayleighs z: z = R2 = r2 ( 23 ) Därefter jämför ma resultatet med kritiskt värde av zα., där α är kofidesgrad och atal observatioer, frå tabell för att avgöra om det är sigifikat. För att få fram ett p-värde på Rayleighs R ka ma aväda: P = e ( 1+4+4(2 R 2 ) (1+2)) ( 24 ) När ma utför Rayleightestet atar ma att de uderliggade fördelige är vo Mises, äve kallat cirkulär ormalfördelig och som det låter är det aalogt med lijär ormalfördelig. Om testet resulterar i att vi förkastar H0 iebär det att det fis e medelvikel och om vi ite förkastar H0 ka vi dra slutsatse att stickprovet har likformig fördelig rut cirkel. Det sistämda gäller dock edast om vi ka ata att stickprovet bara har e grupp med data (alltså uimodal). 5.2 V-testet, ett modifierat Rayleigh test Ett modifierat Rayleightest, äve kallat v-test, är helt ekelt ett valigt Rayleigh test med eda skillade att ma har e specifik medelvikel som mothypotes. Lämpligt tillfälle att aväda sig av v-testet är, äu ett exempel frå biologi, om ma ska udersöka vart hougsbi skulle flyga om de blev frisläppta orr om si bikupa. Det aturliga atagadet är då att bia ställer i siktet på deras hem och flyger rakt söder ut (180 ). Då skulle ma ställa upp följade hypoteser, H0: Populatioes riktig är likformigt fördelat rut cirkel, mot H1: Populatioes riktig är ej likformigt fördelat och medelvikel är 180. Eftersom vi gissar 7

e medelvikel, och därmed adderar mer iformatio, är v-testet ågot kraftfullare ä Rayleighs test. När ma seda skall räka på det aväder ma: V = R cos(a a 0) ( 25 ) där a 0 är de förslaga medelvikel. Sigifikase för variabel v erhålls frå: u = V 2 ( 26) Detta jämförs med kritiskt tabellvärde på uα,. 5.3 Ett-stickprovstest för medelvikel Om ma är ute efter att testa ifall ett stickprovs medelvikel (a ) är lika med ett givet värde bör ma göra ett test som är aalogt med ett oe-sample t test. Då ställer ma upp H0: a = a 0 mot H1: a a 0. Seda udersöker ma ifall a 0 ligger iom ett kofidesitervall för a. Ligger det utaför förkastar ma H0. 5.4 Hodges-Aje testet för likformighet Som ett alterativ till Rayleightestet fis det så kallade Hodges-Ajetestet, vilket ej atar ågo specifik fördelig för stickprovet. Det fugerar bra för såväl uimodala som bimodala samt multimodala fördeligar. Om de uderliggade fördelige är vo Mises (cirkulär ormalfördelig), som är förutsättige för att göra Rayleightestet, är också Rayleightestet det starkare av de två. Givet ett stickprov med cirkulära data dras e lije geom cetrum (e diameter) så att differese mella atal observatioer på båda sidora av diameter blir så stor som möjligt. På ea sida har vi så måga observatioer som möjligt meda på adra sida har vi så få som möjligt. Just det atalet, det lägsta, blir viktigt seda är vi skall göra beräkigar så vi kallar det atalet m. P-värdet för ett m mist så litet som det observerade, uder ollhypotese att stickprovet är cirkulärt likformigt, är: P = ( 2m)( m ) 2 1 = ( 2m)! m!( m)! 2 1 ( 27 ) 8

För > 50 ka ma göra följade approximatio: P 2π A e π2 8A 2 ( 28 ) där A = π 2( 2m) ( 29 ) Ma ka äve direkt jämföra es observerade m med ett tabellvärde som ger kritiska värde på m som fuktio av α och. Detta gäller för 9. 5.5 Batschelettestet, ett modifierat Hodges-Aje test På samma sätt som det fis ett modifierat Rayleighs test fis där äve ett modifierat Hodges-Aje test. Det så kallade Batschelet testet fugerar på likade sätt som v-testet, att ma ställer upp e ollhypotes med föreslage medelvikel. Därefter räkar vi atalet observatioer som ligger iom ± 90 frå de föreslaga medelvikel, vi beämer dea variabel m : C = m ( 30 ) Där värdet på det observerade C är det vi seda jämför med kritiskt tabellvärde, där C är e fuktio av α och. 6. Goodess of fit test för cirkulära data 6.1 Chi två test Chi två aväds för att se hur väl e teoretisk cirkulär fördelig stämmer överes med e observerad. Tillvägagågssättet är, som för ett valigt chi två test, att bestämma förvätad frekves för varje observerad. Detta görs geom att dela i det observerade materialet i grupper, till exempel 0-30, 30-60, 60-90 etc., därefter beräka förvätad frekves för varje grupp. Eligt kovetio bör observatioera grupperas så att ige förvätad frekves uderstiger fyra. Grupperas itervall behöver ite vara lika me om de är det (exempelvis 30 som ova) råds följade kriterium vara uppått, /k 2, där är atal observatioer och k är atal grupper. För att slutföra sitt chi två test ska ma beräka testvariabel χ 2 eligt följade: 9

χ 2 = k (f i f i) 2 i=1 ( 31 ) k Där fi är observerad frekves och f i är förvätad frekves. Slutlige jämför ma sitt beräkade χ 2 2 med kritiskt värde χ α,k 1 frå tabell, där α är kofidesgrad och k är atal grupper. Om ma skulle aväda sig utav icke-grupperade data bör ma, istället för chi två, aväds atige Kuipertestet eller Watsos U 2 -test för ett stickprov. 6.2 Watsos U 2 test för ett stickprov Då Watsotestet och Kuipertestet är av likvärdig styrka kommer edast det förstämda testet att redovisas. Det första ma gör är att omvadla sia observerade viklar (ai) geom att dividera respektive vikel med 360. u i = a i 360 ( 32 ) Seda beräkar ma testvariabel Watsos U 2 : U 2 = 2 i=1 u i ( i=1 u i ) 2 2 iu i=1 i + ( + 1)u + 12 ( 33 ) Tills sist jämför ma sitt U 2 med kritiskt värde U α, 2 frå tabell, där α är kofidesgrad och är atal observatioer. 10

7. Problemlösig Neda kommer ågra av metodera att demostreras geom ett exempel. När e ekvatio frå arbetet aväds kommer det att fias e hävisig till höger om uträkige. Detta exempel är baserat på data frå Trasportstyrelse. 7.1 Exempel: Svårt skadade i trafikolyckor åre 2006-2012 Måad ai fi si ai fi si ai cos ai fi cos ai Ja 0 1522 0 0 1 1 522 Feb 30 1435 0,5 717,5 0,866 1 242,7 Mar 60 1505 0,866 1 303,4 0.5 752,5 Apr 90 1824 1 1 824 0 0 Maj 120 2209 0,866 1 913,1-0,5-1 104,5 Ju 150 2722 0,5 1 361-0,866-2 357,3 Jul 180 2564 0 0-1 -2 564 Aug 210 2346-0,5-1 173-0,866-2 031,7 Sep 240 2178-0,866-1 886,2-0,5-1 089 Okt 270 1965-1 -1 965 0 0 Nov 300 1813-0,866-1 570,1 0,5 906,5 Dec 330 1807-0,5-903,5 0,866 1 564,9 Beräkig av medelvikel: = 23 890 Eftersom det är grupperade data måste vi multiplicera med frekvese fi är vi beräkar de rektagulära koordiatera: f i si a i = 378,889 f i cos a i = 3 157,86 Y = f i si a i X = f i cos a i = 0, 01586 ( 4 ) = 0, 13218 ( 3 ) r = X 2 + Y 2 0, 1331 ( 5 ) 11

Beräkar äve det korrigerade r-värdet ty grupperade data: r c = cr = 30 π 360 0, 1345 si( 30 ( 6 ) ) 2 Det korrigerade r-värdet skiljer sig ej mycket frå det ursprugliga ty itervalle på 30 är ej stort og för att påverka avsevärt. si a = Y r = 0,01586 0,1331 = 0, 11913 ( 9 ) cos a = X r = 0,13218 0,1331 = 0, 99288 ( 8 ) Detta ger oss följade medelvikel: a 173 Vi beräkar äve spridige: s 2 = 2(1 r) = 1, 733738 ( 17 ) 12

Figur 1: Schematisk bild över skador i trafike år 2006-2012. De röda lije idikerar medelvikel. Bilde är gjord i R med paketet plotrix. Rayleighs test: H0: Svårt skadade i trafike är likformigt fördelat rut cirkel (året). H1: H0. z = r 2 = 23 890 0, 1331 2 = 423, 23 ( 23 ) Jämför seda med tabellvärdet z 0,05,23 890 = 2,9957, vi ka förkasta H0 på ivå 5 %. Eftersom vi har ett väldigt stort får vi ett oerhört litet p-värde, P < 0,0001 Chi två test: H0: Svårt skadade i trafike är likformigt fördelat rut cirkel (året). 13

H1: H0. k = 12 Ta fram förvätade värde: f i = k = 23 890 12 1 991 χ 2 = k (f i f i) 2 i=1 f i = (1 522 1 991)2 1991 + + (1 807 1 991)2 1991 969, 7 ( 31 ) 2 χ 0,05,11 = 19,675 Förkasta H0 på ivå 5 %. Svårt skadade i trafike är ej likformigt fördelat rut året. 14

8. Refereser Böcker Jerold H. Zar. Biostatistical Aalysis. 5 uppl. Pearso Educatio, Ic. 2010. N. I. Fisher. Statistical aalysis of circular data. Cambridge Uiversity Press. 1993. Webbsidor Dödade och svårt skadade efter lä, måad och år. (seast uppdaterad 2016-02-15) Trasportstyrelse. https://www.trasportstyrelse.se/sv/vagtrafik/statistik-ochregister/vag/olycksstatistik/polisrapporterad-statistik/natioell-statistik/maadsstatistik/ (Hämtad 2016-05-13) 15