Statistisk analys av kundtjänstdata. Statistical analysis of customer service data. - Queuing theory, Entropy analysis, Time series analysis

Relevanta dokument
Fö relä sning 2, Kö system 2015

Markovprocesser SF1904

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Fö relä sning 1, Kö system vä ren 2014

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Övning 1(a) Vad du ska kunna efter denna övning. Problem, nivå A. Redogöra för begreppen diskret och kontinuerlig stokastisk variabel.

M/M/m/K kösystem. M/M/m/K kösystem

Kunna beräkna medelantal kunder för alla köer i ett könät utan återkopplingar.

Tiden i ett tillstånd

Fö relä sning 1, Kö system 2015

Kunna beräkna medelantal kunder för alla köer i ett könät utan återkopplingar. I denna övning kallas ett kösystem som ingår i ett könät oftast nod.

Kunna använda Littles sats för enkla räkningar på kösystem.

Poisson Drivna Processer, Hagelbrus

Matematisk statistik KTH. Formel- och tabellsamling i Matematisk statistik, grundkurs

Föreläsning G60 Statistiska metoder

SF1901 Sannolikhetsteori och statistik I

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

Statistik 1 för biologer, logopeder och psykologer

Kurs: HF1012 Matematisk statistik Lärare: Armin Halilovic

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Fördelningsfunktionen för en kontinuerlig stokastisk variabel. Täthetsfunktionen för en kontinuerlig och en diskret stokastisk variabel.

a) Använd samtal.mat för att beräkna antalet samtal som blir spärrade i de olika cellerna under den givna timmen.

TMS136. Föreläsning 4

Medelvärde, median och standardavvikelse

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL

Krafts olikhet. En momentant avkodbar kod (prefixkod) med kodordslängderna l 1,...,l N existerar om och endast om. 2 l i. 1 i=1

1.1 Diskret (Sannolikhets-)fördelning

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Analys av korstabeller

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Kunna beräkna P (spärr) för system med begränsat antal kunder och köplatser. Kunna beräkna medelantal upptagna betjänare.

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 12: Repetition

1 Stokastiska processer. 2 Poissonprocessen

Ärendehanteringssystem för Solna Stads Kundtjänst

Matematisk statistik för D, I, Π och Fysiker


Tentamen för kursen. Linjära statistiska modeller. 16 augusti

2 Dataanalys och beskrivande statistik

13.1 Matematisk statistik

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Föreläsninsanteckningar till föreläsning 3: Entropi

Statistik 1 för biologer, logopeder och psykologer

Vardagssituationer och algebraiska formler

Ma7-Åsa: Statistik och Sannolikhetslära

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: Sannolikhetslära och statistik

Kunna använda Littles sats för enkla räkningar på kösystem.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Övning 3 Vecka 4,

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901: Sannolikhetslära och statistik

Del I: Digitala verktyg är inte tillåtna. Endast svar krävs. Skriv dina svar direkt i provhäftet.

Tentamen i Matematisk statistik Kurskod S0001M

Optimering av ett kösystem på IKEA Kungens Kurva

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Kunna beräkna spärren i ett M/M/m*upptagetsystem.

Uppgift 1. Deskripitiv statistik. Lön

Föreläsning 12: Regression

Stokastiska processer och simulering I 24 maj

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Kunna definiera laplacetransformen för en kontinuerlig stokastisk variabel. Kunna definiera z-transformen för en diskret stokastisk variabel.

Markovprocesser SF1904

Markovprocesser SF1904

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Introduktion till statistik för statsvetare

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

aug 2017 Kurskod HF1012 Halilovic internet. Betygsgränser: För (betyg Fx). Sida 1 av 13

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

TILLSTÅNDSGRAFEN. Slutligen erhålls den mycket viktiga så kallade Snittmetoden :

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Stokastiska processer och simulering I 24 augusti

Blandade problem från elektro- och datateknik

Analys av samvariationen mellan faktorer som påverkar vattennivåerna i Karlstad

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen MVE301 Sannolikhet, statistik och risk

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Härledning av Black-Littermans formel mha allmänna linjära modellen

import totalt, mkr index 85,23 100,00 107,36 103,76

bli bekant med summor av stokastiska variabler.

b) Vad är sannolikheten att personen somnar i lägenheten? (4 p) c) Hur många gånger förväntas personen byta rum? (4 p)

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Stokastiska signaler. Mediesignaler

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Introduktion till statistik för statsvetare

Transkript:

Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:6 Statistisk analys av kundtjänstdata - Köteori, Entropianalys, Tidsserieanalys Statistical analysis of customer service data - Queuing theory, Entropy analysis, Time series analysis Pernilla Jonsson och Maria Ygge Självständigt arbete 15 högskolepoäng inom Statistik III, VT2014 Handledare: Ove Frank

2

Sammanfattning I denna uppsats har vi applicerat köteoretiska termer på kundtjänstdata från Järfälla kommun. Data är från år 2013 och innehåller 74 383 ärenden. Vi har funnit att ankomstprocessen följer en exponentialfördelning och att betjäningstider och väntetider eventuellt skulle gå att anpassa efter en exponential- eller gammafördelning om fullständigare data kunde erhållas. Detta resulterar i att en enkel och vanligt förekommande modell inom köteori skulle kunna vara lämplig för analys av dessa data. Genom entropianalys har vi hittat samband och beroenden mellan variabler, dessa kan utnyttjas vid förenkling av datamaterialet och kan även underlätta vidare analys. Tidsserieanalys har använts för att studera om trender förekommit under året och då har vi bland annat funnit att det har varit ett högre tryck på kundtjänsten i början av veckan samt under månaderna januari och oktober. De flesta ärenden kundtjänsten behandlade gällde socialtjänsten tätt följt av ärenden gällande bygg och miljö. Nyckelord: Kundtjänstdata, Köteori, Betjäningstider, Väntetider, Markovkedjor, Entropianalys, Tidsserieanalys. Abstract In this paper we have applied queuing theory terms on customer data from the municipality of Järfälla. The data is from the year 2013 and contains 74 383 cases. We found that the arrival process follows an exponential distribution and that the service and waiting times might be adjustable by an exponential distribution or a gamma distribution if more accurate data were available. This shows that a simple and commonly used model of queuing theory could be appropriate for analyzing this data. By using entropy analysis we found relationships and dependencies between variables which can be used to simplify data and also to facilitate further analysis. Time series analysis have been used to study whether trends occurred during the year and we found, among other things, that there were a higher pressure on customer service at the beginning of weeks and during the months of January and October. Most cases that customer service treated was related to social services, followed by cases related to construction and environment. Keywords: Customer data, Queuing theory, Service times, Waiting times, Markov chains, Entropy analysis, Time series analysis. 3

Förord Detta arbete utgör ett självständigt arbete i statistik om 15 hp. Vi vill tacka Järfälla kommun som låtit oss göra vårt arbete i samarbete med dem och då framförallt våra handledare där, Zara Bengtsson och Peter Rösgren. Vi vill även tacka vår handledare på statistiska institutionen, professor emeritus Ove Frank, för givande diskussioner och för sitt engagemang samt Marcus Berg för introduktionen med Järfälla kommuns kundtjänst. 4

Innehållsförteckning 1 Inledning... 7 1.1 Bakgrund till studien... 7 1.1.1 Järfälla kommun... 7 1.1.2 Järfälla kommuns kundtjänst... 9 1.1.3 Studiens syfte... 9 1.2 Genomförande och översikt... 9 2 Köteori och betjäningssystem... 10 2.1 Kundankomster och betjäningsflöden... 10 2.2 Väntetider och betjäningstider... 11 2.3 Kömodeller baserade på Markovkedjor... 11 3 Kundtjänstärenden i Järfälla kommun... 13 3.1 Klassifikation av ärendetyper... 13 3.2 Ärendehandläggning och ärendehantering... 13 3.2.1 Telefonlinjer och ärendehandläggare... 13 3.2.2 Ärendehantering... 14 4 Precisering av undersökningens syfte... 15 4.1 Beskrivning av omfattning och flöden av olika ärenden... 15 4.2 Variation och samvariation för olika variabler... 15 4.3 Jämförelser och trender för olika perioder... 15 5 Data för undersökningen... 16 5.1 Grunddata... 16 5.2 Variabelval... 17 5.3 Variabelförteckning... 17 6 Analys av Järfälla kommuns data... 19 6.1 Entropianalys... 19 6.1.1 Absolut och relativ univariat entropi... 19 6.1.2 Bivariat och gemensam entropi... 20 6.1.3 Multivariat entropi... 21 6.2 Samband och beroenden... 22 6.3 Ankomstprocessen... 30 6.4 Väntetider och betjäningstider... 31 6.5 Jämförelser och trender... 34 7 Diskussion... 38 8 Referenser... 39 Bilaga A: Grunddata... 40 Bilaga B: Kodning... 49 Bilaga C: Trivariat och tetravariat entropi... 53 Bilaga D: Tabeller och diagram... 56 5

6

1 Inledning 1.1 Bakgrund till studien Järfälla kommun har sedan tre år tillbaka samlat data från sin kundtjänst. De vill nu ha hjälp med att få dessa data analyserade för att kunna utveckla sin verksamhet. Som bakgrund till studien ges i 1.1.1 och 1.1.2 en översiktlig beskrivning av kommunen och dess kundtjänstavdelning följt av 1.1.3 där studiens syfte redovisas. 1.1.1 Järfälla kommun Järfälla kommun ligger två mil nordväst om Stockholm. E18, liksom Mälarbanan, går genom hela kommunen och med pendeltåg tar det 20 minuter till Stockholm C [1]. Kommunen är 6 350 hektar stort med en befolkning på 68 210 människor. I Järfälla förmedlas tomter, hus och bostadsrätter i första hand av mäklare. De har ingen egen förmedling av hyresrätter utan hänvisar till privata fastighetsbolag. Antalet bostadsrätter i kommunen är cirka 11 000 och antalet hyresrätter är cirka 8 000. Kommunen är nummer 30 i storleksordning i landet, detta trots att den till ytan är Sveriges åttonde minsta kommun. Järfälla växer med ca 1 000 personer per år - det är bara 17 kommuner i landet som har en större ökning av invånarantalet än vad Järfälla har. På grund av den ökade befolkningen kommer det att byggas fler bostäder. Det kommer även att byggas två nya järnvägsspår mellan Barkarby och Kallhäll detta för att pendeltågen ska kunna gå ännu oftare och med bättre punktlighet än idag. Befolkningen i kommunen består mestadels utav människor i åldrarna 25-64 som utgör cirka hälften av kommunens befolkning. Andelen barn och ungdomar i åldrarna 0-24 utgör cirka 32 procent och andelen äldre utgörs av cirka 17 procent. Det mesta av kommunens budget läggs på grundskola år 1-9 som följs av barn- och äldreomsorg. Järfälla har 20 kommunala grundskolor och fyra fristående. Några av skolorna har profilerat sig med klasser i musik eller idrott och det finns även en skola med undervisning på engelska. Kommunen har ett brett utbud av gymnasieutbildningar, här finns tre kommunala gymnasieskolor och en fristående. Grundskolan har totalt 7 270 helårsplatser och gymnasieutbildningen har 3 637 platser. I grundskolan är det 81 procent som får godkänt i alla ämnen. Järfälla arbetar förebyggande för en bra ungdomsmiljö som är tillgänglig för alla oavsett kön, etnicitet och funktionshinder. De har flera fritidsgårdar och ett rikt föreningsliv med en mängd olika föreningar inom olika intresseområden. Kommunen arbetar för att minska tobaks-, alkohol- och drogvanor bland ungdomar och har haft stora nedåtgående trender de senaste tio åren. 31 940 personer av arbetskraften är förvärvsarbetande, vilket motsvarar 59 procent av befolkningen, med den största andelen hos personer i åldrarna 35-44 år. Den största arbetsgivaren i kommunen är Järfälla kommun följt av Saab, Arla och IKEA. Den totala andelen arbetslösa i kommunen är 5,3 procent där en stor del utgörs av utrikesfödda. Omkring 2 000 människor är i behov av äldreomsorg. Socialnämnden i Järfälla verkar för att äldre människor ska kunna leva och bo självständigt under trygga förhållanden och ha en aktiv och meningsfull tillvaro i gemenskap med andra, och de har som ambition att de äldre ska kunna bo kvar i sina hem även om ålder och sjukdom ger funktionshinder. 7

Bild 1.1: Karta över Järfälla kommun 8

1.1.2 Järfälla kommuns kundtjänst Kundtjänstens uppdrag är att ge service åt kommunens invånare och deras målsättning är att förbättra kvaliteten och effektiviteten i kommunens service till såväl invånare som kommunens personal [2]. Uppdraget specificeras dels i ledningskontorets uppdragsbeskrivning, dels i överenskommelser med förvaltningarna. Kommunfullmäktige i Järfälla beslutade år 2008 att anta en e-strategi för kommunens utveckling under en period som sträckte sig fram till år 2012. En av insatserna i strategin innebar att en kommungemensam kundtjänst skulle skapas och att man skulle jobba mot fyra mål för kundtjänsten: Att öka servicegraden till brukare; Att få en snabbare handläggning även av mer komplicerade ärenden; Att öka kvaliteten och effektiviteten i handläggningen av ärenden; Att minska kostnaderna för den totala ärendehandläggningen. Som en vidareutveckling av denna strategi vill kommunen undersöka insamlad data från år 2013. 1.1.3 Studiens syfte Med hjälp av statistiska metoder ska vi undersöka om det finns statistisk information i datamaterialet från ärendehanteringssystemet som kan utnyttjas för att förbättra kundtjänstarbetet. Vårt fokus ligger på att ge en beskrivning av omfattning och flöden av olika ärenden, att hitta samband och beroenden mellan variabler samt att studera trender för olika perioder. 1.2 Genomförande och översikt Den statistiska institutionen på Stockholms universitet arbetar aktivt med att skapa samarbeten mellan universitetet och kommuner, myndigheter och privata aktörer för att ge studenter en möjlighet att få skriva sitt självständiga arbete tillsammans med en tredje part. Kontakten med Järfälla kommun har förmedlats genom adjunkt Marcus Berg. På Järfälla kommun har vi haft kontakt med Zara Bengtsson som är utbildningsansvarig och Peter Rösgren som är IT-ansvarig. Vår handledare har varit Ove Frank som är professor emeritus vid Stockholms universitet. Av Järfälla kommuns tre års insamlade data har vi fått tillgång till data från år 2013. Kommunen använder sig av ett system som heter Flexite BPMS, ett system för kontaktcenter som är anpassat för affärslösningar gällande ärendehantering [3]. Data består av 74 383 kontakter med kundtjänst och varje ärende beskrivs av 31 olika uppgifter. Uppsatsen är strukturerad enligt följande. I avsnitt 2 kommer vi ta upp allmänna statistiska begrepp för köteori och betjäningssystem. Dessa ligger till grund för avsnitt 3 där vi beskriver kundtjänstärenden i Järfälla kommun. I avsnitt 4 kommer vi att precisera syftet med vår studie för att sedan i avsnitt 5 gå igenom det datamaterial som vi har fått tillgång till. I avsnitt 6 analyseras ärendedata med hjälp av så kallad entropianalys som är en statistisk metodik anpassad för att mäta information och hitta samband och beroenden. En kortfattad beskrivning av teorin bakom metodiken inleder analysen. I detta avsnitt kommer vi även att studera ankomstprocessen, betjäningstider och väntetider samt trender över olika perioder. 9

2 Köteori och betjäningssystem Köteori är läran om köer ur ett matematiskt perspektiv [4, 5, 6]. Köerna har ett stokastiskt tillflöde och utflöde givet ett antal ärendehandläggare. Den stokastiska teorin grundades redan i början på 1900-talet av den danske ingenjören A.K. Erlang. Teorin går ut på att konstruera en modell så att kölängder och väntetider kan förutsägas. Grundidén för köteorin kan kortfattat beskrivas enligt följande: Kunder kommer till ett betjäningsställe med en viss intensitet, λ. Kunderna kan tvingas vänta och bildar då en kö eller lämnar systemet. Kunderna betjänas. Kunderna lämnar betjäningsstället, ärendet är avslutat. Bild 2.1: Grundidé för köteori Ankomstprocess med intensitet λ Kö Betjäning Ärende avslutat Lämnar kön För att visa på ett simpelt exempel så kan en privatpersons telefon betraktas som ett betjäningssystem med en betjäningsstation. Ankomstprocessen består av de personer som ringer och betjäningstiden svarar mot längden av ett telefonsamtal. När en person ringer så kan tre saker ske: ingen svarar, det är upptaget eller samtalet påbörjas. 2.1 Kundankomster och betjäningsflöden Kundankomster kan beskrivas som en stokastisk process över hur kunder kommer till betjäningsstationer. I en Poissonprocess med intensiteten λ är avstånden mellan händelserna kunderna oberoende och exponentialfördelade. När det kommer till att ta kontakt med kundtjänst via telefon så blir kunderna placerade i en telefonkö där de väntar tills dess att de når fram till en ärendehandläggare som kan betjäna dem eller tills de tröttnar på att vänta och lämnar telefonkön. Når kunderna fram till en ärendehandläggare knappar denne handläggare in och hämtar information som är relaterad till kunderna och deras frågor. Det finns flera sätt som ordningen i kön kan hanteras på, de vanligaste är: FIFO (first-in, first-out). Denna princip säger att kunderna betjänas en åt gången samt att kunden som först kom in i kön ska betjänas först. LIFO (last-in, first-out). Även denna princip säger att kunderna betjänas en åt gången men enligt denna princip ska kunden som sist kom in i kön betjänas först. 10

Prioritet. Denna princip säger att kunderna med hög prioritet ska betjänas först. Slumpmässig ordning. 2.2 Väntetider och betjäningstider Man beskriver ofta ett kösystem kortfattat enligt Kendalls beteckningssystem: A/B/c 2.1 där A anger ankomstprocessen, B anger betjäningstidsfördelningen och c är antalet betjäningsstationer. Ibland betecknar man enligt G/G/c där G står för generell fördelning. Belastningen av systemet kan mätas genom trafikintensiteten som mäter förhållandet mellan ankomsthastigheten, λ, och servicegraden, µ. Ankomsthastigheten är antal ankomster per tidsenhet och servicegraden hos systemet är summan av servicegraderna för betjäningsstationerna där varje servicestation har en servicegrad som definieras som antal avslutade betjäningar per tidsenhet. Detta förhållande spelar en betydande roll när det kommer till att mäta prestationen av betjäningssystemet och ges av: ρ = trafikintensitet = λ. 2.2 cµ Om man begränsar antalet betjäningsstationer till endast en, det vill säga c = 1, kan belastningen tolkas som sannolikheten att betjäningsstationen arbetar. Om c 1 kan belastningen tolkas som den förväntade proportionen av betjäningsstationerna som arbetar. Trafikintensiteten härrör från ett av de mest användbara förhållandena i köteori som kallas Little s formel (J.D.C. Little 1961). Formeln säger att givet stadiga förhållanden kommer det genomsnittliga antalet kunder, L, i ett kösystem vara lika med ankomsthastigheten, λ, multiplicerad med den förväntade väntetiden, W: 2.3 Kömodeller baserade på Markovkedjor L = λw. 2.3 Med ankomster enligt en Poissonprocess och handläggning enligt en exponentialfördelning kan vi använda oss av kömodeller baserade på Markovkedjor [7]. För dessa modeller finns omfattande matematiska analyser och användbara resultat. Man använder en terminologi med födelse- och dödsprocesser för att beskriva ankomster av samtal samt avslut av dessa. Den enklaste kömodellen kallas M/M/1. Det första M:et står för Markov eller minneslös och anger frekvensen för inkommande ärenden i systemet och antas vara Poissonfördelad. Det andra M:et står för servicetiden hos betjäningsstationerna, det vill säga vad den genomsnittliga tiden för ett telefonsamtal är, och antas vara exponentialfördelad. Siffran 1 står för att det endast är en ärendehandläggare som tar 11

emot kunderna genom principen först in, först ut. När ärendet är avslutat så lämnar kunden kön och antalet kunder i kön minskar med en. Kön har ingen begränsning på antalet kunder som kan vänta. Låt λ vara ankomsthastigheten och μ servicegraden. Att antalet kunder N(t) som anländer i tidsintervallet (0, t] har en Poissonfördelning innebär att: λt (λt)j P[N(t) = j] = e j! där j = 0,1,2,.. 2.4 Det innebär även att tiden, T, mellan konsekutiva ankomster har en exponentialfördelning med sannolikhetstätheten: a(t) = λe λt där t > 0. 2.5 Vi antar att servicetiden, S, har en exponentialfördelning med sannolikhetstätheten: b(s) = μe μs där s > 0. 2.6 Med dessa antaganden får vi att T och S har väntevärdena: ET = 1 λ 2.7 och ES = 1 μ. 2.8 Trafikintensiteten, förhållandet mellan ankomsthastigheten och servicegraden, i en M/M/1 modell är ρ = λ = ES, det vill säga förhållandet mellan förväntad servicetid och μ ET förväntad tid mellan ankomster. M/M/1 modellen kan generaliseras på flera sätt. Den enklaste och mest använda modellen med mer än en betjäningsstation är M/M/c, också kallad Erlang-c modellen. Precis som i en M/M/1 modell antas kundernas ankomsttider följa en Poissonprocess och servicetiderna antas ha en exponentialfördelning. Antalet handläggare, c, som betjänar kunderna antas arbeta oberoende av varandra och kunderna placeras i en och samma kö där den som väntat längst i kön får handläggning först (först in, först ut principen). Ingen ärendehandläggare är inaktiv så länge som det finns kunder som väntar på betjäning. I M/M/1 och M/M/c modellerna antas en oändlig kökapacitet. I de flesta situationer är det dock vanligare med ändliga köer och dessa situationer kan beskrivas med M/M/c/K modellen där K står för kapacitetsbegränsning. Ju större kapacitet systemet har desto mer närmar det sig ett system med en oändlig kö och i sådana fall kan vi ignorera kapacitetsbegränsningen. Även i M/M/c/K modellen följer ankomsterna en Poissonprocess, handläggningen en exponentialfördelning, λ är ankomsthastigheten och µ är servicegraden. Kapacitetsbegränsningen har en gräns K på antalet kunder som kan stå i kö och K c. 12

3 Kundtjänstärenden i Järfälla kommun 3.1 Klassifikation av ärendetyper Kundtjänst använder sig av fyra olika klassificeringar av ärenden. Först väljs en av sex huvudkategorier, kategori 1, sedan väljs en av 41 underkategorier, kategori 2. Ärenden förklaras även av kategorier 3 och 4. För vissa kategori 2 slutar dock kategoriseringen redan vid denna kategori och för vissa kategori 3 slutar den här. Finns det kategorier 3 och 4 måste dessa anges, man kan alltså inte sluta vid exempelvis kategori 2 om det finns en kategori 3. Kategori 2 förklarar ärendet mer specifikt än vad kategori 1 gör, detta gäller även kategori 3 som förklarar det mer specifikt än kategori 2 och så vidare till kategori 4 som mest ingående kan förklara ärendet. För att få en tydligare bild av kategoriseringens uppbyggnad, se bilaga A tabell A.2-A.4. 3.2 Ärendehandläggning och ärendehantering Kommunen använder sig av ett telefonväxelsystem som heter Avaia och som är separerat från ärendehanteringssystemet, Flexite BPMS. I vår undersökning har vi fokuserat på data från ärendehanteringssystemet och kommer därför inte att gå in djupare på hur telefonväxelsystemet fungerar. I 3.2.1 beskrivs hur samtalen fördelas över olika telefonlinjer och hur dessa kopplas till olika avdelningar inom kommunen. Detta stycke följs av 3.2.2 där ärendehanteringen beskrivs. 3.2.1 Telefonlinjer och ärendehandläggare När man ringer till Järfälla kommuns kundtjänst får man välja mellan fem olika tonval. Dessa tonval fördelas över fyra olika telefonlinjer. Telefonlinje 1 (tonval 1 och 2) har hand om ärenden gällande socialtjänsten; telefonlinje 2 (tonval 3) har hand om ärenden gällande barn och ungdom, skola och fritid samt utbildning; telefonlinje 3 (tonval 4) har hand om ärenden gällande bygg och miljö; telefonlinje 4 (tonval 9) har hand om ärenden främst gällande kommunstyrelseförvaltningen men har även hand om allmänna frågor. Samtal besvaras genom att den som väntat längst i respektive telefonlinje blir besvarad först, enligt en så kallad först in, först ut princip. Under år 2013 jobbade 13 ärendehandläggare på telefonlinje 1, på telefonlinje 2 jobbade 6 ärendehandläggare och på telefonlinje 3 och 4 jobbade 14 ärendehandläggare på vardera. Totalt fanns det alltså 47 anställda ärendehandläggare. Utöver dessa arbetade även en konsumentvägledare på kommunen som inte hade något direktval i telefonväxelsystemet och det förekom även att man av olika anledningar tog in vikarier. Öppettider för telefonlinjerna var måndag till torsdag 8.00 16.45 och fredag 8.00 16.00. Under sommartid var linjerna öppna måndag till torsdag 8.00 16.30 och fredag 8.00 15.00. Dag före röd dag var linjerna öppna 8.00 13.00. Förutom ärenden via telefonsamtal kan kundtjänsten även ta emot ärenden via e-post. E-post kan inkomma till kundtjänst dygnet runt men behandlas sedan på samma sätt som telefonsamtalen. Vi har ingen uppgift i datamaterialet som särskiljer dessa ärenden åt och kommer därför behandla alla ärenden på samma sätt i vår analys. 13

3.2.2 Ärendehantering När ett samtal inkommer skapar ärendehandläggaren ett ärende i ärendehanteringssystemet, ärendet registreras, och sedan följer ett antal olika aktiviteter under ärendets gång. I första steget efter registrering kan man välja att skicka vidare ärendet för svar och åtgärd av förvaltning, man kan parkera ärendet för att besvara det senare (exempelvis för att det är högt tryck på telefonlinjerna eller för att ärendehandläggaren behöver mer tid och information), man kan koppla samtalet vidare till kollegor eller externt, eller så löses ärendet direkt, FCR (First call resolution). Se flödesschema, bild 3.1. Om ärendet skickas till förvaltningen så tar en ärendehandläggare där hand om ärendet för att besvara och avsluta det. Om ärendet har blivit parkerat har det flera olika vägar det kan gå. Det kan skickas vidare till förvaltning och då hanteras på samma sätt som ett ärende som skickats dit direkt. Kundtjänst kan även behöva återkoppla till kunden för mer information. Om det går att besvara ärendet efter att man har fått mer information så avslutas det, men det kan även vara så att man vill följa upp ärendet för att se om det har löst sig för kunden innan det avslutas. Ett ärende kan även vara parkerat enbart för att ärendehandläggaren vill följa upp ärendet innan det avslutas, eller så kan ett parkerat ärende besvaras och avslutas av kundtjänst utan återkoppling och uppföljning. Sista vägen ett parkerat ärende kan ta är att kopplas till en kollega på kundtjänsten eller att kopplas vidare externt om ärendehandläggaren inte anser att det är ett ärende för kommunen. När ett ärende har avslutats kommer det beskrivas av totalt 31 olika uppgifter, dessa finns beskrivna i avsnitt 5.1 som behandlar grunddata. Bild 3.1: Flödesschema Registrera Parkera (Besvara senare) Svar/åtgärd av förvaltning Återkoppling (av kundtjänst) Uppföljning (av kundtjänst) Avslutat av förvaltning Avslutat av kundtjänst Kopplat samtal FCR Löst direkt 14

4 Precisering av undersökningens syfte 4.1 Beskrivning av omfattning och flöden av olika ärenden Ett syfte med undersökningen är att få kontroll på betjäningstider och väntetider. I datamaterialet saknas en uppgift om när ärendet avslutades och vi har även upptäckt felaktigheter i tiderna. Resultaten för betjäningstider och väntetider måste därför tolkas med försiktighet. Analysen visar ändå hur man principiellt skulle kunna göra om man hade tillförlitliga uppgifter om dessa tider. 4.2 Variation och samvariation för olika variabler Med hjälp av entropianalys ska vi undersöka hur de olika variablerna förhåller sig till varandra. Vi kan då finna stokastiska beroenden och funktionella samband. Genom detta kan vi se vilka variabler som förklarar varandra, därmed kan vi förenkla vårt datamaterial och underlätta vidare analys. 4.3 Jämförelser och trender för olika perioder Ytterligare ett syfte med undersökningen är att jämföra olika perioder såsom månader, veckodagar och tid på dygn för att se om det finns några trender i de typer av ärenden som kommer in till kundtjänst samt hur arbetsbelastningen är fördelad. Genom att studera trender för olika perioder kan kommunen anpassa sin verksamhet och enklare nå sina effektiviseringsmål. 15

5 Data för undersökningen 5.1 Grunddata Datamaterialet består av 74 383 kundtjänstärenden från år 2013. Varje ärende beskrivs av en datapost med 31 olika uppgifter. Kodnamnen är de beteckningar som används i ärendehanteringssystemet. I tabell 5.1 nedan ges en kortfattad beskrivning av dessa uppgifter. För en utförligare beskrivning se bilaga A, tabell A.1. Tabell 5.1: Grunddata Variabel Kodnamn Beskrivning X1 Oreg_ID ID-nummer. X2 Last_update När posten i statistikdatabasen senast uppdaterades. X3 Flt_active Anger om ärendet är verkligt eller om det är ett testärende. X4 Is_deleted Anger om ärendet är borttaget. X5 Seq_number Ärendenummer. X6 Attr_12098 Ärendedatumet, datumet och tidpunkten när ärendet kom in. X7 Attr_12104 Kategori 1. X8 Attr_12105 Kategori 2. X9 Attr_12103 Kategori 3. X10 Attr_13258 Kategori 4. X11 Attr_12075 Beslut om flöde. X12 Attr_13653 Klagomål. X13 Attr_13678 Klagomål avancerad. X14 Status Aktivitetsstatus. X15 Inner_status Inre status. X16 S_by_451 Parkerad kvitterad av. X17 Initiator Rapportör, ärendehandläggaren som tagit emot ärendet. X18 A_dt_451 Parkera ankomstdatum. X19 A_dt_455 Svar/åtgärd av förvaltning ankomstdatum. X20 S_dt_451 Parkera kvitterad datum. X21 S_dt_455 Svar/åtgärd av förvaltning kvitterad datum. X22 Attr_12084 Ärenderubrik. X23 Lt_449 Ledtid totalt. X24 Lt_451 Ledtid parkera. X25 Lt_455 Ledtid svar/åtgärd av förvaltning. X26 Lt_av_449 Ledtid tillgänglig totalt. X27 Lt_av_451 Ledtid tillgänglig parkera. X28 Lt_av_455 Ledtid tillgänglig svar/åtgärd av förvaltning. X29 Lt_pr_449 Ledtid pågående totalt. X30 Lt_pr_451 Ledtid pågående parkera. X31 Lt_pr_455 Ledtid pågående svar/åtgärd av förvaltning. 16

5.2 Variabelval Innan datamaterialet analyseras väljer vi ut de variabler som vi vill behålla. Vissa variabler behålls i sin ursprungliga form medan redigering genomförs för de andra variablerna där antalet alternativ för dessa minskas. Redigering görs beroende på hur frekvenserna fördelas över variablerna. De variabler vi har valt att behålla i sin ursprungliga form är X18-X21. Vi har även valt att behålla X11, X14, X16, X17 och X23 X31 men för dessa variabler har vi redigerat antalet alternativ samt skapat en ny kodning. Vad gäller X23-X31 så har tiderna för dessa variabler gjorts om från del av dygn till minuter och vi har även tagit bort gallringstiden. I våra grunddata hade vi fyra olika kategoriseringar, X7 X10. För att förenkla våra data har vi valt att endast behålla X7 och X8 av dessa, det vill säga kategori 1 och 2. Vi tror inte att vi kommer tappa information genom att utesluta kategori 3 och 4 eftersom dessa hade många olika utfall med få observationer på vardera. Vi har delat upp X6, ärendedatum, i två nya variabler: en bestående av datum och den andra bestående av tidpunkt. Vi har även skapat tre nya variabler: en som beskriver vilken veckodag ärendet kom in, en annan som beskriver vilken vecka det var samt en tredje som beskriver vilken månad. Vi har skapat två dummyvariabler (variabler som endast antar två värden): den ena beskriver om ärendet registrerades på för- eller eftermiddagen och den andra beskriver om dagen ärendet registrerades på var en halvdag eller inte. Vi har beräknat differenser mellan variabler X20 och X18 och mellan X21 och X19. Efter beräkning av dessa fann vi att differenserna mellan X20 och X18 överensstämde med variabel X24 och att differenserna mellan X21 och X18 överensstämde med variabel X25. Därför utesluter vi våra beräknade differenser från analysen och håller oss till de ursprungliga variablerna X24 och X25. Det fanns sju testärenden under X3 som vi har tagit bort från datamaterialet. Vi har även tagit bort tre ärenden på grund av felregistrering hos kundtjänst. Efter borttagningen av dessa finns det 74 373 ärenden i datamaterialet. 5.3 Variabelförteckning Tabell 5.2: Variabelförteckning Variabel Ursprunglig variabel Kommentar Y1 - Observationens nummer, 1-74373. Y2 X7 Här med kodningen 1-6 vilka finns beskrivna i bilaga B. Y3 X8 Här med kodningen 1-41 vilka finns beskrivna i bilaga B. Y4 X11 Här indelade i tre alternativ vilka finns beskrivna i bilaga B. För frekvenstabell, se bilaga D. Y5 X14 Här indelade i fyra alternativ vilka finns beskrivna i bilaga B. För frekvenstabell, se bilaga D. 17

18 Y6 X16 Här indelade i svarsgrupper 1-5 av sekretesskäl. Ärenden som inte har parkerats blir här kodade 0. Beskrivning av kodningen visas i bilaga B. Y7 X17 Här indelade i svarsgrupper 1-6 av sekretesskäl. Beskrivning av kodningen visas i bilaga B. Y8 X18 - Y9 X19 - Y10 X20 - Y11 X21 - Y12 X23 Här avrundad uppåt till närmaste minut och indelad i 10 intervaller vilka finns beskrivna i bilaga B. Y13 X24 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y14 X25 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y15 X26 Här avrundad uppåt till närmaste minut och indelad i 10 intervaller vilka finns beskrivna i bilaga B. Y16 X27 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y17 X28 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y18 X29 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y19 X30 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y20 X31 Här avrundad uppåt till närmaste minut och indelad i 11 intervaller vilka finns beskrivna i bilaga B. Y21 X6 Tidpunkten ärendet kom in. Visas i timme: minut: sekund. Exempel 10:59:45. Y22 X6 Datumet ärendet kom in. Visas i år-månad-dag. Exempel 2013-10-18. Y23 X6 Veckodagen ärendet kom in, måndag-fredag. Kodas 1 för måndag, 2 för tisdag osv. Y24 X6 Veckan ärendet kom in, 1-53. Kodas 1 för vecka 1, 2 för vecka 2 osv. Y25 X6 Månaden ärendet kom in, 1-12. Kodas 1 för januari, 2 för februari osv. Y26 - Dag innan helg, halvdag. Kodas 1 för halvdag, annars 2. Y27 X6 Ankomstintervall, dvs. tidsavståndet mellan ärendets ankomsttid från närmast föregående ärendes ankomsttid. Det betyder att dagarnas första ärende inte har något intervall, dessa kodas 0. P.g.a. de relativt få intervaller med tider större än 9 minuter har vi valt att enbart behålla intervaller 0-1, 1-2,, 8-9 i vår analys. Kodas 1 för intervall 0-1, 2 för intervall 1-2,,9 för intervall 8-9. Y28 X6 Om ärendet ankom på förmiddag eller eftermiddag. Förmiddag kodas 1 och är ärenden som ankommit innan klockan 12.00 och eftermiddag kodas 2 och är ärenden som ankommit klockan 12.00 och efter.

6 Analys av Järfälla kommuns data 6.1 Entropianalys Genom att hitta samband och beroenden mellan variabler kan vi förenkla datamaterialet och undersöka vilka variabler som ska ingå för vidare behandling. Vi har valt att använda oss av entropianalys, en metod väl anpassad för detta. Entropianalys kan användas för att beskriva ordning och oordning eller koncentration och spridning [8, 9, 10]. Entropin av en viss variabel är som högst logaritmen av dess antal utfall, r. En hög entropi konstaterar antingen hög oordning eller stor spridning, medan en låg konstaterar det motsatta. Med entropianalys kan stokastiska beroenden och funktionella samband upptäckas. Det går inte att bestämma vilken natur ett stokastiskt samband har men man kan med funktionella samband finna att variabler förklarar varandra. Detta betyder att en eller flera variabler i datamaterialet kan vara överflödiga. Entropianalys kan delas upp i univariat, bivariat och multivariat entropi. 6.1.1 Absolut och relativ univariat entropi Den univariata entropin kan beräknas för att se om det finns variabler som kan anses vara konstanta eller likformigt fördelade. Om en variabel har en entropi som är noll eller nära noll så finns det ingen spridning inom variabeln och denna kan därför behandlas som konstant och uteslutas från analysen. Likformighet kan vid behov testas mot data. Absolut univariat entropi, H(X), för en diskret stokastisk variabel X beräknas enligt som gäller för 0 < p x 1 och uppfyller olikheterna H(X) = r 1 x=1 p x log 2 6.1 p x 0 H(X) log 2 (r). 6.2 För att vidareutveckla olikhet 6.2 för absolut univariat entropi kan vi beräkna den relativa univariata entropin. Detta mått gör det enklare att kunna jämföra de olika variablerna. Relativ univariat entropi, H (X), beräknas enligt H (X) = H(X) log 2 (r) 6.3 som gäller för r > 1 och uppfyller olikheterna 0 H (X) 1. 6.4 För den relativa entropin gäller att den är lika med 0 om, och endast om, X är konstant samt att den är lika med 1 om, och endast om, X är likformigt fördelad. 19

6.1.2 Bivariat och gemensam entropi För att undersöka samband mellan variabler beräknas den bivariata entropin. Den bivariata entropin för två variabler X och Y med utfall x = 1,2,, r och y = 1,2 s beräknas enligt r s 1 x=1 y=1 6.5 p x,y H(X, Y) = p x,y log 2 som gäller för 0 < p x,y 1 och uppfyller olikheterna H(X) H(X, Y) H(X) + H(Y). 6.6 Om, och endast om, H(X) = H(X, Y) finns det ett funktionellt samband där X förklarar Y. Detta betecknas X Y och då gäller att H(Y) H(X). Om detta gäller likhet så är X och Y ekvivalenta och förklarar varandra vilket betecknas X Y. Om, och endast om, H(X, Y) = H(X) + H(Y) innebär det att X och Y är oberoende av varandra. Detta betecknas X Y. Efter beräkning av de univariata och bivariata entropierna skapas en entropimatris med de m variabler som ingår i analysen. De univariata entropierna, H(X i ) = H i, visas i diagonalen i matrisen medan de bivariata visas under dessa. De bivariata entropierna, H(X i, X j ) = H i,j, är symmetriska, det vill säga H i,j = H j,i där i = 1,2,, m och j = 1,2,, m. Med hjälp av entropimatrisen beräknas sedan gemensam entropi, J, som används för att mäta stokastiska samband mellan två olika variabler. Gemensam entropi beräknas enligt och uppfyller olikheterna J i,j = H i + H j H i,j 6.7 0 J i,j min(h i, H j ). 6.8 Likheten J i,j = 0 innebär att X i och X j är stokastiskt oberoende av varandra. Likheten J i,j = H i innebär att X i kan förklaras med hjälp av X j, det vill säga att det finns ett funktionellt samband. Detta betecknas X j X i. Likheten J i,j = H j innebär att X j kan förklaras med hjälp av X i, det vill säga att det finns ett funktionellt samband. Detta betecknas X i X j. Efter beräkning av J-värdena skapas en matris, J-matrisen. De univariata entropierna, H(X i ) = H i, visas i diagonalen i matrisen medan J-värdena visas under dessa. J-matrisen är precis som entropimatrisen symmetrisk. Därefter skapas en frekvenstabell med J i,j rangordnade i avtaganade ordning för att enklare kunna se vilka variabler som har starka stokastiska samband och vilka som är oberoende. 20

För att visuellt se relationen mellan variabler kan man med hjälp av J-matrisen och frekvenstabellen rita grafer där variabler representeras av noder och relationer representeras av länkar. Det är upp till analytikern i fråga att bestämma ett kritiskt värde på J i,j, väljer man att minska värdet så kommer antalet samband att öka i och med olikheten 6.8. Det optimala är att få fram grupper av variabler med tydliga samband inom grupper men inga samband mellan grupper. För att undersöka om det finns funktionella samband mellan två olika variabler, X i och X j där i j, beräknas förklaringsgraden A enligt och den uppfyller olikheterna A i,j = H i H i,j 6.9 0 A i,j 1. 6.10 Om, och endast om, A i,j = 1 kan X j förklaras av X i, det vill säga att det finns ett funktionellt samband vilket betecknas X i X j. Om ett sådant samband finns kan X j möjligen antas vara överflödig. Dessa A-värden ställs upp i en A-matris. Diagonalen i matrisen består av förklaringsgrader som alltid har värdet 1, det vill säga varje variabel förklarar sig själv till 100 procent. Under och över dessa visas A-värden mellan olika par av variabler. För varje par av variabler finns det två värden för A, ett för A i,j och ett för A j,i, vilket betyder att A i,j inte behöver vara lika med A j,i. Till skillnad från entropimatrisen och J- matrisen är därför denna matris inte symmetrisk utan visar samband för hur X i påverkar X j och tvärtom. Höga eller låga A-värden ger en uppfattning om det finns starka eller svaga funktionella samband mellan de två olika variablerna som undersöks. I de fall A i,j antar värdet 1 eller nära 1 kan man dra slutsatsen att X j förklaras av X i. Om A i,j = A j,i betyder det att X i påverkar X j lika mycket som X j påverkar X i. 6.1.3 Multivariat entropi Den högre ordningens entropianalys ger en möjlighet att undersöka samband mellan fler än två variabler. Genom olika jämförelser mellan de uni-, bi- och trivariata entropierna kan man undersöka om två variabler gemensamt förklarar en tredje variabel, om två variabler är oberoende betingat av en tredje variabel, eller om ett par av variabler är oberoende av en tredje variabel. Generaliseringar till undersökningar av fler än tre variabler åt gången är också möjliga genom analys av multivariata entropier av högre ordning. I bilaga C ges några formler för tri- och tetravariata entropier som är användbara i dessa sammanhang. 21

6.2 Samband och beroenden De variabler vi valt att använda oss av i entropianalysen finns beskrivna i tabell 6.1 nedan. Tabell 6.1: Variabelval Variabel Antal utfall r Beskrivning Y2 6 Huvudkategori. Y3 41 Underkategori. Y4 3 Beslut om flöde. Y5 4 Status. Y6 6 Parkerad kvitterad av. Y7 6 Rapportör. Y12 10 Betjäningstid totalt. Y13 11 Betjäningstid parkering. Y14 11 Betjäningstid förvaltning. Y15 10 Betjäningstid tillgänglig totalt. Y16 11 Betjäningstid tillgänglig parkering. Y17 11 Betjäningstid tillgänglig förvaltning. Y18 11 Betjäningstid pågående totalt. Y19 11 Betjäningstid pågående parkering. Y20 11 Betjäningstid pågående förvaltning. Y23 5 Veckodag. Y25 12 Månad. Y26 2 Dag innan helg, halvdag. Y27 10 Ankomstintervall. Y28 2 Förmiddag/eftermiddag. Antal möjliga kombinationer för ett datamaterial som består av m stycken olika m variabler kan beräknas via i=1 r i där r i är antal utfall för varje variabel X i, i = 1,2,, m. Detta innebär att vi har 4,97 10 17 antal möjliga kombinationer i vårt datamaterial. De allra flesta av dessa förekommer dock inte och entropianalysen används för att närmare undersöka hur många av dessa som förekommer i väsentlig utsträckning enligt en modell som tar hänsyn till statistiska egenskaper hos data. Efter beräkning av de univariata och bivariata entropierna skapas entropimatrisen vilken ges i tabell 6.2. 22

Tabell 6.2: Entropimatris Y2 Y3 Y4 Y5 Y6 Y7 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20 Y23 Y25 Y26 Y27 Y28 Y2 199 Y3 381 381 Y4 300 475 109 Y5 328 499 141 139 Y6 242 420 163 163 56 Y7 262 438 278 305 218 175 Y12 528 705 415 428 376 503 332 Y13 268 447 180 181 84 243 384 72 Y14 361 534 198 229 227 339 442 244 173 Y15 528 705 415 429 377 503 350 386 444 332 Y16 268 447 180 181 84 243 385 79 244 385 72 Y17 361 534 198 229 227 339 443 244 184 442 244 173 Y18 289 468 190 204 132 265 405 149 253 407 150 254 93 Y19 249 429 161 174 79 225 375 96 225 376 97 224 109 53 Y20 256 436 149 179 114 232 380 130 210 381 130 212 110 110 58 Y23 429 611 339 369 286 405 561 301 401 561 301 401 323 282 288 230 Y25 555 735 466 496 413 531 672 429 530 672 429 530 450 410 415 586 358 Y26 211 393 121 151 68 186 344 83 184 344 83 184 105 64 70 241 368 12 Y27 419 601 329 359 276 395 552 292 393 552 292 393 313 272 278 449 577 232 220 Y28 299 480 209 239 155 274 432 171 272 432 170 272 193 152 158 330 457 111 318 100 Entropierna i matrisen är multiplicerade med hundra och avrundade till närmaste heltal. De univariata entropierna visas på diagonalen och de bivariata entropierna visas under dessa. Eftersom entropimatrisen är symmetrisk inkluderas bara hälften. Genom att studera tabellen kan vi se att variabler Y2, Y3, Y7, Y12, Y14, Y15, Y17, Y23, Y25 samt Y27 har en hög univariat entropi vilket innebär att dessa variablers utfall har en stor spridning. Vi kan även se att Y26 har en väldigt låg entropi vilket tyder på att denna variabel är konstant. Om vi studerar de bivariata entropierna finner vi att H(Y3) = H(Y2,Y3) vilket innebär att det finns ett funktionellt samband där Y3 förklarar Y2, Y3 Y2. För att mer tydligt konstatera om en variabel är konstant eller om den har stor variation så kan vi undersöka den relativa entropin som tar hänsyn till antalet utfall i varje variabel. Den relativa univariata entropin ges i tabell 6.3 tillsammans med den absoluta entropin. 23

Tabell 6.3: Univariat entropi Från tabellen kan vi se att variablerna Y12, Y15, Y25 och Y28 är likformigt fördelade då de har en relativ univariat entropi på 100 procent. Med kritiskt värde för relativ entropi på 99 procent kan vi även betrakta Y23 som likformigt fördelad. Vi kan även se att variabel Y26 har en liten absolut och relativ entropi och kan därför antas vara konstant, precis som vi konstaterade genom att undersöka entropimatrisen tidigare. Variabler Y19 och Y20 har även dem en relativt liten absolut och relativ entropi. De univariata entropierna för resterande variabler är relativt stora, vi kan därför inte säga att någon av dessa är konstant. För att visa att en variabel med hög relativ entropi är likformigt fördelad kan vi studera dess frekvensfördelning. Som exempel visar vi frekvenstabellen för variabel Y28. Tabell 6.4: Frekvenstabell för Y28 Variabel Antal utfall r Univariat entropi Absolut Relativ Y12 10 3,32 1,00 Y15 10 3,32 1,00 Y25 12 3,58 1,00 Y28 2 1,00 1,00 Y23 5 2,30 0,99 Y2 6 1,99 0,77 Y3 41 3,81 0,71 Y5 4 1,39 0,70 Y4 3 1,09 0,69 Y27 10 2,20 0,66 Y7 6 1,75 0,68 Y14 11 1,73 0,50 Y17 11 1,73 0,50 Y18 11 0,93 0,27 Y6 6 0,56 0,22 Y13 11 0,72 0,21 Y16 11 0,72 0,21 Y20 11 0,58 0,17 Y19 11 0,53 0,15 Y26 2 0,12 0,12 Y28 Frekvens Procent Förmiddag 39760 53 Eftermiddag 34613 47 Total 74273 100 Frekvenstabellen visar att båda kategorierna i variabel Y28 har ungefär 50 % av den totala frekvensen. 24

För Y12 och Y15 beror den likformiga fördelningen på att vi i redigeringen av datamaterialet själva valde hur de ursprungliga utfallen kombinerades till nya kategorier, vi valde här att låta varje kategori ha cirka 10 procent av den totala frekvensen för respektive variabel. För att undersöka stokastiska samband mellan två olika variabler används den univariata och den bivariata entropin för att beräkna gemensam entropi, J-värden, med ekvation 6.7. Tabell 6.5: J-matris Y2 Y3 Y4 Y5 Y6 Y7 Y12 Y13 Y14 Y15 Y16 Y17 Y18 Y19 Y20 Y23 Y25 Y26 Y27 Y28 Y2 199 Y3 199 381 Y4 8 15 109 Y5 10 21 107 139 Y6 13 17 2 32 56 Y7 112 118 6 9 13 175 Y12 3 8 26 43 12 4 332 Y13 3 6 1 30 44 4 20 72 Y14 11 20 84 83 2 9 63 1 173 Y15 3 8 26 42 11 4 314 18 61 332 Y16 3 6 1 30 44 4 19 65 1 19 72 Y17 11 20 84 83 2 9 62 1 162 63 1 173 Y18 3 6 12 28 17 3 20 16 13 18 15 12 93 Y19 3 5 1 18 30 3 10 29 1 9 28 2 37 53 Y20 1 3 18 18 0 1 10 0 21 9 0 19 41 1 58 Y23 0 0 0 0 0 0 1 1 2 1 1 2 0 1 0 230 Y25 2 4 1 1 1 2 18 1 1 18 1 1 1 1 1 2 358 Y26 0 0 0 0 0 1 0 1 1 0 1 1 0 1 0 1 2 12 Y27 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 220 Y28 0 1 0 0 1 1 0 1 1 0 2 1 0 1 0 0 1 1 2 100 På samma sätt som med entropierna i entropimatrisen är J-värdena i J-matrisen multiplicerade med hundra och avrundade till närmaste heltal. De univariata entropierna visas på diagonalen och de beräknade J-värdena visas under dessa. Eftersom J-matrisen är symmetrisk inkluderas bara hälften. Höga värden visar på starka stokastiska samband medan låga värden visar på svaga. Från J-matrisen ser vi att det är starka stokastiska samband mellan variabler Y2 och Y3, Y2 och Y7, Y3 och Y7, Y4 och Y5, Y12 och Y15 samt Y14 och Y17. Vi kan också se att variabler Y23, Y25, Y26, Y27 och Y28 är oberoende eller nära oberoende av alla andra variabler. Genom att skapa en frekvenstabell för J-värdena får vi information om antalet stokastiska samband som finns för varje observerat J-värde. 25

Tabell 6.6: Frekvenstabell för J-värden J * 100 Frekvens Kumulativ frekvens 314 1 1 199 1 2 162 1 3 118 1 4 112 1 5 107 1 6 84 2 8 83 2 10 65 1 11 63 2 13 62 1 14 61 1 15 44 2 17 43 1 18 42 1 19 41 1 20 37 1 21 32 1 22 30 3 25 29 1 26 28 2 28 26 2 30 21 2 32 20 4 36 19 3 39 18 7 46 17 2 48 16 1 49 15 2 51 13 3 54 12 3 57 11 3 60 10 3 63 9 5 68 8 3 71 6 4 75 5 1 76 4 5 81 3 9 90 2 12 102 1 45 147 0 43 190 26

I och med att höga J-värden visar vilka variabler som har stokastiska samband kan man anta att samma variabler potentiellt har funktionella samband. Det kan dock förekomma funktionella samband mellan variabler som inte har några stokastiska samband och vice versa, varför vi i det bivariata fallet inkluderar alla variabler i vår analys. Genom beräkning med ekvation 6.9 erhåller vi värden för A vilka infogas i tabell 6.7, A-matrisen. Sambanden i A-matrisen visas i procentform. A-värden nära 100 procent visar på starka funktionella samband. Tabell 6.7: A-matrisen Y3 Y25 Y12 Y15 Y23 Y27 Y2 Y7 Y14 Y17 Y5 Y4 Y28 Y18 Y13 Y16 Y20 Y6 Y19 Y26 Y3 100 52 54 54 62 63 100 87 71 71 76 80 79 81 85 85 87 91 89 97 Y25 49 100 53 53 61 62 65 67 68 68 72 77 78 80 83 83 86 87 87 97 Y12 47 49 100 95 59 60 63 66 75 75 78 80 77 82 86 86 87 88 89 97 Y15 47 49 95 100 59 60 63 66 75 75 77 80 77 82 86 86 87 88 88 97 Y23 38 39 41 41 100 51 54 57 57 57 62 68 70 71 76 76 80 80 82 95 Y27 37 38 40 40 49 100 53 56 56 56 61 67 69 70 75 75 79 80 81 95 Y2 52 36 38 38 46 47 100 76 55 55 61 66 67 69 74 74 78 82 80 94 Y7 40 33 35 35 43 44 67 100 52 52 57 63 64 66 72 72 75 80 78 94 Y14 32 33 39 39 43 44 48 51 100 94 76 87 64 68 71 71 82 76 77 94 Y17 32 33 39 39 43 44 48 51 94 100 76 87 64 68 71 71 82 76 77 94 Y5 28 28 32 32 38 39 42 46 61 61 100 99 58 68 77 77 78 85 80 92 Y4 23 23 26 26 32 33 36 39 55 55 77 100 52 57 61 61 73 67 68 90 Y28 21 22 23 23 30 31 33 36 37 37 42 48 100 52 58 59 63 65 66 90 Y18 20 21 23 23 29 30 32 35 37 37 46 49 48 100 62 62 85 70 85 89 Y13 16 17 19 19 24 25 27 30 30 30 40 40 42 48 100 91 55 86 75 87 Y16 16 17 19 19 24 25 27 30 30 30 40 40 42 48 91 100 55 86 74 87 Y20 13 14 15 15 20 21 23 25 28 27 32 39 37 53 45 45 100 51 53 83 Y6 13 14 15 15 20 21 23 26 25 25 85 34 36 42 67 67 49 100 71 82 Y19 12 13 14 14 19 19 21 24 24 24 30 33 35 49 55 55 48 67 100 83 Y26 3 3 3 3 5 5 6 6 7 7 8 10 11 11 14 14 17 18 19 100 I matrisen är variablerna ordnade efter avtagande absoluta univariata entropier. Med denna ordning blir varje värde i övre halvan av matrisen större än eller lika med det symmetriskt belägna värdet i undre halvan. Det kan alltså framkomma förklaringar i övre halvan och om samma värde står symmetriskt i undre halvan har man ekvivalens. Genom att studera matrisen kan vi se att det är en ekvivalens mellan Y12 och Y15, A 12,15 = A 15,12 = 95 %. Detta innebär att det finns ett starkt samband mellan dessa två variabler som är lika stort i båda riktningar. På samma sätt kan vi se att det är en ekvivalens mellan Y13 och Y16 på 91 % och mellan Y14 och Y17 på 94 %. Ena variabeln i respektive variabelpar kan därför tas bort vid fortsatt analys då dessa är överflödiga. Genom att studera matrisen vidare kan vi se att A 3,2 = 100 % vilket innebär att variabel Y3 förklarar variabel Y2 med 100 %. Vi kan även se att A 5,4 = 99 % vilket innebär att 27

variabel Y5 förklarar variabel Y4 med 99 %. Vi kan därför betrakta variabel Y2 som likvärdig med Y3 och variabel Y4 som likvärdig med Y5. Från matrisen kan vi även se att variabel Y26 förklaras väl av många andra variabler vilket beror på att den är så gott som konstant. För att visa vilka variabler som har stokastiska samband ritas grafer för olika kritiska J-värden. I bild 6.1 visas en graf med kritiskt värde J=37. Grafer över beroendestrukturen mellan variabler med kritiska värden J=32, J=30, J=29, J=28 samt J=21 visas i bilaga D tabell D.2. Eftersom vi tidigare i analysen funnit att variabel Y26 är så gott som konstant väljer vi att inte inkludera denna variabel i graferna. Valet av kritiskt värde beror på hur stort J-värde man väljer att acceptera som oberoende. Ju lägre kritiskt J-värde, desto mindre accepteras som oberoende. Vid kritiska gränsen J=37 bildas fyra små komponenter förutom de fyra en-nods komponenterna. Vi kan se att variabler Y3 och Y7 har ett stokastiskt samband och bildar en komponent, precis som variabler Y6 och Y13 som bildar en annan komponent. Variabler Y5, Y12 och Y14 bildar en trippel där alla variabler har ett stokastiskt samband med varandra och vi kan även se att Y18 har ett stokastiskt samband med både Y19 och Y20. Väljer man att minska det kritiska värdet för J kommer antalet samband att öka. Minskar vi det till J=32 kommer två av de små komponenterna att gå ihop med en länk. Vid kritiskt J-värde på 30 stärks detta samband med ännu en länk mellan samma komponenter och även en länk till en av de andra två komponenterna. Vid J=29 och J=28 stärks detta med bibehållande av samma komponenter men vid gränsen J=21 bildas en enda stor komponent förutom de fyra en-nods komponenterna. 28

Bild 6.1: Beroendestruktur mellan variabler med kritiskt J-värde = 37. Stokastiskt samband J 37 Stokastiskt samband J = 37 Förklarar Förklarar varandra Parkeringstider Ärendekategori Y6 Y16 Y7 Y2 Y13 Y3 Betjäningsstatus Y4 Pågående betjäningstider Y5 Y18 Y12 Y14 Y19 Y20 Y15 Y17 Veckodag Månad Ankomstintervall För-/eftermiddag Y23 Y25 Y27 Y28 29

6.3 Ankomstprocessen För att se om ankomsterna följer en Poissonprocess har vi anpassat en exponentialkurva på variabel Y27, ankomstintervall. För att få en så exakt precision som möjligt har vi valt att redovisa variabeln i sekunder och trunkera data till 540 sekunder. Histogrammet skulle se likadant ut för hela data men medelvärdet och standardavvikelsen skulle bli högre på grund av de outliers som finns i datamaterialet. Eftersom trunkeringen täcker in nästan 99 % av alla ärenden får vi ändå ett pålitligt resultat. Att det finns outliers kan exempelvis bero på att det vissa dagar jobbat färre ärendehandläggare än normalt. Det kan vara av intresse att studera dessa outliers separat men vi har valt att inte fördjupa oss i detta. 250 andra ärenden har även tagits bort från beräkningarna eftersom dessa ärenden är de första inkommande ärendena per dag och därför blir startpunkten för intervallberäkningarna. Bild 6.1: Ankomstprocessen anpassad till exponentialfördelning 30

Bild 6.1 visar tydligt att ankomstintervallen följer en exponentialfördelning. Vi får ett medelvärde på 95 sekunder och en standardavvikelse på 94 sekunder. Även dessa siffror visar en bra passning då medelvärdet och standardavvikelsen ska vara lika i en exponentialfördelning. 6.4 Väntetider och betjäningstider I det datamaterial vi har analyserat finns det ingen uppgift om hur länge en kund har väntat innan samtalet nått fram. Det vi avser med väntetid här är således de tider som kunden kan sägas få vänta efter att ärendet har registrerats. Exempelvis, en kund ringer in varpå en ärendehandläggare svarar, ärendehandläggaren kommer under samtalets gång fram till att detta är ett ärende för förvaltning varpå ärendehandläggaren skriver ett meddelande till förvaltningen genom ärendehanteringssystemet. Samtalet och därmed den första betjäningstiden avslutas. Mellan det att ärendet har kommit in till förvaltning och att en ärendehandläggare på förvaltning öppnar ärendet skapas en väntetid. När ärendehandläggaren börjar arbeta med ärendet uppstår en andra betjäningstid som slutar när denne sedan avslutar ärendet. Om man kan tolka vad kommunen kallar ledtider tillgänglig som väntetider och ledtider pågående som betjäningstider så borde följande stämma: - Ledtid totalt, Y12, består av ledtid tillgänglig totalt, Y15, och ledtid pågående totalt, Y18. - Ledtid pågående totalt, Y18, består av ledtid pågående parkera, Y19, och/eller ledtid pågående förvaltning, Y20. - Ledtid tillgänglig totalt, Y15, består av ledtid tillgänglig parkera, Y16, och/eller ledtid tillgänglig förvaltning, Y17. - Ledtid parkera, Y13, består av ledtid tillgänglig parkera, Y16, och ledtid pågående parkera, Y19. - Ledtid förvaltning, Y14, består av ledtid tillgänglig förvaltning, Y17, och ledtid pågående förvaltning, Y20. När vi har gått igenom dessa tider så har siffrorna dock inte stämt. Exempelvis så är de pågående ledtiderna inte pålitliga; de är ofta korta eller noll, vilket kan förklaras av att ärendehandläggarna inte alltid har ärendehanteringssystemet i gång under tiden som de arbetar med ärendena. Vi har även funnit att det finns vissa fördröjningar i systemet som inte går att förklara, exempelvis är Y12 ofta större än Y15 + Y18. Vi har beräknat statistiska mått för variabler Y12-Y14. Eftersom vi fann i avsnitt 6.2 om samband och beroenden att Y15-Y17 är ekvivalenta med Y12-Y14 redovisar vi inte dessa här. I tabell 6.8 visas statistiska mått för variabler Y12-Y14. Från tabellen kan vi se att variablerna har medelvärden som är mycket högre än medianerna vilket innebär att det finns ärenden med avstickande och mycket höga tider som väger upp medelvärdet. 31