MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar A, 15 p Höstterminen 2016 Laboration 1 Övningsuppgifter Baserade på dataseten: discrim_lab.xlsx prisindex.xlsx samt SCB s statistiska databas Syfte: Syftet med den här laborationen är att träna på att använda Excel och R Commander. Att träna på att göra deskriptiva diagram, lära sig att skapa indexserier och sammanvägda prisindex. Att lära sig hur man använder prisindex för deflatering samt att öva på att hämta data från internet.
Innehåll Datasetet discrim_lab... 3 1. Att göra diagram i Excel och R Commander.... 4 1.1 Kvalitativa variabler... 4 A Cirkeldiagram och stapeldiagram i Excel... 4 B Cirkeldiagram och stapeldiagram i R Commander... 5 1.2 Kvantitativa variabler... 6 A Gör ett histogram över priset på medium soda i R Commander... 6 B Gör en boxplot över priset på medium soda i R Commander... 6 C Deskriptiv statistik i R Commander... 6 D Att illustrera samband mellan kvantitativa variabler spridningsdiagram... 6 E Att ladda ner data från SCB s statistiska databaser.... 6 2. Index och tidserier... 8 2.1 Att illustrera tidserier i Excel... 9 2.2 Att skapa indexserier i Excel... 11 2.3 Konsumentprisindex... 12 2.4 Deflatering... 12 Lösningar... 13 1.1 Kvalitativa variabler... 13 A Cirkeldiagram och stapeldiagram i Excel... 13 B Cirkeldiagram och Stapeldiagram i R Commander... 14 Grupperade stapeldiagram i R Commander... 15 1.2 Kvantitativa variabler... 16 A Histogram i R Commander... 16 B Box plot i R Commander... 17 C Deskriptiv statistik i R Commander... 17 D Spridningsdiagram i R Commander... 18 E Att ladda ner data från SCB s statistiska databaser.... 19 2. Index och tidserier... 23 2.1 Att illustrera tidserier i Excel... 23 2.2 Att skapa indexserier i Excel... 24 2.3 Konsumentprisindex... 24 2.4 Deflatering... 27
Datasetet discrim_lab Till första delen av den här övningslaborationen ska ni använda datasetet discrim_lab. Ni hittar det i discrim_lab.xlsx Variabel förteckning: psoda pris på mellanläsk, dollar pfries pris på liten pommes, dollar pentree pris huvudrätt, dollar (hamburgare eller kyckling) nmgrs antal managers hrsopen antal timmar öppettid per dygn. emp antal anställda compown1 =1 om företagsägd compown =yes om företagsägd density befolkningstäthet i staden där restaurangen ligger, invånare per kvadratmiles. crmrte Antal brott per tusen invånare, staden prpblck Antal svarta per tusen invånare, postnummerområdet prppov Antal fattiga per tusen invånare, postnummerområdet prpncar Antal hushåll utan bil per tusen hushåll, postnummerområdet hseval Medianen av huspriserna i postnummerområdet restaurangen ligger i, dollar nstores Antalet affärer i postnummerområdet restaurangen ligger i. income Medianen av hushållens inkomst i postnummerområdet som restaurangen ligger i, dollar. county löpnummer för det county som restaurangen ligger i NJ = 1 för New Jersey = 0 för Pennsylvania State New Jersey eller Pennsylvania chain Namnet på kedjan som restaurangen tillhör logpsoda log(psoda) logpfries log(pfries) logpentree log(pentree) logincome log(income) loghseval log(hseval) logdensity log(density) Source: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401.
1. Att göra diagram i Excel och R Commander. Till att börja med ska du använda filen discrim_lab.xlsx. Filen innehåller data över ett urval av snabbmatsrestauranger i New Jersey och Pennsylvania. Urvalsstorleken är 373. Börja med att ladda ner den från blackboard och spara den på ett USB minne eller ert privata serverutrymme. Det går inte att arbeta med filen så länge den ligger på blackboardservern, ni måste ha en egen kopia. Datan finns på bladet discrim, på bladet Info finns variabelförteckning och källhänvisning. 1.1 Kvalitativa variabler A Cirkeldiagram och stapeldiagram i Excel Börja med att illustrera den kvalitativa variabeln kedjetillhörighet. Denna kvalitativa variabler mäts på nominalskala och det enda vi kan göra är att räkna fram frekvenser och andelar. Till denna typ av variabler används i första hand cirkeldiagram och stapeldiagram. För att kunna göra dessa diagram behöver vi räkna antalet restauranger i varje kedja. Skriv in antalet i de gula cellerna på bladet figures. Tips om du vill slippa räkna för hand: 1. Peka på cellen under rubriken Burger King i bladet figures 2. Välj autosum/ more functions. 3. Välj countif i kategorin Statistical 4. Muspekaren är nu antagligen i det over fältet i dialogrutan (Range) Markera alla celler i kolumnen chain 5. Klicka sedan i det undre fältet (Criteria ) och skriv Burger King (glöm inte citattecknen) 6. Gör likadant för de andra restaurangkedjorna För att göra cirkeldiagram eller stapeldiagram markera de 8 celler i bladet figures där restaurangernas namn och deras antal står. På fliken INSERT hittar ni knapparna att klicka på för att skapa cirkeldiagram och stapeldiagram. Stapeldiagram gör ni med knappen Column och cirkeldiagram med knappen Pie. Experimentera gärna med lite olika utseende på diagrammen. Under Chart Tools kan ni välja Design. Klicka på det diagram ni vill ändra utseendet på så att det är markerat. Prova att klicka på Data Labels i menyn Add Chart element. Här kan ni ange antalet restauranger i diagrammet. Prova att klicka på Chart title i menyn Add Chart element. Här kan ni lägga till en rubrik på ert diagram. Under Change Colors kan ni byta färgerna i diagrammet. Om ni högerklickar på ett diagram får ni lite fler olika alternativ att välja bland.
För att lägga in diagrammen i ett Word dokument: Öppna Word, på fliken INSERT klicka på Screenshot Välj det fönster du vill klistra in en bild ifrån. Du kan därefter högerklicka på bilden och välja beskär för att klippa bort de delar av fönstret du ej vill ha med. Om ni använder Screenshot läggs diagrammen in som bilder. Det brukar vara säkrast. Om ni istället använder copy och paste för att flytta diagram från Excel till Word läggs de in som diagramobjekt och min erfarenhet är att det kan strula ibland. B Cirkeldiagram och stapeldiagram i R Commander Låt oss nu pröva att göra denna typ av diagram i R Commander. För att öppna Excelfilen i R Commander följ instruktionen Att öppna en Excel datafil i En kort instruktion för arbete i R Commander. Det går bra att arbeta från Excelfilen men ni kan också spara datasetet som Rdata fil. Gör så här för att spara datasetet Välj Active data set / Save active data set i Data menyn Ni ska nu illustrera variabeln chain med cirkeldiagram och stapeldiagram. Grupperade stapeldiagram är lite överkurs men prova gärna att göra ett sådant också. Instruktioner finner ni i En kort instruktion för arbete i R Commander.
1.2 Kvantitativa variabler Illustrera nu restaurangernas prissättning av mellan läsk, medium soda. Detta är en kontinuerlig kvantitativ variabel som mäts på kvotskala. För sådana variabler använder vi histogram, frekvens polygon och boxplot. Excel är inte bra på att göra dessa typer av figurer så det gör vi bara i R Commander. Och R Commander har inget kommande för frevenspolygon så vi nöjer oss med histogram och boxplot. A Gör ett histogram över priset på medium soda i R Commander B Gör en boxplot över priset på medium soda i R Commander C Deskriptiv statistik i R Commander Som ett komplement till våra grafer över variabeln price of medium soda (psoda) kan vi också beräkna några numeriska mått. Exempelvis medelvärde, standardavvikelse, skewness och kvartiler. D Att illustrera samband mellan kvantitativa variabler spridningsdiagram Vi ska försöka illustrera om det finns ett samband mellan en restaurangs öppettider och hur många anställda de har. Gör ett spridningsdiagram mellan variablerna hrsopen och emp. Har de restauranger som har långa öppet tider fler eller färre anställda än de restauranger som har korta öppettider? E Att ladda ner data från SCB s statistiska databaser. Vi ska nu göra histogram och boxplot över folkmängden i svenska kommuner 2014. Gå till www.scb.se Klicka på: Hitta statistik och därefter på statistikdatabasen. Klicka på: Befolkning Klicka på: Befolkningsstatistik Klicka på: Folkmängd Klicka på: Folkmängden efter region, civilstånd, ålder och kön. År 1968-2015 Under tabellinnehåll; välj Folkmängd Under region välj kommuner, och klicka sedan på bocken för att markera alla kommuner Under civilstånd ska vi inte markera något alls (då får vi totala folkmängden oavsett civilstånd) Under ålder marker ni ingenting Under kön markerar ni ingenting Under år väljer ni 2014 Under tabellerna finns en rullista intill vilken det står fortsätt, välj Excel (xlsx) med kod och text och klicka sedan på fortsätt. Välj spara fil i dialogrutan som kommer upp.
Vi ska nu flytta era data från Excel till R Commander För att R Commander ka kunna läsa datafilen behöver kolumnrubrikerna ligga i rad 1 och datan börja från rad 2. Detta åstadkommer ni enklast genom att radera de två översta raderna och sedan skriva lämpliga kolumnrubriker i det som då blir rad 1. Exempelvis nummer, namn och folkmängd. Ni måste också radera den informationstext som finns längre ner i Excelfilen så att den enbart innehåller datan. Vill ni ha kvar informationstexten kan det vara lämpligt att spara Excelfilen i två olika namn, ett för ursprungsfilen och en för den ni bearbetat. Öppna den bearbetade filen i R Commander. Nu kan ni beräkna deskriptiv statistik samt göra histogram och boxplot på samma sätt som tidigare. Som ni ser blir diagrammen ganska konstiga eftersom denna fördelning är extremt skev. Ett alternativ kan då vara ett exkludera Stockholm Göteborg, Malmö och Uppsala och ange deras folkmängd i löpande text. Ni kan radera dem från datasetet, men spara först det gamla datasetet så att ni har två olika datafiler. En med alla kommunerna och en med alla kommuner utom de fyra största städerna. Därefter kan ni göra figurer utan Stockholm, Göteborg, Malmö och Uppsala.
2. Index och tidserier Låt oss illustrera den svenska arbetsmarknaden. Först behöver vi då ladda ner data från SCB s hemsida. Vi ska dels använda data över sysselsättningen, dels över arbetslösheten. Ladda ner data över sysselsättningen i Sverige. Gå till www.scb.se Klicka på: Hitta statistik och därefter på statistikdatabasen. Klicka på: arbetsmarknad Klicka på: arbetskraftsundersökningarna AKU Klicka på: sysselsatta från och med 2005 Klicka på: Sysselsatta i arbete 15-74 år (AKU) efter kön och ålder. År 2005-2015 Under tabellinnehåll; välj tusental samt felmarginal ± 1000-tal. Under kön; välj samtliga (klicka på bocken) Under ålder; välj totalt 16-64 år Under år; välj alla år (klicka på bocken) Under tabellerna finns en rullista intill vilken det står fortsätt, välj Excel (xlsx) med kod och text och klicka sedan på fortsätt. Välj spara fil i dialogrutan som kommer upp. Ni ska också ladda ner data över arbetslösa. Klicka på: Hitta statistik och därefter på statistikdatabasen. Klicka på: arbetsmarknad Klicka på: arbetskraftsundersökningarna AKU Klicka på: Arbetslösa från och med 2005 Klicka på: Arbetslösa samt därav heltidsstuderande 15-74 år (AKU) efter kön och ålder. År 2005-2015 Under tabellinnehåll; välj tusental samt felmarginal ± 1000-tal. Under arbetskraftstillhörighet; välj arbetslösa Under kön; välj samtliga (klicka på bocken) Under ålder; välj totalt 16-64 år Under år; välj alla år (klicka på bocken) Under tabellerna finns en rullista intill vilken det står fortsätt, välj Excel (xlsx) med kod och text och klicka sedan på fortsätt. Välj spara fil i dialogrutan som kommer upp.
2.1 Att illustrera tidserier i Excel Skapa ett diagram som visar total sysselsättning i Sverige och som också visar hur pass osäker statistiken är. Det är enklast att göra diagram i Excel om man skapar ett speciellt dataområde för varje diagram. Antingen längre ner på samma kalkylblad eller i ett nytt kalkylblad. För att skapa detta diagram behöver ni tre dataserier. En har ni redan det är den totala sysselsättningen. Sen behöver ni en övre gräns för sysselsättningen ni skapar genom att addera sysselsättning och felmarginal samt en nedre gräns som ni skapar genom att ta sysselsättningen minus felmarginalen. Om ni gjort rätt ska ert dataområde se ut såhär, men observera att lösningsförslagen nedan är ett år gamla, era serier bör sluta 2015 istället för 2014. Markera sedan detta dataområde. På fliken INSERT hittar ni knapparna att klicka på för att skapa linjediagram. Ni ska använda knappen Insert Line Chart och i menyn välja alternativet Line. (Alternativet längs upp till vänster). Se bild nedan. Om ni även markerat årtal och seriernas rubriker från början brukar Excel förstå vad som ska vara serienamn och gradering av X-axeln. Om inte får ni göra enligt instruktionen nedan: Genom att högerklicka på ett diagram och välja Select Data har ni möjlighet att ge serierna namn. Markera serie 1
Klicka på Edit i den vänstra rutan Legend Entries (Eeries) Klicka sedan på den cell där seriens namn anges. Klicka på OK Gör på motsvarande sätt med de andra serierna. Under markera data anger ni också graderingen på x-axeln. Klicka på Edit i den högra rutan Horizontal (Categori) Axis Labels Markera de celler i översta raden där årtalen anges Klicka på OK Klicka på OK
2.2 Att skapa indexserier i Excel I den här uppgiften ska ni skapa 6 stycken indexserier. Här ska ni inte använda felmarginalen utan enbart punktskattningen. De serier ni ska använda är; antal arbetslösa män, kvinnor och totalt samt antal sysselsatta män, kvinnor och totalt. För att förenkla för er kan ni kopiera över dessa till ett och samma Excelblad. Detta gör ni lämpligen på ett sådant sätt att ni har siffrorna i 6 rader. I översta raden anger ni årtal fr o m kolumn B I de 6 följande raderna klistrar ni in era siffror fr o m kolumn B I kolumn A skriver ni in namn på de olika serierna, typ sysselsättning män etc Skapa sex stycken indexserier med 2005 som basår. Skapa era indexserier under tidserierna. Det kan vara snyggare och mer lättläst om man hoppar över en tom rad. En indexserie beräknas ju genom att man för varje år dividerar det årets värde med basårets värde och multiplicerar med hundra. För att göra det följer ni instruktionerna nedan: I kolumn A ger ni indexserierna namn. Placera er sedan i kolumn b och skriv in ett lika-medtecken. Därefter pekar ni på b cellen i motsvarande tidserie. (När ni gör det skriver Excel automatiskt in en hänvisning till den cellen.) Därefter skriver ni: *100/ och skriver sedan in värdet på motsvarande tidserie år 2005 med siffror. (Alternativt pekar på cellen för 2005 igen men låser kolumnen med hjälp av ett dollartecken, om ni bara pekar på cellen så kommer ni att dividerar med olika år när ni kopierar till resten av raden). Kopiera sedan denna cell och klistra in i resten av raden. Gör på motsvarande sätt med de andra serierna. Om ni har gjort rätt ska ni nu ha 6 rader med siffror som alla har värdet 100 i kolumnen för 2005. Varje siffra i den raden är beräknad som ursprungliga seriens värde multiplicerat med 100 och dividerat med värdet för 2005. Illustrera era indexserier med hjälp av linjediagram på samma sätt som ni gjorde med total sysselsättning. Skapa sex stycken indexserier med 2010 som basår. Gör som ovan men dividera med 2010 års värden istället. Illustrera även dessa index med hjälp av linjediagram. Fundera över hur val av basår kan påverka intrycket man får av diagrammen.
2.3 Konsumentprisindex I tabellen på fliken KPI i Excel filen prisindex.xlsx visas vägningstal och prisökning för huvudgrupperna i KPI för åren l999 till 2001 enligt SCB. i. Beräkna ett kedjat index för den aktuella perioden. ii. Ange med ord innebörden av den i (a) framräknade indexserien. iii. Ange bastidpunkten för den beräknade indexserien. Tips: Börja med att beräkna ett vägt medelvärde av prisökningarna genom att multiplicera vägningstalen med prisökningarna och sedan summera dessa. 2.4 Deflatering Export av papper och pappersprodukter I tabellen på fliken papper i Excel filen prisindex.xlsx visas svensk export av papper och pappersprodukter i miljarder kronor samt två olika prisindex. EPI (exportprisindex) är ett index över prisutvecklingen på de pappers och pappersmassa produkter som Sverige exporterar. KPI (konsumentprisindex) är ett index över prisutvecklingen på de varor och tjänster som svenska hushåll köper. i. Beräkna svensk export av papper och pappersmassa uttryckt 2000 års prisnivå. Använd EPI som deflator. ii. Beräkna svensk export av papper och pappersmassa uttryckt 2000 års prisnivå. Använd KPI som deflator. iii. Illustrera de båda deflaterade serierna i ett diagram och kommentera vilka slutsatser vi kan dra. Tänk på att du måste ha en indexserie med år 2000 som basår för att kunna beräkna exporten uttryckt i 2000 års priser
Lösningar 1.1 Kvalitativa variabler A Cirkeldiagram och stapeldiagram i Excel Figur 1. Antal restauranger av respektive restaurangkedja. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I Figur 1 ser vi att Burger King har flest restauranger i urvalet medan Wendys har det minsta antalet. Figur 2. Antal restauranger av respektive restaurangkedja. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I Figur 2 ser vi att Burger King har flest restauranger i urvalet medan Wendys har det minsta antalet.
B Cirkeldiagram och Stapeldiagram i R Commander Figur 3. Restaurangernas fördelning på olika kedjor. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I Figur 3 ser vi att Burger King har flest restauranger i urvalet medan Wendys har det minsta antalet. Figur 4. Antal restauranger av respektive restaurangkedja. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I Figur 4 ser vi att Burger King har flest restauranger i urvalet medan Wendys har det minsta antalet.
Grupperade stapeldiagram i R Commander Figur 5. Fördelning mellan företagsägda och icke företagsägda restauranger i respektive kedja.. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I Figur 5 ser vi att Burger King har flest restauranger som inte är företagsägda Det är dock väldigt få Burger King restauranger som är företagsägda. Största antalet företagsägda restauranger har Roy Roger.
1.2 Kvantitativa variabler A Histogram i R Commander Figur 6. Prissättning av mellanläsk i urvalet av snabbmatsrestauranger. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I figur 6 ser vi att de allra flesta restaurangerna har ett pris på mellanläsk mellan 0,9 och 1,2
B Box plot i R Commander Figur 7. Prissättning av mellanläsk i urvalet av snabbmatsrestauranger. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I figur 7 ser vi att hälften av restaurangerna har ett pris på mellanläsk mellan 0,98 och 1,08, en fjärdedel har ett pris som är lägre än 0,98 och en fjärdedel ett pris som är högre än 1,08. medianen är ca 1,075 C Deskriptiv statistik i R Commander Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. Vi ser att medianen är 1,06 medan medelvärdet är 1,04. Pearsons measure of skewness blir då 3(1,0439 1,06) 0,08861972 = 0,54 I det här fallet får vi sålees ganska olika mått på skewhet med pearson förenklade formel och den som datorn använder. Båda måttet är ju dock ganska nära noll så slutsatsen blir väl att detta är en skapligt symmetrisk fördelning. Eftersom de båda måtten definierar skevhet på olika sätt är de inte helt jämförbara.
D Spridningsdiagram i R Commander Figur 8. Samband mellan antal anställda och öppettid i snabbmatsrestauranger. Källa: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. I figur 8 ser vi att restauranger med längre öppettider tenderar att ha fler anställda även om spridningen i antal anställda är ganska stor även för en specifik daglig öppettid. Det är således ett ganska svagt samband. Den gröna linjen i grafen ovan är en regressionslinje, vi kommer att återkomma till den i avsnittet om regressionsanalys.
E Att ladda ner data från SCB s statistiska databaser. Vi ser att medianen är 33612 medan medelvärdet är 15324,5. Pearsons measure of skewness blir då 3(33 612 15 324,5) 69 275 = 0,79 Även i det här fallet får vi ganska olika mått på skewhet med pearson förenklade formel och den mer korrekta som datorn använder. Båda måttet är ju positiva. Detta är helt klart en positivt skev fördelning. Eftersom de båda måtten definierar skevhet på olika sätt är de inte helt jämförbara. Figur 9 Folkmängd i svenska kommuner 2014. Källa SCB s statistikdatabas
Figur 10 Folkmängd i svenska kommuner 2010. Källa SCB s statistikdatabas
Figur 11 Folkmängd i svenska kommuner 2010 förutom Stockholm (911 989), Göteborg (541 145), Malmö (318 107) och Uppsala (207 362). Källa SCB s statistikdatabas Figur 11 visar att fördelningen över folkmängd i Sveriges kommuner är positivt snedfördelad. De flesta kommuner har en folkmängd under 40 000 medan ett fåtal är betydligt större.
Figur 12 Folkmängd i svenska kommuner 2010 förutom Stockholm (911 989), Göteborg (541 145), Malmö (318 107) och Uppsala (207 362). Källa SCB s statistikdatabas Figur 12 visar att första kvartilen är ca 10 000, Medianen är ca 15 000 och tredje kvartilen är ca 30 000. Eftersom fördelningen är positivt skev finns ett stort antal extremvärden.
2. Index och tidserier Observera att lösningsförslagen nedan är ett år gamla, era serier bör sluta 2015 istället för 2014. 2.1 Att illustrera tidserier i Excel Figur 13 Total sysselsättning i Sverige 2005 till 2014 Källa: Sysselsatta 16-64 år från AKU, SCB s statistikdatabas. Vi ser i figur 13 att sysselsättningen har ökat över tidsperioden som helhet men vi fick ett dropp mellan 2008 och 2009 p.g.a. finanskrisen. Statistiken är ganska exakt eftersom de tre linjerna ligger nära varandra (åtminstone enligt SCB beräkning av felmarginalen).
2.2 Att skapa indexserier i Excel Observera att lösningsförslagen nedan är två år gamla, era serier bör sluta 2015 istället för 2013. Figur 14 Svenska sysselsättningsindex 2005 till 2014 Egna beräkningar baserad på data för sysselsatta 16-64 år från AKU, SCB s statistikdatabas. I Figur 14 ser vi hur sysselsättningen varierar över konjunkturcykeln. Speciellt märks fallet i sysselsättning i samband med finanskrisen 2008 och 2009. Figur 15 Svenska arbetslöshetsindex 2005 till 2013 Egna beräkningar baserad på data för arbetslösa 16-64 år från AKU, SCB s statistikdatabas. I Figur 15 ser vi hur arbetslösheten varierar över konjunkturcykeln. Speciellt märks ökningen av arbetslösheten i samband med finanskrisen 2008 och 2009.
Figur 16 Svenska sysselsättningsindex 2005 till 2014 Egna beräkningar baserad på data för sysselsatta 16-64 år från AKU, SCB s statistikdatabas. Figur 17 Svenska arbetslöshetsindex 2005 till 2013 Egna beräkningar baserad på data för arbetslösa 16-64 år från AKU, SCB s statistikdatabas. I Figur 16 och 17 ser vi att valet av basår inte påverkar intrycket speciellt mycket. I vissa fall speciellt när en serie är stigande och en annan fallande kan det ge ganska olika intryck eftersom det avgör vilket serie som ligger överst. 2.3 Konsumentprisindex
i. 100 102,7 103,8 105,2 ii. Konsumentpriserna stiger med 5,2 procent rån 1998 till 2001. Ökningen från 1998 till 1999 är 2,7 procent och från 1998 till 2000 3,8 procent. Varje indextal anger således förändringen från basåret. iii. Bastidpunkten är 1998
2.4 Deflatering Export av papper och pappersprodukter Första steget är att göra om våra indexserier så att de har 2000 som basår. Det måste vi göra eftersom de deflaterade serierna ska uttryckas i 2000 års priser. (Dividera alla indexvärden med värdet från 2000 och multiplicera med 100). Därefter divideras exporten med respektive index och vi multiplicerar med hundra. År EPI Papper och pappersmassa Basår 2000 KPI Basår 2000 Export av papper och pappersmassa deflaterad med EPI Export av papper och pappersmassa deflaterad med KPI 2000 100 100 73,5 73,5 2001 98,08 102,41 76,78 73,53 2002 89,00 104,62 82,48 70,16 2003 83,32 106,63 87,26 68,18 2004 80,87 107,03 91,50 69,14 2005 87,34 107,52 86,56 70,32 2006 88,82 108,98 89,62 73,04 2007 93,89 111,39 87,66 73,89 2008 97,64 115,22 88,38 74,90 2009 93,80 114,65 87,53 71,61 2010 98,52 115,97 88,41 75,10 Figur 22. Svensk export av papper och pappersprodukter deflaterad med olika deflatorer. Källa SCB s statistiska databaser.
Kommentarer till figuren: När vi deflaterar med EPI dividerar vi pappersexporten med priset på papper. Vi får då ett mått över hur kvantiteten exporterade massa och pappersprodukter utvecklas över tid. När vi deflaterar med KPI räknar vi om intäkterna från massa och pappersexporten till 2000 års penningvärde, vi får en serie som visar hur mycket varor och tjänster vi kan köpa för de inkomster vi får från exporten av papper och pappersmassa. Under första delen av perioden sjönk priset på papper i förhållande till priserna på konsumtionsvaror. Det innebar att trots att exporterad kvantitet ökade kunde vi inte köpa lika mycket för inkomsterna från pappersexporten. Under senare delen av perioden stiger priset på papper i förhållande till priserna på konsumtionsprodukter. Vi kan köpa mer för våra inkomster från pappersexporten trots att exporterad kvantitet sjunker något.