LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Relevanta dokument
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Föreläsning G60 Statistiska metoder

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

732G01/732G40 Grundläggande statistik (7.5hp)

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Beskrivande statistik

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Läs noggrant informationen nedan innan du börjar skriva tentamen

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Statistik, STA A13 (4 poäng) Lördag 11 november 2006, Kl

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 27 mars 2004, kl

OBS! Vi har nya rutiner.

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Läs noggrant informationen nedan innan du börjar skriva tentamen

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Hypotestestning och repetition

Repetitionsföreläsning

Statistik 1 för biologer, logopeder och psykologer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Tentamen Tillämpad statistik A5 (15hp)

Bearbetning och Presentation

OBS! Vi har nya rutiner.

13.1 Matematisk statistik

Föreläsning G70 Statistik A

Tentamen i Matematisk statistik Kurskod S0001M

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp

1 Mätdata och statistik

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen i Dataanalys och statistik för I den 28 okt 2015

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 24 april 2004, kl

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen i Matematisk statistik Kurskod S0001M

MVE051/MSG Föreläsning 7

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 4 e mars Ten 1, 9 hp

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I STATISTIK B,

Laboration 3: Urval och skattningar

Uppgift a b c d e Vet inte Poäng

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Laboration 3: Urval och skattningar

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i Matematisk statistik Kurskod S0001M

Inlämningsuppgift-VT lösningar

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

, s a. , s b. personer från Alingsås och n b

Medelvärde, median och standardavvikelse

Föreläsning G60 Statistiska metoder

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i Matematisk statistik Kurskod S0001M

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Föreläsning G60 Statistiska metoder

Transkript:

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2008-08-23 Skrivtid 0900 1400 Tentamen i: Statistik 1, Undersökningsmetodik 7.5 hp Antal uppgifter: 6 Krav för G: 14 Lärare: Robert Lundqvist, tel 49 24 04 Jour: Robert Lundqvist, tel 49 24 04 Resultatet anslås senast: 18/9 2008 Tillåtna hjälpmedel: En statistikbok, gärna Introduction to the Practice of Statistics av Moore & McCabe. Undantag: kombinationen Praktisk statistik/räkna med slumpen Miniräknare Tänk på att redovisa dina lösningar på ett klart och tydligt sätt. Endast det numeriska svaret räcker inte för full poäng. Korrekt lösning ger det poängantal som står angivet efter uppgiftstexten. LYCKA TILL!

Tentamen i Statistik 1, S0006M, 2008-08-23 1. I tillverkningen av en viss komponent till personbilar uppstår smärre fel i ytskiktet. Urval av komponenter tas ut regelbundet för undersökning, och antalet fel sammanställs. För ett urval av 14 komponenter får man följande resultat: Antal fel per komponent 0 1 2 3 Frekvens 3 6 4 1 (a) Vad blir medelvärde och standardavvikelse för antalet fel per komponent? (b) Vad blir median, undre och övre kvartil för antalet fel per komponent? (c) Beskriv antalet fel per komponent med en boxplot/lådagram. (6p) 2. I en viss syssla krävs förmåga att uppfatta detaljer. För att ta reda på vilka av de anställda som ska få träna upp sig i den sysslan genomfors ett test där man mäter andelen korrekta bedömningar (enhet: %), resultat i ett frågeformulär (enhet: antal korrekta svar). I nedanstående tabell ges resultaten för de testade personerna: Person Andel korrekta Antal Person Andel korrekta Antal nr bedöm- korrekta nr bedöm- korrekta ningar svar ningar svar 1 58 5 9 98 9 2 53 4 10 45 2 3 33 10 11 97 8 4 97 10 12 90 6 5 36 2 13 96 7 6 83 7 14 66 3 7 67 6 15 82 6 8 84 9 (a) Om man studerar dessa variabler med andelen korrekta bedömningar som svarsvariabel och antalet korrekta svar som förklarande variabel fås följande resultat: ŷ = 43.5+4.6x Kan koefficienterna i den modellen ges meningsfulla tolkningar? Om så är fallet, ge sådana tolkningar. Om inte, motivera detta. 1

Tentamen i Statistik 1, S0006M, 2008-08-23 (b) En viss anställd var inte med i testet av andelen korrekta bedömningar men besvarade ändå frågorna i frågeformuläret. Där fick hon 5 korrekta svar. Hur stor andel korrekta bedömningar kan hon förväntas göra utifrån det resultatet? (c) I testet gjordes också noteringar om vilken av de två avdelningar som de anställda kom ifrån. I nedanstående tabell ges den informationen. Person 1 2 3 4 5 6 7 8 Avdelning A A A A A A A A Person 9 10 11 12 13 14 15 Avdelning B B B B B B B Uppgifterna om avdelning kan tas med i modellen om den kodas på så vis att en anställd som arbetar vid avdelning A får värdet 0, och en anställd från avdelning B får värdet 1. Om den informationen tas med i en så kallad multipel regressionsmodell fås resultatet ŷ = 29.3+5.2x+22.1d där x är samma variabel som i föregående analys och d är variabeln för avdelning. Kan värdet 22.1 ges en meningsfull tolkning? Gör i så fall detta. Om det inte är möjligt, motivera då detta. (d) En mindre insatt medarbetare gjorde samma slags analys av ovanstående material, men vände på variablerna så att den förklarande variabeln sattes som svarsvariabel och samma omvändning för svarsvariabeln. I en sådan analys, kommer korrelationskoefficienten att vara samma som med rättvända variabler, eller blir det med samma siffervärde fast med annat tecken? (5p) 3. I tillverkningen av stålbalkar ska en viss typ av balk väga 2000 kg. Den vikten är dock inte exakt densamma för alla balkar, utan vikten kan beskrivas med en normalfördelning med genomsnittet 2000 kg och standardavvikelsen 2.3 kg. (a) Om en balk väger mer än 2004 kg måste den efterbearbetas vilket medför en minskad vinst vid försäljning. Hur stor andel av balkarna kommer att kräva sådan efterbearbetning? (b) När man ska bestämma en procedur för kontroll av balkarna blir det en fråga om att inte skicka iväg för många dåliga balkar men inte heller kontrollera alltför många bra. Procedurens utformning hur många 2

Tentamen i Statistik 1, S0006M, 2008-08-23 balkar som ska kontrolleras kräver alltså en slags förhandling mellan tillverkare och kund. En typisk frågeställning i de förhandlingarna blir att ta reda på högsta vikt i gruppen av de 10% lättaste balkarna. Bestäm denna. (c) För en annan balktyp har man inte ingen bra uppgift på standardavvikelsen för vikten. Däremot vet man att genomsnittet 3000 kg är rimligt och att 5% av balkarna mycket väger mindre än 2990 kg. Beräkna utifrån dessa uppgifter standardavvikelsen för balkarnas vikt. (7p) I denna uppgift är det särskilt viktigt att du tydligt definierar de variabler och händelser du använder i beräkningarna. 4. Inom en kedja av möbelvaruhus ville man se om en viss utbildning av säljarna gjorde någon skillnad i resultatet. Den undersökningen lades upp så att man först tog ut ett slumpmässigt urval av försäljare där veckoförsäljningen i kronor sammanställdes. Samma försäljare gick igenom utbildningen, och efter en tid sammanställdes dessa personers försäljning. I nedanstående tabell ges resultatet: Säljare 1 2 3 4 5 6 7 8 9 10 11 12 Före 32 29 42 51 21 40 62 56 36 43 50 50 Efter 34 28 47 51 21 50 63 56 36 43 52 61 (a) Beskriv resultaten efter utbildning i ett lämpligt stambladdiagram. (b) Beskriv hur ett slumpmässigt urval av säljare kan göras: vilka hjälpmedel du behöver, vilka underlag som krävs och tillvägagångssätt. (c) Ge exempel på ett sätt att grafiskt åskådliggöra resultaten så att det går att se om det blivit någon individuell förändring. (4p) 5. I ett urval ur SCB:s databaser för hushållens utgifter kan man för gruppen ensamstående utan barn se att deras årliga utgifter för alkoholhaltiga drycker (lättöl inräknat) har utvecklat sig på följande sätt: Utgifter, kr/hushåll efter hushållstyp, utgiftsslag och tid År 2003 2004 2005 2006 2007 Utgifter 3260 3000 2610 3050 2930 3

Tentamen i Statistik 1, S0006M, 2008-08-23 (a) Beräkna en indexserie för dessa utgifter med 2003 som basår, dvs det år då index är 100. (b) För samma tidsperiod var konsumentprisindex följande: Konsumentprisindex (KPI) årsmedeltal totalt, skuggindextal, 1980=100 efter tid 2001 267 2002 272 2003 278 2004 279 2005 280 2006 284 2007 290 Vad blir utgifterna för år 2003 med 2007 års penningvärde? (c) Hur stor är den genomsnittliga årliga förändringen av konsumentprisindex under perioden 2003 till 2007? (3p) 6. Du har fått i uppdrag att genomföra en undersökning i en stadsdel där syftet är att få ett underlag för både framtida byggnationer och för att få en bild av hur invånarna ställer sig till förändringar i den kommunala förvaltningen av området. Några av de variabler som ska mätas är följande: Åldersgrupp, där svar ges som en av fyra fasta alternativ. Grad av förvärvsarbete: heltid eller mer, deltid eller inte alls. Hur länge man bott i området där svar ska anges som antalet år. Inställning till byggande av ett villaområde i anslutning till det aktuella bostadsområdet: svar ska anges som positiv, neutral, negativ eller ingen åsikt. (a) När man plottar upp tiden de svarande bott i området i ett histogram visar den en påtagligt sned fördelning med en svans åt höger. Beskriv vad det säger om boendetiden i ord. (b) Ge ett förslag på hur boendetiden kan beskrivas grafiskt så att det blir lätt att jämföra de olika åldersgruppernas boendetid. (c) Ge ett förslag på hur man kan åskådliggöra inställningen till byggande för olika boendetider i en tabell. (3p) 4

1. Låt x stå för antalet fel per komponent. För den variabeln gäller enligt uppgiften att Antal fel 0 1 2 3 per komponent (x) Frekvens 3 6 4 1 (a) Medelvärdet blir x = 1 n x i = 1 (0+0+0+ + 3) = 1.214 14 och standardavvikelse blir 1 s = n 1 (x i x) 2 = 1 = 13 ((0 1.214)2 )+ (3 1.214) 2 = 0.8925824 (b) Medianen, det mittersta värdet är medelvärdet av 7:e och 8:e värdet i storleksordning, dvs 1. Undre kvartil blir då medianen i den undre halvan, dvs värde nr 4 som också är 1. Den övre kvartilen blir på motsvarande sätt 2. (c) Antalet fel per komponent kan beskrivas med en boxplot av följande utseende: ++------+-------+------+-------+------+-------++ +--------------+ +-------------- --------------+ +--------------+ ++------+-------+------+-------+------+-------++ 0 0.5 1 1.5 2 2.5 3 5

2. Låt x stå för antalet korrekta svar och y för andelen korrekta bedömningar. Resultatet i regressionsanalysen blev ŷ = 43.5+4.6x (a) Här kan värdet 43.5 inte ges meningsfull tolkning eftersom man inte har några observationer påy för värden på x som ligger nära 0. Värdet 4.6 kan dock sägas visa att genomsnittligt antal bedömningar ökar med 4.6 procentenheter när antalet korrekta svar ökar med 1. (b) Om x = 5 betyder det att motsvarande värde på y blir 43.5+4.6 5 = 66.5. (c) Låt d beteckna avdelning. Koefficienten för den variabeln är 22.1, vilket kan tolkas som att värdet på svarsvariabeln, andelen korrekta bedömningar, ökar med i genomsnitt 22.1 procentenheter när d ökar med 1, dvs när man jämför en anställd från avdelning A med en från avdelning B. (d) Om man vänder på variablerna kommer korrelationskoeffienten att bli densamma, dvs samma siffervärde och samma tecken. Rent allmänt gäller att med ett positivt samband så hänger höga värden på den ena variablen ihop med höga värden på den andra. För ett negativt samband gäller förstås motsvarande mönster. 3. Låt x beteckna vikten för den aktuella balktypen. För den gäller att genomsnittet µ = 2000 kg och standardavvikelsen σ = 2.3 kg. (a) Det som söks är andelen x som är högre än 2004 kg: 6

0.00 0.05 0.10 0.15 1994 1996 1998 2000 2002 2004 2006 Den andelen motsvarar en andel för den standardiserade normalfördelningen: om man tar till sedvanlig standardisering (z = (x µ)/σ framgår att när x = 2004 så är z = (2004 2000)/2.3 = 1.74, vilket i sin tur betyder att andelen x > 2004 är lika stor som andelen z > 1.74: 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 Enligt tabell är den andelen 4.10%, dvs andelen balkar som kräver 7

efterbearbetning är 4.10%. (b) Det som söks är c, högsta vikt i gruppen av de 10% lättaste balkarna: 0.00 0.05 0.10 0.15 1994 1996 1998 2000 2002 2004 2006 Andelen x < c ska vara 10%. Med sedvanlig standardisering fås att när x = c så är z = (c 2000)/2.3, vilket i sin tur betyder att andelen x < c är lika stor som andelen z < c 2000 2.3 Enligt uppgiften är den andelen 10%. Enligt tabell för z-värdena gäller att dessa 10% nås när z < 1.28. Detta betyder att c 2000 2.3 = 1.28 vilket i sin tur ger att c = 1997.056. Högsta vikt i gruppen av de 10% lättaste balkarna är alltås 1997.056 kg. (c) För en annan balktyp söks standardavvikelsen σ för vikten. Man kan utgå från att genomsnittet är 3000 kg och att 5% av balkarna mycket väger mindre än 2990 kg. 8

0.00 0.01 0.02 0.03 0.04 0.05 0.06 2990 3000 3010 Om w står för balkvikten vet vi alltså att andelen w < 2990 är 5%. Då gäller med standardiseringen att när w = 2990 så är z = (2990 3000)/σ. Det betyder som tidigare att andelen w < 2990 är lika stor som andelen z < (2990 3000)/σ. Samtidigt ger tabell att andelen z < 1.64 är just dessa 5%. Det betyder att 2990 3000 σ = 1.64 Detta ger att σ = 6.098. Standardavvikelsen för vikten på dessa balkar är alltså 6.098 kg. 4. Ett stambladdiagram för resultaten efter utbildning kan se ut på följande sätt: 1 2* 1 2 2. 8 3 3* 4 4 3. 6 5 4* 3 6 4. 7 6 5* 012 3 5. 6 2 6* 13 9

1* 1 represents 11 Leaf digit unit = 1 5. Ett slumpmässigt urval av de 11 säljarna kan göras på flera sätt, ett vanligt och principiellt enkelt är att använda en slumptalstabell. Det som då ska göras är följande: Ta fram en urvalsram, dvs en lista med alla säljare. Numrera namnen i ramen från 1 till sista namn. En godtycklig startpunkt i slumptalstabellen väljs ut. Om säljarna är högst 99 personer tas två siffror ut ur tabellen. Om sifforna motsvarar en viss säljare tas den personen med i urvalet. Om säljarna är fler än 99 och högst 999 tas tre siffror ut, och om en sifferkombination motsvarar en av säljarna i ramen tas den personen med. Om sifferkombinationen inte passar in på någon i listan går man vidare. När en sifferkombination är tagen går man vidare i tabellen på ett konsekvent sätt: radvis till nästa grupp av två (alt tre) siffror eller möjligen kolumnvis. 6. Förändringen kan beskriva på flera sätt: (a) Eftersom värdena hänger ihop parvis kan man göra en sambandsplott där resultat före utbildning läggs på ena axeln och resultat efter utbildning på den andra: +---+---+---+----+---+---+----+---+--+ * 60+ * + * e 50+ * ** + f * t 40+ * + e * r * 30+ * + * 20+---+---+---+----+---+---+----+---+--+ 20 25 30 35 40 45 50 55 60 före 10

(b) Ett annat sätt är att bilda differensen mellan resultaten individvis: 2-1 5 0 0 10 1 0 0 0 2 11 Dessa kan sedan beskrivas med någon lämplig metod stambladdiagram, dotplot, boxplot eller annan metod som bygger på en endimensionell beskrivning. 7. De aktuella utgifterna ges i nedanstående tabell: Utgifter, kr/hushåll efter hushållstyp, utgiftsslag och tid År 2003 2004 2005 2006 2007 Utgifter 3260 3000 2610 3050 2930 (a) En indexserie för dessa utgifter med 2003 som basår ges av År 2003 2004 2005 2006 2007 Index 100 92.02 80.06 93.56 89.88 där index för år 2004 har beräknats tenom att ta det årets index genom basårets, dvs 3000 3260 100. (b) Det som söks är utgifterna för år 2003 med 2007 års penningvärde. Här kan man med hjälp av KPI visa att År -03-07 1 kr motsvarar 290/270 kr 3260 kr motsvarar 3260 290 278 En utgift från 2003 på 3260 motsvarar alltså 3400.72 kr i 2007 års penningvärde. (c) Det som söks är den genomsnittliga årliga förändringen av konsumentprisindex under perioden 2003 till 2007. Om f står för den årliga tillväxtfaktorn gäller att 278 f 4 = 290 vilket betyder att f = (290/278) 1/4 = 1.0106. Den årliga förändringen uttryck i procent är alltså 1.06%. 8. Grunden är följande variabler: 11

Åldersgrupp, där svar ges som en av fyra fasta alternativ. Grad av förvärvsarbete: heltid eller mer, deltid eller inte alls. Hur länge man bott i området där svar ska anges som antalet år. Inställning till byggande av ett villaområde i anslutning till det aktuella bostadsområdet: svar ska anges som positiv, neutral, negativ eller ingen åsikt. (a) Boendetiden är enligtuppgiften sned med en svans åt höger. Det betyder att det de flesta har en kortare boendetid, men det finns några få som har påtagligt längre boendetid än flertalet. (b) För att beskriva boendetiden grafiskt på ett sådant sätt att det blir lätt att jämföra de olika åldersgruppernas boendetid kan man till exempel använda parallella boxplottar: en boxplott för varje åldersgrupp och varje boxplott visar den gruppens boendetid. Andra varianter? Dotplot med samma uppdelning, parallella histogram? (c) För att åskådliggöra inställningen till byggandeför olika boendetider i en tabell är det enklaste att först göra om boendetiden till en kategorisk variabel, dvs dela in alla värden i grupper. Därefter kan man lätt göra en vanlig korstabell av följande snitt: Boendetid Grupp 1 Grupp 2 Grupp 3 Grupp 4 positiv Inställning neutral negativ ingen åsikt 12