ÖVNINGSUPPGIFTER KAPITEL 2 DATAMATRISEN 1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater. Stat Befolkningsmängd Inkomst Marijuana Procent män (miljoner) per person lagligt? 1. Kalifornien 38,8 49,7 43104 0 2. Texas 27,0 49,6 39493 0 3. Florida 19,9 48,9 39272 0 4. New York 19,7 48,4 48821 0 5. Illinois 12,9 49,0 43159 0 6. Alaska 0,7 52,0 44174 1............... 50. Wyoming 0,6 51,0 47851 0 a. Vad är observationsenheten? b. Hur stort är antalet observationer? c. Hur många kvantitativa variabler finns det och vilka är de? d. Hur många kvalitativa variabler finns det och vilka är de? FÖRDELNINGEN FÖR EN VARIABEL 2. Nedan visas ett sampel för 22 barn. För varje barn har vi mätt åldern då de lärde sig gå. Åldern är uttryckt i månader: 17, 17, 15, 15, 16, 14, 14, 16, 16, 13, 15, 16, 14, 18, 13, 15, 11, 13, 15, 15, 15, 16 a. Beskriv åldersfördelningen genom att fylla i frekvenstabellen: Ålder 11 13 14 15 16 17 18
b. Illustrera åldersfördelningen med hjälp av ett frekvensdiagram. 3. I en kommun gick 800 elever ut nian förra våren. Här är en frekvenstabell över elevernas slutbetyg i modersmål. Fyll i den kumulativa och relativa frekvensen. Betyg 4 26 5 40 6 86 7 232 8 238 9 130 10 48 Kumulativ frekvens Relativ frekvens 4. 300 pensionärer får genomgå ett test där man mäter deras reaktionsförmåga i trafiken. Histogrammet nedan visar fördelningen för pensionärernas loggade reaktionstider. Agnes (A) fick en reaktionstid som var hälften av Bosses (B). A B 0 10 20 30 40 -.5 0.5.69 1 1.5 Ln(reaktionsförmåga) a. Calle hade dubbelt längre reaktionstid än Bosse. Märk ut Calles loggade reaktionstid i histogrammet. Skriv också ut värdet för Calles loggade reaktionsförmåga på x-axeln. b. Dan hade 10 procent längre reaktionstid än Bosse. Vad är Dans reaktionstid mätt på den naturliga logaritm-skalan? c. Mätt på den naturliga logaritm-skalan så ligger Evas reaktionstid 0,05 enheter under Bosses. Hur mycket snabbare är Eva än Bosse uttryckt i procent?
SUMMATECKNET 5. Vi gör fyra mätningar på en variabel X: 1, 2, 3, 6. Beräkna följande summor: a. b. 3 c. 3 d. 3 e. 2 f. 2 6. Vi gör 4 mätningsar på en variabel X: -1, 0, 4, 5. Beräkna följande summor: a. b. 7. Vi gör 500 mätningsar på en variabel X. Summan av dessa är 2636. Beräkna: a. 2 b. +1 c. 2 LÄGESMÅTT 8. Nedan visas cigarettkonsumtionen i de nordiska länderna. Cigarettkonsumtionen mäts som antalet cigaretter per person. 534 (Norge), 715 (Sverige), 671 (Finland), 1413 (Danmark) och 477 (Island) a. Hur stor är den genomsnittliga cigarettkonsumtionen? b. Hur stor är mediankonsumtionen av cigaretter? 9. I en undersökning frågar man 750 personer om de anser att det var bättre förr. Resultatet visas i frekvenstabellen nedan (variabeln bättre antar värdet 1 för personer som ansåg att det var bättre förr och värdet 0 för övriga). Hur stort är medelvärdet för variabeln bättre? Förklara också vad medelvärdet betyder i detta fall (beakta då att variabeln är binär).
bättre frekvens 0 405 1 345 10. Du kör längs med motorvägen Åbo-Helsingfors och får se fyra skyltar som visar temperaturen. Den första skylten visar 10 grader; den andra 11 grader; den tredje 10 grader och den fjärde 36 grader. För att uppskatta temperaturen längs med motorvägen så skulle då medelvärdet av de olika mätningarna vara ett lämpligt mått. Eller? Förklara varför medianen ger en bättre uppskattning i detta exempel. Hur stor är medianen? 11. Ange om följande variabler är kvantitativa eller kvalitativa. Om kvalitativa; ange också om de har data på ordinal- eller nominalnivå. a. Kvinna (antar värdet 1 för kvinnor och 0 för män) b. Trivsel på jobbet (antar värdena 1, 2,..., 5 där 1 är usel och 5 är utmärkt ) c. Lön (mäts i euro per månad) d. Blodtyp (A, B, AB och O) e. Parti (variabeln visar vilket parti personen röstar på) f. Lycka (antar värdena 1, 2,..., 10 där 1 är maximalt olyckligt och 10 är maximalt lycklig) g. Kursbetyg (Underkänd, 1, 2,..., 5) h. Postnummer (t.ex. 20500) 12. Se histogrammet nedan. De tre utritade sträcken i rött representerar medelvärdet, medianen och typvärdet (men inte nödvändigtvis i den ordningen). Skriv in rätt lägesmått vid respektive sträck. Ange också om den här fördelningen är skev åt vänster, skev åt höger eller symmetrisk. 0 50 100 150 200 0 50 100 150 200 Y 13. Låddiagram nedan visar fördelningen för alkoholkonsumtionen i världens länder. Alkoholkonsumtionen mäts som liter per vuxen invånare.
Alkoholkonsumtion 0 2.5 5 7.5 10 12.5 15 17.5 20 22.5 25 a. Hur stor är den första kvartilen (med ögonmått mätt)? Ge också en tolkning av detta värde. b. Hur stor är den andra kvartilen (med ögonmått mätt)? Ge också en tolkning av detta värde. c. Hur stor är den tredje kvartilen (med ögonmått mätt)? Ge också en tolkning av detta värde. d. Hur mycket dricks det i det land som har högst alkoholkonsumtion? 14. I en tidsanvändningsstudie låter man 300 personer anteckna hur många minuter de använder till att surfa på nätet. I genomsnitt använder personerna 350 minuter per vecka och den 75:e percentilen är 630 minuter. Vilket eller vilka av följande påståenden är sanna: a. 75 procent av personerna surfar på nätet 630 minuter per vecka. b. 25 procent av personerna surfar på nätet mer än 630 minuter per vecka. c. 75 procent av personerna surfar på nätet mindre än 630 minuter per vecka. d. Den fjärde kvartilen är 630 minuter. 15. Vi har samplat 1000 personer och mätt deras inkomster i euro per månad. Vi har delat in personerna i tio decilgrupper, betecknade D1, D2,..., D10. diagrammet nedan visar hur många personer som ingår i respektive decilgrupp. Eller? Förklara vad som inte stämmer med detta frekvensdiagram.
300 250 200 150 100 50 0 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 SPRIDNINGSMÅTT 16. Tabellen nedan visar mordfrekvensen i de nordiska länderna. Mordfrekvensen mäts som antalet mord per hundratusen invånare. Beräkna variansen och standardavvikelsen för mordfrekvensen. Den genomsnittliga mordfrekvensen är 0,8. Land Mord Norge 0,6 Sverige 0,7 Finland 1,6 Danmark 0,8 Island 0,3 17. I tabellen nedan visas bränsleförbrukningen för åtta bilmodeller. Bränsleförbrukningen mäts i liter per 100 kilometer. Beräkna variansen och standardavvikelsen för bränsleförbrukningen. Den genomsnittliga bränsleförbrukningen är 7,6 liter. Modell Bränsleförbrukning Audi A4 6,9 BMW M6 10,3 Citroen C5 8,3 Dacia Sandero 9,3 Fiat 500 Sport 6,3 Lada Priora 7,2 Opel Astra 6,7 Saab 9-3 5,8
18. Vilket eller vilka av följande tre påståenden är korrekta? a. Variansen kan vara negativ i sampel med negativa värden. b. Standardavvikelsen är lika stor i samplet (4, 5, 9, 10) som i samplet (14, 15, 19, 20). c. I en löpartävling springer deltagarna 2 kilometer. Löptiden för tävlingsdeltagarna är normalfördelad med medelvärdet 8 minuter och standardavvikelsen 1 minut. Påstående: Ungefär 95 procent av deltagarna har en löptid någonstans mellan 6 och 10 minuter. 19. Du funderar på att söka jobb på ett visst företag. Under det senaste året har företaget anställt hundra nya arbetare. För dessa har ingångslönen varit normalfördelad med medelvärdet 2600 euro och standardavvikelsen 120 euro. Hur bedömer du dina chanser att tjäna minst 3000 euro om du får jobbet? Motivera.