Övningar Övning 1 En statistiktenta har skrivits av 24 programstudenter och 20 friståendekursstudenter. Följande resultat i antal poäng erhölls: Programstud: 18, 22, 26, 35, 9, 34, 12, 36, 29, 29, 30, 32, 27, 28, 24, 40, 35, 34, 39, 39, 31, 31, 28, 26 Friståendekursstud: 38, 25, 28, 4, 6, 11, 8, 30, 21, 21, 31, 35, 23, 22, 37, 36, 34, 39, 34, 34 a) Beskriv hur de studerandes skrivningsresultat fördelar sig på poäng i ett histogram med följande klasser: 3-17, 18-22, 23-27, 28-32, 33-37, 38-42. Fundera på hur Du skall hantera den första klassen, som ju är tre gånger så bred som de övriga fem klasserna. b) Beskriv resultaten för de 24 programstudenterna i ett lådagram (boxplot). c) Karin, friståendekursstuderande som skrev den aktuella statistiktentan, fick 38 poäng på provet. Hon uttalar följande hurra, den här gången ligger jag på den 90:e percentilen. Ta ställning till om Karin har rätt. Om Du anser att hon har fel korrigera hennes uttalande så att det blir rätt, d.v.s. vad borde hon ha sagt? Övning 2 De tolv boende i ett litet serviceboende beskrivs här med avseende på hur stort hjälpbehovet (hjälp med städning, inköp, personlig omvårdnad etc) bedömts vara i timmar per vecka och hur väl de boende trivs samt kön och ålder. Person nr Kön Ålder Hjälpbehov, tim/vecktrivsel i boendet 1 k 76 2 god 2 m 82 6 god 3 m 93 11 dålig 4 k 98 10 dålig 5 k 87 3 dålig 6 m 81 3 god 7 k 79 3 god 8 k 95 14 dålig 9 k 88 8 dålig 10 m 81 2 god 11 m 81 10 god 12 k 79 12 god a) Beskriv hur de boende fördelar sig på ålder i ett punktdiagram. b) Beskriv i ett punkt- eller stolpdiagram hur de boende fördelar sig på hjälpbehov. c) Beskriv sambandet mellan kön och trivsel i boendet i en tvåvägsindelad frekvenstabell. d) Trivs män eller kvinnor bäst? Kan skillnaden mellan könen snarare vara ett uttryck för skillnaden mellan åldrar? Försök att utreda. 16
Övning 3 Här följer data från en liten undersökning riktad till ett antal studerande vid en högskola där man med hjälp av ett enkelt frågeformulär insamlat uppgifter. Enkät nr Utbildn.omr Kön Attityd Studietid 1 1 1 4 30 2 1 1 2 16 3 2 1 2 26 4 1 2 3 19 5 2 2 4 35 6 2 1 2 45 7 2 2 3 52 8 1 1 2 36 9 1 1 4 22 10 2 2 4 40 11 2 2 3 29 12 2 1 1 48 13 2 2 3 38 14 1 2 4 40 15 1 1 3 20 16 2 2 4 30 17 1 1 4 15 18 2 2 3 30 19 2 2 2 25 20 2 2 4 35 I enkäten har man ställt frågor kring attityd till utbildningen, 4-gradig skala med 1= negativ, 4 = positiv ungefärlig nedlagd studietid per normalvecka i timmar. Man har också bett de svarande uppge utbildningsområde (utbildn.omr), där studierna sker (filosofisk utbildning, teknisk utbildning) samt kön. I datasammanställningen ovan motsvaras en rad av en enkät. Kön är kodat med 1 = kvinna och 2 = man. Utbildningsområde är kodat med filosofisk utbildning = 1 och teknisk utbildning = 2. a) Beskriv sambandet mellan kön och attityd i en tvåvägsindelad frekvenstabell, med två kolumner (kön) och fyra rader (attityd). Du gör alltså en tabell som visar hur de totalt 20 personerna fördelar sig på kön och attityd. Använd absoluta frekvenser (antal). b) Beskriv sambandet mellan utbildningsområde och kön i två fyrfältstabeller, en med absoluta frekvenser och en med relativa frekvenser (procent), där varje kolumn skall summera till 100 %. Välj utbildningsområde som kolumnvariabel och kön som radvariabel. c) Beskriv i vanliga ord hur skillnaden i könsfördelning ser ut mellan de olika utbildningsområdena. d) Beskriv sambandet mellan utbildningsområde, kön och nedlagd studietid i en tvåvägsindelad medeltalstabell, där den genomsnittliga studietiden för olika grupper läggs in i fyrfältstabellen. Fortsättning på nästa sida 17
e) Beskriv sambandet mellan utbildningsområde, kön och nedlagd studietid, i en trevägsindelad frekvenstabell. Klassindela studietiden i 3 klasser, nämligen: högst 25 timmar, 26-39 timmar, 40 timmar och mer. Övning 4 I segelsällskapet Clara avser man göra en kampanj för att samtliga klubbens båtägare skall ha skepparexamen. För att skaffa sig ett första underlag för kampanjen insamlar man via enkät vissa uppgifter (kön, ålder och huruvida man har skepparexamen eller ej) från 30 slumpmässigt utvalda bland klubbens båtägare (20 män och 10 kvinnor). Följande resultat erhölls (fetstilt och understruken person har skepparexamen): Män Män Kvinnor Person nr Ålder Person nr Ålder Person nr Ålder 1 30 11 57 21 25 2 52 12 49 22 27 3 48 13 24 23 26 4 44 14 26 24 23 5 22 15 33 25 41 6 48 16 39 26 34 7 21 17 46 27 24 8 27 18 24 28 36 9 38 19 52 29 34 10 51 20 41 30 23 a) Man vill jämföra åldersfördelningen för män och kvinnor. Presentera materialet i en lämplig tvåvägsindelad frekvenstabell. Tolka sambandet i ord. (Ledning: Det räcker att klassindela ålder i två klasser.) b) Beräkna andelen personer med skepparexamen bland männen och motsvarande andel bland kvinnorna. Vilket av könen har den största andelen skeppare? c) Undersök sambandet mellan kön och innehav av examen då man samtidigt tar hänsyn till variabeln ålder. Sätt upp en lämplig tabell och tolka sambandet i ord. Övning 5 Vi tänker oss en totalundersökning riktad till de studerande och anställda vid en liten högskola. Man vill undersöka om det kan finnas underlag för ett bankkontor på campus. En mycket enkel enkät med några få frågor distribueras via postfack och internpost till samtliga studerande och anställda. 540 besvarade formulär utgör resultatet. Bland dessa har 405 svarat ja på frågan anser Du att det behövs ett bankkontor på campus?. a) Beräkna med utgångspunkt från undersökningsresultatet procentandelen i populationen, som anser att det behövs ett bankkontor. Antag nu att vi får veta att det finns sammanlagt 980 anställda och studerande vi högskolan i fråga. Det finns alltså ett stort bortfall i undersökningen. b) Beräkna hur stor andelen jasvar skulle ha kunnat bli som minst respektive mest, om hänsyn tas till bortfallet. c) Fundera lite kring vad man kan tro om bortfallet. 18
Övning 6 På två utbildningsprogram vid en högskola har man genomfört kursvärdering enligt ett fastställt formulär. Bland annat ställer man följande fråga: Är Du i huvudsak nöjd med Din utbildning på programmet? På ekonomprogrammet finns 60 studerande varav 42 personer besvarar frågorna och 24 svarar ja. På lärarprogrammet finns 50 studerande. Antalet svarande är 45 personer och 30 av dem svarar ja. a) Beräkna procentandelen nöjda (ja-svarare) bland de svarande på vart och ett av programmen samt hur många procent högre (eller lägre) som andelen nöjda är på lärarprogrammet jämfört med ekonomprogrammet. b) De, som arbetar med ekonomprogrammet hävdar att jämförelsen är orättvis och att man mycket väl skulle kunna haft minst lika hög andel nöjda som "lärarna" om bara antalet svarande varit större. Utred om det ligger något i detta påstående. Övning 7 I en undersökning vill man bl a studera storleken på bostäderna i ett bostadsområde. Som ett led i undersökningen sammanställer man följande tabell: Antal bostadsrum Antal bostäder med Procent (utom kök och badrum) vidstående antal rum 2 130 26 3 140 28 4 120 24 5 40 8 6 50 10 7 20 4 Totalt 500 100 a) Beräkna medelantalet bostadsrum per bostad b) Beräkna standardavvikelsen för antal bostadsrum c) Beräkna medianantalet bostadsrum d) Beräkna kvartilavstånd (interquartile range) 19
Övning 8 Vid en vårdcentral finns 16 personer anställda. Deras månadslöner för april år 2001 i tusental kronor ges, tillsammans med uppgift om ålder och kön nedan: Person nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Lön, tkr 12 14 14 28 23 17 21 13 17 15 23 27 27 23 31 19 Ålder 21 26 23 32 39 22 43 57 63 42 28 32 47 44 59 49 Kön k k k k k k k k k k m m m m m m a) Beräkna medellönen för samtliga anställda i september. b) Beräkna fyra medellöner, nämligen för männen respektive för kvinnorna liksom för de yngre (under 40 år) respektive de äldre (40 år eller mer). Beräkna också skillnaden i medellön mellan män och kvinnor respektive mellan äldre och yngre. c) Bilda en tabell särskilt lämpad att jämföra de yngre och äldre med avseende på lön så att man också kan se skillnaden mellan könen. Lämpligen gör man då en fyrfältstabell med två kolumner, en för yngre och en för äldre, och två rader, en för kvinnor och en för män. I varje ruta placeras medelvärdet för den aktuella gruppen samt antalet personer. d) Beräkna skillnaden i medellön mellan yngre och äldre bland männen respektive bland kvinnorna. Jämför dessa skillnader med skillnaden mellan åldersgrupperna i b). e) Vilka tjänar egentligen genomsnittligt bäst, yngre eller äldre. Utred frågan. f) Kan man hävda att det föreligger lönediskriminering av kvinnorna på vårdcentralen? Skulle slutsatsen förändras om Du fick veta att personerna nr 4, 5, 11, 12, 13, 14 och 15 är läkare och/eller chefer medan de övriga är annan vårdpersonal och administrativ personal. Formulera några tankar. Övning 9 Under rubriken Ordentliga förare i flest dödsolyckor kunde man i en artikel i Dagens Nyheter den 17 december 1999 läsa bl. a följande "Hela 62 % av de omkomna använde bilbälte." a) Kan man av den citerade uppgiften dra slutsatsen att användande av bilbälte ökar risken för bilförare att dödas i trafiken? b) Antag att cirka 85 % av alla bilförare använder bilbälte. Hur många gånger större (eller mindre) risk att dödas i trafiken löper en förare med bilbälte jämfört med en förare utan bilbälte? (Ledning: Antag att procentangivelsen i artikeln är korrekt.) Övning 10 I en kommun avser man byta ekonomiskt redovisningssystem. Det kommer därför bli aktuellt att utbilda personalen på det nya systemet. Man tar fram två utbildningsmaterial avsedda i huvudsak för självstudier och testar de båda materialen på två av kommunens förvaltningar, det ena materialet på en förvaltning och det andra på den andra. Syftet är att komma underfund med vilken metod som ger kortast inlärningstid och därmed är minst resurskrävande. Fortsättning på nästa sida 20
De anställda på de två förvaltningarna för noggrann bok över den tid som går åt för att ta sig igenom studiematerialet, så att man klarar av slutprovet. Resultaten redovisas i tabellen, där man delat in de anställda på de båda förvaltningarna efter ålder i två grupper - Äldre och Yngre - och efter datorvana i två grupper med stor respektive liten vana. Följande resultat erhålls: Genomsnittlig inlärningstid i timmar samt antal anställda (inom parantes) Grupp Material A, Förvaltning I Material B, Förvaltning II Äldre, stor vana 18 (22) 16 (16) Äldre, liten vana 27 (18) 26 (32) Yngre, stor vana 17 (36) 16 (22) Yngre, liten vana 26 (14) 23 (40) a) Beräkna den genomsnittliga inlärningstiden för vart och ett av de båda utbildningsmaterialen. b) Beräkna standardvägda medeltal för inlärningstiden för vart och ett av de båda utbildningsmaterialen. Välj standardvikter proportionella mot samtligas fördelning på åldersgrupp och datorvana. c) Jämför resultaten under a) och b) och kommentera. Förklara varför det blir så här i just detta fall. Övning 11 Man vill jämföra två sjukhus A och B med avseende på operationsresultat. Under en given tidsperiod har 2000 operationer genomförts på sjukhus A medan man på det mindre sjukhuset B genomfört 800 operationer under samma period. Av tabellen som följer på nästa sida framgår komplikationsandelen efter operation för de båda sjukhusen efter operationernas svårighetsgrad. Operationerna har delats in i mindre respektive större operationer (efter ingreppets svårighetsgrad). I varje "cell" ges också totala antalet operationer av det aktuella slaget (inom parantes). Exempelvis kan man i tabellen på nästa sida se att bland 600 mindre operationer utförda på sjukhus B, så har 2.0 % lett till komplikationer. Svårighetsgrad Sjukhus A Sjukhus B Mindre 1.0% (600) 2.0% (600) Större 3.5% (1400) 4.0% (200) Samtliga 2000 800 a) Beräkna den totala komplikationsandelen (andelen operationer som leder till komplikationer) för sjukhus A och motsvarande mått för sjukhus B. b) Beräkna "standardvägda komplikationsandelar" på vart och ett av sjukhusen. Använd standardvikter som är proportionella mot totala antalet patienter som genomgått mindre respektive större operation. c) Jämför resultaten under a) och b) och försök reda ut hur det kommer sig att resultaten blir som de blir. 21
Övning 12 I ett företag vill man undersöka om det finns något samband mellan anställningstid i företaget och sjukfrånvaro. Man undersöker inledningsvis hur sambandet ser ut på företagets minsta avdelning, där det finns åtta personer anställda. Följande data tas fram: Person nr 1 2 3 4 5 6 7 8 Antal sjukdagar, y 4 8 17 2 1 2 6 8 Anställningstid, antal år, x 2 4 1 6 6 8 2 3 a) Beskriv materialet i ett tvådimensionellt punktdiagram, (spridningsdiagram). b) Beräkna korrelationskoefficienten, r, mellan x och y i materialet. c) Förklara i termer av antal år, x, och antal sjukdagar, y, hur det beräknade värdet på korrelationskoefficienten kan tolkas. d) Kan man av den gjorda analysen dra slutsatsen att det observerade sambandet är ett orsakssamband? Motivera svaret. 22