LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik A1, 15 hp Antal uppgifter: 6 Krav för G: 13 Lärare: Robert Lundqvist, tel 49 24 04 Jour: Robert Lundqvist, tel 49 24 04 Resultatet anslås senast: 22/12 2009 Tillåtna hjälpmedel: En statistikbok, gärna Introduction to the Practice of Statistics av Moore & McCabe. Undantag: kombinationen Praktisk statistik/räkna med slumpen Miniräknare Tänk på att redovisa dina lösningar på ett klart och tydligt sätt. Endast det numeriska svaret räcker inte för full poäng. Korrekt lösning ger det poängantal som står angivet efter uppgiftstexten. LYCKA TILL!
Tentamen i Statistik A1, S0002M, 2009-12-17 2
Tentamen i Statistik A1, S0002M, 2009-12-17 I alla lösningar förutsätts du ge tydliga beskrivningar av såväl förutsättningar som frågeställning. Det innebär att händelser, slumpvariabler och fördelningar/slumpmodeller ska beskrivas tydligt. 1. I fastighetsenheten inom en större organisation vill man se hur lokaler man ansvarar för utnyttjas. Det finns totalt 14 hus, och i vart och ett av dessa finns en typ av sammanträdesrum. För en given månad sammanställs beläggningen, dvs andel av tillgänglig tid som lokalerna utnyttjas, för alla dessa 14 rum. Resultatet ges i nedanstående tabell: 0.264 0.277 0.284 0.239 0.219 0.261 0.250 0.254 0.233 0.270 0.268 0.261 0.243 0.246 (a) Beskriv beläggningen i ett stambladdiagram. (b) Beräkna median, undre och övre kvartil för beläggningen. Du ska tydligt ange hur du definierat dessa. (c) Beskriv beläggningen i en boxplot. (6p) 2. I en undersökning av konsumtion av mjölkprodukter ingick frågor om vilket märke på laktosfri mjölk som personerna i undersökningen hade provat. Det visade sig att märke N hade köpts av 15% av personerna i undersökningen och märke V hade köpts av 12%. Dessutom visade det sig att 8% hade provat båda. (a) Hur stor är sannolikheten att en slumpmässigt utvald person i gruppen har köpt minst en av de aktuella produkterna? (b) Hur stor är sannolikheten att en slumpmässigt utvald person i gruppen inte har köpt någon av de aktuella produkterna? (c) En slumpmässigt utvald person visade sig ha köpt en produkt av märke N. Hur stor är då sannolikheten att den personen också hade köpt en produkt av märke V? (4p) 3. På ett visst universitet erbjuder man i en kurs studenterna träffar med en personlig handledare. Handledaren har tagit för vana att se hur många studenter som anmäler intresse för sådana träffar, och med den historiken har det visat sig rimligt att säga att det är 70% chans att högst 1 student per dag anmäler sig för handledning. Vad blir då sannolikheten att det under 5 dagar blir högst 1 anmäld student per dag? Utgå från att antalet anmälningar en dag är oberoende av antalet en annan dag. (3p) 1
Tentamen i Statistik A1, S0002M, 2009-12-17 4. Efterfrågan på blyfri bensin, 95 oktan, på en viss macken vanlig måndag har visat sig kunna beskrivas med en normalfördelning där genomsnittet är 27 000 liter och standardavvikelsen är 2 000 liter. (a) Hur stor är sannolikheten att efterfrågan överstiger 30 000 liter? (b) Hur många liter bensin måste finnas i tanken en måndag för att det ska vara högst 5% sannolikhet att bensinen tar slut, dvs att efterfrågan är större än den tillgängliga volymen? (4p) 5. I en större organisation har man sett att andelen fakturor med felaktiga detaljer är 8%. Den andelen mäts regelbundet och redovisas för både hela organisationen och enheter inom densamma. Andelen skattas genom stickprovsundersökningar som görs genom att ett antal av det föregående årets fakturor väljs ut slumpmässigt och de utvalda fakturorna granskas sedan noggrant. Med fel menas här allt från fel datum och kontaktuppgifter till felaktiga summor. I en enhet har man tagit ut 200 fakturor. Antalet fakturor med fel bland dessa var 12. Om 8% antas vara den sanna andelen i hela organisationen, kan man med detta resultat i enheten påvisa att andelen där är lägre än vad den är i organisationen? Besvara frågan genom att göra ett lämpligt hypotestest. Där ska det tydligt framgå vilka hypoteser du använder, vad du grundar dina slutsatser på och förstås även vad dina slutsatserär. (5p) 6. Monteringstid för en större del i en s k personlyft som används för patienter som ligger till sängs ska sättas under luppen. Monteringen är inte helt enkel, och för att få ett underlag för förbättring har monteringstiden mätts för en grupp montörer, se nedanstående tider (enhet: minuter). Vad är den genomsnittliga monteringstiden? Besvara frågan genom att bestämma ett lämpligt konfidensintervall med konfidensgraden 90%. Du kan utgå från att tiden kan beskrivas med en normalfördelning. I din lösning ska det förstås framgå tydligt hur införda variabler är definierade, likaså ska antaganden om fördelning/slumpmodell vara tydligt beskrivna. 28 31 29 30 29 (4p) 2
Svar till tentamen i Statistik A1, S0002M, 2009-12-17 1. (a) Ett stambladdiagram för andelen av tiden som rummen används kan se ut på följande sätt: The decimal point is 2 digit(s) to the left of the 20 9 22 39 24 3604 26 114807 28 4 (b) Medianen blir det mittersta värdet, dvs värde nr 7.5 eller medelvärdet av 6:e och 7:e värdet. Här blir det 0.2575. Undre kvartil (q 1 ) blir mitten i undre halvan, dvs värde nr 4 som här råkar vara 0.243. Övre kvartil (q 3 ) blir på motsvarande sätt 0.268. (c) 0.22 0.23 0.24 0.25 0.26 0.27 0.28 2. Låt N stå för händelsen att en person har köpt produkt av märke N, och V för motsvarande händelse för märke V. Då gäller att P(N) = 0.15, P(V) = 0.12 och P(N och V) = 0.08. (a) P(minst en av produkterna) = P(N eller V) = = P(N)+P(V)+P(N och V) = 0.15+0.12 0.08 = 0.19 3
Svar till tentamen i Statistik A1, S0002M, 2009-12-17 (b) P(en person har inte köpt någon av produkterna) = = 1 P(minst en av produkterna) = 1 0.19 = 0.81 (c) P(V N) = P(V och N) P(N) = 0.08 0.15 0.533 3. Låt X står för antalet anmälningar under en dag. Då gäller att X bör kunna beskrivas med en binomialfördelning där n = 5 och p = 0.70. Det som söks är P(X 1) = P(X = 0)+P(X = 1) = 0.00243+0.02835 = 0.03078 Här behäver man använda sannolikhetsfunktionen för X, dvs ( ) 5 P(X = k) = 0.7 k 0.3 5 k, k = 0, 1, 2, 3, 4, 5 k Ett annat sätt är att utgå från att det är händelsen att det inte blir högst 1 anmälan per dag. Den händelsen har sannolikheten 0.30. Om Y står för antalet dagar då det inte kommer högst 1 anmälan per dag är Y binomialfördelad med n = 5 och p = 0.3. Det som ska beräknas är P(X 1), men det måste vara detsamma som P(Y 4). Den sannolikheten kan hittas i tabell för binomialfördelningen: P(Y 4) = P(Y = 4)+P(Y = 5)) = = 0.02835+0.00243 = 0.03078 4. Låt E stå för efterfrågan på blyfri bensin. Den variabeln sägs kunna beskrivas med en normalfördelning där genomsnittet är 27 000 liter och standardavvikelsen är 2 000 liter. (a) P(efterfrågan överstiger 30 000) = ( E 27000 = P(E 30000) = P 2000 ) 30000 27000 = 2000 = P(Z 1.5) = 1 P(Z < 1.5) = 1 0.9332 = 0.0668 4
Svar till tentamen i Statistik A1, S0002M, 2009-12-17 (b) Det som söks är det värde c som gör att P(E c) = 0.05. ( E 27000 P(E c) = P c 27000 ) = P(Z c) = 0.05 2000 2000 Enligt tabell är P(Z > 1.645) = 0.05, vilket betyder att c 27000 2000 = 1.645 vilket i sin tur betyder att c = 30290 liter. 5. Det som ska göras är ett hypotestest med hypoteserna H 0 : p = 0.08 mot H a : p < 0.08 där p betecknar andelen felaktiga fakturor i hela populationen av fakturor i organisationen. Ett stickprov har tagits ut om 200 fakturor, och stickprovsandelen där blev ˆp = 12/200 = 0.06. Första steget är beräkna textvariabeln: z = ˆp p 0 p0 (1 p 0 ) n = 0.06 0.08 0.08(1 0.08) 200 = 1.0426 Nästa steg är att beräkna p-värdet, dvs att se vad P(Z 1.0426) blir. I tabellen kan man utläsa att detta är ungefär 14.9%. Detta kan inte betraktas som något särskilt starkt stöd för mothypotesen, dvs en rimlig slutsats är att nollhypotesen accepteras. Annorlunda uttryckt: vi kan inte visa att andelen felaktiga fakturor är lägre än den som gäller i hela organisationen. 6. Om X står för monteringstid gäller att vi ska kunna beskriva den variabeln med en normalfördelning. Det som söks är ett konfidensintervall för µ, och ett sådant ges av uttrycket x ±t s n Här är x = 29.4, s = 1.140175 och n = 5. För att få fram värdet på t tas tabellen för t-fördelningen med 4 frihetsgrader: t är det värde som gör att en t(4)-fördelad variabel T uppfyller P(T > t ) = 0.05. Tabellen ger att t = 2.132. Detta ger sammantaget intervallet [28.31, 30.49]. 5