Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 1 januari 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel- och tabellsamling (skall returneras) samt miniräknare. Ansvarig lärare: Leif Ruckman, 0705-75961 Övrigt: Varje uppgift kan ge max 10p. Lösningar skall utansvårighet kunna följas. Införda beteckningar skall förklaras. För betyget Godkänd krävs minst 30 p och för Väl godkänd krävs 45 p. Uppgift 1. En tandläkare har genomfört en statistisk undersökning bland sina patienter. Han frågade dem hur många dagar i veckan de normalt sett brukar hoppa över tandborstningen på morgonen. Svaren från de 10 patienterna som tillfrågades blev följande: Antal överhoppade dagar 0 1 3 4 5 6 7 frekvens 46 19 14 1 3 16 3 18 Dessa 10 patienter kan betraktas som ett slumpmässigt urval av tandläkarens hela patientgrupp som totalt består av 800 patienter. Vi förutsätter att patienterna har givit korrekta svar i det följande. 1a Skatta hur många dagar i snitt som tandläkarens patienter hoppar över borstningen på morgonen. 1b Gör ett konfidensintervall med 95 % konfidensgrad för parametern μ. 1c Beskriv vad parametern μ står för i detta sammanhang och förklara innebörden av konfidensintervallet. Anmärkning: I praktiken finns det flera felkällor inblandade när det gäller denna typ av undersökningar: man kanske inte vill medge för sin tandläkare att man fuskar med tandborstningen, det kan det vara svårt att komma ihåg hur ofta man hoppar över, ska semesterveckor räknas som normala veckor? (man kanske inte hoppar över lika ofta en arbetsvecka som en semestervecka),.
Uppgift. I en spelhall finns det ett stort antal olika spel, bland annat ett tärningsspel. Det kostar 10 kronor att spela en omgång av detta spel. Om du vinner omgången så får du 100 kronor, förlorar du så får du inget. Om du tänker spela spelet eller inte beror av vinstsannolikheten π för en enskild omgång. Men denna vet du ju tyvärr inte. Av spelets regler inser du dock att det ganska enkelt går att skriva ett litet program i SPSS som simulerar detta tärningsspel. Du går därför hem och gör detta. När din dator spelat 1000 omgångar av spelet visade det sig att det blev vinst i 115 av dessa omgångar. a Skatta vinstsannolikheten π. b Gör ett konfidensintervall för π med 95 % konfidensgrad. c Skatta din genomsnittliga nettovinst per omgång (i kronor). d Gör ett konfidensintervall för den genomsnittliga nettovinsten per omgång. e Vad kan du dra för slutsatser när det gäller om spelet är lönsamt i långa loppet för dig eller inte. Uppgift 3. En storförbrukare av glödlampor vet av erfarenhet att glödlampor av sort A, den sort som man hittills köpt in, har en genomsnittlig brinntid på 150 timmar. Nu vill man testa en ny sort, sort B, för att se om den eventuellt är bättre. Man har tagit ett slumpmässigt urval omfattande 1 lampor av sort B och mätt deras brinntid, resultatet framgår nedan. 1356 1701 1306 180 1534 1115 1359 164 1014 190 1165 181 Man har bestämt att om man med 95 % säkerhet lyckas bevisa att sort B är bättre så köper man i fortsättningen in sort B, i annat fall fortsätter man som vanligt att köpa in sort A. 3a Sätt upp hypoteserna för testet. 3b Ange beslutsregeln för testet. 3c Räkna ut observerat värde på testvariabeln och formulera slutsatser. 3d Vilken sort kommer företaget att köpa in i fortsättningen?
Uppgift 4. I ett laboratorium bestämmer man smältpunkten för olika metallegeringar. Bland annat ville man veta smältpunkten för olika blandningar av metall A och metall B. I tabellen nedan redovisas resultatet av 8 olika smältpunktbestämningar. Anpassa en regressionsmodell y a + bx till datamaterialet i tabellen nedan där x är andelen av metallen A i legeringen (i procent) och y är smältpunkten ( i Celsius grader). Illustrera data och modell med en lämplig graf. x (%) 3 3 4 4 5 5 y ( C) 10 110 10 130 145 150 155 170 Uppgift 5. 5 x En slumpvariabel X har sannolikhetsfunktionen P( x) för x 1,, 3, 4. 10 5a Beräkna väntevärdet för X. 5b Beräkna standardavvikelsen för X. 5c Bestäm fördelningsfunktionen F ( x). 5d Anta att X 1,..., X 50 är 50 stycken oberoende slumpvariabler som alla följer samma fördelning som X ovan. Beräkna sannolikheten att summan Y X 1 +... + X 50 blir minst 90. Uppgift 6. Centrala gränsvärdessatsen, CGS, är mycket viktig inom statistisk teori. Ange i vilka av uppgifterna 1-5 ovan du kan dra nytta av CGS och på vilket sätt du utnyttjar satsen i dina beräkningar.
Lösningar till tentamen i statistik, 06011 Uppgift 1. fx 86 fx 15 fx 86 x.383 dagar n 10 s 7.0619.657 dagar s fx ( fx) n 1 n 86 15 10 119 7.0619 a) µ x.383 dagar s N n 7.0619 800 10 b) x ± 1.96.383 ± 1.96.383 ± 0. 438 n N 10 800 [1.945,.81] 95% Då n10 kan vi anta att stickprovsmedelevärdet är approximativt NF enl CGS och använder konstanten 1.96 i beräkningen. c) µ är genomsnittligt antal dagar per vecka som de 800 personerna i populationen hoppar över tandborstningen. Konfidensintervallet ringar in detta värde och med 95% säkerhet återfinns µ inom det framräknade intervallet. Uppgift. 115 a) π p 0. 115 1000 b) Då np(115 > 5) är stort kan vi enligt CGS skapa ett 95% konfidensintervall för π p( 1 p) enligt p ± 1.96 n 1 0.115 0.885 0.115 ± 1.96 0.115 ± 0.00 [0.095, 0.135] 95% 999 Med 95% säkerhet ligger vinstchansen för spelet inom framräknat intervall. c) Y Nettovinst 0-10 -10 100-10 90 Skattad sannolikhet 0.885 0.115 Y ( ) 10 0.885 + 90 0.115 1. 5 E kronor
d) σ Y ( 10) 0.885 + 90 0.115 1.5 1017. 75 1017.75 95% konfidensintervall 1.5 ± 1.96 1.5 ± [-0.5, 3.5] 95% 1000 Vid ett stort antal spel ligger den genomsnittliga nettovinsten per spel mellan -0.5 kronor och 3.5 kronor. e) Då intervallet i d) innehåller både negativa och positiva värden går det inte att dra någon säker slutsats om för vem spelet är lönsamt i långa loppet. Uppgift 3. X Brinntid a) H 0 : µ B 150 H 1 : µ B > 150 b) Signifikansnivå: α 5% x 150 Testfunktion t är t-fördelad med 11 frihetsgrader om X är s / n normalfördelad. Beslutsregel: Förkasta nollhypotesen om t obs > 1.80 (från t-tabell, ensidigt test 11 fg) c) x 1335.4 timmar s 01.639 1335.4 150 t obs 1.467 < 1.80 Nollhypotesen kan ej förkastas. 01.639 / 1 Det finns inget stöd i insamlade data för att genomsnittlig brinntid för lampor av typ B skulle överstiga 150 timmar. d) Då man inte kunnat visa att B skulle vara bättre än A så fortsätter man att köpa A.
Uppgift 4. X Y X XY 10 4 440 110 4 40 3 10 9 6360 3 130 9 6390 4 145 16 8580 4 150 16 8600 5 155 5 10775 5 170 5 10850 8 17100 108 60015
b n n xy x x y ( x) 8 60015 8 17100 16.5 8 108 8 17100 8 a y bx 16.5 079.75 8 8 y 079.75 + 16. 5x Uppgift 5. X 1 3 4 P ( x) 5 x 10 0.4 0.3 0. 0.1 F(x) Σp(x) 0.4 0.7 0.9 1.0 a) E(X) µ Σxp(x) 1 0.4 + 0.3 + 3 0. + 4 0.1 b) V ( X ) x p( x) µ 1 0.4 + 0.3 + 3 0. + 4 0.1 1 σ V ( X ) 1 1 c) Se tabellen ovan. d) Y ΣX i är approximativt NF enl CGS då antalet termer i summan överstiger 30. E(Y) E(ΣX) ΣE(X) 50. 100 V(Y) V(ΣX) ΣV(X) 50. 1 50 σ y V ( Y ) 50 Y E( Y ) σ y 89.5 100 50 ( 90 ) P P( Z 1.48) P( Z 1.48) [ tabell] 0. 9306 P Y
Uppgift 6. Centrala gränsvärdessatsen, CGS, är mycket viktig inom statistisk teori. Ange i vilka av uppgifterna 1-5 ovan du kan dra nytta av CGS och på vilket sätt du utnyttjar satsen i dina beräkningar. Uppgift Koppling till CGS 1 För att få fram konstanten 1.96 i konfidensintervallsberäkningen utnyttjar vi CGS som säger att x är approximativt normalfördelat. I konfidensintervallsberäkningarna utnyttjas CGS på samma sätt som i uppgift 1. 3 För att lösa uppgiften antas att X är normalfördelad. CGS behövs därför inte i denna uppgift. 4 CGS används ej 5 I d) antar vi att Y är approximativt normalfördelad enligt CGS eftersom vi har mer än 30 termer i summan. Approximationen låter oss göra en enkel normalfördelningsberäkning istället för att beräkna sannolikheten exakt.