Tentamen i Matematisk statistik, S0001M, del 1, 007-10-30 1. En viss typ av komponenter tillverkas av en maskin A med sannolikheten 60 % och av en maskin B med sannolikheten 40 %. För de komponenter som tillverkas i maskin A är sannolikheten % att komponenter blir defekt. Motsvarande siffra för maskin B är 5 %. a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt. Ange ditt svar i procent med en decimals noggrannhet. b) Bestäm sannolikheten att en komponent som visat sig vara defekt har tillverkats av maskin B? Ange ditt svar i procent med en decimals noggrannhet.. På ett lager som håller vitvaror har man kunnat konstatera att antalet beställningar på en viss typ av kylskåp som kommer in under en arbetsvecka kan beskrivas av en Poissonfördelning med väntevärde μ = 6. a) Hur många kylskåp av denna typ bör man ha på lagret vid starten av en arbetsvecka om man vill att sannolikheten att lagret ska bli tomt vid arbetsveckans slut ska vara högst 5 %? b) Antag att antalet beställningar under olika arbetsveckor är oberoende. Betrakta 10 arbetsveckor, där antalet beställningar är fördelat enligt Poissonfördelningen som angivits i a) ovan. Vad blir standardavvikelsen för det totala antalet beställningar över tio veckors tid? Ange ditt svar med två decimalers noggrannhet. (1p) 3. Ett företag som säljer en viss vara har efter kundundersökningar kunnat konstatera att fördelningen för vad en slumpmässigt vald kund är beredd att betala för en viss vara (enhet: kronor) kan beskrivas av en kontinuerlig fördelning med frekvensfunktion 00 x f ( x) = 0000 0 0 x 00 f. ö. a) Vad är sannolikheten att en kund är beredd att betala mer än 150 kronor för varan? Ange ditt svar i procent med två decimalers noggrannhet. b) Bestäm fördelningens väntevärde. Ange ditt svar med en decimals noggrannhet. 4. Det har visat sig att varvtalet vid tomgångskörning hos en slumpmässigt vald Volvo 744 av 1990 års modell kan beskrivas av en normalfördelning med väntevärde μ = 750 rpm och standardavvikelsen σ = 30 rpm. a) Vad är sannolikheten att en slumpmässigt vald Volvo 744 av 1990 års modell har ett varvtal vid tomgångskörning som överstiger 800 rpm? Ange ditt svar i procent med en decimals noggrannhet. (1p) - 1 -
Tentamen i Matematisk statistik, S0001M, del 1, 007-10-30 b) Bestäm det varvtal vid tomgångskörning som en slumpmässigt vald Volvo 744 av 1990-års modell överstiger med med sannolikheten 80 %. Ange ditt svar i rpm, utan decimaler. 5. Man vill avgöra om en lång rulle metalltråd är gjord av ren koppar eller ej genom att undersöka trådens resistans. Teoretiska beräkningar ger att trådens resistans är 55 Ohm per meter om den är gjord av ren koppar. Om mätapparaturen vet man att den ger ett mätresultat som kan beskrivas med hjälp av en normalfördelning med väntevärde μ och standardavvikelse σ =. Man gör 8 mätningar av resistansen, vilka anges nedan: 53.7 56.1 55. 5.3 58.9 55. 51.1 53. a) Man beslutar sig för att använda ett enkelsidigt hypotestest där man förkastar nollhypotesen att tråden är gjord av rent koppar om medelvärdet av observationerna överstiger en kritisk gräns k. Bestäm k då vi använder oss av en signifikansnivå på 5 %. Ange ditt svar med två decimalers noggrannhet. b) Ange den övre gränsen i ett dubbelsidigt 95 % konfidensintervall över trådens förväntade resistans. Ange ditt svar med två decimalers noggrannhet 6. Ett -försök gjordes med syftet att undersöka en viss kemisk process. Den uppmätta variabeln var procentuellt utbyte. Faktorerna och deras nivåer beskrivs nedan. Tabell 1: Nivåer för de ingående faktorerna: Faktor Låg nivå ( ) Hög nivå ( ) Temperatur (A) 160 o C 180 o C Katalysator (B) Leverantör 1 Leverantör I varje försökspunkt gjordes tre oberoende körningar av processen. Försöksmatrisen i tabell illustrerar nivåerna och resultaten vid det fullständiga faktorförsök som gjordes. Tabell : Resultaten presenterade i standardordning: Försök nr A B Y 1 Y Y 3 1 59 61 60 + 74 70 71 3 + 50 54 53 4 + + 81 85 84 a) Skatta samspelseffekten för A och B. Ange ditt svar med en decimals noggrannhet. (1p) b) Bestäm standardavvikelsen för en effekt dvs s effekt. Ange ditt svar med minst två decimalers noggrannhet. - -
Tentamen i Matematisk statistik, S0001M, del 1, 007-10-30 7. Kraftbolag önskar ofta göra prognoser av den maximala effekten (Y, enhet: megawatt) som efterfrågas per dag. Ett kraftföretag ville med hjälp av dagsmedeltemperaturen (X, enhet: C, 0 < X < 0) under en vintermånad i en region i norra Sverige hitta en modell över efterfrågad effekt. Resultatet av en enkel linjär regressionsanalys baserat på observationer över 30 dagar ges i tabell 3. a) Hur stor påverkan på efterfrågad effekt har en ökning av dygnsmedeltemperaturen med en C? Besvara frågan genom att skapa ett 98 % konfidensintervall (dubbelsidigt). Ange den övre gränsen i ett sådant intervall med två decimalers noggrannhet. b) Bestäm en punktskattning av den efterfrågade effekten om dygnmedeltemperaturen är -15 C. (1p) c) Bestäm modellen förklaringsgrad. Ange ditt svar i procent med en decimals noggrannhet. (1p) Tabell 3 The regression equation is Effekt = 48,89 1.6433 Temperatur Predictor Coef SE Coef T P Constant 48,89 15,6677 3.105 0.036 Slope -1,643 0,177 9.84 0.000 Analysis of Variance Source DF SS MS F P Regression 1 3375,6 3375,6 43,61 0,000 Residual Error 8 168,4 77,4 Total 9 5544,0 Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! - 3 -
Tentamen i Matematisk statistik, S0001M, del 1, 007-10-30 Tabell för svar till del 1. Riv ut och lägg svarsbladet först i tentamen! Namn... Personnummer... Fråga Svar Poäng 1 a Sannolikhet 3. b Sannolikhet 6.5 a Antal 11 b Standardavvikelse 7.75 1 3 a Sannolikhet 6.5 b Väntevärde 66.7 1 4 a Sannolikhet 4.8 b Varvtal (rpm) 75 5 a Kritisk gräns 56.16 b Övre gräns 55.85 6 a Samspelseffekt 9.7 1 b Standardavvikelse 1.08 7 a Övre gräns -1.0 b Punktskattning 73.54 1 c Förklaringsgrad 60.9 1 Totalt antal poäng 5 Lycka till! - 4 -
Tentamen i Matematisk statistik, S0001M, del (för överbetyg), 007-10-30 Vid bedömningen av lösningarna av uppgifterna i del läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 8. Ett gammaldags signalsystem för elektroniska pulser består av en sändare och en mottagare. Hos mottagaren finns tre möjliga kanaler för att ta mot pulser; A, B och C. Det är samma sannolikhet för en puls att hamna hos var och en av de öppna kanalerna. Sändaren skickar ut en serie på fem pulser med intervallet 1 ms mellan varje puls. Tiden det tar för en puls att färdas mellan sändare och mottagare anses vara försumbar, men man vet att mottagaren behöver 1, ms för att behandla en signal. Detta betyder att den kanal som tar emot signalen är stängd under behandlingstiden, innan den återigen kan öppnas för att ta mot pulser. Antag att kanalen A behandlar en puls korrekt, medan kanalerna B och C utför en defekt behandling. Betrakta 3000 pulsserier, var och en bestående av 5 pulser som sänds med intervallet 1 ms. Efter att en pulsserie om fem pulser sänts så har sändaren ett uppehåll på 10 ms innan den startar nästa pulsserie. Detta gäller alla 3000 pulsserier. Bestäm sannolikheten att minst 4950 signaler har behandlats korrekt. Antag att behandlingen i sändaren av var och en av pulsserierna kan ses som oberoende händelser. (10p) 9. Man vill jämföra effekten av en ny typ av foder för boskap innan och efter två månaders utfodring. Man valde att testa fodret på sju slumpmässigt utvalda kalvar i samma ålder. Värdena som erhölls var vikt (enhet: kilo) före och efter utfodring. Kalv 1 3 4 5 6 7 Före 300 70 340 38 96 335 90 Efter 335 314 37 365 338 37 318 Normal viktökning för en kalv i den givna åldern är 30 kilo över två månaders tid. Mätvärdena för vikten kan antas vara observationer på normalfördelade stokastiska variabler. Undersök om man kan påvisa någon effekt i form av tillväxtökning för denna nya typ av foder med hjälp av ett lämpligt konfidensintervall med konfidensgrad 95 %. De antaganden som görs ska tydligt framgå. Tolka dina slutsatser tydligt i ord. (8p) 10. Vid tillverkning av hållare till rullningslager stansas hållaren ur mässingsplåt. För att ta upp de grader som uppstår vid stansningen blästras hållaren före montering. För att minska kostnaden för denna operation önskar man byta den hittills använda sjösanden mot stålsand. Tanken på detta är inte ny, men de försök som gjorts gav ett ganska negativt resultat. Genom mer systematiskt planerade försök tror man sig nu kunna anpassa blästringsprocessen så att stålsanden ger ett resultat som är jämförbart med sjösan- - 5 -
Tentamen i Matematisk statistik, S0001M, del (för överbetyg), 007-10-30 dens. Som resultatparameter beslutade man sig för att studera hur ytjämnheten (enhet: mm) påverkades av fyra olika faktorer. Dessa anges i tabell 3. Därefter gjorde man ett fullständigt 4 -faktorförsök utan replikat. Resultatet anges i tabell 4. a) Bestäm en skattning av fyrfaktorsamspelet samt ange vilka effekter som är signifikanta med 1 % signifikansnivå. Hypoteser, beslutsvariabel och eventuella antaganden ska tydligt framgå. Ange också och motivera med ord nivån på respektive faktor då man önskar maximera ytjämnheten. b) Ange den skattade modellen samt de antaganden som ligger till grund för denna modell. Ange dessutom en skattning av standardavvikelsen för resultatvariabeln Y. (8p) (4p) Tabell 3: Faktorerna och deras respektive nivåer Faktorer Låg nivå ( ) Hög nivå (+) Blästringshastighet (A, enhet: %) 80 100 Blästringstid (B, enhet: minuter).5 5 Sandstorlek (C) liten stor Sandens kondition (D) gammal ny Tabell 4: Resultat av försöket samt försöksplan A B C D Y 3.83 + 4.85 +.9 + + 3.65 + 4.4 + + 4.97 + + 4.04 + + + 5.7 + 4.16 + + 7.16 + + 4.3 + + + 6.4 + +.65 + + + 4.4 + + + 3.45 + + + + 3.78-6 -
Tentamen i Matematisk statistik, S0001M, del (för överbetyg), 007-10-30 Tabell 5: Skattningar av huvudeffekter och samspel t.o.m. ordning 3 Estimated Effects and Coefficients for Y (coded units) Term Effect Coef Constant 4,3663 A 1,355 B -0,95 C -0,575 D 0,900 A*B -0,35 A*C -0,385 A*D 0,450 B*C 0,405 B*D 0,100 C*D -1,3900 A*B*C 0,045 A*B*D -0,850 A*C*D -0,4350 B*C*D -0,1500-7 -
Losningar till del tentamen i Matematisk statistik, S0001M, 007-10-30 Uppgift 8 För en signalserie önskar vi bilda en sannolikhetsfördelning. För detta utnyttjar vi följande förhållanden som ges via texten: För den första signalen som sänds ut gäller att: P(signal hamnar i kanal A) = P (signal hamnar i kanal B) = P(signal hamnar i kanal C) = 1/3 P(signal hamnar i kanal A i steg i+1 signal i kanal A i steg i) = P(signal hamnar i kanal B i steg i+1 signal i kanal B i steg i) = P (signal hamnar i kanal Cistegi+1 signal i kanal C) = 0 P(signal hamnar i kanal A i steg i+1 signal i kanal B i steg i) = P(signal hamnar i kanal A i steg i+1 signal i kanal C i steg i) = 1/ P(signal hamnar i kanal B eller C i steg i+1 signal i kanal A i steg i) = 1 Vi kan ur förhållandet att en signal inte kan hamnar i samma kanal två pulser i följd inse att det möjliga pulser som behandlas korrekt (dvs hamnar i kanal A) kommer anta något av värdena 0,1,,3. P(0 signaler behandlas rätt) = P(B eller C i steg 1)P(B eller C i steg B eller C i steg 1)P(B eller C i steg 3 B ellercisteg)p(b eller C i steg 4 B eller Cisteg3)P(B eller C i steg 5 B ellerc4steg1)= 3 0.54 = 1 4 P(1 signal behandlas rätt) = P(signal skickas rätt i steg 1, men fel i övriga)p(signal rätt i steg, men fel i övriga)...p (signal rätt i steg 5, men fel i övriga) = 1 3 0.53 +3 3 0.53 + 3 0.54 = 8 4 På liknande sätt kan vi sedan resonera vidare och hitta P( signaler behandlas rätt) = 13 4 P(3 signaler behandlar rätt) = 4 E[ξ] = 8 13 4 1+ 4 + 4 3= 5 3 V [ξ] =( 5 3 ) 1 4 +( 3 ) 8 4 +(1 13 3 ) 4 +(4 3 ) 4 =0.47 Vi bildar η = antal signaler som behandlas korrekt då 3000 signalserier skickas ut, och kan med hjläp av CGS inse att η N(5000, 37.6) P(η > 4950) = 1 φ( 1, 33) = 0.91 1
Losningar till del tentamen i Matematisk statistik, S0001M, 007-10-30 Uppgift 9 Vi har en situation med stickprov i par där proven kommer enligt. (ξ 1, η 1 ), (ξ, η ),...(ξ 7, η 7 ) ξ i är vikten i kilo före utfodring hos kalv i η i är vikten i kilo efter utfodring hos kalv i där x i är en observation på ξ i N(μ i, σ 1 ),i=1,,...,7 och y i är en observation på η i N(μ i + 4, σ ),i=1,,...,7 Bilda z i = y i x i som är en observation på ς i = η i ξ i N(4, σ) P Bilda medelvärdet z = 7 z i =36.43 i=1 Skatta standardavvikelsen s σ genom följande: σ obs = s = 7P (z i z) =5.5 1 7 1 i=1 Om vi skapar ett 95% konfidensintervall får vi att: s z ± t 0.05 (7 1) 7 =36.43 ±.447 5.5 7 =[31.34, 41.51] Svar: Vi kan med95% säkerhet påvisa att fodret ger en förväntadtillväxtökning, då den förväntade viktökningen ligger mellan gränserna 31.34 41.51 kilo, dvs intervallet innheåller inte den normala viktökningen 30 kilo.
Losningar till del tentamen i Matematisk statistik, S0001M, 007-10-30 Uppgift 10 a) Skatta först samspelet av ordning 4 genom: effekt = Ȳ(+) Ȳ( ) = 0.155 För att ta reda på vilkaefektersomär signifikanta så behöver vi testa H 0 : μ effekt =0 H 1 : μ effekt 6=0 Som testvariabel kan vi använda T = effekt 0 s ef fekt Vi förkastar H 0 om T >t α/ (f), där f =5 s effekt skattas genom att vi använder samspeltermer av ordningen 3 och 4 och vi får att s effekt = 5P 1 5 Zi = 1 5 ((0.045) +( 0.85) +...) =0.064 i=1 dvs s effekt = 0.064 = 0.55 Ur tabell får vi att t 0.005 (5) = 4.03 med detta så får vi att följande effekter är signifikanta huvudeffektasamtsamspeletcd Bilda en samspelsplott mellan C och D. Utifrån denna såfår vi att ytjämnheten maximeras om C på låg nivå ochdpåhög nivå. Samt vi har att huvudfaktor A ska var på hög nivå. Slutsats: För att få en maximal ytjämnhet bör vi ha hög blästringshastighet (A), Stor sandstorlek (C) och ny sand (D). b) Modellantagande: Y i = β 0 + β 1 X 1 + β X 3 + β 3 X 4 + β 4 X 3 X 4 + ε i,i = 1,,...,16 där X 1omfaktornpålåg nivå i 1 om faktorn på hög nivå i =1, 3, 4och(X 1 : A, X 3 : C och X 4 : D) ε i N(0, σ),i=1,,..., 16 ε 1, ε,..., ε 16 oberoende stokastiskavariabler Denskattademodellenblir: ŷ =4.3663 + 1.355 X 1 + 0.575 X 3 + 0.9 X 4 + 1.39 X 3 X 4 = =4.3663 + 0.6765 X 1 0.865 X 3 +0.145 X 4 0.695 X 3 X 4 Spridningen för Y beräknas genom s effekt = V [Y (+) Ȳ( )] =V [Y (+) ]+V [Ȳ( )] = s 8 + s 8 =0.55 =>s= 4 0.55 =0.505 3