Tentamen i Matematisk statistik, S0001M, del 1,

Relevanta dokument
a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Kompletterande kursmaterial till kursen Matematisk statistik.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Antal P(ξ = x)

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik, Föreläsning 5

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Examinationsuppgifter del 2

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

7.5 Experiment with a single factor having more than two levels

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik

8.1 General factorial experiments

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Följande resultat erhålls (enhet: 1000psi):

Tentamen i Matematisk statistik Kurskod S0001M

10.1 Enkel linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen i Matematisk statistik Kurskod S0001M

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tentamen i Matematisk statistik Kurskod S0001M

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Regressions- och Tidsserieanalys - F7

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I MATEMATISK STATISTIK

Regressions- och Tidsserieanalys - F4

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F1

Tentamen i Matematisk statistik Kurskod S0001M

tentaplugg.nu av studenter för studenter

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

Tentamen i Matematisk statistik Kurskod S0001M

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Lycka till!

Uppgift 1. f(x) = 2x om 0 x 1

Tentamen i Matematisk statistik Kurskod S0001M

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Skrivning i ekonometri torsdagen den 8 februari 2007

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Föreläsningsanteckningar till kapitel 8, del 2

Regressions- och Tidsserieanalys - F3

Statistik för teknologer, 5 poäng Skrivtid:

Statistisk försöksplanering

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Transkript:

Tentamen i Matematisk statistik, S000M, del, 008-06-03. Längs en väg in mot centrum av Luleå finns 3 trafikljus. Trafikljusen fungerar oberoende av varandra. En Luleåbo som ofta kör längs den vägen har uppskattat att sannolikheten för att tvingas stanna vid de olika trafikljusen är 0.3, 0.5 respektive 0.4. Vid en bilfärd längs denna väg in mot Luleå, vad är sannolikheten för att trafikljusen ger upphov till a) minst ett stopp? Ange ditt svar i procent utan decimaler. b) exakt ett stopp? Ange ditt svar i procent utan decimaler. Antidepressiv medicin kan som biverkning ge illamående, speciellt i början av behandlingen. Tillverkaren av en ny typ av antidepressiv medicin anser att 5% av de som behandlas med den blir illamående under den första veckan av behandlingen. Anta att en behandlad patient mår illa oberoende av om någon annan behandlad patient gör det. I en studie ska 0 patienter behandlas med den aktuella medicinen. a) Vad är det förväntade antalet patienter som blir illamående av medicinen under den första veckan av behandlingen? Ange ditt svar med decimals noggrannhet. (p) b) Hur stor är sannolikheten att minst av patienterna blir illamående av medicinen under den första veckan av behandlingen? Ange ditt svar i procent med två decimaler. 3. Cairnterriern Sofie får gå lös vid skogspromenader. Hon kommer oftast snabbt till matte vid inkallning. Men om hon nosat upp något som är intressant, t ex en mus, en sork eller något ätbart, så kan det dröja innan hon kommer. Den statistikintresserade matten har funnit att tiden (i minuter) tills Sofie kommit efter inkallning kan beskrivas av en Weibullfördelning med α = 0.8 och β = 0.5. Då blir fördelningsfunktionen för tiden i minuter tills Sofie kommer efter inkallning F( x) x /0.8 = e. a) Bestäm sannolikheten att matte får vänta i mer än 5 minuter på att Sofie ska komma efter inkallning. Ange ditt svar i procent med två decimaler. b) Bestäm mediantiden som matte får vänta efter inkallning. Ange ditt svar i minuter med två decimalers noggrannhet. (p) 4. De passerande bilarnas hastighet mäts vid ett ställe på väg E4, mellan Antäs och Ersnäs. Det visar sig att bilarnas hastigheter i km/tim är normalfördelade N(05,7). Hastighetsbegränsningen på vägsträckan är 0 km/tim. a) Vad är sannolikheten att en slumpvis vald bil har högre hastighet än den högsta tillåtna? Ange ditt svar i procent med en decimals noggrannhet. b) Lastbilarna på samma vägsträcka kör med en hastighet (km/tim) som är normalfördelad N(85,0). Vad är sannolikheten att en slumpvis vald bil kör långsammare än en slumpvis vald lastbil? Ange ditt svar i procent med en decimals noggrannhet. - -

Tentamen i Matematisk statistik, S000M, del, 008-06-03 5. Bensbybonden Birger abonnerar på en bredbandsuppkoppling via ADSL på 8 Mbit. Han tycker dock att nerladdningshastigheten inte motsvarar förväntningarna och bestämmer sig för att kontrollera om internetleverantören verkligen levererar vad han betalar för. Full nerladdningshastighet vid 8 Mbit är 700 Kbyte/s. Birger genomför en serie med 0 försök, med nedladdning från en närliggande server. Medelvärdet av nerladdningshastigheterna för dessa försök är x = 650 Kbyte/s, och den skattade standardavvikelsen är s = 90 Kbyte/s. Antag att nerladdningshastigheten är normalfördelad med samma fördelning för varje nerladdningstillfälle. a) Bestäm ett dubbelsidigt konfidensintervall med konfidensgrad 90% för väntevärdet av nerladdningshastigheten. Redovisa den övre gränsen för konfidensintervallet med en decimals noggrannhet. b) Birger bestämmer sig för att använda hypotesprövning istället. Han använder hypoteserna H : µ = 700 och 0 H : 700 µ < och formulerar beslutsregeln: Förkasta om x 700 s/ 0 < a Bestäm värdet på a så att testet får signifikansnivå 0%. Ange ditt svar med tre decimalers noggrannhet. (p) 6. En flygplanskonstruktör företar vindtunnelprov med en prototyp till en ny flygplanstyp. Speciellt intresserar hon sig för ett par små extravingar som väntas ge flygplanet goda flygegenskaper inom ett visst fartområde. Modellen är byggd så att två vinklar hos nämnda vingpar kan varieras. Vinklarna kallas Vinkel A respektive Vinkel B (enhet: grader). Konstruktören mäter luftmotståndet (enhet: kp) vid en viss hastighet för några olika värden på vinklarna och får totalt 8 observationer. Sedan görs en regressionsanalys med Vinkel A och Vinkel B som förklarande variabler. Delar av resultatet framgår av tabell. Tabell The regression equation is Luftmotstånd = 53. + 8.53 Vinkel A +.44 Vinkel B Predictor Coef SE Coef T P Constant 53.06.33 4.68 0.000 Vinkel A 8.53.080 7.90 0.000 Vinkel B.4430 0.60 6.68 0.000 Analysis of Variance Source DF SS Regression 9486.9 Residual Error 330.0 Total 7 086.9 a) Bestäm residualspridningen. Ange ditt svar med två decimalers noggrannhet. (p) - -

Tentamen i Matematisk statistik, S000M, del, 008-06-03 b) Bestäm den justerade föklaringsgraden. Ange ditt svar i procent med en decimals noggrannhet c) Bestäm ett tvåsidigt 95% konfidensintervall för regressionsparametern som hör till Vinkel A. Ange övre gränsen med två decimalers noggrannhet. 7. Ett 4 -försök gjordes i en kemisk process som producerar en polymer för att hitta vilka av fyra faktorer som påverkar molekulärvikten. De faktorer som studerades och deras nivåer ges i tabell. Skattningarna av huvudeffekterna och samtliga samspelseffekter framgår ges i tabell 3. Tabell. Faktor Låg ( ) Hög (+) A Temperatur (ºC) 00 0 B Katalysatorkoncentration (%) 4 8 C Tid (min) 00 30 D Tryck (psi) 60 75 Tabell 3 Estimated Effects and Coefficients for Molekulärvikt Term Effect Coef Constant 506.5 A 3.75 6.87 B -.5-5.6 C 0.5 00.6 D 6.5 3. A*B 0.00 60.00 A*C 0.00 0.00 A*D -7.50-8.75 B*C -.50 -.5 B*D 7.50 3.75 C*D.50 6.5 A*B*C 6.5 8.3 A*B*D -.5-5.63 A*C*D -8.75-9.38 B*C*D 3.75.87 A*B*C*D -.50 -.5 a) Bestäm standardavvikelsen för en effekt, s effekt, under antagandet att samspelseffekterna av ordning 3 och 4 är försumbara. Ange ditt svar med två decimalers noggrannhet. b) En effekt bedöms vara signifikant skild från 0 om effekt s effekt > c. Bestäm värdet på c som ger ovanstående beslutsregel 5% signifikansnivå. Ange ditt svar med tre decimalers noggrannhet. Slut på del. Glöm inte att bifoga svarsbladet med tentan! (p) - 3 -

Tentamen i Matematisk statistik, S000M, del, 008-06-03 Tabell för svar till del. Riv ut och lägg svarsbladet först i tentamen! Namn... Personnummer... Fråga Svar Poäng a Sannolikhet 79 b Sannolikhet 44 a Väntevärde 3.0 b Sannolikheten 8.44 3 a Sannolikhet 6. b Mediantid 0.3 4 a Sannolikhet 38.6 b Sannolikhet 5.6 5 a Övre gräns 70. b Kritiskt värde.383 6 a Residualspridning 9.4 b Justerad förklaringsgrad 86. c Övre gräns 0.83 7 a Standardavvikelse 5.89 b Kritiskt värde.57 Totalt antal poäng 5 Lycka till! - 4 -

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Vid bedömningen av lösningarna av uppgifterna i del läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 8. Ett tåg ska enligt tidtabellen anlända till Station A klockan 9.00 dagligen. Tåget är dock sällan exakt i tid utan ofta något försenat vid ankomsten och den verkliga ankomsttidens variation, i minuter, från tidtabellen kan beskrivas av N(3, )- fördelningen. Då tåget anlänt så måste det gå igenom obligatoriska kontroller som startar omedelbart efter ankomst till Station A. Tiden, i minuter, det tar att utföra dessa kan antas vara normalfördelad N(9, 3). Tåget avgår omedelbart då kontrollerna är avslutade. Tåget skall enligt tidtabell anlända till Station B klockan 0.30 varje dag. Tiden, i minuter, det tar att åka mellan stationerna kan antas vara N(75, 4)-fördelad. Hur stor är sannolikheten att tåget under en period på 0 dagar anländer försenat till Station B minst två gånger? Införda stokastiska variabler och eventuella antaganden ska vara tydligt beskrivna. (8p) 9. Ett försök har gjorts för att undersöka om två olika metoder för att bestämma oktantalet i bensin ger olika resultat. Båda metoderna användes på 3 olika bensinblandningar som täckte in en stor variation av olika oktantal. Varje blandning delades i två delar så att varje blandning kunde undersökas med båda metoderna och slumpen fick avgöra vilken metod som användes på vilken del. Resultatet framgår av tabell 4. Kan man utifrån resultaten i tabell 4 påvisa att de två metoderna i genomsnitt ger olika resultat? I så fall, hur stor är skillnaden? Besvara frågorna genom att beräkna och i ord tolka ett lämpligt 99% konfidensintervall under rimliga normalfördelningsantaganden. För full poäng ska resultatet av intervallet tolkas i ord och det ska tydligt framgå vilka antaganden som görs för den stokastiska modell som intervallet förutsätter. Till din hjälp finns också beräkningar från Minitab i tabell 5. (8p) Tabell 4. Blandning Metod Metod Blandning Metod Metod 05.0 06.6 7 86.8 96.5 8.4 83.3 8 90. 99.5 3 9.4 99.4 9 9.4 99.8 4 84.0 94.7 0 85.9 97.0 5 88. 99.7 84.8 95.3 6 9.4 94. 89.3 00. 7 98.0 0.9 3 9.7 96.3 8 90. 98.6 4 87.7 93.9 9 94.7 03. 5 9.3 97.4 0 05.5 06. 6 90.7 98.4 86.5 9.3 7 93.7 0.3 83. 89. 8 90.0 99. 3 86. 93.6 9 85.0 9.8 4 87.7 97.4 30 87.9 95.7 5 84.7 88.8 3 85. 93.5 6 83.8 85.9 3 87.4 97.5-5 -

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Tabell 5. Beräkningar gjorda på data från tabell 4 N Mean StDev SE Mean Metod 3 89.48 5.5305 0.9777 Metod 3 96.533 5.666 0.933 Difference 3-7.033 3.0404 0.53748 0. En nickel-titan legering används till vissa komponenter i jetmotorer och sprickbildning i dessa komponenter är potentiellt farligt. Ett fullständigt 4 -försök med två replikat på varje faktorkombination utfördes för att undersöka den eventuella effekt som fyra olika faktorer har på sprickbildningen. De fyra faktorerna som studerades var temperatur (A), titanhalt (B), värmebehandlingsmetod (C) och mängden av en tillsatt kemikalie (D). Resultatvariabeln var spricklängd (i 0.0 mm) hos en komponent utsatt för ett visst standardtest. Försökets resultat framgår av tabell 6. Delar av resultatet av analysen ges i tabell 7. a) Eftersom två replikat gjordes i försöket så kan man beräkna spridningen för en effekt utan att behöva göra något antagande om försumbara effekter. Beräkna spridningen för en effekt och bestäm vilka effekter som är signifikant skilda från 0 på % signifikansnivå. b) Nedan finns ett antal diagram i Figur -4 som man fick vid analysen. Använd dessa för att tolka vilken av de fyra faktorerna som ger upphov till störst effekt när man tar hänsyn till att det finns eventuella signifikanta samspel. Det ska tydligt framgå hur stor den skattade effekten är, vilket tecken den har och om den gäller givet vissa andra faktorers nivåer. Redovisa vilken/vilka figurer som tolkats. Bestäm även vilka nivåer de fyra faktorerna ska sättas på för att få så korta sprickor som möjligt. c) Ange den skattade modellen samt motsvarande modellantagandet. Bestäm en skattning av den förväntade spricklängden för de nivåer på faktorerna som ger kortast förväntad spricklängd. d) I figur 5-6 finns två residualplotter. Tolka dessa och ange tydligt vilka delar av modellantagandet som man undersöker med dessa. (6p) (3p) (3p) - 6 -

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Tabell 6. Resultaten i standardordning nr 3 4 Spricklängd Replikat Replikat Medelspricklängd Standardavvikelse 7.037 6.376 6.707 0.467 + 4.707 5.9 4.963 0.36 3 +.635.089.86 0.3 4 + + 7.73 7.85 7.544 0.383 5 + 0.403 0.5 0.77 0.78 6 + + 4.368 4.098 4.33 0.9 7 + + 9.360 9.53 9.307 0.076 8 + + + 3.440.93 3.8 0.366 9 + 8.56 8.95 8.756 0.76 0 + + 6.867 7.05 6.960 0.3 + + 3.876 3.658 3.767 0.54 + + + 9.84 9.639 9.73 0.3 3 + +.846.337.09 0.347 4 + + + 6.5 5.904 6.05 0.56 5 + + +.90 0.935.063 0.80 6 + + + + 5.653 6.376 5.353 0.44 Tabell 7 Estimated Effects and Coefficients for Spricklängd (coded units) Term Effect Coef Constant.988 A 3.09.509 B 3.976.988 C -3.596 -.798 D.958 0.979 A*B.934 0.967 A*C -4.008 -.004 A*D 0.076 0.038 B*C 0.096 0.048 B*D 0.047 0.04 C*D -0.077-0.038 A*B*C 3.37.569 A*B*D 0.098 0.049 A*C*D 0.09 0.00 B*C*D 0.036 0.08 A*B*C*D 0.04 0.007 S = 0.84885 R-Sq = 99.77% R-Sq(adj) = 99.56% Analysis of Variance for Spricklängd (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 4 333.496 333.496 83.3740 07.8 0.000 -Way Interactions 6 58.609 58.609 6.4348 35.7 0.000 3-Way Interactions 4 78.84 78.84 9.703 4.86 0.000 4-Way Interactions 0.00 0.00 0.006 0.0 0.890 Residual Error 6.99.99 0.08 Pure Error 6.99.99 0.08 Total 3 57.46-7 -

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Main Effects Plot (data means) for Spricklängd Interaction Plot (data means) for Spricklängd 4 3 A B 8 7 6 A - Mean of Spricklängd 0 4 3 0 - - C - - D Mean 5 4 3 0 9 - C Figur Figur Cube Plot (data means) for Spricklängd Interaction Plot (data means) for Spricklängd 0.845 4.673 7 6 A - 5.845 8.6378 4 Mean 3 B.843 5.38-7.733 - A 5.963 - C 0 9 - B Figur 3 Figur 4 Normal Probability Plot of the Residuals (response is Spricklängd) Residuals Versus A (response is Spricklängd) 99 0.50 95 90 0.5 80 Percent 70 60 50 40 30 Residual 0.00 0 0-0.5 5-0.50-0.5 0.00 Residual 0.5 0.50-0.50 -.0-0.5 0.0 A 0.5.0 Figur 5 Figur 6-8 -

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Lösningar till del i tentamen i Matematisk statistik, 008-06-03 Uppgift 8 Sätt ξ = variation, i minuter, från tidtabellen för tåget när det anländer till Station A. Då gäller att ξ N(3, ). Sätt ξ = tiden, i minuter, det tar att utföra de obligatoriska kontrollerna som startar omedelbart efter ankomst till Station A. Då gäller att ξ N(9, 3). Sätt ξ 3 = tiden, i minuter, det tar att åka mellan stationerna. Då gäller att ξ3 N(75, 4). Ingen information finns angiven om det kan finnas något beroende mellan de tre stokastiska variablerna. Man skulle ju kunna tänka sig att om tåget var mycket försenat från Station A så skulle det kunna påverka tiden att köra till Station B. Men eftersom vi inte vet något om detta så antas att ξ, ξ och ξ 3 är oberoende stokastiska variabler. Tåget från Station A till Station B blir försenat om ξ + ξ + ξ 3 > 90. För att kunna bestämma den sannolikheten bestämmer vi fördelningen för ξ + ξ + ξ 3. Eftersom de tre stokastiska variablerna är normalfördelade och antagits vara oberoende gäller att ξ+ ξ + ξ3 N(3 + 9 + 75, + 3 + 4 ), d v s ς = ξ+ ξ + ξ3 N(87, 9). Då fås ς 87 90 87 ς 87 P( ς > 90) = P > = P > 0.58 = Φ (0.58) = 0.790 = 0.8 9 9 9 Sätt η = antal dagar bland 0 som tåget anländer försenat till Station B Ingen information finns angiven om förseningen en dag kan påverka förseningen en annan dag. Eftersom vi inte vet något om detta så antas att tågets försening en dag är oberoende av tågets förseningen en annan dag. Eftersom dessutom sannolikheten för försening P( ς > 90) = 0.8 är densamma för varje dag så gäller att η är binomialfördelad Bin(0, 0.8). Den efterfrågade sannolikheten blir därmed 0 0 0 0 9 P( η ) = P( η ) = 0.8 ( 0.8) 0.8 ( 0.8) = 0 = 0.8 = 0.888 0.8. Uppgift 9 Detta är en typisk stickprov-i-par-situation, där vi har parvisa observationer ( ξi, η i), i =,,...,3, där ξ i = oktantalet enligt metod och η i = oktantalet enligt metod. Vi antar att ξ i N( µ i, σ) och η i N ( µ i +, σ), i =,,..., 3 och att paren ( ξi, η i), i =,,...,3 är oberoende. Låt vidare ( xi, yi), i =,,...,3 beteckna de observerade värdena av ( ξi, η i), i =,,...,3. För att undersöka om de två metoderna i genomsnitt ger olika resultat så bildas ett konfidensintervall för med konfidensgrad 99%. Om det konfidensintervallet inte innehåller 0 så har vi påvisat att metoderna ger olika resultat med 99% säkerhet.

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 För att bilda konfidensintervallet bildar vi skillnaden ς i = ηi ξi, i =,,...,3. Då gäller att ς N(, σ ), där standardavvikelsen σ är okänd. Vi utgår då från i ( ς i ς ) ς, som är t-fördelad med 3 frihetsgrader, där * i= σ σ * ς = / 3 3 ς n. Detta medför att ς P t0.005(3) < < t * 0.005(3) = 0.99. σς / 3 Detta ger oss följande konfidensintervall för med 99% konfidensgrad. s z z ± t (3) 0.005, där zi = yi xi, 3 z 3 = zi och 3 i= n i= s z = ( x x) i 3. Från tabell 5 fås att z = 7.033 och s z = 3.0404. Ur t-fördelningstabellen t (3) 0.005 =.7454 med hjälp av linjär interpolation eftersom 3 frihetsgarder inte står i tabellen. Alltså blir konfidensintervallet s z 3.0404 z ± t0.005(3) = 7.033±.7454 = 7.033±.47558. 3 3 Det efterfrågade 99% konfidensintervallet blir då [ 5.6,8.58 ]. Eftersom 0 inte ingår i intervallet kan vi säga att med 99% säkerhet ger metoderna i genomsnitt olika resultat. Vi kan dessutom säga med 99% säkerhet att metod ger i genomsnitt mellan 5.6 och 8.58 högre värden på oktantalet jämfört med metod. Uppgift 0 Här är faktor A = temperatur, faktor B = titanhalt, faktor C = värmebehandlingsmetod och faktor D = mängden av en tillsatt kemikalie. Resultatvariabeln är Y = spricklängd (i 0.0 mm) hos en komponent. Försöket är ett 4 -försök med två replikat. Det innebär att en skattning av effektens spridning, seffekt, kan beräknas. Låt Yij beteckna spricklängden vid försök i och replikat j, i =,,..6 och j =,. Antag att

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Y = µ + ε, i =,,...,6, j =,, där ε N(0, σ) och ij i ij ij ε, i =,,...,8, j =,, är oberoende stokastiska variabler. ij a) Variansen σ är okänd men kan skattas med s + s +... + s =. 6 6 sp s p kan beräknas från tabell 6 som 0.467 + 0.36 +... + 0.44 = = 0.08. 6 s p Alternativt kan man få värdet på s p från variansanalystabellen på raden Residual error och kolonnen Adj MS. Där finns värdet 0.08. Att det skiljer något från ovanstående beror på avrundningsfel eftersom Minitab har räknat med fler decimaler. Varje effekt beräknas som effekt = Y ( + ) Y ( ). Medelvärdena Y ( + ) respektive Y ( ) har beräknats med hjälp av 8 = 6 ursprungsobservationer Y ij, som är oberoende stokastiska variabler och alla med samma varians σ Det innebär i sin tur att variansen för en effekt blir ( ) ( ) ( ) σ effekt ( + ) ( ) ( + ) ( ) σ σ σ = V(effekt) = V Y Y = V Y + V Y = + =. 6 6 8 Genom att skatta σ med s p fås sp 0.08 s effekt = = = 0.007. 8 8 För att avgöra vilka effekter som är signifikant skilda från 0 på % signifikansnivå görs ett test av H 0 : µ effekt = 0 mot H : µ effekt 0. H 0 förkastas om effekt 0 s effekt < t α/ (f) eller effekt 0 s effekt > t α/ (f). Här är f = 6 och α = 0.0 vilket ger oss t α/ (f) = t 0.005 (6) =.9. Beslutsregeln kan då skrivas som: förkasta H 0 om effekt > t0,005(6) seffekt, dvs om effekt >.9 0.007 = 0.94.

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 Från tabell 7 fås då att för följande effekter gäller att effekt > 0.94 : A, B, C, D, AB, AC och ABC, d v s dessa är signifikant skilda från 0 på % signifikansnivå. Observera att ett tre-faktorsamspel är signifikant skilt från 0. b) Faktor D är inte inblandat i något samspel och dess huvudeffekt kan då tolkas separat. Den är.958 enligt tabell 7. Det betyder att om faktor D ändras från låg till hög nivå, givet alla andra faktorer hålls konstanta, så ökar den genomsnittliga spricklängden med.958 i enheten 0.0 mm. Inga andra huvudeffekter kan tolkas separat eftersom de ingår i signifikanta samspel. Eftersom tre-faktorsamspel ABC är signifikant skilt från 0 så kan inte tvåfaktorsamspelen AB och AC tolkas separat utan man måste tolka effekterna utgående från kuben i figur 3. Vi får att A-effekten beror på vilken nivå B och C hålls, o s v för B-effekt resp C-effekt. Genom att studer kuben i figur 3 framgår att den största A- effekten är 5.963 7.733 = 8.3 och fås både B och C hålls på låg nivå. B- effekten är störst då både A och C är på hög nivå och är 4.673 5.38 = 9.435. C-effekten är störst då både A är på hög nivå och B är på låg nivå och är 5.963 5.38 = 0.8375. Av de fyra faktorerna har alltså C störst effekt och den är 0.8375 och uppkommer då A är på hög nivå och B är på låg nivå. Det betyder att om faktor C ändras från låg till hög nivå, givet att faktor A är på hög nivå, faktor B är på låg nivå och faktor D hålls konstant, så ökar den genomsnittliga spricklängden med 0.8375 0.8 i enheten 0.0 mm. Från kuben framgår att kortast spricklängden fås då A hålls på hög nivå, B på låg nivå och C på hög nivå. Från figur framgår att samtidigt ska D hållas på låg nivå. Att detta stämmer kan verifieras från den skattade modellen. c) Från tabell 7 fås den skattade modellen Y ˆ =.988 +.509 X +.988 X.798 X + 0.979 X + 0.967 X X.004 X X +.569 X X X 3 4 3 3 där X j = om faktor j på låg nivå + om faktor j på hög nivå j =,, 3, 4. Modellantagandet är Y = β + β X + β X β X + β X + β X X β X X + ε 0 3 3 4 4 3 3, där ε N(0, σ) och ε, i =,,...,8, j =,, är oberoende stokastiska variabler ij X j = om faktor j på låg nivå + om faktor j på hög nivå j =,, 3, 4. Skattning av den kortaste förväntade spricklängden fås genom att i den skattade modellen sätta X =, X =, X 3 = och X 4 =. Den blir Y ˆ = 4.9.

Tentamen i Matematisk statistik, S000M, del (för överbetyg), 008-06-03 d) Figur 5 visar en normalfördelningsplot över rsidualerna. Den används för att undersöka om normalfördelningsantagndet är rimligt. I detta fall ligger residualerna väl samlade runt en linje och inget konstigt mönster syns. Det betyder att normalfördelninsgantagandet är rimligt. Figur 6 visar residualerna plottade mot faktor A:s nivåer. Här undersöks om residualspridningen är konstant på A:s två nivåer. Plotten visar att residualerna sprider ut sig ungefär lika på A:s låga respektive höga nivå. Residualspridningen kan tycks alltså inte bero på A:s nivåer.