Kompletterande kursmaterial till kursen Matematisk statistik.



Relevanta dokument
Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik, S0001M, del 1,

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Antal P(ξ = x)

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik, Föreläsning 5

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Examinationsuppgifter del 2

F3 Introduktion Stickprov

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Föreläsning 12: Regression

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Läs noggrant informationen nedan innan du börjar skriva tentamen

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

10.1 Enkel linjär regression

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

LABORATION 3 - Regressionsanalys

TENTAMEN I MATEMATISK STATISTIK

Lycka till!

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Statistisk försöksplanering

Metod och teori. Statistik för naturvetare Umeå universitet

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Tentamen i matematisk statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Regressions- och Tidsserieanalys - F4

tentaplugg.nu av studenter för studenter

Uppgift a b c d e Vet inte Poäng

LABORATION 3 - Regressionsanalys

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Statistisk försöksplanering

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Uppgift a b c d e Vet inte Poäng

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Transkript:

Tentamen i Matematisk statistik Ämneskod-linje S000M Poäng totalt för del 5 (8 uppgifter) Poäng totalt för del 30 (3 uppgifter) Tentamensdatum 008-0-7 Robert Lundqvist Lärare: Ove Edlund Skrivtid 09.00-4.00 Jourhavande lärare: Robert Lundqvist Tel: 404 Resultatet anslås I Studenttorget Tillåtna hjälpmedel: Räknedosa Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik. Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, ska enbart svar lämnas in, men lösningar får bifogas. Observera dock att dessa kommer ej att bedömas utan enbart användas vid gränsfall för att avgöra om någon uppgift kan rättas upp på grund av slarvfel. Svaren ska fyllas i på det blad som bifogas tentamen. Detta blad måste lämnas in. Lägg detta blad först bland lösningarna. Om inte det ifyllda svarsbladet har lämnats in så bedöms tentamen som underkänd. För godkänt krävs minst 9 poäng. Med 4 extrapoäng från laborationerna och KGB så räcker det med 5 poäng av de 5 möjliga för godkänt. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 3 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 3 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del genom att kryssa för uppgifterna 9, 0 eller. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL!

Tentamen i Matematisk statistik, S000M, del, 008-0-7 ) För att testa idrottare om de tagit otillåtna dopningspreparat finns det flera metoder. Med en viss metod (A) är sannolikheten 0.90 att man får positivt utslag när en dopad person testas, och med en annan metod (B) är motsvarande sanolikhet 0.80. Att båda metoderna ger positivt utslag för en dopad person sker med sannolikheten 0.75. a) Hur stor är sannolikheten att minst en av metoderna ger positivt utslag när de används på en dopad person? b) Hur stor är sannolikheten att ingen av metoderna ger positivt utslag när de används på en person som är dopad? c) En dopad person testas med metod B som ger positivt utslag. Hur stor är då sannolikheten att test med metod A också kommer att ge positivt utslag? Ange dina svar i procent med två decimaler. ) I en viss reaktion studeras utbytet (enhet: gram). I ett stickprov med 0 mätningar blir medelvärdet x = 5.8 gram och standardavvikelsen s = 0.707 gram. Utbytet kan beskrivas med en normalfördelning. Bestäm ett konfidensintervall med 95% konfidensgrad för förväntat utbyte. Ange intervallets undre gräns med två decimalers noggrannhet. (p) 3) I en viss grupp av hushåll vill man studera de sammanlagda bolånen. Det visar sig vara rimligt att beskriva bolånen för ett hushåll med en normalfördelning med väntevärdet 00 000 kr och standardavvikelsen 50 000 kr. a) Hur stor är sannolikheten att ett slumpmässigt utvalt hushåll kommer att ha bolån på minst 000 000 kr? Ange ditt svar i procent med två decimalers noggrannhet. (p) b) Vad blir lägsta värde i gruppen av de 0% största bolånen? (p) c) I en annan grupp av hushåll visade det sig att 0% hade bolån på högst 800 000 kr och 5% hade bolån på minst 500 000 kr. Vad blir väntevärde för bolånen i den gruppen? (p) 4) I en så kallad vindkraftspark står två mindre vindkraftverk, ett med en maximal effekt på 50 kw och ett större med en maxeffekt på 00 kw. Kraftverken fungerar oberoende av varandra, och det har visat sig att sannolikheten för att de fungerar vid ett visst tillfälle är 0.98 respektive 0.90. Beroende på vilka kraftverk som är i gång kan man få olika sammanlagda maxeffekter: 0, 50, 00 och 50 kw. a) Hur stor är sannolikheten för en sammanlagd maxeffekt på 00 kw? Ange ditt svar i procent med en decimals noggrannhet. b) Vad blir väntevärdet av den sammanlagda maxeffekten? Ange ditt svar med två decimalers noggrannhet. 5) Firman Smokescreen säljer kaminer. De använder konfidensintervall för att beskriva kaminernas egenskaper, däribland för kaminernas förväntade verkningsgrad. För en viss kamin anges att ett intervall blir 87.5 ±. 05 procent. Detta (p) (p) (p) (p) (p) - -

Tentamen i Matematisk statistik, S000M, del, 008-0-7 sägs vara baserat på mätningar av 0 kaminer där stickprovsstandardavvikelsen var 4.687 procent. Det som inte anges är intervallets konfidensgrad. a) Bestäm konfidensgraden för det angivna konfidensintervallet. Ange ditt svar i procent. b) En spekulant tycker att intervallet är för brett. Ett sätt att få ett snävare intervall är att göra fler mätningar. Vilket är det minsta stickprov som behövs för att få ett 95% konfidensintervall där intervallbredden är högst procent? Utgå här från att standardavvikelsen för verkningsgraden är känd, närmare bestämt att σ = 4. 5 procent. (p) 6) Försäljaren av en viss sorts bladfjädrar hävdar att fjädrarnas förväntade livslängd är 50 000 cykler. Din erfarenhet säger dock att det verkliga värdet bör vara lägre än så. I ett livslängdstest testas 8 bladfjädrar. För de fjädrarna blev x = 83700 och s = 67700. Utifrån de testresultat som erhållits ska du göra ett hypotestest med 5% signifikansnivå för att se om försäljarens påstående om förväntad livslängd verkligen håller. a) Vilken av följande mothypoteser är den korrekta att använda i detta test? () H : μ < 50 000 () H : μ = 50 000 (3) H : μ 50 000 (4) H : μ > 50 000 (p) b) x 50 000 Om testvariabeln t =, ska användas, vad blir då det kritiska s / n värde som detta t ska jämföras med? (p) c) Om man använder ett test med 5% signifikansnivå, ska försäljarens påstående om livslängd avvisas, dvs ska nollhypotesen då förkastas? (p) 7) Vid framställning av ett mycket finfördelat pulver utnyttjar man ett centrifugalhjul till vars periferi ämnet tillförs i flytande form. För att bestämma en modell för att kunna förutsäga den genomsnittliga partikelstorleken (kallad storlek i analysen) görs ett antal försök. Med den variabeln som svarsvariabel försöker man se hur den kan förklaras av följande variabler: Tillförsel av vätska till hjulet tillf g/s/m Periferihastighet perf m/s Viskositet hos tillförd vätska visk Ns/m De resultat som erhållits är följande: (p) Försök tillf perf visk storlek Försök tillf perf visk storlek nr nr.74 53.08 5.4 9 4.08 00.06.3 6.30 54.07 3.6 0 4.08 66.05 6.4 3 6. 83.07 5.7 6.30 87.04 5.8 4.8 08.06 7.4 4.08 44.04 3. 5 0.40 46.0 39. 3 4.5 76.06 5. 6.8 3.05 8. 4 0.0 48.06 39.7-3 -

Tentamen i Matematisk statistik, S000M, del, 008-0-7 7. 58.05 6.5 5.70 3.06 35.6 8. 80.00.3 I nedanstående skärmbilder från Minitab visas resultat för analys med multipel linjär regression där alla tre förklarande variabler ingår. a) Vad blir residualspridningen? Ange ditt svar med tre decimaler. (p) b) Vad blir den justerade förklaringsgraden? Ange ditt svar i procent med en decimals noggrannhet. c) Hur stor påverkan på den förväntade partikelstorleken har en ökning av periferihastigheten med m/s? Besvara frågan genom att bestämma ett 95% konfidensintervall. Ange den undre gränsen i det intervallet med en decimals noggrannhet. (p) (p) The regression equation is storlek = 43.0 +.06 tillf - 0.94 perf - 6. visk Predictor Coef SE Coef T P Constant 43.05 5.6.70 0.6 Tillf.0640 0.65 6.44 0.000 Perf -0.9409 0.0045-9.49 0.000 Visk -6. 3.87-0.6 0.799 s =?? R-Sq =?? R-Sq(adj) =?? Analysis of Variance Source DF SS MS F P Regression 3 66.70 08.90 63.78 0.000 Residual Error 36.03 3.8 Total 4 66.73 Variabel TSS X Tillf 889 Perf 407.08 Visk 6.6 8) Ett experiment i en process för polymertillverkning har utförts. Fyra faktorer har bedömts som väsentliga: temperatur (A), koncentration av en katalysator (B), tid (C) och tryck (D). Responsvariabel har varit molkylvikt på erhållen polymer. I nedanstående tabeller ges försöksuppställning och effektskattningar: nr A B C D molekylvikt Nr A B C D molekylvikt 400 9 + 400 + 40 0 + + 390 3 + 35 + + 300 4 + + 50 + + + 50 5 + 65 3 + + 65 6 + + 65 4 + + + 630 7 + + 400 5 + + + 500 8 + + + 750 6 + + + + 70-4 -

Tentamen i Matematisk statistik, S000M, del, 008-0-7 Estimated Effects and Coefficients for molekylvikt (coded units) Term Effect Coef Constant 506.5 A 3.75 6.87 B -.5-5.6 C 0.5 00.6 D 6.5 3. A*B 0.00 60.00 A*C 0.00 0.00 A*D -7.50-8.75 B*C -.50 -.5 B*D 7.50 3.75 C*D.50 6.5 A*B*C 6.5 8.3 A*B*D -.5-5.63 A*C*D -8.75-9.38 B*C*D 3.75.87 A*B*C*D -.50 -.5 Antag att samspelstermer av ordning tre och högre betraktas som försumbara. Bestäm standardavvikelsen för en effekt, dvs s effekt. Ange ditt svar med en decimals noggrannhet. (p) Slut på del. Glöm inte att bifoga svarsbladet med tentan! - 5 -

Tentamen i Matematisk statistik, S000M, del, 008-0-7 Tabell för svar till del. Riv ut och lägg svarsbladet först i tentamen! Namn... Personnummer... Fråga Svar Poäng a Sannolikhet 95% b Sannolikhet 5% c Sannolikhet 93.75% Undre gräns 5.94 3 a Sannolikhet 90.88% b Bolån 39 33 kr c Väntevärde 06 550 kr 4 a Sannolikhet.8% b Väntevärde 9 kw 5 a Konfidensgrad 80% b Antal n 78 6 a Hypotes (ringa in rätt alternativ () () (3) (4) b Kritiskt värde.895 c Kan nollhypotesen förkastas? Ja Ne 7 a Residualspridning.8097 b Justerad förkl grad 93.% c Undre gräns 0.39 8 Standardavvikelse 5.89 Totalt antal poäng 5 Lycka till! - 6 -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 Vid bedömningen av lösningarna av uppgifterna i del läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 9) Till enheten för datorsupport kommer ärenden av många slag. En viss typ av ärenden har visat sig vara särskilt vanligt förekommande, och vid närmare undersökningar har det visat sig att hanteringen av denna typ av ärenden görs genom att utföra tre delmoment. Tiden det tar att utföra vart och ett av dessa delmoment kan beskrivas med exponentialfördelningar med väntevärdena, respektive 3 minuter. Den totala tiden för den studerade typen av ärende är summan av tiden det tar att utföra de tre momenten. Ärendena läggs i en kö där ärendena tas i tur och ordning. Supportenheten har öppet mellan kl 08.00 och 6.00. Antag att det en viss dag kommer in 70 ärenden av den studerade typen och att endast denna typ av ärenden behandlas. Hur stor är sannolikheten att alla inkomna ärenden hinner avslutas innan man stänger för dagen? Införda stokastiska variabler och eventuella antaganden ska vara tydligt beskrivna. (8p) 0) För ett visst klätterrep vill man uppskatta hållfastheten uttryckt som medianbrottgränsen hos repet. Man mätte brottgränsen hos 0 slumpmässigt utvalda delar av repet. Följande värden erhölls (enhet: kg): 39 47 554 5 660 560 59 540 579 467 Man vill uppskatta medianbrottgränsen med ett ensidigt, nedåt begränsat, konfidensintervall (d v s där gränserna blir av typen [ a, ) ) med konfidengrad 99% eller så nära 99% som möjligt. a) Bestäm konfidensintervallet om brottgränsen kan beskrivas med en normalfördelning. b) Bestäm konfidensintervallet om det enda antagande som kan göras är att fördelningen för brottgränsen är kontinuerlig, men att ingen specifik fördelning kan antas. I dina beräkningar ska det tydligt framgå hur respektive intervall härleds och vilka fördelningsantaganden du har utgått från. Ange även den exakta konfidensgraden. (6p) (6p) ) Vid tillverkningen av ett kretskort ska hål borras i korten. Ett problem är att vibrationer på kortytan orsakar variationer i var hålet hamnar. Två faktorer som anses väsentliga är: storlek på borrinfästning (A) och stanshastighet (B). Två infästningar (/8 tum och /6 tum) ska köras med två hastigheter (40 och 90 rpm), och hål borras sedan på fyra kort för varje nivåkombination. Resultatvariabel är vibration mätt som resultantvektorn för tre accelerometrar i x-, y- och z- led. Resultaten (i standardordning) ges i nedanstående tabell: - 7 -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 A B Y Y Y3 Y4 Medelvärde Standard avvikelse Varians 8. 8.9.9 4.4 6.0.9 8.46 + 7. 4.0.4.5 4.03.4 5.0 + 5.9 4.5 5. 4. 4.9 0.75 0.56 + + 4.0 43.9 36.3 39.9 40.7 3.4 9.87 Medelvärde 5.7 5.3.67.75 Standardavvikelse.38.98 0.56.07 Varians 9.5 68.4.55 45.67 Delar av analysen gjord i Minitab ges nedan a) Beräkna spridningen för en effekt och bestäm vilka effekter som är signifikant skilda från 0 på % signifikansnivå. Hypoteser och den använda beslutsregeln ska framgå tydligt. Vilken effekt har borrinfästning (faktor A) på vibrationen? b) Ange modellantagandet som analysen förutsätter samt ange den skattade modellen som analysen leder fram till. I figurerna nedan finns två residualplotter. Tolka dessa och ange tydligt vilka delar av modellantagandet som man undersöker med dessa. Factorial Fit: vibration versus A; B Estimated Effects and Coefficients for vibration (coded units) Term Effect Constant A 6.637 B 7.537 A*B 8.73 (6p) (4p) Residuals Versus the Fitted Values (response is vibration) Normal Probability Plot of the Residuals (response is vibration) 4 99 3 95 90 Residual 0 - Percent 80 70 60 50 40 30-0 0-3 5-4 5 0 5 30 Fitted Value 35 40-5.0 -.5 0.0 Residual.5 5.0-8 -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 9) Låt ξ, ξ och ξ 3 beteckna tiden för de tre delmomenten. För dessa gäller att de har väntevärdena, respektive 3 minuter. Detta betyder att de kan beskrivas med exponentialfördelningar där λ =, λ = / respektive λ = / 3. Dess moment sätts ihop till en sammanlagd tid η. För den tiden gäller att väntevärdet är E η ) = E( ξ ) + E( ξ ) + E(3) 6 minuter och variansen är V ( η) = + ( = + 3 = 4. Sammanlagt har man 70 ärenden, och deras sammanlagda tid kan beskrivas med en variabel ζ = 70 η i i=, och med stöd av centrala gränsvärdessatsen kan den sägas vara approximativt fördelad enligt N ( nμ, σ n ) d, dvs N ( 40, 3. 305). Den fråga som är ställd är P(alla ärenden avslutas i tid) vilket är detsamma som P ζ 480 : ( ) 0,04 0,0 0,00 0,008 0,006 0,004 0,00 0,000 40 X 480 Den sannolikheten är ζ 40 480 40 P ( ζ 480 ) = P Φ(.9) = 0. 976. 3.3 3.3 Sannolikheten att alla ärenden hinns med under dagen är alltså 97.6%. Kommentar: För att centrala gränsvärdessatsen ska gälla förutsätts att den ingående variablerna kan betraktas som oberoende av varandra. Om så var fallet här gavs ingen upplysning om vilket måste ses som en brist. 0) Låt ξ beteckna brottgränsen (enhet: kg). a) Den variabeln antas kunna beskrivas med en normalfördelning. Det som söks är ett nedåt begränsat 99% konfidensintervall för den variabelns median, och eftersom median och väntevärde μ sammanfaller för en symmetrisk fördelning är detta detsamma som att bestämma ett konfidensintervall för väntevärdet. Standardavvikelsen σ är i detta fall okänd. Grunden i ett sådant intervall blir först medelvärdet ξ som är fördelad en- σ ligt N μ,. Eftersom standardavvikelsen är okänd kan dock intervallet inte härledas utifrån den variabeln, utan vi måste använda n variabeln - 9 -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 ξ μ som är t-fördelad med ( n ) = 9 frihetsgrader. Med följande * σ / n omskrivning fås det sökta intervallet: ξ μ P * σ / 0 * σ < a = P μ < ξ a = 0.99 0. Den intervallskattning vi söker är alltså möjligt att skriva som * σ ξ a, där a än så länge 0.0 (9) ξ μ inte är bestämd. Samtidigt gäller dock att P < a = 0. 99, och ur * σ / 0 det sambandet följer att a = t 0 =. 8. Detta ger sammantaget konfi- densintervallet (9) s x t 0.0, där x = 5. 9 och s = 77.5, vilket 0 ger intervallet 453.7,. [ ) b) Om det inte går att utgå från att brottgränsen, dvs variabeln ξ är normalfördelad, måste ett så kallat teckenintervall för medianen bestämmas. Grunden i detta måste vara att ordna uppmätta värden i storleksordning och ta ett av de lägre som den undre gränsen, dvs intervallet ska ha formen ξ k, där k är ett ordningsvärde. [ ( ) ) Konfidensgraden ska vara så nära 99% som möjligt, dvs P( intervallet täcker) = P( intervallet missar). Att intervallet missar kan ske påflera sätt beroendepå vilket av värdena som används som gränse. Om lägsta värdet ( ξ () ) tas som gräns måste miss innebära att alla värden ligger till höger om medianen, dvs P 0 ( miss ) P( alla ξ till höger om medianen) = 0.5 = i Då är konfidensgraden alltså 0.5 0 = 0.9990, ett för högt värde. Om k =, dvs om undre intervall gräns tas som näst lägsta mätvärdet gäller att P( miss ) = P( högst ett ξi till höger om medianen), och eftersom antal värden till höger om medianen kan beskrivas som en binomialfördelad variabel Bin 0,0.5 blir ( ). Då blir konfi- 0 0 9 P högst ett ξ i till höger = 0.5 + 0.5 0.5 = 0. densgraden 0.989, dvs rätt nära den sökta nivån på 99%. ( ) 007. Om man på motsvarande sätt kollar konfidensgrad för k = 3 fås konfidensgraden 94.5%, vilket innebär att en intervallskattning ges av det näst lägsta värdet som undre gräns. Motsvarande konfidensintervall blir alltså x ( ), eller [ 47, ). [ ) ) - 0 -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 a) Effekten på vibrationen skattas genom att bilda effekt = Y( + ) Y( ), där varje medelvärde baseras på mätvärden. Med 4 replikat baseras varje effektskattning på medelvärdesbildning över 8 ursprungsobservationer ( Y ij ). Detta betyder att ( ) σ σ σ σ effekt = V ( effekt) = V Y ( + ) Y( ) = + =. Där måste σ skattas, vilket görs med hjälp 8 8 4 av s p s = + s + s 4 3 + s 4 8.46 + 5.0 + 0.56 + 9.87 = = 5.978 4 3.9 Detta tillsammans ger skattningen s effekt = =. 4945. 4 effekt Ska sedan hypotesen H 0 : μeffekt = 0 testas mot H : μeffekt 0 kan detta göras på flera sätt, där det som väljs här är att bestämma kvoten effekt μeffekt. Detta är en observation från t-fördelningen med frihets- s grader (där antalet frihetsgrader är kopplat till beräkningen av ). Testet görs genom att jämföra kvoten ovan med lämpligt värde ur t-fördelningen: effekt 0 s Nollhypotesen förkastas om < t ( ) effekt 0 > t s effekt 0.005 ( ) jämföra effekterna med effekt 0.005 s p eller där t 3. 055. Ett annat sätt är förstås att () 0.005 = 0.005 ) t ( s : om effekt > 3. 733 så sägs effekten vara signifikant på %-nivån. effekt I detta fall blir A-effekten = 6.637 enheter, B-effekten = 7.537 och ABeffekten = 8.73. Var och en av dessa kan bestämmas som ett medelvärde enligt beskrivningen ovan eller med hjälp av faktorns teckenkolumn. Ett exempel på det senare: -6.0 + 4.03-4.9 + 40.7 A - effekt = = 6.64. När kvoterna ovan ska beräknas blir då resultatet: Faktor A B AB Effekt 6.64 7.54 8.7 t-kvot 3.6 6.7 7.3 Här är alla t-kvoterna större än gränsen 3.055, så tolkningen bör alltså vara att de alla är signifikanta på % signifikansnivå. Resultatet för faktor A tillsammans med samspelsfaktorn AB säger att om faktor B hålls på låg nivå så ökar vibrationerna med 7.94 enheter, medan om faktor B hålls på hög nivå så är motsvarande effekt 5.35 enheter. Detta går till exempel att åskådliggöra genom att använda en samspelsplott: - -

Tentamen i Matematisk statistik, S000M, lösningar del, 008-0-7 Cube Plot (data means) for vibration 4,95 40,75 B - 6,00 - A 4,05 b) Ett sätt att beskriva modellantagandet är att börja med att låta beteckna uppmätt vibration vid nivåkombination i ( i =,,3, 4 ) och replikat j ( j =,,3, 4 ). Då kan man betrakta den variabeln som fördelad enligt Yij = μ i + ε ij där ε ij N( 0,σ ) och där alla ε ij förutsätts vara oberoende av varandra. Den skattade modellen blir då Y ˆ = 3.83 + 8.39X + där X j + 3.769X 4. 356 om faktor j hålls på låg nivå = + om faktor j hålls på hög nivå De residualplotter som ges används för att kontrollera ) om det är rimligt att utgå från antagandet att ε ij verkligen är normalfördelade, något som framgår först och främst med normalfördelningsplotten till höger, men även den vänstra plotten av residualer mot ŷ i. I det senare fallet skulle till exempel normalfördelningsantagandet kunna ifrågasättas om många av residualerna låg långt utanför intervallet ± s effekt, i detta fall ±.445. Den vänstra plotten kan också användas för att se om det är rimligt att utgå från att variansen är konstant, dvs att det är samma värde på σ för alla nivåkombinationerna. X X Y ij - -