Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Kompletterande kursmaterial till kursen Matematisk statistik.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Matematisk statistik Kurskod S0001M

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Exempel 1 på multipelregression

Statistik för teknologer, 5 poäng Skrivtid:

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i matematisk statistik

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i matematisk statistik

tentaplugg.nu av studenter för studenter

Examinationsuppgifter del 2

LABORATION 3 - Regressionsanalys

Regressions- och Tidsserieanalys - F7

LABORATION 3 - Regressionsanalys

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Metod och teori. Statistik för naturvetare Umeå universitet

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I STATISTIK B,

Regressions- och Tidsserieanalys - F4

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i matematisk statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

tentaplugg.nu av studenter för studenter

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Matematisk statistik, Föreläsning 5

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

0 om x < 0, F X (x) = c x. 1 om x 2.

Matematisk statistik TMS064/TMS063 Tentamen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Avd. Matematisk statistik

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Läs noggrant informationen nedan innan du börjar skriva tentamen

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

10.1 Enkel linjär regression

Regressions- och Tidsserieanalys - F1

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Regressions- och Tidsserieanalys - F3

Stockholms Universitet Statistiska institutionen Termeh Shafie

Transkript:

Tentamen i Matematisk statistik Kurskod SM Poäng totalt för del : 5 (9 uppgifter) Tentamensdatum -3-3 Poäng totalt för del : 3 (3 uppgifter) Skrivtid 9. 4. Lärare: Adam Jonsson och Inge Söderkvist Jourhavande lärare: Adam Jonsson Tel: 9-49948 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium i regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, ska enbart svar lämnas in, men lösningar får bifogas. Observera dock att dessa kommer ej att bedömas utan enbart användas vid gränsfall för att avgöra om någon uppgift kan rättas upp på grund av slarvfel. På del ges inga delpoäng på uppgifterna. Svaren för del ska fyllas i på det blad som bifogas tentamen. Detta blad måste lämnas in. Lägg detta blad först bland lösningarna. Om inte det ifyllda svarsbladet har lämnats in så bedöms tentamen som underkänd. För godkänt krävs minst 7 poäng på del. Med extrapoäng från laborationerna och KGB så räcker det alltså med 5 poäng av de 5 möjliga för godkänt. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 3 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 3 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! (9)

Tentamen i Matematisk statistik, SM, del -3-3. (a) Antag att A och B är händelser som inträffar med sannolikhet 3% respektive 4%. Sannolikheten att både A och B inträffar är 5%. Beräkna sannolikheten att varken A eller B inträffar. (p) (b) Vid tillverkning av detaljer till en maskin är felfrekvensen 5%. För att begränsa antalet reklamationer beslutar man att alla detaljer ska passera en kontroll. Vid denna kontroll kasseras felaktiga detaljer med sannolikheten 9%, och felfria kasseras med sannolikheten %. Du tar en detalj ur högen med kasserade detaljer. Hur stor är sannolikheten att den detaljen är defekt?. Antag att du slumpar fram värden från en kontinuerlig fördelning där medianen är lika med 6. Låt η vara antalet värden som man behöver slumpa fram för att få ett värde som är mindre än 6. Beräkna sannolikheten P (η 3). 3. Havsguden Poseidon strör ut snäckor på havsbotten så att antalet snäckor på en godtyckligt vald yta blir Poisson-fördelat. Om det i genomsnitt ligger.3 snäckor per kvadratmeter havsbotten, hur stor är då sannolikheten att det finns högst två snäckor på en slumpmässigt utvald kvadratmeter? 4. Den kontinuerliga slumpvariablen ξ har fördelningsfunktionen om x <, F (x) = 4x om x /, om x > /. (a) Bestäm sannolikheten P (ξ >.5). (b) Bestäm väntevärdet E(ξ). (p) 5. Majas och Joels utgifter för kursmaterial (enhet: kr) under en månad kan ses som oberoende stokastiska variabler. Majas utgifter/månad kan antas vara normalfördelade med väntevärde 39 kr och standardavvikelse 3 kr och Joels utgifter/månad kan antas vara normalfördelade med väntevärde 34 kr och standardavvikelse 5 kr. (a) Vad är sannolikheten att deras sammanlagda utgifter under en månad överstiger 8 kr? (b) Vad är sannolikheten att Joels utgifter överstiger Majas under minst två av läsårets 8 månader? 6. För att se hur ledningsförmågan hos en polymer påverkas av tillsatser av olika metaller görs en serie försök. I ett visst försök med 8 provbitar fick man följande resistanser (enhet: ohm): i 3 4 5 6 7 8 x i 56.44 55.9 55.89 56.86 56.57 56.9 56.93 56.4 (9)

Tentamen i Matematisk statistik, SM, del -3-3 Från teoretiska överväganden bör ledningsförmågan med den aktuella metallen vara normalfördelad med väntevärde 56 ohm, men man misstänker att ledningsförmågan i genomsnitt blir högre än 56 ohm. För att se om det finns stöd för dessa misstankar ska ett hypotestest utföras där man som testvariabel använder t = x 56 s/ 8, där s är stickprovsstandardavvikelsen. Vad blir den kritiska gränsen för den testvariabeln om signifikansnivån sätts till %? Kan man påstå att ledningsförmågan är större än 56 ohm på %? signifikansnivå? (För p krävs rätt kritisk gräns och rätt slutsats - JA eller NEJ.) 7. På ett sjukhus där man skickar vissa av sina blodprover till två olika laboratorier för analys ville man utföra en undersökning för att testa om laboratorierna mäter likvärdigt. Vid undersökningen tog man ett enda blodprov på 6 ml från en patient och sände 3 ml var till de två laboratorierna, som vart och ett fick göra 8 oberoende mätningar på provet. Man antog att mätningarna på proven kan beskrivas som observationer på normalfördelade slumpvariabler. Resultatatet, i kodade enheter, ges nedan: Mätning 3 4 5 6 7 8 Lab 4.4 4. 4.33 4.9 4.4 4.9 4. 4.89 Lab 4.7 4.9 4. 4. 4.95 4.5 4. 4.39 För att beräkna ett 95% konfidensintervall för, den genomsnittliga skillnaden mellan Lab och Lab, valde man mellan (A): metoden för stickprov i par, (B): metoden för två stickprov och (C) ett teckentest. Vilket (välj ett) av följande alternativ stämmer? Man bör välja... ()... (A) eftersom antalet mätningar är detsamma för Lab och Lab. ()... (A) eftersom de 8 mätningarna görs på samma prov. (3)... (B) eftersom de 8 mätningarna görs på samma prov. (4)... (A) eftersom stickprovsstandardavvikelserna inte är densamma för de två stickproven. (5)... (C) eftersom mätvärdena antas vara observationer från kontinuerliga fördelningar. 8. En Japansk forskare mäter radioaktiv strålning på en viss plats. Antalet pulser som forskarens Geiger-Muller rör registrerar under ett dygn är P o(λ)-fördelat. Konstanten λ, som är okänd, ger viktig information om mängden radioaktivt material. För att testa H : λ = 3 (9)

Tentamen i Matematisk statistik, SM, del -3-3 mot H : λ > räknar forskaren antalet pulser under ett dygn och förkastar H om minst 6 pulser registreras. Beräkna testets styrka då λ = 5. 9. Denna uppgift behandlar borrning av lodräta hål i berggrunden. En undersökning har gjorts av hur tiden det tar att borra 5 feet (TIME, minuter) varierar med hur djupt borren befinner sig (DEPTH, feet). Mätningen har gjorts med två typer av borrar (DRILL) som är kodade med en dummyvariabel som är eller. En regressionsanalys för 8 observationer, där DEPTH ligger i ett intervall mellan 6. och 64.3 feet, redovisas i tabell. (a) Beräkna förklaringsgraden. (b) För att testa om djupet (DEPTH) påverkar borrtiden (TIME) då borrtyp används så kan man titta på en lämplig t-kvot och jämföra dess absolutbelopp med ett värde från t-tabellen på sidan 3 i kursboken. Kan man på % signifikansnivå påstå att djupet påverkar borrtiden då borrtyp används? Svara med (Ja/Nej) samt värdet på t-kvoten. (c) Bestäm ett 98 %-igt konfidensintervall för den genomsnittliga förändringen i borrtid (TIME) då djupet (DEPTH) ökas från 45 till 46 feet och borrtyp används. Svara med den övre gränsen. (p) Tabell : Regression Analysis: TIME versus DEPTH; DRILL The regression equation is TIME = 3,7 +, DEPTH + 4,93 DRILL Predictor Coef SE Coef T P Constant 3,676,5553?? DEPTH,6,349?? DRILL 4,93,89?? S =? R-Sq =? R-Sq(adj) =? Analysis of Variance Source DF SS MS F P Regression? 37,6 8,53 8,4, Residual Error? 3,58,54 Total?? Slut på del. Glöm inte att bifoga svarsbladet med tentan! 4 (9)

Tentamen i Matematisk statistik, SM, del -3-3 Tabell för svar till del Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Fråga Svar Poäng a Sannolikhet (procent, två decimaler) 45. b Sannolikhet (procent, två decimaler) 7.77 Sannolikhet (två decimaler) 5. 3 Sannolikhet (procent, två decimaler) 99.64 4 a Sannolikhet (procent, två decimaler) 75. b Väntevärde (två decimaler).33 5 a Sannolikhet (procent, två decimaler). ( Φ(.5)) b Sannolikhet (procent, två decimaler) 8.69 (P (ξ ) där ξ Bin(8,.). Svar som fåtts med exakt p i Bin(8, p) också OK) 6 Kritisk gräns (tre decimaler).998 JA elle NEJ NEJ (ty t =.9) 7,,3,4 eller 5 3 8 Styrka (procent, två decimaler) 43.9 9 a Förklaringsgrad (%, en decimal) 94.6 b t-kvot (två decimaler) 9. JA eller NEJ JA c Övre gräns (fyra decimaler).55 Totalt antal poäng 5 5 (9)

Tentamen i Matematisk statistik, SM, del -3-3 6 (9)

Tentamen i Matematisk statistik, SM, del -3-3 Vid bedömningen av lösningarna av uppgifterna i del läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden.. En fiskares väntetider mellan napp (napp betyder att en fisk fastnar på kroken) antas vara oberoende och Exponentialfördelade väntevärde minuter. Beräkna sannolikheten att fiskaren lyckas få åtminstone 4 napp på fem timmar. Välmotiverade approximationer godtas. (p) Lösningsskiss: Låt ξ, ξ,... vara väntetiderna (i minuter) mellan napp. Sökt är P (ξ 3), där ξ = 4 ξ j j= är den tid det tar att få 4 napp. Enligt CGS har vi ξ N(4µ, 4σ) approximativt, där µ = σ =. Det ger P (ξ 3).6.. Maria och Helena är båda pingisspelare. Maria tycker att hon är bättre än Helena, och funderar på hur hon skall visa sin tränare att sannolikheten att hon vinner är större än sannolikheten att Helena vinner ett av deras inbördes möten. Föreslå en lämplig statistisk metod som Maria kan använda. Metoden skall baseras på resultatet i de träningsmatcher som Maria och Helena kommer att spela och ha en signifikansnivå på högst 5 %. Lösningsskiss: Låt p vara sannolikheten att Maria vinner en match mot Helena. Maria bör ställa upp ett hypotestest av H : p =.5 mot H : p >.5. Hon kan sedan utgå från resultatet i låt oss säga träningsmatcher och förkasta H om ξ är stort, ξ k, där ξ är antalet vunna matcher. Eftersom ξ Bin(,.5) då H är sann ger k = 8 ett test med 5.5 % signifikansnivå och k = 9 ger ett test med % signifikansnivå. (p). Vi fortsätter med problemet från uppgift 9 på del. För att undersöka om djupets effekt på borrtiden skiljer sig mellan borrtyp och la man till produkten av DEPTH och DRILL som ny förklarande variabel i modellen. Resultatet av regressionsanalysen ges i tabell nedan. 7 (9)

Tentamen i Matematisk statistik, SM, del -3-3 Tabell : Regression Analysis: TIME versus DEPTH; DRILL; DEPTH*DRIL The regression equation is Y = 4,79 +,768 DEPTH +,5 DRILL +,6 DEPTH*DRILL Predictor Coef SE Coef T P Constant 4,794,933 5,3, DEPTH,768,378 3,3,4 DRILL,497,8,,37 DEPTH*DRILL,66,799,,36 S =,68543 R-Sq = 95,5% R-Sq(adj) = 94,9% Source DF SS MS F P Regression 3 39,37 79,79 69,84, Residual Error 4,75,47 Total 7 5,645 (a) Ange fullständigt modellantagande för modellen som analyserats i tabell. Baserat på (de standardiserade) residualplottarna nedan, anser du att modellantagandena är rimliga? (b) Kan man på 5 % signifikansnivå påstå att effekten av djupet på borrtiden i genomsnitt är längre för borrtyp? Formulera ett lämpligt hypotestest, där hypoteser, testvariabel och slutsats framgår tydligt, samt bestäm P-värdet för testet. (6p) Kommentar: Det skulle ha stått...djupet på borrtiden i genomsnitt är större för borrtyp? Lösningsskiss: (a) Modellantagandet är för Y i = β + β X,i + β X,i + β 3 X 3,i + ɛ i 6. X 64.3, X =,, där Y = TIME, X = DEPTH, X = DRILL, X 3 = X X, och där ɛ,..., ɛ 8 är oberoende och N(, σ)-fördelade. Residualplottarna ser bra ut. (b) Om X = har vi medan E(Y ) = β + β X E(Y ) = β + β + (β + β 3 )X om X =. Att effekten är större för borrtyp är därför samma sak som att β 3 >. För att testa H : β 3 = mot den ensidiga mothypotesen H : β 3 > används t-kvoten b 3 /s b3 och beslutsregeln förkasta H om t-kvoten (utan absolutbelopp) är minst t.5 (4) =.7. Det oberverade värdet är. så H förkastas, effekten är större på 5% signifikansnivå. P-värdet är.36/ =.8. 8 (9)

Tentamen i Matematisk statistik, SM, del -3-3 Residual Plots for TIME Normal Probability Plot Versus Fits Residuals Versus DEPTH (response is TIME) Percent Frequency 99 9 5 8 6 4 - - Histogram - - - - 8 4 6 Fitted Value Versus Order - - 4 6 8 4 6 8 4 6 8 Observation Order - - -3 3 4 DEPTH 5 6 7 Residuals Versus DEPTH (response is TIME) - - -3 3 4 5 6 7 DEPTH 9 (9)