Tentamen i Matematisk statistik Kurskod S0001M



Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Statistisk undersökningsmetodik (Pol. kand.)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen MVE265 Matematisk statistik för V,

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Resultatet läggs in i ladok senast 13 juni 2014.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

Kompletterande kursmaterial till kursen Matematisk statistik.

Läs noggrant informationen nedan innan du börjar skriva tentamen

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Vinst (k) Sannolikhet ( )

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Exempel 1 på multipelregression

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Läs noggrant informationen nedan innan du börjar skriva tentamen

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Avd. Matematisk statistik

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)


Tentamen i Matematisk statistik, LKT325,

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

ÖVNINGSUPPGIFTER KAPITEL 9

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Tentamen Tillämpad statistik A5 (15hp)

5 Kontinuerliga stokastiska variabler

Exempel 1 på multipelregression

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Statistik B Regressions- och tidsserieanalys Föreläsning 1

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Storräkneövning: Sannolikhetslära

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Statistik och epidemiologi T5

Läs noggrant informationen nedan innan du börjar skriva tentamen

TT091A, TVJ22A, NVJA02 By, Pu, Ti. 50 poäng

Läs noggrant informationen nedan innan du börjar skriva tentamen

Regressions- och Tidsserieanalys - F3

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

24 oktober 2007 kl. 9 14

Regressions- och Tidsserieanalys - F1

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Tentamen Tillämpad statistik A5 (15hp)

INLÄMNINGSUPPGIFT 2 (Del 2, MATEMATISK STATISTIK) Kurs: MATEMATIK OCH MATEMATISK STATISTIK 6H3000

10.1 Enkel linjär regression

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove Edlund och Niklas Grip Jourhavande lärare: Adam Jonsson Tel: 0920-491948 Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen, som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in lösningar och bifogas oavsett om du lämnat in lösningar eller ej. Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen, som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på den första obligatoriska delen samt minst 13 poäng från den andra delen för överbetyg. För betyg 5 krävs godkänt på den första obligatoriska delen samt minst 23 poäng från den andra delen för överbetyg. OBS! Det går inte att kompensera underkänt på den första korta delen av tentamen med poäng på den andra delen. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (8)

1. Att en slumpmässigt utvald student betalar sina räkningar genom någon internetbank har visat sig ske med sannolikheten 0.40. Att träffa en student som har en mobiltelefon sker med sannolikheten 0.61. Sannolikheten att en student både har mobiltelefon och betalar sina räkningar genom en internetbank är 0.35. En slumpmässigt vald student har mobiltelefon. Hur stor är sannolikheten att han också betalar räkningarna genom en internetbank? 2. Antalet trasiga pixlar på en så kallad LED-tv av ett visst märke har en Poissonfördelning med väntevärdet 2.1. Beräkna sannolikheten att en tv-apparat av den aktuella typen inte har några trasiga pixlar. 3. En partikel utför slumvandring på (dom positiva och negativa) heltalen. Partikeln startar på talet 0 och hoppar sedan ett steg varje sekund. Hoppet görs i negativ respektive positiv riktning med sannolikhet 0.5. Vad är sannolikheten att partikeln befinner sig på talet 2 efter 10 sekunder? Ledning: Att partikeln befinner sig t.ex. på talet 6 efter 10 sekunder är samma sak som att exakt 8 av dom 10 hoppen sker i positiv rikning. (3p) 4. Den stokastiska variabeln ξ har frekvensfunktionen { ce x/5 om 0 x 3, f(x) = 0 annars, där c är en viss konstant. (a) Bestäm konstanten c. (b) Bestäm medianen i fördelningen för ξ. (1p) 5. Om ξ 1, ξ 2, ξ 3, ξ 4, ξ 5 är oberoende och Exp(λ)-fördelade så har summan ξ = ξ 1 + ξ 2 + ξ 3 + ξ 4 + ξ 5 en så kallad Γ(5, λ)-fördelning (uttalas gamma-fördelning ). Dess frekvensfunktion ges av f(x) = λ5 24 x4 e λx, x > 0. Bestäm väntevärde och varians i Γ(5, λ)-fördelningen. 6. Majas och Joels utgifter för kursmaterial (enhet: kr) under en månad kan ses som oberoende stokastiska variabler. Majas utgifter/månad kan antas vara normalfördelade med väntevärde 420 kr och standardavvikelse 30 kr och Joels utgifter/månad kan antas vara normalfördelade med väntevärde 340 kr och standardavvikelse 25 kr. Vad är sannolikheten att Joels utgifter överstiger Majas under en slumpmässigt vald månad? 2 (8)

7. En ingenjör använder två högprecisionsinstrument för att bestämma vikten hos en viss typ av komponenter. Hon misstänker att instrument 1 i genomsnitt visar en högre vikt än instrument 2. För att undersöka om misstanken stämmer väljer hon ut en enda komponent och gör sedan 12 mätningar på den komponenten, 6 med det fösta instrumentet och 6 med det andra. Resultatet i gram ges nedan: Mätning nr 1 2 3 4 5 6 7 Instrument 1 12.22 12.18 12.24 12.41 12.30 12.36 12.35 Instrument 2 12.17 12.31 12.38 12.39 12.39 12.33 12.36 Beräkna ett lämpligt 99% konfidensintervall för den genomsnittliga skillnaden (instrument 1 - instrument 2) mellan instumenten under rimliga normalfördelningsantaganden. Svara med den nedre gränsen. Räknehjälp: x 1 = 12.2943, s 1 = 0, 0840, x 2 = 12.3329, s 2 = 0.0780. För differensserien gäller z = 0.0386, s z = 0.0797. 8. 1 En läkare vill veta om en ny medicin i genomsnitt har en postiv effekt på patienters hälsa. Han hittar en studie gjord på 12 patienter där man dragit slutsatsen att medicinen i genomsnitt har en positiv effekt. De faktiska mätvärdena framgår inte, man har endast angivit (med +) om medicinen gett avsedd effekt: Patient nr 1 2 3 4 5 6 7 8 9 10 11 12 Resultat + + - + + + - + + + + + I studien används antalet + tecken för att testa H 0 : ingen genomsnittlig effekt mot H 1 : positiv effekt i genomsnitt. Beslutsregeln definierades: Förkasta H 0 om antalet + tecken är minst 9. Vilken signifikansnivå har det test som använts i studien? 9. En forskare misstänker att två slumpvariablers standardavvikelser, σ 1 och σ 2, inte är lika stora. För att testa H 0 : slumpvariablerna har samma standardavvikelser på 5 % signifikansnivå väljer hon att utgå från ett 95 % konfidensintervall för β, där β betecknar kvoten σ 1 /σ 2. Vilket av följande påståenden stämmer? En lämplig beslutsregel ges av... 1 H 0 förkastas om talet 0 täcks av konfidensintervallet. 2 H 0 förkastas om talet 0 inte täcks av konfidensintervallet. 3 H 0 förkastas om talet 1 täcks av konfidensintervallet. 4 H 0 förkastas om talet 1 inte täcks av konfidensintervallet. 5 H 0 förkastas om β täcks av konfidensintervallet. 6 H 0 förkastas om β inte täcks av konfidensintervallet. 10. Vid en undersökning studerades hur Y =den totala glassförsäljningen (kkr per dag) i en kiosk kunde relateras till X 1 =utomhustemperaturen och X 2 =kioskens placering. Dom två placeringarna som undersöktes 1 Uppgiften har förtydligats efter att tentamen avslutats. 3 (8)

kodades X 2 = 0 respektive X 2 = 1. Resultatet av en regressionsanalys för 20 glassköp redovisas i tabell 1. (a) Bestäm det predikterade värdet av försäljningen på placering 0 vid temperaturen 24 grader. (1p) (b) För att undersöka om placeringen påverkar försäljningen skall ett test på 1% signifikansnivå genomföras genom att beräkna värdet på en lämplig t-kvot och jämföra denna med ett visst tal. Vad är värdet på t-kvoten? Kan man påstå att placeringen påverkar försäljningen på 1% signifikansnivå? För 2 poäng krävs både t-kvoten och rätt svar (ange JA eller NEJ på svarsbladet). (c) Vad är den genomsnittliga förändingen av försäljningen på placering 1 om temperaturen ökar med 3 grader? Besvara frågan genom att beräkna ett 99%-igt konfidensintervall. Redovisa den undre gränsen. Tabell 1: Regression Analysis: Y versus X1; X2 The regression equation is Y = - 42,8 + 2,66 X1 + 15,0 X2 Predictor Coef SE Coef T P Constant -42,84 10,23?? Temp 2,6607 0,4520?? Placering 15,004 1,360?? S = 3,03949 R-Sq =?% R-Sq(adj) =?% Analysis of Variance Source DF SS MS F P Regression 2???? Residual Error 17 157,05? Total 19 1575,09 Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (8)

Tabell för svar till del 1 Riv ut och lägg svarsbladet först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter skall anges i decimalform dom ett tal mellan 0 och 1. Fråga Svar Poäng 1 Sannolikhet (tre decimaler) 0.574 2 2 Sannolikhet (tre decimaler) 0.122 2 3 Sannolikhet (tre decimaler) 0.205 3 4 a Konstanten c (två decimaler) 0.44 1 b Median (två decimaler) 1.28 2 5 Väntevärde 5/λ 1 Varians 5/λ 2 1 6 Sannolikhet (tre decimaler) 0.020 2 7 Nedre gräns (fyra decimaler) -0,1709 2 8 Signifikansnivå (fyra decimaler) 0.0730 2 9 1,2,3,4,5 eller 6 4 2 10 a Predikterat värde (två decimaler) 21.04 1 b t-kvot (fyra decimaler) 11.0324 JA eller NEJ JA 2 c Nedre gräns (fyra decimaler) 4.0524 2 Totalt antal poäng 25 5 (8)

6 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2013-01-18 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 11. Vad är sannolikheten att partiken från uppgift 3 befinner sig mellan talen -50 och 50 efter 10 minuter? Lösningsskiss Positionen efter 600 sekunder är 2ξ 600, där ξ=antal steg i positiv riktning Bin(600, 0.5) N(300, 12.25) enligt centrala gränsvärdessatsen. Att partiken befinner sig mellan talen -50 och 50 efter 600 sekunder är samma sak som att 25 ξ 300 25, där ξ 300 N(0, 12.25). Sannolikheten är ca 0.4. (10p) 12. Två personer, A och B, skall mäta en okänd fysikalisk konstant θ. De gör en mätning var med olika metoder som båda är väntevärdesriktiga. De stokastiska variablerna ξ 1 och ξ 2 som betecknar mätvärdet från A respektive B kan antas vara oberoende, där V (ξ 1 ) = σa 2 och V (ξ 2) = σb 2 är kända. Som skattning av θ tänker man använda en linjär kombination η = c 1 ξ 1 + c 2 ξ 2. (a) Härled ett villkor som konstanterna c 1 och c 2 måste uppfylla för att η ska vara en väntevärdesriktig skattning av θ. (b) Visa att den väntevärdesriktiga linjärkombination som har bäst precision, dvs minst varians, ges av (5p) Lösningsskiss σ 2 B σ 2 A σa 2 + ξ 1 + σ2 B σa 2 + ξ 2. σ2 B (7p) (a) Enligt Sats 5A har vi E(η) = (c 1 +c 2 )θ. Så det krävs att c 1 +c 2 = 1. Om villkoret är uppfyllt är η väntevärdesriktig. (b) Villkoret c 1 + c 2 = 1 kan skrivas c 2 = 1 c 1. Låt därför c 1 = c och betrakta cξ 1 + (1 c)ξ 2. Variansen är (Sats 5A) c 2 σ 2 A + (1 c) 2 σ 2 B. Man kan t.ex. derivera för att få att uttrycket minimeras då c = σ 2 B σ 2 A +σ2 B. 13. 2 Läkaren från uppgift 8 genomför en egen studie på 20 personer, som var och en provar medicinen. En normalfördelningsplot över de 20 differenserna z i = x i y i, där y i är hälsan (i kodade enheter) för person nummer i efter behandling med medicinen, gav följande resultat. För att testa H 0 : ingen genomsnittlig effekt mot H 1 : positiv genomsnitt effekt 2 Uppgiften har förtydligats efter att tentamen avslutats. 7 (8)

Tentamen i Matematisk statistik, S0001M, del 2 2013-01-18 Figur 1: Normalfördelningsplot på 5 % signifikansnivå väljer han mellan två test. Det första testet baseras på d, där d är antalet negativa differenser. Det andra testet baseras på kvoten z t = s z / 20, där s z är stickprovsstandardavvikelsen för z 1,..., z 20. Vilket test bör läkaren välja och varför? Diskutera (kortfattat men tydligt) vilka konsekvenser ett felaktigt metodval medför. Lösningsskiss Eftersom värdena tycks vara normalfördelade så bör han välja t-testet. Det är möjligt att välja testet som baseras på d eftersom vi har observationer från en kontinuerlig fördelning. Men precisionen för det testet (dvs styrkan) kommer att bli sämre. (8p) 8 (8)