Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Relevanta dokument
(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Avd. Matematisk statistik

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Avd. Matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Lufttorkat trä Ugnstorkat trä

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Avd. Matematisk statistik

Avd. Matematisk statistik

0 om x < 0, F X (x) = c x. 1 om x 2.

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Avd. Matematisk statistik

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Uppgift 1. f(x) = 2x om 0 x 1

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Avd. Matematisk statistik

Avd. Matematisk statistik

1 e (λx)β, för x 0, F X (x) = 0, annars.

f(x) = 2 x2, 1 < x < 2.

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

b) Förekommer A- och B-fel oberoende av varandra? (Motivering krävs naturligtvis!) (5 p)

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Avd. Matematisk statistik

b) Teknologen Osquarulda känner inte till ML-metoden, men kom på intuitiva grunder fram till att p borde skattas med p = x 1 + 2x 2

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Avd. Matematisk statistik

Avd. Matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Avd. Matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 11: Mer om jämförelser och inferens

TENTAMEN I SF1906 (f d 5B1506) MATEMATISK STATISTIK GRUNDKURS,

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Avd. Matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Uppgift 1 Andrej och Harald roar sig med en standardkortlek med 52 kort uppdelade på fyra färger (spader, klöver, hjärter och ruter).

Avd. Matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

e x/1000 för x 0 0 annars

Uppgift 1 P (A B) + P (B A) = 2 3. b) X är en diskret stokastisk variabel, som har de positiva hela talen som värden. Vi har. k s

Lycka till!

Matematisk statistik TMS064/TMS063 Tentamen

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 18 AUGUSTI 2017 KL

Individ nr Första testet Sista testet

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

P =

Föreläsning 12: Repetition

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TENTAMEN I SF1904 MARKOVPROCESSER TISDAGEN DEN 29 MAJ 2018 KL

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

b) Vad är sannolikheten att personen somnar i lägenheten? (4 p) c) Hur många gånger förväntas personen byta rum? (4 p)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

** a) Vilka värden ska vara istället för * och **? (1 p) b) Ange för de tre tillstånden vilket som svarar mot 0,1,2 i figuren.

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901 Sannolikhetsteori och statistik I

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Sju dagar före viral exponering med echinacea därefter Efter viral exponering med echinacea därefter Placebo (ingen echinacea) 58 30

SF1901 Sannolikhetsteori och statistik I

Föreläsning 5: Hypotesprövningar

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Matematisk statistik TMS063 Tentamen

Tentamen i Matematisk statistik Kurskod S0001M

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Tentamen i Matematisk Statistik, 7.5 hp

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Tentamen MVE301 Sannolikhet, statistik och risk

TENTAMEN I STATISTIKENS GRUNDER 2

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

FÖRELÄSNING 8:

Transkript:

Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22 23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 a) En svart och en röd tärning kastas. Låt A vara händelsen att ögonsumman är 6 och B händelsen att den svarta tärningen visar 2 ögon. Undersök om A och B är oberoende eller ej. Noggrann motivering krävs. (5 p) b) För en viss region gäller följande: 20% av befolkningen är rökare. Sannolikheten att en rökare får lungcancer är 10 gånger så hög som att en icke-rökare får lungcancer. Antag att sannolikheten att få lungcancer för en slumpmässigt vald person är 0.006. Vad är då sannolikheten att en person får lungcancer givet att personen i fråga är rökare? (5 p) Uppgift 2 Erik får i uppgift att addera 120 tal, vardera med 10 decimaler. Av lathet bryr sig Erik dock inte om decimalerna vid additionen. Antag att decimaldelarna av de 120 talen kan uppfattas som likformigt fördelade på enhetsintervallet (0, 1) och dessutom oberoende av varandra. Låt X beteckna felet vid additionen som uppkommer på grund av strykningen av decimalerna (definierad så att X 0). Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p) Uppgift 3 Man har två observationer, x från X Exp(1/a), och y från Y Exp(2/a) där a > 0. X och Y är oberoende stokastiska variabler. a) Härled minsta kvadrat-skattningenskattningen a MK av parametern a. (3 p) b) Härled maximum likelihood-skattningen a ML av a. (3 p)

forts tentamen i SF1901, SF1905 2015-08-17 2 c) Undersök om skattningarna i a) och b) är väntevärdesriktiga. Undersök vidare vilken av a MK och a ML som är effektivast? Svaret skall motiveras. Om du inte har svarat på a) och b) så får du anta i del c) att a MK,obs. = 2x+y och a 2.5 ML,obs. = x+2y. (4 p) 2 Uppgift 4 I en veckotidning beskrivs en bantningskur som påstås ge en viktminskning av ungefär 7 kg på 14 dagar. En grupp på åtta personer bestämmer sig för att pröva kuren. Deras vikter (i kg) före och efter genomgången kur ges nedan: Före 108 88 82 103 98 100 90 85 Efter 110 85 78 101 91 99 90 82 Vikterna kan anses vara observationer av oberoende normalfördelade stokastiska variabler. Det är dock inte rimligt att anta att samtliga personer har samma förväntad vikt före kuren, eller att de har samma förväntad vikt efter kuren. a) Beräkna ett konfidensintervall av grad 95% för den förväntade viktminskningen efter genomgången kur. (7 p) b) Testa på signifikansnivån 5% hypotesen att den förväntade viktminskningen är 7 kg. Slutsatsen av testet skall klart framgå. (3 p) Uppgift 5 Inom medicinsk forskning används den så kallade VAS-skalan (Visuell Analog Skala) för att mäta smärta. Skalan är konstruerad som en 100 mm lång linje på vilken patienten får markera sin upplevda smärtnivå, varpå resultaten kan analyseras statistiskt. För att undersöka smärtnivån vid olika typer av kirurgi väljer en kirurg att dela upp VAS-skalan i tre kategorier: låg smärta ( 25) mm, acceptabel smärta 26-74 mm samt hög smärta ( 75) mm. Vidare valde kirurgen slumpmässigt ut 89 patienter vars smärta mättes 48 timmar efter en viss typ av operation. Av de 89 patienter som valdes ut i stickprovet var 42 som opererades med titthålskirurgi, och resten med traditionell kirurgi. Följande resultat erhölles. Låg smärta Accept. smärta Hög smärta Titthålskirurgi 13 23 6 Traditionell kirurgi 7 28 12 Kan man hävda att smärtnivå skiljer sig åt mellan olika typ av kirurgi? Svara på frågan med hjälp av ett lämpligt statistiskt test på nivån 5%. (10 p) Uppgift 6 Den naturliga bakgrundsstrålningen (uttryckt som antalet registrerade pulser per sekund, Bq) vid en viss mätpunkt har en intensitet av λ = 1 sek 1 och antalet registrerade pulser under ett tidsintervall (t 1, t 2 ) beskrivs med Poissonfördelning med väntevärde λ(t 2 t 1 ). På grund av en olycka i ett land misstänker man att intensiteten har ökat. a) Antag att man mäter under 15 sek och därvid registrerar 20 pulser. Pröva hypotesen H 0 : λ = 1 sek 1 med ett ensidigt test på nivån 5%. (2 p) b) Antag att intensiteten i själva verket har ökat till λ = 1.2 sek 1. Hur länge skall man mäta för att ha 50% chans att upptäcka detta om man gör ett approximativt test på nivån 5%. (8 p)

Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1901, SF1905, MATEMATISK STATISTIK. MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00 Uppgift 1 a) Vi har 36 möjliga utfall, vardera med sannolikheten 1/36. Ur figuren fås: P (A) = 5/36, P (B) = 6/36 = 1/6 och P (A B) = 1/36. Detta ger att P (A B) P (A) P (B), så A och B är inte oberoende. Svar: A och B är inte oberoende. b) Inför beteckningarna R = personen är rökare resp. C = personen får cancer. Enligt texten är P (R) = 0.2, P (C) = 0.006 och P (C R) = 10 P (C R ). Lagen om total sannolikhet ger P (C) = P (C R)P (R) + P (C R )P (R ) dvs 0.006 = P (C R) 0.2 + 1 P (C R) (1 0.2) = 0.28 P (C R) 10 och således Svar: P (C R) 0.021. P (C R) = 0.006 0.28 0.021. Uppgift 2 Strykningsfelen U 1, U 2,..., U 120 är oberoende och U(0, 1). Det totala felet X = 120 k=1 U k är enligt centrala gränsvärdessatsen approximativt normalfördelad med väntevärdet 120/2 = 60 och variansen 120/12 = 10. Härav Svar: P (X > 50) 0.999. P (X > 50) 1 Φ((50 60)/ 10) = Φ(3.16) = 0.999. Uppgift 3 För X Exp(1/a) har vi E(X) = a och respektive för Y Exp(2/a) är E(Y ) = a/2, se FSM, avsn. 4. a) MK-skattningen minimerar Q(a) = (x E(X)) 2 + (y E(Y )) 2 = (x a) 2 + (y a/2) 2. Med dq(a)/da = 2(x a) 2 1/2 (y a/2) får man minimum för a = (2x + y)/2.5. Svar: a MK,obs. = (2x + y)/2.5. b) Likelihoodfunktionen blir L(a) = 1 x 2 2y a e a a e a

forts tentamen i SF1901, SF1905 2015-08-17 2 som ger ln L(a) = 2 ln a + ln 2 x a 2y a. Med d ln L(a) da får man maximum för a = (x + 2y)/2. Svar: a ML,obs. = (x + 2y)/2. = 2 a + x a 2 + 2y a 2 = 0 c) Väntevärde och varians för Exp(λ) är 1/λ resp. 1/λ 2. Vi finner för MK-skattningen att ( ) 2X + Y 2a + a/2 E = = a. 2.5 2.5 För ML-skattningen har vi ( ) X + 2Y E 2 = a + 2a/2 2 = a, dvs både a MK och a ML är väntevärdesriktiga. Man finner vidare för MK-skattningen att ( ) 2X + Y V = X och Y är ober. = 1 ( 2a 2 2.5 2.5 2 + (a/2) 2) = 17 25 a2, och för ML-skattningen att ( ) X + 2Y V = 1 2 4 ( a 2 + 4(a/2) 2) = 17 25 a2 = a2 2. Svar: Både a MK och a ML är väntevärdesriktiga. Eftersom V (a MK ) > V (a ML ) så är a ML effektivast. Uppgift 4 a) Beteckna person nr. i:s vikt före resp. efter genomgången kur med x i resp. y i, för i = 1,..., 8. Vikterna är observationer av stokastiska variabler X 1,..., X 8 resp. Y 1,..., Y 8, och lämpliga modellantaganden är att X i N(µ i, σ 1 ) och Y i N(µ i, σ 2 ), för i = 1,..., 8, där är den förväntade viktminskningen, och alla parametrar är okända (modellen stickprov i par). Vi bildar de parvisa differenserna Z i = X i Y i, och motsvarande observerade värden z i = x i y i, för i = 1,..., 8. Då är z i en observation av Z i N(, σ z ), där σ z = σ 2 1 + σ 2 2. De observerade värdena z 1,..., z 8 är 2 3 4 2 7 1 0 3 Eftersom σ z är okänt så är I = z ± t α/2 (n 1) s z n ett konfidensintervall för av grad 1 α. I vårt fall gäller z = 2.25 s z = 2.7124 n = 8 t 0.025 (7) = 2.36 vilket ger I = 2.25 ± 2.36 2.7124 8 = 2.25 ± 2.26 = ( 0.01, 4.51).

forts tentamen i SF1901, SF1905 2015-08-17 3 Svar: I = ( 0.01, 4.51). b) Eftersom 7 / I, så måste denna hypotes förkastas på nivån 5%. Uppgift 5 Vi använder ett χ 2 -oberoendetest för att pröva nollhypotesen att smärtnivån är oberoende av typ av kirurgi. Låt p ij vara andelen av hela populationen av patienter som opererades med typ i av kirurgi (i = 1 för titthålskirurgi, i = 2 för traditionell kirurgi) som har upplevt typ j smärtnivån (j = 1 för låg smärta, och j = 2, 3 för acceptabel resp. hög smärta). Nollhypotesen H 0 är nu p ij = p i p j där p i är andelen av hela populationen av patienter som opererades med typ i av kirurgi, och p j är andelen av samma hela population som har upplevt smärtnivån j enligt ovan. Mothypotesen H 1 är p ij p i p j för något i och j. Vi får Teststorheten blir j = 1 j = 2 j = 3 Totalt i = 1 13 23 6 42 i = 2 7 28 12 47 Totalt 20 51 18 89 Q = + (13 42 20/89)2 (23 42 51/89)2 (6 42 18/89)2 + + 42 20/89 42 51/89 42 18/89 (7 47 20/89)2 (28 47 51/89)2 (12 47 18/89)2 + + 47 20/89 47 51/89 47 18/89 + = 4.02 Under H 0 är detta en observation från en χ 2 -fördelning med (2 1)(3 1) = 2 frihetsgrad, och vi skall förkasta H 0 för stora värden. Då χ 2 0.05(2) = 5.991 och 4.02 < 5.991 finns det inte stöd (på signifikansnivån 5%) för slutsatsen att det finns ett beroende mellan smärtnivån och typ av kirurgi. Det går också utmärkt att använda funktionen χ 2 -test på räknare, med det inre av tabellen ovan som indata. Vi får då teststorheten 4.02 som ovan, och p-värdet 0.059. Eftersom p-värdet är > 0.05 så kan vi inte förkasta nollhypotesen om oberoende på nivån 5%. Uppgift 6 Låt X(t) vara antalet registrerade pulser under (0, t), enligt uppgift är X(t) P o(λt). a) Vi vill testa H 0 : λ = 1 mot H 1 : λ > 1. Om H 0 är sann och t = 15 så är X(t) P o(15). x = 20 är en uttfall av X. Direktmetoden ger p-värde P (X > 20 om H 0 är sann) = P (X > 20 X P o(15)) = 1 P (X 19) = 1 0.8752 = 0.1248. Eftersom 0.1248 > α = 0.05 kan H 0 inte förkastas.

forts tentamen i SF1901, SF1905 2015-08-17 4 b) Normalapproximation ger X(t) N(λt, λt), approximativt. Om H 0 är sann så är X(t) N(t, t). Test: Förkasta H 0 om x(t) t t > λ 0.05 = 1.64. Styrkan för λ = 1.2 ges av 0.5 = h(1.2) = P (Förkasta H 0 om λ = 1.2) = P ) P (X(t) > t + λ 0.05 t λ = 1.2 = standardisera = P ( ) λ0.05 t 0.2t 1 Φ. 1.2t ( ) X(t) t > λ 0.05 λ = 1.2 = t ( X(t) 1.2t > λ ) 0.05 t + t 1.2t = 1.2t 1.2t Detta ger vidare vilket vi löser för t Vi får alltså t = 67.64 sek. ( ) λ0.05 t 0.2t 0.5 = 1 Φ, 1.2t λ 0.05 0.2t 1.2t = 0 t = λ 0.05 0.2.