Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Relevanta dokument
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Matematisk statistik TMS064/TMS063 Tentamen

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 11

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

FÖRELÄSNING 7:

Statistik 1 för biologer, logopeder och psykologer

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

0 om x < 0, F X (x) = c x. 1 om x 2.

Lektionsanteckningar 11-12: Normalfördelningen

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

FÖRELÄSNING 8:

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TMS136: Dataanalys och statistik Tentamen

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Lufttorkat trä Ugnstorkat trä

TENTAMEN Datum: 14 feb 2011

TMS136. Föreläsning 13

F9 Konfidensintervall

Uppgift a b c d e Vet inte Poäng

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Tentamen L9MA30, LGMA30

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

10. Konfidensintervall vid två oberoende stickprov

Avd. Matematisk statistik

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

8 Inferens om väntevärdet (och variansen) av en fördelning

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamentsskrivning: Matematisk statistik TMA Tentamentsskrivning i Matematisk statistik TMA321, 4.5 hp.

Avd. Matematisk statistik

TAMS65 - Föreläsning 6 Hypotesprövning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

F3 Introduktion Stickprov

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Avd. Matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Tentamentsskrivning: Matematisk Statistik TMA321 1

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 12: Regression

Samplingfördelningar 1

Repetitionsföreläsning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Tentamen LMA 200 Matematisk statistik,

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Avd. Matematisk statistik

Föreläsning 5. Kapitel 6, sid Inferens om en population

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning G60 Statistiska metoder

Avd. Matematisk statistik

Formel- och tabellsamling i matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Avd. Matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

F10 Problemlösning och mer om konfidensintervall

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Föreläsning 5: Hypotesprövningar

Avd. Matematisk statistik

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Föreläsning 11: Mer om jämförelser och inferens

Tentamen MVE301 Sannolikhet, statistik och risk

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk Statistik, 7.5 hp

Tentamen MVE301 Sannolikhet, statistik och risk

TMS136. Föreläsning 10

Hur man tolkar statistiska resultat

2. Test av hypotes rörande medianen i en population.

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

(a) Anta att Danmarksprojektet inte lyckas hålla budgeten. Vad är då sannolikheten att Sverigeprojektet inte heller lyckas hålla budgeten? Motivera!

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Lösningar till tentamen i Matematisk Statistik, 5p

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

FACIT: Tentamen L9MA30, LGMA30

Lösningar till tentamen i Matematisk Statistik, 5p

Transkript:

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour: Claes Andersson (tel 0734031540). Hjälpmedel: miniräknare, egenhändigt skriven formelsamling om två A4 fram och bak (dvs 4 sidor) samt tabeller (delas ut på plats). Tentamen består av 8 frågor om sammanlagt 50 poäng. Preliminära betygsgränser är satta till: betyg 3 : 20 till 29 betyg 4 : 30 till 39 poäng betyg 5 : 40 eller fler poäng. OBS! Alla lösningar skall vara väl redovisade och motiverade. Talen är ej ordnade efter svårighetsgrad 1. Låt A, B vara händelser så att P(A) = 0.4 och P(B) = 0.3. (6p) (a) (2p) Om P(A B) = 0.2, vad blir då P(A B)? (b) (2p) Om A, B är oberoende, vad blir då P(A c B c )? (c) (2p) Antag igen att P(A B) = 0.2 och låt C vara sådan att P(C) = 0.6 och A, C är disjunkta. Beräkna P(B C) (a) Vi har att P(A B) = P(A) + P(B) P(A B) = 0.4 + 0.3 0.2 = 0.5. (b) Oberoende ger att P(A c B c ) = P(A c )P(B c ) = (1 P(A))(1 P(B)) = 0.6 0.7 = 0.42. (c) Vi inser att C = A c så att P(B C) = P(B A c ) = P(B) P(B A) = 0.3 0.2 = 0.1. 2. Ceclia har fått diverse frågor att besvara. Hjälp henne med detta: (7p) (a) (1p) Förklara kort vad det är för skillnad mellan en variabel och en parameter. (b) (1p) Ange vad man har för krav på p-värdet för att kunna förkasta en nollhypotes när signifikansnivån är vald till 1%.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 2 (c) (1p) Man har samlat in en datamängd från en variabel som skall ha målvärdet 8.10. Värdena blev: 7.99 8.02 7.95 8.37 8.42. Beräkna en skattning av det systematiska felet (bias). (d) (1p) Vad betyder det att styrkan i ett test är 80%? (e) (3p) Ange för varje påstående nedan om det är fel eller om det är rätt. e1) En signifikansnivå är detsamma som ett minus styrkan. e2) Gör man två mätningar på samma individ kan man inte säga att värdena är oberoende. e3) Man skall inte alltid illustrera kvantitativa (numeriska) data med ett histogram. e4) Om man använder en kvantitativ (numerisk) variabel kan man använda normalfördelning som approximativ modell för medelvärdet om stickprovsstorleken är stor. e5) Om man använder en kvalitativ (kategorisk) variabel kan man inte göra ett t-test. e6) Längden på ett konfidensintervall blir kortare när stickprovsstorleken ökar. a) Parameter; en karakteristika i en population (teoretiskt mått i en fördelning). Variabel; värde som varierar för olika objekt/individer (men kan beskrivas med hjälp av en fördelning). b) Det skall vara 0.01. c) Medelvärdet är 8.15. Det systematiska felet uppskattas till 8.15 8.10 = 0.05. Det går lika bra att först beräkna avvikelserna från målvärdet och sedan medelvärdet av dessa värden. d) Sannolikheten är 80% att korrekt förkasta en nollhypotes (sannolikheten att förkasta nollhypotesen givet att den är falsk). e) Alla utom e1 är korrekta. 3. En slumpvariabel X kan anta värdena 1, 2, 4 och 5 med respektive sannolikheter P(X = 1) = 0.1, P(X = 2) = 0.2, P(X = 4) = 0.3 och P(X = 5) = 0.4. (8p) (a) (2p) Beräkna väntevärde och varians för X. (b) (2p) Beräkna väntevärde och varians för 1/X. (c) (2p) Låt X 1, X 2 vara oberoende slumpvariabler med samma fördelning som X. Vad är sannolikheten att X 1 + X 2 blir ett jämnt tal? (d) (2p) Med samma förutsättningar som i (c), vad är sannolikheten att X 1 X 2 + X 2 blir ett jämnt tal?

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 3 (a) Vi har att E[X] = 1P(X = 1) + 2P(X = 2) + 4P(X = 4) + 5P(X = 5) = 0.1 + 2 0.2 + 4 0.3 + 5 0.4 = 0.1 + 0.4 + 1.2 + 2 = 3.7, och vidare är E[X 2 ] = 1P(X = 1) + 2 2 P(X = 2) + 4 2 P(X = 4) + 5 2 P(X = 5) = 0.1 + 4 0.2 + 16 0.3 + 25 0.4 = 0.1 + 0.8 + 4.8 + 10 = 15.7 så att Var(X) = E[X 2 ] E[X] 2 = 15.7 3.7 2 = 2.01. (b) Vi har att och vidare är så att E[1/X] = 1P(X = 1) + P(X = 2)/2 + P(X = 4)/4 + P(X = 5)/5 = 0.1 + 0.2/2 + 0.3/4 + 0.4/5 = 0.355, E[(1/X) 2 ] = 1P(X = 1) + P(X = 2)/4 + P(X = 4)/16 + P(X = 5)/25 = 0.1 + 0.2/4 + 0.3/16 + 0.4/25 = 739 4000 Var(1/X) = E[(1/X) 2 ] E[1/X] 2 = 739 4000 (71/400)2 = 596 10149 0.058725. (c) Vi har att X 1 + X 2 blir ett jämnt tal om antingen båda är jämna eller båda är udda. Vi får då att P(X 1 + X 2 jämnt ) Alternativt = P(X 1 udda, X 2 udda ) + P(X 1 jämnt, X 2 jämnt ) = P(X 1 udda ) 2 + P(X 1 jämnt ) 2 = 0.5 2 + 0.5 2 = 0.5. P(X 1 + X 2 jämnt ) = P(X 1 = 1, X 2 = 1) + P(X 1 = 1, X 2 = 5) + P(X 1 = 5, X 2 = 1) + P(X 1 = 5, X 2 = 5) +P(X 1 = 2, X 2 = 2) + P(X 1 = 2, X 2 = 4) + P(X 1 = 4, X 2 = 2) + P(X 1 = 4, X 2 = 4) = 0.5 2 + 0.5 2 = 0.5. (d) Vi har att X 1 X 2 + X 2 = X 2 (1 + X 1 ) är jämnt om antingen X 2 är jämnt eller X 1 är udda. Vi får att P(X 2 (1 + X 1 ) jämnt) = 1 P(X 2 (1 + X 1 ) udda) = 1 P(X 2 udda)p(x 1 jämnt) = 1 0.5 2 = 0.75.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 4 4. David har en normalfördelningsmodell och vill utföra ett test. (3p) (a) (1p) Mothypotesen formulerar han som H a : µ µ 0 där µ 0 är ett värde enligt nollhypotesen. Om han använder en teststatistika där σ 2 är känt, vad blir gränsen/gränserna till förkastelseområdet då signifikansnivån är vald till 5%? (b) (1p) Om mothypotesen istället är H a : µ > µ 0, vad blir gränsen/gränserna till förkastelseområdet då? (c) (1p) Om David inte känner till σ 2 och utnyttjar data med stickprovsstorleken n = 5, vad blir gränserna till förkastelseområdet då med mothypotes som i (a)-uppgiften? a) Gränserna är 1.96 och 1.96. b) Gränsen är 1.645. c) Gränserna är 2.776 och 2.776. 5. En vanlig kortlek består av 52 kort, och av dessa väljs ut till en bridgehand. (5p) (a) (1p) Hur många bridgehänder finns det? (b) (2p) Hur många bridgehänder finns det som innehåller exakt fem spader och två klöver? (c) (2p) Vad är sannolikheten att handen innehåller exakt två klöver givet att handen innehåller exakt fem spader? (a) Det finns ( 52 ) händer. (b) Vi kan välja de fem spaderna på ( ) 5 sätt, och sedan kan vi välja de två klöverna på ( ) ( 2 sätt och till sist de resterande 6 korten på 26 ) 6 sätt. Sammanlagt får vi då ( )( )( ) 26. 5 2 6 (c) Låt S = #spader och K = #klöver. Vi får att P(S = 5, K = 2) P(K = 2 S = 5) = P(S = 5) ) ) = ( 5 )( )( 26 2 6 ( 52 ) ( 5 ( 52 )( 39 8 ) = ( )( 26 2 6 ( 39 8 ) ) 0.29189.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 5 6. Anna har gjort en fuktstudie av spånskivor från en tillverkare genom att mäta ånggenomsläppligheten. Värdena (dygnflödet) från mätningarna blev: 8. 9 8.4 9.5 8.6 9.4 8.8 9.1 9.2 Anna har tidigare haft leveranser från en tillverkare som hon varit nöjd med. Nu används medelvärdet från den, som var 8.5 g/m 2, som ett målvärde för den nya tillverkarens väntevärde. Normalfördelning anses vara en bra modell för variabeln. (8p) (a) (5p) Beräkna ett 95%-igt konfidensintervall för väntevärdet. Om syftet var att undersöka om den nya tillverkarens väntevärde avviker från förra, dra en slutsats enbart med hjälp av det uträknade intervallet. Ange också vilken signifikansnivå detta test har. (b) (3p) Anna tycker att en avvikelse på som mest 10% från den gamla tillverkarens medelvärde är acceptabelt. Visa hur hon kan ta ett beslut om nya tillverkaren med hjälp av konfidensintervallet. Vad blir din slutsats? a) Låt Y = dygnflödet. Formeln för ett konfidensintervall: ȳ ± t n 1,α/2 s/ n Med de givna värdena blir det (avrundat) 8.91 ± 2.365 0.35/ 8 dvs (8.6, 9.2). Eftersom målvärdet 8.5 inte ingår i det 95%-iga intervallet kan H 0 : µ = 8.5 förkastas på signifikansnivå 5%. b) Acceptabelt är inom intervallet (7.65, 9.35). Eftersom hela konfidensintervallet ryms inom detta intervall anses avvikelsen vara acceptabel och inte signifikant ur ett mer praktiskt perspektiv. Den nya tillverkarens väntevärde i fuktstudien kan anses duga. 7. Charlie vill studera om folk upplever störningar i sitt boende. Lägenheter från bostadsområden i två olika delar av Göteborg har därför valts ut slumpmässigt. I dessa intervjuade han de boende bl a med frågan om de stördes av trafiken. Bland de 60 st i område 1 svarade 15 ja på detta och bland de 65 i område 2 var det 24 st som svarade ja. Syftet är att undersöka om proportionerna skiljer sig åt mellan bostadsområdena. (7p) (a) (5p) Charlie vill att du formulerar hypoteserna och utför testet. (b) (2p) Charlie vill också att du beräknar ett konfidensintervall för skillnaden mellan bostadsområdenas proportioner. Låt p 1 och p 2 vara parametrarna i två oberoende binomialfördelningar och beteckna andelarna för de som störs av trafik. a) H 0 : p 1 = p 2 och H a : p 1 p 2. Skattningarna: ˆp 1 = x 1 /n 1 = 15/60 =

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 6 0.25 och ˆp 2 = x 2 /n 2 = 24/65 0.37. I testet med H 0 : p 1 = p 2 skattas det gemensamma p 1 = p 2 = p med ˆp = x1+x2 n 1+n 2. Teststatistikan ˆp 1 ˆp 2 ˆp(1 ˆp)(1/n1 + 1/n 2 ) (approximativt normalfördelad) fick värdet 1.44. Jämför detta med förkastelsegränserna ±z 0.025 = ±1.96. Eftersom teststatistikans värde inte har passerat någon av förkastelsegränserna kan H 0 inte förkastas. Man kan inte i denna undersökning påvisa skillnad i andelarna som störs av trafiken. b) Till skillnad från fallet beräknat under förutsättningen H 0 : p 1 = p 2 = p måste de två proportionerna skattas var för sig. Det gör man med relativa frekvenserna och standardavvikelsen har därför formeln ˆp1 (1 ˆp 1 )/n 1 + ˆp 2 (1 ˆp 2 )/n 2 Ett 95%-igt konfidensintervall för p 2 p 1 blir ( 0.04, 0.28). 8. Ett sågverk tillverkar brädor. Brädorna är av varierande kvalitet och graderas antingen som A-klass,B-klass eller C-klass. Sågverket antar att sannolikheten för att en given bräda blir A-klass är 0.2, B-klass 0.5 och C-klass 0.3. Låt X A vara antalet brädor som blir A-klass om sågverket en dag tillverkar 2300 brädor. (6p) (a) (2p) Hitta en lämplig fördelning för X A. Vilka antaganden måste du göra? Är dessa antaganden realistiska? (b) (2p) Beräkna sannolikheten att X A blir 420 eller mindre. (c) (2p) En fjärde klassificering införs som kallas A +. Sannolikheten att en given bräda skall få denna klassificering är 0.005. Låt X + vara antalet brädor som får denna klassificering av de 2300 som tillverkas. Ange en lämplig approximativ fördelning för X + och använd denna för att beräkna sannolikheten att X + = 15. (a) Vi har att X A Bin(2300, 0.2) under antagandet att alla brädor klassificeras som A oberoende av varandra. Detta antaganden är rimligt, även om man kan tänka sig att eventuella defekter delas av andra brädor som är gjorda av samma träd. Då antalet tillverkade brädor är så stort kommer felet från vårt antagande vara litet. (b) Approximativt får vi att så att X A N (E[X], Var(X)) = N(np, np(1 p)) = N(460, 368) P(X A 420) = P ( ) XA 460 420 460 P(Z 2.0851) 368 368 = P(Z 2.0851) = 1 P(Z 2.0851) 1 0.981 0.019.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 7 (c) Vi använder att X + Poi(λ) där λ = 2300 0.005 = 11.5 vilket är lämpligt då p är väldigt litet. Med hjälp av detta får vi att P(X + = 15) = 11.515 e 15 0.0019. 15!