TMS136: Dataanalys och statistik Tentamen

Relevanta dokument
Matematisk statistik TMS063 Tentamen

Matematisk statistik TMS064/TMS063 Tentamen

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

FÖRELÄSNING 8:

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen i Sannolikhetslära och statistik, TNK069, , kl 8 13.

Tentamen i Matematisk Statistik, 7.5 hp

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 4

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

2. En vanlig kortlek består av 52 kort, varav 13 i varje färg. En pokerhand består av 5 kort.

Avd. Matematisk statistik

TMS136. Föreläsning 11

Tentamentsskrivning: Matematisk Statistik TMA321 1

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Kap 2. Sannolikhetsteorins grunder

Tentamen MVE302 Sannolikhet och statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

FACIT: Tentamen L9MA30, LGMA30

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen L9MA30, LGMA30

Avd. Matematisk statistik

TMS136. Föreläsning 13

Matematisk statistik KTH. Formelsamling i matematisk statistik

Formel- och tabellsamling i matematisk statistik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

SF1901: Sannolikhetslära och statistik

Matematisk statistik för D, I, Π och Fysiker

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

STATISTISKA INSTITUTIONEN Jakob Bergman

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Lösningar till tentamen i Matematisk Statistik, 5p

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Tentamen MVE301 Sannolikhet, statistik och risk

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

, för 0 < x < θ; Uppgift 2

Avd. Matematisk statistik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen MVE301 Sannolikhet, statistik och risk

Lufttorkat trä Ugnstorkat trä

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

FACIT: Tentamen L9MA30, LGMA30

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Uppgift 1. f(x) = 2x om 0 x 1

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen LMA 200 Matematisk statistik,

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Kurssammanfattning MVE055

Tentamen MVE300 Sannolikhet, statistik och risk

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Föreläsning 12: Repetition

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)


Avd. Matematisk statistik

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Lösningar till tentamen i Matematisk Statistik, 5p

Statistik 1 för biologer, logopeder och psykologer

Problemdel 1: Uppgift 1

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 10/ KL

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 7: Punktskattningar

(a) Anta att Danmarksprojektet inte lyckas hålla budgeten. Vad är då sannolikheten att Sverigeprojektet inte heller lyckas hålla budgeten? Motivera!

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 7: Punktskattningar

Transkript:

TMS136: Dataanalys och statistik Tentamen 013-08-7 Examinator och jour: Mattias Sunden, tel. 0730 79 9 79 Hjälpmedel: Chalmersgodkänd räknare och formelsamling (formelsamling delas ut med tentan). Betygsgränser: För betyg 3 krävs 14 poäng, för 4 krävs 0 poäng och för betyg 5 krävs 7 poäng. Totalt finns 35 poäng. Om du vill att jag skall mejla dig resultatet när jag rättat klart din tenta kan du skriva din mejladress på det sista pappret du lämnar in. Skriv i så fall gärna läsligt. Observera att tentan i detta fall kanske inte blir anonym, så strunta i det om det känns viktigt. Fullständiga och välmotiverade lösningar skall ges till varje uppgift! 1. Definiera följande begrepp: Lösningar (a) Signifikansnivå. Sannolikheten att göra ett typ I-fel (förkasta nollhypotesen då nollhypotesen är sann) (1p) (b) Styrka. Sannolikheten att inte göra ett typ II-fel (att inte göra ett typ II-fel betyder att man förkastar nollhypotesen då nollhypotesen är falsk) (1p) (c) Väntevärdesriktighet. En skattare är väntevärdesriktig om väntevärdet av skattaren är precis den parameter som skattaren avser (1p) (d) Av två väntevärdesriktiga skattare (för samma parameter) väljer du den med? Minst varians (1p). Ett elevråd bestående av tre killar och tre tjejer ska väljas bland 7 killar och 8 tjejer. Den ena killen är syskon med den ena tjejen. Vad är sannolikheten att: (a) Båda syskonen hamnar i elevrådet? (p) Lösning: Om båda syskonen ska vara med återstår att välja av 6 killar och av 7 tjejer. Detta kan göras på C 6 C 7 = 6! 7! = 15 1 = 315!4!!5! sätt. Det finns alltså 315 gynnsamma utfall. Antalet möjliga utfall vid val av elevråd blir C3 7 C3 8 = 7! 8! = 35 56 = 1960. 3!4! 3!5! Så sannolikheten att båda syskonen hamnar i elevrådet är 315 1960 = 9 56. 1

(b) Inget av syskonen hamnar i elevrådet? (p) Lösning: Om inget av syskonen ska vara med ska man välja 3 av 6 killar och 3 av 7 tjejer. Detta kan göras på C3 6 C3 7 = 6! 7! = 0 35 = 700 3!3! 3!4! sätt. Det finns alltså 700 gynnsamma utfall. Så sannolikheten att båda syskonen hamnar i elevrådet är 700 1960 = 5 14. 3. Som ni säkert vet har Franska Ligue 1 precis dragit igång och då måste vi ju ha en fotbollsfråga. Jag har kollat upp lite statistik på Zlatan. Han gör mål i ungefär 65% av matcherna och hans lag PSG vinner 84% av dessa matcher. PSG vinner 5% av matcherna där Zlatan inte gör mål. Om PSG vinner en match, vad är sannolikheten att Zlatan gjorde mål? (4p) Lösning: Låt V vara händelsen att PSG vinner och Z vara händelsen att Zlatan gör mål. Vi har då att P(Z) = 0.65, P(V Z) = 0.84, P(V Z ) = 0.5. Den sannolikhet vi ska beräkna är P(Z V ). Enligt Bayes sats följer att P(Z V ) = P(V Z)P(Z) P(V Z)P(Z) P(V Z )P(Z ) = 0.84 0.65 0.84 0.65 0.5 0.35 = 0.75. 4. Låt X och Y vara oberoende och (kontinuerligt) likformigt fördelade på intervallet [0,1]. Låt C och A vara omkretsen respektive arean av en rektangel med sidorna X och Y. Beräkna kovariansen Cov(C,A). (4p) Lösning: Vi har att C = X Y och A = XY. Det följer (bilinjaritet hos kovariansoperatorn) att Cov(C,A) = Cov(X Y,XY ) = Cov(X,XY ) Cov(Y,XY ). Eftersom X och Y är oberoende har vi = 1 1 0 0 Cov(X,XY ) = E[X Y ] (E[X]) E[Y ] ( 1 ) 1 x ydxdy xdx ydy = 1 ( ) 1 0 0 6 1 = 1 4. Av symmetriskäl är också Cov(Y,XY ) = 1 4. Det följer att Cov(C,A) = 1 6. 5. Tiden mellan landningar på en flygplats är exponentialfördelad med väntevärde minuter. Antag att ett plan precis har landat. Vad är sannolikheten att det under under nästkommande fem minuter landar åtminstone tre plan? (4p)

Lösning: Under antagande om att tiderna mellan landningar är oberoende följer att antalet plan som landar under en minut är Poissonfördelat med väntevärde 0.5 plan. Under antagande om att landingar från en minut till en annan sker oberoende följer att antalet landningar under fem minuter är Poissonfördelat med väntevärde.5 plan. Låt N ara antalet plan som landar under fem minuter. Den sökta sannolikheten blir då ( ) P(N 3) = 1 P(N ) = 1 e.5 1.5.5 0.46. 6. Under en Gyllene Tider-konsert spelas låtar. Den förväntade längden för en Gyllene Tider-låt är tre minuter och 30 sekunder. Standardavvikelsen för en låtlängd är 45 sekunder. Under antagande om att låtlängderna är oberoende av varandra och att låtarna väljs godtyckligt bland oändligt många GT-låtar, vad är sannolikheten att den sammanlagda låtlängden under en konsert är större än en timme och 15 minuter? (3p) Lösning: Enligt CGS är den sammanlagda låtlängden approximativt normalfördelad med väntevärde 10 = 460 sekunder och standardavvikelse 45. Om vi låter X i vara längden för en låt i = 1,..., följer att den sökta sannolikheten är (vi räknar i sekunder och låter Z beteckna en N(0,1)-variabel...) P ( ) X i > 4500 i=1 ( ) 4500 460 P Z > P(Z > 0.57) = Φ(0.57) 0.7. 45 7. Låt X 1,...,X n vara ett stickprov från en fördelning med täthetsfunktion f(x) = λe λx, x 0,λ > 0. Bestäm Maximum likelihood-skattaren för λ. (3p) Lösning: Med den givna täthetsfunktionen följer att likelihood-funktionen är L(λ) = λ n e λ P X i. Detta betyder att log-likelihood-funktionen är l(λ) = nln λ λ X i. Deriverar vi l (med avseende på λ) och sätter derivatan lika med noll följer n att ML-skattaren för λ är P Xi = 1 X. 8. Punkter (X, Y ) på enhetscirkeln genereras slumpmässigt genom att låta X = cos Z och Y = sin Z där Z är (kontinuerligt) likformigt fördelad på intervallet [0,π). (a) Vad är väntevärdet för X? (ingen beräkning krävs) (1p) Lösning: Väntevärdet är noll eftersom det är lika stor area ovanför x-axeln som under x-axeln i integrationsområdet. 3

(b) Är X och Y okorrelerade? (p) Lösning: Ja, eftersom Cov(X, Y ) = E[XY ] här och E[XY ] = E[cos Z sin Z] = 1 E[sin(Z)] = 0. (c) Är X och Y oberoende? (p) Lösning: Nej, eftersom X = ± 1 Y. 9. En leverantör av muttrar påstår att antalet defekta muttrar i de lådor om 50 muttrar som han levererar är binomialfördelat. Du testar 100 lådor för att undersöka om leveratörens påstående stämmer. Du finner noll defekta muttrar i 44 lådor, en defekt mutter i 36 lådor, två defekta muttrar i 18 lådor och fyra defekta muttrar i resterande lådor. Ställ upp lämpliga hypoteser och testa leveratörens påstående. (4p) Lösning: Vi ska använda ett goodness of fit-test med nollhypotesen att antalet defekta muttrar i en låda är binomial fördelat med n = 50 och någon proportion p. Vi väljer signifikansnivån α = 0.05. Vi har inget värde på p så vi skattar p från våra observerade data. Vi observerar att ˆp = 0 44 1 36 18 4 50 100 = 15. Om vi låter X vara antalet defekta muttrar i en låda har vi alltså under nollhypotesen att ( ) ( ) 50 k 13 P(X = k) = Ck 50. 15 15 Det följer att P(X = 0) = ( ) 50 13 0.4464 15 P(X = 1) = 50 15 ( ) 49 13 0.3630 15 ( ) ( ) 48 13 P(X = ) = 49 5 0.1446 15 15 P(X 3) 0.0460 Det ger i sin tur att de förväntade antalen lådor med 0,1, respektive fler än 3 defekta muttrar är E 0 = 0.4464 100 = 44.64, E 1 = 0.3630 100 = 36.30, E = 0.1446 100 = 14.46, E 3 = 0.0460 100 = 4.64. 4

Det observerade värdet på den χ med två frihetsgrader-fördelade teststatistikan blir alltså (44 44.64) 44.64 (36 36.30) 36.30 (18 14.46) 14.46 ( 4.64) 4.64.38 Det kritiska värdet är 5.99 så vi kan alltså inte förkasta nollhypotesen. Vi har alltså inte fog för att säga att leverantören ljuger. 5