Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsningsanteckningar till kapitel 8, del 2

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Avd. Matematisk statistik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

TENTAMEN Datum: 14 feb 2011

Avd. Matematisk statistik

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Tentamen LMA 200 Matematisk statistik,

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Matematisk statistik TMS063 Tentamen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

FÖRELÄSNING 7:

Lösningar till tentamen i Matematisk Statistik, 5p

Uppgift a b c d e Vet inte Poäng

Lycka till!

Matematisk statistik TMS064/TMS063 Tentamen

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Lufttorkat trä Ugnstorkat trä

Tentamen LMA 200 Matematisk statistik,

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Matematisk statistik LKT325 Tentamen med lösningar

Avd. Matematisk statistik

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

F9 Konfidensintervall

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Uppgift 1. f(x) = 2x om 0 x 1

Avd. Matematisk statistik

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Avd. Matematisk statistik

Transkript:

Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 ( uppgifter) Tentamensdatum 2018-08-28 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Niklas Grip Jourhavande lärare: Niklas Grip Tel: 0920-49 30 09 Examinator: Mykola Shykula Tillåtna hjälpmedel: Räknedosa, Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen (del 1), som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in även lösningar och bifogas oavsett om du lämnat in lösningar eller ej. OBS! Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen (del 2), som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på del 1 samt minst 13 poäng på del 2. För betyg 5 krävs godkänt på del 1 samt minst 23 poäng på del 2. OBS! Det går inte att kompensera underkänt på del 1 av tentamen med poäng från del 2. Ange på tentamensomslaget om du har lämnat in lösningar på del 2 genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 (9)

1. Låt A och B vara två disjunkta händelser med sannolikheter P (A) = 0.3 och P (B) = 0.7. Bestämd den betingade sannolikheten P (A B). (1 p) 2. LTU-studenten Lisa läser en kurs med tre problemseminarier. Vid varje seminarietillfälle lottas sex stycken studenter ut, vilka får redovisa sin lösning på var sitt i förhand utdelat problem. Lisa konstaterar efteråt att sannolikheten att behöva redovisa sin lösning på en uppgift var 6 25, 6 24 och 6 20 vid seminarie 1, 2 respektive 3. Betrakta detta som sannolikheterna för tre oberoende händelser. Vad blir då sannolikheten att Lisa får redovisa sin lösning på en utdelad uppgift vid högst ett av de tre problemseminarierna? (2 p) 3. LTU-studenten Lasse deltar i en frågesport där man får +1 poäng för varje korrekt svar och -1 poäng för varje felaktigt svar (eller för inget svar). Totala antalet poäng kan alltså bli negativt. Från tidigare omgångar bedömer han att att han i genomsnitt ger rätt svar på 60 % av frågorna. Betrakta poängtilldelningen på olika frågor som oberoende slumpvariabler och räkna ut sannolikheten att Lasse efter besvarade frågor har minst 4 poäng. (3 p) 4. Slumpvariablerna ξ 1, ξ 2 och ξ 3 är oberoende, där ξ 1 R(0,30), ξ 2 N(16,3) och där ξ 3 Exp(1). Bestäm väntevärde och standardavvikelse för slumpvariabeln ξ = ξ 1 + ξ 2 + ξ 3. (2 p) 5. Slumpvariabeln ξ har en kontinuerlig fördelning med fördelningsfunktion 0, om x 1, F (x) = x+1 3, om 1 x 2, 1, om x > 2. (a) Bestäm sannolikheten P (0 < ξ 1). (1 p) (b) Bestäm medianen i fördelningen för ξ. (1 p) (c) Bestäm väntevärdet E(ξ). (2 p) 6. För en viss typ av elektroniska komponenter är livslängden exponentialfördelad med genomsnittlig livslängd 0 veckor. Man har 0 sådana komponenter i en låda, och en apparat som bara behöver en fungerande komponent. Varje gång en sådan komponent går sönder så byter man omedelbart till en ny från lådan. Antag att livslängden för de olika komponenterna är statistiskt oberoende. Räkna ut sannolikheten att sammanlagda livslängden för alla de 0 komponeneterna blir högst 11 000 veckor. (2p) 7. I ett laboratorium finns två olika maskiner för torsionsprov på stålvajrar. Man vill undersöka om det finns någon skillnad mellan mätresultat från de två maskinerna. Fem vajrar av olika typer delas därför i två likadana bitar som testas i var sin maskin. Detta ger följande resultat Typ av vajer 1 2 3 4 5 Maskin A 27 35 38 28 40 Maskin B 25 34 39 26 37 2 (9)

Mätresultat för olika vajertyper betraktas som oberoende normalfördelade variabler. Beräkna ett 95 % konfidensintervall för den genomsnittliga skillnaden mellan mätresultaten från de två maskinerna (det vill säga (Maskin A) (Maskin B)). Ange intervallets övre gräns (=höger ändpunkt) i svarsbladet. (2p) 8. En läkare vill undersöka om svenska kvinnor har större underarmsmått på den dominanta sidan (till exempel höger sida för högerhänta) eller om måttet på höger och vänster sida i genomsnitt är detsamma. Han har tillgång till en undersökning på kvinnor där man inte noterat de faktiska mätvärdena, utan endast angivit med + när personens dominanata mått var större och - annars. Resultaten sammanfattas i följande tabell: Kvinna nr 1 2 3 4 5 6 7 8 9 Mätning + + - + + - - + + + Läkaren förutsätter mätvärdena för olika kvinnor är oberoende och väljer att använda ξ = antal plustecken för att testa hypoteserna H 0 : ingen genomsnittlig skilllnad, H 1 : genomsnittlig skillnad finns. Han väljer beslutsregeln Förkasta H 0 om antalet plustecken är högst 1 eller minst 9. Vilken signifikansnivå har den beslutsregeln? (2 p) 9. Antag att x 1, x 2,..., x 5 är ett observerat stickprov från N(µ,2). För att testa H 0 : µ = 125 mot H 1 : µ 125 på 5 % signifikansnivå har man beslutat sig för att använda testvariabeln och beslutsregeln där k är en konstant. z = x 125 2/ 5 Förkasta H 0 om z k Din uppgift är att bestämma värdet på k och tillämpa testet för följande datamaterial: i 1 2 3 4 5 x i 123,6 123,8 125,9 123,3 120,6 På denna uppgift ska du på svarsbladet ange värde på k och svar på frågan om H 0 ska förkastas: JA om H 0 ska förkastas och NEJ om H 0 inte ska förkastas. (2 p) 3 (9)

. Man vill använda regressionsanalys för att studera samband mellan produktionskostnader (X 1, miljoner dollar), marknadsföringskonstnader (X 2, miljoner dollar) och biljettintäkter under första året (Y, miljoner dollar) för amerikanska filmer. Tjugo (20) filmer studerades för att få den skattade regressionsmodellen Resulatet anges nedan. Ŷ = b 0 + b 1 X 1 + b 2 X 2. b 0 = 21.8 s b0 = 55.3 b 1 = 4.406 s b1 = 0.394 b 2 = 4.86 s b2 = 1.68 Regressionskvadratsumman blev 73981 och den totala kvadratsumman blev 84029. (a) Bestäm residualspridningen s e. (b) För att undersöka om kostnaderna för marknadsföring påverkar biljettintäkterna på 5% signifikansnivå kan man beräkna värdet på en lämplig t-kvot och jämföra denna t-kvot med ett tal från t-tabellen. Vad är värdet på t-kvoten? Vilket värde ska t-kvoten jämföras med? Ett annat sätt att genomföra testet är att utgå från ett lämpligt P-värde. Är detta P-värde i detta fall större eller mindre än 0.02 (dvs 2 %)? Svara STÖRRE eller MINDRE. På denna uppgift ska du på svarsbladet ange tre saker: t-kvot, tabell-värde och svar på frågan om P-värdet. (c) Vad är den förväntade ökningen av biljettintäkterna om marknadsföringskonstnaderna ökar med 0 000 dollar medan produktionskostnaderna hålls konstanta? Besvara frågan genom att bestämma ett 98%-konfidensintervall. (2p) (2p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 4 (9)

Tabell för svar till del 1 Lägg detta blad först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter anges som ett tal mellan 0 och 1 i decimalform om inget annat anges. Fråga Svar Poäng 1 Sannolikhet (exakt) 0 1 2 Sannolikhet (tre decimaler) 0.829 2 3 Sannolikhet (fyra decimaler) 0.382 3 4 Väntevärde (exakt) 32 1 Standardavvikelse (två decimaler) 9.22 1 5 a Sannolikhet (exakt eller tre decimaler) 0.333 1 b Median (exakt) 0.5 1 c Väntevärde (exakt) 0.5 2 6 Sannolikhet (fyra decimaler) 0.8413 2 7 Övre gräns (tre decimaler) 3.283 2 8 Signifikansnivå (tre decimaler) 0.021 2 9 Värde på k (fyra decimaler) 1.96 JA (=förkasta H 0 ) eller NEJ NEJ 2 a residualspridning (tre decimaler) 24.312 1 b Värde på t-kvot (tre decimaler) 2.893 Värde från tabell 2.1 STÖRRE ELLER MINDRE MINDRE 2 c Nedre gräns (två decimaler) 0.05 2 Totalt antal poäng 28 5 (9)

Lösningar till del 1. Det som följer är bara lösningsförslag. Det finns ofta flera olika sätt att lösa en uppgift. 1. P (A B) = P (A B) Svar: 0 P (B) = 0 P (B) = 0. 2. Låt A,B,C vara händelserna att Lisa får redovisa en lösning på seminarium 1, 2 respektive 3. Sannolikheten att hon får redovisa sin lösning på en uppgift vid högst ett av problemseminarierna är då P ((A C B C C C ) (A B C C C ) (A C B C C ) (A C B C C)) = P (A C B C C C ) + P (A B C C C ) + P (A C B C C ) + P (A C B C C) = 19 18 14 25 24 20 + 6 18 14 25 24 20 + 19 6 14 25 24 20 + 19 18 6 25 24 20 = 0,829. Svar: 0,829 3. Minst 4 poäng motsvarar att han svarar rätt på minst 7 frågor av. Låt ξ vara antalet korrekt besvarade frågor. Då är ξ Bin(; 0,6) och ( ) ( ) ( ) ( ) P (ξ 7) = 0,6 7 0,4 3 + 0,6 8 0,4 2 + 0,6 9 0,4 1 + 0,6 0,4 0 7 8 9 0,3823. Alternativt kan tabellen i läroboken användas, men för sannolikhet 0,6 behöver vi då även en variabel η Bin(; 0,4): P (ξ 7) = 1 P (ξ 6) = 1 P (η 4) = P (η 3) 0,3823. Svar: 0,3823 4. För ξ 1 R(0,30), ξ 2 N(16,3) och ξ 3 Exp(1) är vi intresserade av ξ def = ξ 1 + ξ 2 + ξ 3. Från formelbladet fås att E(ξ 1 ) = 0 + 30 = 15, 2 E(ξ 2 ) =16, E(ξ 3 ) =1, (30 0)2 V (ξ 1 ) = = 75, 12 V (ξ 2 ) =9, V (ξ 3 ) =1. Detta ger att E(ξ) = 15 + 16 + 1 = 32 och σ = 75 + 9 + 1 = 85 9,22. Svar: Väntevärde 32 och standardavvikelse 9,22. 5. (a) P (0 < ξ 1) = F (1) F (0) = 2 3 1 3 = 1 3. Svar: 1/3 0,333 6 (9)

(b) Medianen är ett tal m sådant att Svar: m = 0,5 (c) För frekvensfunktionen så blir väntevärdet E(ξ) = f(x) = F (x) = xf(x) dx = 0,5 = F (m) = m + 1 3 1,5 =m + 1 2 1 m =0,5. { 1 3, om 1 x 2 0, annars, 1 3 x dx = 1 3 [ x 2 2 ] 2 1 = 1 3 ( 4 2 1 ) = 1 2 2. (Väntevärdet kan alternativt fås från tabell för rektangelfördelning.) Svar: 1/2 = 0,5 (2 p) 6. Låt ξ k vara livslängden (antal veckor) för komponent nummer k med k = 1, 2,..., 0. Enligt formelbladet så gäller att ξ k Exp(λ) med λ = 1 E(ξ k ) = 0,01 och σ k def = 1 V (ξ k ) = λ 2 = 0. För ξ def = 0 k=1 ξ k så ger centrala gränsvärdessatsen approximationen ξ N(0 0, 0 0) = N( 000, 1 000) och ( ξ 000 P (ξ 11 000) = P 1 000 Svar: 0,8413 ) 11 000 000 = Φ(1) 0,8413. 1 000 7. Då det är olika vajrar så är det metoden för stickprov i par som skall användas. Låt ζ k vara differensvärderna för Maskin A Maskin B. Observerat stickprov blir k 1 2 3 4 5 z k 2 1-1 2 3 Med formler från formelbladet fås stickprovets medelvärde och standardavvikelse till z = 1,4 och s = 2,3 För α = 1 0,95 = 0,05 så blir det sökta konfidensintervallet I = s [z a,z + a] för a = t α/2 (4) 5 = 2,776 2,3 5 Svar: Avrundning utåt ger I = [ 0,483; 3,283]. 7 (9)

8. Om H 0 är sann så är det 50 % sannolikhet att en slumpvis vald kvinna har större mått på dominant sida. Eftesom de måtten i stickprovet antas vara oberoende så följer att ξ Bin(; 0,5) då H 0 är sann. Signifikansnivån är då α =P (H 0 förkastas H 0 sann) =P (ξ 1 eller ξ 9 ξ Bin(; 0,5)) =P (ξ 1 ξ Bin(; 0,5)) + P (ξ 9 ξ Bin(; 0,5)) =P (ξ 1 ξ Bin(; 0,5)) + 1 P (ξ 8 ξ Bin(; 0,5)) 0,07 + 1 0,9893 = 0,0214 Alternativt, utan tabell och med 0,5 k 0,5 k = 0,5 : Svar: 0,021 α =P (ξ 1 eller ξ 9 ξ Bin(; 0,5)) (( ) ( ) ( ) ( )) = + + + 0,5 0,0215. 0 1 9 9. Om H 0 är sann så är z en observation från N(0,1). För att få ett test med 5 % signifikansnivå så skall H 0 förkastas om z λ 0,025 eller z λ 0,025, det vill säga om z k = λ 0,025 1,9600. För det givna datamaterialet har vi x = 123,44 och z 1,744, så H 0 skall inte förkastas. Svar: k 1,9600 och NEJ, H 0 förkastas ej. 8 (9)

Tentamen i Matematisk statistik, S0001M, del 2 2018-08-28 Till uppgifterna på del 2 krävs fullständiga lösningar. 11. Fortsättning på problem nummer 2: (a) Låt ξ i = { 1 om Lisa får redovisa på seminarie nummer i, 0 om Lisa inte får redovisa på seminarie nummer i. Beräkna väntevärde och standardavvikelse för ξ 1. (b) Låt ξ = antal uppgifter som Lisa totalt får redovisa under de tre seminarierna. Beräkna väntevärde och standardavvikelse för ξ. (p) 12. Fem stolar står runt ett cirkulärt bord. Fem personer A E sätter sig slumpmässigt på stolarna. Vad är sannolikheten att A och B hamnar bredvid varandra? ( p) 13. Det här problemet handlar om uppgift 8.25 på s. 218 i kursboken. Konfidensintervallet som ger svaret på (a) i uppgift 8.25 är [ 1.1,8.1] medan intervallet intervallet som ger svaret på (b) är [1.24,2.56]. Om man använder metoden som används i (a) kan man alltså inte säga att medicinen i fråga ökar blodtrycket (i genomsnitt) med 95% säkerhet, medan man kan säga att medicinen ökar blodtrycket om man använder metoden i (b). Arvid menar att eftersom metoderna inte ger samma slutsats så är det inte tydligt att vi kan dra någon slutsats med 95% säkerhet. Håller du med Arvid? Om du håller med så skall du motviera varför du gör det. Om du inte håller med så skall du ge en förklaring som du tror skulle få honom att hålla med dig. ( p) 9 (9)