Antal P(ξ = x)

Relevanta dokument
a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik, S0001M, del 1,

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Kompletterande kursmaterial till kursen Matematisk statistik.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

Tentamen i Matematisk statistik Kurskod S0001M

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tentamen i Matematisk statistik Kurskod S0001M

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Föreläsningsanteckningar till kapitel 8, del 2

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Övningstentamen i matematisk statistik för kemi

Statistisk försöksplanering

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Matematisk statistik LKT325 Tentamen med lösningar

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Lösningsförslag till Matematisk statistik LKT325 Tentamen

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

10.1 Enkel linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

TENTAMEN Datum: 14 feb 2011

Avd. Matematisk statistik

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Lycka till!

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Regressions- och Tidsserieanalys - F1

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Matematisk statistik, LMA 200, för DAI och EI den 25 aug 2011

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Resultatet anslås senast 10 juni på institutionens anslagstavla samt på kurshemsidan.

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Matematisk statistik, Föreläsning 5

Föreläsning 12, FMSF45 Hypotesprövning

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Stockholms Universitet Statistiska institutionen Termeh Shafie

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Lufttorkat trä Ugnstorkat trä

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = ξ = 2ξ 1 3ξ 2

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Transkript:

Tentamen i Matematisk statistik, S0001M, del 1, 2008-03-31 1. I USA s primärval har den demokratiske presidentkandidaten Barack Obama lyckats samla in stora mängder pengar till sin kampanj, där antalet donatorer nu överstiger en miljon personer. Antag att man vid en undersökning funnit att sannolikheten att en donator gett sina pengar via ett onlinesystem är 30 %, och att 60 % av dem som donerat online är kvinnor. Man har också funnit att 40 % av dem som donerat pengar till kampanjen är kvinnor. a) Vad är sannolikheten att en slumpmässigt utvald donator är en kvinna som donerat sina pengar via onlinesystemet? Ange ditt svar i procent med en decimals noggrannhet. b) Givet att en donator är en kvinna, hur stor är sannolikheten att hon inte donerat pengar via onlinesystemet? Ange ditt svar i procent med en decimals noggrannhet. 2. På en förpackning med köttbullar anges att den innehåller 18-22 köttbullar. Erfarenhet har visat att sannolikhetsfördelningen för antalet köttbullar i en slumpmässigt utvald förpackning kan beskrivas som Antal 18 19 20 21 22 P(ξ = x) 0.1 0.1 0.5 0.2 0.1 a) Bestäm väntevärdet för antalet köttbullar i en slumpmässigt utvald förpackning. Ange ditt svar med två decimalers noggrannhet. (1p) b) Betrakta fem slumpmässigt utvalda förpackningar av ovanstående typ, vars innehåll av köttbullar kan antas oberoende. Vad är sannolikheten att minst tre av dessa förpackningar innehåller minst 20 köttbullar? Ange ditt svar i procent med en decimals noggrannhet. 3. Livslängden hos bildröret i en äldre TV-apparat kan beskrivas av en exponentialfördelad stokastisk variabel ξ, där E[ξ] = 6 (enhet: år). a) Bestäm sannolikheten att TV-apparatens bildrör är helt efter 8 år. Ange ditt svar i procent med en decimals noggrannhet. b) Bestäm standardavvikelsen för den sammanlagda livslängden hos nio bildrör av ovanstående typ. Ange ditt svar med två decimalers noggrannhet. (1p) 4. Ett flygbolag har efter en studie funnit att antalet passagerare som kommer till check-in vid en slumpmässigt utvald flygning på en viss linje kan approximeras av en normalfördelning med väntevärde 240 och standardavvikelsen 8. a) Vilket är det passagerarantal vid check-in som överskrids med sannolikheten 10 % vid en slumpmässigt utvald flygning? Avrunda ditt svar uppåt till närmaste heltal. - 1 -

Tentamen i Matematisk statistik, S0001M, del 1, 2008-03-31 a) Betrakta 25 oberoende flygningar. Vad är sannolikheten att det genomsnittliga antalet passagerare som dyker upp vid check-in på dessa är mindre än 238? Ange ditt svar i procent med två decimalers noggrannhet. 5. En byggfirma köper cementsäckar av en grossist och är intresserade av den förväntade vikten hos en säck. Man misstänker att metoden för att fylla säckarna har gett upphov till en slumpmässig variation hos vikten av en säck. Vikten hos var och en av säckarna kan antas komma från en kontinuerlig fördelning. a) Grossisten vill använda ett konfidensintervall för medianen som mått på vad en cementsäck kan förväntas väga. Grossisten tar slumpmässigt ut nio cementsäckar som vägs. Konfidensintervallens undre gräns bestäms som vikten hos den näst lättaste av de vägda säckarna och intervallets övre gräns bestäms som vikten hos den näst tyngsta säcken. Bestäm konfidensgraden för det angivna intervallet. Ge svaret i procent med en decimals noggrannhet. b) Byggfirman ansåg att den slumpmässiga variationen hos vikten av en cementsäck kunde beskrivas av en normalfördelning och menade därför att man skulle bestämma ett konfidensintervall för väntevärdet μ, utgående från normalfördelningsantaganden. De nio säckarna vägdes och man fann att medelvärdet var 16.9 kilo och standardavvikelsen skattades till 1.3 kilo. Bestäm den undre gränsen i ett tvåsidigt 95 % konfidensintervall för μ. 6. En ingenjör vill hitta en modell som kan användas till att göra prognoser över beräkningstiden hos en mjukvaruapplikation som utför termodynamiska beräkningar. Till sitt förfogande har hon resultat från 30 körningar över beräkningstid, mängd indata samt antal ingående parametrar. Beräkningstiden (i minuter) analyserades med hjälp av en multipel linjär regressionsanalys med mängd indata (i kilobyte) och antal parametrar som förklarande variabler. Delar av resultatet ges i tabell 1. a) Bestäm den justerade förklaringsgraden för modellen. Ange ditt svar i procent med en decimals noggrannhet. b) Bestäm ett tvåsidigt 90 % konfidensintervall för regressionsparametern som hör till variabeln mängd indata. Ange den övre gränsen med två decimalers noggrannhet. Tabell 1 The regression equation is Beräkningstid = -2.350 + 0.802 Mängd_indata + 0.138 Antal_param Predictor Coef SE Coef T P Constant -2,350 2,3039-1,021 0,322 Mängd_indata 0,802 0,113 7,097 0,000 Antal_param 0.138 0,044 3,122 0,007-2 -

Tentamen i Matematisk statistik, S0001M, del 1, 2008-03-31 Tabell 1 (forts) Analysis of Variance Source DF SS MS F P Regression 2 343,51 171,75 51,21 0,000 Residual Error 27 90,579 3,354 Total 29 434,01 7. Det procentuella utbytet i en kemisk process ska studeras med tre tänkbara faktorer. Ett fullständigt 2 3 -försök gjordes, där varje försök utförs på två nivåer med fyra replikat i varje försökspunkt. Tabell 2: Nivåer för de ingående faktorerna: Faktor Låg nivå ( ) Hög nivå ( ) Temperatur (T) 220 o C 250 o C Reaktionstid (R) 150 sek 180 sek Koncentration (K) 12 % 16 % Försöksmatrisen i tabell 2 illustrerar nivåerna och resultaten vid det fullständiga faktorförsök som gjordes. Tabell 3: Resultaten presenterade i standardordning: T R K Y s 80.3 3.2 + 77.2 2.7 + 79.0 2.8 + + 68.0 2.2 + 82.1 3.1 + + 81.3 2.2 + + 84.0 2.5 + + + 77.0 2.3 a) Skatta samspelseffekten för faktorerna T och K. Ange ditt svar med en decimals noggrannhet. b) Bestäm standardavvikelsen för en effekt dvs s effekt. Ange ditt svar med minst två decimalers noggrannhet. (1p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! - 3 -

Tentamen i Matematisk statistik, S0001M, del 1, 2008-03-31 Tabell för svar till del 1. Riv ut och lägg svarsbladet först i tentamen! Namn... Personnummer... Fråga Svar Poäng 1 a Sannolikhet 18.0 2 b Sannolikhet 55.0 2 2 a Väntevärde 20.10 1 b Sannolikhet 94.2 2 3 a Sannolikhet 26.4 2 b Standardavvikelse 18.00 1 4 a Antal 251 2 b Sannolikhet 10.6 2 5 a Konfidensgrad 96.1 2 b Undre gräns 15.90 2 6 a Juster. förklaringsgrad 77.7 2 b Övre gräns 1.00 2 7 a Samspelseffekt 1.6 1 b Standardavvikelse 0.94 2 Totalt antal poäng 25 Lycka till! - 4 -

Tentamen i Matematisk statistik, S0001M, del 2 (för överbetyg), 2008-03-31 Vid bedömningen av lösningarna av uppgifterna i del 2 läggs stor vikt vid hur lösningarna är motiverade och redovisade. Tänk på att noga redovisa införda beteckningar och eventuella antaganden. 8. Efter att kvartsfinalerna lottades till UEFA s Champions League har anklagelser om att lottningen varit manipulerad förekommit. Anledning är att en person på tidningen Liverpool Echo s forum påstod att han visste vilka kvartsfinalparen skulle bli en halvtimme innan lottningen. Han redovisade den förhandsinformation han påstod sig sitta på, och det visade sig att han hade rätt. Roma kommer att möta Manchester United, Schalke 04 möter Barcelona, Arsenal kommer att möta Liverpool och Fenerbahce kommer att stångas mot Chelsea. Lottningen till kvartsfinalerna är helt fri, vilket betyder att det inte finns några restriktioner då det gäller vilka lag som kan komma att mötas. Lottningen går till så att man väljer bollar ur en skål. Om lottningen går rätt till så är var och en av dessa bollar omärkta, men de innehåller respektive lags namn. Alltså finns totalt åtta bollar i skålen. Man drar en efter en tills ingen finns kvar. Ordningen spelar roll i så mån att lag ett som dras möter lag två, lag tre möter lag fyra och så vidare. Vilket lag som dras först inom respektive par styr endast vilket lag som börjar på hemmaplan, och är inte något som här behöver tas hänsyn till. Givet detta förfarande vid lottningen, vad är sannolikheten att gissa alla fyra kvartsfinaler rätt? (8p) 9. Acetylsalicylsyra kan användas för att förhindra att blodproppar bildas. Man ville undersöka om det fanns en skillnad i den maximala hopklumpningen av blodplättarna beroende på om en patient var rökare eller inte. För detta ändamål undersökte man åtta personer som inte var rökare, och åtta personer som uppgav att de röker cirka tio cigaretter per dag. Varje försöksperson fick därefter äta den blodproppshämmande medicinen under en vecka, varefter den andelen (enhet: procent) maximal hopklumpning av blodplättar uppmättes. Icke-rökare 25 29 22 26 32 31 29 32 Rökare 32 35 33 31 36 37 38 29 a) Antag att resultaten kan ses som observationer på oberoende normalfördelade stokastiska variabler och att försökspersonerna valts ut oberoende av varandra. Ger detta resultat belägg för att det föreligger en påvisbar skillnaden i förväntad hopklumpning mellan de två olika grupperna? Besvara frågan genom att bestämma ett 95 % konfidensintervall. Redogör tydligt de antaganden smo görs, samt för dina slutsatser i ord. b) Antag att man i ett andra steg i undersökningen valt att fokusera enbart på gruppen rökare. Man har då velat testa hypotesen att förväntad maximal andel hopklumpning är 30, mot att den är högre än så. Man ställer alltså upp nollhypotesen H 0 : μ = 30 mot H 1 : μ > 30. Man anser sig kunna påstå att standardavvikelsen är känd och att σ = 3.0. Man vill bestämma ett test (8p) - 5 -

Tentamen i Matematisk statistik, S0001M, del 2 (för överbetyg), 2008-03-31 som har felrisken 5 %, och styrkan 90 % då μ = 32. Hur många försökpersoner krävs minst för att detta ska vara uppfyllt? (6p) 10. Vid ett företag som tillverkar maskiner har man använt försökplanering för att undersöka en typ av förband, som kallas lockbolt. Man önskar att få en så hög hållfasthet som möjligt i förbandet, och valde i försöket att mäta hållfastheten i en försöksfixtur som utsattes för en cyklisk belastning. Vid varje försök användes ett automatiskt räkneverk som räknade antalet cykler till brott, varefter detta resultat logaritmerades. I Tabell 4 anges faktorerna och deras nivåer. I tabell 5 ges effektskattningar från ett fullständigt 2 4 -försök, och resultatet av försöket ges i Tabell 6. a) Ange vilka faktorer som är signifikanta med 5 % signifikansnivå, om du samtidigt antar att alla samspelseffekter av ordning tre och högre är försumbara. Ange också på vilken nivå respektive faktor ska hållas för att ytjämnheten ska maximeras. (5p) b) Bestäm standardavvikelsen för resultatvariabeln Y. (3p) Tabell 4: Faktorerna och deras respektive nivåer Faktorer Låg nivå ( ) Hög nivå (+) Geometri, passning mellan nit och plåt (A) spel grepp Material, plåttyp (B) 1-skikt 2-skikt Tätningsmedel (C) ja nej Lastnivå (D) hög låg Tabell 5. Effektskattningar Term Effect Coef Constant 5,6138 A -0,4625-0,2312 B 0,0850 0,0425 C 0,3025 0,1512 D 1,0675 0,5337 A*B 0,8450 0,4225 A*C -0,3775-0,1887 A*D 0,6825 0,3412 B*C -0,2450-0,1225 B*D 0,5850 0,2925 C*D -0,3375-0,1688 A*B*C 0,0750 0,0375 A*B*D 0,4100 0,2050 A*C*D -0,1825-0,0912 B*C*D 0,1450 0,0725 A*B*C*D -0,2600-0,1300-6 -

Tentamen i Matematisk statistik, S0001M, del 2 (för överbetyg), 2008-03-31 Tabell 6: Resultat av försöket samt försöksplan A B C D Y 5,34 + 4,29 + 5,13 + + 4,28 + 6,90 + + 4,79 + + 5,24 + + + 4,67 + 6,11 + + 5,45 + + 5,44 + + + 7,66 + + 6,55 + + + 5,14 + + + 6,05 + + + + 6,78-7 -

Losningar till del 2 tentamen i Matematisk statistik, S0001M, 2008-01-18 Uppgift 8 De möjliga ordningarna att lotta lagen i, från lag 1 till 8 kan skrivas som 8! = 40320. Om vi antar att vi lottat ordningen 1, 2, 3, 4, 5, 6, 7, 8 så kommerlag1att möta lag 2, lag 3 möta lag 4 och så vidare. Vi sa att det spelar ingen roll inom vilken ordning lagen dras inom varje par, det finns två sätt att ordna varje par. Det finns alltså 2 4 sätt att kasta om lagen inom varje par. Dessutom så spelar det ingen roll om lag 1 och 2 är det första paret som dras. De kan lika gärna vara par nummer 2, 3 eller 4. Antalet möjliga sätt att ordna paren är således 4! = 24. Alltså, med hjälp av klassiska sannolikhetsdefinitionen, där vi dividerar antal gynnsamma utfall med antal möjliga utfall bör vi då få att: P(gissa rätt kvartsfinalpar) = 24 4! 8! = 1 105 1

Losningar till del 2 tentamen i Matematisk statistik, S0001M, 2008-01-18 Uppgift 9 Vi har en situation med två stickprov. ξ 1, ξ 2,..., ξ 8 är stokastiska variabler som beskriver andelen (i procent) hopklumpning hos icke-rökare η 1, η 2,..., η 8 är stokastiska variabler som beskriver andelen (i procent) hopklumpning hos rökarna vi har änven att x i är en observation på ξ i N(μ 1, σ),i=1, 2,..., 6 och y i är en observation på η j N(μ 2, σ),j =1, 2,..., 6 Via beräknigar kan vi erhålla x = 1 P 8 xi =28.25 q P 1 s x = 8 1 (xi x) 2 =3.615 På samma sätt för våra observationer på y erhålls: ȳ =33.875 s y =3.1367 Skatta standardavvikelsen σ genom följande: s pool = q q s 2 x +s 2 y 3.615 2 = 2 +3.1367 2 2 =3.384 Om vi skapar ett 95 % konfidensintervall för differensen mellanväntevärden får vi att: q 1 x ȳ ± t 0.025 (8 1+8 1) s pool 8 + 1 8 ( 9.25; 2.00) Svar: Vi kan med 95 % säkerhet påstå att den förväntade maximala andelen hopklumpning är mellan 2 och 9.25 procentenheter högre hos rökarna än hos icke-rökarna. 2

Losningar till del 2 tentamen i Matematisk statistik, S0001M, 2008-01-18 Uppgift 10 a) Vi antar att alla smaspelseffekter av ordning tre och högre är observationer på en stokastisk variabel som är fördelad enligt N(0, σ effekt ). Vi skattar då σ effekt mha observationerna: s= q 1 5 P (Zi 0) 2 =0.243 Vi vill för varje effekt testa hypotesen: H 0 : μ effekt =0 H 1 : μ effekt 6=0 som testvariabel används effektskattningen, och vi förkastar nollhypotesen om absolutbeloppet blir högre än s*t(5) = 0.243*2.571 = 0.625 Detta ger oss att effekterna D, AB, och AD är signifikanta. Vi undersöker AB och AD i samspelsplottar för att hitta vilka nivåer dessa bör hållas på för att maximera Y. Vi får ur dessa att vi bör hålla A, B och D på hög nivå. b) s 2 effekt = V [Y (+) Ȳ( )] =V [Y (+) ]+V [Ȳ( )] = s2 8 + s2 8 =0.2432 =>s= 4 0.2432 =0.486 3