Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Totalt antal poäng på tentamen: 50 För att få respektive betyg krävs: 3=20, 4=30, 5=40 Allmänna anvisningar: Nästkommande tentamenstillfälle: 25 aug 14-18 Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in. Lycka till! Ansvarig lärare: Sara Lorén Telefonnummer: 031-435 4622 076-1364871
Fråga 1 (6p) a) Förklara kortfattat innebörden av centrala gränsvärdessatsen. b) Vad innebär det att en skattning är väntevärdesriktig?(förklara kortfattat) c) För att jämföra spridningen på två olika stickprov kan man jämföra stickprovens standardavvikelse eller stickprovens variationskoefficient. Ge ett exempel på när det är lämpligare att använda variationskoefficienten. d) Hur kan man upptäcka en outlier (avvikande värde) inom regressionsanalysen? e) Förklara skillnaden mellan oberoende och beroende variabler. f) Ge ett exempel på när man kan använda Poisson fördelningen. Fråga 2 (4p) I en glassbar finns hundra olika glassmaker. a) På hur många olika sätt kan vi välja två kulor glass, om ordningen inte spelar någon roll och vi kan välja samma smak två gånger? (2p) b) Om vi väljer de två kulorna helt slumpmässigt, vad är sannolikheten att de två kulorna vi väljer har samma smak? (2p) Fråga 3 (6p) I en burk finns 5 mynt 2 stycken enkronor, 2 stycken femkronor och 1 styck 10-krona. En person drar 2 mynt, ett i taget utan återläggning. a) Beräkna det förväntade värdet (väntevärdet) av det första draget (2p) b) Beräkna det förväntade värdet av det andra draget. (2p) c) Vad är lämpligt att högst betala för att dra 2 mynt ur burken? Man får behålla myntet man har dragit. Motivera ditt svar. (2p) Fråga 4 (4p) I ett laboratorium vet man av erfarenhet att ett experiment lyckas i 8 falla av 10, och att experiment lyckas oberoende av varandra. a) Under en vecka genomfördes 25 experiment. Vad är sannolikheten att högst 2 experiment misslyckades? (2p) b) Under ett år genomfördes 1100 experiment. Uppskatta sannolikheten att 900 eller fler experiment lyckades. (2p) 1
Fråga 5 (5p) En fabrik tillverkade en produkt där längden på produkten var viktig. Man vet att längden på produkten är normalfördelad med ett väntevärde på 50 mm och en standardavvikelse på 3 mm. a) Vad är sannolikheten att en slumpvis vald produkt ur produktionen är kortare än 48 mm? (1p) b) Vad är sannolikheten att en slumpvis vald produkt ur produktionen har en längd som ligger mellan 48 och 51 mm? (2p) c) Vilken längd kommer 20% av produkten att överstiga? (2p) Fråga 6 (6p) För att kontrollera vikten på 100 grams te påsar gjordes en undersökning för att testa detta. Man vägde 8 påsar och fick följande resultat 104.6 98.9 99.2 103.2 101.3 103.4 103.7 103.5 Summan av alla vikter är 817.8 83632.44 ( 83632.44) 817.8 och summan av alla vikter i kvadrat är Du kan antaga att mätresultaten är oberoende observationer av,. Testa hypotesen att väntevärdet av vikten är 100 gram mot att den inte är det och svara på frågorna a)-d) a) Skriv upp H 0 respektive H 1? (1p) b) Vilken slutsats kan man säga om väntevärdet på signifikansnivån 0.05? (3p) c) Vilken slutsats kan man säga om väntevärdet på signifikansnivån 0.01? (1p) d) Förklara i ord vad ett Typ I fel och ett Typ II fel innebär i detta fall. Räcker ej med definitionen på vad felen är. (1p) 2
Fråga 7 (5p) Furuvirke från två leverantörer, A och B skall utvärderas med avseende på densitet (kg/m 3 ). Följande mätningar finns tillgängliga (10 stycken av varje sort) A 449 478 480 490 473 461 507 443 467 489 B 475 486 497 483 496 516 509 509 492 504 Även summor av alla mätningar och summor av alla mätningar i kvadrat för respektive sort finns tillgängliga A 4737 2247343 B 4967 2468633 Bestäm ett konfidensintervall med konfidensgraden 0.95 för skillnaden i medeldensitet och tolka intervallet för att utreda om någon skillnad finns. Antag att observationerna är normalfördelade och att båda furusorterna har samma (okända) standardavvikelse. Fråga 8 (6p) Vid ett experiment har följande 7 observationspar, 1,,7 observerats Tid x 1 2 3 4 5 6 7 Djup y 18.6 13.9 16.9 10.4 11.1 8.5 4.2 a) Rita upp värdarna i ett diagram (spridningsdiagram, xy diagram) och undersök om det är rimligt att anta att y beror linjärt av x (med vissa slumpvariationer). (1p) b) Skatta regressionslinjens parametrar samt rita in linjen i diagrammet i a) (2p) c) Gör ett 95% prediktionsintervall för djupet vid tiden 5. (2p) d) Vad är residualen för observationen (2, 13.9) dvs för,? (1p) Fråga 9 (4p) En viss ljussort brinner minst 3 timmar. Ljusens brinntid X har följande frekvensfunktion 1 3 0 3 För att kunna skatta parametern gjordes 5stycken försök. Resultatet blev följande Ljus nr 1 2 3 4 5 Brinntid 4.5 4.2 6.3 5.0 7.1 Skatta parametern i fördelningen med hjälp av maximum likelihood metoden. 3
Fråga 10 (4p) Till fråga 10 hör figur 1 och figur 2. a) Vad kan du säga om stickprovskorrelatinen mellan X och Y utifrån figur 1? (1p) Scatterplot of Y vs X 120 110 100 Y 90 80 70 60 10 15 X 20 25 30 Figur 1: Spridningsdiagram Figur 2 innehåller två sannolikhetsdiagram för normalfördelningen för två olika stickprov (data 1 och data2) b) Vilken fördelning har data 1 och data2? (1p) c) Vilket väntevärdet har data 1 respektive data 2? (1p) d) Vilket stickprov (data 1 eller data2) har störst varians? Motivera ditt svar. (1p) Figur 2: Sannolikhetsdiagram för normalfördelning för två olika stickprov (data 1 och data2). 4
Formelsamling Matematisk Statistik Kontinuerliga Fördelningar Normal f, Exponential, 0 1, 0 Weibull, 0 1, 0 Likformig f, Diskreta Fördelningar A Likformig p, 1,, E Binomial p 1, 0,1,, 1 Geometrisk 1, 0,1,2, Hypergeometrisk, max 0, xmin, 1 Poission, 0,1,.! Sannolikhetslära om P(A)>0 Om händelserna,,, är parvis oförenliga och då gäller för varje händelse A att Antalet permutationer!! Antalet kombinationer!!! 2,,,, 5
Beskrivande statistik Stickprovsmedel, Stickprovets korrelation Stickprovets standardavvikelse Poolad standardavvikelse Konfidensintervall X stokastisk variabel med okänt väntevärde μ och känd varians σ 2. Ett 100(1-α)% tvåsidigt konfidensintervall för μ / / X normalfördelad stokastisk variabel med okänt väntevärde μ och okänd varians σ 2. Ett 100(1-α)% tvåsidigt konfidensintervall för μ,, X normalfördelad stokastisk variabel med okänt väntevärde μ och okänd varians σ 2. Ett 100(1-α)% tvåsidigt konfidensintervall för σ 2 1 1,, X binomialfördelad stokastisk variabel med parametrarna n och p. Ett 100(1-α)% tvåsidigt konfidensintervall för p om normalapproximation kan användas är följande 1 1 Prediktionsintervall X normalfördelad stokastisk variabel med okänt väntevärde μ och känd varians σ 2. Ett 100(1- α)% tvåsidigt prediktionsintervall för / 1 1 / 1 1 X normalfördelad stokastisk variabel med okänt väntevärde μ och okänd varians σ 2. Ett 100(1-α)% tvåsidigt prediktionsintervall för, 1 1, 1 1 6
Test för medel H 0 Teststatistika H 1 Kritiskt område när känd / / 1 och okänd / / 2 / / och kända 1 1 2 men okända 1 1 2 / / och okända 1 1 / Parade observationer ; 1 / / 7
Goodness-of-fit test approximativt fördelad med 1 frihetsgrader Test av proportion när normalapproximation kan användas H 0 Teststatistika H 1 Kritiskt område / / 1 1 / / Test varians normalfördelad population H 0 Teststatistika H 1 Kritiskt område 1,,,eller,,, /,, eller /,,,, Regression Minsta kvadrat skattningarna av regressionskoefficienterna i Varianser för och 2 respektive Konfidensintervall för 1 1 Prediktionsintervall för 11 11 8
Areas under the Normal Curve 9
(continued) Areas under the Normal Curve 10
Critical Values of the t-distribution 11
(continued) Critical Values of the t-distribution 12
Critical Values of the Chi-Squared Distribution 13
(continued) Critical Values of the Chi-Squared Distribution 14
Critical Values of the F-distribution,., 15
(continued) Critical Values of the F-distribution,., 16
(continued) Critical Values of the F-distribution,., 17
(continued) Critical Values of the F-distribution,., 18