Statistik för teknologer, 5 poäng Skrivtid:

Relevanta dokument
Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Följande resultat erhålls (enhet: 1000psi):

TENTAMEN I MATEMATISK STATISTIK

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels

Tentamen i matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i matematisk statistik

Tentamen i matematisk statistik

Tentamen i matematisk statistik

Examinationsuppgifter del 2

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

7.3.3 Nonparametric Mann-Whitney test

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Räkneövning 3 Variansanalys

TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematisk statistik Kurskod S0001M

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Tentamen i Matematisk statistik Kurskod S0001M

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Tentamen i matematisk statistik

8.1 General factorial experiments

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Matematisk statistik Kurskod S0001M

Skrivning i ekonometri torsdagen den 8 februari 2007

Tentamen i Matematisk statistik Kurskod S0001M

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Experiment med två faktorer. Treatment Population. Balanced och ortogonal design. Graph of means. Table of means

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Tentamen i Matematisk statistik Kurskod S0001M

3.1 Beskrivande statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

OBS! Vi har nya rutiner.

Tentamen i Matematisk statistik Kurskod S0001M

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

TENTAMEN I STATISTIK B,

Lufttorkat trä Ugnstorkat trä

, s a. , s b. personer från Alingsås och n b

Lösningar till tentamen i Matematisk Statistik, 5p

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

Skrivning i ekonometri lördagen den 29 mars 2008

Regressions- och Tidsserieanalys - F1

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Statistisk försöksplanering

Regressions- och Tidsserieanalys - F7

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I STATISTIKENS GRUNDER 2

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

DATORÖVNING 3: MER OM STATISTISK INFERENS.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Exempel 1 på multipelregression

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Samhällsvetenskaplig metod, 7,5 hp

Tentamen Tillämpad statistik A5 (15hp)

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Lycka till!

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen Tillämpad statistik A5 (15hp)

Transkript:

UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer, poäng Skrivtid: 9.00-1.00 Tillåtna hjälpmedel: utdelad tabellsamling, valfri miniräknare med nollställt minne, egenhändigt författat formelblad (A4-format). Studenterna får behålla tentamensuppgifterna. Betygsgränser (teknologer):. poäng för 3, 14 poäng för 4 och 17. poäng för. Betygsgränser (kemister):. poäng för G och 1.7 poäng för VG. 1. För att förhindra snatteri har en affär infört att kunderna vägs på en våg vid affärens ingång och på en annan våg strax innan utgången. Om vikten vid utgången överstiger vikten vid ingången med mer än 20 gram uppmanas kunden att återvända till affären för att lätta på sin vikt. Om däremot differensen (utgångsvikt ingångsvikt) understiger 20 gram släpps kunden fram till kassan. Antag att båda vågarna har ett slumpmässigt fel som är normalfördelat med väntevärde 0 och standardavvikelse 6 gram samt att felen vid olika vägningar är oberoende. a) Vad är sannolikheten att en oskyldig kund, som inte har snattat något, ändå får en viktdifferens som överstiger 20 gram? (1. p) b) Vad är sannolikheten att en person som snattat en chokladbit som väger 30 gram, fastnar i kontrollen? (1. p) Lösning uppgift 1: a) Låt X = ingångsvikt och Y = utgångsvikt. 2 Y X N(0, 6 2 + 6 ). Y X 20 P ( Y X > 20) = P( > ) = 1 Φ(2,36) = 1 0,99086 0,009. 72 72 b) (30, 6 2 2 Y X 20 30 Y X N + 6 ). P ( Y X > 20) = P( > ) = 1 Φ( 1,18) = Φ(1,18) 0,881. 72 72 2. Anta att SARS (svår akut respiratorisk sjukdom) orsakar feber i 9 fall av 0. I en viss population vet man också att en på 7 individer har SARS och att en på 00 individ har feber. a) Om en individ i populationen inte har SARS, vad är då sannolikheten att denna individ är feberfri? (1 p) b) Vad är sannolikheten att en individ i populationen både har SARS och är feberfri? (1 p)

c) Om en individ i denna population har feber, vad är då sannolikheten att det är SARS som orsakar den. (1 p) Lösning uppgift 2: Vi har P(SARS) = -7, P(Feber) = - 3, P(Feber SARS) = 0.9. P(Feber SARS) = P(Feber SARS) P(SARS) = -7 0.9 Vi kan fylla i detta i en korstabell: SARS Ej SARS totalt Feber 0.9* -7-3 Ej Feber totalt -7 1 De tomma rutorna i korstabellen kan vi nu fylla i: SARS Ej SARS totalt Feber 0.9* -7-3 -0.9* -7-3 Ej Feber (1-0.9)* - 7 1- -3 -(1-1- -3 0.9)* -7 totalt -7 1- -7 1 a) P(ej Feber ej SARS) = P(ej Feber ej SARS) /P(ej SARS) = 1- -3 -(1-0.9)* -7 /1- -7 = 0.34889. b) P(SARS ej Feber) = (1-0.9)* -7. c) P(SARS Feber) = P(SARS Feber) / P(Feber) = 0.9* -7 / -3 = 9.* -. 3. Tio individer har deltagit i ett program för att stimulera viktminskning. Deras vikt före och efter deltagandet i programmet redovisas i tabellen nedan. Om vi antar att den i:te individens vikt före behandling är 2 N( µ i, σ1 ), i = 1,2,..., och efter behandlingen 2 N( µ i + d, σ2 ), i = 1,2,..., a) bestäm ett 9%-igt konfidensintervall för d. (2 p) b) Har viktminskningsprogrammet någon effekt? (1 p) Individ Vikt före Vikt efter 1 64 62 2 84 80 3 71 72 4 6 98 89 6 63 63 7 67 68 8 77 74 9 6 82 81

Lösning uppgift 3: a) Paired T for Vikt efter - Vikt före N Mean StDev SE Mean Vikt efter 70.0000 11.246 3.90 Vikt före 71.7000 13.814 4.2948 Difference -1.70000 3.09300 0.97809 9% CI for mean difference d: (-3.91260; 0.1260) b) Eftersom 0 finns i intervallet ovan kan vi inte förkasta H 0 :Programmet har ingen effekt Alternativt kan detta testas med T-Test: T-Value = -1.74 P-Value = 0.116 4. Antag att X har följande diskreta sannolikhetsfördelning 1/ 3 för x = 1,2,3 p (x) = 0 annars X observeras n=36 gånger och medelvärdet beräknas. Bestäm approximativt sannolikheten att medelvärdet är större än 2.1 men mindre än 2.. (3 p) Lösning uppgift. 4: Utnyttja CGS, dvs medelvärdet är ungefär N(µ, σ 2 /n) om n 30. µ = 1*1/3 +2*1/3 + 3*1/3 = 2 σ 2 = (1-2) 2 *1/3 + (2-2) 2 *1/3 +(3-2) 2 *1/3 = 2/3 P(2.1 < medelvärdet < 2.) = [standardiserar] P((2.1-2)/ sqrt((2/3)/36) < Z < (2.-2)/sqrt((2/3)/36)) = P(0.73 < Z < 3.67) = Φ(3.67) - Φ(0.73) = 1-0.7673 = 0.2327. En ny policy för sjuka skall införas inom ett stort företag. För att undersöka inställningen till denna policy gjordes en stickprovsundersökning med följande resultat: Positiv Negativ Vet ej Män 23 6 6 Kvinnor 42 36 8 Är reaktionen på den nya policyn oberoende av arbetstagarnas kön? (3 p)

Lösning uppgift : 1 2 3 All 1 23 6 6 3 18.80 12.1 4.0 3.00 2 42 36 8 86 46.20 29.8 9.9 86.00 All 6 42 14 121 6.00 42.00 14.00 121.00 Chi-Square = 7.019; DF = 2; P-Value = 0.030 Ho: förkastas på % nivån men ej på 1%-nivån 6. Man har bestämt draghållfastheten hos provkroppar av stål för två olika legeringar och fått följande data: Legering A 13 1 18 113 131 144 141 Legering B 111 128 82 1 99 132 Antag att båda våra observationsserier är normalfördelade med samma varians. a) Skatta median och medelvärde för respektive legering samt skatta legeringarnas gemensamma standardavvikelse. (1 p) b) Testa, med ett tvåsidigt test på signifikansnivån en procent, hypotesen att det inte är någon skillnad i draghållfasthet hos de bägge legeringarna. (1 p) c) Antag att observationerna inte är normalfördelade och genomför ett test som motsvarar hypotesen i b) ovan. (1 p) Lösning uppgift 6: a) Variable N Mean Median A 7 13.71 141.00 B 6 8.83 6.00 Pooled StDev = 18.7768 b) Two-sample T for Hållfasthet Legering N Mean StDev SE Mean A 7 13.7 18.7 7.1 B 6 8.8 18.9 7.7

Difference = mu (A) - mu (B) Estimate for difference: 26.88 T-Test of difference = 0 (vs not =): T-Value = 2.7 P-Value = 0.026 DF = 11 Vi förkastar inte på 1%-nivån och inte på 2%-nivån c) Signifikansnivå 2% Rangsumman för legering B är 27. Tabellens intervall med n 1 =6 och n 2 =7 är [2, 9] H 0 förkastas inte 7. Vid ett försök ville man testa om det är någon skillnad i avkastningen av raps för 3 olika sorters gödningsmedel (A, B och C). Till varje gödningsmedel användes tio provrutor där raps. För att kunna avgöra om gödningsmedlen har någon effekt på avkastningen användes också tio provrutor utan gödning. Man slumpade ut vilka provrutor som skull användas till respektive gödningsmedel/ingen gödning. Avkastningen från de olika provrutorna framgår av tabellen nedan. Ingen A B C 60,2 6,4 66,9 71,7 69,3 6, 71,3 63,1 8,3 66,4 63,1 61,3 66,1 68,8 67,9 68,4 64,8 71,4 6, 71,1 62,9 69,1 67,6 6, 61,6 72,1 72, 6,9 63,3 68,8 67,2 62, 60,9 60,7 68,7 71,8 60,2 6,9 62,0 7,9 MINITAB-utskrift: One-way ANOVA: Avkastning versus gödsling Source DF SS MS F P gödsling 3 168,0 6,0 4,02 0,014 Error 36 01,4 13,9 Total 39 669,3 S = 3,732 R-Sq = 2,% R-Sq(adj) = 18,8% Individual 9% CIs For Mean Based on Pooled StDev Level N Mean StDev A 67,41 3,348 (---------*--------) B 67,27 3,247 (--------*---------) C 67,726 4,818 (---------*--------) Ingen 62,74 3,277 (---------*---------) 62, 6,0 67, 70,0

Pooled StDev = 3,732 Tukey 9% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of gödsling Individual confidence level = 98,93% gödsling = A subtracted from: gödsling Lower Center Upper B -4,636-0,140 4,36 (--------*--------) C -4,18 0,311 4,807 (--------*--------) Ingen -9,17-4,660-0,164 (--------*--------) -,0 0,0,0,0 gödsling = B subtracted from: gödsling Lower Center Upper C -4,04 0,41 4,947 (--------*--------) Ingen -9,017-4,20-0,024 (--------*--------) -,0 0,0,0,0 gödsling = C subtracted from: gödsling Lower Center Upper Ingen -9,468-4,972-0,47 (--------*--------) -,0 0,0,0,0 Plots for Avkastning Normal Probability Plot of the s 99 s Versus the Fitted Values Percent 90 0 0 1 - - 0-64 66 Fitted Value 68,0 Histogram of the s s Versus the Order of the Data Frequency 7,,0 2, 0,0-6 -4-2 0 2 4 6 8 0-1 1 20 2 30 Observation Order 3 40

Test for Equal Variances for Avkastning A B Bartlett's Test Test Statistic 2, P-Value 0,2 Levene's Test Test Statistic 1,44 P-Value 0,247 gödsling C Ingen 2 3 4 6 7 8 9 9% Bonferroni Confidence Intervals for StDevs 11 a) Redogör för idén bakom det F-test man gör i variansanalys. Vilka antaganden skall vara uppfyllda för att man skall kunna göra test med variansanalys? (1 p) b) Verkar dessa antaganden vara uppfyllda i detta fall (motiver)? (1 p) c) Om antagandena vid ensidig variansanalys är uppfyllda, vilka slutsatser kan man dra från analysen ovan på signifikansnivån % (motivera)? (1 p) Lösning uppg. 7: a) Modell Y ij = µ i + ε ij = µ + τ i + ε ij N(m i, σ), j = 1,2,3,4,n i, i = 1,2,3,. (samma varians) Idén bakom test av H 0 : µ 1 = µ 2 = µ 3 = µ 4 : Bilda en variansskattning av σ 2 som är väntevärdesriktig oavsett om H 0 är sann eller falsk. Bilda en annan skattning som bara är väntevärdesriktig om H 0 är sann. Bilda kvoten mellan dessa, om kvoten blir stor i förhållande till ett tyder det på att H 0 är falsk (den andra skattningen skattar något annat än bara σ 2. b) analys ser OK ut. c) F-testet styrker att det finns en skillnad mellan de fyra gödningsalternativen (p-värdet 0.014 <%). Tukey s test ger att A, B och C statistiskt skiljer sig ifrån ingen gödsling.