ÖVNINGSTENTAMEN: Statistisk modellering för I3, TMS160 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista och typgodkänd

Relevanta dokument
Uppgift a b c d e f (vet ej) Poäng

Del A: Schema för ifyllande av svar nns på sista sidan

Uppgift a b c d e f (vet ej) Poäng

Uppgift a b c d e Vet inte Poäng

Uppgift a b c d e Vet inte Poäng

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Uppgift a b c d e f (vet ej) Poäng

Statistisk försöksplanering

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Statistisk försöksplanering

Examinationsuppgifter del 2

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

10.1 Enkel linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 12: Regression

Tentamen i matematisk statistik

TENTAMEN I MATEMATISK STATISTIK

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

7.5 Experiment with a single factor having more than two levels

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Blandade problem från elektro- och datateknik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Metod och teori. Statistik för naturvetare Umeå universitet

Föreläsning 11: Mer om jämförelser och inferens

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i Matematisk statistik Kurskod S0001M

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 12: Linjär regression

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Blandade problem från maskinteknik

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Tentamen i Matematisk statistik Kurskod S0001M

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsningsanteckningar till kapitel 8, del 2

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

FÖRELÄSNING 8:

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Statistik för teknologer, 5 poäng Skrivtid:

7.5 Experiment with a single factor having more than two levels

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Följande resultat erhålls (enhet: 1000psi):

Tentamen i Matematisk statistik Kurskod S0001M

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i Dataanalys och statistik för I den 28 okt 2015

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

TMS136. Föreläsning 10

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Lycka till!

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

9. Konfidensintervall vid normalfördelning

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

27,5 27,6 24,8 29,2 27,7 26,6 26,2 28,0 (Pa s)

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Laboration 4 R-versionen

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Laboration 3: Enkel linjär regression och korrelationsanalys

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

AMatematiska institutionen avd matematisk statistik

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen för kursen. Linjära statistiska modeller. 20 mars

TENTAMEN I MATEMATISK STATISTIK

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för D, I, Π och Fysiker

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Transkript:

ÖVNINGSTENTAMEN: Statistisk modellering för I3, TMS160 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista och typgodkänd räknedosa. Poängberäkning: Uppgifterna är av flervalstyp, där endast ett alternativ är rätt. Korrekt besvarad uppgift ger 2 poäng, obesvarad uppgift (vet ej) ger 0 poäng och felaktigt besvarad uppgift ger -0.5 poäng (flera ifyllda alternativ ger automatiskt -1/2 poäng). Inlämnade lösningar kommer ej tas hänsyn till vid rättningen. Fyll i och lämna in denna sida. Svar: Läggs ut i studieportalen efter tentamens slut. Uppgift a b c d e f vet ej Poäng 1 Λ Λ Λ Λ Λ Λ Λ 2 Λ Λ Λ Λ Λ Λ Λ 3 Λ Λ Λ Λ Λ Λ Λ 4 Λ Λ Λ Λ Λ Λ Λ 5 Λ Λ Λ Λ Λ Λ Λ 6 Λ Λ Λ Λ Λ Λ Λ 7 Λ Λ Λ Λ Λ Λ Λ 8 Λ Λ Λ Λ Λ Λ 9 Λ Λ Λ Λ Λ Λ Λ 10 Λ Λ Λ Λ Λ Λ Λ 11 Λ Λ Λ Λ Λ Λ Λ 12 Λ Λ Λ Λ Λ Λ Λ 13 Λ Λ Λ Λ Λ Λ Λ 14 Λ Λ Λ Λ Λ Λ Λ 15 Λ Λ Λ Λ Λ Λ Λ 1

1 I ett laboratorium vill man bestämma ett konfidensintervall för en mätmetod. Man har mycket stor erfarenhet av metoden och vet att den är mycket stabil, men att spridningen beror på en komponent som ofta byts ut. För att bestämma spridningen måste man därför göra ett antal mätningar på ett referensämne varje gång komponenten bytts ut. Man vet att spridningen är oberoende av väntevärdet av mätningarna och alltså bara beror på komponenten. Först gör man 25 mätningar på referensämnet och beräknar standardavvikelsen till 1.07 g/ml. Därefter gör man 12 mätningar av halten i det prov man verkligen är intresserad av. Medelvärdet av dessa mätningar blev 101.12 och standardavvikelsen blev 1.13 g/ml Det mest korrekta 95%- iga konfidensintervallet för halten i provet ges då av: r 1:13 2 a Λ 101:12 ± t 11;0:95 12 r 1:13 2 [g/ml] b Λ 101:12 ± t 11;0:975 c Λ 101:12 ± t 35;0:95 d Λ 101:12 ± t 35;0:975 e Λ 101:12 ± t 11;0:975 f Λ vet ej r r r 12 1 12 1 12 1 11 [g/ml] 24 1:07 2 +11 1:13 2 35 24 1:07 2 +11 1:13 2 35 24 1:07 2 +11 1:13 2 35 [g/ml] [g/ml] [g/ml] 2

2 I en multivariat regression får vi ett p-värde för F-teststorheten som är mindre än 0.01. Senare upptäcker vi i datorutskriften att en av variablernas t-teststorheter har ett p-värde större än 0.1. Vad kan man säga om detta. a Λ detta är inget förvånande b Λ det är fel på programmvaran ty F-testet och t-testet mäter ungefär samma sak. c Λ om toleransvärdet är större än 0.1 så är detta normalt. d Λ om toleransvärdet är mindre än 0.1 så är detta normalt. e Λ inget av det ovanstående. f Λ vet ej. 3

3 Om vi låter r vara Pearson korrelationskoefficient kan vi tolka r 2 i enkel linjär regression på följande sätt: a Λ om r 2 är litet har vi en beskrivande modell b Λ r 2 beskriver den totala variationen c Λ r 2 mäter hur mycket som regressionen reducerar osäkerheten vid prediktion d Λ r 2 är summan av alla residualer och alltså ett mått på osäkerheten i modellen. e Λ inget av de ovanstående. f Λ vet ej. 4

4 I en intervjuvundersökning av läsarna till tidskriften Fortune fann man att 46% hade andelar i aktiefonder, 63% ägde andelar i andra fondtyper och 74% ägde antingen den ena eller den andra eller båda typerna av fondandelar. Vilket av följande uttalande är då korrekt? a Λ sannolikheten att en läsare ägde båda typerna av fondandelar är 0.35 och sannolikheten att en läsare inte hade några fonder är 0.26 b Λ sannolikheten att en läsare ägde båda typerna av fondandelar är 0.26 och sannolikheten att en läsare inte hade några fonder är 0.35 c Λ sannolikheten att en läsare ägde båda typerna av fondandelar är 0.20 och sannolikheten att en läsare inte hade några fonder är 0.26 d Λ sannolikheten att en läsare ägde båda typerna av fondandelar är 0.35 och sannolikheten att en läsare inte hade några fonder är 0.37 e Λ inget av ovanstående f Λ vet ej 5

5 Som en del av en undersökning av matvaruaffärers placering av varor studerade man en grupp butiker som alla hade frukostvaror (havregryn, cornflakes, etc) på tre eller flera hyllor placerade ovanpå varandra. 30 butiker valdes ut slumpmässigt. Från 10 av butikerna valdes slumpmässigt en frukostvara från nedersta hyllan, från 10 en vara från den mellersta hyllan, och från 10 en vara från översta hyllan. För var och en av de 30 utvalda varorna bestämde man så sockerinnehållet, beräknat som gram per portion, från innehållsdeklarationen på paketet. Med hjälp av dessa data vill man undersöka om det finns något sammanhang mellan hyllplacering och sockerinnehåll. Detta gör man bäst med a Λ regressionsanalys b Λ ensidig variansanalys utan blockindelning c Λ ensidig variansanalys med blockindelning (RCBD) d Λ Pearsons χ 2 -test in en tvåsidig tabell för kategoriska data e Λ inget av ovanstående f Λ vet inte 6

6 Nedastående bilder visar scatterplottar för observationer från tre olika bivariata fördelningar. Är det är det för någon/några av dem tydligt att korrelationskoefficienten är skilld från noll? 2 10 1 9 0 8 1 7 6 2 5 3 4 4 3 5 2 6 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 2.5 1 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 2 1.5 1 0.5 0 0.5 1 1.5 2 2.5 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 Figur 1: Observationer från fördelning a överst till vänster, fördelning b överst till höger och fördelning c nederst a Λ ja, för fördelning a och b, men inte för fördelning c b Λ ja, för fördelning a och c, men inte för fördelning b c Λ ja, men bara för fördelning c d Λ ja, för fördelning b och c,men inte för fördelning a e Λ nej, inte för någon av fördelningarna f Λ vet ej 7

7 Som del i tillverkning av elektroniska kretskort uppbygges en film genom oxidering av kiselskivor i en högtemperaturugn. Nedanstående tabell visar uppmätta värden av filmtjockleken (i ångström) och skivans avstånd (i cm) från ugnsöppningen. avstånd 10 15 20 25 30 35 40 tjocklek 725 1150 1250 1400 1350 1475 1600 För att undersöka filmtjocklekens beroende av avståndet från ugnsöppningen gjordes en linjär regressionsanalys. Man fick då bl a följande datorutskrifter. Analysis of Variance Source DF Sum of Squares Mean Square F Stat Pr > F Model 1 406808.0357 406808.0357 25.84 0.0038 Error 5 78727.6786 15745.5357.. C Total 6 485535.7143... Parameter Estimates Pr Variable DF Estimate Std Error t Stat > t Intercept 1 675.8929 127.7023 5.29 0.0032 afstand 1 24.1071 4.7427 5.08 0.0038 8

Man vill bestämma ett 95% prediktionsinterval for filmtjockleken hos en skiva som ska placeras 30 cm från ugnsöppningen. Detta ska räknas ut som: s 1 (30 25)2 a Λ 675:9 + 30 24:11 ± 2:5706 15745:5 + 7 700 b Λ 675:9+30 24:11±2:5706 c Λ 675:9+30 24:11±2:5706 s s d Λ 675:9 + 30 24:11 ± 2:5706 e Λ 675:9+30 24:11±2:5706 f Λ vet ej s 15745:5 15745:5 s 15745:5 80922:6 17 (30 25)2 1 + + 116:7 17 (30 25)2 1 + + 700 1 + 302 116:7 (30 24:11)2 1 + 116:7 9

8 Efter injektion av ett antibiotikum i blodet binds en viss del av den injicerade mängden till serumproteiner. Detta fenomen har stor farmakologisk betydelse, eftersom det påverkar hur effektiv antibiotikan ifråga blir mot infektioner. I en studie ville man undersöka hur stor del av fem olika antibiotikatyper som bands. Varje medel injicerades på fyra olika individer. De tjugo frivilliga försökspersonerna tilldelades genom lottning en av de fem antibiotikatyperna. Antibiotikum M ängd bundet serum (okänd enhet) Penicillin G 29.6 24.3 28.5 32.0 Tetracycline 27.3 32.6 30.8 34.8 Streptomycin 5.8 6.2 11.0 8.3 Erythromycin 21.6 17.4 18.3 19.0 Chlomphenicol 29.2 32.8 25.0 24.2 Vilket av följande statistiska verktyg (med data på den form som ges i tabellen) skall du använda för att undersöka nollhypotesen att de fem typerna är likvärdiga? a Λ χ 2 -test av radoberoende ienkontigenstabell b Λ enkel linjär regression c Λ ensidig variansanalys d Λ tvåsidig variansanalys e Λ vet ej 10

9 Vid en kontroll av antagandena i en enkel linjär regressionmodell är residualplottar ett mycket användbart verktyg. Man skall dock inte plotta residualerna mot: a Λ de observerade värdena av svarsvariabeln. b Λ de anpassade värdena av svarsvariabeln. c Λ värdena av prediktorn. d Λ värdena av regressorn. e Λ tidsordningen för observationerna. f Λ vet ej 11

10 Två uppmätta dimensioner, X och Y hos en plastdetalj tros följa en bivariat normalfördelning med ff X = 0:04;ff Y = 0:08;μ X = 3:0;μ Y = 7:7;ρ =0.Dåär P (2:95 <X< 3:05; 7:60 <Y < 7:80) lika med a Λ 0.32 b Λ 0.42 c Λ 0.52 d Λ 0.62 e Λ 0.72 f Λ Vet ej 12

11 Man var intresserad av felfrekvenser i ett sjukhuslaboratorium, och gick därför igenom 1000 slumpmässigt utvalda analysrapporter. Rapporterna kom från en vanlig arbetsvecka. De klassificerades som tillfredsställande, eller som behäftade med så pass viktiga fel att de borde ha gjorts om. Dessutom antecknades om analysen gjorts av dagskiftet eller kvällsskiftet. Resultatet ges i nedanstående tabell: Skift felprocent antal fel antal OK totalt Procent Dag 2.4 16 654 670 67 kväll 7.3 24 306 330 33 totalt 4.0 40 960 1000 100 Procent 4 96 100 Pearson χ 2 testkvantitet för hypotesen om oberoende mellan felfrekvens og skift ges då av: (16 26:8)2 (24 13:2)2 a Λ + 26:8 13:2 b Λ (2:4 4:85) 2 (7:3 4:85)2 + 4:85 4:85 c Λ d Λ e Λ f Λ (16 26:8)2 26:8 (2:4 4:85)2 4:85 (16 250)2 250 Vet ej (654 643:2)2 (24 13:2)2 (306 316:8)2 + + + 643:2 13:2 316:8 + + (97:6 95:15)2 95:15 (654 250)2 250 + + (7:3 4:85)2 4:85 (24 250)2 250 + + (92:7 95:15)2 95:15 (306 250)2 250 13

12 Ett företag som framställer insulin vill jämföra mätmetoderna för insulinstyrka vid 5 olika laboratiorier runt om i värlsden. För detta har man planerat göra följande sk Round Robin försök. Man skickar 6 prov från vart och ett av 3 insulinpartier till vart och ett av laboratorierna. Proverna analyseras sedan av laboratorierna, och analysresultaten skickas till företaget. Resultaten (mätta i insulinstyrka per ml) kan antagas vara normalfördelade. Man vet av erfarenhet att insulinstyrkan kan variera lite från parti till parti. Ändamålet med försöket är att undersöka om laboratorierna mäter samma insulinstyrka. Detta gör man bäst med a Λ regressionsanalys b Λ ensidig variansanalys utan blockindelning (one-way model) c Λ ensidig variansanalys med blockindelning (RCBD) d Λ χ 2 -test för oberoende ienfyrfältsstabell för kategoriska data e Λ inget av ovanstående f Λ vet ej 14

13 Den stokastiska variabeln X har väntevärde 3 och standardavvikelse 1 och variablen Y har väntevärde 2 och standardavvikelse 2. Vidare är korrelationen mellan X och Y lika med 0.5. Sätt Z = X Y +2. Då är variansen för Z lika med a Λ 1 b Λ 2 c Λ 3 d Λ 5 e Λ 7 f Λ vet ej 15

14 En teknolog gör examensarbete i en fabrik som tillverkar tandkräm. Hennes uppgift är att undersöka variationer i produktionen. Tandkrämen fylls på tuber av en maskin med sex påfyllningskanyler som fyller parallellt från samma tank. Hon valde att bedömma variationen genom att undersöka ev. skillnader mellan tuber som kom från olika påfyllningskanyler. Under en dag med 17 timmars produktion tog hon en gång i timmen samtidigt ut en tub från varje kanyl. Hon vägde därefter tuberna. Från de uppmätta vikterna kunde hon så beräkna värdena i följande tabell: Variation SS Tidpunkt 0.5458 Kanyl 4.0175 Error 0.1122 Testkvantiteten för test av hypotesen om att det inte finns någon skillnad i vikten av tandkrämstuber som kommer från olika påfyllningskanyler ges då av: a Λ 0:5458=16 0:1122=80 b Λ 0:5458=16 0:1122=81 c Λ 0:5458=5 0:1122=81 d Λ 0:5458=6 0:1122=81 e Λ 4:0175=5 0:1122=80 f Λ vet ej 16

15 En betongtillverkare vill jämföra dragstyrkan hos betong tillverkat med fyra olika produktionsmetoder. Vid tillverkningen används ofta fyra olika tillsättningsmedel, som kanske har inflytande på dragstyrkan. Man har därför planerat ett försök där var och en av produktionsmetoderna används tillsammans med vart och ett av de fyra tillsättningsmedeln. För att få tillräcklig precision i försöket tänker man göra tre upprepningar för varje kombination av metod och tillsättningsmedel. Test av om produktionsmetoden har något inflytande på dragstyrkan görs bäst som: a Λ regressionsanalys b Λ ensidig variansanalys utan blockindelning (one-way model) c Λ ensidig variansanalys med blockindelning (RCBD) d Λ χ 2 -test för oberoende ienfyrfältsstabell för kategoriska data e Λ inget av ovanstående f Λ vet ej 17