Uppgift a b c d e f (vet ej) Poäng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15



Relevanta dokument
Del A: Schema för ifyllande av svar nns på sista sidan

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Uppgift a b c d e f (vet ej) Poäng

ÖVNINGSTENTAMEN: Statistisk modellering för I3, TMS160 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista och typgodkänd

Uppgift a b c d e f (vet ej) Poäng

Uppgift a b c d e Vet inte Poäng

Del A: Schema för ifyllande av svar nns på sista sidan

Uppgift a b c d e Vet inte Poäng

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Samhällsvetenskaplig metod, 7,5 hp

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

OBS! Vi har nya rutiner.

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

(a) Beräkna sannolikhetsfunktionen p X (x). (2p) (b) Beräkna väntevärdet för X. (1p) (c) Beräkna standardavvikelsen för X. (1p)

Statistisk försöksplanering

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

10.1 Enkel linjär regression

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Statistik för teknologer, 5 poäng Skrivtid:

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Statistisk försöksplanering

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Föreläsning 12: Regression

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

OBS! Vi har nya rutiner.

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Regressions- och Tidsserieanalys - F4

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamensresultat anslås (anslagstavla och kursportal) senast 3 veckor efter tentamen.

Statistik 1 för biologer, logopeder och psykologer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Multipel Regressionsmodellen

Tentamen i matematisk statistik

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

7.5 Experiment with a single factor having more than two levels

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

7.5 Experiment with a single factor having more than two levels

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

TENTAMEN I STATISTIK B,

Regressions- och Tidsserieanalys - F3

ANOVA Mellangruppsdesign

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Lösningar till SPSS-övning: Analytisk statistik

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Följande resultat erhålls (enhet: 1000psi):

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Forsknings- och undersökningsmetodik Skrivtid: 4h

Regressions- och Tidsserieanalys - F1

Tentamen Tillämpad statistik A5 (15hp)

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Laboration 2: Styrkefunktion samt Regression

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp 23 maj 2013 kl. 9 14

Musselmatematik eller Stormusselstatistik

Regressions- och Tidsserieanalys - F5

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

MSG830 Statistisk analys och experimentplanering

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Transkript:

查 询 TMS160 供 应 商 捷 多 邦, 专 业 PCB 打 样 工 厂,24 小 时 加 急 出 货 TENTAMEN: Statistisk modellering för I3, TMS160, fredagen den 26 Augusti kl? på?. Jour: Holger Rootzén, ankn. 3578 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista och typgodkänd räknedosa. Poängberäkning: Uppgifterna är av ervalstyp, där endast ett alternativ är rätt. Korrekt besvarad uppgift ger 2 poäng, obesvarad uppgift (vet inte eller alternativ f) ger 0 poäng och felaktigt besvarad uppgift ger -0.5 poäng (era ifyllda alternativ ger automatiskt -1/2 poäng). Inlämnade lösningar kommer ej tas hänsyn till vid rättningen. Fyll i och lämna in denna sida. Svar: Läggs ut i studieportalen efter tentamens slut. Uppgift a b c d e f (vet ej) Poäng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1

1 Tre olika leukemibehandlingar jämfördes i ett försök där 63 patienter slumpmässigt indelades i tre lika stora grupper som behandlades med var sin metod. Efter behandlingsperiodens slut bedömde man om behandlingen haft någon eekt, eller om man inte kunde påvisa någon eekt. Behandling Eekt Ingen eekt 1 12 9 2 17 4 3 16 5 Försöket analyseras bäst med a b c d e f Regressionsanalys Ensidig variansanalys utan blockindelning (one-way model) Ensidig variansanalys med blockindelning (RCBD) Ett Pearson χ 2 -test Inget af ovanstående Vet inte 2

2 Som ett led i ett studium av relationen mellan kroppsvikt och hjärtvikt hos däggdjur fångade man 19 murmeldjur og bestämte deres kroppsvikt och hjärtvikt i gram. Tabellen nedan ger några grundläggande statistikor för kroppsvikten body och hjärtvikten heart. body Moments N 19.0000 Sum Wgts 19.0000 Mean 3103.6842 Sum 58970.0000 Std Dev 1030.7196 Variance 1062382.89 Skewness 1.2068 Kurtosis 0.9321 USS 202147150 CSS 19122892.1 CV 33.2096 Std Mean 236.4633 heart Moments N 19.0000 Sum Wgts 19.0000 Mean 11.9105 Sum 226.3000 Std Dev 1.5776 Variance 2.4888 Skewness 0.9943 Kurtosis 1.0560 USS 2740.1500 CSS 44.7979 CV 13.2453 Std Mean 0.3619 Vidare har man beräknat 19 i=1 (x i x)(y i y) = 2120.2368, där x i och x är kroppsvikten för det i'te murmeldjuret och medelvärdet av kroppsvikten hos de 19 djuren, och motsvarande är y i och y hjärtvikten och den genomsnittliga hjärtvikten. 3

Pearson-korrelationen mellan kroppsvikt och hjärtvikt för desssa mätningar ska beräknas som: a b c d e f 3103.6842 11.9105 18 1030.7196 1.5776 3103.6842 11.9105 18 236.4633 0.3619 2120.2368 18 1030.7196 1.5776 2120.2368 1030.7196 1.5776 2120.2368 18 3103.6842 11.9105 Vet inte 4

3 Varför bör np i 5, i = 1,..., c, i en en-vägs tabell, och hur många frihetsgrader har X 2 = c i=1 Y i np (0) 2 i np (0) i under H 0 : p i = p (0) i? (a) För att undvika beroenden då antalet frihetsgrader ä r c. (b) För att centrala gränsvärdessatsen ska ge att fördelad med en frihetsgrad för varje i, och c 1. Y i np (0) 2 i np (0) i (c) För att centrala gränsvärdessatsen ska ge att Y i np (0) q i np (0) i fördelad med en frihetsgrad för varje i, och c 1. (d) För att centrala gränsvärdessatsen ska ge att fördelad med en frihetsgrad för varje i, och c. (e) Inget av ovanstående. (f) Vet ej. Y i np (0) i np (0) i 2 är χ 2 - är χ 2 - är χ 2-5

4 Vad har tolerans och förklaringsvärde gemensamt, och vad indikerar låg tolerans? (a) Toleransen för regressorn i är 1 förklaringsvärdet för vad man får om man tar den regressorn som respons och gör regression med avseende på övriga regressorer. Låg tolerans indikerar multikolinjäritet. (b) Ingenting. Låg tolerans indikerar liten correlation mellan regressorerna. (c) Toleransen för regressorn i är 1 förklaringsvärdet för vad man får om man tar den regressorn som respons och gör regression med avseende på övriga regressorer. Låg tolerans indikerar liten correlation mellan regressorerna. (d) Ingenting. Låg tolerans indikerar multikolinjäritet. (e) Inget av ovanstående. (f) Vet ej. 6

5 Betrakta gurerna 1-4. I vilka gurer är det rimligt att anta att beroendet mellan datamängderna kan beskrivas (rimligt) väl genom att beräkna korrelationskoecienten? (a) I gurerna 1,2 och 3. (b) I gurerna 1,2 och 4. (c) Endast i gurerna 1 och 2. (d) Endast i gur 4. (e) Inget av ovanstående. (f) Vet ej. ftbpf6.4931in5.232in0innfplot1.epsftbpf6.606in5.232in0innfplot2.epsftbpf6.4931in5.232in0 7

6 En pappersmaskin lägger på en tunn skyddslm av plast på pappret för att göra det motståndskraftigt mot mekaniskt slitage. Man har undersökt tre olika produktionsomgångar och lagt på lmen med fyra olika koncentrationer(2%, 3%, 4% og 5%) av ett tillsatsmedel. I ett kontrollerat experiment ck man följande styrkemätningar: Koncentration Produktion 2% 3% 4% 5% A 10.4 10.2 9.4 9.3 B 11.2 10.5 10.4 10.0 C 11.3 11.0 10.4 9.7 Data analyserades med ensidig variansanalys med blockindelning (RCBD). Tukey's test for additivitet gav följande resultat: TUKEYS TEST FOR ADDITIVITY: F STATISTIC: 0.16638 DEGREES OF FREEDOM: 1 5 P-VALUE: 0.70023 Man kan av detta dra slutsatsen att b d a c e f Man bør använda en multiplikativ model Analysen ger en klar indikation på att skillnaden mellan eekterna av koncentrationerna av tillsatsmedel beror av vilken produktionsomgång man betraktar. Analysen ger ingen indikation på att skillnaden mellan eekterna av koncentrationerna av tillsatsmedel beror av vilken produktionsomgång man betratktar. Man bør göra en logaritmisk transformation av de uppmätta styrkorna. Man bør göra en logaritmisk transformation af de använda koncentrationerna Vet inte 8

7 Under en studie från 1987 av Gastwirth framkom det att sannolikheten att en lögndetektor tror att man ljuger om man verkligen ljuger är 0.88 samt att sannolikheten att lögndetektorn tror att man talar sanning givet att man verkligen gör det är 0.86. Om man dessutom lyckades mäta att sannolikheten att man talar sanning givet att även lögndetektorn tycker så är 0.94 kan man bakvägen räkna ut sannolikheten att en person ljög. Vad blir då denna sannolikhet, alltså sannolikheten en person ljög? a 0.01 b 0.13 c 0.03 d 0.05 e Inget av ovanstående. f Vet ej. 9

8 Varför kan det vara önskvärt att använda multipel jämförelse istället för ett F-test? a Vi får ut mer information i en multipel jämföresle. b Det är ej önskvärt. c En multipel jämförelse är enklare att genomföra. d Multipel jämförelse mäter varians bättre. e Inget av ovanstående. f Vet ej. 10

9 Vid en analys prövade man både linjär och icke-linjär regression och ck nästan likadana R 2 -värden i båda analyserna. Vilken typ av modell borde du då rekomendera, och hur borde du motivera ditt val? a Den icke-linjära för den beräkningsmässigt mindre krävande. b Den linjära för den förklarar variationen på ett bättre sätt. c Den icke-linjära för den förklarar variationen på ett bättre sätt. d Den linjära för den är mindre komplicerad. e Inget av ovanstående. f Vet ej. 11

10 Vilka antaganden bygger F-testet i en multipel linjär regressionsanalys på? 1: Residualerna är normalfördelade. 2: Residualerna är stationära. 3: Värdena av svarsvariabeln är stationära. Svar: a Antagande 1 och 2, men inte 3. b Antagande 1 och 3, men inte 2. c Antagande 2 och 3, men inte 1. c Alla tre antaganden (1-3). e Inget av de ovanstående f Vet inte. 12

11 Tabellen nedan visar ANOVA-tabellen för en tvåsidig variansanalys. Analysis of variance Source DF Sum of squares Mean square F Stat A * 20.48 *? B 1 1.70 1.70 * A B * 157.25 78.62 * Error 18 112.05 6.23 Total 23 291.48 Värdena i några av fälten saknas och är markerade med (*). Från de givna sirorna kan man ändå beräkna värdet av F-statistikan (markerad med ett frågetecken i tabellen). Den blir: a 10.24/6.23 b 10.24/112.05 d 20.48/6.23 e 20.48/112.05 e 20.48/291.48 f vet inte. 13

12 I syfte att undersöka en (kostsam) mätprocedur vid tre olika laboratorier delades ett provmaterial in i 9 delar och 3 delar skickades till vardera av de tre laboratorierna. I respektive laboratorium bad man vidare att de tre provmaterialen skulle mätas av olika laboratorieassistenter för att också få med denna variation i undersökningen. Resultatet visas i följande diagram. Ett test om mätproceduren ger samma resultat vid de tre laboratorierna görs bäst med: a regressionsanalys. b ensidig variansanalys utan blockindelning (one-way model). c ensidig variansanalys med blockindelning (RCBD). d χ 2 -test för oberoende i en kontigenstabell. e inget av de ovanstående. f vet inte. 14

13 Ett jordprovs adsorption av fosfat kan användas som ett mått på eektiviteten av pesticider og andra kemikalier. Tabellen nedan visar sammanhängande mätvärden av fosfatadsorptionsindex och mängden järn och aluminium i ett antal jordprov. Järn Aluminium Adsorptionsindex 175 21 18 111 24 14 124 23 18 130 64 26 173 38 26 169 33 21 169 61 30 160 39 28 244 71 36 257 112 65 333 88 62 199 54 40 Man gjorde en linjär regressionanalys för att beskriva hur fosfatadsorptionen beror av järn- och aluminiumhalt i jorden. Valda delar av output ges nedan. Analysis of Variance Sum of Source DF Squares Mean Square F Value Pr > F Model 2 2806.216517 1403.108258 65.84 <.0001 Error 9 191.783483 21.309276 Corrected Total 11 2998.000000 15

Parameter Estimates Pr Variable DF Estimate Std Error t Stat > t Intercept 1-7.31 4.38-1.67 0.1298 järn 1 0.11 0.03 3.36 0.0084 alum 1 0.34 0.07 4.64 0.0012 Det predikterade värdet av av adsorptionsindex vid ett järninnehåll på 170 och ett aluminiuminnehåll på 25 blir a -7.31 + 0.11 170 + 0.34 25 b -7.31 + 0.34 170 + 0.11 25 c 4.38 + 0.03 170 + 0.07 25 d 173 + 0.11 170 + 0.34 25 e -7.31-4.38 + (0.11-0.03) 170 + (0.34-0.075) 25 f Vet inte 16

14 I ett lantbruksförsök var man intresserad av skördeutbytet under olika förhållanden. Betrakta följande frågor: 1 Hur kan man upptäcka interaktion i en interaktionsgraf? 2 I vilka av följande fall kan man förvänta sig interaktion: a) mellan regnmängd och antalet soltimmar, och b) ögonfärg och hårfärg hos traktorföraren? Dessa frågor besvaras bäst med: a 1: Korsande linjer. 2: a) och b). b 1: Parallella linjer. 2: b) men inte a) c 1: Korsande linjer. 2: a) men inte b) d 1: Parallella linjer. 2: ingen av a) och b) e f Inget av ovanstående vet inte 17

15 En rma säljer swimmingpooler, spas och bastuar. Ägaren beslutar sig för att undersöka om åldern av försäljningspersonalen (grupperad i 20-29-åriga, 30-39-åriga, 40-49-åriga och 50-åriga och över) och om produkttypen (swimmingpool, spa och sauna) har något inytande på den månatliga försäljningen. Resultatet visas i tabellen nedan. Man vet att där är två observationer i varje cell. Variation SS ålder 168.033 produkttyp 1762.067 växelverkan 7955.267 fel 2574.000 total 12459.367 F-testkvantiteten för test av hypotesen att det inte nns någon växelverkan mellan ålder och produkttyp är a (7955.267/6)/(2574.000/12) b (168.033/3)/(2574.000/7) c (168.033/3)/((7955.267 + 2574.000)/13) d (168.033/3)/(7955.267/6) e (1762.067/2)/(2574.000/7) f Vet inte 18