Tentamen för kursen. Linjära statistiska modeller. 13 januari

Relevanta dokument
Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Lycka till!

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 22 februari

AMatematiska institutionen avd matematisk statistik

Föreläsning 15: Faktorförsök

Tentamen för kursen Statistik för naturvetare. Tisdagen den 14 december

Tentamen för kursen Statistik för naturvetare. Torsdagen den 22 december

Statistisk försöksplanering

Statistisk försöksplanering

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tentamen för kursen Statistik för naturvetare. Tisdagen den 11 januari

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Enkel och multipel linjär regression

Matematisk statistik för B, K, N, BME och Kemister

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Tisdagen den 16 januari

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Uppgift 1. f(x) = 2x om 0 x 1

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Övningstentamen i matematisk statistik för kemi

F13 Regression och problemlösning

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

TAMS65 - Seminarium 4 Regressionsanalys

Matematisk statistik LKT325 Tentamen med lösningar

LMA201/LMA521: Faktorförsök

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

LKT325/LMA521: Faktorförsök

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik TMA321 1

Matematisk statistik KTH. Formelsamling i matematisk statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

0 om x < 0, F X (x) = c x. 1 om x 2.

Tenta i Statistisk analys, 15 december 2004

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

TENTAMEN I MATEMATISK STATISTIK

LMA201/LMA521: Faktorförsök

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Avd. Matematisk statistik

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Exempel på tentamensuppgifter

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Avd. Matematisk statistik

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Matematisk statistik, Föreläsning 5

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Tentamen i Matematisk statistik Kurskod S0001M

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Tentamen i Matematisk statistik Kurskod S0001M

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Avd. Matematisk statistik

1 Reducerat faktorförsök rf f

Matematisk statistik för D, I, Π och Fysiker

Lufttorkat trä Ugnstorkat trä

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Grundläggande matematisk statistik

Avd. Matematisk statistik

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Tentamen i Matematisk statistik Kurskod S0001M

LMA201/LMA522: Faktorförsök

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Transkript:

STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2011 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 32, hus 5, fredag 21/1 kl 12.15. Efter återlämningen finns skrivningarna hos Christina Nordgren, rum 303, hus 6. Tillåtna hjälpmedel: Miniräknare. Utdelad formel- och tabellsamling. Lösningar finns på www.math.su.se/matstat/tentor efter skrivtidens slut. Krav för godkänt: För varje betygssteg krävs både ett visst minsta antal poäng på teoridelen (uppgifterna 1 och 2) och på problemdelen (uppgifterna 3-5) enligt nedanstående tabell. Resonemang skall vara klara och tydliga att följa. A B C D E Teoridel 18 15 10 10 10 Problemdel 25 25 20 15 10 Teoridel: Uppgift 1 Betrakta modellen tvåsidig indelning, en observation per cell, modelltyp I. Vi använder de beteckningar som finns på sidan 9 i formelsamlingen. På vanligt sätt skattar vi α i med ˆα i = Ȳi. Ȳ.. och β j med ˆβ j = Ȳ.j Ȳ... a) Hitta ett uttryck för ˆα i som endast innehåller modellens parametrar (dvs µ, α i, β j ) och variablerna ɛ ij. (2 p) b) Beräkna Var(ˆα i ) uttryckt i r, s och σ 2. (3 p) Ledning: Om n variabler Z 1,..., Z n är oberoende och likafördelade med varians τ så gäller att Var(Z i Z) = (n 1)τ/n. Denna formel får användas utan bevis.

Linjära statistiska modeller, 13 januari 2011 2 c) När man bara har en observation per cell brukar man säga att man är tvungen att anta att faktorerna inverkar additivt - man har ju ingen möjlighet att skatta ett eventuellt samspel γ ij separerat från feltermen ɛ ij. Men detta resonemang förutsätter att feltermens varians σ 2 är okänd. Antag att man vet (t.ex av erfarenhet) att σ 2 = 5, och att datorn har skrivit ut den ANOVA-tabell som visas här nedan. Då finns det ett sätt att testa hypotesen att samspelseffekter mellan rad- och kolonnfaktorn saknas. Genomför det testet! Använd signifikansnivån 5 %. (5 p) Variationskälla Antal fr.gr Kvadratsumma Medel. kv.sum Mellan rader 4 54.0 13.50 Mellan kolonner 3 82.7 27.6 Residualer 12 100.3 8.36 Totalt 19 237.0 Teoridel: Uppgift 2 a) En grupp forskare genomför ett fullständigt 2 4 -försök (utan replikat). På grund av slarv råkar ett av de 16 mätvärdena bli mycket större än det borde bli. Följaktligen blir alla de 16 skattningarna (medelvärdesskattningen och de 15 effektskattningarna) också fel. Vi kallar de fyra faktorerna A, B, C och D. Antag att det experiment som har gått fel är den kombination där faktorn A är på plusnivån och faktorerna B, C och D på minusnivån (med andra ord, värdet på y + har blivit mycket större än det borde bli). Hur kommer detta fel att påverka skattningen av trefaktorsamspelet ABC? Blir den större eller mindre än den borde bli? Motivera svaret. (3 p) b) Vid ett annat tillfälle granskar en forskare resultatet av ett 2 4 -försök och gör en konstig upptäckt. Hon finner att både trefaktorsamspelet ABC och fyrfaktorsamspelet ABCD har blivit negativa tal med så stora absolutbelopp att de är statistiskt signifikanta. Forskaren misstänker att detta kan bero på ett allvarligt fel i något av de 16 experimenten. Vad är den mest troliga nivån på faktorn D i det felaktiga experimentet? Har D varit på minusnivå eller plusnivå? Motivera svaret. (3 p) c) Effektskattningarna i Tabell 1 härrör från ett 2 4 -försök i syfte att studera hur halten aktiv substans i en viss hudkräm varierade med olika förhållanden. Resultatet är konstigt, eftersom tre- och fyrfaktorsamspelen inte alls är försumbara jämfört med huvudeffekter och tvåfaktorsamspel, vilket ju är det vanliga. Man kan misstänka att ett grovt fel har inträffat vid ett (och bara ett) av de 16 bakomliggande experimenten. Vilket experiment bör man i första hand misstänka att det är? (Beskriv det genom att

Linjära statistiska modeller, 13 januari 2011 3 ange vilka faktorer som har varit på plus- respektive minusnivå). Motivera svaret. (4 p) Effekt Effekt ˆµ 94.88 BC 0.00  0.02 BD 0.28 ˆB 0.36 ĈD 0.01 Ĉ 0.16 ABC 0.17 ˆD 0.09 ABD 0.27 ÂB 0.03 ACD 0.17 ÂC 0.22 BCD 0.11 ÂD 0.34 ABCD 0.21 Table 1: Till teoriuppgift 2c Problemdel: Uppgift 3 En grupp forskare vid en teknisk högskola vill ta reda på hur energiförbrukningen i en viss typ av småhus beror på bostadsyta, husets byggnadsår och årsmedeltemperaturen på orten. Man samlar in data för n = 64 hus av den aktuella typen. Bostadsytan varierar mellan 96 och 165 kvadratmeter, energiförbrukningen varierar mellan 18 och ungefär 30 MWh, och byggnadsår varierar ganska jämnt mellan 1950 och 1990. Husen finns i olika delar av Sverige, från Skåne till Norrbotten. Man bestämmer sig för att pröva linjär regression av energiförbrukningen på de tre förklaringsvariablerna och får en ANOVA-tabell som tabell 2 visar (något ofullständig). Vid närmare betraktande ser man att sambandet inte förefaller linjärt och provar därför också en andra ordningens modell, alltså en modell där förutom de tre förklaringsvariablerna även deras kvadrater och produkter ingår. Med en sådan modell blir kvadratsumman för regression lika med 519.3. a) Skatta feltermens varians i de båda modellerna. (4 p) b) Betrakta andra ordningens modell som grundmodell och testa hypotesen att kvadrat- och produkttermerna är betydelselösa för energiförbrukningen. Med andra ord, hypotesen att det sanna värdet på motsvarande regressionskoefficienter är lika med noll. (6 p) Problemdel: Uppgift 4 Ett företag som ska marknadsföra ett nytt tapetklister undersöker hur vidhäftningsförmågan hos klistret beror på tapettyp och underlag. Nedanstående

Linjära statistiska modeller, 13 januari 2011 4 Frihetsgrader Kvadratsumma Regression 3 163.26 Residualer 858.3 Totalt Table 2: Till problem 3a tabell visar data från ett försök med fyra olika underlag (betong, trä, gips respektive minerit) och två olika tapetsorter (slät respektive strukturtapet, betecknade A resp B). Båda faktorerna betraktas som systematiska. Två mätningar av vidhäftningsförmågan gjordes för varje kombination av underlag och tapettyp. Värdena inom parentes är cellmedelvärden. A B Betong 77 82 (79.5) 66 73 (69.5) Trä 67 69 (68) 54 52 (53) Gips 69 74 (71.5) 61 64 (62.5) Minerit 65 59 (62) 48 43 (45.5) Table 3: Uppmätt vidhäftningsförmåga för olika tapettyper och underlag Data analyserades med hjälp av ett statistiskt programpaket som gav totalmedelvärdet 63.94 och de här kvadratsummorna: Mellan underlag: 946.2, Mellan tapettyper: 637.6, Samspel: 40.69, Reisdualer: 88.5. a) Ange en lämplig modell för data. (2 p) b) Testa om underlag och tapettyp inverkar additivt på vidhäftningsförmågan. (3 p) c) Om det visar sig rimligt att anta att de inverkar additivt, så förenkla (reducera) modellen. Undersök sedan om det föreligger någon påvisbar skillnad mellan olika underlag respektive tapettyper. (3 p) d) Skatta den förväntade skillnaden i vidhäftningsförmåga mellan kombinationerna slät tapet på betongunderlag och strukturtapet på träunderlag. Oavsett resultaten i b- och c-delen, räkna på en additiv modell som inkluderar båda faktorerna (underlag och tapettyp). (2 p) Problemdel: Uppgift 5 Vid framställning av ett färgämne varierade man följande fem processbetingelser:

Linjära statistiska modeller, 13 januari 2011 5 A Temperatur Låg (-) Hög (+) Steg 1 B Materialkvalitet Låg (-) Hög (+) C Reduktiontryck Atmosfäriskt (-) Förhöjt (+) Steg 2 D Torkningstryck Lågt (-) Högt (+) E Vakuumläckage Låg (-) Hög (+) Av tekniska skäl visste man att A och B kunde samspela och likaså C, D och E. Däremot är inga samspel möjliga mellan Steg 1 och Steg 2, dvs samspel mellan A eller B å ena sidan och C, D eller E å den andra. Kvalitén mättes med en fotoelektrisk spektrometer där låga värden hörde samman med god kvalitet. Ett 2 5 1 -försök genomfördes och utbytet blev, för de olika faktornivåerna: A B C D E Utbyte 201.5 + + 178.0 + + 183.5 + + 176.0 + + 188.5 + + 178.5 + + 174.5 + + + + 196.5 + + 255.5 + + 240.5 + + 208.5 + + + + 244.0 + + 274.0 + + + + 257.5 + + + + 256.0 + + + + 274.5 Om man räknar effektskattningar som om försöket hade varit ett fullständigt 2 4 -försök i faktorerna A, B, C och D, så får man följande effektskattningar:

Linjära statistiska modeller, 13 januari 2011 6 Effekt Skattning A 0.22 B 3.78 C 7.03 D 33.34 AB 8.34 AC 1.53 AD 2.59 BC 4.16 BD 1.78 CD 7.16 ABC 0.03 ABD 2.34 ACD 3.84 BCD 1.16 ABCD 1.97 a) Med utgångspunkt från vad som ovan angavs om vilka samspelseffekter som bedömdes möjliga, bestäm hur många effektskattningar (och vilka) som kan användas för att skatta försöksfelens standardavvikelse. Beräkna dessa och skatta dels de enskilda försöksfelens standardavvikelse, dels effektskattningarnas standardavvikelse. Ange tydligt vilken som är vilken. (3 p) b) En effekt är betydligt större än alla andra. Den är uppenbar redan vid ett ögonkast på data. Kontrollera att den är statistiskt säkerställd. (3 p) c) CDE-effekten hörde inte till de redan i förväg uteslutna samspelseffekterna. Den effekten är kopplad till en annan effekt, vilken? Vilken av de två kopplade effekterna är troligast som förklaring till det observerade värdet på effektskattningen? Motivera! (4 p)