Uppgift 1. ii) r xy = 0.5. iii) r xy = 1. iv) r xy = 1. v) Denna fråga kan inte besvaras utan att kolla data.

Relevanta dokument
b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Lufttorkat trä Ugnstorkat trä

Sju dagar före viral exponering med echinacea därefter Efter viral exponering med echinacea därefter Placebo (ingen echinacea) 58 30

Avd. Matematisk statistik

Avd. Matematisk statistik

0 om x < 0, F X (x) = c x. 1 om x 2.

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Avd. Matematisk statistik

Uppgift 1. f(x) = 2x om 0 x 1

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Avd. Matematisk statistik

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

f(x) = 2 x2, 1 < x < 2.

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Avd. Matematisk statistik

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Avd. Matematisk statistik

Avd. Matematisk statistik

Avd. Matematisk statistik

Avd. Matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

1 e (λx)β, för x 0, F X (x) = 0, annars.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Avd. Matematisk statistik

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Avd. Matematisk statistik

Lycka till!

b) Förekommer A- och B-fel oberoende av varandra? (Motivering krävs naturligtvis!) (5 p)

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

** a) Vilka värden ska vara istället för * och **? (1 p) b) Ange för de tre tillstånden vilket som svarar mot 0,1,2 i figuren.

Avd. Matematisk statistik

Avd. Matematisk statistik

Avd. Matematisk statistik

Uppgift 1 Andrej och Harald roar sig med en standardkortlek med 52 kort uppdelade på fyra färger (spader, klöver, hjärter och ruter).

Uppgift 1 P (A B) + P (B A) = 2 3. b) X är en diskret stokastisk variabel, som har de positiva hela talen som värden. Vi har. k s

Avd. Matematisk statistik

TENTAMEN I SF1906 (f d 5B1506) MATEMATISK STATISTIK GRUNDKURS,

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

e x/1000 för x 0 0 annars

TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 18 AUGUSTI 2017 KL

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Avd. Matematisk statistik

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

TENTAMEN I SF1904 MARKOVPROCESSER TISDAGEN DEN 29 MAJ 2018 KL

FACIT: Tentamen L9MA30, LGMA30

P =

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Stockholms Universitet Statistiska institutionen Termeh Shafie

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen i Matematisk statistik Kurskod S0001M

b) Teknologen Osquarulda känner inte till ML-metoden, men kom på intuitiva grunder fram till att p borde skattas med p = x 1 + 2x 2

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

b) Vad är sannolikheten att personen somnar i lägenheten? (4 p) c) Hur många gånger förväntas personen byta rum? (4 p)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik TMS064/TMS063 Tentamen

AMatematiska institutionen avd matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Individ nr Första testet Sista testet

Uppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

TENTAMEN Datum: 14 feb 2011

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsning 4: Konfidensintervall (forts.)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsningsanteckningar till kapitel 9, del 2

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Avd. Matematisk statistik

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Transkript:

Avd. Matematisk statistik TENTAMEN I SF9, STATISTIK FÖR BIOTEKNIK Måndag den åttonde januari 08 4:00-9:00. Examinator: Timo Koski, 70 37 00 47. Kursledare: Timo Koski, 790 7 34. Tillåtna hjälpmedel: Formel- och tabellsamling för SF9, Mathematics Handbook (Beta), hjälpreda för miniräknare, miniräknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 8 uppgifter. Varje korrekt lösning ger 4 poäng. Gränsen för godkänt är preliminärt 6 poäng (ev. bonuspoäng inräknade). Möjlighet att komplettera ges för tentander med, preliminärt, 4 5 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift a) Data på livslängderna y för proteinerna i proteinfamiljen A visar att livslängderna y är två gånger livslängderna x för proteinerna i proteinfamiljen B. r xy är korrelationskoefficienten. Vilken av följande utsagor i)-v) är sann? Motivera kortfattat ditt svar. ( p) i) r xy = 0.5. ii) r xy = 0.5. iii) r xy =. iv) r xy =. v) Denna fråga kan inte besvaras utan att kolla data. b) I ett kursprojekt mäter man vikten i g och svanslängden i mm hos en grupp vita möss. Korrelationskoefficienten r mellan vikt och svanslängd blev r = 0.7. Ett spridningsdiagram (scatterplot) visar en utliggare, som tydligt placerar sig under de övriga punkterna. Det visar sig att utliggaren svarar mot en sjuk mus, och därför elimineras utliggaren från projektet. En av följande utsagor i)-iv) är sann, vilken? Motivera kortfattat ditt svar. ( p) i) Värdet på r är oförändrat efter att utliggaren har avlägsnats. ii) Värdet på r växer efter att utliggaren har avlägsnats.

forts tentamen i SF9 08-0-08 iii) Värdet på r minskar efter att utliggaren har avlägsnats. iv) Denna fråga kan inte besvaras utan att ha tillgång till data. Uppgift Vi jämför två DNA-sekvenser x och y med anpassningen x y = G A T A A A A A A G T T A Vi säger att vi har en match, om de två nukleotiderna i en position är desamma i de båda sekvenserna. Här är dylika match indikerade av. Vi antar att nukleotiderna i x och y är slumpässigt valda och oberoende av varandra så att sannolikheten för en match är /4 på var och en av de 5 positionerna. Vi antar att längderna (=5) på x och y är givna på förhand. a) Låt X = antalet match i passning av två sekvenser av längd 5. En av följande utsagor i)-v) är sann, vilken? ( p) i) X Poi(/4). ii) X Ge(/4). iii) X Bin(5, /4). iv) X N B(5, /4). v) X U(,..., 5). b) Anta att vi gjorde passningen av två DNA-sekvenser med förlängning av sekvenserna under i övrigt oförändrade antaganden tills vi får 5 match. Låt X = antalet positioner utan match, när vi fått 5 match. En av följande utsagor i)-v) är sann, vilken? ( p) i) X Poi(/4). ii) X Ge(/4). iii) X Bin(5, /4). iv) X N B(5, /4). v) X U(,..., 5). G T G T T T Uppgift 3 Hardy-Weinbergs lag eller Hardy-Weinbergs jämvikt (HWE) för allelfrekvenser i en population kräver ett antal förutsättningar för att gälla. En av följande i)-vi) ingår INTE bland förutsättningarna för HWE, vilken? i) en mycket stor population. ii) inga mutationer av alleler. iii) ingen migration in i eller ut ur populationen.

forts tentamen i SF9 08-0-08 3 iv) genetisk drift, d.v.s. ändringar i de relativa allelfrekvenserna inträffar slumpmässigt. v) ingen selektion bland genotyperna (d.v.s. ingen skillnad i reproduktionsförmåga mellan individerna). vi) parningen är slumpmässig (random mating). (4 p) Uppgift 4 År 0 godkände läkemedelsmyndigheten FDA i USA ett första test kit för HIV, OraQuick In-Home HIV Test, för privat bruk. OraQuick accepterades tack vare en undersökning, där 440 vuxna, som tillhörde en riskgrupp, testades med OraQuick. Dessa individer kände inte till, huruvida de var infekterade eller inte. Det sanna tillståndet på HIV-infektion (D+ = infektion) eller inte (D ) kontrollerades sedan för var och en av dessa individer med flera andra medicinska undersökningar. Nedan har vi resultaten från denna undersökning. T + betyder att OraQuick gav resultatet att HIV-infektion föreligger, och T att HIV-infektion inte föreligger enligt OraQuick. D+ D T + TP = 05 FP= T FN = 8 TN = 496 a) En av följande utsagor i)-iv) är sann, vilken? ( p) i) OraQuicks Sensitivity = 0.9875. ii) OraQuicks Sensitivity = 0.9998. iii) OraQuicks Sensitivity = 0.99. iv) OraQuicks Sensitivity = 0.950. b) En av följande utsagor i)-iv) är sann, vilken? ( p) i) OraQuicks Specificity = 0.9875. ii) OraQuicks Specificity = 0.9998. iii) OraQuicks Specificity = 0.99. iv) OraQuicks Specificity = 0.950. c) På basis av tabellen ovan räknar vi att den relativa frekvensen för HIV, P (D+), i denna högriskgrupp är = 0.05. Du får ta detta som givet. Vi har att PPV = positive predictive value =P (D + T +). En av följande utsagor i)-iv) är sann, vilken? ( p) i) OraQuicks PPV = 0.9500. ii) OraQuicks PPV = 0.9906. iii) OraQuicks PPV = 0.9650.

forts tentamen i SF9 08-0-08 4 iv) OraQuicks PPV = 0.9700 Uppgift 5 I kvalitetskontroll (Q) vid kundanpassad (eller just-in-time) produktion behandlas ett mätvärde X av en producerad enhet så att man först subtraherar produktionsprocessens medelvärde från X och dividerar skillnaden med standardavvikelsen. Resultatet kallas i Q ett Z-värde. Vi antar att Z N (0, ). Vi säger att en producerad enhet är systemiskt avvikande, om Z >.5758. De mot olika producerade enheter svarande Z -värdena antas vara oberoende av varandra. a) Beräkna sannolikheten p c = P ( Z >.5758). ( p) b) Låt nu produktionen löpa och sätt Y = antalet kvalitetsgranskade enheter, när den första systemiskt avvikande enheten uppträder, den första avvikande enheten medräknad. M.a.o. antar Y värdena,, 3,.... Vilken fördelning har Y? Lägg märke till att p c ur a) skall ingå som en statistisk parameter i denna fördelning. ( p) c) Beräkna sannolikheten P (Y 3). Ifall Du inte löst del a) av denna uppgift får Du använda (det felaktiga) värdet p c = 0.05. ( p) Uppgift 6 En bakteriofag är ett virus som infekterar bakterier. En mikrobiolog studerar en bakterieart och frågar sig hur antalet infektioner med en viss typ av bakteriofager fördelar sig statistiskt. Hen odlar ett antal bakterieodlingar och räknar antalet infekterade bakterier per odling. På basis av sina data presenterar hen följande empiriska sannolikhetsfunktion för X= antalet infektioner per odling. Antal infektioner per odling 0 3 4 5 Sannolikhet 0.4 0 0 0. 0.3 0. a) Beräkna koefficienten V MR = V ar(x) E(X) utifrån denna sannolikhetsfunktion. ( p) b) Om bakteriofagerna angriper bakterierna slumpmässigt, så är en rimlig modell för X en Poissonfördelning, m.a.o., X Poi(λ). Jämför resultatet i a) med VMR för Poi(λ). Verkar bakteriofagerna agera slumpmässigt enligt Din bedömning? Vilken nollhypotes och mothypotes testas här? Motivering av svaret förväntas. Varför görs det här inga konfidensintervall för VMR? Vilken statistisk metod skulle kunna ge ett konfidensintervall för VMR? (3 p) j.f.r. Lars Sörqvist: Ständiga förbättringar. En bok om resultatorienterat förbättringsarbete, verksamhetsutveckling och Sex Sigma. Studentlitteratur 004

forts tentamen i SF9 08-0-08 5 Uppgift 7 Man vill undersöka halten av kvartsdamm (mg/m 3 ) i luften på en arbetsplats. Man antar att mätningarna är fördelade enligt N(µ, σ ). Vi gör fem oberoende mätningar och får x = 0.086, x = 0., x 3 = 0.079, x 4 = 0.09, x 5 = 0.085. a) Gör ett tvåsidigt 95% konfidensintervall för µ. ( p) b) Ett svenskt hygieniskt gränsvärde för respirabelt kvartsdamm är 0. mg/m 3. Vi vill avgöra om det finns anledning till oro på basis av data ovan. Vi tar nollhypotesen Mothypotesen är H o : µ = 0. H a : µ < 0. Avgör på signifikansnivån % om halten av kvartsdamm på denna arbetsplats i genomsnitt ligger under gränsvärdet. Om konfidensintervallet i a) användes här, vilken slutsats skulle man dra?. ( p) Uppgift 8 Ett team av elektrokemister gör mätningar av ph-värdet för en kommersiell läskdryck med två olika ph -mätare (egentligen ph-array sensorer). Ingen av dessa ph-mätare har ett systematiskt fel. DATA: ph-mätare producerar mätdata x,..., x n med mätresultat har som standardavvikelse σ och ph-mätare ger data y,..., y n med standardavvikelse σ. För skattning av ph-värdet för drycken bildas x = n (x +... + x n ) och ȳ = n (y +... + y n ) och dessa kombineras (data fusion på engelska) genom µ obs = c x + c ȳ, där c och c är konstanter. MODELL: Låt x,..., x n vara respektive utfall av oberoende X i med E(X i ) = µ och D(X i ) = σ för i =,..., n, samt att y,..., y n är respektive utfall av oberoende Y i med E(Y i ) = µ och D(Y i ) = σ. Då tar vi µ = c X + c Ȳ, där X = (X +... + X n ) n Då är µ obs ett utfall av µ. Ȳ = n (Y +... + Y n ). Yi-Hung Liao & Jung-huan ho: omparison of ph Data Measured with a ph Sensor Array Using Different Data Fusion Methods. Sensors (Basel). 0; (9): 098 09.

forts tentamen i SF9 08-0-08 6 a) Beräkna E( µ) = E(c X + c Ȳ ). Hur bör konstanterna c och c väljas så att E( µ) = µ? ( p) b) Beräkna V ar( µ) = V ar(c X + ( c )Ȳ ). Hur bör konstanten c väljas så att V ar( µ) minimeras? ( p) Lycka till!

Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF9 STATISTIK FÖR BIOTEKNIK. Måndag den åttonde januari 08 4:00-9:00. Uppgift a) iii) r xy =, om sambandet är en exakt rät linje y = x. r xy = p.g.a. att > 0. (Ett komplett svar ingår i Problem.5.6.). b) ii) Värdet på r växer efter att utliggaren har avlägsnats, ty utliggaren placerade sig under de övriga punkterna och r är positiv. Uppgift a) iii) X Bin(5, /4). b) iv) X N B(5, /4). Uppgift 3 iv) genetisk drift, d.v.s. ändringar i de relativa allelfrekvenserna inträffar slumpmässigt. Uppgift 4 D+ D T + TP = 05 FP= T FN = 8 TN = 496 a) iii) OraQuicks Sensitivity = 0.99, ty Sensitivity är = P (T + D+) = TP TP+FN. b) ii) OraQuicks Specificity = 0.9998, ty Specificity = P (T D ) = TN TN+FP c) i) OraQuicks PPV = 0.9500. ii) OraQuicks PPV = 0.9906. iii) OraQuicks PPV = 0.9650. iv) OraQuicks PPV = 0.9700

forts tentamen i SF9 08-0-08 PPV= Positivt prediktivt värde = P (D + T +) = P (T + D+)P (D+) P (T +) = 0.99 0.05/(P (T +). Här är P (T +) = P (T + D+)P (D+) + P (T + D )P (D ). Vi har P (T + D ) = /( + 496) = 0.000. Detta ger F P = F P +T N P (T +) = P (T + D+)P (D+)+P (T + D )P (D ) = 0.99 0.05+0.000 0.9975 = 0.034. Således är 0.99 0.05 P P V = 0.034 vilket är ii), bortsett från tryckfel i tentan. = 0.997, a) Vi har att b) Uppgift 5 p c = P ( Z >.5758) = P (Z.5758) + P (Z.5758) och p.g.a. symmetrin hos fördelningen för Z fås = P (Z.5758) = 0.005 = 0.0. ty.5758 = λ 0.005 enligt Tabell i Formel- och tabellsamlingen. Y = antalet kvalitetsgranskade enheter t.o.m. den första systemiskt avvikande enheten uppträder, är en Geom(p c )-fördelad stokastisk variabel, där p c = 0.0 enligt del b). c) Den betraktade händelsen Y 3 är i själva verket lika med händelsen att få först två icke-systemiskt avvikande Z-värden efter varandra: P (Y 3) = ( p c ) = 0.99 0.98. Om vi vill checka detta mer omständligt med utnyttjande av sannolikhetsfunktionen för ffg(p), kan vi observera att P (Y 3) = P (Y ). Eftersom p Y (k) = ( p c ) k p c, med k =,,..., har vi att P (Y 3) = p Y (k) = k= ( p c ) k p c k= = p c + ( p c )p c. Således P (Y 3) = P (Y ) = p c ( p c )p c = p c + p c = ( p c ). P (Y 3) = 0.98.

forts tentamen i SF9 08-0-08 3 Uppgift 6 a) Från tabellen E(X) = 0 0.5 + 0 + 0 + 3 0. + 4 0.3 + 5 0. =.3. E(X ) = 0 0.5 + 0 + 0 + 3 0. + 4 0.3 + 5 0. = 9.. Således är Var(X) = E(X ) E(X) = 9..3 = 3.8. Detta ger VMR(=Variance -to - Mean -Ratio) som VMR = 3.8/.3.66 b) Om X Poi(λ), så fås enligt formelsamlingen V MR = λ λ med VMR för Poi(λ). Vi väljer nollhypotesen =. Jämför resultatet i a) och mothypotesen H o : VMR= H a : VMR, ty nollhypotesen svarar mot Poissonfördelningen. Vi har teststatistikan Var(X) E(X). Observera att denna kvot är en statistika, ty dess numeriska värde bestäms utifrån data via den empiriska sannolikhetsfunktionen. Det finns inga konfidensintervall här, ty ingen levande eller bortgången statistiker har framställt någon exakt eller ens en analytiskt härledd approximativ fördelning för teststatistikan Var(X). Det observerade värdet =.66 på VMR är rätt långt ifrån värdet E(X) =, således verkar det enligt en rimlig bedömning som att bakteriofagerna inte agerar slumpmässigt. Bootstrap-metoden skulle kunna ge ett approximativt konfidensintervall för VMR och en hypotesprövning. Uppgift 7 a) För ett tvåsidigt 95% konfidensintervall för µ behöver vi x = 0.0908, s x = 0.07. Vi har från tabellsamlingen t 0.05 (4) =.78. Dessa ger I µ = x ± t 0.05 (4)s x / 5 = 0.0908 ±.78 0.07/ 5 = [0.07507, 0.066]

forts tentamen i SF9 08-0-08 4 b) För och mothypotesen H o : µ = 0. H a : µ < 0. räknar vi ett ensidigt konfidensintervall för µ. Enligt kursens formelsamling bildar vi den t-fördelade teststatistikan t = x 0. s x / 5 t(5 ) = t(4). Vi har från uppgiften att x = 0.0908 och s x = 0.08. t = x 0. s x / 5 = 0.0908 0. 0.07/ 5 =.678. Det ensidiga kritiska området ges av t 0.0 (4) = 3.75. Vi ser att t =.678 > 3.65, och nollhypotesen förkastas inte på signifikansnivån 0.0. Det ensidiga konfidensintervallet är I µ =], 0.], och 0. ligger i intervallet. Med dessa data har man inte visat att µ ligger under gränsvärdet. Om konfidensintervallet i a) användes här, ser vi att 0. ligger i I µ och nollhypotesen kan ej förkastas på signifikansnivån 0.05 i ett tvåsidigt test. Uppgift 8 a) E( µ) = E(c X + c Ȳ )) = c E( X) + c E(Ȳ ), ty c och c är inte stokastiska variabler. Enligt räknereglerna fås E( X) = n (E(X ) +... + E(X n )) = n n µ = µ. På samma sätt fås Detta innebär att E(Ȳ ) = µ. E( µ) = c µ + c µ = (c + c )µ. Om vi alltså tar c + c =, så gäller E( µ) = µ. c + c =. b) Utifrån a) ser vi att vi kan välja att minimera med bibehållet krav E( µ) = µ. V ar( µ) = V ar(c X + ( c )Ȳ )

forts tentamen i SF9 08-0-08 5 Oberoendet ger Men oberoendet ger V ar(c X + ( c )Ȳ ) = c V ar( X) + ( c ) V ar(ȳ ). V ar( X) = (V ar(x n ) +... + V ar(x n )) = n På samma sätt erhåller vi Detta innebär att ( σ +... + σ) = n n σ = σ n. V ar(ȳ ) = n σ. V ar( µ) = c σ + ( c ) σ = c σ + ( c + c n n n ) σ n. Om vi deriverar detta uttryck m.a.p. c fås d V ar( µ) = c σ σ + c σ dc n n n. Vi sätter och löser m.a.p. c. Vi får d dc V ar( µ) = 0, c n σ n σ + c n σ = 0 och vi kan dividera bort faktorn, så att ( c σ + ) σ = σ n n n. Detta ger Ifall n = n och σ = σ får vi vilket känns naturligt. c = c = n σ n σ + n σ c =. n σ n σ + n σ..