Lösningar till övningsuppgifterna

Save this PDF as:
 WORD  PNG  TXT  JPG

Storlek: px
Starta visningen från sidan:

Download "Lösningar till övningsuppgifterna"

Transkript

1 Lösningar till övningsuppgifterna Kapitel Population: alla väljare. Exemplet är en observationsstudie. 1.2 Populationer: Berlinare med respektive utan lungcancer. Exemplet är en observationsstudie. 1.3 Population: alla Majroveplantor med respektive dos. Exemplet är ett experiment. Kapitel a b. (n +1)/4 =6.5 Q 1 =0.5( ) = 45 2(n +1)/4 =13 Q 2 =65 3(n +1)/4 =19.5 Q 3 =0.5( ) = Planthöjd P c. x = 25 x i /25 = 1556/

2 f 2 s 2 P =( 25 x 2 i nx2 )/24 = ( (62.24) 2 )/ s = a. x f x P b. x = 9 f i x i /30 = 61/30 = 2.03 barn/familj. c. s 2 = 1 P fi x 2 i (P f i x 2 i ) = = Gränser f Bredd Höjd /5= /5= /10= C2 5 Kum. antal C1 Histogram Antal anställda Summakurva 20

3 f Lösningar till övningsuppgifterna C2 10 C C1 a. Histogram 20 x b. Summakurva 2.5 a. Två förslag till stam-blad-diagram, med olika stammar, är: Stem-and-Leaf Display: Vattenförbrukning 30 Stem-and-leaf of Vattenförbrukning N = 30 Leaf Unit = (6) Stem-and-Leaf Display: Vattenförbrukning Stem-and-leaf of Vattenförbrukning N = 30 Leaf Unit = (8) b. Förslag till klassindelning och histogram: gränser klassmitt antal hushåll Klassmitt 2.6 C, D, B, A 2.7 a. x = 173. b.s =1.05, c. medianen=173.25, d. R = x max x min = a. Md A < x A, Md B > x B, Md C = x C, Md D = x D. b. x B > x C = x D > x A c. s 2 D >s2 A = s2 B >s2 C. 2.9 a. Ålder är en kontinuerlig variabel.

4 4 Histogram of Ålder b Ålder 2.10 a. Ett stam-blad-diagram är t ex: 65 Stem-and-Leaf Display: Antal blommor Stem-and-leaf of Antal blommor N = 35 Leaf Unit = (11) b. Från data beräknas Q 2 =48, Q 1 =44och Q 3 =54. Detta ger följande lådagram: 60 Antal a. x = b. Md =18c. s 2 =4.15 d. och e.: Se figurer. För att rita ett lådagram behövs Q 1 =16.3, Q 2 =18och Q 3 =18.6.

5 Lösningar till övningsuppgifterna C Freuency C Från data (som ges i stam-blad-diagrammet) beräknas: a. x = b. s 2 = c. För lådagrammet behövs Q 1 =45.00, Q 2 =58.00 och Q 3 = Boxplot of Stress a. Notera att klasserna är olika breda; stapelns area skall vara proportionell mot antalet. Vi beräknar höjden på varje stapel: Antal djur Abs gränser f klassbredd h = f/klassbredd

6 b. Diagrammet ii a. x = b.s 2 = c. För rödhakarna är Min =10, Q 1 =57.5, Q 2 =74.5, Q 3 = Boxplottenär: Rödhakar Turturduvor 2.15 Den procentuella blodgruppsfördelningen bland magsårspatienter och i kontrollgruppen är som följer: Blodgrupp O A B AB Totalt Magsårspatienter Kontrollgrupp Det förefaller som om blodgrupp O är vanligare, och blodgrupp A är ovanligare bland magsårspatienterna än i kontrollgruppen. Vi återkommer till dessa data senare (Exempel 9.8) för att undersöka om slumpen kan ha orsakat denna skillnad a. En plot av sambandet mellan de två idrottgrenarna:

7 Lösningar till övningsuppgifterna Längdhopp Löpning 100 m b. Beräkningarna sammanfattas i följande tabell: x y x 2 y 2 xy Summa r xy = Korrelationen är negativ: de som springer fort (=på kort tid) hoppar ofta långt a. En plot av sambandet mellan ålder och blodtryck är:

8 Blodtryck Ålder b. Regressionsekvationen är y = x. c. Korrelationen är r xy = Kapitel Beteckningar: G = frukten är grön S = frukten är slät. a. P (G S) =P (G)+P (S) P (G S) = = b. P (G S) =P (G S)/P (S) =0.20/0.25 = c. Nej ty (t ex) P (G) =0.60 6= 0.80 = P (G S). 3.2 Beteckningar: G = fröet gror ; R = fröet är ett ringblomsfrö. P (G R) = 0.90 ger P (G R) =P (G R) P (R) = =0.54. Sannolikhetstabellen är G G R R a. P (R G) = 0.54/0.80 = b. P (G R) = 0.26/0.40 = Vi betecknar de två typerna av fel med F 1 respektive F 2. Sannolikhetstabellen är F 1 F 1 F F

9 Lösningar till övningsuppgifterna 9 a. P (F 1 F 2 )= b. P F 1 F 2 = c. Exakt ett fel innebär F 1 F 2 eller F2 F 1. Sannolikheten är = Vi betecknar övermogna med Ö och stötskadade med S. Sannolikhetstabellen är Ö Ö S S a. P ³Ö S =0.93. b.p ³Ö S = a. P F =0.45.b.P E F =0.25.c.P E F = d.P (E F )= A A A A A A B B B B B B a. b. c. 3.7 Vi betecknar knölangrepp med K och blastangrepp med B. Sannolikhetstabellen är B B K K a. P B K =0.78. b.p (K B) =0.80. c.p (B K) = a. P D N innebär personen har difteri och provet är positivt. b. P (D) =0.05. c.p N D =0.80. d.nej,eftersomtexp (N D) = = = P (N) P (D). 3.9 Sannolikhetstabellen är 1 2 G G

10 10 a. P (1) = b.p (1 G) = c.p (1 G) = Sannolikhetstabellen är E E M M a. P (E M) = P (E M) P (M) = = % av männen har egenskapen. b. P (M) =0.5 vilket är skilt från P (M E) =0.75, alltsåharviinteoberoende a. De tänkbara utfallen är: Första lotten Andra lotten Utfall e i P (e i ) 2 V V VV e = 2 90 V V V 2 V e = V V V V 8 e = V V V V e = /90 = 1.00 b. Händelsen B= Vinstpåförstalotten ={e 1 e 2 } där e 1 och e 2 är varandra uteslutande. Alltså: P (B) =2/ /90 = 18/90 = c. Händelsen C= Vinst på andra lotten ={e 1 e 3 }, alltså: P (C) =2/ /90 = De olika sannolikheterna kan sammanfattas så här: Verkligen: Frisk F Verkligen: Sjuk F Diagnos: Frisk D Diagnos: Sjuk D a. P( F D) = P ( F D) = P ( D) = 0.96 (Även ur texten: Fyra procent av kvinnorna som opererats för bröstcancer egentligen var friska ). b. P ( F )= c. P (D F )= P (D F ) = P ( F ) = % av bröstcancerfallen upptäcks alltså inte Svaret på frågan är något förvånande; de flesta svarar nog, utan att tänka efter, att sannolikheten är 0.5. Men det är den inte!

11 Lösningar till övningsuppgifterna 11 De olika tänkbara sammansättningarna av tvåbarnsfamiljer är: Symbol Sammansättning Sannolikhet A pp: två pojkar 0.25 B pf: först p, sedan f 0.25 C fp: först f, sedan p 0.25 D ff: tvåflickor 0.25 Vi vet att familjen inte har två flickor, vi kan alltså utesluta fallet D. Med hjälp definitionen av betingad sannolikhet kan vi då säga: P (andra barnet är en pojke) =P (A D) = = a. Sensitiviteten = P (+ S) = b. Positive predictive value = P (S +) = 0.6. c.prevalensen=p (S) =0.08. Kapitel a. f(9) = 1/12. b.p (4 X 8) = 7/12; P (X 8) = 1/4. c.e(x) = 63/12; Var(X) = 723/ a. x f(x) y 1/x f(x) x b. E(X) = P x f (x) =1.9. Var(X) = P x 2 f (x) (E (X)) 2 =5.49. c. E(Y )=2.45. Var(Y )= d. P (Y >1) = 0.8. e. E( 1 X )=P 1 xf(x) = a. P f(x) =1om och endast om c( )=1dvsc =1/30. Det ger att f(1) = 1/30, f(2) = 4/30, f(3) = 9/30 och f(4) = 16/30. b. P (X =2)=f(2) = 4/30. P (X 2) = f(2) + f(3) + f(4) = 29/30. P (X 2) = f(1) + f(2) = 5/30. P (1 <X 3) = f(2) + f(3) = 13/30. c. E(X) = P x f(x) =( )/30 = 10/3.

12 12 E(X 2 )= P x 2 f(x) = ( )/30 = 354/30 vilket ger Var(X) = 354/30 (10/3) 2 =31/ Vi använder binomialfördelningen: X Bin(10, 0.6) a. P (X 6) = F (6) = b. P (X 8) = 1 F (7) = c. E(X) = 6.0 och Var(X) = X = antalet defekta bland de nio, vilket följer en binomialfördelning, ty frukterna antas vara defekta oberoende av varandra och hela tiden med sannolikheten Alltså: X Bin(9, 0.10). a. P (X =1)= 9 1 (0.10) 1 (0.90) 8 = b. P (X 3) = a. Fördelningen är en Bernoulli-fördelning: P (X =1)=p =0.7, Var(X) = p(1 p) =0.21 och P (X 0.25) = P (Y =0)=0.30. b. Fördelningen för bp är en binomialfördelning med n =4och p =0.7. µ 4 f(bp) =f(x) = 0.7 x x x bp f(bp) Eftersom bp Bin(4, 0.7) gäller E(bp) = 0.7 och Var(bp) = 0.21/4 = P (bp 0.25) = a. p =0.50/0.75 = 2/ (Notera att de möss som har genkombinationen YY inte överlever). b. Detta är en binomialfördelning med p =0.67 och n =3.Viberäknar sannolikheterna som P (X = x) = n x p x (1 p) n x vilket ger följande tabell: x P(X = x) c. För en binomialfördelning gäller att E(X) =np och V ar(x) =np(1 p) varför E(X) = = 2 och Var(X) = =

13 Lösningar till övningsuppgifterna X är Poissonfördelad med λ =5 2=10.Detger: a. P (X =0)= b. P (X 16) = c. P (X >19) = Egentligen gäller: X Bin(n = 40000, p=1/20000). Mendån är stort och p är litet kan vi approximera med en Poissonfördelning med medelvärde λ = np =2.Detger: a. P (X =0)= b. P (X 1) = a. Tillämpning av Poissonfördelningen med λ =1ger P (X 1) = och P (X =1)= b. Tillämpning av Poissonfördelningen med λ =10ger P (X = 10) = De sökta sannolikheterna ges i följande tabell. Där ges också (vilket vi inte frågade om!) de förväntade antalen, som beräknats som (sannolikhet) (antal rutor), där antalet rutor är 576. Detta är den fördelning man skulle vänta sig om data är Poissonfördelade. Dessutom ger vi de i verkligheten observerade antalen. Som synes stämmer verkligheten ganska bra in på en Poissonfördelning, vilket antyder att träffbilden är slumpmässig. Tyskarna kunde inte sikta på enstaka objekt i London. x f(x) Förv. antal Obs. antal > Detta är en tillämpning av den hypergeometriska fördelningen. Vår fördelning har N =12, M =3och n =4.ViberäknarP (X =0)= (3 0)( 9 4) = ( 12 4 ) P (X 1) = 1 P (X =0)= = a b c d e f g h i a b c d e f E (Y )=0.25. Var(Y )=0.56. P (Y 0.20) = E (Y )=1. Var(Y )=1. P (Y <2) =

14 a b c d e. E (Y 1 )=20, Var(Y 1 )=16, E (Y 2 )=10 Var(Y 2 )=4, E (Y 3 )=26, Var(Y 3 )= a. E(X 0.5Y + 20) = =26. b. Var(X 0.5Y + 20) = ( 0.5) ( 0.5) ( 0.5) = c. P (X 0.5Y +20> 30) = P (Z > )=P (Z >1.23) = 1 P (Z < 1.23) = a. E (W )=24, Var(W )=36. b. P (21 W 36) = a. E (W 1 )=2, Var(W 1 )=19. b. E (W 2 )=19, Var(W 2 )= a. E (X Y )= 5. Var(X Y )=25. b. P (X Y>0) = c. E (3X 2Y )=5, Var(3X 2Y ) = 180. d. P ((3X 2Y ) > 18.42) = e. Eftersom X och Y är oberoende är deras korrelation ρ lika med a. Om X och Y är oberoende gäller: E(U 1 )= = 24 och Var(U 1 )= =9. P (U 1 > 20) = P (Z > ) = P (Z > 1.33) = E(W 1 )= ( 1) 11 = 2 och Var(W 1 )=1 2 5+( 1) 2 4=9. P (W 1 < 0) = P (Z < )=P (Z < 0.67) = b. Om kovariansen mellan X och Y är 3 gäller: E(U 2 )= = 24 och Var(U 2 )= =15. P (U 2 > 20) = P (Z > )=P (Z > 1.03) = E(W 2 )=1 13+( 1) 11 = 2 och Var(W 2 )=1 2 5+( 1) ( 1) 3 =3. P (W 2 < 0) = P (Z < )=P (Z < 1.16) = c. Om kovariansen mellan X och Y är 3 gäller: E(U 3 )= = 24 och Var(U 3 )= ( 3) = 3. P (U 3 > 20) = P (Z > )=P (Z > 2.31) = E(W 3 )= ( 1) 11 = 2. Var(W 3 )=1 2 5+( 1) ( 1) ( 3) = 15.

15 Lösningar till övningsuppgifterna 15 P (W 3 < 0) = P (Z < )=P (Z < 0.52) = a. Beteckna väntetiden med X. Det gäller (enligt texten) att µ = E(X) = 1 λ = =5. Man får i genomsnitt vänta 5 minuter. b. P (X <5) = F (5) = 1 e λx =1 e =1 e 1 =0.63. Sannolikheten att man får vänta mindre än 5 minuter är ca c. Medianen är det värde ex som är sådant att P (X <ex) =0.5, dvsdetskall gälla att F (ex) =0.5. Visätterindetta: 1 e 0.2 x =0.5 ger e 0.2 x =0.5 dvs 0.2x =ln(0.5) så ex = =3.47. Medianväntetiden är cirka 3.47 minuter Fördelningen inom missbrukargruppen resp. normalgruppen framgår av följande bild. Man klassificerar en person som missbrukare om X> a. Sensitiviteten=P (X > 3.5 givet att personen tillhör missbrukargruppen) = P (Z > ) = P (Z > 1.5) = b. Specificiteten=P (X < 3.5 givet att personen tillhör normalgruppen) = P (Z < )=P (Z <2) = c. Om vi utesluter personer från normalgruppen påverkas inte missbrukargruppen. Sensitiviteten ändras alltså inte. Om medelvärdet i normalgruppen blir lägre (genom att personer med högt värde på X utesluts) kommer normalgruppens medelvärde att ligga ännu längre från gränsen 3.5. Då kommer sannolikheten att normala blir rätt klassificerade att öka, d v s specificiteten ökar a. P χ =0.95. b. P χ = = a.p (t 2.015) = 0.95.

16 16 b. P ( t 4.032) = = a. P (F 6, ) = b. P (F 6, ) = P (F 12,6 4) = Kapitel Vi betecknar X i =viktenpådeti:te ägget. Antag att X 1,X 2,..., X 100 är oberoende av varandra. Då gäller: P X i ) = 100 E(X i ) = = E( Var( 100 P X i )=100 Var(X i ) = = Centrala gränsvärdesatsen ger att 100 P X i N(5000,σ 2 = 2500). 1 P ( 100 P X i < 5100) = P (Z <( )/ 2500) = P (Z <2) = Alternativt: Centrala gränsvärdessatsen ger att X N(50,σ 2 = ). P ( P X i < 5100) = P ( X <51) = P (Z < )=P (Z <2) = Vi betecknar Y =diametern på en slumpvis vald platta. a. P (Y >3.0128) = P (Z >(( ) /0.01)) = P (Z >1.28) = b. För medelvärdet av 10 plattor gäller E(Ȳ )=E(Y )=3.00 och Var(Ȳ )= = dvsσ Ȳ = SE Ȳ = Det ger P (Ȳ >3.0128) = P (Z > )=P (Z >4.05) < c. X = antal plattor vilkas diameter överstiger Det gäller att X Bin(n =10,p=0.10) varav P (X 4) = F (4) = X=antal frön som gror. X Bin(n, 0.60) om fröna gror oberoende av varandra och med konstant sannolikhet p =0.60. a. n =9 P (X >6) = P (X 7) = 1 F (6) = (från binomialfördelningstabell). b. n =18P (X >12) = P (X 13) = 1 F (12) = (från binomialfördelningstabell). c. n = 180 np = 108 och n(1 p) =72så fördelningen för bp = X/n kan approximeras med en normalfördelning. P (X > 120) = P (bp > 0.667) = P (z > )=P (z >1.83) = / a. P (X <18) =

17 Lösningar till övningsuppgifterna 17 b. P ( P X i < 230) = P 2X 3Y 11 = a. P ( P X i 3120) = b. Kapaciteten måste öka med minst 57 kg. 5.7 a. P (X <90) = b. P 99 X 102 = a. P X>0 = b. P Y>0 = c. P 2X Y +1 > 0 = a. P ((3X 2Y ) > 3) = b. P 3X 2Y > 3 = Kapitel a. Vi beräknar variansen för de tre estimatorerna: i) Var(0.5 X X 2 )=0.5 2 σ2 σ = ii) Var(0.4 X X G )=0.4 2 σ2 σ =0.20. iii) Var( X 2 )= σ2 75 = Estimatorn ii) har minst varians och är alltså effektivast. Alla tre estimatorerna är unbiased. 6.2 i) Var( X 1 /3+2 X 2 /3) = = ii) Var( X 1 /2+ X 2 /2) = = iii) Var(2 X 1 /3+ X 2 /3) = = Estimatorn ii/ har minst varians och är effektivast. Alla tre är unbiased. 6.3 bµ = =20.5. Variansen för estimatorn beräknades i uppgift 5.1 till Intervallet blir bµ±z p Var(bµ) vilket för ett 95% intervall ger 20.5 ± ; 20.5 ± 0.88 med gränser [ ]. 6.4 Intervallet i uppgift 5.3 täcker värdet 20 vilket innebär att avvikelsen från 20 inte är signifikant a ± ;3.476 ± b ± ;3.476 ± c. Probvärde: P (z < )=P (z < 7.9) 0 vilket är kraftigt signifikant.

18 Fel, Fel, Rätt, Fel, Rätt, Fel, Rätt. 6.7 a. Ur data kan vi beräkna x =1.975 ochs 2 = s b. Intervallet blir µ = x ± z 2 n. Eftersom vi har 399 frihetsgrader spelar det där med t eller z ingen stor roll; för ett 95% intervall kan vi använda z = eller t =1.98. Intervallet blir ± eller ±0.109 för z = 1.96, och ±0.110 för t = Det har ingen praktisk betydelse vilket av dessa man väljer. Båda kan sammanfattas som 1.98 ± Viärtill95% säkrapåatt intervallet 1.87 till 2.09 täcker medelvärdet i populationen. c. Det finns kvinnor i landet. I genomsnitt har de (med 95% säkerhet) mellan 1.87 och 2.09 barn. Multiplicera dessa gränser med vilket ger mellan och barn. d. n = ; väljn minst lika med σ 6.8 a. Nivån 95% ger z =1.96. Man vill att n < 5. Vår bästa gissning av σ är vårt gamla s = Vifår n < 5 dvsn> ; 2 n> Väljn>329. (Om man räknar med z 2 får man i stället n>342). Eftersom vår gissning inte är så säker kanske man för säkerhets skull väljer n = 350. b. Vi har nu z =2.576 (99% intervall). Vi vill att s n < 0.1 µ. Vårbästa gissning av µ är vårt gamla x = Det skall alltså gälla att n < vilket ger n > 983. (Eftersom vi gissat σ är nog runt 1000 ett vettigt svar.) 6.9 a. Konfidensintervallet beräknas som <σ 2 < ; 0.09 < σ 2 < b. H 0 : σ 2 =0.175 mot σ 2 =0.175 testas med χ 2 = (n 1)s2 σ = = med (n 1) = 20 frihetsgrader. Gränser för ett test på 5%-nivån är resp Vårt värde på χ 2 ligger innanför dessa gränser så resultatet är inte signifikant; H 0 kan inte förkastas Testets signifikansnivå är 0.01 d v s 1%. Detta är sannoliheten att en person som är nätt och jämnt oskyldig, d v s en person som har precis nivå n 0.5, skall fällas. Alternativet 2. är alltså det riktiga a. α = P ( X < x krit givet H 0 ) P (z < x krit 125 ) /25 x krit 125 = 1.96 alltså x krit = = /25 b. Styrkan=1 β = P ( X < x krit givet H 1 )=P (z < )=P (z < 144/ ) = a. x =83 s 2 = s =15.53.

19 Lösningar till övningsuppgifterna 19 b. H 0 : µ =0 H 1 : µ 6= 0. t = = 2.68 med 5 d.f. Förkasta på 5%- 6 nivån om t > Resultatet är signifikant; H 0 förkastas. Det förefaller som om barn till alkoholiserade mödrar i genomsnitt har lägre IQ än 100. c. Nej, detta är inte ett experiment. Kvinnor har inte slumpmässigt utvalts till att bli alkoholister; det kan finnas andra faktorer som påverkar kvinnor att bli alkoholister, och som också påverkar barnens IQ. (Moderns IQ?) Vi kan dra slutsatsen att barnen till dessa 6 mödrar som är alkoholister har lägre IQ, men vi kan inte med säkerhet sluta oss till att detta beror på moderns alkoholbruk. Det framgår inte av uppgiften om de 6 mödrarna var ett slumpmässigt urval bland alkoholiserade mödrar Den sökta stickprovsstorleken beräknas som n> (z 1 β+z 1 α ) 2 σ 2. Här är (µ 0 µ 1 ) 2 σ 2 =15 2 = 225, z 1 α =1.645, z 1 β =1.282 och µ 0 µ 1 = = 5. Det ger n > ( )2 225 = Stickprovet bör innehålla minst 78 ( 5) 2 personer. Kapitel Vi beräknar förändringen för varje person som D=(efter) (före). Medelvärde och varians för D i stickprovet är 11 resp. 60. Ett 95% konfidensintervall 60 blir 11 ± ; 11 ± 5.54; [ ]. Intervallet täcker inte värdet 0 vilket antyder att det kan finnas en blodtryckssänkande effekt. s 7.2 a. Intervallet kan skrivas x s x k ± t 2 s n s + s2 k n s.viharflera alternativ till antal frihetsgrader: 1) Vi kan ange att frihetsgraderna är minst 33 och får tabellvärdet ) Vi har många frihetsgrader, och kan använda z = ) Vi kan använda Satterthwaites approximation som ger 61 fg och t= ± vilket ger 0.22±0.15. [ ]. Eftersom intervallet inte täcker värdet 0 verkar det inte som om raserna har samma medelvärde. (Det är inte fel att poola varianserna heller; detta skulle här ge 74 frihetsgrader). b. Oberoende inom varje ras; oberoende mellan raser; medelvärdena approximativt normalfördelade vilket de är om fördelningen inom resp ras inte är alltför sned. 7.3 a. Använd index T för Trevi, och S för Svanota. Från data kan vi beräkna x T = s T = x S =38.5 s S = Intervallet är x T x S ± t s 2 = (n T 1)s 2 T +(n S 1)s 2 S n T +n S 2 = s 2 ( 1 n T + 1 n S );

20 ± ( ); 8.2 ± 13.4; [ ] b. Intervallet täcker värdet 0. Vi kan därför inte förkasta hypotesen att skillnaden är 0. c. F =2.90 med (7;6) df. Dubbelsidigt test. Gräns (20%) ca 3.0; (10%) ca 4.2; Vi kan inte påvisa någon signifikant skillnad mellan varianserna. 7.4 Försöket är upplagt med matchning. Vi beräknar differensenmellansort A och sort B för varje fält och räknar ut medelvärde och varians för dessa differenser: d = 6 och s 2 d = A B d d a. Ett 95% konfidensintervall för µ A µ B = µ d är d ± t s 2 d n,därn =7och t har (n 1) = 6 frihetsgrader. I t-tabellen finner vi gränsen t = Vi får intervallet 6 ± dvs 6 ± 4.5. Intervallet sträcker sig från 10.5 till 1.5. Eftersom intervallet inte täcker 0 verkar det som om sort B ger högre avkastning. b. Vi skall testa H 0 : µ A µ B =0dvs µ d =0mot H 1 : µ d 6=0.Signifikansnivån väljs till Gränsen (t med 6 frihetsgrader) blir ± Vi får t = r d 0 = = Eftersom detta värde är mindre än är s 2 d n 7 resultatet signifikant och nollhypotesen förkastas; det verkar finnas en skillnad i genomsnittlig avkastning mellan sort A och sort B. c. Vi förutsätter att försöket upplagts med matchning, att värdena på d är oberoende av varandra och att d approximativt kan antas följa en normalfördelning. 7.5 a. Ur de givna data kan vi beräkna x 2 =3.02, s 2 = H 0 : µ =3; H 1 : µ>3. Hypotesen skall förkastas på 5% nivå (enkelsidigt) om t> Resultat: t = =0.30 < Vårtresultatärejsignifikant och H 0 kan ej förkastas b. Försöket är upplagt med matchning. Vi beräknar differensen mellan korna i varje par och räknar ut medelvärde och varians för dessa differenser:

21 Lösningar till övningsuppgifterna d d d = = 0.16, s 2 d = ( 0.96)2 5 6 = med 5 df Ett 95% konfidensintervall för differensen är 0.16 ± Intervallet går från 0.24 till 0.08 och täcker inte 0. Det verkar därför som om de behandlade korna ger högre proteinhalt. c. Enligt a) verkar det som om behandlade kor kan ha medelvärde 3.0, vilket skulle innebära att behandlingen inte har någon effekt. Men enligt b) har de kor i försöket som behandlats en högre proteinhalt än sina obehandlade kolleger. De olika slutsatserna beror på att de obehandlade korna i försöket råkat få en ovanligt låg proteinhalt. Det verkar som om behandlingen har effekt. 7.6 a. Först räknar vi ut förändringen i hjärtfrekvens för varje djur. Vi får 10 värden för bufflar och 8 värden för oxar. Medelvärden och standardavvikelser är: Djurslag Antal n x s Bufflar Oxar Vi kan testa om bufflar och oxar har samma medelvärde (d v s H 0 : µ B = µ O ) mot alternativet att de inte har det genom att beräkna t = = 2.64 ( ) %-gräns med ( ) = 16 d.f. är ±2.12. Vårtresultatärsignifikant och H 0 förkastas. Troligen skiljer sig djurslagen åt. b. Vi antar att förändringen i hjärtfrekvens är normalfördelad för båda djurslagen, att observationerna är oberoende inom och mellan djurslagen och att variansen för förändringen är densamma för båda djurslagen a. Hypotesen H 0 : µ 1 = µ 2 kan testas med z = = %-gränsen är ungefär 1.98 så resultatet är kraftigt signifikant. Det finns troligen skillnad mellan de två fågelkolonierna. b. Hypotesen H 0 : µ 1 = µ 2 kan testas med z = = Gräns

22 22 med 198 df är ungefär ±2; resultatet är signifikant. (Alternativt kan vi använda Satterthwaite-approximation av antalet frihetsgrader; det ger ungefär 145 frihetsgrader och samma gräns.) Det finns troligen skillnad i medelvärde mellan de två kolonierna. Probvärdet är 2 P (t < 13.4) som är nästan 0. c. Vi har konstaterat att de olika fågelkolonierna hade signifikant olika mängd protein i musklerna både före och efter häckningen. Med detta har vi inte bevisat att det är mängden protein i musklerna som påverkar häckningen; sådana slutsatser kräver andra undersökningar. 7.8 a. Vi har små stickprov. Stickproven verkar ha någorlunda likstora standardavvikelser, så vi kan med rätt gott samvete anta att populationsvarianserna är lika och beräkna en poolad varians: s 2 p = = H 0 : µ B = µ O mot H 1 : µ B 6= µ O testas med t = ( + 115) = %-gränsen för t med 28 d.f. är Vårt resultat är signifikant och H 0 kan förkastas. b. Om vi approximerar med normalfördelningen skall det gälla att n + 1 n < 0.75 varur n> = Vibörhaminst20 provplatser per jordtyp. 7.9 a. Vi använder den poolade standardavvikelse som vi fått i texten till uppgiften. (Vi utgår ifrån att man kan anta lika varianser). t har 40 d.f. och 5%-värdet är Intervallet blir x k x s ± ; ± b. Vi skall testa H 0 : µ U µ S = 0.2 mot H 1 : µ U µ S > 0.2. Testvariabeln är t = = %-gränsen (enkelsidig) med 40 d.f. är ( ) 1.684; vårt resultat är signifikant och H 0 förkastas Båda studenterna vill testa samma hypoteser. H 0 : µ A µ B 2=0mot H 1 : µ A µ B 2 > 0. Vid matchning skrivs hypoteserna H 0 : µ A µ B =2 respektive H 1 : µ A µ B > 2. Rakel har använt matchning (randomiserat blockförsök). Hon beräknar differensen d i = x Ai x Bi mellan de två djuren i varje par. Den parameter hon testar kan skrivas som µ A µ B = µ D. Dess estimator är d och dess skattade medelfel får (n 1) = 9 frihetsgrader. För att skatta medelfelet s 2 d n på detta sätt krävs att differanserna är oberoende. Testvariabeln är t = r d 2 s 2 d 10 med 9 fg. För att använda t krävs att differenserna är normalfördelade. Probvärde: P (t > 2.1) ligger mellan 2.5-5%. Resultatet är signifikant på 5%-nivån. Nollhypotesen förkastas. Troligen ger fodertillskott A i genomsnitt mer än 2 enheter högre tillväxt än fodertillskott B.

23 Lösningar till övningsuppgifterna 23 Lea använder ett fullständigt randomiserat försök. Det är samma parameter µ A µ B 2=0som Rakel men då hon på grund av försöksuppläggningen kan anta oberoende mellan och inom stickprov blir hennes estimator x A x B.Dess skattade medelfel är blir t = x A x B 2 s s2 10 r s 2 p ³ 1 n A + 1 n B med (n A +n B 2) = 18 d.f. Testvariabel med 18 fg. För att använda t krävs att observationerna är normalfördelade. Leas observerade t-värde var Här ligger probvärdet mellan 5 och 10% och resultatet är inte signifikant. (Leas försök blir inte publicerat i Animal Production.) 7.11 Biologiska variabler av denna typ kan ofta antas vara normalfördelade. Antagandet om lika varianser är rimligt. Oberoende i statistiskt hänseende mellan raser är rimligt och i texten anges att urvalet var slumpmässigt så vi antar oberoende också inom ras. s 2 = = ger medelfelet 0.059( )=0.083 med 69 fg. H 0 : µ 1 µ 2 =0testas mot H 1 : µ 1 µ 2 6=0med t 69 = = Probvärdet är 2 P (t < 3.01) < 0.01 vilket innebär ett signifikant resultat. Nollhypotesen förkastas. Troligen ger korsningarna i genomsnitt olika födelsevikt. Ett 95% konfidensintervall för µ 1 µ 2 ges av 0.25 ± Korsning2 ger med 95% säkerhet en genomsnittlig tillväxt som är mellan 0.08 och 0.42 kg större än korsning Vi förutsätter oberoende mellan och inom stickprov (fullständig randomisering). Båda stickproven antas komma från approximativt normalfördelade populationer. a. Vi testar H 0 : σ 2 F = σ2 P mot H 1 : σ 2 F 6= σ2 P med F 8,9 = = Vid dubbelsidigt test är gränsen (10%): F =3.23. H 0 kan inte förkastas. b. H 0 : µ F = µ P skall testas mot H 1 : µ F 6= µ P. Den poolade variansen är s 2 = =2.89 med 17 d.f. Resultat:t 17 = = = Gränsenärt =2.11. Vårtresultatärsignifikan och H 0 förkastas. Behandlingarna förefaller ge olika genomsnittlig skörd. c. Ett 95% konfidensintervall beräknas som 3.3 ± t ; 3.3 ± a. Vi söker ett 95% konfidensintervall baserat på 11 1=10frihetsgrader; t = Situationen är matchning. Intervallet kan skrivas d±t 2 d s n, ± Minitab skriver resultatet som Variable N Mean StDev SE Mean 95.0 % CI C1-C ( , )

PÅ UPPDRAG AV REV. 12-0 01-30. Ulf

PÅ UPPDRAG AV REV. 12-0 01-30. Ulf ULF GRANDIN, INSTITUTIONEN FÖR MILJÖANALYS, SLUU PÅ UPPDRAG AV SWEDISH ENVIRONMENTAL PROTECTION AGENCY REV. 12-0 03-01-13 01-30 Dataanalys och hypotesprövning förr statistikanvändare Ulf Grandin 2 Förord

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II G. Gripenberg Aalto-universitetet 13 februari 2015 G. Gripenberg (Aalto-universitetet) MS-A0509 Grundkurs i sannolikhetskalkyl och

Läs mer

Texas Instruments Sverige 1997 Printed in Sweden by Gumm essons Tryckerier AB

Texas Instruments Sverige 1997 Printed in Sweden by Gumm essons Tryckerier AB Förord Detta häfte innehåller ett a ntal mat ematikp roblem inom olika områden av den mat ematik som behandlas inom de olika ku rsern a på g ymnasieskolan. Vi har, i de flesta fall, inte delat upp i nnehållet

Läs mer

Räkna med variation Studiematerial i sannolikhetslära och statistisk inferens mars 2015

Räkna med variation Studiematerial i sannolikhetslära och statistisk inferens mars 2015 Räkna med variation Studiematerial i sannolikhetslära och statistisk inferens mars 2015 Innehåll 1. Beskrivning av data 2. Grundläggande sannolikhetsberäkningar 3. Fördelningar 3.1 Diskreta fördelningar

Läs mer

Marknadens effektivitet vid aktieprisfallet på ex-dagen

Marknadens effektivitet vid aktieprisfallet på ex-dagen Marknadens effektivitet vid aktieprisfallet på ex-dagen Vårterminen 2007 Författare: Handledare: Alexander Lemland Oskar Sinha Hossein Asgharian Sammanfattning Titel: Marknadens effektivitet vid aktieprisfallet

Läs mer

Vad påverkar priset på en bostadsrätt?

Vad påverkar priset på en bostadsrätt? Företagsekonomiska institutionen STOCKHOLMS UNIVERSITET Kandidatuppsats 10 poäng HT 2005 Vad påverkar priset på en bostadsrätt? Författare: Niclas Roll Handledare: Claes Hägg Sammanfattning Fastighetsmarknaden

Läs mer

Räknefärdighet och finansiell förmåga 1 Preliminära resultat från Finansinspektionens konsumentundersökning 2010

Räknefärdighet och finansiell förmåga 1 Preliminära resultat från Finansinspektionens konsumentundersökning 2010 Räknefärdighet och finansiell förmåga 1 Preliminära resultat från Finansinspektionens konsumentundersökning 2010 Johan Almenberg 2 och Olof Widmark 3 24 januari 2011 Sammanfattning. Vi redogör för några

Läs mer

Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2011?

Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2011? Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2011? Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2011? 2 Medlingsinstitutet Medlingsinstitutet

Läs mer

Om Marknadens Beteende på Ex-Dagen

Om Marknadens Beteende på Ex-Dagen Företagsekonomiska institutionen STOCKHOLMS UNIVERSITET Magisteruppsats 10 poäng VT 2006 Om Marknadens Beteende på Ex-Dagen Kan ex-dagseffekten förklaras av skatterelaterad teori? Författare: Martin Berggren

Läs mer

SKOLVERKETS AKTUELLA ANALYSER 2004. Mer kunskap för pengarna En analys av resurser och resultat i grundskolan

SKOLVERKETS AKTUELLA ANALYSER 2004. Mer kunskap för pengarna En analys av resurser och resultat i grundskolan SKOLVERKETS AKTUELLA ANALYSER 2004 Mer kunskap för pengarna En analys av resurser och resultat i grundskolan Mer kunskap för pengarna En analys av resurser och resultat i grundskolan Mer kunskap för pengarna

Läs mer

Kortanalys. Gärningspersoners kön och ålder vid misshandel, hot, rån och sexualbrott

Kortanalys. Gärningspersoners kön och ålder vid misshandel, hot, rån och sexualbrott Kortanalys Gärningspersoners kön och ålder vid misshandel, hot, rån och sexualbrott en beskrivning utifrån misstankestatistiken och Nationella trygghetsundersökningen Gärningspersoners kön och ålder vid

Läs mer

Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2013?

Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2013? Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och män 2013? Swedish National Mediation Office Vad säger den officiella lönestatistiken om löneskillnaden mellan kvinnor och

Läs mer

Men hur trovärdig är studien egentigen?

Men hur trovärdig är studien egentigen? Men hur trovärdig är studien egentigen? Hur skakig får en utvärdering vara? Sent i våras publicerades rapporten Utvärdering av Socialtjänstens och Ideella kvinnojourers insatser för Våldsutsatta kvinnor

Läs mer

C Höstterminen 2009. Matematik. Elevhäfte KURSPROV. Elevens namn

C Höstterminen 2009. Matematik. Elevhäfte KURSPROV. Elevens namn KURSPROV Matematik C Höstterminen 2009 Prov som ska återanvändas omfattas av sekretess enligt 17 kap. 4 offentlighets- och sekretesslagen. Avsikten är att detta prov ska kunna återanvändas t o m 2015-12-31.

Läs mer

Hur fungerar arbetsmarknadspolitiken under olika konjunkturlägen?

Hur fungerar arbetsmarknadspolitiken under olika konjunkturlägen? Rapport till Finanspolitiska rådet 2010/7 Hur fungerar arbetsmarknadspolitiken under olika konjunkturlägen? Per Skedinger Institutet för Näringslivsforskning De åsikter som uttrycks i denna rapport är

Läs mer

Hur mycket släkt är släktingar?

Hur mycket släkt är släktingar? Hur mycket släkt är släktingar? En studie i den genetiska likhetens variation Examensarbete för kandidatexamen i matematik vid Göteborgs universitet Kandidatarbete inom civilingenjörsutbildningen vid Chalmers

Läs mer

Det som inte mäts finns inte

Det som inte mäts finns inte Det som inte mäts finns inte En studie av kommunala svenska grundskolors stödinsats till elever som inte klarar eller inte förväntas klara minst godkänt eller nå kunskapskraven i ett eller flera ämnen

Läs mer

Sveriges framtida befolkning 2009 2060

Sveriges framtida befolkning 2009 2060 DEMOGRAFISKA RAPPORTER 2009:1 Sveriges framtida befolkning 2009 2060 Omslagsbilden: Befolkningspyramider för 1956, 2008 och 2060 Diagrammen förekommer var för sig inne i publikationen. DEMOGRAFISKA RAPPORTER

Läs mer

Det nya högskoleprovet samband mellan provresultat och prestation i högskolan

Det nya högskoleprovet samband mellan provresultat och prestation i högskolan Institutionen för tillämpad utbildningsvetenskap Beteendevetenskapliga mätningar Högskoleprovet RAPPORT 2014-12-19 Det nya högskoleprovet samband mellan provresultat och prestation i högskolan Per-Erik

Läs mer

Har den växande friskolesektorn varit bra för elevernas utbildningsresultat på kort och lång sikt?

Har den växande friskolesektorn varit bra för elevernas utbildningsresultat på kort och lång sikt? Har den växande friskolesektorn varit bra för elevernas utbildningsresultat på kort och lång sikt? Anders Böhlmark Mikael Lindahl RAPPORT 2012:17 Institutet för arbetsmarknads- och utbildningspolitisk

Läs mer

Hur kan förskolan förbättra barns psykiska hälsa?

Hur kan förskolan förbättra barns psykiska hälsa? Hur kan förskolan förbättra barns psykiska hälsa? EN KUNSKAPSÖVERSIKT AV SVEN BREMBERG Förord Barns hälsoutveckling i Sverige är i huvudsak positiv. De flesta barn växer upp under goda materiella förhållanden

Läs mer

Utvärdering av mätosäkerhet vid kalibrering EA-4/02 M:2013 Svensk översättning

Utvärdering av mätosäkerhet vid kalibrering EA-4/02 M:2013 Svensk översättning SWEDAC DOC 04:1 Datum 014-05-19 ISSN 1400-6138 Utvärdering av mätosäkerhet vid kalibrering EA-4/0 M:013 Svensk översättning SYFTE Syftet med detta dokument är att harmonisera utvärdering av mätosäkerhet

Läs mer

Äp9Bi 2013. Innehåll... Sid nr

Äp9Bi 2013. Innehåll... Sid nr Innehåll... Sid nr Inledning... 2 Bedömningsanvisning Delprov A... 4 Bedömningsanvisning Delprov B... 20 Kopieringsunderlag för resultatsammanställning... 24 Innehållsmatris... 25 Bedömningsmatris... 26

Läs mer

kulturrådets skriftserie 2008:4 kultur en del av ett hälsosamt liv? kulturrådet

kulturrådets skriftserie 2008:4 kultur en del av ett hälsosamt liv? kulturrådet kulturrådets skriftserie 2008:4 kultur en del av ett hälsosamt liv? kulturrådet Statens kulturråd, Box 27215, 102 53 Stockholm Besök: Borgvägen 1 5 Tel: 08 519 264 00 Fax: 08 519 264 99 Webbplats: www.kulturradet.se

Läs mer

Vem vill veta vad för att välja?

Vem vill veta vad för att välja? Rapport 2014:1 Vem vill veta vad för att välja? Om vilken information olika grupper av personer vill ha för att välja vårdcentral Citera gärna ur Vårdanalys rapporter, men ange alltid källa. Rapporten

Läs mer

Utvärdering av lärplattor i undervisningen i Gislaveds grundskolor. Jan Hylén

Utvärdering av lärplattor i undervisningen i Gislaveds grundskolor. Jan Hylén Utvärdering av lärplattor i undervisningen i Gislaveds grundskolor Jan Hylén Innehåll 1. Sammanfattning...2 2. Bakgrund...4 3. Genomförande av undersökningen...4 4. Hur fungerar lärplattorna i skolans

Läs mer

Välj välfärden vi har råd!

Välj välfärden vi har råd! Välj välfärden vi har råd! Välj välfärden - vi har råd! Rapport av Torbjörn Dalin och Thomas Berglund Kommunal 2014 Innehållsförteckning Inledning... 4 Den framtida befolkningsutvecklingen... 6 Tidigare

Läs mer

Linnæus University studies in policing #002-2011. Peter Lindström. Peter Lindström Fler poliser - färre brott?

Linnæus University studies in policing #002-2011. Peter Lindström. Peter Lindström Fler poliser - färre brott? Docent Peter Lindström är kriminolog och har i ett kvarts sekel arbetat med forsknings- och utvecklingsverksamhet inom det kriminalpolitiska området. De senaste två åren vid Polismyndigheten i Stockholms

Läs mer

Konsten att strula till ett liv Om ungdomars irrvägar mellan skola och arbete. Stefan Fölster, Johan Kreicbergs, Malin Sahlén Juli 2011

Konsten att strula till ett liv Om ungdomars irrvägar mellan skola och arbete. Stefan Fölster, Johan Kreicbergs, Malin Sahlén Juli 2011 Konsten att strula till ett liv Om ungdomars irrvägar mellan skola och arbete Stefan Fölster, Johan Kreicbergs, Malin Sahlén Juli 2011 Sammanfattning 1 Sammanfattning En vanlig uppfattning är att svenska

Läs mer

Nationalekonomiska Institutionen HT 2012 Mikroekonomi C. Skatter och subventioners effekter pa den svenska konsumtionen av djupfrysta fa rdigra tter

Nationalekonomiska Institutionen HT 2012 Mikroekonomi C. Skatter och subventioners effekter pa den svenska konsumtionen av djupfrysta fa rdigra tter LUND UNIVERSITET EXAMENARBETE Nationalekonomiska Institutionen HT 2012 Mikroekonomi C Skatter och subventioners effekter pa den svenska konsumtionen av djupfrysta fa rdigra tter Författare: Charlie Lundgren

Läs mer