STOCKHOLMS UNIVERSITET MS1130 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 16 januari 2004 Tentamen för kursen Statististik för naturvetare 16 januari 2004 9 14 Examinator: Louise af Klintberg, tel. 16 45 71, lusse@matematik.su.se Tillåtna hjälpmedel: Levine, Ramsey & Smidt: Applied Statistics for Engeneers and Scientists, egna anteckningar samt valfri miniräknare. Återlämning: Efter överenskommelse. På begäran skickas resultatet per Epost. För betyget godkänt krävs minst åtta poäng inklusive maximalt fyra bonuspoäng från inlämningsuppgifterna. För betyget väl godkänt krävs minst åtta poäng av de totalt tolv som är möjligt att få på skrivningen. Om lösningar för både alternativ I och II på uppgift 5 lämnas in, tillgodoräknas endast det alternativ som ger mest poäng. Uppgift 1 Sjukhuset i Alsterholm har under lång tid haft samma antal sängplatser och istort sett full beläggning under många år. Varje vecka har man i sjukhusets kök noterat åtgången av olika specerier. Nu vill man veta hur stort medelvärdet av åtgången av vetemjöl är för samtliga bokförda veckor, men eftersom det skulle bli för krävande att gå igenom alla listor nöjer man sig med att på måfå plockautvärdena för tjugo veckor. Dessa data visar ett medelvärde x på 12.3 kg och en standardavvikelse s på 1.8 kg. Man vill räkna ut ett konfidensintervall för medelvärdet av alla veckor, baserat på t-fördelningen. a) Vilka förutsättningar måste vara uppfyllda för att en sådan beräkning ska vara berättigad? (1 p) b) Beräkna ett tvåsidigt 99% konfidensintervall för medelvärdet av åtgången vetemjöl under alla bokförda veckor. (1 p) Uppgift 2 Bifogade data visar februari månads medeltemperatur från några år i början av 1800-talets andra hälft, dels i Lund, dels i Kalmar. Medelvärdet är något lägre Kalmar. Testa med en lämplig metod hypotesen att Lund och Kalmar
Statististik för naturvetare, 16 januari 2004 2 vid denna tid i historien inte skilde sig åt systematiskt i fråga om medeltemperatur i februari. Årtal Kalmar Lund 1859 1.6 2.2 1860-3.9-3.7 1861 0.0 0.4 1862-4.1-2.7 1863 2.3 2.4 1864-0.1-0.3 1865-4.8-4.6 1866 1.2 2.1 (2 p) Uppgift 3 Ett sätt att mäta radioaktiviteten hos ett ämne är att se hur ofta sönderfall sker. Man tar då enbestämd mängd av ämnet och låter en geigermätare registrera tidpunkterna för sönderfall. En fysiker vill veta om två olika ämnen är lika radioaktiva och mäter därför intervallen (i µs) mellan sönderfall hos ett preparat vardera ämnet. Preparaten har samma vikt. Följande resultat erhölls: Preparat A 0.6 1.0 0.1 13.1 0.1 B 1.6 0.1 25.5 0.7 3.9 6.3 2.6 Varför är det olämpligt att använda t-test för att lösa detta problem? Använd någon lämpligare metod att testa om det fins signifikant skillnad i sönderfallsskillnad mellan de två ämnena. (2 p) Uppgift 4 En bakteriolog vill undersöka hur tillväxten av ett visst virus påverkas av vilket medium det odlas i samt av odlingstidens längd. Han väljer därför slumpmässigt två odlingstider, 12 och 18 timmar och likaledes slumpmässigt 3 odlingsmedier A, B och C. För varje nivåkombination gör han sex odlingar och antecknar tillväxten.du erhåller följande data från bakteriologen.
Statististik för naturvetare, 16 januari 2004 3 tid medium data mv stdav 12 tim A 23.2 25.8 22.5 26.4 27.1 26.8 25.30 1.96 12 tim B 27.4 24.9 26.5 29.4 28.3 27.3 27.30 1.54 12 tim C 24.1 22.3 25.1 22.6 23.0 25.4 23.75 1.32 18 tim A 38.9 33.5 34.8 33.9 35.3 38.1 35.75 2.24 18 tim B 31.2 31.7 31.7 30.1 34.4 32.0 31.85 1.42 18 tim C 31.4 34.3 30.6 34.9 31.5 29.2 31.98 2.20 a) Vilken modell bör användas för att analysera dessa data? Hur ska data organiseras för att man ska kunna genomföra analysen med hjälp av Excel dataanalys? (1 p) b) Bakteriologen har även sammanfattat medelvärdena i en tabell : medium A B C tid 12 tim 25.3 27.3 23.75 18 tim 35.75 31.85 31.983 Därefter har han utfört Anova två faktorer utan reproducering på dessa medelvärden: Resultatet av detta ges i nedanstående tabeller: Anova: Två faktorer utan reproducering SAMMANFATTNING Antal Summa Medelvärde Varians 12 tim 3 76.35 25.45 3.1675 18 tim 3 99.583 33.194 4.902 A 2 61.05 30.525 54.601 B 2 59.15 29.575 10.351 C 2 55.733 27.867 33.894 ANOVA Variationsursprung KvS fg MKv F p-värde F-krit Rader 89.965 1 89.965 20.258 0.0460 18.513 Kolumner 7.258 2 3.629 0.8172 0.550 19.000 Fel 8.881 2 4.441 Totalt 106,105 5 Med hjälp av standardavvikelserna i den första tabellen kan man beräkna errorkvadratsumman för fullständiga data SSE = 98.873. Visa hur. Visa också hur man ur ovanstående tabeller kan få en anova för fullständiga data. Utför variansanalysen och dra relevanta slutsatser. Undersök särskilt om faktorerna samspelar eller inverkar oberoende av varandra. (2 p) Ledning: Excels Anova: Två faktorer utan reproducering motsvarar kursbokens Anova for the randomized block model beskriven i avsnitt 10.5
Statististik för naturvetare, 16 januari 2004 4 Uppgift 5 I Man vill undersöka hur fetthalten i mjölk beror på vilken typ av kraftfoder man ger till korna. För undersökningen väljer man ut en ladugård med en besättning av ca 200 SRB-kor och en ladugård med en besättning av ca 200 Jersey-kor. I båda ladugårdarna delas besättningarna i två ungefär lika delar, där den ena delen får kraftfoder av typ A och den andra delen får kraftfoder av typ B. Detta gör man två gånger på hösten och två gånger på våren. För varje fodertyp, årstid och ladugård har man alltså två replikationer för vilka fetthalten bestäms i %. Försöken ger följande resultat Här är kraftfoder A på minus-nivå och kraftfoder B på plus-nivå. Av årstiderna är höst på minus-nivå ochvår på plusnivå : SRB Jersey Faktor Foder Årstid Medelvärde Faktor Foder Årstid Medelvärde 4.25 4.15 + 4.5 + 4.4 + 3.5 + 4.7 + + 3.75 + + 5.0 Utöver dessa värden får du totalkvadratsumman (uträknad på alla 16 värdena) SST = 3.564375 samt följande uträknade kontraster för samspel: Samspel kontrast Foder*Årstid 0.1 Foder*Ladugård 0.1 Årstid*Ladugård 5.3 a) Ställ upp en lämplig statistisk modell. Skatta huvudeffekter och samspelseffekter samt testa på nivån 5% vilka effekter som är signifikanta. (2 p) b) Om man eftersträvar hög fethalt, vilket foder bör man då geidebåda ladugårdarna under hösten och under våren? (1 p) Uppgift 5 II Vid prövning av en ny halspastill mot förkylning undersökte man preparatets effekt mot β-streptokocker (halsflussbakterier) av olika typer i prov tagna från 360 värnpliktiga med övre luftvägsinfektioner. Proven odlades i buljong och blanades sedan med en uppslamning av preparatet. Efter 2 minuter och efter 5 minuter undersöktes det om det fanns några bakterier kvar i blandningen. Man fick följande resultat:
Statististik för naturvetare, 16 januari 2004 5 Antal prov bakteriefria efter Streptokock Antal prov 2 min 5 min Typ A 160 30 123 Typ B 100 52 81 Övrigt 100 60 91 a) Låt π A vara sannolikheten att ett prov av typ A ej är bakteriefritt efter 2 minuter men är bakteriefritt efter 5 minuter och låt π B vara motsvarande sannolikhet för ett prov av typ B. Beräkna 90%-iga konfidensintervall för π A och π B. Skiljer π A sig signifikant 0.5 och π B sig signifikant från 0.35? Vilka signifikansnivåer har motsvarande tester. (1 p) b) Pröva med ett lämpligt test om de olika bakterietyperna är lika motståndskraftiga mot preparatet. (2 p) Lycka till!