SKRIFTLIGT PROV: Introduktion till BIOLOGISK STATISTIK, 3hp. DELMOMENT INOM GRUNDUTBILDNINGEN I BIOLOGI/MOLEKYLÄRBIOLOGI HT 2015 Dag: Fredagen den 15 januari, 2016 Tid: 9 00-12 00 Svara på markerad plats. Blad med uträkningar, etc bifogas EJ. Varje rätt besvarad fråga ger 1 poäng. Kod:... Vi lägger ut den korrekta svarsraden på kursens hemsida skriv gärna av din svarsrad och ta med dig så kan du kolla hur det har gått efter skrivningen. Nr Fråga Svarsalternativ (ringa in rätt svar) Ringa in det alternativ Du anser bäst besvarar frågan. Endast ett alternativ per fråga är rätt. 1 Vad anger det p-värde som erhålls vid ett statistiskt test? a) Ett antagande om verkligheten om H 0 är sann. b) En statistisk testmetod. c) Sannolikheten att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. d) Sannolikheten att förkasta en falsk H 0. 2 Vad menas med parameter? a) Slumpen spelar en roll. b) En storhet som karaktäriserar en population. c) En skattning av en storhet som karaktäriserar en population. d) Detsamma som obundet slumpmässigt urval. 3 Under vilket av nedastående alternativ anges tre mått på spridning? a) Standardavvikelse, typvärde, konfidensintervall b) Standardavvikelse, standardvidd, kvartiltrend c) Standardavvikelse, standard error, median d) Standardavvikelse, variationsvidd, kvartilavvikelse 4 Vilket av intervallen överensstämmer med det vi kallar enstjärning signifikans? a) 0.01 < P < 0.05. b) 0.001 < P 0.01. c) 0.1 < P 0.5. d) 0.0001 < P < 0.001.
5 Utgångspunkt: Variabeln X är normalfördelad med medelvärdet 12 och variansen = 4. Fråga: Hur stor andel av värdena är mindre än 7? a) ca 10.6% b) ca 1.9% c) ca 5% d) ca 0.6% 6 Utgångspunkt: Variabeln Y är normalfördelad med medelvärdet 30 och variansen 4. Fråga: Hur stor andel av värdena i fördelningen är större än 35 eller mindre än 25? a) ca 1.2% b) ca 0.6% c) ca 5% d) ca 25% 7 Vad menas med korrelation? a) En typ av t-test där två frekvenser jämförs. b) En diagramform som illustrerar sannolikheter. c) Antalet enheter som Y ändras då X ökar en enhet. d) Riktningen och styrkan hos ett samband mellan två variabler. 8 Tänk dig att du kastar en tärning fyra gånger och betraktar utfallet att få ett visst antal sexor. Vilken är sannolikheten att få exakt två sexor på de fyra kasten? a) P = 0.1157 b) P = 0.9838 c) P = 0.0154 d) P = 0.0278 8b Samma förutsättningar som ovan. Händelsen du betraktar är en så kallad... a)...enkel händelse. b)...sammansatt händelse. c)...systematisk händelse. d)...osannolik händelse. 9 Ett mynt kastas fyra gånger. Vilken är sannolikheten att krona kommer upp i alla fyra kasten? a) 0.1250 b) 0.0316 c) 0.2500 d) 0.0625 10 Vilken är binomialkoeffienten för ett försök som upprepas 10 gånger där den aktuella händelsen inträffar sex gånger? a) 10!/6!4! b) 10!/5!5! c) 6!/6!4! d) 6!/10!4!
11 Vad står de fyra beteckningarna μ, σ, N, ρ hos den sanna populationen för? a) medelvärde, standardavvikelse, stickprovsstorlek, varians b) medelvärde, varians, populationsstorlek, percentile c) medelvärde, standardavvikelse,populationsstorlek, korrelationskoefficient d) medelvärde, standardavvikelse, populationsstorlek, regressionskoefficient 12 Antag att ett kort dras slumpmässigt ur en vanlig, normal kortlek. Vilken är sannolikheten att det dragna kortet är antingen klöver eller hjärter? a) 0.5 b) (13/52) 2 c) 13/52 + 13/52 - (13/52) 2 d) 13/52 + 13/52 - (2/52) 13 Vad menas med Typ I-fel vid statistisk hypotesprövning? a) En falsk H 0 accepteras b) En sann H 0 accepteras c) En falsk H 0 förkastas d) En sann H 0 förkastas 14 Kryssa för det alternativ där alla karaktärer kan klassificeras som kvalitativa nominala. 15 a) Pälsfärg, ögonfärg, hårstruktur b) Pälsfärg, öronlängd, tassform c) Pälsfärg, ögonform, mankhöjd d) Pälsfärg, pälskvalité, kroppsvikt Ett mynt kastas sex gånger och vi betraktar utfallet tre krona. På hur många olika sätt kan vi erhålla tre krona? a) 1 b) 5 c) 10 d) 20 16 Ett mynt kastas sex gånger. Vilken är sannolikheten att erhålla två eller tre krona? a) 0.6250 b) 0.5469 c) 0.3125 d) 0.2375 17 Med begreppet deskriptiv statistik menas a) att med hjälp av statistiska metoder dra slutsatser om förhållanden och fenomen. b) att med hjälp av icke-parametriska metoder dra slutsatser om förhållanden och fenomen. c) att utifrån ett insamlat material sammanfatta och beskriva olika karaktäristika hos det insamlade materialet. d) att utifrån ett insamlat material statistiskt testa en hypotes. 18 Två av varandra oberoende händelser C och D inträffar med
frekvensen 0.3 (=p(c)) respektive 0.1 (=p(d)). Hur tecknas sannolikheten att både C och D inträffar? a) 0.3 0.9 b) 0.3 0.1 c) 0.3 + 0.1 d) 0.3 0.3 - (0.1x0.3) 19a Utgångspunkt: Ön Mauritius är den enda plats på jorden där Calvariaträdet förekommer naturligt. För att kunna gro och bilda nya plantor behöver trädets frön passera igenom mag- /tarmsystemet på en sällsynt kalkonliknande fågel. Fågeln äter fröet, och när fröet kommer ut i andra änden är grobarheten 85 procent. Antag att 15 frön äts upp och passerar en fågel. De binomiala sannolikheterna för olika antal grodda frön presenteras nedan (k=antal grodda frön). k Pr(k) Cumulative a b c d 0 0.000000 0.0000 1 0.000000 0.0000 2 0.000000 0.0000 3 0.000000 0.0000 4 0.000001 0.0000 5 0.000008 0.0000 6 0.000073 0.0001 7 0.000529 0.0006 8 0.002996 0.0036 9 0.013205 0.0168 10 0.044895 0.0617 11 0.115639 0.1773 12 0.218430 0.3958 13 0.285639 0.6814 14 0.231232 0.9126 15 0.087354 1.0000 Fråga: Är det statistiskt osannolikt att alla 15 frön gror? a) Ja b) Nej c) Sannolikheten är 0.044895 och det är en tolkning om detta ska betraktas som osannolikt eller inte. d) Frågan kan inte besvaras utan mer information 19b Utgångspunkt: Som i uppgift 19a. Fråga: Vilken är sannolikheten att exakt åtta frön gror? a) 0.0036 b) 0.044895 c) 0.002996 d) 0.087354 19c Utgångspunkt: Som i uppgift 19a. Fråga: Vilken är sannolikheten att nio eller fler frön gror? a) 0.013205 b) 0.0168 c) 0.98319 d) 0.996394 20a En karaktär är approximativt normalfördelad med ett medelvärde på 78.5 och en standardavvikelse på 16. Vilken är den ungefärliga sannolikheten att en slumpmässigt vald observation har ett högre värde än 92? a) 2.5%
20b b) 16% c) 20% d) 30% Utgångspunkt: Samma som i frågan ovan. Fråga: Vilken är sannolikheten att en slumpmässigt vald observation har ett lägre värde än 55? a) 21% b) 30% c) <0.05% d) 7% 21a En biologistudent studerar reproduktion hos igelkott genom att bl.a. undersöka kullstorlek. Studenten har funnit 22 igelkottfamiljer och noterat följande antal ungar per familj. 3 2 2 6 3 5 3 4 5 3 2 1 5 1 3 6 4 4 1 5 2 4 Vad är det för typ av karaktär hon undersöker? a) Kvalitativ nominal b) Kvantitativ diskret c) Kvantitativ kontinuerlig d) Kvalitativ ordinal 21b Utgångspunkt: Samma som i uppgift 21a. Vilket är medelvärdet för kullstorlek i stickprovet? a) 3.2 b) 3.6 c) 3.5 d) 3.4
21c Utgångspunkt: Samma som i uppgift 21a. Vilken är medianen? a) 3 b) 4 c) 2 d) 3.5 21d Utgångspunkt: Samma som i uppgift 21a. Vilket är typvärdet? a) 3 b) 4 c) 2 d) 3.5 21e Utgångspunkt: Samma som i uppgift 21a. Vilken är den bästa skattningen av den sanna medianen? a) 3 b) 3.5 c) 3.2 d) 3.1 21f Utgångspunkt: Samma som i uppgift 21a. Vilken är den bästa skattningen av den sanna variansen? a) 2.43 b) 3.50 c) 1.56 d) 2.83 21g Utgångspunkt: Samma som i uppgift 21a. Studenten samlar in ytterligare uppgifter om kullstorlek och har till slut en stickprovsstorlek på n=54. Hon vill nu få en uppfattning om precisionen i sin skattning av medelkullstorleken hos igelkott. Vad bör hon göra? a) Bestämma ett kontentintervall b) Bestämma säkerhetsintervall c) Bestämma konfidensintervall d) Bestämma kontrollintervall 21h Vad anger det intervall som studenten tar fram i föregående uppgift? a) Intervallet täcker med en viss sannolikhet det sanna medelvärdet. b) Intervallet anger variationen i skattningar av det sanna medelvärdet baserat på olika olika stickprovsstorlekar. c) Intervallet anger samplingfördelningen av medelvärdet. d) Inget av ovanstående. 22 En försäljare av tulpanlökar hävdar att om lökarna planteras och sköts på rätt sätt ger 60 procent av dem röda tulpaner och 40 procent gula. Antag att vi köper 50 lökar och erhåller 30 gula och 20 röda tulpaner. Är denna observation trolig om försäljarens information stämmer? Välj alternativet med lämplig test och korrekt resultat. a) Chi2-apriori=8.33, df=1, 0.001< P< 0.01 b) t=2.75, df=49, 0.005 <P< 0.01 c) z=1.96, P<0.05 d) r=0.96, df=49, P<0.001
23 En examensstudent i biologi undersöker inavelseffekter hos dansk/svensk gårdshund och jämför bland annat kroppsvikt hos inavlade och icke-inavlade 7-veckor gamla valpar. Hon undersöker 59 icke-inavlade och 33 inavlade valpar och erhåller t=1.69. Vad innebär detta? a) De inavlade valparna har signifikant lägre vikt än de ickeinavlade. b) Det föreligger ingen statistiskt säkerställd skillnad i kroppsvikt mellan inavlade och icke-inavlade. c) De inavlade valparna har signifikant högre vikt än de ickeinavlade. d) Inavel leder till minskad kroppsvikt hos dansk/svensk gårdshund. a b c d 24 En forskare undersöker om det föreligger ett samband mellan personers konsumption av mörk choklad (70% kakao eller mer) och förekomsten av högt blodtryck. Hon har bland annat ett dataset med uppgifter från 1056 personer vad gäller konsumption och blodtryck. Vid en linjär regressionanalys erhåller hon b=-2.56, t=2.75, P<0.01. Vilken slutsats kan forskaren dra? a) Det föreligger ett statistiskt säkerställt linjärt samband så att ju mindre mörk choklad en person äter desto högre blodtryck. b) Det föreligger ett statistiskt säkerställt krökt samband mellan mängden konsumerad choklad och blodtryck. c) Det föreligger inte ett statistiskt säkerställt linjärt samband mellan variablerna. d) Det föreligger ett statistiskt säkerställt linjärt samband så att ju mer mörk choklad en person äter desto högre blodtryck. a b c d 25 Stickprov tas ur två fågelpopulationer, A och B, och vinglängden mäts. Medelvärdet för vinglängden i stickprovet från A är 3.4 cm och i stickprovet från B 4.9 cm. Hur kan man testa om det sanna medelvärdet för vinglängd är detsamma i båda populationerna? a) Genom att använda ett t-test. b) Genom att använda ett chi2-kontingenstest. c) Genom göra en regressionsanalys. d) Genom att jämföra mot binomialfördelningarna. a b c d 26 I en vetenskaplig artikel kan man läsa följande mening "Blindness occurs significantly more often among inbred
wolves than among non-inbred ones (χ2 = 11.31, df=1, P<0.001)." Vad menas med detta? a) Man har jämfört inavlade med icke inavlade vargar med avseende på frekvensen blinda vargar med hjälp av ett kontingenstest och inte funnit någon statistiskt signifikant skillnad i frekvensen blinda individer. b) Man har skattat medelförekomsten av blindhet hos inavlade vargar och funnit att den är signifikant. c) Man har jämfört inavlade med icke inavlade vargar med avseende på frekvensen blinda vargar med hjälp av ett kontingenstest och funnit en statistiskt signifikant skillnad i förekomsten mellan de två grupperna. d) Man har jämfört inavlade med icke inavlade vargar med avseende på frekvensen blinda vargar med hjälp av ett t-test och funnit en statistiskt signifikant skillnad i förekomsten. 27 Vid en korrelationsanalys beräknas värdet på korrelationskoefficienten (r) till 0.96. Avgör med hjälp av detta hur mycket av variationen i y som förklaras av det linjära sambandet. a) 96% b) 4% c) 92% d) 0% 28a En forskare vill skatta blodtrycket i en grupp som behandlats med ett medel som förväntas sänka blodtrycket. Hon behandlar en grupp på elva personer och uppmäter ett genomsnittligt blodtryck på 91.09 där variansen är 84.09. Beräkna ett 95 procentigt konfidensintervall för det sanna medelvärdet. a b c d 28b a) 84.33 --- 100.03 b) 84.09 --- 91.09 c) 84.94 --- 97.24 d) 94.24 --- 98.22 Samma utgångspunkt som ovan. Forskaren jämför nu med en grupp om 14 personer som inte behandlats med medlet. I denna grupp uppmäts ett genomsnittligt blodtryck på 93. Tyder observationerna som forskaren gjort på att det föreligger en skillnad i blodtryck mellan den behandlade och den obehandlade gruppen (de som fått respektive inte fått medlet som forskaren testar)? a) Nej. b) Ja. c) Frågan kräver ett t-test för att kunna besvaras. d) Frågan kräver en regressionsanalys för att kunna besvaras. 29 En barnläkare undersöker om en viss behandling sänker blodtrycket hos barn. Blodtrycket mäts på fyra barn före och
efter behandlingen.observationerna nedan erhålls. Läkaren räknar sedan ut ett för den aktuella hypotesprövningen lämpligt t-värde. Vilket t-värde erhåller barnläkaren? Blodtryck före Blodtryck efter Barn 1 107 106 Barn 2 95 100 Barn 3 108 100 Barn 4 105 98 a) 0.9135 b) 0.7973 c) 3.4490 d) 3.0104