Tentamen för kursen Statistik för naturvetare. Tisdagen den 11 januari

Relevanta dokument
Tisdagen den 16 januari

Tentamen för kursen Statistik för naturvetare. Tisdagen den 14 december

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Tentamen för kursen Statistik för naturvetare. Torsdagen den 22 december

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen Statististik för naturvetare 16 januari

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen i matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen för kursen. Linjära statistiska modeller. 22 februari

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamen MVE302 Sannolikhet och statistik

Tentamen i Matematisk statistik Kurskod S0001M

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 12: Regression

Tentamen i Matematisk statistik Kurskod S0001M

GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Statistisk försöksplanering

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 1. f(x) = 2x om 0 x 1

Matematisk statistik för B, K, N, BME och Kemister

Tentamen MVE302 Sannolikhet och statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Lycka till!

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, ONSDAGEN DEN 17 MARS 2010 KL

Tentamen i Matematisk statistik Kurskod S0001M

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Medicinsk statistik II

Tentamen i Matematisk statistik Kurskod S0001M

AMatematiska institutionen avd matematisk statistik

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Tentamen i Matematisk statistik Kurskod S0001M

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

OBS! Vi har nya rutiner.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I MATEMATISK STATISTIK

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Resultatet läggs in i ladok senast 13 juni 2014.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen Tillämpad statistik A5 (15hp)

Resultatet anslås senast 10 juni på institutionens anslagstavla samt på kurshemsidan.

b) Teknologen Osquarulda känner inte till ML-metoden, men kom på intuitiva grunder fram till att p borde skattas med p = x 1 + 2x 2

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Matematisk statistik, Föreläsning 5

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Statistik för teknologer, 5 poäng Skrivtid:

Stockholms Universitet Statistiska institutionen Termeh Shafie

Avd. Matematisk statistik

Föreläsning 12: Linjär regression

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen MVE300 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

TENTAMEN I MATEMATISK STATISTIK

Uppgift a b c d e Vet inte Poäng

Tentamen MVE301 Sannolikhet, statistik och risk

OBS! Vi har nya rutiner.

Tentamen i Matematisk statistik Kurskod S0001M

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Föreläsning G60 Statistiska metoder

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

1 Förberedelseuppgifter

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Metod C-kurs

Transkript:

STOCKHOLMS UNIVERSITET TENTAMEN MATEMATISKA INSTITUTIONEN Statistik för naturvetare Avd. Matematisk statistik Tisdagen den 11 januari 2005 Tentamen för kursen Statistik för naturvetare Tisdagen den 11 januari 2005 9-14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Tillåtna hjälpmedel: Levine, Ramsey & Smidt: Applied Statistics for Engineers and Scientists. Egna anteckningar. Miniräknare. Lösningar finns på kursens hemsida (www.math.su.se/matstat/und/statfnat) fr. o. m. skrivtidens slut. Återlämning: Fredag 14/1 2005 kl 16.00. Rum 312, hus 6. Den som vill veta sitt resultat tidigare kan lämna uppgift om sin epostadress tillsammans med lösningarna. Krav för godkänt: För betyget godkänt krävs minst åtta poäng inklusive maximalt fyra poäng från inlämningsuppgifterna. För betyget väl godkänt krävs åtta poäng bland de tolv som är möjligt att få på skrivningen. Resonemang skall vara klara och tydliga att följa. Uppgift 1 En grupp doktorander har mätt ett antal rävhannar i Västsverige. I institutionens rapportserie skriver de sedan att ett 95% konfidensintervall för rävhannars medellängd (inklusive svans) sträcker sig från 110.4 cm till 134.2 cm. Deras professor tolkar detta såhär: Med 95 % sannolikhet är en rävhanne i Västsverige mellan 110.4 cm och 134.2 cm. a) Är detta en riktig tolkning? Om inte, förklara tydligare vad doktorandernas resultat innebär. (1 p) b) Vid närmare granskning visar sig undersökningen ha omfattat sju rävhannar, med följande längder (i cm, inkl. svans): 123, 144, 105, 99, 120, 136, 129. Om man beräknar ett symmetriskt 95% konfidensintervall för medellängden av en rävhanne utifrån dessa data så får man inte riktigt samma resultat som doktoranderna fick. Räkna ut ett riktigt konfidensintervall och förklara vad doktoranderna troligen har gjort för fel. (1 p)

Statistik för naturvetare, Tisdagen den 11 januari 2005 2 Uppgift 2 På ett mejeri vill man undersöka om två paketeringsmaskiner A och B är likvärdiga från hygiensk synpunkt. Maskin A är av en traditionell typ, medan B är en nyutvecklad variant som påstås ge lägre bakteriehalter i mjölken. Man tar på måfå ut 24 paket ur vardera maskinens produktion och mäter halten av en viss bakterie. Det bifogade Excel-bladet visar mängden bakterier per volymsenhet. Man kan tänka sig två sätt att analysera dessa data: Tvåsampel t-test eller Wilcoxons rangsummetest. Bilagorna visar en datorutskrift av resultatet. a) Avgör, både för tvåsampel t-testet och Wilcoxontestet, huruvida det kan anses säkerställt på nivån 5 % att maskin B ger lägre bakteriehalter. (1 p) b) Vilket av de båda testen är lämpligast att utföra här? (1 p) Uppgift 3 Vid enkel linjär regression talar man dels om prediktionsintervall för kommande observationer, dels om konfidensintervall för den sanna regressionslinjens y-värde. Båda typerna av intervall förutsätter att ett x-värde är specificerat. När antalet observationer ökar blir båda intervallen kortare. a) Den ena typen av intervall kan göras hur kort som helst, bara antalet observationer blir tillräckligt stort. Vilken av typerna gäller det? Varför kan inte den andra typen av intervall blir hur kort som helst? (Svara med en intuitiv motivering, inte med en hänvisning till en formel). (1 p) b) I bilagan redovisas en regressionsanalys baserad på n = 20 observationer. Man skall göra en observation till, och man vill då välja x-värdet så att prediktionsintervallet blir så kort som möjligt. Bestäm x och beräkna ett symmetriskt 95% prediktionsintervall. (1 p) Uppgift 4 Vid en farmakologisk institution genomfördes en studie för att jämföra olika ämnen som lindrar irriterande klåda. Fem olika medel jämfördes i studien. Tio frivilliga försökspersoner deltog, alla män i åldern 20-30 år. Varje försökperson utsattes för en behandling per dag och det antogs att inga behandlingar lämnar kvarstående effekter till nästa dag. Behandlingen gick till så att försökspersonen fick en injektion av ett av ämnena, varefter han utsattes för ett irriterande preparat. Med hjälp av en klocka registerades hur länge klådan varade. Förutom de fem aktiva ämnena utsattes försökspersonerna för en injektion av ett placebopreparat, och en kontroll gjordes då personen inte fick någon behandling alls. Tidsföljden mellan behandlingarna

Statistik för naturvetare, Tisdagen den 11 januari 2005 3 randomiserades. Resultaten framgår av följande tabell, som anger hur många sekunder klådan varade: Ingen Papa- Amino- Pento- Tripelen- Person behandling Placebo verine Morphine phylline barbital namine BG 174 263 105 199 141 108 141 JF 224 213 103 143 168 341 184 BS 260 231 145 113 78 159 125 SI 255 291 103 225 164 135 227 BW 165 168 144 176 127 239 194 TS 237 121 94 144 114 136 155 GM 191 137 35 87 96 140 121 SS 100 102 133 120 222 134 129 MU 115 89 83 100 165 185 79 OS 189 433 237 173 168 188 317 Medelvärde 191.0 204.8 118.2 148.0 144.3 176.5 167.2 Som inledning till den statistiska bearbetningen upprättar man följande ANOVA-tabell: Variationskälla Antal frihets- Kvadrat- MKVSUM F grader summa Mellan behandlingar 53013 Mellan försökspersoner 103280 Residualer 167130 Totalt Fortsätt den statistiska analysen och tala om vilka slutsatser man kan dra. (3 p) Uppgift 5, alternativ I För att undersöka hur valet av lösningsmedel och koncentrationen av en katalysator inverkade på bildandet av en biprodukt vid en syntes prövades två gånger alla kombinationer av två olika lösningsmedel A och B och två koncentrationer av katalysatorn i följande experiment. Lösningsmedel Katalysator Mängd bildad biprodukt vid två ober. upprepn. A 3% 8.0, 7.0 B 3% 9.0, 9.0 A 5% 11.0, 12.0 B 5% 16.0, 14.0

Statistik för naturvetare, Tisdagen den 11 januari 2005 4 a) Skatta faktorernas huvudeffekter och samspelseffekten. (1 p) b) Skatta osäkerheten i de enskilda mätvärdena, i form av standardavvikelsen för försöksfelet. Ange skattningens antal frihetsgrader. (1 p) c) Förutsätt att försöksfelet är normalfördelat. Beräkna konfidensintervall med 95% konfidensgrad för vardera medeleffekten och för samspelseffekten. Avgör vilka effekter som är signifikant säkerställda på 5% signifikansnivå. (1 p) Uppgift 5, alternativ II a) Ett livsmedelsföretag överväger att börja tillsätta en konsistensgivare till sin jordgubbssylt, eftersom marknadsundersökningar tyder på att kunderna önskar en fastare konsistens. Företaget vill dock försäkra sig om att konsistensgivaren inte påverkar smaken hos sylten. Därför genomförs följande experiment: Ett antal försökspersoner får smaka på tre prover av sylten, varav ett är behandlat med konsistensgivare och två är obehandlade. Personen får ange vilket av de tre proverna som avviker mest i smak. Sextio personer deltar i undersökningen, och 28 av dem uppger att det behandlade provet har den mest avvikande smaken. Kan det anses säkerställt att konsistensgivaren förändrar smaken hos sylten? (2 p) b) I ett inslag i Rapport den 23 nov 2004 berättades att det i Jokkmokk under året hade fötts 20 % fler barn än normalt. Det beror på kommunens nyinförda belöningssystem, som premierar familjer med många barn, förklarade en belåten kommunpolitiker. I inslaget framgick också att det totala antalet nyfödda under året var 42 (mot normalt 35, således). Betrakta en fiktiv kommun vars folkmängd är så stor att det brukar födas 35 barn per år, och antag att varje kvinna i fertil ålder bestämmer om hon ska föda barn under året eller låta bli, oberoende av de övrigas val. Om det råkar födas 42 barn ett visst år, finns det då skäl att överhuvudtaget söka efter någon annan förklaring än slumpen? Motivera svaret. (1 p) Lycka till!

STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. matematisk statistik Anders Björkström Datorutskrifter för vissa uppgifter (Bilaga till tentamen i Statistik för naturvetare 2005-01-11.) Uppgift 2 Output från Excel: a: Indata: Mängd bakterier per volymsenhet

b: Resultat av Excels tvåsampletest: Output från ett statistikprogram som räknar ut rangsummor (Score Sum):

Aktuella data för den linjära regressionen: Uppgift 3 Resultat av regressionsanalysen: