Obligatorisk uppgift, del 1

Relevanta dokument
STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Introduktion och laboration : Minitab

LABORATION 1. Syfte: Syftet med laborationen är att

Laboration med Minitab

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

DATORÖVNING 2: STATISTISK INFERENS.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Examinationsuppgifter del 2

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Laboration 2 Inferens S0005M VT18

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning G60 Statistiska metoder

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Metod och teori. Statistik för naturvetare Umeå universitet

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

TAMS28 DATORÖVNING VT1

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

F13 Regression och problemlösning

Tentamen i Matematisk statistik Kurskod S0001M

2.1 Minitab-introduktion

Parade och oparade test

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

TENTAMEN I MATEMATISK STATISTIK

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

LABORATION 3 - Regressionsanalys

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Tentamen i Matematisk statistik Kurskod S0001M

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Multipel Regressionsmodellen

Stockholms Universitet Statistiska institutionen Termeh Shafie

Laboration 2 Inferens S0005M VT16

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistisk försöksplanering

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

TVM-Matematik Adam Jonsson

Datorövning 1 Enkel linjär regressionsanalys

10. Konfidensintervall vid två oberoende stickprov

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Laboration med MINITAB, Del 2 Om Fyris ns global uppv rmning

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Tentamen i Matematisk statistik Kurskod S0001M

F3 Introduktion Stickprov

Statistik B Regressions- och tidsserieanalys Föreläsning 1

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tentamen i Matematisk statistik Kurskod S0001M

Studietyper, inferens och konfidensintervall

7.5 Experiment with a single factor having more than two levels

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

TMS136. Föreläsning 13

Tentamen i Matematisk statistik Kurskod S0001M

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Tentamen i Matematisk statistik Kurskod S0001M

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Laboration 2 multipel linjär regression

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Laboration 4 R-versionen

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

, s a. , s b. personer från Alingsås och n b

Tentamen i Matematisk statistik Kurskod S0001M

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Matematisk statistik Kurskod S0001M

Formel- och tabellsamling i matematisk statistik

Transkript:

Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten att produkten skall bli felaktig på ett eller annat sätt är 0,02. Vad är sannolikheten att högst 2 exemplar blir felaktiga vid tillverkning av 250 stycken om vi antar att de olika exemplaren blir felaktiga oberoende av varandra? Gör en lämplig a) Poissonapproximation. b) Normalapproximation. c) Gör en exakt beräkning av den sökta sannolikheten. d) Vilken approximation blev bäst? 2. Farbror Sid har fem mynt. Ett av dem är falskt och har gubbe på båda sidor. De övriga mynten är välgjorda, dvs för dessa mynt gäller att P(gubbe) = P(krona) = 0,5. Sid väljer slumpmässigt ett av mynten och singlar det fem gånger. a) Vad är sannolikheten att Sid väljer det falska myntet? b) Vad är sannolikheten att Sid får gubbe fem gånger? c) Sid fick gubbe fem gånger. Vad är sannolikheten att kasten har utförts med det falska myntet? 3. En maskin förpackar kaffe. På förpackningarna står det att nettovikten är l000 gram. Anta att nettovikten varierar som en normalfördelad slumpvariabel med väntevärdet 1000 gram och standardavvikelsen 5 gram. a) Vad är sannolikheten att en slumpmässigt utvald förpackning har en nettovikt som är mindre än 990,2 gram? b) Antag att man slumpmässigt väljer ut 200 förpackningar. Vad är sannolikheten att högst 80 av de utvalda förpackningarna har nettovikt mindre än 997,8 gram? 2

Obligatorisk uppgift, del 2 Uppgiften går ut på att genom simulering illustrera innebörden av begreppen samplingfördelning och konfidensintervall. Med hjälp av MINITAB skall sammanlagt 100 stickprov om vardera 25 oberoende observationer dras från en normalfördelning med väntevärdet µ = 100 och standardavvikelsen σ = 5. För varje stickprov beräknas dels ett stickprovsmedelvärde, dels ett konfidensintervall för µ. De erhållna resultaten skall sedan kommenteras. Uppgiften redovisas i form av en kort rapport skriven i ordbehandlingsprogrammet Word. Gör följande: 1. Rita täthetsfunktionen f(x) för en normalfördelad slumpvariabel som har väntevärdet µ = 100 och standardavvikelsen σ = 5. OBS Nästan hela normalfördelningen finns inom gränserna µ ± 3σ. Om du vill ha med en bit av normalfördelningens svansar kan du låta diagrammet visa f(x)-värden för x i intervallet fr o m µ - 4σ t o m µ + 4σ. MINITAB-tips: Skapa en uppsättning x-värden i kolumn c1: Calc > Make Patterned Data > Simple Set of Numbers... Välj avståndet 0,5 mellan värdena (In steps of 0,5). Beräkna sedan f(x) för varje x i c1, och lägg in värdena i c2: Calc > Probability Distributions. Sätt rubriker på kolumnerna: c1 = x och c2 = f(x). Rita diagram: Graph > Scatterplot... För över diagrammet till rapporten. 2. Generera 100 stickprov av storlek n = 25 från N(100; 5). Nu behöver du inte längre värdena som finns i kolumnerna c1 och c2. Töm dessa kolumner. Vi vill att varje stickprov skall utgöras av en rad i datamatrisen. De 100 stickproven skall alltså bli 100 rader, och i varje rad skall kolumnerna c1-c25 innehålla de 25 observerade värdena i resp. stickprov. Kan åstadkommas på följande sätt: Calc > Random data > Normal Generate: 100 rows Store in: c1-c25 Mean: 100 Standard deviation: 5 3

3. Beräkna medelvärde och standardavvikelse för varje stickprov. Lägg medelvärdena i c26 och standardavvikelserna i c27. Kan göras på följande sätt: Calc > Row statistics > Mean Input variables: c1-c25 Store result in: c26 Calc > Row statistics > Standard deviation Input variables: c1-c25 Store result in: c27 4. Gör ett histogram som visar de 100 stickprovsmedelvärdenas fördelning. Görs på vanligt sätt i MINITAB. 5. Beräkna för varje stickprov ett 95% konfidensintervall för µ. Vid beräkning av konfidensintervall antas att σ 2 är okänt. Konfidensintervallets gränser beräknas alltså såsom x ± t s n där lämpligt t-värde hämtas från tabell över t-fördelningen. Lägg för varje stickprov in konfidensintervallets undre och övre gräns i c28 resp. c29. Kan göras på följande sätt: Calc > Calculator Store result in variable: c28 Expression: c26-t*c27/5 Calc > Calculator Store result in variable: c29 Expression: c26+t*c27/5 (OBS Sätt in det numeriska värdet för t ) (OBS Sätt in det numeriska värdet för t ) 4

6. Ta reda på hur många av de 100 konfidensintervallen som innehåller det sanna värdet på µ. Vi kan låta MINITAB göra detta. Skapa först (i c30) en indikatorvariabel som för varje stickprov anger om konfidensintervallet innehåller µ eller ej. (Värdet 1 skall alltså betyda att konfidensintervallet innehåller µ, och värdet 0 skall betyda att konfidensintervallet inte innehåller µ.) Kan göras på följande sätt: Calc > Calculator Store result in variable: c30 Expression: c28<=100 And 100<=c29 Ta sedan reda på hur stor andel av de 100 konfidensintervallen som innehåller µ (dvs. hur många av de 100 indikatorvärdena som är ettor): Stat > Tables > Tally individual variables Variables: c30 Display: Counts, Percents 7. Skriv färdig rapporten. Rapporten skall vara på högst tre sidor. Den skall innehålla: a) Ett diagram över den normalfördelning som stickproven dragits från. b) Ett histogram som visar de erhållna stickprovsmedelvärdenas fördelning. c) Kommentar till detta histogram. Vad skulle man ha väntat sig? Blev resultatet som väntat? d) De erhållna konfidensintervallens täckningsgrad. Kommentar till detta. Vad skulle man ha väntat sig? Blev resultatet som väntat? Diagrammen i rapporten skall ha begripliga rubriker och sorter på axlarna. Bifoga till rapporten en fullständig utskrift från datorkörningen. 5

Obligatorisk uppgift, del 3 Uppgiften (som har okänt ursprung) är en övning i regressionsanalys med hjälp av programpaketet MINITAB. Förutsättningarna tänks vara följande. En marknadsledande tillverkare av tvättmedel vill veta hur försäljningen av dess största produkt påverkas av marknadsföringsinsatser och eget pris i förhållande till konkurrenternas priser. Företaget har 650 återförsäljare, alla med ungefär samma försäljningsvolym. Till huvudkontoret rapporteras från återförsäljarna (som har en egen pris- och marknadsföringspolitik) värden på följande fem variabler för en viss vecka: Antal sålda förpackningar. Genomsnittligt pris (kr) per förpackning för den egna produkten. Genomsnittligt pris (kr) per förpackning för konkurrerande produkter. Utgifter för marknadsföring (kr) av den egna produkten i butikerna. (Denna typ av marknadsföring antas främst ha kortsiktiga effekter på konsumtionsmönstret för den aktuella produkten.) Uppgift om extraerbjudande eller ej (1 = extraerbjudande och 0 = ej extraerbjudande). Analysen skall göras med hjälp av data för dessa fem variabler från ett slumpmässigt urval av 30 återförsäljare. Din tilldelade datafil ligger i katalogen m:\gk\teori. Filen heter regrx.mtw där X ersätts med ett tal 1-30. Läraren bestämmer vilket tal just din arbetsgrupp skall tilldelas. Innan du sätter igång med själva analysarbetet, gör följande: Kontrollera att du har 30 observationer i var och en av kolumnerna c1-c5. Bilda en ny variabel c6 som visar differensen mellan den egna produktens genomsnittliga pris och det genomsnittliga priset för konkurrenternas produkter. MINITAB-tips: Calc > Calculator... Sätt rubriker på kolumnerna. Spara materialet i en MINITAB-fil på din diskett. Nu kommer uppgifterna. Tabeller och diagram skall redovisas i den skriftliga rapporten (se uppgift 12 nedan): 1. Beräkna korrelationsmatrisen för samtliga variabler i datamatrisen. MINITAB-tips: Stat > Basic Statistics... Variables: cl-c6 6

2. Gör spridningsdiagram. Plotta variablerna c2, c3, c4, c5 och c6 i tur och ordning mot c1. MINITAB-tips: Graph > Scatterplot... 3. Välj en bästa regressionsmodell. Med ledning av resultaten i 1 och 2 ovan, välj den bästa regressionsmodellen med c1 som beroende variabel och en enda oberoende (förklarande) variabel. Motivera valet av oberoende variabel. Varför anser du att just denna modell är den bästa? 4. Anpassa den bästa regressionsmodellen. Anpassa den enkla regressionsmodell, som du i uppgift 3 tyckte var bäst. Tolka värdena på a och b i termer av de aktuella variablerna. MINITAB-tips: Stat > Regression > Regression. 5. Beräkna ett 95%-igt konfidensintervall för β. Beräkna (med utnyttjande av utskriften från uppgift 4) ett 95% konfidensintervall för regressionskoefficienten β. Tolka resultatet i ord. Vilka förutsättningar måste vara uppfyllda för att konfidensintervallet skall ha den angivna konfidensgraden? 6. Plotta residualerna i din modell mot den oberoende variabeln. Finns det fog för att ifrågasätta den valda modellen? Motivera! MINITAB-tips: Stat > Regression > Regression. Välj därefter Graphs. 7. Välj den bästa multipla regressionsmodellen. Vilken kombination av oberoende variabler väljer du? Motivera! MINITAB-tips : Stat > Regression > Best Subsets... Eftersom c2, c3 och c6 är starkt korrelerade måste man först välja bort någon av dem, t ex c3. Response: c1 Free Predictors: c2 c4-c6 7

8. Anpassa den bästa multipla regressionsmodellen. Anpassa den multipla regressionsmodell som du i uppgift 7 tyckte var bäst. Tolka också värdena på a, b 1, b 2, i termer av de aktuella variablerna. 9. Beräkna 95% konfidensintervall för var och en av regressionskoefficienterna β 1, β 2,. Utnyttja utskriften från uppgift 8. Tolka intervallen i ord. Vilka förutsättningar måste vara uppfyllda för att konfidensintervallen skall ha den angivna konfidensgraden? 10. Är regressionen som helhet signifikant? Undersök om den i uppgift 7 valda modellen är signifikant förklarande, dvs. undersök om regressionen som helhet är signifikant. Ställ upp hypoteser och gör sedan en hypotesprövning på signifikansnivån 1%. Vilken blir din slutsats? Anta att förutsättningarna enligt uppgift 9 är uppfyllda. 11. Prognos. Hur många förpackningar kommer en enskild återförsäljare att sälja en vecka då det genomsnittliga priset för den egna produkten är 25,60 kr, det genomsnittliga priset för konkurrerande produkter är 28.50 kr, utgifterna for marknadsföring av den egna produkten ar 6250 kr och extraerbjudande inte förekommer (extraerbjudande = 0)? Gör prognoser för försäljningen enligt de valda modellerna i uppg. 3 och 7, dels punktprognoser, dels prediktionsintervall, som har tillförlitligheten 95%. Jämför och tolka resultaten. Anta att förutsättningarna enligt uppgift 9 är uppfyllda. MINITAB-tips: Stat > Regression > Regression... Välj Options: Prediction intervals for new observations Fyll här i de numeriska värdena på de valda oberoende variablerna. 12. Gör en skriftlig rapport. Uppgifterna 1-11 skall besvaras. Text plus tabeller och diagram. Glöm inte tabellerna i uppgifterna 1, 4, 7, 8 och 11 samt diagrammen i uppgifterna 2 och 6. 8