Laboration 2 Inferens S0005M VT18

Relevanta dokument
Laboration 2 Inferens S0005M VT16

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 5. Kapitel 6, sid Inferens om en population

7.3.3 Nonparametric Mann-Whitney test

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Obligatorisk uppgift, del 1

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i matematisk statistik

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

EXAMINATION KVANTITATIV METOD vt-11 (110319)

TENTAMEN I MATEMATISK STATISTIK

Statistik för teknologer, 5 poäng Skrivtid:

Introduktion och laboration : Minitab

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Lektion 1: Fördelningar och deskriptiv analys

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

F3 Introduktion Stickprov

Laboration 3 Inferens fo r andelar och korstabeller

Föreläsning 12, FMSF45 Hypotesprövning

Laboration 4: Hypotesprövning och styrkefunktion

Studietyper, inferens och konfidensintervall

Laboration 3: Urval och skattningar

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

7.5 Experiment with a single factor having more than two levels

Föreläsning G60 Statistiska metoder

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

LABORATION 3 - Regressionsanalys

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning G60 Statistiska metoder

TAMS28 DATORÖVNING VT1

Tentamen i matematisk statistik

, s a. , s b. personer från Alingsås och n b

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Följande resultat erhålls (enhet: 1000psi):

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

8 Inferens om väntevärdet (och variansen) av en fördelning

Hur skriver man statistikavsnittet i en ansökan?

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

LABORATION 1. Syfte: Syftet med laborationen är att

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Föreläsning 7. Statistikens grunder.

TMS136. Föreläsning 13

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Medicinsk statistik II

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

SOPA62 - Kunskapsproduktion i socialt arbete

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 4 mars 2006, kl

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Hur man tolkar statistiska resultat

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TVM-Matematik Adam Jonsson

TENTAMEN I STATISTIKENS GRUNDER 2

Föreläsning G60 Statistiska metoder

LABORATION 3 - Regressionsanalys

Läs noggrant informationen nedan innan du börjar skriva tentamen

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i matematisk statistik

TMS136. Föreläsning 11

Föreläsning 12: Repetition

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Uppgift a b c d e Vet inte Poäng

Laboration 3: Urval och skattningar

OBS! Vi har nya rutiner.

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Tentamen i Matematisk statistik Kurskod S0001M

DATORÖVNING 2: STATISTISK INFERENS.

2.1 Minitab-introduktion

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Statistik och epidemiologi T5

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Laboration med Minitab

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Matematisk statistik Kurskod S0001M

Medicinsk statistik II

F9 Konfidensintervall

Att göra före det schemalagda labpasset.

Parade och oparade test

TMS136. Föreläsning 10

Transkript:

Laboration 2 Inferens S0005M VT18 Allmänt Arbeta i grupper om 2-3 personer. Flertalet av uppgifterna är tänkta att lösas med hjälp av Minitab. Ett lärarlett pass i datorsal finns schemalagt. Var gärna förberedd inför detta pass genom att: Läsa Kap 6 och 7 i kursboken (Moore), motsvarande föreläsning 7-11 Läsa igenom uppgifterna och fundera på hur de skall lösas Lösa de delar som skall lösas för hand Det är även bra om man tittat igenom relevanta avsnitt i Minitab-handledningen på http://staff.www.ltu.se/~jove/s0006m/kompl_mtrl/minitab/ (Minitabtips där det mesta för Laboration 2 finns: Stat Basic Statistics; se även avsnitt 5.1 och 5.2 i Minitabmanualen). Länk finns även i Canvas. Det är viktigt att i alla tre deluppgifterna klargöra vilken situation det rör sig om och vilket test som passar bäst: ett-stickprov z- eller t-test, två-stickprov t-test eller stickprov i par. Labbrapporterna lämnas in via canvas och de skall innehålla alla uträkningar som ni utfört och utskrifter från Minitab som visar hur ni fått fram de värden som ni använder. Sista inlämningsdatum är 9 maj 2018. DEL A Ladda ned filen lab2_data.xls från Canvasrummet under Laborationer. Den innehåller även data för Del B och C. I filen finns reaktionstider för 8 personer. Reaktionstiden för varje person har mätts då personen varit nykter respektive då han/hon varit berusad med en viss promillehalt alkohol i blodet. Varje rad i datamaterialet motsvarar reaktionstider för en av de åtta testpersonerna. Tips: Se avsnitt 5.1 och 5.2 i http://staff.www.ltu.se/~jove/s0006m/kompl_mtrl/minitab/ för lämpliga kommandon för denna uppgift (länk finns även i Canvasrum under Laborationer). A1. Kan vi anta att de två stickproven är normalfördelade? (Minitab-tips: Graph Probability Plot, och sid 66-68 i Moore). A2. Gör manuellt en hypotestest på 5% signifikansnivå som prövar om reaktionstiden är längre vid berusat tillstånd jämfört med vid nyktert tillstånd. Ni får räkna ut medelvärde och standardavvikelse med datorhjälp eller funktioner i miniräknare, men gör övriga räkningar utan datorhjälp. Vilken typ av test passar bäst i detta sammanhang? Var noga med att ange tydliga hypoteser och dra korrekta slutsatser av ert test. A3. Verifiera resultatet i A2 genom att göra samma hypotestest i Minitab.

A4. Beräkna även ett 90% konfidensintervall för skillnaden mellan reaktionstider vid berusat kontra nyktert tillstånd. (Tips: För kommandot ni använde i Minitab för hypotestest behöver ni både ändra konfidensnivå och ändra mothypotes-inställningen till "Difference hypothesized difference" eller till "Mean hypothesized mean".) A5. Tolka i ord konfidensintervallet i A4. A6. Hur ändras intervallet i A4 när konfidensgraden minskar, respektive om konfidensgraden ökar? Ta fram mha Minitab två sådana konfidensintervall. Kommentera iakttagelser. DEL B En grupp ekonomistudenter har träffat en grupp teknologer och diskuterat litteraturkostnader. Det uppstod en tro om att ekonomistudenterna har en högre kostnad för litteratur jämfört med teknologerna. För att få bättre stöd för denna tro valde man slumpmässigt ut 10 stycken ekonomistudenter och 10 stycken teknologer och varje student fick uppge sina litteraturkostnader under det gångna året. Filen lab2_data.xls innehåller information om deras litteraturkostnader. B1. Jämför de olika studentkategoriernas kostnad med hjälp av låddiagram. Finns det anledning att misstänka att ekonomistudenterna har högre kostnad? B2. Utför ett test på 5 % signifikansnivå (med hjälp av Minitab) för att besvara frågan om det finns stöd för påståendet att ekonomistudenterna har högre litteraturkostnad än teknologerna. Ange tydligt hypoteser och slutsatser av testet. Vilket test är lämpligt i denna situation (tex ett stickprov, två stickprov, z-test, t-test mm)? B3. Vad blir slutsatsen om vi i stället hade använt signifikansnivån 10 % i testet i B2? B4. Kontrollera om normalfördelningsantaganden är uppfyllda för det test ni utförde i B2. Kontrollen skall göras med hjälp av en normal quantile plot (Minitab: Graph Probability Plot). DEL C I Del C skall du tillämpa det du lärt dig i kapitel 6 och 7 i läroboken om hur man använder hypotesprövning och konfidensintervall samt vilka villkor som man har att förhålla sig till. Du skall undersöka banken LTB:s förmåga att förvalta aktieportföljer i förhållande till Stockholmsbörsens OMXS30-index. Frågorna du skall besvara är dels teoretiska (märkta med ett (T)), där svaren hittas i boken, samt några där du tolkar de resultat som återfinns i bilagorna som följer efter Del C uppgiftbeskrivning, och med egen analys i Minitab. Bilagorna visar en del analysresultat för ett stickprov med 153 slumpvist utvalda aktieportföljer som beskriver förra kvartalets värdeförändring. Datamaterialet finns i filen lab2_data.xls. Under samma period hade stockholmsbörsens index, OMXS30, minskat i värde med -0,601%. Till saken hör att det var lite strul med datasystemen när detta gjordes så att en del värden hanterades manuellt, vilket ökar risken för felaktiga data.

Vid första anblicken av det underlag du fått så ser det ut som inferens är applicerbart: problem där man brukar beräkna konfidensintervall, p-värde och göra lämpliga hypotesprövningar baserade på skattade medelvärden och standardavvikelser. Det vill säga någon typ av t-test eller liknande. Tips: läs Moore bokens text och exempel noggrant samt ta speciell hänsyn till de varningar och goda råd som ges i de textavsnitten som är märkta med Caution. (Läs speciellt tex s 19, 423-424, och s 415). C1) Uppfyller ditt stickprov kraven för att det ska vara lämpligt att använda sig av ett One-Sample t-test? a) Vilken fördelning bör man ha på observationerna? (T) b) Hur känsligt är en avvikelse från denna fördelning och hur förhåller det sig till antalet observationer man har tillgång till (s 424 i Moore)? (T) c) Nämn några metoder man kan använda sig av för att bedöma om stickprovet följer normalfördelningen, förklara även hur man tolkar dessa. (T) d) Formulera en hypotesprövning utifrån den information du fått för att undersöka om banken LTB presterat annorlunda än OMXS30 index. Motivera de val an noll- och alternativhypotes du gör. (T) e) Uteliggare kan stöka till resultat och analys på ett mycket obehagligt sätt. Hur många uteliggare hittar du i stickprovet och hur får du hantera dessa, d v s vad krävs för att man ska få plocka bort en observation som man tror är en uteliggare? (Se till exempel sid 19 i kursboken.) (T) Till er hjälp har ni tidigare analys av materialet (gjorda med ett statistikprogram, men ej Minitab) för hela materialet i Bilaga 2. Motsvarande analys finns även i bilaga 3, men där har vissa observationer tagits bort. Observera att dessa två approacher ger stora skillnader i till exempel stickprovsmedelvärde och standardavvikelse. För korrekt resultat i nästa uppgift är det viktigt att ni avgör om ni också bör ta bort vissa uteliggare. Motivera i så fall vilka och varför. Studera datamaterialet noggrant för att avgöra vilka uteliggare ska tas bort. Plocka bort dom uteliggare ni bestämmer att ta bort innan ni fortsätter vidare till C2. C2) Är det någon genomsnittlig skillnad mellan hur banken LTB presterar (över alla sina aktieportföljer utom kanske de uteliggare ni tog bort från datat) och OMXS30? Utför hypotestestet och dra slutsatser. Använd Minitab och dra slutsatser utifrån de villkor ni kom fram till i C1. Vilken signifikansnivå tycker du det är lämpligt att använda? Kontrollera om de resultat du fått stämmer överens med motsvarande bilaga nedan. C3) Antag nu att du inte har tillgång till de 153 observationerna eller tidigare analys i bilagorna. Istället ombeds du av banken LTB att själv samla in och sammanställa data, vilket dock kostar tid och pengar. Därför är målet att göra betydligt mindre än 153 observationer, så du funderar över hur många du egentligen behöver när du ej har några tidigare observationer eller annan information om fördelningen att utgå från. a) I labben gör du dina observationer genom ett slumpmässigt urval från de 153 (eller färre) observationer. Hur många observationer väljer du och hur kommer du att gå till väga för att dina val av observationer verkligen är randomiserat, dvs slumpmässigt valda? Resonera kring vad som händer med parametrarna i

exempelvis formeln som används när man beräknar ett konfidensintervall (se till exempel s 353) (T) b) Välj ut en mindre delmängd och gör om analysen som i C2 med det mindre stickprovet. Räckte antalet för att dra samma slutsats som i uppgift C2? Om inte, prova gärna ett nytt stickprov av samma storlek eller fråga några andra labbgrupper som valt ungefär samma stickprovsstorlek för att få en liten indikation på om det verkar som att det alltid blir så eller lite olika från ett stickprov till ett annat. Här får du en första översikt över hur materialet i uppgift 1 ser ut. Mer hittar du i bilagorna. Mean -5,644706 Std Dev 25,264409 Std Err Mean 2,0425064 N 153

Bilaga 1 Värdeutveckling i % per Aktieportfölj, totalt 153 st. -6,82-4,43-7,63 4,33 2,29 4,98-9,16 0,95-8,61-9,14-17,22-8,7 10,03 0,14-0,25-8,66 0,63-8,61-19,14 0,64-1,77 14,44 0,37-1,22 1,63-5,68-7,38 5,04-3,38 5,64 15,35 0,05-2,03 2,35-1,08-135 -19,25 0,81-1,03-15,03-0,02-0,33 2,34 1,52 2,66 1,28-0,14 40 8,22-0,6-0,42-7,24 0,72-6,25 6,22-6,48 6,07-10,36-8,55-10,19-7,41 1,41-1,05-2,65 1,27-180 -12,93 1,61-2,2-1,14 0,42-0,51 6,13-6,13 26,22-5,35-3,41-120 -10,27-5,14-9,95 5,34-4,65 6,32-7,21-0,94-6,66 8,01-1,05-165 5,03-9,14 7,88-16,13 2,24-4,45-12,7-2,24-1,87-8,36-0,8 1,9 7-2,38 7,94 6,01 0,35-0,42-5,11-5,06-4,85-9,27 0,39-2,15 15,09-0,08 0,33-13,58-1,04-3,36-2,56-1,43-1,91-2,64-1,61-2,01-2,93 0,03-2,32 5,82 0,9 6,32-15,25-11,74-15 -8,16 1,16-6,95-15,8 0,46-0,76 0,63-0,25 5-7,34-0,44 4,63-2,25-1,22-1,15-26,19 0,69-0,52

Bilaga 2 Analysunderlag Uppgift C. 153 observationer. Resultaten nedan är baserat på samtliga data som visas i Bilaga 1. Programvaran som använts heter JMP och ser troligtvis lite annorlunda ut än vad det gör i Minitab. Observera resultaten att bilagorna inte följer samma upplägg. Du ska själv bedöma och motivera vilken av versionerna (Bilaga 2 eller Bilaga 3) du kommer att använda till din analys och slutsats i de olika uppgifterna. SUMMARY STATISTICS Mean -5,644706 Std Dev 25,264409 Std Err Mean 2,0425064 Upper 95% Mean -1,609338 Lower 95% Mean -9,680073 N 153 Stem and Leaf Histogram, box-plot och normalfördelningsplot

t-test baserat på medelvärdet KONFIDENSINTERVALL Parameter Estimate Lower CI Upper CI 1-Alpha Mean -5,64471-9,68007-1,60934 0,950 Std Dev 25,26441 22,71547 28,46278 0,950 Quantiles 100.0% maximum 40 99.5% 40 97.5% 15,129 90.0% 6,106 75.0% quartile 1,215 50.0% median -1,14 25.0% quartile -7,08 10.0% -12,838 2.5% -122,25 0.5% -180 0.0% minimum -180

Bilaga 3, Analysunderlag Uppgift C. Vissa uteliggare exkluderade. Resultaten nedan är baserat på delar av data som visas i Bilaga 1. Programvaran som använts heter JMP och ser troligtvis lite annorlunda ut än vad det gör i Minitab. 40-2,33-1,64-1,28-0,67 0,0 0,67 1,28 1,64 2,33 30 20 10 0-10 -20-30 Stem and Leaf 0,0075 0,07 0,2 0,4 0,6 0,8 0,93 Normal Quantile Plot

Konfidensintervall Parameter Estimate Lower CI Upper CI 1-Alpha Mean -1,7694-3,0443-0,49449 0,950 Std Dev 7,875143 7,071065 8,887183 0,950 Hyptesprövning: t Test Test Statistic -1,8110 Prob > t 0,0722 Prob > t 0,9639 Prob < t 0,0361*