Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Relevanta dokument
Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

TMS136. Föreläsning 13

Matematisk statistik KTH. Formelsamling i matematisk statistik

FACIT (korrekta svar i röd fetstil)

Thomas Önskog 28/

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 12: Regression

Föreläsning 11: Mer om jämförelser och inferens

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tenta i Statistisk analys, 15 december 2004

9. Konfidensintervall vid normalfördelning

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

F3 Introduktion Stickprov

Grundläggande matematisk statistik

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Introduktion och laboration : Minitab

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Metod och teori. Statistik för naturvetare Umeå universitet

Föreläsning 12: Linjär regression

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

TMS136. Föreläsning 11

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen MVE301 Sannolikhet, statistik och risk

Parade och oparade test

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

FÖRELÄSNING 8:

Tentamen MVE302 Sannolikhet och statistik

Lycka till!

TMS136. Föreläsning 10

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

7.5 Experiment with a single factor having more than two levels

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 12, FMSF45 Hypotesprövning

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Statistik för teknologer, 5 poäng Skrivtid:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Föreläsningsanteckningar till kapitel 9, del 2

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsning 4: Konfidensintervall (forts.)

Hypotestestning och repetition

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

Tentamen MVE302 Sannolikhet och statistik

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Avd. Matematisk statistik

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Avd. Matematisk statistik

Föreläsning 6: Hypotestester (forts.)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

Statistik 1 för biologer, logopeder och psykologer

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Lufttorkat trä Ugnstorkat trä

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för D, I, Π och Fysiker

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsningsanteckningar till kapitel 8, del 2

Regressions- och Tidsserieanalys - F1

F13 Regression och problemlösning

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Tentamen i Matematisk statistik Kurskod S0001M

Hypotestest och fortsättning av skattningar och konfidensintervall

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: Medelfel, felfortplantning

Examinationsuppgifter del 2

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Transkript:

Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall, linjär regression och hypotesprövning Starta Excel och kontrollera att alternativet Data Analysis finns under menyn Tools Om inte så klicka på Add Ins och markera där Analysis Toolpak 2 På kursens hemsida, wwwmathkthse/matstat/gru/5b52/ finns en länk för laboration 2 Följ länken och spara ned textfilen med dina datamängder Enklaste sättet att få in dina data i Excel är att öppna textfilen i tex Wordpad Markera relevanta data med musen, välj Copy och sedan Paste i ett nytt Excel-ark Om data är ordnade radvis (som i dataset 2) kan man behöva klicka på Paste options och välja Text Import Wizard Där kan man markerange att utklippet är data separerade med blanksteg (space) 3 Lägg in dataset i kolumn A på ett nytt kalkylark Observationerna x,, x n, kommer från en normalfördelning med (okänt) väntevärde µ, men vi antar att fördelningens standardavvikelse σ är känd Du finner ditt värde på σ på ditt datablad Du skall nu göra ett konfidensintervall för µ Beräkna först skattningen x med funktionen AVERAGE applicerad på ditt dataset Ange denna skattning av µ 4 Om den bakomliggande populationen är oändlig beskrivs skattningen x av en fördelning, här normalfördelning, med standardavvikelse σ x = σ/ n Beräkna denna standardavvikelse Funktionen heter SQRT i Excel 5 Felmarginalen (maximum error) för skattningen x av µ ges av z α/2 σ x Beräkna 25%- kvantilen z 0025 i normalfördelningen med NORMSINV i en cell och ange slutligen felmarginalen i en annan 6 Ett 95% konfidensintervall för µ ges av x ± felmarginal Beräkna den undre och övre gränsen i konfidensintervallet 7 Baserat på konfidensintervallet ovan, är 32 ett rimligt värde på µ? 8 Felmarginalen i uppgiften innan kan beräknas med funktionen CONFIDENCE i Excel Gör detta i en cell och verifiera att du får samma svar som innan 9 Du skall testa hypotesen µ = µ 0 mot hypotesen µ > µ 0 Du finner ditt värde på µ 0 på ditt datablad Detta test utnyttjar teststorheten z = x µ 0 σ x Beräkna värdet av denna 0 Förkastas hypotesen µ = µ 0 till förmån för hypotesen µ > µ 0 för stora/små/eller både stora och små värden på z?

Bestäm ett kritiskt värde för teststorheten z för ett test på signifikansnivå 5% och ange ifall hypotesen µ = µ 0 förkastas eller ej 2 Använd funktionen NORMSDIST för att bestämma testets p-värde, dvs den lägsta risknivån som hypotesen µ = µ 0 kan förkastas på 3 Om populationen är ändlig är spridningen i medelvärdesfördelningen given av standardavvikelsen σ x = σ N n n N Du finner ditt värde på N på ditt datablad Beräkna den nya standardavvikelsen σ x i en cell och den nya felmarginalen för x i en annan 4 Ange konfidensintervallet för µ motsvarande standardavvikelsen ovan Baserat på detta konfidensintervall, är 32 ett rimligt värde på µ? 5 Om σ inte är känd får den skattas med hjälp av observationerna x,, x n Beräkna skattningen s av σ med hjälp av funktionen STDEV 6 Medelfelet för x är skattningen s/ n av σ/ n Beräkna denna 7 För att beräkna ett (exakt) konfidensintervall för µ när σ är okänd så byter man ut normalkvantilen i felmarginalen mot en t-kvantil Funktionen TINV ger kritiska värden för absolutbeloppet i en t-fördelning Det betyder att funktionsanropet TINV(2α,n) returnerar α-kvantilen, t α, i en t-fördelning med n frihetsgrader Använd funktionen för att beräkna 4%-, %- och 05%-kvantilerna för en t-fördelning med 6 frihetsgrader 8 Beräkna 25%-kvantilen i relevant t-fördelning och beräkna felmarginalen t 0025 s/ n för skattningen x 9 Ange konfidensintervallet för µ motsvarande felmarginalen ovan Baserat på detta konfidensintervall, är 32 ett rimligt värde på µ? 20 Under Tools välj Descriptive statistics och markera alternativet Confidence Level for Mean Ange cell-området för dina data och välj därefter OK Du kommer då att få en tabell som innehåller raden Confidence Level vilket motsvarar felmarginalen för medelvärdet när du skattat standardavvikelsen Verifiera att du får samma sak som tidigare 2 Du skall testa hypotesen µ = µ 0 mot hypotesen µ > µ 0 Du finner ditt värde på µ 0 på ditt datablad Detta test utnyttjar teststorheten t = x µ 0 s/ n Beräkna värdet av denna 22 Använd funktionen TINV för att bestämma ett kritiskt värde för teststorheten t vid ett test på signifikansnivå 5% och ange ifall hypotesen µ = µ 0 förkastas eller ej 2

23 Funktionsanropet TDIST(x,n,) anger arean under t(n)-fördelningen till höger om x Använd funktionen TDIST för att bestämma testets p-värde, dvs den lägsta risknivån som hypotesen µ = µ 0 kan förkastas på 24 Ett konfidensintervall för σ med konfidensgrad α fås (se formelsamlingen) som (n )s 2 χ 2 α/2 (n )s 2 < σ < χ 2 α/2 Funktionsanropet CHIINV(α,n) returnerar α-kvantilen i χ 2 (n)-fördelningen Använd detta för att beräkna χ 2 0025 och χ 2 0975 i χ 2 -fördelningen med n frihetsgrader 25 Ange undre och övre gräns i konfidensintervallet för σ och ange ifall värdet σ = 2 är rimligt eller ej baserat ditt konfidensintervall 26 Du skall testa hypotesen σ = σ 0 mot hypotesen σ > σ 0 Du finner ditt värde på σ 0 på ditt datablad Detta test utnyttjar teststorheten χ 2 = (n )s2 σ0 2 Beräkna värdet av denna 27 Förkastas hypotesen σ = σ 0 till förmån för hypotesen σ > σ 0 för stora/små/eller både stora och små värden på χ 2? 28 Bestäm med CHIINV ett kritiskt värde för teststorheten χ 2 för ett test på signifikansnivå 5% och ange ifall hypotesen σ = σ 0 förkastas eller ej 29 Funktionen CHIDIST(x,n) ger arean under χ 2 (n)-fördelningen till höger om punkten x Använd denna funktion för att bestämma testets p-värde, dvs den lägsta risknivån som hypotesen σ = σ 0 kan förkastas på 30 Skriv ut Kalkylarket med dina uträkningar och skapa ett nytt ark för dataset 2 3 Lägg in dataset 2 i ett nytt kalkylark Observationerna kommer från två oändliga populationer som beskrivs av normalfördelningar med (okända) väntevärden µ respektive µ 2 Antag att standardavvikelserna för de två populationerna är σ respektive σ 2 Du finner dina värden på ditt datablad Skillnaden µ µ 2 skattas med x x 2 Ange denna skattning 32 Skattningen x x 2 är ett utfall från en fördelning, här en normalfördelning, med standardavvikelse σ 2 σ x x 2 = + σ2 2 n n 2 Beräkna denna standardavvikelse 33 Felmarginalen (maximum error) för skattningen är z α/2 σ x x 2 Beräkna 25%-kvantilen z 0025 i normalfördelningen (se 5) och ange slutligen felmarginalen 3

34 Ett 95% konfidensintervall för µ µ 2 ges av x x 2 ± felmarginal Ange detta konfidensintervall 35 Baserat på konfidensintervallet ovan, är 0 ett rimligt värde på µ µ 2? 36 Du skall testa hypotesen µ = µ 2 mot hypotesen µ µ 2 Detta test utnyttjar teststorheten z = x x 2 0 σ x x 2 Beräkna värdet av denna 37 Förkastas hypotesen µ = µ 2 till förmån för hypotesen µ µ 2 för stora/små/eller både stora och små värden på z? 38 Bestäm ett kritiskt värde för teststorheten z för ett test på signifikansnivå 5% och ange ifall hypotesen µ = µ 2 förkastas eller ej 39 Använd funktionen NORMSDIST för att bestämma testets p-värde, dvs den lägsta risknivån som hypotesen µ = µ 2 kan förkastas på 40 I Data Analysis finns rutiner för test av olika slag För att testa om väntevärdena är lika, det vill säga skillnaden lika med noll, då varianserna är kända används z-test: Two Sample for Means Kör denna rutin på dataset 2 på 5 % signifikansnivå Som resultat erhålls en tabell för testet Strunta i raderna one-tail Den näst sista raden ger p-värdet för det tvåsidiga testet Jämför med ditt tidigare svar Skall hypotesen förkastas? 4 Om man kan anta att σ = σ 2 behöver man inte känna denna gemensamma standardavvikelse Den skattas med (n )s 2 s p = + (n 2 )s 2 2 n + n 2 2 Använd funktionen STDEV för att beräkna s och s 2 och slutligen s p 42 Standardavvikelsen σ x x 2 = σ n + n 2 skattas med (medelfelet) s p n + n 2 Ange denna 43 Beräkna 25%-kvantilen t(n + n 2 2)-fördelningen med TINV Felmarginalen för x x 2 ges av t 0025 medelfelet Beräkna denna 44 Ange slutligen konfidensintervallet för µ µ 2 Baserat på detta konfidensintervall, är 0 ett rimligt värde på µ µ 2? 45 I Data Analysis finns detta test av skillnad i väntevärdena: t-test: Two-Sample Assuming Equal Variances Kör denna rutin på dataset 2 på 5 % signifikansnivå Som resultat erhålls en tabell för testet Strunta i raderna one-tail Den näst sista raden ger p-värdet för det tvåsidiga testet Raden t-stat är din teststorhet och sista raden det kritiska värdet på teststorheten Jämför med ditt tidigare svar Skall hypotesen förkastas? 4

46 För att undersöka om det är rimligt att anta σ = σ 2 kan man se ifall den hypotesen kan förkastas till förmån för hypotesen σ σ 2 Beräkna kvoterna s 2 /s 2 2 och s 2 2/s 2 Låt sedan F vara det största värdet av dessa två (använd funktionen max) Ange F 47 Testet förkastar σ = σ 2 för stora värden på F Det kritiska värdet på 0 % signifikansnivå bestäms som FINV(00, n, n2) eller FINV(00, n2, n) beroende på om det var den första eller den andra kvoten som var störst Ange det kritska värdet Skall hypotesen σ = σ 2 förkastas? 48 Skriv ut Kalkylarket med dina uträkningar och skapa ett nytt ark för dataset 3 49 I dataset 3 finner du en serie heltalsvärden Du skall nu testa ifall det är rimligt att data kommer från en Poissonfördelning med väntevärde λ 0 eller ej Du finner ditt värde på λ 0 på ditt datablad Som första steg måste observationerna klassindelas Lägg in dataset 3 i kolumn A 50 Du skall nu räkna antalet 0:or, :or, 2:or osv med hjälp av funktionen FREQUENCY Gör enligt följande: I B B5 anger du värdena 0,,2,3,4 Markera sedan cellerna C C5 och ange formeln FREQUENCY(A:A,B:B5) Avsluta inmatningen med CTRL+SHIFT+ENTER och inte med ENTER I cellerna C C5 kommer nu frekvenserna för värdena 0,,,4 i dataset 3 att finnas 5 I cell C6 anger du hur många övriga observatiner du har, dvs antalet som är 5 eller större Gör detta genom att i cell C6 ange formeln count(a:a)-sum(c:c5) 52 Funktionen POISSON(x,λ 0,0) beräknar sannolikheten för att en Poissonfördelning med väntevärde λ 0 antar värdet x Om du anger uttrycket $C$0 som andra argument kan du ange ditt värde på λ 0 i cell C0 Beräkna i cell D D5 sannolikheten att en Poissonfördelning med väntevärde λ 0 antar värdena 0,,2,3,4 I cell D6 anger du sannolikheten för att den antar värdet 5 eller större dvs -sum(d:d5) 53 Ange i cellerna E E6 anger du produkten av sannolikheterna i D D6 och n där n är antalet observationer Kolumn E innehåller de förväntade antalen Poissonfördelade observationer i respektive kategori Dessa skall jämföras med antalen i kolumn C 54 I F skriv =(E-C)^2/E Markera cellen och tryck Control+C eller välj Copy från menyn Klistra sedan in detta med Control+V eller Paste i cellerna F2 F6 Summera värdena i F F6 i cell F7 I F7 finns nu teststorheten χ 2 Ange denna 55 En hypotes om Poissonfördelning med väntevärde λ 0 förkastas för stora värden på χ 2 Det kritiska värdet på 0 % risknivå bestäms som χ 2 00 ur χ 2 (5)-fördelningen Bestäm detta värde med hjälp av CHIINV och ange ifall hypotesen förkastas eller ej 56 Bestäm testets p-värde genom att beräkna arean i χ 2 (5)-fördelningen till höger om punkten χ 2 med hjälp av funktionen CHIDIST Ange detta p-värde 57 För att testa en hypotes om Poissonfördelning över huvud taget skattas ett lämpligt värde på λ ur data Skatta λ med medelvärdet av observationerna i kolumn A Du kan nu ange detta värde som värde på λ 0 i cell C0 58 Teststorheten i F7 skall nu jämföras mot det kritiska värdet på 0 % risknivå som bestäms som χ 2 00 ur χ 2 (4)-fördelningen Bestäm detta värde med hjälp av CHIINV och ange ifall hypotesen förkastas eller ej 59 Skriv ut kalkylarket med dina uträkningar och skapa ett nytt ark för dataset 4 5

60 Betrakta dataset 4 Statistisk modell är enkel linjär regression, y = α+βx+ɛ där ɛ beskrivs av en normalfördelning med väntevärde 0 och standardavvikelse σ Lägg in x-värdena i kolumn A och y-värdena i kolumn B 6 Beräkna i x och y i cell C och C2 med funktionen AVERAGE 62 I kolumn D anger du avvikelserna x i x och i kolumn E avvikelserna y i y 63 Beräkna S xy = n i= (x i x)(y i y) genom att i kolumn F ange produkten av kolumn D och E och summera dessa värden Ange svaret i cell C4 64 Beräkna i kolumn G produkten D*D och summera dessa värden i cell C5 Detta är S xx = n i= (x i x) 2 65 Beräkna i kolumn H produkten E*E och summera dessa värden i cell C6 Detta är S yy = n i= (y i y) 2 66 Skatta α, β och σ med a = y b x b = S xy /S xx s = n 2 (S yy bs xy ) Ange dessa skattningar i cellerna C8, C9 resp C0 67 Använd funktionen SLOPE för att skatta β Jämför med C9 68 Använd funktionen INTERCEPT för att skatta α Jämför med C8 69 Rita slutligen en plot med dina x- och y-värden genom att välja Chart från Insert -menyn och där ange XY (Scatter) som graf-alternativ 70 Skriv ut arket! 6