Industriell matematik och statistik, LMA136 2013/14



Relevanta dokument
TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 12: Regression

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

TENTAMEN I STATISTIKENS GRUNDER 2

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

TMS136. Föreläsning 13

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 12: Repetition

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

MVE051/MSG Föreläsning 14

Konfidensintervall, Hypotestest

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Statistik 1 för biologer, logopeder och psykologer

Matematisk statistik för D, I, Π och Fysiker

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

8 Inferens om väntevärdet (och variansen) av en fördelning

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Föreläsning 11: Mer om jämförelser och inferens

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

FÖRELÄSNING 8:

Några extra övningsuppgifter i Statistisk teori

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

F22, Icke-parametriska metoder.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 11

Sannolikheter och kombinatorik

, s a. , s b. personer från Alingsås och n b

Föreläsning 12: Linjär regression

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen den 11 april 2007 i Statistik och sannolikhetslära för BI2

Föreläsning 5: Hypotesprövningar

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen i Matematisk statistik Kurskod S0001M

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TMS136: Dataanalys och statistik Tentamen

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentamen LMA 200 Matematisk statistik,

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Uppgift a b c d e Vet inte Poäng

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Tenta i Statistisk analys, 15 december 2004

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Tentamen i Matematisk statistik Kurskod S0001M

Avd. Matematisk statistik

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 12, FMSF45 Hypotesprövning

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

FÖRELÄSNING 7:

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

4 Diskret stokastisk variabel

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Föreläsningsanteckningar till kapitel 9, del 2

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Lektionsanteckningar 11-12: Normalfördelningen

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för B, K, N, BME och Kemister

Uppgift a b c d e Vet inte Poäng

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Stockholms Universitet Statistiska institutionen Termeh Shafie

Kapitel 10 Hypotesprövning

Tentamen i Matematisk statistik Kurskod S0001M

F3 Introduktion Stickprov

Grundläggande matematisk statistik

Hur man tolkar statistiska resultat

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Repetitionsföreläsning

Tentamen MVE301 Sannolikhet, statistik och risk

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

MVE051/MSG Föreläsning 7

MSG830 Statistisk analys och experimentplanering

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Statistik och epidemiologi T5

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Transkript:

Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014

Disposition r

Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2 är (1 α/2)-kvantil för fördelningen F. P( q 1 α/2 < Z < q 1 α/2 ) = 1 α Lös ut den sökta parametern ur olikheterna (1-α)-kondensintervallet för θ deneras av det resulterande intervallet. (1-α)-kondensintervall för väntevärdesparameter ges av ( x q 1 α/2 S, x + q 1 α/2 S) då S = σ/ n om standardavvikelsen känd och S = s/ n då σ okänd.

Kondensintervall och hypotestest Hypotestest; Objektivt dra slutsats om data Nollhypotes, H 0, samt mothypotes, H 1. Signikansnivå α = P(Förkasta H 0 sann H 0 sann) Testvariabel (statistikan) Z, T, med tillhörande kvantiler q för förkastelseområdet. Beräkna observerade testvariabeln Z Obs, T Obs Förkasta H 0 (och acceptera H 1 ) om observerade testvariabeln inom förkastelseområdet, annars acceptera H 0. Testets p-värde (beror av mothypotesen) Mothypotes p-värde H 1 : µ µ 0 P( Z > Z Obs H 0 sann) H 1 : µ > µ 0 P(Z > Z Obs H 0 sann) H 1 : µ < µ 0 P(Z < Z Obs H 0 sann) Hypotestest med H 0 : µ = µ 0, H 1 : µ µ 0 Testregel: förkasta H 0 på signikanssnivå α om (1-α)-kondensintervallet inte innehåller µ 0.

Y Beroende data {(x 1, y 1 ), (x 2, y 2 ),..., (x n, y n )} Nederbörd - Vattenskador Trakhastighet - Personskador Bokslut -Aktiekurs Figur: Bivariat data

Y Y Y Y Y Y Beroenden

Y Y Y Y Y Y Linjärt beroende y = bx + a

Linjär regression nna a, b som bäst beskriver relationen y = bx + a Skatta a, b låt ŷ(x) = bx + a Kvadratiska avståndet Q = n n (y i ŷ(x i )) 2 = (y i (bx i + a)) 2 i=1 i=1 dq da dq db = 2 = 2 n (y i bx i a) = 0 i=1 n (y i bx i a)x i = 0 i=1

Forts. linjär regression Om x 2 = 1 n n i=1 x 2 i xy = 1 n n i=1 x i y i b x + a = ȳ, bx 2 + a x = xy dvs a = ȳ b x xy ȳ b = x x 2 x 2

Korrelation Mått på hur starkt det linjärt beroendet r = xy xȳ ( x 2 x 2 )( y 2 ȳ 2 ) Förklaringsgrad R 2 = r 2

Multivariat linjär regression Data {(x 1, y 1, z 1 ), (x 2, y 2, z 2 ),..., (x n, y n, z n )} Ansätt funktion ẑ(x, y) = bx + cy + a Kvadratiska avståndet; Q = n (z i ẑ(x i, y i )) 2 = i=1 n (z i (bx i + cy i + a)) 2 i=1 Minsta kvadratiska avståndet; dq dq = 0, = 0, = 0 lös ekvationssytemet dq da db dc

Generell minsta kvadrat-regression Ansätt funktion en passande funktion t.ex.; ŷ(x) = bx 2 + a ŷ(x) = e bx + a Minsta kvadratiska avståndet; Q = n (y i ŷ(x i )) 2 i=1 dq da dq = 0, db = 0 lös ekvationssystemet

Q1 Antag att vi har två händelser A och B, där P(A) = 0.48, P(B) = 0.42 och P(A B) = 0.55. a) P(A c ) b) P(A B) c) P(A B) d) P(A B c ) e) P(A c B c ) f) P(A c B c ) g) Är händelserna A och B oberoende?

Q2 Ett brev levereras på 1, 2, 3 eller 4 dagar med respektive sannolikhet 0.28, 0.31, 0.24, 0.17. a) Vad är risken att det tar mer än en dag att leverera brevet? b) Vad är den förväntade leveranstiden? c) Vad är variansen på leveranstiden?

Q3 En elev, David, går i klass 9A. David har 24 klasskamrater. Elevernas födelsedagar antas vara oberoende samt likformigt fördelade över året. a) Matilda går i samma klass, vad är chansen att Matilda fyller år samma dag som David? b) Kim går också i samma klass, vad är chansen att ingen av de tre; David, Matilda och Kim har födelsedag samma dag? c) Vad är chansen att ingen i klassen har födelsedag på samma dag?

Q1 På en telefonkundtjänst beräknas betjäningstiden modelleras som en kontinuerlig stokastisk variabel med frekvensfunktion f (x) = c 8 x c 1 om x ligger i intervallet (0,2) minuter noll om x ligger utanför detta intervall. a) Vad är konstanten c för att f(x) är en frekvensfunktion? b) Vad är den förväntade betjäningstiden? c) Vad är variansen av betjäningstiden? d) Om inbördes betjäningstider är oberoende och det ett år inkommer 10005 samtal till kundtjänsten, vad är sannolikheten att att den totala betjäningstiden överstiger 250 timmar (15000 minuter)?

Q2 Maja spelar Blackjack, hon spelar alltid med insatsen 100kr/spel och är ganska duktig. Hon beräknar att hon har en vinstchans på p=0.47 i varje enskild spelomgång. Vid vinst utbetalas 2 ggr insatsen. a) Beräkna förväntade antal spelomgångar som Maja vinner om hon deltager i 10 spel. b) Beräkna Majas förväntade resultat i kr efter 10 spelomgångar (Kom ihåg att det kostar 100kr/spel att deltaga). c) För att öka intresset för Black Jack på casinot introduceras en bonus på 50kr för spelare som deltager i 7 efterföljande spel. Beräkna Majas förväntade resultat i kr om hon deltager i 7 spel och erhåller bonusen. d) Vad är det minsta antal spel som casinot kan erbjuda Maja en bonus om 50kr för att deltaga i och samtidigt ha en positiv förväntad vinst? (dvs. Maja har ett negativt förväntat resultat)

Q3 Svenska kvinnors kroppslängd kan anses vara normalfördelad med väntevärde 166.6 cm och standardavvikelse 6.6 cm. a) Hur stor är sannolikheten att en slumpvis utvald svensk kvinna är mellan 160 och 173.2 cm lång? b) Hur stor är sannolikheten att en slumpvis utvald svensk kvinna är mellan 153.4 och 179.8 cm lång? c) Hur stor är sannolikheten att en slumpvis utvald svensk kvinna är kortare än 166.6 cm?

Q1 Vid en opinionsundersökning uppskattas stödet för Piratpartiet. I ett stickprov om 4505 människor har 165 uttryckt sitt stöd för partiet. Beräkna kondensintervall på nivåerna 95% respektive 99% för andelen som stödjer partiet. a) Beräkna nedre intervallgräns för 95%-intervallet. b) Beräkna nedre intervallgräns för 99%-intervallet. c) Sverige har en småpartispärr på 4% vid riksdagsval som försvårar för små partier att få mandat i allmänna val. Erhåller partiet mindre än 4% röster ges de inget mandat alls. Baserat på undersökningen, vad är sannolikheten att Piratpartiet inte får något mandat?

Q2 Medelsträckan svenska pendlare kör i veckan är 27 km. I ett slumpmässigt urval om 20 kvinnor från Norrbotten beräknades deras medelpendlarsträcka till 28 km och stickprovsvariansen (s 2 ) 16 km 2. Man vill testa om medelsträckan kvinnor i Norrbotten pendlar till jobber skiljer sig från medelsträckan för alla pendlare. Sträckorna kan antas vara approximativt normalfördelade. a) Man testar på 0.5% signikansnivå, nollhypotesen är H 0 : Equation 250 = 27 km. Vad är mothypotesen? b) Vad är testvariabeln t för detta test? c) Vad är p-värdet för testet? d) Förkasta eller acceptera H 0?

Q3 är rektangelfördelad mellan 0 och okänd parameter b. Eftersom rektangelfördelningen är symmetrisk kring väntevärdet innebär det att medianen för är lika med väntevärdet för. ˆµ 1 = 1/3( 1 + 2 + 3) och ˆµ 2 = c m( 1, 2, 3) då m(...) är en funktion som väljer ut det mittersta värdet av datapunkterna, är två skattare av medianen. a) Är ˆµ 1 en väntevärdesriktig skattare av medianen för? b) Man har funnit att tätheten f (x) till den stokastiska variabeln m( 1, 2, 3) är f (x) = 6x(b x)/b 3 för x mellan 0 och b och 0 annars. För vilket c är ˆµ 2 en väntevärdessriktig skattning av medianen? Om c är den den konstant som gör ˆµ 2 till en väntevärdesriktig skattning av medianen för. vilken av skattarna ˆµ 1 och ˆµ 2 är eektivast?