Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Relevanta dokument
Lektionsanteckningar 11-12: Normalfördelningen

Formel- och tabellsamling i matematisk statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Föreläsning G60 Statistiska metoder

Formler och tabeller till kursen MSG830

Repetitionsföreläsning

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Matematisk statistik TMS064/TMS063 Tentamen

Grundläggande matematisk statistik

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

F9 SAMPLINGFÖRDELNINGAR (NCT

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift a b c d e Vet inte Poäng

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Samplingfördelningar 1

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

F9 Konfidensintervall

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Föreläsning 12: Regression

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 12: Linjär regression

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 7: Punktskattningar

F3 Introduktion Stickprov

FÖRELÄSNING 7:

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Föreläsning 7: Punktskattningar

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 7. Statistikens grunder.

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 7: Punktskattningar

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Tentamen i Matematisk statistik Kurskod S0001M

Mer om konfidensintervall + repetition

Tentamen i Matematisk statistik Kurskod S0001M

Sannolikheter och kombinatorik

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Studietyper, inferens och konfidensintervall

F10 Problemlösning och mer om konfidensintervall

F13 Regression och problemlösning

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Föreläsning G70 Statistik A

FACIT: Tentamen L9MA30, LGMA30

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

FÖRELÄSNING 8:

Föreläsning 11: Mer om jämförelser och inferens

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Matematisk statistik Kurskod S0001M

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid

TENTAMEN GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

AMatematiska institutionen avd matematisk statistik

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i Matematisk statistik Kurskod S0001M

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Statistik 1 för biologer, logopeder och psykologer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Föreläsning G60 Statistiska metoder

Uppgift a b c d e Vet inte Poäng

oberoende av varandra så observationerna är

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Tentamen i Matematisk statistik Kurskod S0001M

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Avd. Matematisk statistik

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

TMS136. Föreläsning 11

Kap 3: Diskreta fördelningar

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Transkript:

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng Godkänt. Tentans maxpoäng: 70 poäng (därtill räknas resultat på inlämningsuppgifter och dugga). Anvisningar: Läs igenom uppgifterna nogrannt. Svara på det som frågas efter i kronologisk ordning. I de fall uppgiften kräver en matematisk lösning, ger ofullständiga lösningar poängavdrag. Lämna in lösningar på lösa blad, skriv namn, personnummer, uppgiftsnummer och sidnummer på varje blad. Skriv läsligt! Hjälpmedel: Penna, sudd, räknedosa och linjal. Formelsamling och tabeller medföljer tentamen. Lycka till!

1) (26p) Är följande påståenden sanna eller falska. Kryssa för sant om det är sant. Kryssa för falskt om det är falskt. Kryssa för vet ej om du inte vet. Du får 2 poäng för varje rätt svar. Du får -1 poäng för varje fel svar. Vet ej, ger alltid 0 poäng. Totalt kan man inte få mindre än noll poäng på denna uppgiften. (15p) Tips! Skriv namn och personummer på den här sidan och infoga den med er inlämnade tentamen. Påstående Sant Falskt Vet ej 1 Relativ frekvens anges i antal. 2 Ett 95% konfidensintervall har större felmarginal än ett 99% konfidensintervall. 3 Om fördelningen är högerskev är standardavvikelsen mindre än medelvärdet. 4 Tillsammans med medelvärde används kvartil och tillsammans med median används standardavvikelse 5 En parameter beskriver ett stickprov ur en population. 6 Begreppet bias innebär ett systematiskt fel. 7 Att genom resultaten från ett stickprov uttala sig om populationen kallas för statistisk inferens. 8 Anekdotisk data är lämpligt att använda för statistisk analys. 9 Vid en skev fördelning ger femsiffermåttet en bra beskrivning av fördelningen. 10 Ett placebo är vid en medicinsk studie t.ex. ett piller som endast innehåller verkningslösa substanser. 11 Alla kontinuerliga variabler är normalfördelade. 12 En stark korrellation är bevis för kausalitet. 13 Oavsett variabelns fördelning i populationen så är fördelningen för stickprovsmedelvärdet approximativt normalfördelat då stickprovet är stort. 1

2) (14p) Man har under åren 1900 till 1940 undersökt medelåldern (y) för det första äktenskapet. Determinationskoefficienten för regressionsmodellen är 92.6%. År 1900 motsvarar x = 0 i regressionsmodellen. Ange följande: ŷ =25.7 0.04x, a) interceptet, (2p) b) lutningen, (2p) c) korrellationskoefficienten, (2p) d) skattade värdet för medelåldern år 2006, (2p) e) residualen för en person som gifter sig vid 20 års ålder år 1933, (2p) f) det årtal då den skattade medelåldern har sjunkit till 15 års ålder. (2p) h) Är det rimligt att förlita sig på modellen i fråga d) och f)? Vad kallas det när man gör sådana beräkningar? (2p) 2

3) (14p) I en skola gjordes en undersökning om elevers studievanor. I ett stickprov visade det sig att 20 av 40 flickor använde senaste helgen till studier och att 10 av 40 pojkar använde senaste helgen till studier. a) Räkna ut ett 99% konfidensintervall för proportionen flickor som använde senaste helgen till studier. (4p) b) Räkna ut ett 90% konfidensintervall för proportionen pojkar som använde senaste helgen till studier. (4p) c) Räkna ut ett 95% konfidensintervall för skillnaden mellan proportionerna flickor och pojkar som använde senaste helgen till studier. (6p) 3

4) (16p) Antag att inga studenter kan svaret på någon fråga från uppgift 1, utan de chansar vilt mellan de olika svarsalternativen (sant, falsk, vet ej). a) Ställ upp utfallsrummet (sample space) för det antal poäng en fråga kan ge. Namnge frågan med slumpvariabeln X i,däri =1, 2,...,13 (totalt är det 13 frågor). Verifiera att sannolikheten för utfallsrummet är lika med 1. (4p) b) Beräkna hur många poäng studenterna borde få i snitt (för alla 13 frågorna), d.v.s. medelvärdet, μ Y. (4p) c) Beräkna standardavvikelsen (för alla 13 frågorna), σ Y. (4p) d) Vad är sannolikheten att medelvärdet (ȳ) hamnar över 5.6 poäng för 50 st vilt chansande studenter? Antag att medelvärdet kan anses normalfördelat. Ledning: SD(ȳ) =σ Y / n (4p) 4

Formelsamling och Tabeller Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Beteckningar, punktskattningar m.m. Population Stickprov Namn σ 2,σ s 2,s varians, standardavvikelse μ x medelvärde ρ r korrellationskoefficient N n populations-, stickprovs-storlek β 0,β 1 b 0, b 1 intercept, lutning ε e slumpfel, residual R 2 determinationskoefficient, förklaringsgrad Md median SD( x) SE( x) Medelvärdets standardavvikelse, Standardfelet p ˆp proportion x = 1 n x i n i=1 ˆp = 1 n x i,x=0, 1 n i=1 s = 1 n (x i x) n 1 2 r = 1 n 1 i=1 n z xi z yi i=1 z = x μ σ, x = μ + zσ ŷ i = b 0 + b 1 x i y i = b 0 + b 1 x i + e i μ yi = β 0 + β 1 x i y i = β 0 + β 1 x i + ε i 2

Sannolikhetsteori Regler Multiplikationsregeln för oberoende händelser A och B P (A och B) =P (A)P (B) Additionsregeln för disjunkta händelser A och B P (A eller B) =P (A)+P(B) Komplementregeln P (A c )=1 P(A) Övrigt, Om A och B är oberoende, så är också A c och B oberoende A och B c oberoende A c och B c oberoende Slumpvariabler Väntevärde för en diskret slumpvariabel: μ = E(X) = xp (X = x). Varians och standardavvikelse för en diskret slumpvariabel: σ 2 = Var(X) = (x μ) 2 P (X = x), σ = SD(X) = Var(X) = (x μ) 2 P (X = x). Linjär transformation på en slumpvariabel: E(a + bx) = be(x)+a, Var(a + bx) =b 2 Var(X), SD(a + bx) = Var(a + bx) =bsd(x). Addition och subtraktion mellan två slumpvariabler: E(X ± Y )=E(X) ± E(Y ). Om X och Y är oberoende, ges Var(X ± Y )=Var(X)+Var(Y), SD(X ± Y )= Var(X ± Y )= Var(X)+Var(Y ). 3

Sannolikhetsfördelningar Bernoullifördelning, Bernoulli(p) P (X = x) =p x (1 p) 1 x, x =0, 1, 0 p 1 μ = E(X) =p, V ar(x) =p(1 p),sd(x) = p(1 p) Parameter = p Geometrisk fördelning, Geometrisk(p) P (X = x) =(1 p) x 1 p, x =1, 2,...,, 0 p 1 μ = E(X) = 1 p, p 1 p Var(X) =1 p, SD(X) = p Parameter = p Geometrisk summa P (X x) = x (1 p) i 1 p, i=1 för att förenkla uttrycken så kan man ersätta (1 p) =q, x P (X x) = q i 1 p = p + qp + q 2 p + + q x 1 p i=1 = = p(1 qx ) 1 q Binomialfördelning, Bin(n, p) = p(1 qx ) 1 (1 p) = p(1 qx ) =1 q x p ( ) n P (X = x) = p x (1 p) n x, x =0, 1, 2,...,n, 0 p 1 x μ = E(X) =np, V ar(x) =np(1 p), SD(X) = np(1 p) Parametrar = p, n ( ) n n! = x x!(n x)! = n(n 1)(n 2) 1 x(x 1) 1((n x)(n x 1) 1) Där 0! = 1 och 1! = 1. 4

Konfidensintervall - KI, CI Konfidenskoefficienten eller konfidensgraden (Confidence level) för intervallen är =1 α. KI för en proportion Förutsättningar: np och n(1 p)) > 10 Obundet slumpmässigt urval p {ˆp ± z α/2 SE(ˆp) } Där standardfelet och felmarginalen är SE(ˆp) = ˆp(1 ˆp)/n ME = z α/2 SE(ˆp) Stickprovsstorlek n = z2 ˆp(1 ˆp) α/2 ME 2 KI för skillnaden mellan två proportioner Förutsättningar: n 1 p 1, n 1 (1 p 1 ),n 2 p 2, och n 2 (1 p 2 ) > 10 Obundet slumpmässigt urval ˆp 1 och ˆp 2 är oberoende av varandra (p 1 p 2 ) { (ˆp 1 ˆp 2 ) ± z α/2 SE(ˆp 1 ˆp 2 ) } Där standardfelet och felmarginalen är ˆp 1 (1 ˆp 1 ) SE(ˆp 1 ˆp 2 )= + ˆp 2(1 ˆp 2 ) n 1 n 2 ME = z α/2 SE(ˆp 1 ˆp 2 ) 5

KI för ett medelvärde Förutsättningar: X N(μ, σ) Obundet slumpmässigt urval μ { x ± t α/2 (n 1)SE( x) } Där standardfelet och felmarginalen är SE( x) =s/ n ME = t α/2 (n 1)SE( x) KI för skillnaden mellan två medelvärden Förutsättningar: X 1 N(μ 1,σ 1 ) och X 2 N(μ 2,σ 2 ), Obundet slumpmässigt urval X 1 och X 2 oberoende av varandra (μ 1 μ 2 ) { ( x 1 x 2 ) ± t α/2 ( )SE( x 1 x 2 ) } Där standardfelet och felmarginalen är SE( x 1 x 2 )= s 2 1 /n 1 + s 2 2 /n 2 ME = t α/2 ( )SE( x 1 x 2 ) = antalet frihetsgrader, som är det minsta stickprovet minus ett, (n 1 1) eller (n 2 1). I kurslitteraturen ges en mer komplicerad uträkning av frihetsgrader, vilken ni också kan använda, dock ger den inga pluspoäng = antal frihetsgrader = ( ) s 2 2 1 n 1 + s2 2 n 2 ( ) 1 s 2 2 1 n 1 1 n 1 + 1 n 2 1 ( s 2 2 n 2 ) 2. 6

7

8

9