Repetition 2, inför tentamen

Relevanta dokument
Repetition. Plus lite av det om faktorförsök som inte hanns med förra gången

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 12, FMSF45 Hypotesprövning

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik för B, K, N, BME och Kemister

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Enkel linjär regression

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12: Regression

TAMS65 - Föreläsning 6 Hypotesprövning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 13

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Statistisk försöksplanering

Binomialfördelning, två stickprov

TMS136. Föreläsning 11

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 5: Hypotesprövningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Styrkeberäkningar och diskreta data

Avd. Matematisk statistik

Avd. Matematisk statistik

Statistisk försöksplanering

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 12: Linjär regression

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Avd. Matematisk statistik

Repetitionsföreläsning

FÖRELÄSNING 8:

Uppgift a b c d e Vet inte Poäng

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tenta i Statistisk analys, 15 december 2004

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Kapitel 10 Hypotesprövning

Föreläsning 15, FMSF45 Multipel linjär regression

4.1 Grundläggande sannolikhetslära

Tentamen för kursen. Linjära statistiska modeller. 13 januari

F9 Konfidensintervall

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Hypotestest och fortsättning av skattningar och konfidensintervall

Kap 2. Sannolikhetsteorins grunder

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

TMS136. Föreläsning 4

F3 Introduktion Stickprov

Introduktion till statistik för statsvetare

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Kap 3: Diskreta fördelningar

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Föreläsning 11, FMSF45 Konfidensintervall

Föreläsning 7: Punktskattningar

Samplingfördelningar 1

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Lektionsanteckningar 11-12: Normalfördelningen

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Jörgen Säve-Söderbergh

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

F13 Regression och problemlösning

Formel- och tabellsamling i matematisk statistik

Några extra övningsuppgifter i Statistisk teori

Avd. Matematisk statistik

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 12: Repetition

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Transkript:

Repetition 2, inför tentamen

Styrka Styrkefunktionen π(θ) är en funktion av det sanna parametervärdet och definieras som sannolikheten att förkasta nollhypotesen om θ är det sanna parametervärdet. I ett test av H0: θ=θ0 är π(θ0)=α, dvs. sannolikheten att förkasta H0 om den är sann är liten (som sig bör.) När mothypotesen är sann bör π(θ) vara så stor som. Låt oss se direkt på tentauppgifterna!

Tentauppgift 31/8-18

Lösning - - Minimum av styrkefunktionen är vid μ=4. Alltså är testet av H0:μ=4. Sannolikheten att förkasta är stor både till vänster och höger om μ=4. Alltså är mothypotesen H0:μ 4. Vid μ=4 är styrkefunktionen 0.1, alltså har testet den (lite ovanliga) signifikansnivån 0.1.

Uppgift på tentamen 10/4-18 (b) Vi förkastar H0: μ=76.92 om ett ensidigt konfidensintervall inte täcker värdet 76.92, vilket är detsamma som

Lösning, fortsättning Om rätt värde är 71.43, gäller: Argumentet till den standardiserade normalfördelningen ska vara minst 0.68. Svar: Det behövs minst 26 personer för att uppnå önskad styrka.

Tentauppgift 3/1-17 95 % CI: (0.62, ) Stickprov i par!!!

Lösning (c) Om μy-μx=25, gäller Och alltså: H0: μx=μy förkastas i ett test mot H1: μx<μy om

Lösning, fortsättning Svar: Åtta eller fler behövs för att uppnå önskad styrka. (X)

Tentauppgift 15/8-17 När variansen ökar, blir testet svagare, dvs sannolikheten att förkasta H0 när det alternativa hypotesen är sann (H1: μ<1)

Lösning (väldigt grovt) Däremot kommer den att vara detsamma när μ=1.

Tentauppgift 24/10-17 (i) Eftersom vi inte ens strävar efter stor styrka när μ=-10, är styrkan extremt liten där: h(-10)<h(-4)=0.05<h(10) (ii) Mindre variation ger ett starkare test. Alltså ökar styrkan då.

4. Binomial- poisson- och exponentialfördelning - Väntevärde och varians Summor Konfidensintervall och hypotesprövning 1-5-fråga: 5 av 5, teorifråga (nr 6): 4 av 5

Allt är inte normalfördelat...

Binomialfördelningen Om ett försök upprepas n oberoende gånger och varje gång lyckas med sannolikhet p, så är X: antal gånger försöket lyckas binomialfördelad. Lyckas behöver inte alls vara något bra eller ens något dåligt. Man räknar antal gånger det går på ett visst. Ex: slå en trea med tärning, vinna på lotteri, få en flicka, få igång en kemisk reaktion...

Tentauppgift 15/8-17 Det klassiska hypotestestet: Talar data så mycket mot nollhypotesen att den kan förkastas? Om p = 1/6, kan man beräkna sannolikheten att få 3 eller mer, som är ett minus sannolikheten att få 2 eller mindre: Svar: H0 kan inte förkastas. Att få 3 eller fler är helt förenligt med att p= 1/6. (X)

Summan av av biomial är binomial, om p är samma Den klassiska bilden av binomialfördelning är dragning med återläggning. Andelen röda bollar är p. Om vi först väljer n1 bollar ur med återläggning ur en urna med andelen p och sedan n2 bollar ur en urna med andel p, är detta detsamma som att välja n1+n2 bollar ur en enda urna.

Tentauppgift 31/8-18 Avrundat blir det 0.7748 Kontroll i Matlab: >> binocdf(1,9,.1) ans = 0.7748

Tentauppgift 24/10-17 Under H0 är antalet sexor fördelat som X~Bin(10,1/6): Jag lämnar den trista räkningen som övning, men resultatet är 0.0155. Detta är alltså sannolikheten att förkasta H0 om H0 är sann. (X)

Centrala gränsvärdessatsen för binomial Alltså är varje binomialfördelning en summa av n oberoende slumpvariabler. När n är någorlunda stort, är den approximativt normalfördelad. Tumregel: npq>10. (q=1-p)

Tentauppgift 10/4-18 (a) (b) (c) Alltså normalapproximation!

Ett 95 procents approximativt konfidensintervall ges alltså av: (0.0325,0.0715) (X)

Tentaupgift 3/1-17 Eftersom nollhypotesen är sann, är sannolikheten att varje test förkastar 0.05. Antalet förkastade test blir X~Bin(10,0.05). (X)

Tentauppgifter 31/8-18 X~Bin(1200,0.75) b) N(900,1200*0.25*0.75)=N(900,)=N(900,152) Motivering: 1200*0.25*0.75>10 c) P(X<x)=Φ((x-900)/15)>0.99 ; (x-900)/15 > z0.01 ;x >900+15*z0.01 x>900+15*2.3263=934.8945; Svar: Man behöver minst 935 valsedlar

Tentauppgift 31/8-18 >> pstar = 0.042 0.0420 >> pstar-1.96*sqrt(pstar*(1-pstar)/3486) 0.0353 >> pstar+1.96*sqrt(pstar*(1-pstar)/3486) 0.0487 Konfidensintervall: (3.53 %,4.87 %) Annars ingen Bin-förd De kan inte vara säkra men ska inte ge upp hoppet.

Poissonfördelning - Binomialfördelning X~Bin(n,p): n oberoende försök som var och en lyckas med sannolikhet p. X är antal lyckade gånger. Poissonfördelning: X~Po(θ): Händelser inträffar med med konstant intensitet. X är antal händelser under en viss tidsperiod. Ex: antal kunder som kommer in i en butik, antal radioaktiva sönderfall under en viss tidsperiod. Ingen gräns för hur stort X kan vara.

Tentauppgifter 3/1-17 Frågan kan omformuleras: Hur osannolikt är det att få 6 eller mer om X är Poissonfördelad med väntevärde 2: H0 kan alltså förkastas med P-värdet 0.0166 (X)

Tentauppgift 24/10-17 15/8-17 a) Summor av oberoende poissonfördelningar är poissonfördelade. Xvecka=Xmån+Xtis+Xons+Xtor+Xfre+Xlör+Xsön~Po(0.2+0.2+...+0.2+0.1+0.1)=Po(1.2) b) P(Xvecka>0 = 1-P(Xvecka=0)=1-e-1.2= 0.699. (X)

Tentauppgifter 3/1-17 X och Y är det första respektive andra årets antal explosioner. X och Y antas oberoende.

Skapa en teststorhet baserad på separata skattningar Men under H0 gäller också att θ1=θ2, och vi kan skatta det gemensamma θ som (135+147)/2 θ1*=θ2*=282/2 θ1*+θ2*=282 H0: Δ=0 H1: Δ>0. Om H0 är sann, gäller approximativt att Detta kan jämföras med z0.05=1.64. H0 kan alltså inte förkastas. (Än mindre på nivån 0.01!) Det finns inga belägg för att en systematisk minskning av antal smällar.

Tentauppgift 15/8-17 μ*=196/280 =0.7. Eftersom 196>>15 kan vi lugnt normalapproximera. (X)

Tentauppgift 24/10-17 Uppgiften måste vara felformulerad. Följer man lösningen borde det stå att - 30 monster observerades under 12 månader i Arkham. (Frekvens: 30/12=2.5 /månad) - 31 monster observerades under 6 månader i Dunwich (Frekvens 31/6= 5.17/månad)

c) Alltså gäller approximativt: Testa nu hypotesen Under H0 gäller Eftersom observationerna av A och D är rejält mycket större än 15, så är approximationerna giltiga.

Under H0 är det mindre än 1 procents sannolikhet att få ett så stort värde som 2.9. Alltså förkastas H0. Skillnaden avspeglar en verklig och inte bara en slumpmässig skillnad. (X)

Exponentialfördelningen En av de få kontinuerliga fördelningar som man kan räkna på utan hjälp av tabeller: Om man utsätter sig för en konstant risk för att en händelse ska inträffa, är tiden tills den inträffar exponentialfördelad. Typexempel: radioaktivt sönderfall.

Tentauppgift 31/8-18

5. Linjär regression - Skattning av α, β och σ Konfidensintervall för α och β (och σ) Konfidensintervall för α + βx0+prediktions-och kalibreringsintervall

Tentauppgift 3/1-17 3/1-17 (a)

För (b) används formelsamlingen Med insatta värden: (-3.00,11.78) Det går alltså inte att förkasta H0: α=0. (X)

För (c) används formelsamlingen: kalibrering! Med insatta värden (x0*=(150-3.8934)/0.9933=147.1): (127.5,166.7)

Tentauppgift 31/8-18

Tentauppgift 31/8-18, fortsättning Hur lämpligt som helst. Residualerna ser fina ut. Vad jag kan se har tentamenskonstruktören skrivit fel. Det ska vara Sty=-35.86. Uppgiften blir faktiskt olöslig annars.

För b-uppgiften. Snittslad bana x = 1990:2003 y = [3.47 2.79 2.93 2.28 2.08 2.44 1.92 1.95 2.02 1.94 1.41 1.22 1.33.99] n = length(x) meanx = mean(x) meany = mean(y) Sxx = sum((x-meanx).^2) % = sum(x.^2)-sum(x)^2/length(x) Syy = sum((y-meany).^2) % = sum(y.^2)-sum(y)^2/length(x) Sxy = sum((y-meany).*(x-meanx)) % = sum(x.y)-sum(x)*sum(y)/length(x) betastar = Sxy/Sxx %=-0.1576 () alphastar = meany-betastar*meanx%=-338.9735 s = sqrt((syy-sxy^2/sxx)/(n-2)) %=0.2369 C: betastar + [-1 1]*tinv(0.975,n-2)*s/sqrt(Sxx) -0.1918-0.1234

Prediktionsintervall Här går vi utanför området där vi har mätningar. alphastar + betastar*x0 + [-1 1]*tinv(0.975,n-2)*s*sqrt(1+1/n+(x0-meanx)^2/sqrt(Sxx)) -1.3765 1.8616

Tentauppgift 10/4-18

Tentauppgift 10/4-18, fortsättning

Här kan vi hälla ned data precis i samma maskin meanx meany Sxx = Syy = Sxy = n=18 = 2006.44 = 457.06 872.44 5330.94 2008.56 betastar = Sxy/Sxx %2.3022 alphastar = meany-betastar*meanx % -4.1622e+03 s = sqrt((syy-sxy^2/sxx)/(n-2)) % 6.6463 % Preditionsintervall när x=2020 x0 = 2020 alphastar + betastar*x0 + [-1 1]*tinv(0.975,n-2)*s*sqrt(1/n+(x0-meanx)^2/Sxx) % 481.0073 495.5492

Ur färdig lösning

Tentauppgift 15/8-17

Tentauppgift 15/8-17, forts 15/8-17

(a) (b) Naturligtvis är det den logaritmerade modellen som fungerar bäst. Linjeanpassningen ser vettig ut och residualerna ligger slumpmässigt. Formelsamling: Alltså ges ett 95 % konfidensintervall av: (X)

(c) löses av att göra ett kalibreringsinteervall x0*=(log(1000)+6.605)/0.666=20.28942 Ett nedåt begränsat kalibreringsintervall har nedre gränsen x0*-t0.05(16)*0.536/0.666*(1+1/18+(x0*-14.40)2/191.47)½= 18.7. Detta är alltså gränsen för när man ska börja oroa sig.

Denna lösning delades ut och ger ett lite annorlunda svar. Jag har inte lyckats se varför.

Notering om multipel linjär regression Inte en enda uppgift bland uppgifterna 2017-2018 innehåller multipel linjär regression. Det betyder inte att det inte kommer på denna tenta. (Det betyder heller inte att det säkert kommer.) Gör relevanta uppgifter och lär er hitta i den aktuella delen av formelsamlingen.

6. Faktorförsök

22- och 23-försök

Tentauppgift 3/1-17 Eftersom vi har n2k försök och 2k parametrar, är antalet frihtetsgrader n2k-2k=(n-1)2k. I detta fall: (2-1)23=8. Sålunda ser ett tvåsidigt konfidensintervall för effekterna ut som: Effekterna A och C är signifikanta på nivån 5 procent, eftersom de till beloppet skattas större än 0.276. (X)

Tentauppgit 10/4-18 Ni kan bli tvungna att använda t0.025(30)=2.04, som är det närmsta i tabellen. Då blir C = 0.237 (X)

Tentauppgift 31/8-18

Alla skattningar har samma medelfel Därför kan en kompakt beskrivning av resultatet bestå av skattningarna av huvudeffekterna, samspelet och T-kvantilen gånger medelfelet:

Enkel redovisning av resultat Dock hör en interaktionsplot också till. Kan lätt ritas för hand. T-kvantilen gånger medelfelet är mindre än absolutbeloppet av alla skattare. Alltså är alla effekter, huvudeffekter som samspel, signifikanta.

Tentauppgift 24/10-17