Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016
GRUNDLÄGGANDE SANNOLIKHETSTEORI
Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse = delmängd av utfallsrummet Sannolikheten av en händelse : = () () där () är antal element i.
Grundläggande sannolikhetsteori Union: Snitt: Komplement: A B A B A B S S S Disjunkta händelser: = ϕ A B S
Räkneregler Multiplikationsregeln: Ett försök som utförs i k steg där är antal utfall i steg j har totala antalet utfall = Permutationer: objekt kan arrangeras på! sätt. Permutationer med grupper med identiska objekt:!!!! där + + + =.
Med/utan återläggning, ordningen kvittar/spelar roll Utan återläggning Med återläggning Ordningen spelar roll!! Ordningen kvittar =!!! + 1
Betingad sannolikhet och Bayes regel Den betingade sannolikheten för givet ( ) () = = () () För disjunkta händelser,, som täcker = ( ) Specialfall: = + ( )
Oberoende händelser Två händelser A och B är oberoende om = = = Generalisering: händelserna,, är oberoende om =
DISKRETA STOKASTISKA VARIABLER
Diskreta stokastiska variabler En diskret stokastisk variabel tar diskreta värden,, (kan vara oändligt). Frekvensfunktion = = 0 1 = 1 Fördelningsfunktion = = () [0,1] < ()
Väntevärde och varians Väntevärde: = = () h = h () för en funktion h. Varians: = = =
Diskreta fördelningar Bernoulli: du utför ett försök som kan lyckas eller misslyckas med sannolikheter och 1, respektive. Binomial: du utför Bernoulli-försök och räknar antal lyckade. Geometrisk: du utför Bernoulli-försök och räknar antal försök till och med första lyckade. Negativ binomial: du utför Bernoulli-försök och räknar antal försök till och med 1 lyckade. Hypergeometrisk: av objekt där klassas som lyckade drar du objekt utan återläggning och räknar antal lyckade.
Diskreta fördelningar Bernoulli: Bernoulli() = om = 1 1 om = 0 Binomial: (, ) = 1, {0,1,2, } Geometris: () = 1, > 0 Negativ binomial:, = 1 1 1,
KONTINUERLIGA STOKASTISKA VARIABLER
Kontinuerliga stokastiska variabler En kontinuerlig stokastisk variabel tar värden i intervall på R. Täthetsfunktion 0 = = 1 Fördelningsfunktion = =
Väntevärde och varians Väntevärde: = = h = h Varians: för en funktion h. = = = =
Kontinuerliga fördelningar Likformig: [, ] = 1 om [, ] Exponential: () = om 0 Normal:, = 1 < < 2
Normalfördelning Om (, ) gäller = (0,1) Om (0,1) gäller = + (, )
Centrala gränsvärdessatsen För oberoende och lika fördelade,,, där = och varians =, gäller för stora. =, Särskilt gäller för medelvärdet att,
Normalapproximation Av Binomial: för (, ) där > 5 och 1 > 5 (, (1 ) Av Poisson: för () med > 20 (, ) Kontinuitetskorrektion ( 0.5 + 0.5)
POISSONPROCESSER
Poissonprocesser Poissonfördelning: = antal impulser under en given fix tidsenhet =! Poissonprocesser: () = antal impulser i ett variabelt intervall [0, ] > 0 är intensiteten per tidsenhet Tid mellan impulser
FLERDIMENSIONELLA FÖRDELNINGAR
Flerdimensionella fördelningar För diskreta stokastiska variabler och, = =, = 0 (, ) 1, = 1 För kontinuerliga stok. var. och, =,, 0,
Diskreta Marginalfördelningar = = =, = = = (, ) Kontinuerliga = =,,
Väntevärde och varians Väntevärde och varians beräknas mha de univariata marginalfördelningarna = () = (, ) = =, = =
Räkneregler väntevärde och varians För stokastiska variabler och och konstanter,, + = + + = + = [] + = = + = + + 2, = + 2(, ), = (), = 0 om och är oberoende.
Kovarians och korrelation Beroendet mellan två stok var och Kovarians, = = [][[] Korrelation (, ) =, 1 1
Betingad fördelning Betingad frekvens/täthet för givet = (, ) () = = () = = = =
Oberoende variabler Stok. variabler och är oberoende om, = () = () = (), = ( )
PUNKTSKATTNING
Punktskattning För ett stickprov,, från fördelning med parameter. En statistika är en funktion h(,, ) av stickprovet, som också är en stok var. En punkskattning = h(,, ) är en statistika som används för att skatta. Skattning sägs vara väntevärdesriktig om =.
Vanliga punktskattningar Väntevärdet = [] skattas med stickprovsmedelvärdet. Variansen = () skattas med stickprovsvariansen = En proportion/andel som tillhör en grupp skattas med / där = antal i gruppen.
Momentmetoden För,, ett stickprov från en fördelning med okända parametrar,,, ges skattningarna,,, av att lösa ekvationssystemet = = =
Maximum Likelihood För,, ett stickprov från en fördelning med okända parametrar,,, ges skattningarna,,, av bilda loglikelihoodfunktionen,, = ln ( ) och lösa ekvationssystemet av partiella derivator = 0
KONFIDENSINTERVALL
Konfidensintervall Ett konfidensintervall med konfidensgrad 1 för en parameter är ett intervall där = 1, 0 < < 1 1 /2 /2
Konfidensintervall för i Två-sidigt: känd: = ± / okänd: = ± /, En-sidigt övre: känd: + okänd: +, En-sidigt undre: känd: okänd:,
Konfidensintervall för i, Två-sidigt: 1 /, 1 /, () 1 /2 /2 0
Ensidiga intervall En övre konfidensgräns för ges av 1, 1, En undre konfidensgräns för ges av 1,,
HYPOTESTEST
Hypotestest Vi har en hypotes om någon parameter som vi vill testa. Vi konstruerar en noll-hypotes som vi försöker motbevis : = Vi konstruerar en alternativ hypotes för det vi vill påvisa H : eller : > eller : < Vi testar om vi kan förkasta på signifikansnivå.
Signifikansnivå och p-värde Signifikansnivå = (förkasta sann) p-värde, den exakta signfikansnivån = (obs stickprov sann)
Hypotestest kontra konfidensintervall 1 /2 /2 / / Konfidensintervall Kritisk region för hypotestest Kritisk region för hypotestest Så om konfidensintervallet täcker in kommer hypotestestet inte att förkasta.
Test av i Hypotestest: : = : : = : < : = : > känd: teststatistika = / (0,1) okänd: teststatistika = / Förkasta när / /,,,
Test av i : = : : = : < : = : > /2 1 /2 1 1 / / Förkasta om: /,,,
Test av i På samma sätt som för kan vi konstruera testen : = : Vi använder statistikan = och förkastar om : = : < 1 : = : > < /, el. > /, <, >,
Test av i : = : : = : < : = : > 1 1 /2 /2 /, /,,, Förkasta om: < /, el. > /, <, >,
Hypotestest kontra konfidensintervall Antag att vi har bildat ett 100 1 % konfidensintervall för en parameter så att Då kommer hypotestestet : = : förkasta på signifikansnivå när > eller <.
Inferens för andelar Test-statistika där =. = Konfidensintervall 1 (0,1) = ± / (1 )
Goodness-of-fit test Vi drar ett stickprov,, och vill testa hypotesen : fördelning : annan fördelning Låt Test-statistika = observerad frekvens av kategori = förväntad frekvens under = där är antal kategorier och antal skattade parametrar. Vi förkastar på signifikansnivå om >,.
JÄMFÖRELSE AV TVÅ POPULATIONER
Test av två väntevärden, kända varianser Hypotestest: : = : : = : < : = : >, kända: = (0,1)
Test av två väntevärden, varianser okända men lika där = 1 + 1 = 1 + 1 + 2
Test av två väntevärden, varianser okända och olika = + där skattas med (avrundas nedåt) = + 1 + 1
Test av två varianser Hypotestest : = mot något av : : < : > Test-statistika = / /,
Test av två andelar Hypotestest : = mot något av alternativen :, : <, : > Test-statistika = 1 + 1 (0,1)