1. Test av anpassning.

Relevanta dokument
χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Föreläsning G04: Surveymetodik

TMS136: Dataanalys och statistik Tentamen med lösningar

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

S0005M V18, Föreläsning 10

F10 ESTIMATION (NCT )

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

a) Beräkna E (W ). (2 p)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Grundläggande matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Lösningsförslag

Tentamen i Matematisk statistik för V2 den 28 maj 2010

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

2. Konfidensintervall för skillnaden mellan två proportioner.

Datorövning 2 Fördelningar inom säkerhetsanalys

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

θx θ 1 om 0 x 1 f(x) = 0 annars

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Matematisk statistik TMS063 Tentamen

Föreläsning G70 Statistik A

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Föreläsning G70 Statistik A

4.2.3 Normalfördelningen

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

================================================

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Jag läser kursen på. Halvfart Helfart

Borel-Cantellis sats och stora talens lag

Armin Halilovic: EXTRA ÖVNINGAR

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen Metod C vid Uppsala universitet, , kl

Introduktion till statistik för statsvetare

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

TENTAMEN I MATEMATISK STATISTIK

Datorövning 2 Fördelningar inom säkerhetsanalys

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

Föreläsning 2: Punktskattningar

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Avd. Matematisk statistik

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

b 1 och har för olika värden på den reella konstanten a.

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Formelblad Sannolikhetsteori 1

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Tentamen i matematisk statistik

TAMS15: SS1 Markovprocesser

Lösningar och kommentarer till uppgifter i 1.1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Jag läser kursen på. Halvfart Helfart

STATISTIK FÖR LÄKARSTUDENTER

Föreläsning G60 Statistiska metoder

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

Transkript:

χ -metode. χ -metode ka avädas för prövig av hypoteser i flera olika slag av problem: om e stokastisk variabel följer e viss saolikhetsfördelig med käda eller okäda parametrar. om två stokastiska variabler är oberoede av varadra. 1. Test av apassig. Data: observatioer klassificerade i K olika kategorier: Kategori Atal obs. 1 O 1 O K O K O i = observatioer i kategori i (i = 1,,, K K Låt P i = saolikhete att få e observatio i kategori i ( i 1 Pi 1. Kategori Atal obs. Saolikhet Förvätat obs. 1 O 1 P 1 P 1 O P P K O K P K P K 1 Saolikhetera P 1, P,, P K är u okäda, och vi vill pröva ollhypotese att de har vissa bestämda umeriska värde: H 0 : P 1 =P 10, P =P 0,, P K =P K0 Mothypotese är att H 0 ite gäller, dvs. att ite alla saolikhetera har de i H 0 giva värdea. Vi aväder ett -test med testvariabel: K ( Oi i i1 i, där O i = observerat i kategori i i = P i0 = förvätat uder H 0 När H 0 är sa, så är testvariabel approximativt -fördelad med K-1 fg, ifall et observatioer är tillräckligt stort. Det förvätade et, i = P i0, måste vara 5 för alla kategorier. Om så ite är fallet, brukar ma iblad slå ihop kategorier. 1

Stora skillader mella observerat och förvätat ger höga värde på testvariabel. Vi förkastar därför H 0, om (och edast om vi får extremt höga värde på testvariabel. Kritiskt värde bestäms av öskad sigifikasivå och av frihetsgrader. xempel 1: produkt tillverkas i fyra färger. Ma vill udersöka om vissa av färgera föredras framför de övriga. tt slumpmässigt urval av 80 presumtiva kosumeter tillfrågas om vilke färg de föredrar, och följade data erhålls: Färg 1 3 4 Atal 1 40 8 0 80 Nollhypotese är att alla färgera är lika populära, dvs. att vi har lika stor slh att i urvalet få e perso som föredrar färg 1 som att få e perso som föredrar färg etc. Dvs. Hypoteser: H 0 : P 1 = P = P 3 = P 4 = 0,5 H 1 : j alla saolikheter lika med 0,5 Sig.-ivå: 5% Testvariabel: ( Oi i (K-1 = 3 fg Beslutsregel: H 0 förkastas om obs > 0,05 (3 =7,81. Resultat: i Färg Obs. Saolikhet el. H 0 Förv. el. H 0 1 1 0,5 800,5 = 0 40 0,5 800,5 = 0 3 8 0,5 800,5 = 0 4 0 0,5 800,5 = 0 80 1 80 (1 0 (40 0 (8 0 (0 0 obs = 30,400 >7,81 0 0 0 0 H 0 förkastas på 5% sigifikasivå (Sigifikat skillad i popularitet mella olika färger. xempel : A, B och C är tre kokurrerade produkter av samma typ. Uder e lägre tid har 30% av kudera efterfrågat produkt A, 50% produkt B, och 0% produkt C. Nylige har produkt C geomgått e förädrig, och ma vill veta om produkteras markadsadelar därigeom har förädrats. Vid e markadsudersökig av 00 kuder fa ma att 48 u sade sig föredra produkt A, 98 produkt B, och 54 produkt C. Vilke slutsats ka vi dra? Hypoteser: H 0 : P A = 0,3; P B = 0,5; P C = 0, H 1 : Det gäller ite att P A = 0,3; P B = 0,5; P C = 0, Sig.-ivå: 5%

( Oi i Testvariabel: (K-1 = fg Beslutsregel: H 0 förkastas om obs > 0,05 ( =5,99. Resultat: i Prod. Obs. Saolikhet el. H 0 Förv. el. H 0 A 48 0,3 000,3 = 60 B 98 0,5 000,5 = 100 C 54 0, 000, = 40 Tot. 00 1,0 00 (48 60 (98 100 (54 40 obs =,40 + 0,04 + 4,90 = 7,34 > 5,99 60 100 40 H 0 förkastas på 5% sigifikasivå, dvs vi tror att förädrige av produkt C medfört e ädrig av markadsadelara. OBS 1. Avruda ite de förvätade e. Om de förvätade e ite blir heltal, så ta med ågo eller ågra decimaler i beräkigara. OBS. O i och i står för observerat och förvätat, ite procettal.. Test av apassig: fördelig med skattade parametrar Säg att vi vill testa om våra data ka ses som ett stickprov frå e viss typ av fördelig, t.ex. e Poissofördelig, uta att vi i förväg har specificerat ågot bestämt parametervärde. Vi måste beräka ett skattat parametervärde utifrå våra data. Med hjälp av detta får vi seda det förvätade et observatioer (uder H 0 i olika kategorier. Atalet frihetsgrader är u K-m-1, där K = et kategorier m = et skattade parametrar xempel 3: Vi har 6 textblock (ugefär lika låga frå ett visst dokumet. För varje textblock räkar vi hur måga gåger ordet may förekommer. Data: Atal förekomster 0 1 3 eller fler Obs. 156 63 9 14 Vi vill testa om et förekomster av ordet may i ett textblock följer e Poissofördelig. Poissofördeliges saolikhetsfuktio är x e P( x (x = 0, 1,, x! 3

och dess medelvärde är: =. Detta medelvärde skattas u med stickprovets medelvärde, och vi får ˆ x1 x x6 x 0,6. 6 Vi sätter seda i detta skattade parametervärde i saolikhetsfuktioe ova. Hypoteser: H 0 : Stickprovet kommer frå e Poissofördelig. H 1 : Stickprovet kommer ite frå e Poissofördelig. Sig.-ivå: 5% Testvariabel: ( Oi i Frihetsgrader: K-m-1 = 4-1-1 = i Beslutsregel: H 0 förkastas om vi får obs > 0,05 ( =5,99. Resultat: Atal förekomster Obs. P(x =0,6 Förv. 0 156 0,5379 140,9 1 63 0,3335 87,4 9 0,1034 7,1 3 el. fler 14 0,05 6,6 6 1,0000 6,0 obs (156 140,9 140,9 (63 87,4 87,4 (9 7,1 7,1 (14 6,6 6,6 16,86 5,99. Nollhypotese, att stickprovet kommer frå e Poissofördelig, förkastas på 5% sigifikasivå. 3. Test av oberoede i korstabell Problemet i fortsättige är följade: Vi har ett slumpmässigt stickprov av elemet, för vilka vi observerat två kvalitativa variabler. Stickprovsdata = korstabell, med observatioer i varje cell. Vi frågar: Råder det oberoede mella de två kvalitativa variablera i populatioe? 4

xempel 4: Dispoibel ikomst och bostadskostad för 500 epersoshushåll. Bostadskostad Ikomst Låg Mella Hög Låg 35 50 15 100 Mella 50 10 30 00 Hög 15 80 105 00 100 50 150 500 Fis det ett sambad mella ikomst och bostadskostad? Hur skulle det ha sett ut om det helt sakades sambad mella ikomst och bostadskostad? Dvs. om det rådde fullstädigt oberoede mella ikomst och bostadskostad? Vid fullstädigt oberoede skulle vi ha haft följade förvätade epersoshushåll: Bostadskostad Ikomst Låg Mella Hög Låg 0 50 30 100 Mella 40 100 60 00 Hög 40 100 60 00 100 50 150 500 Iformatio om ikomst skulle vid oberoede ite vara till hjälp, ifall vi ville försöka gissa hushållets bostadskostad. Stickprovsdata: Korstabell med r rader och c kolumer: 1 c 1 O 11 O 1 O 1c R 1 O 1 O O c R r O r1 O r O rc R r C 1 C C c där c R i O ij, i=1,,r; j 1 C r j O ij i 1, j=1,, c. 5

H 0 : Oberoede mella de båda ideligsgrudera. H 1 : j oberoede Testas med testvariabel: r c ( Oij ij i1j1 ij där ij = Förvätat uder H 0 = Ri C j Ri C j 1 c 1 11 1 1c R 1 1 c R r r1 r rc R r C 1 C C c ij -värde beräkade på detta sätt har egeskape att: de relativa fördelige i varje kolum blir desamma som margialfördelige till höger, de relativa fördelige i varje rad blir desamma som margialfördelige lägst er. Det är ju vad vi vätar oss vid oberoede. När H 0 är sa, så är testvariabel approximativt -fördelad med (r-1(c-1 fg, ifall stickprovet är tillräckligt stort. Tumregel: ij måste vara mist lika med 5 i mer ä 0% av cellera. Iblad måste ma slå ihop kategorier för att uppå detta. H 0 förkastas är vi får höga värde på testvariabel. Kritiskt värde bestäms på valigt sätt frå tabell med ledig av öskad sigifikasivå och frihetsgrader. x.(forts.: H 0 : Oberoede mella dispoibel ikomst och bostadskostad. H 1 : j oberoede. Sigifikasivå: 5% Testvariabel: r c ( Oij ij i1j1 ij Frihetsgrader: (3-1(3-1 = 4 fg Beslutsregel: H 0 förkastas om obs > 0,05(4 =9,49. 6

Resultat: Förvätat, uder H 0, står iom paretes uder observerade et i varje cell. Bostadskostad Ikomst Låg Mella Hög Låg 35 50 15 100 (0 (50 (30 Mella 50 10 30 00 (40 (100 (60 Hög 15 80 105 00 (40 (100 (60 100 50 150 500 (35 0 (105 60 obs = 93,63 > 9,49 0 60 H 0 förkastas på 5% sig.-ivå, dvs. att vi tror att det fis ett sambad mella dispoibel ikomst och bostadskostad. 7