1. Test av anpassning.

χ -metode. χ -metode ka avädas för prövig av hypoteser i flera olika slag av problem: om e stokastisk variabel följer e viss saolikhetsfördelig med käda eller okäda parametrar. om två stokastiska variabler är oberoede av varadra. 1. Test av apassig. Data: observatioer klassificerade i K olika kategorier: Kategori Atal obs. 1 O 1 O K O K O i = observatioer i kategori i (i = 1,,, K K Låt P i = saolikhete att få e observatio i kategori i ( i 1 Pi 1. Kategori Atal obs. Saolikhet Förvätat obs. 1 O 1 P 1 P 1 O P P K O K P K P K 1 Saolikhetera P 1, P,, P K är u okäda, och vi vill pröva ollhypotese att de har vissa bestämda umeriska värde: H 0 : P 1 =P 10, P =P 0,, P K =P K0 Mothypotese är att H 0 ite gäller, dvs. att ite alla saolikhetera har de i H 0 giva värdea. Vi aväder ett -test med testvariabel: K ( Oi i i1 i, där O i = observerat i kategori i i = P i0 = förvätat uder H 0 När H 0 är sa, så är testvariabel approximativt -fördelad med K-1 fg, ifall et observatioer är tillräckligt stort. Det förvätade et, i = P i0, måste vara 5 för alla kategorier. Om så ite är fallet, brukar ma iblad slå ihop kategorier. 1

Stora skillader mella observerat och förvätat ger höga värde på testvariabel. Vi förkastar därför H 0, om (och edast om vi får extremt höga värde på testvariabel. Kritiskt värde bestäms av öskad sigifikasivå och av frihetsgrader. xempel 1: produkt tillverkas i fyra färger. Ma vill udersöka om vissa av färgera föredras framför de övriga. tt slumpmässigt urval av 80 presumtiva kosumeter tillfrågas om vilke färg de föredrar, och följade data erhålls: Färg 1 3 4 Atal 1 40 8 0 80 Nollhypotese är att alla färgera är lika populära, dvs. att vi har lika stor slh att i urvalet få e perso som föredrar färg 1 som att få e perso som föredrar färg etc. Dvs. Hypoteser: H 0 : P 1 = P = P 3 = P 4 = 0,5 H 1 : j alla saolikheter lika med 0,5 Sig.-ivå: 5% Testvariabel: ( Oi i (K-1 = 3 fg Beslutsregel: H 0 förkastas om obs > 0,05 (3 =7,81. Resultat: i Färg Obs. Saolikhet el. H 0 Förv. el. H 0 1 1 0,5 800,5 = 0 40 0,5 800,5 = 0 3 8 0,5 800,5 = 0 4 0 0,5 800,5 = 0 80 1 80 (1 0 (40 0 (8 0 (0 0 obs = 30,400 >7,81 0 0 0 0 H 0 förkastas på 5% sigifikasivå (Sigifikat skillad i popularitet mella olika färger. xempel : A, B och C är tre kokurrerade produkter av samma typ. Uder e lägre tid har 30% av kudera efterfrågat produkt A, 50% produkt B, och 0% produkt C. Nylige har produkt C geomgått e förädrig, och ma vill veta om produkteras markadsadelar därigeom har förädrats. Vid e markadsudersökig av 00 kuder fa ma att 48 u sade sig föredra produkt A, 98 produkt B, och 54 produkt C. Vilke slutsats ka vi dra? Hypoteser: H 0 : P A = 0,3; P B = 0,5; P C = 0, H 1 : Det gäller ite att P A = 0,3; P B = 0,5; P C = 0, Sig.-ivå: 5%

( Oi i Testvariabel: (K-1 = fg Beslutsregel: H 0 förkastas om obs > 0,05 ( =5,99. Resultat: i Prod. Obs. Saolikhet el. H 0 Förv. el. H 0 A 48 0,3 000,3 = 60 B 98 0,5 000,5 = 100 C 54 0, 000, = 40 Tot. 00 1,0 00 (48 60 (98 100 (54 40 obs =,40 + 0,04 + 4,90 = 7,34 > 5,99 60 100 40 H 0 förkastas på 5% sigifikasivå, dvs vi tror att förädrige av produkt C medfört e ädrig av markadsadelara. OBS 1. Avruda ite de förvätade e. Om de förvätade e ite blir heltal, så ta med ågo eller ågra decimaler i beräkigara. OBS. O i och i står för observerat och förvätat, ite procettal.. Test av apassig: fördelig med skattade parametrar Säg att vi vill testa om våra data ka ses som ett stickprov frå e viss typ av fördelig, t.ex. e Poissofördelig, uta att vi i förväg har specificerat ågot bestämt parametervärde. Vi måste beräka ett skattat parametervärde utifrå våra data. Med hjälp av detta får vi seda det förvätade et observatioer (uder H 0 i olika kategorier. Atalet frihetsgrader är u K-m-1, där K = et kategorier m = et skattade parametrar xempel 3: Vi har 6 textblock (ugefär lika låga frå ett visst dokumet. För varje textblock räkar vi hur måga gåger ordet may förekommer. Data: Atal förekomster 0 1 3 eller fler Obs. 156 63 9 14 Vi vill testa om et förekomster av ordet may i ett textblock följer e Poissofördelig. Poissofördeliges saolikhetsfuktio är x e P( x (x = 0, 1,, x! 3

och dess medelvärde är: =. Detta medelvärde skattas u med stickprovets medelvärde, och vi får ˆ x1 x x6 x 0,6. 6 Vi sätter seda i detta skattade parametervärde i saolikhetsfuktioe ova. Hypoteser: H 0 : Stickprovet kommer frå e Poissofördelig. H 1 : Stickprovet kommer ite frå e Poissofördelig. Sig.-ivå: 5% Testvariabel: ( Oi i Frihetsgrader: K-m-1 = 4-1-1 = i Beslutsregel: H 0 förkastas om vi får obs > 0,05 ( =5,99. Resultat: Atal förekomster Obs. P(x =0,6 Förv. 0 156 0,5379 140,9 1 63 0,3335 87,4 9 0,1034 7,1 3 el. fler 14 0,05 6,6 6 1,0000 6,0 obs (156 140,9 140,9 (63 87,4 87,4 (9 7,1 7,1 (14 6,6 6,6 16,86 5,99. Nollhypotese, att stickprovet kommer frå e Poissofördelig, förkastas på 5% sigifikasivå. 3. Test av oberoede i korstabell Problemet i fortsättige är följade: Vi har ett slumpmässigt stickprov av elemet, för vilka vi observerat två kvalitativa variabler. Stickprovsdata = korstabell, med observatioer i varje cell. Vi frågar: Råder det oberoede mella de två kvalitativa variablera i populatioe? 4

xempel 4: Dispoibel ikomst och bostadskostad för 500 epersoshushåll. Bostadskostad Ikomst Låg Mella Hög Låg 35 50 15 100 Mella 50 10 30 00 Hög 15 80 105 00 100 50 150 500 Fis det ett sambad mella ikomst och bostadskostad? Hur skulle det ha sett ut om det helt sakades sambad mella ikomst och bostadskostad? Dvs. om det rådde fullstädigt oberoede mella ikomst och bostadskostad? Vid fullstädigt oberoede skulle vi ha haft följade förvätade epersoshushåll: Bostadskostad Ikomst Låg Mella Hög Låg 0 50 30 100 Mella 40 100 60 00 Hög 40 100 60 00 100 50 150 500 Iformatio om ikomst skulle vid oberoede ite vara till hjälp, ifall vi ville försöka gissa hushållets bostadskostad. Stickprovsdata: Korstabell med r rader och c kolumer: 1 c 1 O 11 O 1 O 1c R 1 O 1 O O c R r O r1 O r O rc R r C 1 C C c där c R i O ij, i=1,,r; j 1 C r j O ij i 1, j=1,, c. 5

H 0 : Oberoede mella de båda ideligsgrudera. H 1 : j oberoede Testas med testvariabel: r c ( Oij ij i1j1 ij där ij = Förvätat uder H 0 = Ri C j Ri C j 1 c 1 11 1 1c R 1 1 c R r r1 r rc R r C 1 C C c ij -värde beräkade på detta sätt har egeskape att: de relativa fördelige i varje kolum blir desamma som margialfördelige till höger, de relativa fördelige i varje rad blir desamma som margialfördelige lägst er. Det är ju vad vi vätar oss vid oberoede. När H 0 är sa, så är testvariabel approximativt -fördelad med (r-1(c-1 fg, ifall stickprovet är tillräckligt stort. Tumregel: ij måste vara mist lika med 5 i mer ä 0% av cellera. Iblad måste ma slå ihop kategorier för att uppå detta. H 0 förkastas är vi får höga värde på testvariabel. Kritiskt värde bestäms på valigt sätt frå tabell med ledig av öskad sigifikasivå och frihetsgrader. x.(forts.: H 0 : Oberoede mella dispoibel ikomst och bostadskostad. H 1 : j oberoede. Sigifikasivå: 5% Testvariabel: r c ( Oij ij i1j1 ij Frihetsgrader: (3-1(3-1 = 4 fg Beslutsregel: H 0 förkastas om obs > 0,05(4 =9,49. 6

Resultat: Förvätat, uder H 0, står iom paretes uder observerade et i varje cell. Bostadskostad Ikomst Låg Mella Hög Låg 35 50 15 100 (0 (50 (30 Mella 50 10 30 00 (40 (100 (60 Hög 15 80 105 00 (40 (100 (60 100 50 150 500 (35 0 (105 60 obs = 93,63 > 9,49 0 60 H 0 förkastas på 5% sig.-ivå, dvs. att vi tror att det fis ett sambad mella dispoibel ikomst och bostadskostad. 7