Exempel i stickprovsteori p. 1/26 Exempel i stickprovsteori Göran Arnoldsson Umeå universitet
Exempel i stickprovsteori p. 2/26 1. Audit sampling En bank vill göra en snabb uppskattning av den totala behållningen τ på ett antal (2000) konton. Ett OSU om 300 konton ger en behållning i medeltal på 2345:- med en standardavvikelse på 397:-. 1. Gör en intervallskattning av τ med 95% konfidensgrad. 2. Det visade sig att 75 av de utvalda kontona tillhörde personer under 15 år. Skatta den totala andelen kontohavare under 15 år med 99 % konfidensgrad. 3. Hur många observationer skulle krävas för att den statistiska felmarginalen för skattningen av medelbehållningen inte ska överstiga 50 och för att den statistiska felmarginalen för skattningen av andelen kontohavare under 15 år inte ska överstiga 3 procentenheter?
Exempel i stickprovsteori p. 3/26 2. Kvinnors utgifter SCBs utgiftsbarometer 2000 innehåller bl.a. en tabell med utgifter under året för kläder och skor fördelat på kön och ålder. Utifrån tabellen kan vi återskapa följande tabell med data för kvinnor. Ålder N n x s - 6 319 300 248 3 772 4 299 7-15 511 600 435 4 743 5 033 16-24 408 800 241 5 790 8 253 25-44 1 257 500 628 6 298 9 564 45-64 1 107 200 532 7 459 10 485 65-434 400 168 5 698 6 891 Summa 4 038 800 2 252
Exempel i stickprovsteori p. 4/26 2. Kvinnors utgifter (forts.) 1. Gör intervallskattning av populationens medelvärde och av de svenska kvinnornas totala utgifter för kläder och skor 2000 2. Vilken hade varit den optimala sampleallokeringen?
Exempel i stickprovsteori p. 5/26 3. Mäns utgifter Motsvarande siffror för män är Ålder N n x s - 6 354 000 224 3 172 3 841 7-15 542 100 427 3 900 4 502 16-24 413 800 217 6 397 9 620 25-44 1 191 000 712 4 959 11 599 45-64 1 059 400 519 4 238 7 265 65-409 300 151 3 580 5 693 Summa 3 969 600 2 250
Exempel i stickprovsteori p. 6/26 3. Mäns utgifter (forts.) 1. Genomför motsvarande beräkningar som för kvinnor 2. Är den (ev.) funna skillnaden mellan kvinnors och mäns genomsnittliga utgifter för kläder och skor statistiskt signifikant? 3. Gör en gemensam skattning för båda könen tillsammans.
Exempel i stickprovsteori p. 7/26 4. Ledarresurser En länsidrottsorganisation vill veta hur mycket pengar medlemsföreningarna (150 st) lägger på ledarutbildning. Data baseras på inlämnade årsrapporter. Totalantalet ledare inom organisationen är ca. 600. Ett OSU om 10 föreningar redovisas här. Hur mycket lägger föreningarna ut i snitt per ledare och år på ledarutbildning? Förening Antal ledare Årskostnad Förening Antal ledare Årskostnad 1 7 100 6 9 140 2 15 120 7 20 160 3 5 70 8 3 70 4 11 170 9 17 220 5 7 140 10 13 170 Summa 45 600 Summa 62 760
Exempel i stickprovsteori p. 8/26 5. Sjuk statistik(?) Personalavdelningen på ett företag med 1000 anställda vill uppskatta den totala sjukfrånvaron under året. Man gör ett snabbt OSU av 10 anställda och kontrollerar deras sjukfrånvaro. Enligt internstatistiken för föregående år uppgick den totala sjukfrånvaron till totalt 16 300 timmar. Gör en skattning av den totala sjukfrånvaron innevarande år. Sjukfrånvaro Sjukfrånvaro Individ Föregående år Innevarande år Individ Föregående år Innevarande år 1 12 13 6 26 24 2 24 25 7 10 12 3 15 15 8 15 16 4 30 32 9 0 2 5 32 36 10 14 12
Exempel i stickprovsteori p. 9/26 6. Utbildningseffekter Vid början av en utbildning gavs studenterna N = 486 st ett test X som avsåg mäta matematiska färdigheter. Beräknad på alla studenter hade det första testet ett medelvärde om 52 poäng. Efter avslutad utbildning gavs så ännu ett test Y till n = 10 st slumpmässigt utvalda studenter. Bestäm en intervallskattning av medelvärdet för det avslutande testet. Testresultat Testresultat Student X Y Student X Y 1 39 65 6 47 89 2 43 78 7 28 73 3 21 52 8 75 98 4 64 82 9 34 56 5 57 92 10 52 75
Exempel i stickprovsteori p. 10/26 7. El Byrån I en mindre elfirma har det inneliggande lagret av installationsmateriel (N = 180 olika sorts artiklar) värderats till 13320 kr. Inför ett eventuellt uppköp av firman vill köparen kontrollera dessa uppgifter. En mindre inventering av n = 10 artiklar (slumpmässigt utvalda) genomförs. Kan säljarens uppgifter godtas? Värde Värde Artikel Uppgivet Sant Artikel Uppgivet Sant 1 10 9 6 112 109 2 12 14 7 36 40 3 8 7 8 240 238 4 26 29 9 59 60 5 47 45 10 167 170
Exempel i stickprovsteori p. 11/26 8. Extern revision På 80-talet iakttogs en trend i USA att många företag utvidgade sina avdelningar för internrevision på grund av att kostnaderna för extern revision hade ökat. W.A. Wallace a genomförde en undersökning i form av ett stickprov (OSU) av 32 företag i en population bestående av totalt 95 företag. Syftet var att undersöka hur kostnaderna för externrevision hade påverkats. För stickprovet beräknades ett medelvärde om $ 779 030 med standardavvikelse $ 1 083 162. 1. Beräkna ett 95% konfidensintervall för de 95 företagens genomsnittliga kostnader för externrevision. 2. Hur stort stickprov hade krävts för att felmarginalen i (a) skulle understiga $ 250 000? a Harvard Business Review, Mar.-Apr. 1984
Exempel i stickprovsteori p. 12/26 9. Kursböcker En myndighet intresserade sig för hur mycket pengar studenter lägger på kursböcker. Man gjorde ett OSU av 50 studenter inom respektive fakultet på ett medelstort universitet. Varje student gav uppgifter på hur stor summa som spenderats under det senaste kvartalet. För urvalen inom respektive fakultet beräknades medelvärde och varians. Antal Fakultet studerande tillfrågade Medelvärde Varians A 4085 50 752 625 B 3520 50 620 865 C 5525 50 452 314 D 5070 50 429 397 Summa 18200 200
Exempel i stickprovsteori p. 13/26 9. Kursböcker (forts.) 1. Bestäm ett konfidensintervall för de totala utgifterna för kursböcker under kvartal. 2. Hur nära en optimal allokering under antagande om lika observationskostnader är den allokering som använts?
Exempel i stickprovsteori p. 14/26 10. Tidningsläsning En pressorganisation undersökte hur många tidningar hushållen i en kommun prenumererade på. Det fanns totalt 3416 hushåll i kommunen. Kommunen delades in i 214 områden och undersökningen genomfördes som ett gruppurval av 10 områden. Antal Antal Område hushåll prenumerationer Område hushåll prenumerationer 1 16 11 6 12 31 2 10 19 7 18 16 3 14 15 8 10 26 4 12 17 9 14 20 5 13 13 10 17 28 1. Intervallskatta medelantalet prenumerationer per hushåll i hela kommunen. 2. Hur stort urval krävs för att halvera felmarginalen i (1)?
Exempel i stickprovsteori p. 15/26 8a Eftersom urvalsmetoden är OSU beräknas konfidensintervallet enligt formeln y ± z α/2 ( 1 n N ) s 2 n, med y = 779030, z α/2 = z 0.025 = 1.96, ( 1 n N ) s 2 n = ( 1 32 95 = 1. 559 3 10 5 ) 1083162 2 32
Exempel i stickprovsteori p. 16/26 Alltså blir konfidensintervallet 779030 ± 1.96 155930, 779030 ± 3056 20, dvs mellan 779030 + 3056 20 = 1084 650 och 779030 3056 20 = 473 410.
Exempel i stickprovsteori p. 17/26 8b Med precisionkravet (N ) n σ 2 2 N 1 n B = 2500000, får vi enligt formeln med σ 2 = s 2 = 1083162 2, att n B 2 4 Nσ 2, (N 1) + σ2 n 95 1083162 2 250000 2 4 (95 1) + 1083162 = 42.187 2 Det skulle alltså krävas att stickprovet bestod av minst 43 företag.
Exempel i stickprovsteori p. 18/26 9a Urvalsdesignen är stratifierat urval med likformig allokering (n 1 = n 2 = n 3 = n 4 = 50). Vi uppskattar först populationsmedelvärdet och gör en skattning av dess medelfel: y st = 4085 3520 752 + 18200 18200 620 + 5525 5070 452 + 18200 18200 429 = 0. 224 45 752 + 0.193 41 620 + 0.303 57 452 + 0.278 57 429 = 168. 79 + 119. 91 + 137. 21 + 119. 51 = 545. 42
Exempel i stickprovsteori p. 19/26 ( ) 2 ( 4085 V (y st ) = 1 50 ) 625 18200 4085 50 ( ) 2 ( 3520 + 1 50 ) 865 18200 3520 50 ( ) 2 ( 5525 + 1 50 ) 314 18200 5525 50 ( ) 2 ( 5070 + 1 50 ) 397 18200 5070 50 = 0. 62202 + 0. 63793 + 0.573 5 +. 61008 = 2. 4435
Exempel i stickprovsteori p. 20/26 Detta ger totalskattningen τ = Ny st = 18200 545. 42 = 9926644, och ett medelfel för totalen blir V ( τ) = N 2 V (y st ) = N V (y st ) = 18200 2. 4435 = 28450.0 Felmarginalen för totalskattningen blir alltså 1.96 28450 = 55762.
Exempel i stickprovsteori p. 21/26 9b Eftersom kostnaderna är desamma för alla strata använder vi Neymanallokering med de observerade standardavvikelserna som ersättning för σ i : N i σ i = 4085 625 + 3520 865 i + 5525 314 + 5070 397 = 102125 + 103526 + 97903. 2 + 101019 = 404574
Exempel i stickprovsteori p. 22/26 Detta ger n 1 = 200 102125 404574 n 2 = 200 103526 404574 n 3 = 200 97903. 2 404574 n 4 = 200 101019 404574 = 50. 485, = 51. 178, = 48. 398, = 49. 939 Och de optimala stickprovsstorlekarna innebär bara en mycket marginell justering, n 1 = n 2 = 51, n 3 = 48 och n 4 = 50.
Exempel i stickprovsteori p. 23/26 10a Detta är ett gruppurval med N = 214, M = 3416, m i = 136 och y i = 196. Detta ger M = M N = 3416 = 15. 962 6. 214 Som punktskattning för µ använder vi kvotskattningen y = yi mi = 196 136 = 1. 441 18, Vi behöver också räkna ut medelfelet för skattningen. Kräver lite energi...
Exempel i stickprovsteori p. 24/26 Vi beräknar först vad som kallas s 2 r eftersom den kvantiteten behövs i b-uppgiften. s 2 r = n i=1 (y i ym i ) 2 n 1 där n (y i ym i ) 2 = (11 1. 441 18 16) 2 i=1 + (19 1. 441 18 10) 2 + + (28 1. 441 18 17) 2 = 659.16
Exempel i stickprovsteori p. 25/26 så att s 2 r = 659.16 9 = 73.24 Så beräknar vi variansen för skattningen V (y) = ( ) N n NnM 2 s 2 r = 214 10 659.16 (214) (10) (15. 962 6) 2 9 = 0.02740 04, som i sin tur ger medelfelet V (y) = 0.02740 04 = 0. 165 531, och felmarginalen 1.96. 165 531 = 0. 324 441. Konfidensintervallet löper alltså mellan 1.44 0.32 = 1. 12 och 1.44 + 0.32 = 1. 76.
Exempel i stickprovsteori p. 26/26 10b Vi vill bestämma en stickprovsstorlek n så att felmarginalen blir högst lika med B = 0.32/2 = 0. 16. Erforderlig stickprovsstorlek är då n Nσ 2 r N B2 M 2 4 + σ 2 r, där vi använder s 2 r som uppskattning av σ 2 r. Vi får n 214 73. 24 214 (0.16)2 (15. 962 6) 2 4 + 73. 24 = 37. 121 3, dvs att stickprovet bör bestå av minst 38 slumpmässigt utvalda områden.