Avd. Matematisk statistik SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010 0 Allmänna anvisningar Arbeta med handledningen, och skriv rapport, i grupper om två eller tre personer. Närvaro vid laborationstiden kl. 12 15 onsdag 6/10 är frivilligt men rekommenderas! För godkänd laborationsdel av kursen krävs godkänd labrapport. Jag vill ha en första version av rapporten senast onsdag 13/10. Denna kan sedan eventuellt behöva justeras och/eller kompletteras för godkännande. 1 Laborationens syfte Denna laboration, eller kanske snarare beräkningsuppgift, handlar om att göra en statistisk analys av mätningar av radonhalten i bostadshus. Syftet är att du skall få möjlighet att ordentligt arbeta igenom en något större, helt verklig uppgift, för att på så sätt få lite inblick i vad konkret statistiskt arbete kan innebära. Använd gärna Matlab som räknehjälpmedel! 2 Något om radonmätningar Radon är en ädelgas som är radioaktiv. Den vanligast förekommande isotopen har en halveringstid på 3,8 dygn. Radonisotopen sönderfaller till nya ämnen, s k radondöttrar, som i sin tur är radioaktiva med mycket kort halveringstid. Vid sönderfallen bildas alfa-partiklar som, när de far fram, kan orsaka skada i sin allra närmaste omgivning. Om gasen eller någon av döttrarna har inandats utgör lungvävnaden den närmaste omgivningen. Radon och dess döttrar är delar av en lång s k sönderfallskedja som startar med uran och slutar med bly. Ett sätt att mäta radonkoncentrationen i inomhusluften är att hänga upp en alfa-känslig film. När den träffas av en alfa-partikel uppstår en skada 1
i filmen i träffpunkten. Denna skada förstärks vid framkallning av filmen så att det blir ett hål i filmen. Bilden nedan visar hur ett hål kan se ut efter framkallning då man tittar på filmen i mikroskop. Hålen har maximalt diametern 7 µm. Antalet hål på en yta är ett mått på radonkoncentrationen. Figur 1: Framkallad alfa-känslig film. Bilden såväl som delar av texten har tillhandahållits av Gilbert Jönsson vid Atomfysik, Lunds Tekniska Högskola. 3 Statistisk modell För att kunna göra en ordentlig statistisk analys av ett mätmaterial behöver vi mer statistisk kunskap om radioaktivt sönderfall. Det visar sig att tidpunkterna och platserna (rumskoordinaterna) för sönderfallen bildar en s k Poissonprocess (efter den franske matematikern Poisson). Poissonprocessen behandlas utförligt i fortsättningskursen i sannolikhetsteori. Enkelt kan man säga att sannolikheten för att en given radonatom skall sönderfalla i ett givet tidsintervall är fix, och oberoende av vad som har hänt tidigare. Bl a innebär detta att antalet hål på en given yta av en film är Poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationen, exponeringstiden och ytans storlek. Vidare är antalet hål på olika disjunkta (ej överlappande) ytor på en film oberoende stokastiska variabler. Detta är vad som visar sig väsentligt i den fortsatta analysen. Det datamaterial som vi skall arbeta med har uppmätts genom att ett antal rum i en bostad har försetts med var sin film. Dessa filmer har efter framkallning avlästs på tio olika icke överlappande ytor, med fix storlek, var. 2
Vi inför följande beteckningar: n = antalet upphängda filmer, dvs antalet rum; γ i = radonkoncentrationen i rum i, mätt i Bq/m 3 ; X ij = antalet hål i film i på yta j, i = 1,...,n, j = 1,...,10. Enligt ovan gäller då X ij Po(Kγ i ), där proportionalitetskonstanten K, som nämnts, beror på avläsningsytornas storlek och exponeringstiden, men också på bl a förstoringen vid avläsningen av filmerna. 4 Punktskattning Det första datamaterialet är uppmätt i en nybyggd bostad den 24/3 25/4 1994. Detta skall tolkas så att filmerna hängdes upp vid en viss tidpunkt den första dagen och togs ned vid samma tidpunkt den sista dagen. Rum Antal hål per observationsyta (X ij ) Vardagsrum 20, 17, 22, 15, 20, 22, 24, 22, 34, 20 Sovrum 14, 15, 17, 13, 14, 11, 15, 16, 22, 15 Mikaels rum 11, 17, 19, 14, 25, 17, 18, 16, 23, 21 Konstanten K är 0.0962 (för en yta) vid 30 dagars exponering. Eftersom den aktuella exponeringstiden är längre (32 dagar) måste en kompensation för detta göras. Enligt resonemanget i förra stycket skall detta helt enkelt göras linjärt, eftersom väntevärdena för X-variablerna är proportionella mot exponeringstiden. Med andra ord skall K skalas upp med en faktor 32/30 relativt det värde som gäller för 30 dagar. Uppgift 1: Använd den statistiska modellen för att hitta en väntevärdesriktig punktskattare γ i av radonkoncentrationen γ i i rum i. Utgå från X ij vad är väntevärdet för denna stokastiska variabel, och hur kan du kombinera samtliga mätningar ett rum i, dvs X ij för j = 3
1,2,...,10, för att få en bättre skattning av γ i? Vad har en summa av oberoende Poissonfördelade stokastiska variabler för fördelning? Beräkna dessa skattningar för datamaterialet ovan. Vi är också intresserade av γ = 1 n γ i, n dvs medelvärdet av radonkoncentrationen över alla rum. Hitta och beräkna en skattare γ även för denna storhet. Den skattning av γ du får fram skall jämföras med gränsvärdet för nybyggda hus som är 200 Bq/m 3. Om gränsvärdet överstigs måste (ofta kostsamma) åtgärder vidtagas. 5 Intervallskattning För att på ett bättre sätt kunna uttala oss om huruvida radonkoncentrationen överstiger gränsvärdet eller ej, vill vi göra konfidensintervall för γ i, i = 1,...,n och γ. Uppgift 2: För att kunna göra konfidensintervall från de punktskattningar som du tog fram ovan, måste vi känna till dessa skattningars fördelningar, åtminstone approximativt. Härled alltså skattningarnas fördelningar, eller lämpliga approximationer. Vad är variansen för Poissonfördelningen, och hur kan Poissonfördelningen approximeras när väntevärdet inte är alltför litet? Uppgift 3: Tag fram (ev approximativa) konfidensintervall för γ i, i = 1,...,n och γ. I dessa beräkningar kan det vara lämpligt att ersätta standardavvikelserna för skattarna γ i och γ (som vi inte känner, eftersom de beror av okända parametrar) med uppskattningar av desamma. Med andra ord kan standardavvikelserna ersättas med motsvarande medelfel. Beräkna konfidensintervallen för datamaterialet ovan. Kan man för något rum med fog påstå att radonkoncentrationen ligger under eller över gränsvärdet? Vad gäller för medelvärdet γ över huset? i=1 4
6 Hypotesprövning Man kan också välja att utföra analysen som ett hypotesprövningsproblem. Som boende i huset vill vi testa mot H 0 : γ = 200 Bq/m 3 H 1 : γ < 200 Bq/m 3. Egentligen är nollhypotesen γ 200 Bq/m 3, men den enkla nollhypotesen ovan ger samma test som denna något mer komplicerade variant. Uppgift 4: Testa H 0 mot H 1. Använd samma punktskattare som i föregående uppgift. Beräkna ett p-värde, eller ställ upp en signifikansnivå för testet först och beräkna sedan ett kritiskt område, dvs en gräns som avgör när H 0 skall förkastas. 5