Laboration 4: Intervallskattning och hypotesprövning

Relevanta dokument
Laboration 4: Intervallskattning och hypotesprövning

Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

Laboration 4: Intervallskattning och hypotesprövning

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Laboration 4: Intervallskattning och hypotesprövning

Laboration 5: Intervallskattning och hypotesprövning

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Datorövning 3 Hypotesprövning och styrka

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

bli bekant med summor av stokastiska variabler.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Avd. Matematisk statistik

Laboration 4: Hypotesprövning och styrkefunktion

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Matematisk statistik för D, I, Π och Fysiker

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 12: Repetition

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 12: Regression

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik KTH. Formelsamling i matematisk statistik

Avd. Matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

0 om x < 0, F X (x) = c x. 1 om x 2.

Binomialfördelning, två stickprov

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

Laboration 4: Lineär regression

Avd. Matematisk statistik

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Avd. Matematisk statistik

Laboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08

Laboration 3: Parameterskattning och Fördelningsanpassning

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Avd. Matematisk statistik

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Matematisk statistik för D, I, Π och Fysiker

9. Konfidensintervall vid normalfördelning

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

TAMS65 - Föreläsning 6 Hypotesprövning

, s a. , s b. personer från Alingsås och n b

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Lufttorkat trä Ugnstorkat trä

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

3 Maximum Likelihoodestimering

Tentamen i Matematisk statistik Kurskod S0001M

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

TMS136. Föreläsning 4

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Uppgift 1. f(x) = 2x om 0 x 1

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Avd. Matematisk statistik

TMS136. Föreläsning 13

Mer om konfidensintervall + repetition

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

Transkript:

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 4 MATEMATISK STATISTIK AK FÖR I, FMS012, HT08 Laboration 4: Intervallskattning och hypotesprövning Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden Intervallskattning Hypotesprövning Normalapproximation Dessutom får du möjlighet att arbeta igenom ett något större verkligt problem. Vi kommer att ägna oss åt statistisk analys av radonmätningar i bostadshus och försöka bedöma om gällande gränsvärden kan anses vara över- eller underskridna. 1 Förberedelseuppgifter Som förberedelse till laborationen bör du läsa igenom Kapitel 12 och 13 i kursboken samt hela laborationshandledningen. Till laborationens start har du med dig lösningar till förberedelseuppgifterna 1. 1. Vi har observationer x 1, x 2,..., x n som är oberoende och exponentialfördelade med väntevärdet a. Härled ML- och MK-skattningarna av a. 2. Ett intervall I θ som med sannolikheten 1 täcker över θ kallas ett konfidensintervall för θ med konfidensgraden 1. Ge en frekvenstolkning av begreppet, dvs ungefär hur stor andel av intervallen kommer att täcka θ om man gör många konfidensintervall med konfidensgraden t.ex 1 = 0.95? 3. Redogör för de viktigaste begreppen inom teorin för hypotesprövning; nollhypotes, mothypotes, signifikansnivå och P-värde (direktmetoden). 4. Redogör för sambandet mellan intervallskattning och hypotesprövning. Om jag vill testa H 0 : Ñ = Ñ0 mot H 1 : Ñ > Ñ0 med hjälp av motsvarande intervall. Hur skall detta intervall konstrueras, tvåsidigt, uppåt begränsat eller nedåt begränsat? 5. Om X Po(Ñ), vad är då väntevärdet E(X ) och vad är då variansen V (X )? 6. Om X 1 Po(Ñ1) och X 2 Po(Ñ2), X 1 och X 2 oberoende, vilken fördelning har då X 1 + X 2? Är 2X 1 poissonfördelad? Motivera. 7. När kan den Poissonfördelade variabeln X approximeras med en normalfördelning? Hur ser den normalfördelningen ut? 1 OBS! Fler förberedelseuppgifter på nästa sida.

2 Laboration 4, Matstat AK för I, HT08 8. Antag nu att du har ett stickprov x 1,...,x n som är observationer av X 1,...,X n som alla är Poissonfördelade Po(Ñ). Härled maximum-likelihood-skattningen av Ñ. 9. Beräkna väntevärde och varians för denna skattning, dvs beräkna E(Ñ ) och V (Ñ ). 10. Antag att du vill ha ett numeriskt värde på V (Ñ ) hur gör du då? Dvs hur beräknas medelfelet d(ñ )? 11. Nu vill du göra ett konfidensintervall för Ñ, hur ska detta se ut om du kan använda principen för konfidensintervall baserade på normalapproximation? 12. I labben kommer Ñ att t.ex. vara av formen K där K är en känd konstant och du är intresserad av. Tänk efter hur resultaten i 8-11 kommer att förändras när du vill göra skattningar och intervall för. 13. Vi har två stora, oberoende stickprov x 1,..., x n1 med E(X i ) = Ñ1 och V(X i ) = 2 samt y 1,..., y n2 med E(Y i ) = Ñ2 och V(Y i ) = 2 där Ñ1, Ñ2 och är okända. Hur kan du med ett konfidensintervall undersöka om Ñ1 < Ñ2? 2 Punktskattningar 2.1 ML- och MK-skattning Vi skall i den här uppgiften titta lite närmare på två av de vanligaste skattningsmetoderna i statistiken, nämligen ML- och MK-skattning. Vi skall bl.a. se att ML-skattning är ett maximeringsproblem medan MK-skattning kan ses som ett minimeringsproblem. I filen matdata.dat (som finns på kursens hemsida) har vi 150 mätningar av livslängden (enhet: timmar) av en viss komponent i en bil. Livslängden hos varje komponent antages vara oberoende av alla andra komponenter. Ladda in data och gör en första undersökning av livslängderna. >> load matdata.dat >> plot(matdata, * ) >> hist(matdata) Vi är intresserade av att skatta medellivslängden för komponenten. En variant att göra detta på är att göra en ML-skattning av a. För att kunna göra en ML-skattning måste vi ha en uppfattning om vilken fördelning data har. Från liknande experiment som gjorts tidigare har det visat sig att livslängden hos en viss komponent är approximativt exponentialfördelad. Alltså, vi antar att livslängden är exponentialfördelad med väntevärde a och ställer upp log-likelihoodfunktionen. Hur ser den ut? Svar: l(a) = ln L(a) =... Det finns (på kursens hemsida) en specialskriven m-fil, ML_exp, som beräknar l(a). Studeram-filens MATLAB-kommandon och förvissa dig om att den verkligen ger rätt funktion! (type ML_exp) Rita upp l(a), då 30 a 150. Hur ser funktionen ut och vilket värde på a motsvarar MLskattningen? (Du kan använda kommandotzoom för att förstora delar av figuren.) >> a=[30:.5:150]; >> l=ml_exp(a,matdata); >> plot(a,l) >> grid

Laboration 4, Matstat AK för I, HT08 3 Nu går vi över och tittar på hur en MK-skattning av medellivslängden ser ut. Fördelen med MK jämfört med ML är att fördelningen för data ej behöver vara känd. Börja nu med att ställa upp förlustfunktionen, Q(a). Svar: Q(a) =... Programmet MK_exp (som du hittar på hemsidan) är specialskrivet för att beräkna Q(a). Titta på MATLAB-kommandona för att kolla att det stämmer! Rita ut Q(a). Vilket värde på a motsvarar MK-skattningen? >> Q=MK_exp(a,matdata); >> plot(a,q) >> grid Både ML- och MK-skattningen av a är enkel att beräkna, se förberedelseuppgift (1). Beräkna aml och amk och jämför med dina figurer. Här blev ML- och MK-skattningarna lika, det är inte alltid fallet. 2.2 Skattningen a är en stokastisk variabel! Om vi skulle ta 150 nya mätningar av livslängden hos ovanstående komponenter (dvs ett nytt stickprov) så skulle skattningen av medelvärdet med säkerhet bli annorlunda, dvs skattningen kan ses som en stokastisk variabel. För att illustrera detta tänker vi oss att vi tar 1000 stickprov med 150 mätningar i varje stickprov. Eftersom vi inte har 1000 riktiga stickprov så får vi nöja oss med att simulera data. Genom att utnyttja funktionenexprnd kan vi enkelt generera exponentialfördelade slumptal. Vi antar att det sanna medelvärdet är 100, dvs a = 100 >> help exprnd >> a=100; >> x=exprnd(a,150,1000); Kolonn nummer i i matrisen x motsvarar stickprov i. Nu skall vi skatta a för varje stickprov. Det kan göras enkelt enligt >> a_est=mean(x); Element i i vektorn a_est innehåller skattningen av medelvärdet för stickprov i. Plotta a_est! Hur ser det ut? Vilken ungefärlig fördelning har skattningen av medelvärdet? Använd dig av kommandona hist och normplot och dina nyförvärvade kunskaper om Stora talens lag och Centrala gränsvärdessatsen för att ta reda på detta. 3 Mottagarkänslighet Under laboration 1 och i datamaterialet sensitivity.mat studerade vi mottagarkänslighet för 76 telefoner för en radiokanal kring 947.5 MHz (mitt på GSMs mottagarfrekvensband), kolonn 2, och

4 Laboration 4, Matstat AK för I, HT08 för en radiokanal kring 935 (en kanal längst ner på frekvensbandet), kolonn 1. Ett högre värde på mottagarkänsligheten motsvarar att det behövs en högre mottagen signaleffekt för att nå något visst resultat i mottagaren. Under laboration 1 studerade vi histogrammen nedan och ställde frågan om det var någon skillnad mellan väntevärdena. >> load sensitivity >> slc=sensitivity(:,1); >> smc=sensitivity(:,2); >> x= -109:0.3:-104; >> subplot(2,1,1) >> hist(slc,x) >> grid >> subplot(2,1,2) >> hist(smc,x) >> axis([-110-104 0 40]) >> grid I histogrammen ser man en tydlig skillnad men är den signifikant? ( statistiskt säkerställd )? 3.1 Skillnad mellan väntevärden Uppgift: Antag att förutsättningarna i förberedelseuppgift 13 är uppfyllda och beräkna medelvärde (mean) och standardavvikelse (std) förslc ochsmc samt testa med ett approximativt test om Ñsmc är signifikant mindre än Ñslc (använd resultatet i förberedelseuppgift 13). H 0 : Ñsmc = Ñslc, H 1 : Ñsmc < Ñslc. Svar: Anm. Egentligen är mätningarna i de två dataserierna tagna på samma telefoner (första elementet i de två serierna från en telefon osv) så egentligen är modellen stickprov i par lämpligare i detta fall. Prova även att basera testet på denna modell om du hunnit gå igenom det. 4 Radon 4.1 Något om radonmätningar Radon är en ädelgas som är radioaktiv. Den vanligast förekommande isotopen har en halveringstid på 3,8 dygn. Radonisotopen sönderfaller till nya ämnen, s k radondöttrar, som i sin tur är radioaktiva med mycket kort halveringstid. Vid sönderfallen bildas alfa-partiklar, som, när de far fram, kan orsaka skada i sin allra närmaste omgivning. Om gasen eller någon av döttrarna har inandats utgör lungvävnaden den närmaste omgivningen. Radon och dess döttrar är delar av en lång s k sönderfallskedja som startar med uran och slutar med bly. Ett sätt att mäta radonkoncentrationen i inomhusluften är att hänga upp en alfa-känslig film. När den träffas av en alfa-partikel uppstår en skada i filmen i träffpunkten. Denna skada förstärks vid framkallning av filmen så att det blir ett hål i filmen. Bilden nedan visar hur ett hål kan se ut efter

Laboration 4, Matstat AK för I, HT08 5 framkallning då man tittar på filmen i mikroskop. Hålen har maximalt diametern 7 Ñm. Antalet hål på en yta är ett mått på radonkoncentrationen. Figur 1: Framkallad alfa-känslig film. Bilden såväl som delar av texten har tillhandahållits av Gilbert Jönsson vid Atomfysik, LTH 4.2 Statistisk modell För att kunna göra en ordentlig statistisk analys av ett mätmaterial behöver vi mer statistisk kunskap om radioaktivt sönderfall. Det visar sig att tidpunkterna och platserna (rumskoordinaterna) för sönderfallen bildar en s k poisson-process (efter den franske matematikern Poisson). Poisson-processen behandlas utförligt i fortsättningskursen i stokastiska processer. Enkelt kan man säga att sannolikheten för att en given radonatom skall sönderfalla i ett givet tidsintervall är fix, och oberoende av vad som har hänt tidigare. Bl a innebär detta att antalet hål på en given yta av en film är poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationen, exponeringstiden och ytans storlek. Vidare är antalet hål på olika disjunkta (ej överlappande) ytor på en film oberoende stokastiska variabler. Detta är vad som visar sig väsentligt i den fortsatta analysen. Det datamaterial som vi skall arbeta med har uppmätts genom att ett antal rum i en bostad har försetts med var sin film. Dessa filmer har efter framkallning avlästs på tio olika icke överlappande ytor, med fix storlek, var. Vi inför följande beteckningar: n = antalet upphängda filmer, dvs antalet rum, i = radonkoncentrationen i rum i, mätt i Bq/m 3, X ij = antalet hål i film i på yta j, i = 1,..., n, j = 1,..., 10. Enligt ovan gäller då X ij Po(K i), där proportionalitetskonstanten K, som nämnts, beror på avläsningsytornas storlek och exponeringstiden, men också på bl a förstoringen vid avläsningen av filmerna. 5 Arbete med data Datamaterialet är uppmätt i en nybyggd bostad den 24/3 25/4 1994. Detta skall tolkas så att filmerna hängdes upp vid en viss tidpunkt den första dagen och togs ned vid samma tidpunkt den sista dagen.

6 Laboration 4, Matstat AK för I, HT08 i Rum X ij 1 Vardagsrum 20 17 22 15 20 22 24 22 34 20 2 Sovrum 14 15 17 13 14 11 15 16 22 15 3 Mikaels rum 11 17 19 14 25 17 18 16 23 21 Datamaterialet finns iradon200.dat och läses in på vanligt sätt. Kolonn 1 innehåller mätvärdena för vardagsrummet, kolonn 2 sovrummet och kolonn 3 Mikaels rum. Konstanten K är 0.0962 för en yta vid 30 dagars exponering. Eftersom den aktuella exponeringstiden är längre måste en kompensation för detta göras. Enligt resonemanget i förra stycket skall detta helt enkelt göras linjärt, eftersom väntevärdena för X -variablerna är proportionella mot exponeringstiden. Eftersom våra filmer exponerats 32 dagar bör vårt värde på K vara 0.0962 32/30 = 0.1026. Syftet med analysen av datamaterialet är att utreda om gränsvärdet på 200 Bq/m 3 överskrids. Vi kommer att beräkna punktskattningar av radonkoncentrationen dels för rummen var för sig, dels för hela huset. Punktskattningarna kommer att kompletteras med motsvarande intervallskattningar. 5.1 Punktskattningar Uppgift: Vi startar med att studera de tre rummen var för sig. Tänk igenom att en väntevärdesriktig punktskattning i av i, i = 1, 2, 3, ges av i = 1 10K 10 X ij. Beräkna skattningarna för datamaterialet ovan: För att gå vidare i vår statistiska analys och (så småningom) beräkna konfidensintervall behöver vi ta reda på statistiska egenskaper hos punktskattningarna. Uppgift: Här beräknas V( i ). V( i ) = V 1 10 10K X ij = 1 (10K ) 2 V 10 V (X ij ) = 1 (10K ) 2 10K i = i 10K Använd detta till att beräkna medelfelen d( i ) för var och en av de tre rummen. Uppgift: Vi studerar nu medelvärdet av radonkoncentrationen över de tre rummen, vilken ges av = 1 3 3 i. i=1 En skattning av denna storhet ges av = 1 3 3 i=1 i,

Laboration 4, Matstat AK för I, HT08 7 med i som tidigare i texten. Variansen för skattningen blir (återigen egenskaper hos Poissonfördelning) ( 10 1 V( ) = V 30K ( 10 10 ) X 1j + X 2j + X 3j ) = 1 (30K ) 2 10K ( 1 + 2 + 3). och du inser nog själv hur motsvarande medelfel erhålles. Beräkna detta medelfel. Den skattning av du får fram skall jämföras med gränsvärdet för nybyggda hus som är 200 Bq/m 3. Om gränsvärdet överstigs måste kostsamma åtgärder vidtagas. Punktskattningen kompletteras nedan med ett approximativt konfidensintervall och vi behöver då de beräknade medelfelen. 5.2 Intervallskattning För att på ett bättre sätt kunna uttala oss om huruvida radonkoncentrationen överstiger gränsvärdet eller ej, vill vi göra konfidensintervall för i, i = 1, 2, 3 (varje enskilt rum) samt (medelvärde över alla rum). Uppgift: För att kunna göra konfidensintervall för de punktskattningar som du tog fram ovan, måste vi känna till dessa skattningars fördelningar, åtminstone approximativt. Bestäm lämpliga approximationer av skattningarnas fördelningar. Uppgift: Konfidensintervall kan vara tvåsidiga eller ensidiga, ensidiga intervall kan dessutom vara uppåt begränsade eller nedåt begränsade. Vilken typ av intervall för radonkoncentrationen är intressant för invånarna i huset att studera? Uppgift: Beräkna konfidensintervall (den typ som ni bestämt) för i, i = 1, 2, 3 och. Använd en approximativ konfidensgrad på 0.95. Kan man för något rum med fog påstå att radonkoncentrationen ligger under eller över gränsvärdet? Vad gäller för medelvärdet över huset?

8 Laboration 4, Matstat AK för I, HT08 5.3 Hypotesprövning Man kan också välja att utföra analysen som ett hypotesprövningsproblem. Vi vill testa H 0 : = 200 Bq/m 3, H 1 : < 200 Bq/m 3. Uppgift: Testa H 0 mot H 1. Kan vi förkasta H 0, dvs vågar vi påstå att radonhalten för huset ligger under gällande gränsvärde? Använd resultaten i föregående avsnitt. 5.4 Hypotesprövning med direktmetoden Tidigare gjorde vi punkt- och intervallskattingar av i och vilket ger kvantitativ information om var de sanna värdena kan tänkas ligga. För att göra hypotestest är konfidensmetoden som vi använde i föregående avsnitt användbar. Problemet i det här fallet är dock att det baseras på normalapproximation och testet blir därmed inte exakt. För att göra testen utan approximation kan vi i det här fallet i stället använda direktmetoden, dvs vi räknar ut ett P-värde som P = P(Få det vi fått eller värre om H 0 är sann) och förkasta H 0 om P <. För att räkna utan normalapproximation kan vi räkna direkt med observationerna X ij Po(K i) och framförallt utnyttja att summan av observationerna i ett rum även är Poissonfördelad, 10 X ij Po(10K i). Uppgift: Beräkna P-värdena för vart och ett av rummen och avgör om nollhypotesen skall förkastas eller ej enligt direktmetoden. Uppgift: Summan av samtliga observationer i alla rummen är även poissonfördelad. Räkna ut ett P-värde som gäller för hela huset och avgör med direktmetoden om H 0 skall förkastas. Tack! Tack till Gilbert Jönsson vid Atomfysik, LTH som gett oss datamaterial och hjälpt till med bakgrundsbeskrivningen av radonmätningarna.