SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Relevanta dokument
Laboration 4: Intervallskattning och hypotesprövning

Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

Laboration 4: Intervallskattning och hypotesprövning

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

Laboration 4: Intervallskattning och hypotesprövning

Laboration 5: Intervallskattning och hypotesprövning

Datorövning 3 Hypotesprövning och styrka

Laboration 4: Intervallskattning och hypotesprövning

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Avd. Matematisk statistik

Föreläsning 12: Repetition

Föreläsningsanteckningar till kapitel 8, del 2

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Avd. Matematisk statistik

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Binomialfördelning, två stickprov

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 12: Regression

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Studiehandledning S0001M Matematisk statistik Läsperiod 2, HT 2017

Matematisk statistik KTH. Formelsamling i matematisk statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Tentamen i Matematisk statistik Kurskod S0001M

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i Matematisk statistik Kurskod S0001M

Lärmål Sannolikhet, statistik och risk 2015

SF1901: Medelfel, felfortplantning

Avd. Matematisk statistik

Uppgift 1. f(x) = 2x om 0 x 1

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

SF1901 Sannolikhetsteori och statistik I

Studiehandledning S0001M Matematisk statistik Läsperiod 4, VT 2017

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Några extra övningsuppgifter i Statistisk teori

Avd. Matematisk statistik

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Laboration 4: Hypotesprövning och styrkefunktion

Våra vanligaste fördelningar

, s a. , s b. personer från Alingsås och n b

TMS136. Föreläsning 10

KURSPROGRAM HT-10 MATEMATISK STATISTIK AK FÖR CDI, FMS 012

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 7: Punktskattningar

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

TENTAMEN I STATISTIKENS GRUNDER 2

Matematisk statistik för D, I, Π och Fysiker

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Avd. Matematisk statistik

Problemdel 1: Uppgift 1

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 7: Punktskattningar

Jörgen Säve-Söderbergh

f(x) = 2 x2, 1 < x < 2.

Matematisk statistik TMS064/TMS063 Tentamen

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Studiehandledning S0001M Matematisk statistik Läsperiod 2, Ht 2013

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Statistiska metoder för säkerhetsanalys

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

1 e (λx)β, för x 0, F X (x) = 0, annars.

4 Diskret stokastisk variabel

Transkript:

Avd. Matematisk statistik SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010 0 Allmänna anvisningar Arbeta med handledningen, och skriv rapport, i grupper om två eller tre personer. Närvaro vid laborationstiden kl. 12 15 onsdag 6/10 är frivilligt men rekommenderas! För godkänd laborationsdel av kursen krävs godkänd labrapport. Jag vill ha en första version av rapporten senast onsdag 13/10. Denna kan sedan eventuellt behöva justeras och/eller kompletteras för godkännande. 1 Laborationens syfte Denna laboration, eller kanske snarare beräkningsuppgift, handlar om att göra en statistisk analys av mätningar av radonhalten i bostadshus. Syftet är att du skall få möjlighet att ordentligt arbeta igenom en något större, helt verklig uppgift, för att på så sätt få lite inblick i vad konkret statistiskt arbete kan innebära. Använd gärna Matlab som räknehjälpmedel! 2 Något om radonmätningar Radon är en ädelgas som är radioaktiv. Den vanligast förekommande isotopen har en halveringstid på 3,8 dygn. Radonisotopen sönderfaller till nya ämnen, s k radondöttrar, som i sin tur är radioaktiva med mycket kort halveringstid. Vid sönderfallen bildas alfa-partiklar som, när de far fram, kan orsaka skada i sin allra närmaste omgivning. Om gasen eller någon av döttrarna har inandats utgör lungvävnaden den närmaste omgivningen. Radon och dess döttrar är delar av en lång s k sönderfallskedja som startar med uran och slutar med bly. Ett sätt att mäta radonkoncentrationen i inomhusluften är att hänga upp en alfa-känslig film. När den träffas av en alfa-partikel uppstår en skada 1

i filmen i träffpunkten. Denna skada förstärks vid framkallning av filmen så att det blir ett hål i filmen. Bilden nedan visar hur ett hål kan se ut efter framkallning då man tittar på filmen i mikroskop. Hålen har maximalt diametern 7 µm. Antalet hål på en yta är ett mått på radonkoncentrationen. Figur 1: Framkallad alfa-känslig film. Bilden såväl som delar av texten har tillhandahållits av Gilbert Jönsson vid Atomfysik, Lunds Tekniska Högskola. 3 Statistisk modell För att kunna göra en ordentlig statistisk analys av ett mätmaterial behöver vi mer statistisk kunskap om radioaktivt sönderfall. Det visar sig att tidpunkterna och platserna (rumskoordinaterna) för sönderfallen bildar en s k Poissonprocess (efter den franske matematikern Poisson). Poissonprocessen behandlas utförligt i fortsättningskursen i sannolikhetsteori. Enkelt kan man säga att sannolikheten för att en given radonatom skall sönderfalla i ett givet tidsintervall är fix, och oberoende av vad som har hänt tidigare. Bl a innebär detta att antalet hål på en given yta av en film är Poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationen, exponeringstiden och ytans storlek. Vidare är antalet hål på olika disjunkta (ej överlappande) ytor på en film oberoende stokastiska variabler. Detta är vad som visar sig väsentligt i den fortsatta analysen. Det datamaterial som vi skall arbeta med har uppmätts genom att ett antal rum i en bostad har försetts med var sin film. Dessa filmer har efter framkallning avlästs på tio olika icke överlappande ytor, med fix storlek, var. 2

Vi inför följande beteckningar: n = antalet upphängda filmer, dvs antalet rum; γ i = radonkoncentrationen i rum i, mätt i Bq/m 3 ; X ij = antalet hål i film i på yta j, i = 1,...,n, j = 1,...,10. Enligt ovan gäller då X ij Po(Kγ i ), där proportionalitetskonstanten K, som nämnts, beror på avläsningsytornas storlek och exponeringstiden, men också på bl a förstoringen vid avläsningen av filmerna. 4 Punktskattning Det första datamaterialet är uppmätt i en nybyggd bostad den 24/3 25/4 1994. Detta skall tolkas så att filmerna hängdes upp vid en viss tidpunkt den första dagen och togs ned vid samma tidpunkt den sista dagen. Rum Antal hål per observationsyta (X ij ) Vardagsrum 20, 17, 22, 15, 20, 22, 24, 22, 34, 20 Sovrum 14, 15, 17, 13, 14, 11, 15, 16, 22, 15 Mikaels rum 11, 17, 19, 14, 25, 17, 18, 16, 23, 21 Konstanten K är 0.0962 (för en yta) vid 30 dagars exponering. Eftersom den aktuella exponeringstiden är längre (32 dagar) måste en kompensation för detta göras. Enligt resonemanget i förra stycket skall detta helt enkelt göras linjärt, eftersom väntevärdena för X-variablerna är proportionella mot exponeringstiden. Med andra ord skall K skalas upp med en faktor 32/30 relativt det värde som gäller för 30 dagar. Uppgift 1: Använd den statistiska modellen för att hitta en väntevärdesriktig punktskattare γ i av radonkoncentrationen γ i i rum i. Utgå från X ij vad är väntevärdet för denna stokastiska variabel, och hur kan du kombinera samtliga mätningar ett rum i, dvs X ij för j = 3

1,2,...,10, för att få en bättre skattning av γ i? Vad har en summa av oberoende Poissonfördelade stokastiska variabler för fördelning? Beräkna dessa skattningar för datamaterialet ovan. Vi är också intresserade av γ = 1 n γ i, n dvs medelvärdet av radonkoncentrationen över alla rum. Hitta och beräkna en skattare γ även för denna storhet. Den skattning av γ du får fram skall jämföras med gränsvärdet för nybyggda hus som är 200 Bq/m 3. Om gränsvärdet överstigs måste (ofta kostsamma) åtgärder vidtagas. 5 Intervallskattning För att på ett bättre sätt kunna uttala oss om huruvida radonkoncentrationen överstiger gränsvärdet eller ej, vill vi göra konfidensintervall för γ i, i = 1,...,n och γ. Uppgift 2: För att kunna göra konfidensintervall från de punktskattningar som du tog fram ovan, måste vi känna till dessa skattningars fördelningar, åtminstone approximativt. Härled alltså skattningarnas fördelningar, eller lämpliga approximationer. Vad är variansen för Poissonfördelningen, och hur kan Poissonfördelningen approximeras när väntevärdet inte är alltför litet? Uppgift 3: Tag fram (ev approximativa) konfidensintervall för γ i, i = 1,...,n och γ. I dessa beräkningar kan det vara lämpligt att ersätta standardavvikelserna för skattarna γ i och γ (som vi inte känner, eftersom de beror av okända parametrar) med uppskattningar av desamma. Med andra ord kan standardavvikelserna ersättas med motsvarande medelfel. Beräkna konfidensintervallen för datamaterialet ovan. Kan man för något rum med fog påstå att radonkoncentrationen ligger under eller över gränsvärdet? Vad gäller för medelvärdet γ över huset? i=1 4

6 Hypotesprövning Man kan också välja att utföra analysen som ett hypotesprövningsproblem. Som boende i huset vill vi testa mot H 0 : γ = 200 Bq/m 3 H 1 : γ < 200 Bq/m 3. Egentligen är nollhypotesen γ 200 Bq/m 3, men den enkla nollhypotesen ovan ger samma test som denna något mer komplicerade variant. Uppgift 4: Testa H 0 mot H 1. Använd samma punktskattare som i föregående uppgift. Beräkna ett p-värde, eller ställ upp en signifikansnivå för testet först och beräkna sedan ett kritiskt område, dvs en gräns som avgör när H 0 skall förkastas. 5