Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

Relevanta dokument
Laboration 4: Intervallskattning och hypotesprövning

Laboration 4: Intervallskattning och hypotesprövning

Laboration 5: Intervallskattning och hypotesprövning

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Laboration 4: Intervallskattning och hypotesprövning

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden

Laboration 4: Intervallskattning och hypotesprövning

Datorövning 3 Hypotesprövning och styrka

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Avd. Matematisk statistik

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsningsanteckningar till kapitel 8, del 2

Laboration 4: Hypotesprövning och styrkefunktion

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TAMS65 - Föreläsning 6 Hypotesprövning

Matematisk statistik för D, I, Π och Fysiker

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

SF1901 Sannolikhetsteori och statistik I

Lufttorkat trä Ugnstorkat trä

Binomialfördelning, två stickprov

TAMS65 - Föreläsning 6 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Föreläsning 12, FMSF45 Hypotesprövning

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Matematisk statistik för B, K, N, BME och Kemister

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

, s a. , s b. personer från Alingsås och n b

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Matematisk statistik för B, K, N, BME och Kemister

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsning 12: Repetition

Laboration 1: Grundläggande sannolikhetsteori, simulering och dataanalys

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Extrauppgifter - Statistik

Föreläsning 12: Regression

9. Konfidensintervall vid normalfördelning

KURSPROGRAM HT-10 MATEMATISK STATISTIK AK FÖR CDI, FMS 012

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

TMS136. Föreläsning 10

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Avd. Matematisk statistik

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Några extra övningsuppgifter i Statistisk teori

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Föreläsning 5. Kapitel 6, sid Inferens om en population

F3 Introduktion Stickprov

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Avd. Matematisk statistik

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Extrauppgifter i matematisk statistik

SF1901: Medelfel, felfortplantning

Matematisk statistik för B, K, N, BME och Kemister

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Matematisk statistik för D, I, Π och Fysiker

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Avd. Matematisk statistik

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Uppgift 1 P (A B) + P (B A) = 2 3. b) X är en diskret stokastisk variabel, som har de positiva hela talen som värden. Vi har. k s

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

0 om x < 0, F X (x) = c x. 1 om x 2.

Avd. Matematisk statistik

Föreläsningsanteckningar till kapitel 9, del 2

bli bekant med summor av stokastiska variabler.

Thomas Önskog 28/

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Blandade problem från maskinteknik

Tentamen i Matematisk statistik Kurskod S0001M

Transkript:

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02 Laboration 4: Intervallskattning och hypotesprövning Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden Intervallskattning Hypotesprövning Normalapproximation Dessutom får du möjlighet att arbeta igenom ett något större verkligt problem. Vi kommer att ägna oss åt statistisk analys av radonmätningar i bostadshus och försöka bedöma om gällande gränsvärden kan anses vara över- eller underskridna. 1 Förberedelseuppgifter Som förberedelse till laborationen bör du läsa igenom Kapitel 21 och 22 (Blom: Bok B (20 och 21 i gamla upplagan)) samt hela laborationshandledningen. Till laborationens start har du med dig lösningar till uppgifterna a) f): a) Ett intervall I θ som med sannolikheten 1 a täcker över θ kallas ett konfidensintervall för θ med konfidensgraden 1 a. Ge en frekvenstolkning av begreppet. b) Redogör för de viktigaste begreppen inom teorin för hypotesprövning; nollhypotes, mothypotes, signifikansnivå, kritiskt område och styrkefunktion. c) Redogör för sambandet mellan intervallskattning och hypotesprövning. Om jag vill testa H 0 : m = m 0 mot H 1 : m > m 0 med hjälp av motsvarande intervall. Hur skall detta intervall konstrueras, tvåsidigt, uppåt begränsat eller nedåt begränsat? d) Låt x 1, x 2,..., x n vara oberoende observationer av X Po(K l ) där K är en konstant. Bestäm ML-skattningen, l ML av l och ange dess varians. Om antalet observationer är någorlunda stort kan vi göra en normalapproximation av l ML. Vad blir väntevärde och varians i den approximerande fördelningen? e) Lös övningsuppgift ST29. f) Man vill veta om det är någon skillnad i livslängd mellan två olika fabrikat av batterier och undersöker därför 50 batterier av varje sort. Resultatet blev i timmar x = 4.82, ȳ = 4.13, s x = 1.88 och s y = 2.76. Testa med ett approximativt test på nivån 0.05om H 0 : m y = m x, (m y m x = 0), H 1 : m y < m x, (m y m x < 0). Alternativt går det lika bra att göra ett ensidigt uppåt begränsat konfidensintervall för m y m x och kontrollera om nollan är med i intervallet eller ej.

2 Laboration 4, Matstat AK för ED, VT02 2 Radon 2.1 Något om radonmätningar Radon är en ädelgas som är radioaktiv. Den vanligast förekommande isotopen har en halveringstid på 3,8 dygn. Radonisotopen sönderfaller till nya ämnen, s k radondöttrar, som i sin tur är radioaktiva med mycket kort halveringstid. Vid sönderfallen bildas alfa-partiklar, som, när de far fram, kan orsaka skada i sin allra närmaste omgivning. Om gasen eller någon av döttrarna har inandats utgör lungvävnaden den närmaste omgivningen. Radon och dess döttrar är delar av en lång s k sönderfallskedja som startar med uran och slutar med bly. Ett sätt att mäta radonkoncentrationen i inomhusluften är att hänga upp en alfa-känslig film. När den träffas av en alfa-partikel uppstår en skada i filmen i träffpunkten. Denna skada förstärks vid framkallning av filmen så att det blir ett hål i filmen. Bilden nedan visar hur ett hål kan se ut efter framkallning då man tittar på filmen i mikroskop. Hålen har maximalt diametern 7 m m. Antalet hål på en yta är ett mått på radonkoncentrationen. Figur 1: Framkallad alfa-känslig film. Bilden såväl som delar av texten har tillhandahållits av Gilbert Jönsson vid Atomfysik, LTH 2.2 Statistisk modell För att kunna göra en ordentlig statistisk analys av ett mätmaterial behöver vi mer statistisk kunskap om radioaktivt sönderfall. Det visar sig att tidpunkterna och platserna (rumskoordinaterna) för sönderfallen bildar en s k poisson-process (efter den franske matematikern Poisson). Poisson-processen behandlas utförligt i fortsättningskursen i stokastiska processer. Enkelt kan man säga att sannolikheten för att en given radonatom skall sönderfalla i ett givet tidsintervall är fix, och oberoende av vad som har hänt tidigare. Bl a innebär detta att antalet hål på en given yta av en film är poissonfördelat med ett väntevärde som är proportionellt mot radonkoncentrationen, exponeringstiden och ytans storlek. Vidare är antalet hål på olika disjunkta (ej överlappande) ytor på en film oberoende stokastiska variabler. Detta är vad som visar sig väsentligt i den fortsatta analysen. Det datamaterial som vi skall arbeta med har uppmätts genom att ett antal rum i en bostad har försetts med var sin film. Dessa filmer har efter framkallning avlästs på tio olika icke överlappande ytor, med fix storlek, var. Vi inför följande beteckningar: n = antalet upphängda filmer, dvs antalet rum, g i = radonkoncentrationen i rum i, mätt i Bq/m 3, X ij = antalet hål i film i på yta j, i = 1,..., n, j = 1,..., 10.

Laboration 4, Matstat AK för ED, VT02 3 Enligt ovan gäller då X ij Po(K g i), där proportionalitetskonstanten K, som nämnts, beror på avläsningsytornas storlek och exponeringstiden, men också på bl a förstoringen vid avläsningen av filmerna. 2.3 Punktskattning Det första datamaterialet är uppmätt i en nybyggd bostad den 24/3 25/4 1994. Detta skall tolkas så att filmerna hängdes upp vid en viss tidpunkt den första dagen och togs ned vid samma tidpunkt den sista dagen. Rum X ij Vardagsrum 20 17 22 15 20 22 24 22 34 20 Sovrum 14 15 17 13 14 11 15 16 22 15 Mikaels rum 11 17 19 14 25 17 18 16 23 21 Datamaterialet finns i radon200.dat och läses in på vanligt sätt. (Kolonn 1 innehåller mätvärdena för vardagsrummet, kolonn 2 sovrummet och kolonn 3 Mikaels rum.) >> load radon200.dat Konstanten K är 0.0962 (för en yta) vid 30 dagars exponering. Eftersom den aktuella exponeringstiden är längre måste en kompensation för detta göras. Enligt resonemanget i förra stycket skall detta helt enkelt göras linjärt, eftersom väntevärdena för X -variablerna är proportionella mot exponeringstiden. Eftersom våra filmer exponerats 32 dagar bör vårt värde på K vara 32 30 0.0962 = 0.1026. Uppgift 1: Använd den statistiska modellen för att hitta väntevärdesriktiga punktskattningar g av g i, i = 1, 2, 3 och beräkna dessa skattningar för datamaterialet ovan. Bestäm också V (g i ) och d(g i ). Utnyttja förberedelseuppgift d) eller att 10 j=1 X ij Po(10K g i). i Uppgift 2: Vi är också intresserade av g = 1 3 3 g i, i=1 dvs medelvärdet av radonkoncentrationen över de tre rummen. Beräkna också en skattning av denna storhet och ange dess varians och medelfel. Den skattning av g du får fram skall jämföras med gränsvärdet för nybyggda hus som är 200 Bq/m 3. Om gränsvärdet överstigs måste kostsamma åtgärder vidtagas.

4 Laboration 4, Matstat AK för ED, VT02 2.4 Intervallskattning För att på ett bättre sätt kunna uttala oss om huruvida radonkoncentrationen överstiger gränsvärdet eller ej, vill vi göra konfidensintervall för g i, i = 1, 2, 3 och g. Uppgift 3: För att kunna göra konfidensintervall för de punktskattningar som du tog fram ovan, måste vi känna till dessa skattningars fördelningar, åtminstone approximativt. Bestäm lämpliga approximationer av skattningarnas fördelningar. Uppgift 4: Tag fram ensidiga approximativa konfidensintervall för g i, i = 1, 2, 3 och g, och beräkna dem för datamaterialet ovan. Kan man för något rum med fog påstå att radonkoncentrationen ligger under eller över gränsvärdet? Vad gäller för medelvärdet över huset? 2.5 Hypotesprövning Man kan också välja att utföra analysen som ett hypotesprövningsproblem. Vi vill testa H 0 : g = 200 Bq/m 3 mot H 1 : g < 200 Bq/m 3. Egentligen är nollhypotesen g 200 Bq/m 3, men den enklare formuleringen ovan ger samma test som denna något mer komplicerade variant. Uppgift 5: Testa H 0 mot H 1. Kan vi förkasta H 0, dvs vågar vi påstå att radonhalten för huset ligger under gällande gränsvärde? Använd gärna resultaten i föregående avsnitt. 2.6 Data från äldre hus Den här uppgiften gör du bara om du hinner eller om du vill träna mer på tankegångarna ovan. Följande datamaterial är uppmätt i ett äldre hus den 6/12 1993 4/3 1994.

Laboration 4, Matstat AK för ED, VT02 5 Rum X ij Sovrum 1 13 9 11 12 10 12 12 14 9 12 Sovrum 2 10 12 8 10 11 10 15 12 12 13 Gillestuga 10 10 15 6 7 10 14 16 12 10 Datamaterialet finns i radon400.dat och läses in på vanligt sätt. Konstanten K är 0.00663 (för en yta) vid 30 dagars exponering. Uppgift 6: Utför analysen även på detta material. Gränsvärdet för den här typen av bostäder är 400 Bq/m 3. Om detta överskrids kan fastighetsägaren åläggas att vidtaga åtgärder.

6 Laboration 4, Matstat AK för ED, VT02 3 Mottagarkänslighet Under laboration 1 och i datamaterialet sensitivity.mat studerade vi mottagarkänslighet för 76 telefoner för en radiokanal kring 947.5 MHz (mitt på GSMs mottagarfrekvensband), kolonn 2, och för en radiokanal kring 935 (en kanal längst ner på frekvensbandet), kolonn 1. Under laboration 1 studerade vi histogrammen nedan och ställde frågan om det var någon skillnad mellan väntevärdena. >> load sensitivity >> slc=sensitivity(:,1); >> smc=sensitivity(:,2); >> x= -109:0.3:-104; >> subplot(2,1,1) >> hist(slc,x) >> grid >> subplot(2,1,2) >> hist(smc,x) >> axis([-110-104 0 40]) >> grid I histogrammen ser man en tydlig skillnad men är den signifikant? Uppgift 7: Beräkna medelvärde (mean) och standardavvikelse (std) för de två kolonnerna samt testa med ett approximativt test på nivån a om det finns någon skillnad mellan väntevärdena m smc och m slc (använd resultatet i förberedelseuppgift f). H 0 : m smc = m slc, H 1 : m smc < m slc. Om du vill får du gärna konstruera motsvarande approximativa konfidensintervall i stället och på så sätt avgöra om data styrker vår uppfattning om att känsligheten är sämre för kanaler nära frekvensbandets ändpunkter.