Lektion 7. Radioaktivt sönderfall Bakgrundsräkning Vad är en hypotes? χ 2 -test (chi-kvadrattest) Fysikexperiment, 7.

Relevanta dokument
Föreläsning 7 FK2002

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

4.1 Grundläggande sannolikhetslära

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

7.5 Experiment with a single factor having more than two levels

, s a. , s b. personer från Alingsås och n b

4 Diskret stokastisk variabel

Kapitel 10 Hypotesprövning

Experimentella metoder 2014, Räkneövning 1

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 5: Hypotesprövningar

TAMS65 - Föreläsning 6 Hypotesprövning

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Kort om mätosäkerhet

Gamla tentor (forts) ( x. x ) ) 2 x1

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Fysikexperiment, 7.5 hp 1

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

TAMS65 - Föreläsning 6 Hypotesprövning

F3 Introduktion Stickprov

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Del A: Begrepp och grundläggande förståelse

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Experimentella metoder 2014, Räkneövning 4

TMS136. Föreläsning 11

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Hur skriver man statistikavsnittet i en ansökan?

TMS136. Föreläsning 4

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

FACIT (korrekta svar i röd fetstil)

Grundläggande matematisk statistik

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Avd. Matematisk statistik

4.2.1 Binomialfördelning

Neutronaktivering. Laboration i 2FY808 - Tillämpad kvantmekanik

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Experimentella metoder, FK3001. Datorövning: Finn ett samband

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Föreläsning 12: Regression

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Grundläggande matematisk statistik

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 5. Kapitel 6, sid Inferens om en population

Sänkningen av parasitnivåerna i blodet

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Uppgift 1. Produktmomentkorrelationskoefficienten

F9 SAMPLINGFÖRDELNINGAR (NCT

Matematisk statistik för D, I, Π och Fysiker

Föreläsning G60 Statistiska metoder

import totalt, mkr index 85,23 100,00 107,36 103,76

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Kundts rör - ljudhastigheten i luft

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

STOCKHOLMS UNIVERSITET FYSIKUM

2. Test av hypotes rörande medianen i en population.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Statistik 1 för biologer, logopeder och psykologer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Repetition 2, inför tentamen

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

STOCKHOLMS UNIVERSITET FYSIKUM

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

MVE051/MSG Föreläsning 7

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Lösningar 15 december 2004

8 Inferens om väntevärdet (och variansen) av en fördelning

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Avd. Matematisk statistik

Föreläsning G60 Statistiska metoder

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

1.1 Diskret (Sannolikhets-)fördelning

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

1. Du slår en tärning två gånger. Låt A vara händelsen att det första kastet blir en sexa och låt B vara händelsen att summan av kasten blir sju.

Lärare 1. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Transkript:

Lektion 7 Radioaktivt sönderfall Bakgrundsräkning Vad är en hypotes? χ 2 -test (chi-kvadrattest) 2010-11-15 Fysikexperiment, 7.5 hp 1 1

Radioaktivt sönderfall För varje specifik isotop gäller att sannolikheten för att en kärna skall sönderfalla under ett tidsintervall dt är l dt. Om vi har N stycken kärnor närvarande förväntas alltså dn = Nλdt kärnor sönderfall under tiden dt ( tecknet anger att N minskar). Antalet kvarvarande kärnor efter en viss tid t kan beskrivas av N( t) = N 0 e Räknehastigheten blir: n ( t ) λt dn ( t ) dt (sönderfallslagen) λ t = = N 0 e = n 0 λ t 2010-11-15 Fysikexperiment, 7.5 hp 2 λ e Notera att den momentana räknehastigheten vid tiden t = 0 är n(0) = n 0 = ln 0. Aktiviteten i varje tidsögonblick är n (y) = ln(t). 2

Sönderfallskurvan För varje halveringstid som går halveras mängden aktivt material. Halveringstiden T 1/2 definieras genom relationen N T λt1/ 2 0 / 2 = N0e 1/ 2 = ln 2 λ 2010-11-15 Fysikexperiment, 7.5 hp 3 Notera definitionen av halveringstiden T 1/2. Halveringstiden har den praktiska betydelsen att när en halveringstid har gått har aktiviteten (eller antalet sönderfallande isotoper) halverats. 3

Fördelningar med bakgrund OBS logskala! 10 1 Rod - signal Bla - bakgrund Svart - signal + bakgrund 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 Räknehastigheten i ett experiment med radioaktivt sönderfall. n ( t ) Funktionen kan lineariseras genom logaritmering: ln [ n ( t )] = ln [ n 0 ] λ t En konstant bakgrund ger emellertid ett ickelinjärt bidrag till logaritmen. För att kunna bestämma sönderfallskonstanten måste den konstanta bakgrunden först subtraheras och vi får i varje intervall: N signal = N s+b - N bakgrund med osäkerhet σ + = signal s+ b = n 0 e λ t ( σ ) ( σ ) 2 2 bakgrund 2010-11-15 Fysikexperiment, 7.5 hp 4 Om vi är säkra på att vi bara har en radioaktiv isotop som sönderfaller och sönderfallshastigheten inte uppvisar ett linjärt samband i en logaritmisk skala, ja då kan vi vara säkra på att vi har någon typ av bakgrundsstrålning (som oftast är konstant med tiden). 4

Radioaktivt sönderfall med bakgrund R källa Exempel: Radioaktivt sönderfall med bakgrund. Aktiviteten från en radioaktiv källa mättes av en student (inklusive bakgrundsaktivitet): Antal sönderfall N T = 2540 under tiden T T = 10 minuter Bakgrunden, dvs aktiviteten då källan var borttagen mättes av studenten: Antal sönderfall N B = 95 under tiden T B = 3 minuter Antalet sönderfall är Poissonfördelat och osäkerheten i antalet ges av kvadratrotsregeln: = RT RB Räknehastigheterna erhålles genom att dividera med tiderna : R T N = T R B T T N N = T = 2540 ± = 95 ± 2540 = 2540,0 ± 50,4 95 = 95,0 ± 9,7 2540 ± 50,4 = = 254,00 ± 5,04 10 B B T N B 95,0 ± 9,7 = = 31,7 ± 3,2 3 sönderfall / min. sönderfall / min. Slutligen erhåller vi räknehastigheten från den radioaktiva källan enbart som: = ( 254,00 ± 5,04) (31,7 ± 3,2) = 222,30 ± 5,97 = 222± 6 sönderfall/ min. 2010-11-15 Fysikexperiment, 7.5 hp 5 Observera att vi här betraktar ett preparat som har en lång halveringstid, dvs sönderfallshastigheten är konstant under överskådlig tid. Hur bestämmer vi bakgrundsräknehastigheten? 5

Osäkerheten i en räknehastighet: Undvik detta fel! 5 2010-11-15 Fysikexperiment, 7.5 hp 6 Läs noga! 6

Sönderfallskurvor (två sönderfallskomponenter) 18 16 14 λ 1t λ 2t n ( t) = n1e + n2e + n bg 12 10 8 summa = den mätta signalen snabbt avklingande komponent mer långsamt avklingande komponent konstant bakgrund 6 4 2 0 0 20 40 60 80 100 120 140 160 180 200 2010-11-15 Fysikexperiment, 7.5 hp 7 Observera att här är skalan linjär. Med linjär skala är det svårt att se om det finns fler än en sönderfallande isotop. Notera att funktionen inte går att lineariseras genom lgaritmering på denna form. 7

Sönderfallskurvor (två sönderfallskomponenter) 10 2 10 1 Plottar vi de två sönderfallskurvorna med log-skala blir svansen inte entydig om bakgrunden finns med. Här finns bakgrunden med 10 2 10 1 Subtraheras bakgrunden från data kan den långsamma komponenten associeras med svansen vid höga t. a 1 1 2 2 ( t) = ln[ n( t)] = a λ t + a λ t I detta tidsintervall kan vi göra en Första anpassning för att bestämma Den långa halveringstiden. 10 0 10 0 10-1 10-1 10-2 10-3 10-2 10-3 Utan bakgrund! 10-4 0 20 40 60 80 100 120 140 160 180 200 10-4 0 20 40 60 80 100 120 140 160 180 200 2010-11-15 Fysikexperiment, 7.5 hp 8 Samma plot med logaritmisk skala, med och utan bakgrund. Notera att summan av två räta linjer i logaritmisk skala blir inte en rät linje. 8

Bakgrunden är Poisson! Frekvensen av observerat antal sönderfall i en-minuters intervall. Antalet sönderfall v 0 1 2 3 4 5 6 7 8 9 Frekvens N i 5 19 23 21 14 12 3 2 1 0 Antalet sönderfall 0 1 2 3 4 5 6 7 8 9 Observerad fördelning 0,05 0,19 0,23 0,21 0,14 0,12 0,03 0,02 0,01 0,00 Förväntad fördelning 0,06 0,05 0,15 0,17 0,24 0,22 0,22 0,16 0,17 0,10 0,09 0,05 0,04 0,02 0,01 0,00 0,25 0,20 0,15 0,10 0,05 0,00 1 2 3 4 5 6 7 8 9 10 Experimentell Poisson 2010-11-15 Fysikexperiment, 7.5 hp 9 Detta är ett exempel på en bakgrundsmätning. Antalet sönderfall inom ett visst tidsintervall är Poissonfördelat. Överensstämmelsen kan synas vara god. Men hur god? 9

Hur god är överensstämmelsen? Vi har två fördelningar där vi i det första fallet misstänker en avvikelse från Poisson medan i det andra fallet har vi en god överensstämmelse med Poisson. 0,25 0,20 0,15 0,10 0,05 0,00 1 2 3 4 5 6 7 8 9 10 Finns det något objektivt sätt att bedöma hur god överensstämmelsen är? Experimentell Poisson 2010-11-15 Fysikexperiment, 7.5 hp 10 Tidigare hade vi resultatet från en annan undersökning där vi räknade antalet utdöda fossiler. Avvikelsen från en Poissonfördelning är tydlig (skulle vi minska Poissonfördelningens medelvärde skulle antalet händelser i svansen öka markant). 10

Vad är en hypotes? En hypotes är ett antagande. Vi utgår t.ex. ifrån att sannolikheten för att få en sexa med en tärning är 1/6. Vårt grundantagande, P = 1/6, kallas för nollhypotes. Den betecknas H0. Vi samlar in data och jämför resultatet med vad som utifrån sannolikhetsteorin verkar rimligt. Om vi kastar en tärning t.ex. 120 gånger förväntar vi oss att nummer 6 kommer upp 20 gånger i medeltal och utifrån resultatet av dessa kast funderade vi på om det verkar rimligt att P = 1/6. Antag nu att vi i detta försök fick 29 6-or. Om sannolikheten att få ett så extremt (eller ännu extremare) resultat som vi fått är mycket liten så tror vi inte att vi erhållit resultatet av en slump, utan att det ligger någon annan orsak än slumpen bakom resultatet. Vi förkastar då nollhypotesen. I vårt exempel hade vi H0: p=1/6. Om vi förkastar nollhypotesen så tror vi alltså att denna inte är sann. Då måste det ju vara något annat som är sant och som vi tror på istället. Detta kallas för en mothypotes eller alternativ hypotes. Vanliga beteckningar för mothypotesen är H1 och Ha. 2010-11-15 Fysikexperiment, 7.5 hp 11 11

Noll-hypotesen (H0) Vi kan närma oss en tänkt gränsvärdesfördelning om en mätning av samma sak upprepas många gånger. Gaussfördelningen är ett exempel. Poissonfördelningen ett annat exempel 0,25 0,20 0,15 0,10 0,05 0,00 1 2 3 4 5 6 7 8 9 10 Experimentell Poisson Även anpassningen av en rät linje (funktion) Residualerna bildar en N(0,1)- fördelning 2010-11-15 Fysikexperiment, 7.5 hp 12 Nolllhyposen i de två första exemplen är H0: Histogrammen (våra data) sammanfaller med (de teoretiska) gränsfunktionerna. Nollhypotesen i det tredje fallet är H0: Punkterna ligger på en rät linje. Finns det nu något (objektivt) mått på hur nära man har kommit dessa gränsfunktioner eller indikerar data att det finns en annan gränsfunktion än den man hade tänkt sig? Eller med andra ord vilken av hypoteserna skall förkastas. Svaret på denna fråga kan vi få om vi studerar residualfördelningen. Om denna är sant N(0,1) fördelad så stödjer vi H0 hypotesen. 12

Chi-kvadrattestet Vi har redan flera gånger använt oss av en hypotestest, om ännu ej uttalad, nämligen en test som testar noll-hypotesen: att ingen skillnad finns mellan observerat och förväntat resultat. Vi kan t.ex. förkasta noll-hypotesen om avvikelsen mellan det mätta värdet och det sanna värdet är > t σ, där t är någon av oss vald gräns. Låt oss se på ett exempel i boken (kapitel 12). Exempel: 40 mätningar av räckvidden x (i cm) för en kanon. Tabellvärdena på sidan 261 ger direkt medelvärdet och standardavvikelsen: x = σ = 1 N 1 N 1 x = 730,1 cm i 2 (x x) i = 46,8 cm 2010-11-15 Fysikexperiment, 7.5 hp 13 Medelvärdet och standardavvikelsen ger oss information om den bakomliggande fördelningen (normalfördelningsfunktionen i detta fall). 13

Chi-kvadrat (forts.) Vi vill nu testa om data kan reproduceras med Gauss-fördelningen med dessa värden på det mest sannolika medelvärdet och standardavvikelse: Steg 1: Vi delar in x-axeln i intervall (bins), så att åtminstone några värden hamnar i varje bin (i detta fall väljer vi intervallet = standardavvikelsen). Steg 2: vi räknar antalet mätvärden i varje bin, det talet kallas O k. Steg 3: Vi antar att Gauss-fördelningen gäller och räknar det förväntade antalet värden i varje bin, det talet kallas E k. Steg 4: Vi jämför antalet observerade och förväntade värden i varje bin. Bin number k <1 2 3 >4 Probability Prob k 16% 34% 34% 16% Expected number E k = NProb k 2010-11-15 Fysikexperiment, 7.5 hp 14 6.4 13.6 13.6 6.4 Observed number O k 8 10 16 6 För att ha någon mening bör antalet händelser i varje intervall inte vara för litet. Det minsta antalet i en enskilt intervall bör vara större än 5 och detta kan åstadkommas genom att man slår ihop flera intervall (alternativt väljer bredare intervall). I detta exempel slår vi ihop innehållet i de två sista intervallen (se nästa figur) till 5 + 1 = 6. 14

Chi-kvadrat (forts.) Vi förväntar oss att fördelningen av x skall närma sig normalfördelningsfunktionen. Den första stapeln omfattar intervallet - < x < -1σ. Enligt Appendix B i läroboken motsvarar detta sannolikheten 50 % - 34.13 % = 15.87 %. Nästa intervall x - s < x < x motsvarar sannolikheten 34.13 % etc. Det förväntade antalet i varje bin blir således 40 0,1587 = 6,35 och 40 0,3413 = 13,65 etc. som visats i föregående tabell. 2010-11-15 Fysikexperiment, 7.5 hp 15 Fördelningen (data) ger oss ett medelvärde och en standardavvikelse vilket genererar den teoretiska Gaussfördelningen som är den bästa uppskattningen av den bakomliggande fördelningen. Vi kan sedan enkelt beräkna det förväntade antalet händelser i varje intervall. 15

Chi-kvadrat (forts.) k k Vi har redan tidigare använt storheten chi, definierad som χ = för att skaffa σ oss en uppfattning om hur väl mätningar stämmer överens med en teori eller ett medelvärde av många mätningar. För att undvika att stora positiva och negativa avvikelser tar ut varandra så betraktar vi kvadraten av detta uttryck och testar på chi-kvadrat, dvs.: 2 χ = n k = 1 ( O k E k ) 2 ( σ ) För en mätning (en frihetsgrad, n = 1) vet vi att sannolikheten att x mätt skall finnas inom ±1 s är 68%, alltså är sannolikheten för c 2 < 1 lika med 68% - på samma sätt är sannolikheten att x mätt skall finnas inom ±2s 95.5%, alltså är sannolikheten för c 2 < 4 lika med 95.5% och så vidare. Vi får följande tabell för sannolikheten att fåc 2 större än c 2 0 för 1 frihetsgrad: k 2 O E c 2 0 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 P (%) 100 48 32 22 16 Vi ser till exempel att 10% av alla mätningar ger c2 > 2,6 för en frihetsgrad. Tolkningen är att bara 10% av alla mätserier kommer att ha högre c 2 än 2,6. Vi säger att mätningen är kompatibel med teorin med 10%-ig signifikansnivå. 2010-11-15 Fysikexperiment, 7.5 hp 16 11 8,3 6,1 4,6 3,4 För n=1 gäller att c2 = [(O 1 E 1 )/ s] 2 = t 2 och vi kan enkelt konstruera en c2 tabell enligt ovan. För flera mätningar (frihetsgrader) gäller att c2 är tabellerad. 16

Chi-kvadratsumman Läs kapitel 3.2 i läroboken. Slumpmässiga händelser som inträffar med en konstant medelfrekvens har den egenskapen att osäkerheten i antalet händelser kan enkelt beskrivas som kvadratroten ur antalet händelser. Detta påstående kan under vissa förutsättningar ges en teoretisk grund. Antalet barn som föds (N) under en 2-veckors period har en osäkerhet som är N. Antalet sönderfall i ett radioaktivt preparat under ett visst tidsintervall (N) har också en osäkerhet som är N. Låt oss återvända till tabellen på sidan 14 ovan och beräkna c 2 för vårt exempel: = 4 2 2 2 2 2 2 ( O E ) 1,6 ( 3,6) 2,4 ( 0,4) k k χ = + + + = 1,80 k= 1 E 6,4 13.6 13,6 6,4 k Antag att överensstämmelsen är perfekt, detta ger det högst osannolika värdet c 2 = 0 (O k = E k i varje intervall). Överrensstämmelsen är acceptabel om varje term i summan har storleksordningen 1 och det finns n termer. Värdet på blir då c 2 ~ n. I detta exempel är n = 4 så c2 = 1,8 < 4 är bra. Överrensstämmelsen finns inte, värdet blir följaktligen c 2 >> n. I praktiken används en sannolikhetstabell efter det att c 2 -värdet räknats ut. 2010-11-15 Fysikexperiment, 7.5 hp 17 Observera att E k är det förväntade antalet med osäkerheten σ = E k (gäller Poissonfördelad storhet). 17

Chi-kvadrat för en linjär anpassning De 10 mätpunkterna i figuren till vänster antyder att vi har ett linjärt samband (resistansen hos mätobjektet är en konstant). Chi-kvadrat för denna anpassning är 3,8. Är detta bra eller dåligt? Om vi upprepar försöket 10 gånger erhålls en chi-kvadratfördelning (se figuren nedan till vänster). Vi ser början på en fördelning. Antalet frihetsgrader är i detta fall 8 (två frihetsgrader går förlorade eftersom vi har använt data för att bestämma den räta linjens två parametrar). Andra frihetsgrader ger andra fördelningar. 2010-11-15 Fysikexperiment, 7.5 hp 18 Notera att de tio bestämningarna av resistansen ger värden på chi-kvadrat som ligger i närheten av 10 - vilket vi förväntar oss i första approximationen. 18

Chi-kvadrat (forts.) 2010-11-15 Fysikexperiment, 7.5 hp 19 Så här ser den teoretiska gränsfunktionen ut för chi-kvadratfördelningen med 10 frihetsgrader (n = 10) (samma data som föregående bild men vi antar här att antalet frihetsgrader är 10). Strategin för att avgöra om data stämmer med det teoretiskt förväntade värdet eller inte är att (helst innan man beräknat sannolikheten) bestämma sig för hur sällsynta fluktuationer man är beredd att acceptera. Man kan till exempel säga Jag tror inte att min mätning är en kompatibel med teorin om sannolikheten att chi-kvadratsumman skall bli lika stor eller större än det jag mäter är mindre än 10%. I nästa figur kan vi se att detta svarar mot en chi-kvadratsumma som är > 16. (I EXCEL kan funktionen CHI2FÖRD användas). 19

Chi-kvadrat (forts.) 2010-11-15 Fysikexperiment, 7.5 hp 20 Ett liknande exempel med 9 frihetsgrader och chi-kvadratsumman = 7,96. Konfidensnivå som funktion av antal frihetsgrader och chi-kvadrat. Tolkningen är att om man gör ett stort antal experiment med samma antal mätningar, och att dessa verkligen har ett gemensamt medelvärde och att vi förstår våra mätfel då kommer ca 52% av mätningarna att ge en chikvadratsumma som är större än den vi observerat här. Skulle vi ställa så hårda krav på konsistent att vi kallade denna mätning inkonsistent med teorin, då skulle dessa kriterier förkasta 48% av alla korrekt genomförda mätningar. För 9 frihetsgrader så ligger 10% konfidensnivån vid chi-kvadratsumman ~15, dvs chi-kvadrat kan vara så stort som 15 utan att vi riskerar att kast mer än 10% av korrekta mätningar. I vårt tidigare exempel som handlade om räckvidden hos en kanon fann vi ett c 2 = 1,8 med 4 frihetsgrader. Ur diagrammet ovan kan vi avläsa att detta ger en konfidensnivå på nära 90%. Dvs det är mycket troligt att vår fördelning verkligen är en gauss-fördelning (H0-hypotesen). 20

Chi-kvadrat i tabell och graf 1s χ 2 0 2s d 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 1 100 48 32 22 16 11 8.3 6.1 4.6 3.4 n = 1 45% av arean 90% av arean n är antalet frihetsgarder (= antalet oberoende mätningar) 2010-11-15 Fysikexperiment, 7.5 hp 21 Ett annat sätt att försöka åskådliggöra sambanden 1 respektive 10 frihetsgrader. 21

Reducerad chi-kvadrat Vi har redan nämnt att man bör använda antalet frihetsgrader definierat av d = n c där c är antalet constraints eller antalet parametrar man kan bestämma redan innan beräkningen. Man kan visa att det förväntade medelvärdet av chi-kvadrat blir just antalet frihetsgrader, dvs n-c. Den reducerade chikvadratfunktionen blir då ~ 2 2 χ = χ vars förväntade medelvärde blir 1. Ett värde mindre än eller kring 1 stöder vårt hypotesfördelning, ett värde mycket större än 1 gör hypotesen osannolik. / d 2010-11-15 Fysikexperiment, 7.5 hp 22 Om sannolikheten P (c 2 c 2 obs ) är liten så är hypotesen sannolikt inkorrekt och tvärtom. P (c 2 c 2 obs) < 5% (1%) sägs vara signifikant ( högst signifikant ) dvs hypotesen kan uteslutas på signifikansnivån 5% (1%). 22

Chi-kvadrat (forts.) Procedur för en diskret fördelning: 1. Histogrammera data och gör en tabell. 2. Räkna antal observerade värden i varje bin. 3. Räkna ut antalet förväntade värden i varje bin utifrån en antagen fördelning. 4. Räkna ut chi-kvadrat för varje bin. 5. Summera till ett totalt chi-kvadratvärde. 6. Fastställ antal frihetsgrader och räkna ut det reducerade chi-värdet. 7. Gå in i en tabell och läs av P-värdet för motsv. chi-värde och frihetsgrad. 8. Jämför sannolikheten med ett lämpligt villkor och förkasta alt. acceptera hypotesen. 2010-11-15 Fysikexperiment, 7.5 hp 23 Klart för att attackera tabell D i läroboken. 23

Exempel på antal frihetsgrader Exempel: Antag att vi gör en beräkning och testar 250 personer mot en Gauss-fördelning, och delar upp data i 10 binnar. Hur stort är antalet frihetsgrader d? Medelvärdet och standardavvikelsen beräknas ur fördelningen. Normaliseringsvillkoret är 250 personer. Antal binnar n = 10. Antalet frihetsgrader blir således d = n c = 10 2 1 = 7 2010-11-15 Fysikexperiment, 7.5 hp 24 Notera att då samplet storlek är fixerad utgör detta ett villkor som sänker antalet frihetsgrader med 1 enhet. Jämför med antalet möss i figur 26 summan av de 3 klasserna skall vara 784, vilket minskar antalet frihetsgrader med 1 enhet i det fallet. 24

Räkna möss For example, a geneticist has a breeding population of mice in his laboratory. Some are entirely white, some have a small patch of brown hairs on the skin, and others have a large patch. According to the genetic theory for the inheritance of these coloured patches of hair the population of mice should include 51.0% entirely white, 40.8% with a small brown patch, and 8.2% with a large brown patch. In fact, among the 784 mice in the laboratory 380 are entirely white, 330 have a small brown patch, and 74 have a large brown patch. Do the proportions differ from those expected? 2010-11-15 Fysikexperiment, 7.5 hp 25 Nollhypotesen (H0) i detta fall är att fördelningen av färgade möss följer den teoretiska fördelningen. 25

Räkna möss (forts.) For comparison between actual distribution and theoretical distribution Mice Observed cases Theoretical proportions Expected cases O E (O E) 2 /E Entirely White 380 0,510 400-20 1,0000 Small brown patch 330 0,408 320 10 0,3125 Large brown patch 74 0,082 64 10 1,5625 Total 784 1,000 784 0 2,8750 2010-11-15 Fysikexperiment, 7.5 hp 26 I detta fall är n = 3. De olika teoretiska proportionerna är givna och påverkar inte antalet frihetsgrader. Summan av de 3 kategorierna är fix och minskar antalet frihetsgrader till 2. Reducerad chi-kvadrat blir 1,44. The P-table is entered at two degrees of freedom. We find that P ~ 25% (23,75%). Consequently the null hypothesis of no difference between the observed distribution and the theoretically expectedone is not disproved. The data conform to the theory. 26

Blodgrupper Antag att vi planerar en sjukvårdsinsats i ett u-land. Operationer måste kunna genomföras och blodtransfusioner skall kunna ges. Hur fördelar sig de olika blodgrupperna i detta u-land jämfört med vad som kan anses normalt i Europa? Vi tar ett prov på 200 slumpmässigt utvalda personer från u-landet. Blodgrupp A B AB 0 Observerat värde 58 34 8 100 2 2 2 ( ) ( ) ( ) ( ) Förväntat värde 2 58 90 34 16 8 8 100 86 χ = + + + = 56,44 90 16 8 86 Värdet 56,44 slår vi upp i en tabell över chi-kvadratfördelningen och ser att det motsvarar p < 0,003 (vid tre frihetsgrader). Slutsatsen blir att i det aktuella u-landet har man i befolkningen en annan fördelning av blodgrupper än i Europa. 2010-11-15 Fysikexperiment, 7.5 hp 27 2 90 16 8 86 Ser man på de olika blodgrupperna en och en så är AB samma i de två befolkningsgrupperna med konfidensnivån 100%. För O-gruppen gäller konfidensnivån ca 10% och man kan inte utesluta 0-hypotesen. Däremot är konfidensnivån för de övriga nära 0. 27