Sta$s$k och Experiment Christophe Clément Stockholms universitet clement@fysik.su.se 1
Varför staesek? Datainsamling och mängd mätningar Sannolikhetsfördelning Normalfördelning Centralvärdesatsen SystemaEska fel Snedvridna undersökningar Andra fördelningar Falska samband Higgs parekeln 2
Richard Feynman (1918-1988) Nobelpristagare i fysik 1965 Vetenskapens främsta uppgio är ap inte lura sig själv! Och man är själv den läpaste ap lura! Gäller alla människor!! 3
Varför är sta$s$k ingrediens inom vetenskapen? VikEg ap kunna kvanefiera sannolikheten av det man observerar. Kan det komma sig av en slump? Eg. parapsykologi föreläsningen. Något kan uppstå av ep sammanträffande, hur avgör man? Hur säkra är vi ap något verkligen händer av det skälet man tror? 4
Behandling av lunginflamma$on fram $ll milen av 18- talet Sjukdomen beror på en obalans bland kroppsvätskorna (blod, gul galla, svart galla och slem).! Behandling: Åderlåtning Kräkmedel God och dålig vetenskap 5
Joseph Dietl Polsk läkare som gjorde en mycket vikeg undersökning 1842-1846.! Delade upp pa$enterna i 3 grupper: - - Behandling med åderlåtning - - Behandling med kräkmedel - - Ingen behandling!! Resultat: - - Åderlåtning - - Kräkmedel - - Ingen behandling 2,4% dog 2,7 % dog 7% dog 6
Slutsats? Dietl slutsats: AP behandla lunginflammaeon med kräkmedel eller åderlåtning inte fungerar utan dödar 2 ggr fler paeenter än själva sjukdomen (vid Dietls sjukhus)...! Flertusenåriga anor... tradieonell europeisk medicin! Varför upptäckte man inte problemet Edigare?! Kanske för a+ läkarna såg med egna ögon a+ å+a av 5o pa5enter blev friska? 7
Slutsats? Dietl slutsats: AP behandla lunginflammaeon med kräkmedel eller åderlåtning inte fungerar utan dödar 2 ggr fler paeenter än själva sjukdomen (vid Dietls sjukhus)...! Flertusenåriga anor... tradieonell europeisk medicin! Varför upptäckte man inte problemet Edigare?! Kanske för a+ läkarna såg med egna ögon a+ å+a av 5o pa5enter blev friska? Nu tror ni också al han hade räl men ni har kanske fel! 8
TiLa närmare Resultat: - - Grupp 1 Åderlåtning 2 % dog - - Grupp 2 Kräkmedel 21 % dog - - Grupp 3 Ingen behandling 7% dog Det står inte hur många personer som var med i testet så det går inte ap bestämma hur staeseskt säkert depa är. Var det lika många personner i varje grupp? Resultat: - - Grupp 1 Åderlåtning 5 av 25 som dog - - Grupp 2 Kräkmedel 4 av 19 som dog - - Grupp 3 Ingen behandling 2 av 28 som dog (avrundat med avsikt) Det kan röra sig om ganska små antal undersökta personer och skillnader skulle kunna uppstå av staeskeska fluktuaeoner I moderna undersökningar kvaneficerar man alled sannolikhet för det observerade ugallet. 9
Datainsamling och mängd mätningar Data set = el antal mätningar Tidiga kurser i fysikutbilningen har studenter laboraeoner Studenter måste göra många mätningar, stämmer resultatet med vad som står i boken? OOast är studenternas första erfarenhet ap mätningar blir alled olika, mätvärden varierar utan ap man inte rikegt får grepp om varför. EP experiment eller en undersökning ger oss en mängd mätningar en mängd mätningar experiment / undersökning mätvärden Vi behöver analysera mätningarna t= 1.145 s 1.116 s 1.141 s 1.124 s 1.141 s 1.124 s 1.17 s 1.124 s 1.125 s 1.117 s 1
naturlag experiment / undersökning mätvärden Dataset kommer från ep experiment - - säger alled något om vårt experiment - - säger kanske något en fysiklag man vill undersöka TiPar på en fysiklag alled igenom filtret av vårt experiment AP Analysera Data handlar om ap förstå vad datamätningar säger om en mängd mätningar t= 1.145 s 1.116 s 1.141 s 1.124 s 1.141 s 1.124 s 1.17 s 1.124 s 1.125 s 1.117 s - - själva experimentet - - är det något man kan även lära sig om fysik, eller biologi osv. 11
naturlag experiment / undersökning mätvärden Dataset kommer från ep experiment - - säger alled något om vårt experiment - - säger kanske något en fysiklag man vill undersöka TiPar på en fysiklag alled igenom filtret av vårt experiment AP Analysera Data handlar om ap förstå vad datamätningar säger om - - själva experimentet det kan man vara säker på - - är det något man kan även lära sig om fysik, eller biologi osv. en dataset t= 1.145 s 1.116 s 1.141 s 1.124 s 1.141 s 1.124 s 1.17 s 1.124 s 1.125 s 1.117 s endast om det är e3 bra experiment 12
i vårt experiment mäter man t.ex. en Ed t= 1.145 s 1.116 s 1.141 s 1.124 s 1.141 s 1.124 s 1.17 s 1.124 s 1.125 s 1.117 s Lära sig något om experimentet först! Genom analys av data mängden. 1.8.6.4 Trots ap studenterna förväntar sig ungefär samma mätvärdet varje gång - mätpunkterna finns litet överallt - men inte rik6gt överallt - man kan se en viss spridning.2 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] Det finns många möjliga orsaker ap man inte får samma svar varje gång: hur noggran är Edtagaruren? är det en person som startar/stoppar klockan?. 13
1.8.6.4.2 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] En uppsäpning av mätningar har vissa egenskaper som i första hand återspeglar experimentet / undersökningen (och förhoppningsvis återspeglar också något om fysiklagar som man vill undersöka) Från spridningen kan man lära sig något om hur bra Edtagaruren är och hur snabb personen som stoppar/stannar uren är. 14
Nu med 1 mätningar varje mätning visas med ep lodräp sträck Svårt överskådligt Inter särskilt determiniseskt Ändå ser man ap det är fler punkter i mipen Ed [s] Beskriva en mängd data med - - medelvärdet - - median - - standardavvikelse 15
Nu med 1 mätningar varje mätning visas med ep lodräp sträck Ed [s] Beskriva en mängd mätningar med - - median = ligger så ap lika många mätvärden är större än och mindre än medianen - - medelvärdet μ = central tendens av en mängd mätningar µ = x + x +...+ x 1 2 N N - - standardavvikelse σ = hur mycket hoppar mätvärden upp och ner i genomsnip kring medelvärdet 16
Gruppera mätningarna i klasser / intervall 1.6 < t < 1.75 s 1.75 < t < 1.9 s och man räknar hur många mätpunkter faller i varje intervall. antal mätningar i intervallet 18 16 14 Ed [s] klassindelat 12 1 histogram 8 6 4 2 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] 17
Från mätningar $ll sannolikhetsfördelning antal mätningar i intervallet nu delar vi antalet mätningar i varje interval med det totalla antalet mätningar 18 16 14 12 1 8 6 4 2 1 mätningar 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] sannolikhet.18.16.14.12.1.8.6.4.2.1.1.8.17.32.58.88.124.175.155 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2.97.15.72.37.21.5.3.1 Ed [s] värdet i varje interval anger nu sannolikheten för ap få en mätning i intervallet. => sannolikhetsfördelning 18
- - mätningar in en given experimentell uppställning ger olika svar. - - men en mätning är en del av en data mängd - - följer en given sannolikhetsfördelning sannolikhet.16.14.12.1 1 mätningar.9655.132596.155663.1553.132874.96848 Formen på sannolikhetsfördelning bestäms av - - den experimentella uppställningen - - naturlagen man försöker undersöker.8.6.59997.6867 En mängd mätningar av samma egenskap beräpar mycket mer än en enstaka mätning.4.2.139.578.192.5667.14518.32298 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2.31771.1449.563.199 Ed [s] y- axeln anger = sannolikhet eller den observerade frekvensen.524.138 beräpar för oss hur moder sannolikhets fördelningen ser ut. 19
Normalfördelning Många slumpmässiga processer kring oss följer en så kallad normalfördelning Gäller biologi, fysik, geo, kemi, ekonomi, samhällsvetenskap, Det tar normalt 4 veckor eoer sista menstruaeon Ell barnets födelse. Man kan skapa ep histogram av skillnaden i antalet dagar mellan nedkomst och fakeskt födelsedatum. sannolikhet Staplarna höjd visar sannolikheten. Kurvan visa en så kallad normalfördelning (en Gauss funkeon) 2
Varför dyker det upp normalfördelningar överallt? Låt oss anta ap vi kastar tärning 1 ggr och skapar ep histogram av ugallen antal u:all i varje intervallet 18 16 14 12 1 8 6 4 2 167 ugall 1 2 3 4 5 6 7 6 möjliga ugall 1 ugall => ca. 167 ugall i varje intervall u:all 21
Låt oss nu kasta två tärningar EP försök = kasta två tärningar. Summan är ep ugall för ep försök. Och så gör vi 1 försök. 16 antal u:all i varje intervallet 14 12 1 8 6 4 2 2 4 6 8 1 12 14 u:all = tärning1 + tärning2 22
Låt oss nu kasta $o tärningar EP försök = kasta $o tärningar. Summan av alla Eo tärningar är ep ugall för ep försök. Och så gör vi 1 försök. 9 8 antal u:all i varje intervallet 7 6 5 4 3 2 1 1 2 3 4 5 6 7 u:all = tärning1 + + tärning1 23
Låt oss nu kasta $o tärningar EP försök = kasta $o tärningar. Summan av alla Eo tärningar är ep ugall för ep försök. Och så gör vi 1 försök. 9 8 antal u:all i varje intervallet 7 6 5 4 3 2 1 med en Gauss funkeon ovanpå 1 2 3 4 5 6 7 u:all = tärning1 + + tärning1 24
Centrala Centralvärdesatsen Om vi summerar ep stort antal slumpmässigt fördelade tal, fördelningen av summan => normalfördelning Lägger man ihop många slumpmässiga faktorer, så får man automaeskt en fördelning som liknar en normalfördelning. Gäller oavsep hur ursprungsfördelningen ser ut. 25
Normalfördelning Centralvärdesatsen säger ap den underliggande sannolikhetsfördelningen för mätningar ska följa en normalfördelning med ep medelvärde μ och standardavvikelse σ. Där μ är det sanna värdet som eoersöks och σ säger hur stora är staeseska slumpmässiga felen Man vill komma fram med våra experiment Ell det sanna μ. Man kan komma åt μ genom många experiment. 26
De stora talens välsignelse h3 Entries 5 t= 1.145 s 1.116 s 1.141 s 1.124 s 1.141 s sannolikhet.4.35.3.25 5 mätningar medelvärdet =1.134.4 Mean 1.134 RMS.1118 Underflow.2.2.2.2.15.1.5 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] 27
De stora talens välsignelse h3 Entries 1 sannolikhet.18.16.14.12.1 1 mätningar medelvärdet = 1.126.88.124.175.155.97.15 Mean 1.126 RMS.276 Underflow.8.72.6.58.4.32.37.2.1.1.8.17.21.5.3.1 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] 28
Och det sanna värdet av μ som jag använder för dessa simuleringar är 1.125. sannolikhet.16.14.12.1 1 mätningar medelvärdet = 1.125.9655.132596.155663.1553.132874.96848 Så med $llräckligt många mätningar kommer medelvärdet väldigt nära sanningen..8.6.4.32298.59997.6867.31771.2.139.578.192.5667.14518 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] Man kan minska den slumpmässiga osäkerheten genom al u_öra många mätningar σ(medelvärdet) = σ(1 mätning) Antalet mätningar.1449.563.199.524.138 29
Signifikans Normalfördelningen kan användas för ap testa hypoteser. Man undrar om en viss mätning följer en vis modell som förutsäger ep värde. z = mätvärde modell σ z- värdet: Till ep visst z- värde kan man associera en sannolikhet för ap depa beror på en sta$s$sk avvikelse. Stora värden av z pekar mot något som är mycket osannolikt om det endast skulle uppstå av slumpen, och då måste man kasta bort modellen. 3
Systema$ska fel Andra typer av fel kan inte försvinna oavsep antalet mätningar Tex. om Edtagaruren går litet långsammare än den borde Vad kan man lära sig av det andra instrumentet?.35.3.25.2 1 mätningar medelvärdet = 1.114 2 mätserier med 2 olika instrument medelvärdet = 1.126.15.1.5 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] 31
Systema$ska fel 1) Den andra Edtagaruren har bäpre precision mindre spridning. 2) De ger dock två olika medelvärden Det finns en systemaesk skillnad mellan både instrument. Kan inte avgöra vilken som är räp utan vidare undersökningar..35.3.25.2 1 mätningar medelvärdet = 1.114 2 mätserier med 2 olika instrument medelvärdet = 1.126 Det finns en systemaesk osäkerhet som är ca..1 och som är mycket större en den staeseska osäkerheten här..15.1.5 1.6 1.8 1.1 1.12 1.14 1.16 1.18 1.2 Ed [s] 32
Systema$ska fel Den systemaeska osäkerheten kan inte minskas m.h.a. flera mätningar med samma uppställning. Något måste ändras i den experimentella uppställningen för ap komma åt den systemaeska osäkerheten (tex använda ep tredje intrusment ). I en undersökning är ep systemaeskt fel ep snedvridet underlag 33
Snedvridna undersökningar och störande faktorer Popula$onen inte den avsedda En läkare önskar undersöka alla som genomgåp magsårsoperaeon vid ep stort sjukhus under en viss Edsperiod. Genom brev, telefonsamtal och besök kom han i kontakt med 7% och undersökte dessa. Den populaeon han studerade blev följakegen inte den avsedda, och iakpagelserna kan troligen inte generaliseras Ell den avsedda större populaeonen. Varför inte? 34
Magsår kan var livshotande. PaEenter som avlidit kommer inte med i undersökningen. Av olika skäl vill inte paeenterna prata med just denna läkare. 35
Resultat från den undersökta gruppen (7% av alla) Mår sämre Ingen förändring 39 % mår bäpre, 26% mår sämre. Mår bälre 3 4 45 115 Antalet undersökta Mha binomial fördelning kan man även räkna osäkerheten från staesek. (39 ± 4)% mår bäpre (26 ± 4)% Signifikans ~2.3 standard avvikelser Tyder på posiev effekt. mår sämre 36
I verkligheten är det 164 paeenter som blev behandlade av denna läkare. Icke undersökta: Mår sämre Ingen förändring Mår bälre 39 9 1 49 Antalet icke undersökta Om man lägger ihop undersökta och icke undersökta: Mår sämre Ingen förändring Mår bälre Alla Antalet personer 69 49 46 164 Man skulle kunna skriva så här men vi har undersökt HELA populaeonen, då finns det ingen 42 mår sämre 28 mår bäpre en helt annan slutsats! trots al man hade undersökt 7% av gruppen. 42% mår sämre inget binomial fel 28% mår bäpre eoersomvi EPade på hela befolkningen 37
Det som är avgörande är inte al man undersökt en stor andel av hela popula$onen. 1) Gruppen som man försöker nå (s$ckprovet) måste vara representa$v för hela popula$onen 2) Man måste anstränga sig för verkligen undersöka alla som man hade tänkte sig undersöka från början. 3) Det kan finnas en underliggande orsak al undersökta kommer inte med i undersökningen och denna orsak kan vara kopplad $ll den undersökta egenskapen. Om man $Lar på undersökningar från Sta$s$ska Centralbyrån så anges andelen som inte svarade på undersökningen. I vissa undersökningar inves$gerar man varför folk inte svarade på undersökningen. 38
Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Antalet olyckor under fartbegränsningen har i Grönköping med omnejd varit 1. Under samma tid förra året var antalet 2, dvs en nedgång som är nog så uppenbar, å inte mindre än 5 procent. Måste man nog emellertid, liksom om olycksstatistiken i hela landet, säga, att den markanta nedgången av antalet olyckor till största delen beror på det halkiga väglaget. Grönköpings Veckoblad Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det är en effekt! 214-3-2 God och dålig vetenskap 39
Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det inte ens är en effekt! Behöver så kallade Poisson fördelning för att räkna felet. Reproducerar fördelningen för hur många händelser inträffar under en viss period, i och med att händelserna är oberoende. Kan berätta att om man observera N så är felet N. År 1: 2± 2 => 2±1 År 2: 1± 1 => 1±1 Helt kompatibla med varandra. Ingen statistisk signifikant minskning! 214-3-2 God och dålig vetenskap 4
Falska samband Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Ett klassiskt exempel: En pedagog observerade att i en population av skolbarn i olika åldrar de som hade de största fötterna läste innantill bäst. Orsakar alltså stora fötter god inläsningsförmåga? Svar: Nej, däremot har de äldre barnen i genomsnitt större fötter och bättre läsförmåga. 214-3-2 God och dålig vetenskap 41
Samband mellan egenskap A och B- Låt oss anta av vi har uteslutit statistisk fluktuation som möjlig orsak. Om man utför observationer i en öppen okontrollerad miljö observationella undersökningar är det svårt att skilja mellan följande fallen: A? B? Dold orsak? A B Observationella undersökningar hjälper oss att hitta oanade samband och kopplingar! Experiment i mycket strängt kontrollerad miljö krävs för att skilja mellan olika scenarier. 214-3-2 God och dålig vetenskap 42
Exempel dagligen i dagspressen Folk som gör si och så (A) löper dubbel så stor risk för (B) Ser man ett samband mellan A och B i en observationellstudie i en öppen miljö kan man inte dra slutsatsen att A innebär B. Det kan också finnas en gemensam orsak till A och B. Vi antar här att det var inga felaktigheter i undersökningen. Vi kommer senare att titta på hur man utför undersökningen. För att t.ex. bevisa att en medicin fungerar eller är ofarlig behövs en mycket väl kontrollerad miljö => kommande föreläsning 214-3-2 God och dålig vetenskap 43
Riktlinjer för al bevisa kausalitet Kontrollera ap korrelaeonen existerar även när andra parametrar varieras!! Kontrollera ap korrelaeonen förstärks då en misstänkt parameter förstärks!! Om effekten kan orsakas av någon känd effekt, kontrollera ap effekten finns kvar då man tagit hänsyn Ell den kända effekten.!! Försök ap göra ep experiment!! Försök finna en fysisk orsak Ell korrelaeonen! 44
Hur man visade al rökning orsakade lungcancer Observerad korrelaeon mellan rökning och lungcancer för alla typer av människor Man fann ap för människor med lika förutsäpningar ap icke rökare hade mer sällan lungcancer än rökare Folk som rökte mycket och länge hade högre chans ap få lungcancer När man korrigerade för kända orsaker Ell lungcancer som tex radon hade rökare forgarande högre frekvens än icke rökare!! Man gjorde djurförsök och fann ap de rökande fick lungcancer Biologer studerade cellkulturer och fann ap röken orsakade mutaeoner och ap det inte fanns någon geneesk faktor! större grad av förståelse och säkerhet Kan inte avstå den undersöknings processen Ells man nåp den djupa förklarigen. 45
Upptäckten av Higgs boson 46
Large Hadron Collider (LHC) at CERN Collide protons at s=7-14 TeV TeV 27 km circumference LHC- B CMS ATLAS ALICE Christophe Clement Search for TeV scale R- parity conserving supersymmetry with ATLAS
27 km circumference 1732 dipoles (8.3T) 15m long Dozens of quadrupole magnets Dozens of special magnets Thousands of beam diagnoec systems Advanced quench warning system RadiaEon hard electronics Christophe Clement Search for TeV scale R- parity conserving supersymmetry with ATLAS
ATLAS Experiment 37 Countries 169 Ins$tu$ons 3 Physicists Swedish Ins$tu$ons in ATLAS Stockholm University Kungliga Tekniska Högskolan Lund Universitet Uppsala Universitet Now starts the exciting expoitation of the data from the ATLAS experiment Explore the microscopical landscape at 1-19 m! Instruments with Stockholm University contribueon in design, construceon and calibraeon Instruments with contribueons from other Swedish InsEtuEons Christophe Clement Search for Dark Ma3er with the ATLAS experiment
God och dålig vetenskap 5
51
52
53