Presentation av data Medelvärde av grupperade data Slumptal Gränsvärdesfunktioner Normalfördelningsfunktionen Parameterbestämning Minsta kvadratmetoden 010-08-30 Fysikexperiment, 7.5 hp 1 1
Presentation av data Den mest primitiva formen av en mängd mätdata är en oordnad lista: 3 6 9 4 3 8 4 8 6 1 9 4 4 9 8 3 5 6 1 8 som blir något mer överskådlig om vi ordnar mätvärdena i storleksordning: 1 1 3 3 3 4 4 4 4 5 6 6 6 8 8 8 8 9 9 9 Härifrån är steget inte långt till en frekvenstabell: x k 1 3 4 5 6 7 8 9 f k 5 3 4 1 3 0 4 3 Vi kan också ange den relativa frekvensen r k = f k / n, där n är summan Σf k i stället för den absoluta frekvensen n k : x K 1 3 4 5 6 7 8 9 r k 0,08 0,0 0,1 0,16 0,04 0,1 0,00 0,16 0,1 010-08-30 Fysikexperiment, 7.5 hp Utfallsrummet i detta exempel är heltalen 1-9. Utfallet kan presenteras som en frekvenstabell med absoluta eller relativa förekomster av talen 1-9.
Presentation av data Stapeldiagram över mätdata 0,5 0, Frekvens i % 0,15 0,1 0,05 0 1 3 4 5 6 7 8 9 Mätetal 010-08-30 Fysikexperiment, 7.5 hp 3 Frekvenstabellen kan åskådliggöras som ett stapeldiagram. 3
Grupperade data (a) (b) (c) (d) Intervallmitt Frekvens x i f i f i x i f i x i 1,30 1 1,30 1,69 18 1,35 1,40 5 6 6,75 8,40 9,11 11,76 16 14 1 1,45 1,50 13 8 18,85 1,00 7,33 18,00 10 8 Serie1 1,55 17 6,35 40,84 6 4 1,60 14,40 35,84 1,65 7 11,55 19,06 0 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,70 1 1,70,89 1,75 Total 3 n = 75 5,5 S(x) = 114,55 9,19 S(x ) = 175,715 medelvärde = 1,53 standardavvikelse = 0,10 Tabell 1. Tabellen visar uppställningen för beräkning av medelvärde och standardavvikelse för grupperade data. 010-08-30 Fysikexperiment, 7.5 hp 4 Föregående exempel visade på diskreta data, dvs heltalsdata. För en kontinuerlig variabel måste man först gruppera data för att sedan räkna antalet händelser i varje grupp. Figuren ovan visar ett exempel på grupperade data (75 datapunkter i ett kontinuerligt intervall mellan 1,5 och 1,80) och exempel på en enkel tabell för beräkning. I den understa raden i tabellen har värdena i kolumnerna summerats. Kontrollera att du kan beräkna medelvärdet och standardavvikelsen och jämför med svaret i figuren till höger (se nästa bild för formler). 4
010-08-30 Fysikexperiment, 7.5 hp 5 Beräkning av medelvärde och standardavvikelse för grupperade data. Härledning på tavlan. 5
Representation av data 010-08-30 Fysikexperiment, 7.5 hp 6 Vidden på staplarna är viktig för det grafiska intrycket. I det vänstra exemplet har mycket information gått förlorad. 6
010-08-30 Fysikexperiment, 7.5 hp 7 En optimal klassindelning av data. Vi kan ana den bakomliggande teoretiska fördelningen (röd heldragen linje). Notera att en figur (liksom en tabell) skall ha nummer och en beskrivande text. 7
Vad är slump(tal)? Äkta slumptal utgår från fysikaliska processer! - singla slant - kasta tärning (jmf Lotto-spelen) - antal radioaktiva sönderfall under en viss tid Pseudo-slumptal genereras genom någon (matematisk) metod! - 7:e decimalen ur kvadratroten ur datorns klocktid t.ex. (för att ta en enkel men dålig metod). En standardslumptalsgenerator genererar slumptal mellan 0 och 1 med en flat gränsvärdesfördelning. 010-08-30 Fysikexperiment, 7.5 hp 8 Det är inte helt trivialt att skapa sant slumpmässiga tal! De fysikaliska metoderna (processerna) är ofta för långsamma när det gäller att producera tusentals slumptal i sekunden. Ett problem med pseudo-slumptal är att de kan upprepar sig efter en viss period (säg efter 10^10 försök). 8
Slumptal mellan 0 och 1 Funktionen rand() i MatLab eller ComsolScript 10 slumptal (bin=1/1000) 100 slumptal (bin=1/1000) 1 000 slumptal (bin=1/1000) 10 000 000 slumptal (bin=1/10000) 010-08-30 Fysikexperiment, 7.5 hp 9 I MatLab (ComsolScript) kallas funktionen rand(n) för att generera ett slumptal mellan 0 och 1 (argumentet n anger hur många slumptal som genereras testa!). Det tar 1 s att generera 10 miljoner slumptal på min dator är din snabbare? OBS det är histogrammeringen som tar tid: a=rand(1,10000000); hist(a,10000) tar 7 sekunder. Vill du pröva så börja med mindre tal! Vi noterar att i detta fall erhålles en gränsfunktion y = konstant, dvs ett utfall i varje delintervall i intervallet 0 till 1 är lika sannolikt. 9
Random Walk 36 försök med Random walk med 1000 steg. Den röda cirkeln markerar den genomsnittlig räckvidden efter 1000 steg (som är 1000@3). 010-08-30 Fysikexperiment, 7.5 hp 10 Låt oss leka lite med slumpen! Vi startar i origo och för varje förflyttning (steg med längden 1) vi gör är sannolikheten att gå vänster eller höger, upp eller ner lika stor. Var hamnar vi efter 1000 steg? Man kan visa att i medeltal hamnar man på eller i närheten av den röda cirkeln i figuren. De gröna linjerna markera avstånd och riktning för det sista steget i de 36 försöken. 10
Random Walk (forts.) 000 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är 1000@3. Visualisering av utfallsrummet (räckvidden). Den röda cirkeln markerar medelavståndet från origo för alla försök @ 1000. 010-08-30 Fysikexperiment, 7.5 hp 11 Fördelningen av räckvidden efter 000 försök om 1000 steg fördelar sig slumpvis på ett visst avstånd från origo men i medeltal hamnar vi på den röda linjen. 11
Summera slumptal mellan 0 och 1 y = I varje histogram finns 10 000 samplade värden på summorna (y) i= 0 x i 5 y = x i y = / 5 i= 0 100 i= 0 x i Vi noterar att fördelningarna samlas kring det sanna medelvärdet som i dessa fall är 1 (vänster),,5 (mitten) och 10 (höger) 010-08-30 Fysikexperiment, 7.5 hp 1 Utfallsrummet är i vart och ett av försöken talområdet 0-, 0-5 och 0-0. I det sista exemplet ser vi att större delen av utfallsrummet är tomt och trots att 10000 försök gjordes, blev den maximala summan inte större än 15. Notera att varje fördelning tycks ha sin egen gränsfunktion (triangulär i det första fallet). 1
Gränsvärdesfunktion Teoretisk gränsfunktion (i ) 100 x i i= 0 5 Blå kurva / 50 Grön kurva x i /, 5 i= 0 x i i= 0 Röd kurva 010-08-30 Fysikexperiment, 7.5 hp 13 Histogrammen på föregående bild kan normaliseras så att de har samma area (och flyttas så att de är centrerade runt medelvärdet 1). Vi ser att gränsfunktionerna i sin tur, asymptotiskt går mot en ny gränsfunktion! Denna nya gränsfunktion kallas normalfördelningsfunktionen och kan beskrivas exakt i matematiska termer (svart kurva). Observera att i detta speciella fall har vi använt samma slumptalsfördelning (slumptal mellan 0 och 1) för att närma oss gränsvärdesfunktionen. 13
Centrala gränsvärdessatsen Central Limit Theorem på engelska eller Normal Convergence Theorem Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att under vissa allmänna villkor, gå mot en normalfördelning. Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! 010-08-30 Fysikexperiment, 7.5 hp 14 Gränsvärdessatsen är en av den teoretiska statistikens viktigaste (mest centrala) sats. Punkt två är anmärkningsvärd det spelar ingen roll hur de underliggande fördelningarna ser ut bara de är många. Man har kunnat visa rent empiriskt att många naturliga fenomen som t.ex. längden hos en människa approximativt följer en normalfördelning. En föreslagen förklaring är att denna observabel (och andra liknande) är följden av en lång rad oberoende, slumpmässiga effekter och följaktligen är normalfördelade enligt gränsvärdessatsen. 14
Normalfördelningsfunktionen f(x; µ, σ ) 1 ( x µ ) exp σ = πσ Normerad till 1, dvs integralen av f för < x < + är 1. Maximum vid x = µ. Symmetrisk runt x = µ. När σ är litet så blir exponenten stor Ø lutningen blir större. När σ är litet så blir normaliseringskonstanten större Ø höjden vid toppen blir relativt sett högre. Men hur ser den ut då? 010-08-30 Fysikexperiment, 7.5 hp 15 Denna funktion är den viktigaste teoretiska sannolikhetsfördelningen i statistiken och är välkänd inom matematiken. Kallas även Gaussfunktionen. Mätvärdenas normalfördelning utgör en framgångsrik modell inom statistiken. 15
Grafisk form av f(x; µ,σ ) = 1 (x µ) exp πσ σ.5 sigma = 0.1 Genom att sätta parametern m = 0 (medelvärdet noll) skrivs funktionen: 1.5 f(x;0, σ ) 1 x exp σ = πσ 1 Sätter vi dessutom bredden s = 1 får vi: 0.5 sigma = 0.5 sigma = 1.0 N(0,1) f(x;0,1) = 1 x exp π 0-3 - -1 0 1 3 010-08-30 Fysikexperiment, 7.5 hp 16 Den standardiserade formen av normalfördelningen är N(0,1). Alla andra former erhålles genom en enkel variabeltransformation x Ø x = (x - m)/s. Observera att funktionen är normaliserad, dvs arean under funktionen är 1. 16
Tolkningen av: f(x; µ,σ ) = 1 (x µ) exp πσ σ Tolkning av normalfördelningsfunktionen som en sannolikhetsfördelning. Utfallet av en mätning ges med en viss sannolikhet. (99,73 %) (95,45 %) (68,7 %) 010-08-30 Fysikexperiment, 7.5 hp 17 Antag att vi har en variabel (observabel) som har en asymptotiska fördelning som beskrivs av normalfördelningsfunktionen med medelvärdet m och bredden s. Sannolikheten för att en mätning skall ge ett resultat i intervallet [x, x+dx] är då lika med arean under kurvan mellan dessa värden. Studera även tabellerna i appendix A och B i kursboken. 17
Parametrarna för den asymptotiska fördelningen 6 5 4 3 1 0 - -1.5-1 -0.5 0 0.5 1 1.5.5 6 Mätningar ger oss en verklig fördelning som av många olika skäl bara innehåller ett mycket begränsat antal mätningar! 0.4 0.35 0.3 0.5 0. 0.15 0.1 0.05 0 -.5 - -1.5-1 -0.5 0 0.5 1 1.5.5 Experimentet karakteriseras av en teoretisk gränsvärdesfunktion med okända värde på parametrarna. 5 4 3 Minsta kvadratmetoden låter oss bestämma vilka värden på de teoretiska parametrarna som ger bästa överensstämmelsen 1 010-08-30 0 Fysikexperiment, 7.5 hp 18 -.5 - -1.5-1 -0.5 0 0.5 1 1.5.5 När det gäller fysikaliska mätningar av olika slag gör vi oftast det antagandet att eventuella fel i mätningarna är helt slumpvisa och som beror på en mycket stor mängd olika fysikaliska effekter som är slumpvisa men som var och en inte nödvändigtvis behöver vara normalfördelade. Summan av alla dessa fel bör dock enligt centrala gränsvärdessatsen vara normalfördelad. Hur skall vi göra för att bestämma parametrarna för den asymptotiska normalfördelningen? Den metod vi skall använda är Minsta kvadratmetoden. 18
En riggad tärning Nedan visas utfallet för kast med en normal tärning. Gränsfunktionen förväntas vara en konstant P(x) = 1/6 för 1 x 6. Denna tärning misstänker vi vara felaktig! En experimentell fördelning för utfall med denna tärning. Den sanna (teoretiska) fördelning för utfall med denna tärning. 010-08-30 Fysikexperiment, 7.5 hp 19 Vi skall använda minsta kvadratmetoden i följande exempel. I situationen till vänster har vi en 100% perfekt tärning. Om vi kastar denna många gånger så förväntar vi oss att alla sex sidorna kommer upp lika många gånger i medeltal, dvs sannolikheten är 1/6 för varje enskild sida. Med datorhjälp kan vi testa detta och se på hur en verklig fördelning kan se ut då antalet kast ökar. I figuren till höger kan vi misstänka att tärningen inte är perfekt. 6:an synes vara något mer frekvent än 1:an (observera att 1:an och 6:an ligger på motstående sidor i en vanlig tärning. Frågeställning här är: Hur skall vi finna (det bästa) värdet på sannolikheten för att 6:an skall komma upp enbart med utgångspunkt från mätdata? 19
Bestämning av sannolikheten p(x) x = 1,, 3, 4, 5, 6 z y x a b c d e f Antag att vi har antalet utfall som i figuren: p(1) = a, p() = b, p(3) = c, p(4) = d, p(5) = e, p(6) = f. Antag vidare att den sanna fördelningen bör vara: p(1) = x, p() = p(3) = p(4) = p(5) = y, p(6) = z. Vilka värden på parametrarna för den asymptotiska (sanna) fördelningen ger bäst överensstämmelse med observationerna? Ett sätt att välja de bästa värdena för parametrarna är att minimera skillnaden mellan observationer och förväntade värden: Vi bör inte gärna välja att summera skillnaderna (observation förväntad). Bidrag med olika tecken kan då summeras till noll även om bidragen i sig är stora. Summan av observation förväntad löser det problemet, men små avvikelser blir lika viktiga som en stor och stora avvikelser bör undvikas. Summan av (observation förväntad) löser även det problemet. Denna metod - minsta kvadratmetoden har i allmänhet andra teoretiska fördelar, och är den som oftast används. 010-08-30 Fysikexperiment, 7.5 hp 0 Vi antager att tärningen endast har en obalans mellan 1 och 6 (1 och 6 ligger mitt emot varandra på en tärning), de andra sidorna antages ha samma sannolikhet (y) att komma upp. Vi har alltså tre obekanta x, y och z. Vi kan utnyttja att summan x + 4ÿy + z = 1 (dvs 1/6 + 4*1/6 + 1/6 = 1), vilket reducerar antalet obekanta till två! 0
Minsta kvadratmetoden Obs medelvärdet av b,c,d och e a mätt endast en gång! 010-08-30 Fysikexperiment, 7.5 hp 1 Vi gör det antagandet att en bra metod att söka parametrarna x, y och z är att minimera summan av avvikelsernas kvadrater enligt uttrycket ovan. Metodens resultat är i överensstämmelse med vad vi förväntar oss: Värdet på y bör vara medelvärdet av de faktiska mätningarna. Vi har bara ett värde x av a. Dvs a = x bör alltså vara en god gissning! Observera att lösningen inte är entydig - vi skulle lika gärna kunna sätta z = f. Bägge lösningarna är lika goda i detta fall. 1
Exempel på utfall! Utfall från en riggad tärning # Alternativt Nominellt Utfall Beräknat Procentuell fördelning 0,5 0, 0,15 0,1 0,05 0 1 3 4 5 6 1 3 4 5 0,143 0,164 0,164 0,164 0,164 0,146 0,163 0,156 0,166 0,176 0,146 0,165 0,165 0,165 0,165 0,148 0,165 0,165 0,165 0,165 Utfall 6 0,00 0,19 0,194 0,19 010-08-30 Fysikexperiment, 7.5 hp Vi noterar att den första lösningen är z = 0,194 = 1 0,146 4*0,165 och den andra lösningen är x = 0,148 = 1 0,19 4*0,165 i andra fallet.
Nomenklaturen (repetition) Medelvärdet (stickprovsmedelvärdet) kan skrivas n x1 + x + K+ xn 1 µ = x = x = = xi n n i= 1 I ComsolScript (MatLab) beräknas medelvärdet med hjälp av funktionen mean: <x> = mean(x) Standardavvikelsen (stickprovsvariansen) kan skrivas (V = variansen) n 1 V ( x) = s = σ x = n 1 010-08-30 Fysikexperiment, 7.5 hp 3 i= 1 ( x i x) I ComsolScript (MatLab) beräknas kvadratroten ur variansen med hjälp av funktionen std: s = std(x) Notera de olika beteckningarna för medelvärde och varians (= kvadraten på standardavvikelsen). Bekanta dig med funktionerna mean och std i ComsolScript och MatLab. 3
Uppgifter 4. Räkna för hand och jämför sedan med att räkna i ComsolScript 4.3 Räkna för hand och jämför sedan med att räkna i ComsolScript 4.5 Räkna på tavlan (övning i summaräkning) 4.9 Räkna på tavlan (sannolikhet för utfall) 010-08-30 Fysikexperiment, 7.5 hp 4 Testa funktionen mean och std i ComsolScript på uppgift 4. (du behöver inte skriva något program utan kan använda ComsolScript som en miniräknare), dvs du skriver helt enkelt på kommandoraden: mean([9.9 9.6 9.5 9.7 9.8]) och std([9.9 9.6 9.5 9.7 9.8]) Ett smartare alternativ är att först definiera en vektor: x=[9.9 9.6 9.5 9.7 9.8]; och sedan skriva mean(x) och std(x) 4
Experimentet Ta det lugnt! Förbered er! Släng ingenting inga lösa lappar! Dokumentera uppställningen och yttre variabler! Dokumentera under arbetets gång! Beräkna delresultat! 010-08-30 Fysikexperiment, 7.5 hp 5 Fem minuter insparad tid på labbet kan innebära 30 minuter extra möda vid rapportskrivningen när man försöker reda ut vad man egentligen gjorde. 5
Planeringen Planering och förberedelser Vad är det vi vill göra? Vad har andra gjort? Förstå den underliggande teorin! Genomförandet Tänk igenom mätningarna! Kalibrering av instrument! Systematiska effekter? Analys och rapport Förbered analysen, t.ex. härled formler! Förbered rapporten, skriv ner alla data! 010-08-30 Fysikexperiment, 7.5 hp 6 I en labbsituation gäller det att i görligaste mån komma förberedd till en laborationen kanske labbkompisen har lagt ner stor möda på förberedelsearbetet och vill kunna jobba undan. 6
Rapporten (innehåll) 010-08-30 Fysikexperiment, 7.5 hp 7 Dessa rubriker gäller för mer ambitiösa rapporter endast en liten del av dessa och följande rubriker behöver användas i en labbrapport. 7
010-08-30 Fysikexperiment, 7.5 hp 8 Denna tabell innehåller både mätdata och beräknade data och r4efereras därför två gånger i texten. 8
Exempel figur 010-08-30 Fysikexperiment, 7.5 hp 9 Notera att figuren har ett nummer och refereras till i texten. Figurtexten skall vara informativ. Enbart Försöksuppställning är ej tillfredsställande. 9
Exempel tabell 010-08-30 Fysikexperiment, 7.5 hp 30 Denna tabell innehåller både mätdata och beräknade data och r4efereras därför två gånger i texten. 30
Exempel Tabell Nedan följer två exempel på en tabell. Först ett nybörjarexempel med en del misstag. 010-08-30 Fysikexperiment, 7.5 hp 31 Skriv upp alla nybörjarfel du kan finna i denna tabell. 31
Exempel 3 Tabell Nedan följer två exempel på en tabell. Först ett nybörjarexempel med en del misstag. En proffsigare tabell: 010-08-30 Fysikexperiment, 7.5 hp 3 Ett par fel kvarstår i den undre tabellen (kan du se vilka?). Notera att i tabell återfinner vi de konstanta storheterna R och B i tabelltexten. I det undre exemplet bör man skriva R = 0.100 m i tabelltexten om man menar att noggrannheten är +- 1mm. Värdena på storheten F har avrundats med ett implicit fel på en halv enhet i sista decimalen. 3