Forskningsmetodik 2006 lektion 2

Relevanta dokument
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning G60 Statistiska metoder

Lektionsanteckningar 11-12: Normalfördelningen

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Grundläggande matematisk statistik

Ingenjörsmetodik IT & ME 2011 Föreläsning 11

Experimentella metoder 2014, Räkneövning 1

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 12: Regression

Kort om mätosäkerhet

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

13.1 Matematisk statistik

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Introduktion till statistik för statsvetare

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Fysikexperiment, 7.5 hp 1

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Föreläsning G60 Statistiska metoder

Beskrivande statistik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Grundläggande matematisk statistik

Medelvärde, median och standardavvikelse

Statistik 1 för biologer, logopeder och psykologer

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Vetenskaplig metod och statistik

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

2 Dataanalys och beskrivande statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Parade och oparade test

Ingenjörsmetodik IT & ME 2010 Föreläsning 5

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

LMA521: Statistisk kvalitetsstyrning

LMA522: Statistisk kvalitetsstyrning

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Thomas Önskog 28/

Diskussionsproblem för Statistik för ingenjörer

Studietyper, inferens och konfidensintervall

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Statistik 1 för biologer, logopeder och psykologer

9. Konfidensintervall vid normalfördelning

Studieplanering till Kurs 2b Grön lärobok

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

MVE051/MSG Föreläsning 7

Vetenskaplig metod och statistik

Vad är rätt och vad är fel?

6-2 Medelvärde och median. Namn:

Uppgift a b c d e Vet inte Poäng

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

TAMS79: Föreläsning 6. Normalfördelning

Forskningsmetodik Lektion 8 Systematiska och statistiska fel

Föreläsning 12, FMSF45 Hypotesprövning

SF1901 Sannolikhetsteori och statistik I

Medicinsk statistik I

SF1901: Sannolikhetslära och statistik

Hur måttsätta osäkerheter?

Hypotestestning och repetition

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Mer om konfidensintervall + repetition

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Arvodesenkät. Resultat Egenföretagare.

TMS136. Föreläsning 7

Statistik och epidemiologi T5

F9 Konfidensintervall

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

SF1901 Sannolikhetsteori och statistik I

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

EXTRA ÖVNINGSUPPGIFTER MED SVAR

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Vetenskaplig metod och Statistik

SF1901 Sannolikhetsteori och statistik I

FÖRELÄSNING 8:

Matematisk statistik för B, K, N, BME och Kemister

F10 Problemlösning och mer om konfidensintervall

SF1901 Sannolikhetsteori och statistik I

FÖRELÄSNING 7:

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Experimentella metoder, FK3001. Datorövning: Finn ett samband

19.1 Funktioner av stokastiska variabler

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Arbeta med normalfördelningar

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

Föreläsning 11: Mer om jämförelser och inferens

10. Konfidensintervall vid två oberoende stickprov

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

1 Mätdata och statistik

Transkript:

Forskningsmetodik 6 lektion Per Olof Hulth hulth@physto.se Slumpmässiga och systematiska mätfel Man skiljer på två typer av fel (osäkerheter) vid mätningar:.slumpmässiga fel Positiva fel lika vanliga som negativa, små fel vanligare än stora fel. Mätningar ligger symmetriskt runt sanna värdet.. Systematiska fel Ett systematiskt skift av mätningar på grund av något okänt fel, tex mätinstrumentet ej nollställt. Slumpmässig spridning runt en punkt som inte är det riktiga värdet Slumpmässig, stor spridning runt det riktiga värdet. Sant värde Sant värde Sant värde Slumpmässig spridning runt det riktiga värdet Slumpmässiga fel lättare att beräkna! Ex sidan 58

Medelvärde, median och typvärde Medelvärde = x = m + m +.+ m N N Medelvärdet skrivs även som µ = Summan antalet = N i= N m i Median delar en fördelning i mittenvärdet i en sorterad fördelning. Tex:, 4, 9,, 55, 9 ger median = (jämt antal mätpunkter),4,9,,4,55,9 ger median = (udda antal mätpunkter) Typvärdet är det vanligaste värdet i en fördelning Längden på forskningsmetodikstudenter N= 5,55,56,56,58,6,64,66,69,69,7,7,7,7,74,75,75,75,78,8,8,9,9 Medelvärde = x = =7,cm 5+55 +..+9 +9 = 9 Median Typvärde Median = 7cm Maxvärde(typvärde) = 75cm Medelvärde => Mean Median=> Median Typvärde => Mode Exempel 4,5 sidan 5

Extremvärden, utliggare, Outliers Extremvärden (outliers, på svenska kan man även se termen utliggare ) kan påverka medelvärdet men påverkar ofta inte median och typvärde Behandlingen av extremvärden är grannlaga. Oftast uppstår de p g a något mätfel, men de kan också dölja den stora upptäckten. Extremvärde Mätfel? Upptäckt? Exempel sidan 5

Viktade medelvärden När vissa mätvärden har större betydelse än andra använder man ett viktat medelvärde: (x i vikt i ) X viktat = vikt i i Viktade medelvärden används när man bestämt sig för att tillmäta vissa mätpunkter en större vikt än andra, det kan t.ex. röra sig om medelbetyg (där man kan välja att ge större vikt åt ämnen som är särskilt relevanta för en utbildning). Ett vanligt tillfälle då man använder sig av viktade medelvärden är när man lägger samman mätresultat med olika storlekar på felen, I det läget finns det en väl definierad procedur för hur dessa skall viktas samman, så att de värden som har den lägsta osäkerheten bidrar mest till det gemensamma medelvärdet. Exempel 7 sidan 54 Spridningen av en fördelning Spridningen av mätpunkterna ger information om mätningen Fullvidd, avståndet från lägsta till högsta värdet Kvartiler, delar upp datamängden i 4 lika stora delar Percentiler, delar upp datamängden i lika stora delar Slumpmässig, stor spridning runt det riktiga värdet. Sant värde Sant värde Sant värde Viktigaste måttet: Variansen = Slumpmässig spridning runt det riktiga värdet i (x x i ) N Exempel sidan 6 4

Undre kvartil Kvartiler Övre kvartil N= 5,55,56,56,58,6,64,66,69,69,7,7,7,7,74,75,75,75,78,8,8,9,9 Median Standardavvikelsen Standardavvikelsen är definierad som: stan dardavvikelsen(σ) = var iansen = σ(sigma) i (x x i ) N Standardavvikelsen har samma enhet (sort) som mätvärdena Exempel 4 sidan 7 5

Tumregel för standardavvikelsen Standardavvikelsen fullvidden/4 Vet vi standardavvikelsen är: Lägsta värdet medelvärde - *standardavvikelsen Högsta värdet medelvärde + *standardavvikelsen Exempel 6 sidan 75 Mät längden på en parkeringsficka Gör en mängd mätningar och observera fördelningen av mätningarna Sann längd 48, cm L 6

Efter 5 mätningar medel 45.85 sigma 8.9.5.5.5 4 6 8 4 4 44 46 48 5 5 Efter mätningar medel 4.6 sigma 8.5.5.5.5 4 6 8 4 4 44 46 48 5 5 7

5 Efter mätningar medel 44.4 sigma.5 4.5 4.5.5.5.5 4 6 8 4 4 44 46 48 5 5 7 Efter 5 mätningar medel 47. sigma 7.7 6 5 4 4 6 8 4 4 44 46 48 5 5 8

8 Efter 5 mätningar medel 48.69 sigma 6.9 7 6 5 4 4 6 8 4 4 44 46 48 5 5 5 Efter mätningar medel 48.56 sigma 6.8 5 5 4 6 8 4 4 44 46 48 5 5 9

Centrala Gränsvärdesatssen Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! Normalfördelningen: σ x f(x;µ,σ) = πσ exp (x µ) σ Centrala Gränsvärdesatssen Medelvärdet av fördelningen av medelvärden närmar sig det sanna medelvärdet, µ, för stora N Standardavvikelsen för fördelningen av medelvärden går mot σ µ = σ N De stora talens välsignelse

.5.5.5 Efter 5 mätningar medel 45.85 sigma 8.9 4 6 8 4 4 44 46 48 5 5 9 8 7 6 5 4.5.5.5 Efter mätningar medel 4.6 sigma 8.5 4 6 8 4 4 44 46 48 5 5..4.6.8..4.6.8 5 4.5 4.5.5.5.5 Efter mätningar medel 44.4 sigma.5 4 6 8 4 4 44 46 48 5 5 4 8 6 4 8 6 4....4.5.6.7.8.9 7 6 5 4 Efter 5 mätningar medel 47. sigma 7.7 4 6 8 4 4 44 46 48 5 5 9 8 7 6 5 4 8 7 6 5 4 Efter 5 mätningar medel 48.69 sigma 6.9 4 6 8 4 4 44 46 48 5 5 -.5 - -.5.5.5.5.5 5 5 5 Efter mätningar medel 48.56 sigma 6.8 4 6 8 4 4 44 46 48 5 5 σ 45 44 4 Standardavvikelse 4 4 4 4 6 8 45 σ µ = σ N 4 5.9 45 4 45 8. 4.5.5.7.4 4 Föreläsning 4Forskningsmetodik 6 HT 6 8 Exempel: Summera tal slumpvis fördelade mellan och Ursprungliga fördelningen Se figur 5.7 sidan! - - 4 5 6 Summan av två tal Summan av fem tal Summan av tjugo tal När kan man förvänta sig en normalfördelning?. De flesta värdena skall ligga nära medelvärdet.. Positiva avvikelser är lika vanliga som negativa.. Stora avvikelser är mindre sannolika än små. 4. Den totala avvikelsen för ett mätvärde är summan av en mängd slumpmässiga bidrag. (Strikt matematiskt kommer punkt 4, tack vare centrala gränsvärdessatsen leda till de övrig punkterna)

Föreläsning Forskningsmetodik HT 6 Normalfördelningen Maximum vid x=µ.8 Symmetrisk runt x= µ.6 Ytan under kurvan normaliserad till sigma= sigma=.5 sigma=..4..8.6.4. - Föreläsning - - Forskningsmetodik HT 6

Normalfördelningen För att förstå hur centralvärdessatsen sats kan hjälpa oss så kan vi betrakta resultatet av en mätning som beroende av det sanna värdet till vilket har adderats slumpvisa bidrag från ett stort antal okända (och en del kända) felkällor. Det totala felet i mätningen är då summan av alla dessa bidrag. Enligt centrala gränsvärdessatsen är då denna summa (= det totala mätfelet) normalfördelat. Resultatet av ett stort antal mätningar kommer då att spridas runt det sanna värdet, och fördelningen av mätningarna runt detta kommer att ha en form som ges av normalfördelningen. Eftersom normalfördelningen är normaliserad - så kan man tolka ytan under kurvan mellan två x-värden som den relativa frekvensen för att mätvärdena skall hamna I detta intervall. The 68-95-99,7 regel 68% av datapunkterna faller inom standardavvikelse från medelvärdet 95% av datapunkterna faller inom standardavvikelse från medelvärdet 99,7% av datapunkterna faller inom standardavvikelse från medelvärdet Exempel sid 99, ex sid

Ett standardiserat mått på avvikelsen ges av (mätvärdet - medelvärdet) / standardavvikelsen. I boken kallas detta mått standard score eller z-score. Vanligare i naturvetenskap är kanske termen pull z = mätvärde medelvärde stan dardavvikelsen z är antalet standardavvikelser som mätvärdet avviker från medelvärdet Exempel sidan 4