Lärare 1. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Relevanta dokument
Lärare 4. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Sta$s$k och Experiment

Föreläsning 7 FK2002

Lärare 5 Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Att jämföra i tid och rum

Lärare 2. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Jörgen Säve-Söderbergh

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

4 Diskret stokastisk variabel

Kap 3: Diskreta fördelningar

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Lärare 2. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Studietyper, inferens och konfidensintervall

Grundläggande matematisk statistik

4.1 Grundläggande sannolikhetslära

Lektionsanteckningar 11-12: Normalfördelningen

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

F3 Introduktion Stickprov

2. Test av hypotes rörande medianen i en population.

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Lärare 5. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

TMS136. Föreläsning 4

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 6, Repetition Sannolikhetslära

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Samplingfördelningar 1

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

MVE051/MSG Föreläsning 7

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

Vetenskaplig metod och statistik

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

1.1 Diskret (Sannolikhets-)fördelning

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Kort om mätosäkerhet

1 Mätdata och statistik

Föreläsning 5. Kapitel 6, sid Inferens om en population

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Repetition 2, inför tentamen

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning 4: Konfidensintervall (forts.)

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

TENTAMEN I STATISTIKENS GRUNDER 2

Introduktion till statistik för statsvetare

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Föreläsning G60 Statistiska metoder

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Lotto, ett skicklighetsspel!

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

1) I följande studier a) och b) identifiera populationen, stickprovet, stickprovs egenskap, rådata och populationsegenskap.

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 4. Kapitel 5, sid Stickprovsteori

LMA521: Statistisk kvalitetsstyrning

Vetenskaplig metod och statistik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning G70 Statistik A

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

7. NÅGRA SPECIELLA DISKRETA SANNOLIKHETSFÖRDELNINGAR

LMA522: Statistisk kvalitetsstyrning

Föreläsning G60 Statistiska metoder

Uppgift a b c d e Vet inte Poäng

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Parade och oparade test

Statistik 1 för biologer, logopeder och psykologer

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Tentamen i Matematisk statistik Kurskod S0001M

f(x) = 2 x2, 1 < x < 2.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Grundläggande matematisk statistik

Föreläsning 7: Punktskattningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Avd. Matematisk statistik

SOS HT Slumpvariabler Diskreta slumpvariabler Binomialfördelning. Sannolikhetsfunktion. Slumpförsök.

Transkript:

Lärare 1 Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum Lärare 2 Att utföra undersökningar Sneda statistiska underlag Störande faktorer Hypotestester Placebo effekt Blindtester av läkemedel Lärare 3 Skilja mellan vetenskap och pseudovetenskap Världens undergång Lärare 4 Felaktiga upptäckter i historia Sannolikhetsfördelning och numeriska modeller av vardagliga problem Numbers Lärare 5 Problem för tentan 1

Sannolikhet för två händelser En händelse A har en sannolikhet p A och händelse B har en sannolikhet p B. Om händelserna A och B är oberoende av varandra då är sannolikheten för A OCH B p(a och B)= p A x p B Till exempel: jag har 1 chans i en miljon för att vinna på lotteriet. p A = 1 / 10 6 = 10-6 Varje dragning är oberoende av tidigare dragningar: Chansen för vinna två gånger i två dragninar: p 2ggr = p A x p A = 10-12 2

Binomialfördelning Binomialfördelning är sannolikhetsfördelning för antalet framgångar i en sekvens av n oberoende ja eller nej experiment, som var för sig har sannolikhet p. ja / nej röd / svart framgång / misslyckande 3

Binomialfördelning exempel Vid dragning ur urna med röda / svarta bollar Urna: p=0.5 är sannolikheten för att dra en röd boll. p=0.5 => betyder 50% chans Lägger man tillbaka bollen efter varje dragning då är sannolikheten konstant p=0.5 => dragningar är oberoende av varandra. Urna Sannolikheten för att dra en röd boll och återigen en röd boll är 0.5 x 0.5 = 0.5 2 = 0.25 Sannolikheten för att dra en röd boll n gånger är 0.5 n 0.5 /0.5 blandning 4

Om det är olika antal röda och svarta bollar N r och N s då är sannolikheten för att dra en röd boll p= N r /(N r +N s ) Sannolikheten för att dra 1 röd boll n gånger är nu Urna Prob(s=1 röd boll n dragningar) = p n detta är sannolikhet för en framgångsrik (=röd boll) dragning p / (1-p) blandning 5

Sannolikhet för flera framgångsrika dragningar? Man kastar n tärningar. Vad är sannolikheten för att få 3 sexor? Det finns 6 möjliga utfall 1,,6 Varje utfall har sannolikhet p=1/6 En person kan välja ett parti eller ej med sannolikhet p, och så gör man en opinions undersökning med n personer. => Hur räknar man osäkerheten på p? 6

Binomial Fördelning Exempel Vi kastar tärning n=10 ggr och man räknar antalet man får 6 Sannolikheten för att få utfallet 6 är p=1/6 i ett kast. Sannolikheten för att få utfallet 6 två ggr är p=(1/6) 2 i 2 kast. Sannolikheten för att få tio är (1/6) 10 =~10-8 Det är mer sannolikt att få 2 sexor om man kastar tärningen mer en två ggr 7

Binomial Fördelning Vad är sannolikheten Bin(3,2) att få 2 stycken 6 i 3 kast? Kast 1 Kast 2 Kast 3 Sannolikhet 6 6 6 1/6 x 1/6 x (1-1/6) 6 6 6 1/6 x (1-1/6) x 1/6 6 6 6 (1-1/6) x 1/6 x 1/6 Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 8 Antalet sätt att få två sexor med tre tärningar 3 = 3 2 sannolikhet att få 2 6 Om två utfall A och B är oberoende så är sannolikheten för (A OCH B) lika med produkten av sannolikhet för A ggr sannolikhet för B. sannolikhet att få något annat än 6 en gång

Binomial Fördelning Vad är sannolikheten Bin(3,2) att få 2 stycken 6 i 3 kast? Kast 1 Kast 2 Kast 3 Sannolikhet 6 6 6 1/6 x 1/6 x (1-1/6) 6 6 6 1/6 x (1-1/6) x 1/6 6 6 6 (1-1/6) x 1/6 x 1/6 Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 9 Antalet sätt att få två sexor med tre tärningar 3 = 3 2 sannolikhet att få 2 6 Om två utfall A och B är oberoende så är sannolikheten för (A OCH B) lika med produkten av sannolikhet för A ggr sannolikhet för B. sannolikhet att få något annat än 6 en gång

Binomial Fördelning Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 3 2 = x p 2 x (1-p) I det allmäna fallet: 3 = 2 3! 2!(3 2)! = 1 2 3 (1 2) 1 = 3 B n,p (s) = n p s (1 p) n s s n är antalet försök, försökpersoner, opionsundersökta s är antalet positiva svar eller framgångar i n försök (s=success) p är sannolikheten för framgång per enstaka försök n = s n(n 1)...(n s +1) 1 2... s = n! s!(n s)! Vi bryr inte oss om sjävla uttrycket i denna kurs Det viktiga är att förstå att detta representerar på hur många sätt man kan välja s äpplen bland n 10

Tillämpningar Spelteori, många processer i vardagslivet Exempel: En fotballspelare gör flera försök att göra mål. Om hon har en sannolikhet att lyckas för varje försök på 0.25 och sparkar 4 gånger i en match, då är antalet mål binomialfördelad enligt B(4, 0.25). Där p föreställer sannolikheten för en enda spark ska lyckas, då är 1 p sannolikheten att mislyckas. Sannolikeheten för spelaren att göra 0, 1, 2, 3, eller 4 mål är i 4 försök är: Best bet1 11

Approximation med stora tal När np(1-p) är ca lika med eller större än 10 kan binomial fördelning approximeras mycket väl med en normal fördelning med medelvärde np och σ = np(1 p) 12

Approximera Binomialfördelning med normalfördelning Sannolikhet för s framgångar Antalet frangångar s binomial fördelning med n=6, p=0.5 och approximation med normalfördelning

Opinionsundersökningar Varje opinionsundersökning utförs med en ny grupp försökspersoner. Därför finns det ett slumpmässigt fel i undersökningen som beror på att andelen människor med en viss åsikt kan variera litet grand mellan olika grupper av tusen personer. Man väljer dock 1000 personer så att det ska inte variera för mycket från en grupp till en annan. Dessa 1000 personer ska också vara utvalda på ett sätt som inte påverkar resultatet (mer detaljer i nästa föresläsning). 14

Tänk på urnan Med en urna med 50% / 50% svarta och röda bollar kommer man ganska snabbt med få dragningar se att det är ungefär lika många svarta som röda. ju fler dragningar desto bättre uppskattning av p. 15

Vad är det statistiska felet (= slumpmässiga felet) i en opinionsundersökning? Anta ett statistiskt underlag på n=1000 personer. Den statisktiska osäkerheten kommer att vara störst för små partier eftersom det är få av dem undersökta människor som väljer de. Färre mätpunkter => större slumpmässigt fel. Låt oss räkna den statistiska osäkerheten för ett parti som får p=2%? 1) Kan vi använda normalfördelning som approximation? np(1-p) >10? Här p=0.02 och n=1000 (personer): np(1-p)=1000 x 0.98 x 0.02 = 19.6 JA vi kan använda normalfördelning som approximation 16

2) Vi använder standardavvikelsen från normalfördelningen Här p=0.02 och n=1000 (personer): σ = np(1 p) σ = 1000 0.98 0.02 = 4 Osäkerheten är alltså 4 personer i 1000 eller 0.4%. (2% parti representerar 20 personer i 1000) Osäkerheten på 2% är 2±0.4% Obs 1 sigma ger oss en 68% konfidensinterval, dvs 68% sannolikhet att det sanna värdet befinner sig i intervallet mellan 1.6% och 2.4% Om man 8 eller fler partier så är det sannolikt att några av de har den sanna opinionsiffran utanför konfidens intervallet. 17 Man väljer ibland att ange ett 95% konfidens interval (2 sigma) här 1.2% - 2.8% (med 95% konfidens)

ur mätvärdesbehandling 3 normalfördelning 18

Här används 2 sigma konfidensinterval 95% sannolikhet att det sanna värdet ligger inom det angivna intervallet 19 En låtsas opinionsundersökning 2 mätserier 95 % konfidens felstaplar För att jämföra parti X och parti Y måste man veta hur stora är felstaplarna. Det är bara 5% sannolikhet att det sanna värdet ligger utanför intervallet.

Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Antalet olyckor under fartbegränsningen har i Grönköping med omnejd varit 1. Under samma tid förra året var antalet 2, dvs en nedgång som är nog så uppenbar, å inte mindre än 50 procent. Måste man nog emellertid, liksom om olycksstatistiken i hela landet, säga, att den markanta nedgången av antalet olyckor till största delen beror på det halkiga väglaget. Grönköpings Veckoblad Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det är en effekt! 20

Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det inte ens är en effekt! Behöver så kallade Poisson fördelning för att räkna felet. Reproducerar fördelningen för hur många händelser inträffar under en viss period, i och med att händelserna är oberoende. Kan berätta att om man observera N så är felet N. 21 År 1: 2± 2 => 2±1 År 2: 1± 1 => 1±1 Helt kompatibla med varandra. Ingen statistisk signifikant minskning!

Att Tolka Undersökningar Man måste vara försiktig att tolka undersökningar Att jämföra olika kategorier Falska samband Jämföra olika undersökningar i tiden eller rum Jämförbara kategorier? Oberoende händelser Otillåten slutsats Metodiken 22

Jämföra Olika Kategorier i en Undersökning Om parti X har 31% och parti Y har 29% betyder det då att parti X verkligen har mer stöd än Y? Kom ihåg att för varje undersökning är det olika människor som tillfrågas Utan vidare information kan vi inte dra någon slutsats alls! 23 Vi behöver veta vad är osäkerheten. Brukar vara med alltid nu när opinionsundersökning levereras Man kan ofta i dagpressen hitta procentsatser utan någon som helst indikation om osäkerheten. Då ska man vara försiktig med att dra snabba slutsatser

Vad är osäkerheten i undersökningen? Om parti X har 32.0% och parti Y har 29.4% är betyder då att parti X verkligen mer stöd än Y? Om vi vet att det var 1000 personer som svarade: σ = np(1 p) σ = 1000 0.3 0.7 =14 Det betyder att osäkerheten är 14 personer ut av 1000 alltså 1.4% Då kan vi egentligen skriva: Parti X 32 ±1% Parti Y 29 ±1% Hur pass signifikant är skillnaden? => Jämför skillnaden med felen! (kom ihåg vilka värdesiffror som verkligen ska anges) 24

Signifikans när man jämför tal Då kan vi skriva: Parti Parti X 32 ±1% Y 29 ±1% Vi vill veta om X Y är tydligt över noll eller om X-Y är konsistent med noll! För att se om X-Y är konsistent med noll eller ej vi måste: 1. Räkna S=X-Y 2. Räkna felet σ X-Y på X-Y 3. Jämföra hur nära noll S är i förhållande med felet. 25

Avvikelsens Signifikans För att se om X-Y är kompatibelt med noll eller ej vi måste: - räkna S=X-Y - räkna felet σ X-Y på X-Y σ (X Y ) = σ X 2 +σ Y 2 σ (X Y ) = 1.4 2 +1.4 2 = 2 (samma formel på summan eller skillnad av två slumpmässiga variabler) se föreläsning 3 i mätvärdesbehandling S = (X Y) /σ X Y S = (32.0 29.4) /2 S = 2.6 /2 =1.3 När vi räknar måste vi använda alla värdesiffror annars lägger vi till avrundningsfel. Men resultatet presenteras enligt avrundningsregler! 26 => Skillnaden mellan Parti X och Parti Y och 1.3 standardavvikelse.

Skillnaden mellan parti X och Y är 1.3 standardavvikelse. Vilken slutsats ska man då dra? ur mätvärdesbehandling 3 normalfördelning 1.3 sigma eller standardavvikelse är relativt vanligt. Man kan bara säga att Parti X och Parti Y är på samma nivå. 27

Akta för falska samband Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Ett klassiskt exempel: En pedagog observerade att i en population av skolbarn i olika åldrar de som hade de största fötterna läste innantill bäst. Orsakar alltså stora fötter god inläsningsförmåga? 28

Akta för falska samband Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Ett klassiskt exempel: En pedagog observerade att i en population av skolbarn i olika åldrar de som hade de största fötterna läste innantill bäst. Orsakar alltså stora fötter god inläsningsförmåga? Svar: Nej, däremot har de äldre barnen i genomsnitt större fötter och bättre läsförmåga. 29

Säg att man observerar ett samband mellan egenskap A och B- Om man utför observationer i en öppen okontrollerad miljö observationella undersökningar är det svårt att skilja mellan följande fallen: A? B? Dold orsak? A B 30 Observationella undersökningar hjälper oss att hitta oanade samband och kopplingar! (se även laboration nr. 2) Experiment i mycket strängt kontrollerad miljö krävs för att skilja mellan olika scenarier.

Exempel dagligen i dagspressen Folk som gör si och så (A) löper dubbel så stor risk för (B) Ser man ett samband mellan A och B i en observationellstudie i en öppen miljö kan man inte dra slutsatsen att A innebär B. Det kan också finnas en gemensam orsak till A och B. Vi antar här att det var inga felaktigheter i undersökningen. Vi kommer senare att titta på hur man utför undersökningen. För att bevisa att en medicin fungerar eller är ofarlig behövs en mycket väl kontrollerad miljö => Nästa föreläsning Lärare 2 31

Att Jämföra Undersökningar i Tid och Rum Statistik från olika länder svåra att jämföra pga brist av enhetliga definitioner. Exempelvis när det gäller arbetslösheten finns det ofta nationella definitioner och sedan internationella definitioner så att man kan jämföra. Jämförelser mellan år i samma land måste också ske med försiktighet. Man måste vara säker på att man jämför samma sak i tiden. Exempel från Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Från år 1938 till 1939 ökade antalet motorcyklar i Sverige från 43551 till 110262. Förklaringen är till största delen att lättviktarna räknades som motorcyklar fr o m 1939. 32

För att jämföra i tid måste mellan Mätning 1 och Mätning 2 måste man också studera felen. 33 En låtsas opinionsundersökning 2 mätserier 95 % konfidens felstaplar Man ska inte glömma att det är inte samma människor som blir tillfrågade i 2 olika undersökningar

Otillåten slutsats En forskare ville pröva den eventuella skadligheten hos en ny ingrediens i ett livsmedel, låt oss kalla den PQR. Han ordnade därför ett fullständigt randomiserat experiment med försöksdjur, gav somliga PQR, somliga ett bevisligen oskadligt preparat och studerade senare avkommans egenskaper. Bearbetningen skedde efter alla konstens regler, och resultatet blev: ingen signifikant sillnad mellan de båda behandlingsgrupperna. Den praktiska slutsatsen blev: ingen genetisk effekt, grönt ljus för PQR! Den praktiska slutsatsen var inte utan vidare berättigad. Av en icke signifikant differens kan man inte utan vidare dra slutsatsen att någon reell skillnad icke existerar. 34

Otillåten slutsats (2) Vad händer om man PQR testar på 10 personer och sannolikheten för att det ska vara farligt för en person är 15%? Det aktuella antalet personer som kommer få uppleva problem i testet kommer att följa en binomial fördelning med n=10 och p=0.15. Sannolikheten för att ingen upplever något är (1-p) n =(1-0.15) 10 =20% Så det är inte särskilt säkertställt att medicinen är ofarlig. I praktiken måste man testa på ett stort antal personer för att säkerställa att det är ofarligt (mer i nästa föreläsning om att testa läkemedel). 35 Man kan endast sätta en övre gräns på ofarligheten

Att Utföra Undersökningar Man måste vara försiktig att tolka undersökningar Ibland kan man ställa fel fråga Den föreslagna statistiken är felaktig eg procentsats som kan vara större än 100 % Störande faktorer Felaktigheter i datainsamling Illusorisk noggranhet Stickprov storkek 36

Övning Är minskningen mellan 2009 och 2010 statistiskt signifikant? 37