Lärare 1. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Lärare 1 Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum Lärare 2 Att utföra undersökningar Sneda statistiska underlag Störande faktorer Hypotestester Placebo effekt Blindtester av läkemedel Lärare 3 Skilja mellan vetenskap och pseudovetenskap Världens undergång Lärare 4 Felaktiga upptäckter i historia Sannolikhetsfördelning och numeriska modeller av vardagliga problem Numbers Lärare 5 Problem för tentan 1

Sannolikhet för två händelser En händelse A har en sannolikhet p A och händelse B har en sannolikhet p B. Om händelserna A och B är oberoende av varandra då är sannolikheten för A OCH B p(a och B)= p A x p B Till exempel: jag har 1 chans i en miljon för att vinna på lotteriet. p A = 1 / 10 6 = 10-6 Varje dragning är oberoende av tidigare dragningar: Chansen för vinna två gånger i två dragninar: p 2ggr = p A x p A = 10-12 2

Binomialfördelning Binomialfördelning är sannolikhetsfördelning för antalet framgångar i en sekvens av n oberoende ja eller nej experiment, som var för sig har sannolikhet p. ja / nej röd / svart framgång / misslyckande 3

Binomialfördelning exempel Vid dragning ur urna med röda / svarta bollar Urna: p=0.5 är sannolikheten för att dra en röd boll. p=0.5 => betyder 50% chans Lägger man tillbaka bollen efter varje dragning då är sannolikheten konstant p=0.5 => dragningar är oberoende av varandra. Urna Sannolikheten för att dra en röd boll och återigen en röd boll är 0.5 x 0.5 = 0.5 2 = 0.25 Sannolikheten för att dra en röd boll n gånger är 0.5 n 0.5 /0.5 blandning 4

Om det är olika antal röda och svarta bollar N r och N s då är sannolikheten för att dra en röd boll p= N r /(N r +N s ) Sannolikheten för att dra 1 röd boll n gånger är nu Urna Prob(s=1 röd boll n dragningar) = p n detta är sannolikhet för en framgångsrik (=röd boll) dragning p / (1-p) blandning 5

Sannolikhet för flera framgångsrika dragningar? Man kastar n tärningar. Vad är sannolikheten för att få 3 sexor? Det finns 6 möjliga utfall 1,,6 Varje utfall har sannolikhet p=1/6 En person kan välja ett parti eller ej med sannolikhet p, och så gör man en opinions undersökning med n personer. => Hur räknar man osäkerheten på p? 6

Binomial Fördelning Exempel Vi kastar tärning n=10 ggr och man räknar antalet man får 6 Sannolikheten för att få utfallet 6 är p=1/6 i ett kast. Sannolikheten för att få utfallet 6 två ggr är p=(1/6) 2 i 2 kast. Sannolikheten för att få tio är (1/6) 10 =~10-8 Det är mer sannolikt att få 2 sexor om man kastar tärningen mer en två ggr 7

Binomial Fördelning Vad är sannolikheten Bin(3,2) att få 2 stycken 6 i 3 kast? Kast 1 Kast 2 Kast 3 Sannolikhet 6 6 6 1/6 x 1/6 x (1-1/6) 6 6 6 1/6 x (1-1/6) x 1/6 6 6 6 (1-1/6) x 1/6 x 1/6 Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 8 Antalet sätt att få två sexor med tre tärningar 3 = 3 2 sannolikhet att få 2 6 Om två utfall A och B är oberoende så är sannolikheten för (A OCH B) lika med produkten av sannolikhet för A ggr sannolikhet för B. sannolikhet att få något annat än 6 en gång

Binomial Fördelning Vad är sannolikheten Bin(3,2) att få 2 stycken 6 i 3 kast? Kast 1 Kast 2 Kast 3 Sannolikhet 6 6 6 1/6 x 1/6 x (1-1/6) 6 6 6 1/6 x (1-1/6) x 1/6 6 6 6 (1-1/6) x 1/6 x 1/6 Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 9 Antalet sätt att få två sexor med tre tärningar 3 = 3 2 sannolikhet att få 2 6 Om två utfall A och B är oberoende så är sannolikheten för (A OCH B) lika med produkten av sannolikhet för A ggr sannolikhet för B. sannolikhet att få något annat än 6 en gång

Binomial Fördelning Bin(3,2) = 3 x 1/6 x 1/6 x (1-1/6) = 3 x p 2 x (1-p) 3 2 = x p 2 x (1-p) I det allmäna fallet: 3 = 2 3! 2!(3 2)! = 1 2 3 (1 2) 1 = 3 B n,p (s) = n p s (1 p) n s s n är antalet försök, försökpersoner, opionsundersökta s är antalet positiva svar eller framgångar i n försök (s=success) p är sannolikheten för framgång per enstaka försök n = s n(n 1)...(n s +1) 1 2... s = n! s!(n s)! Vi bryr inte oss om sjävla uttrycket i denna kurs Det viktiga är att förstå att detta representerar på hur många sätt man kan välja s äpplen bland n 10

Tillämpningar Spelteori, många processer i vardagslivet Exempel: En fotballspelare gör flera försök att göra mål. Om hon har en sannolikhet att lyckas för varje försök på 0.25 och sparkar 4 gånger i en match, då är antalet mål binomialfördelad enligt B(4, 0.25). Där p föreställer sannolikheten för en enda spark ska lyckas, då är 1 p sannolikheten att mislyckas. Sannolikeheten för spelaren att göra 0, 1, 2, 3, eller 4 mål är i 4 försök är: Best bet1 11

Approximation med stora tal När np(1-p) är ca lika med eller större än 10 kan binomial fördelning approximeras mycket väl med en normal fördelning med medelvärde np och σ = np(1 p) 12

Approximera Binomialfördelning med normalfördelning Sannolikhet för s framgångar Antalet frangångar s binomial fördelning med n=6, p=0.5 och approximation med normalfördelning

Opinionsundersökningar Varje opinionsundersökning utförs med en ny grupp försökspersoner. Därför finns det ett slumpmässigt fel i undersökningen som beror på att andelen människor med en viss åsikt kan variera litet grand mellan olika grupper av tusen personer. Man väljer dock 1000 personer så att det ska inte variera för mycket från en grupp till en annan. Dessa 1000 personer ska också vara utvalda på ett sätt som inte påverkar resultatet (mer detaljer i nästa föresläsning). 14

Tänk på urnan Med en urna med 50% / 50% svarta och röda bollar kommer man ganska snabbt med få dragningar se att det är ungefär lika många svarta som röda. ju fler dragningar desto bättre uppskattning av p. 15

Vad är det statistiska felet (= slumpmässiga felet) i en opinionsundersökning? Anta ett statistiskt underlag på n=1000 personer. Den statisktiska osäkerheten kommer att vara störst för små partier eftersom det är få av dem undersökta människor som väljer de. Färre mätpunkter => större slumpmässigt fel. Låt oss räkna den statistiska osäkerheten för ett parti som får p=2%? 1) Kan vi använda normalfördelning som approximation? np(1-p) >10? Här p=0.02 och n=1000 (personer): np(1-p)=1000 x 0.98 x 0.02 = 19.6 JA vi kan använda normalfördelning som approximation 16

2) Vi använder standardavvikelsen från normalfördelningen Här p=0.02 och n=1000 (personer): σ = np(1 p) σ = 1000 0.98 0.02 = 4 Osäkerheten är alltså 4 personer i 1000 eller 0.4%. (2% parti representerar 20 personer i 1000) Osäkerheten på 2% är 2±0.4% Obs 1 sigma ger oss en 68% konfidensinterval, dvs 68% sannolikhet att det sanna värdet befinner sig i intervallet mellan 1.6% och 2.4% Om man 8 eller fler partier så är det sannolikt att några av de har den sanna opinionsiffran utanför konfidens intervallet. 17 Man väljer ibland att ange ett 95% konfidens interval (2 sigma) här 1.2% - 2.8% (med 95% konfidens)

ur mätvärdesbehandling 3 normalfördelning 18

Här används 2 sigma konfidensinterval 95% sannolikhet att det sanna värdet ligger inom det angivna intervallet 19 En låtsas opinionsundersökning 2 mätserier 95 % konfidens felstaplar För att jämföra parti X och parti Y måste man veta hur stora är felstaplarna. Det är bara 5% sannolikhet att det sanna värdet ligger utanför intervallet.

Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Antalet olyckor under fartbegränsningen har i Grönköping med omnejd varit 1. Under samma tid förra året var antalet 2, dvs en nedgång som är nog så uppenbar, å inte mindre än 50 procent. Måste man nog emellertid, liksom om olycksstatistiken i hela landet, säga, att den markanta nedgången av antalet olyckor till största delen beror på det halkiga väglaget. Grönköpings Veckoblad Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det är en effekt! 20

Från 2 olyckor till 1 olycka kan man inte dra slutsatsen att det inte ens är en effekt! Behöver så kallade Poisson fördelning för att räkna felet. Reproducerar fördelningen för hur många händelser inträffar under en viss period, i och med att händelserna är oberoende. Kan berätta att om man observera N så är felet N. 21 År 1: 2± 2 => 2±1 År 2: 1± 1 => 1±1 Helt kompatibla med varandra. Ingen statistisk signifikant minskning!

Att Tolka Undersökningar Man måste vara försiktig att tolka undersökningar Att jämföra olika kategorier Falska samband Jämföra olika undersökningar i tiden eller rum Jämförbara kategorier? Oberoende händelser Otillåten slutsats Metodiken 22

Jämföra Olika Kategorier i en Undersökning Om parti X har 31% och parti Y har 29% betyder det då att parti X verkligen har mer stöd än Y? Kom ihåg att för varje undersökning är det olika människor som tillfrågas Utan vidare information kan vi inte dra någon slutsats alls! 23 Vi behöver veta vad är osäkerheten. Brukar vara med alltid nu när opinionsundersökning levereras Man kan ofta i dagpressen hitta procentsatser utan någon som helst indikation om osäkerheten. Då ska man vara försiktig med att dra snabba slutsatser

Vad är osäkerheten i undersökningen? Om parti X har 32.0% och parti Y har 29.4% är betyder då att parti X verkligen mer stöd än Y? Om vi vet att det var 1000 personer som svarade: σ = np(1 p) σ = 1000 0.3 0.7 =14 Det betyder att osäkerheten är 14 personer ut av 1000 alltså 1.4% Då kan vi egentligen skriva: Parti X 32 ±1% Parti Y 29 ±1% Hur pass signifikant är skillnaden? => Jämför skillnaden med felen! (kom ihåg vilka värdesiffror som verkligen ska anges) 24

Signifikans när man jämför tal Då kan vi skriva: Parti Parti X 32 ±1% Y 29 ±1% Vi vill veta om X Y är tydligt över noll eller om X-Y är konsistent med noll! För att se om X-Y är konsistent med noll eller ej vi måste: 1. Räkna S=X-Y 2. Räkna felet σ X-Y på X-Y 3. Jämföra hur nära noll S är i förhållande med felet. 25

Avvikelsens Signifikans För att se om X-Y är kompatibelt med noll eller ej vi måste: - räkna S=X-Y - räkna felet σ X-Y på X-Y σ (X Y ) = σ X 2 +σ Y 2 σ (X Y ) = 1.4 2 +1.4 2 = 2 (samma formel på summan eller skillnad av två slumpmässiga variabler) se föreläsning 3 i mätvärdesbehandling S = (X Y) /σ X Y S = (32.0 29.4) /2 S = 2.6 /2 =1.3 När vi räknar måste vi använda alla värdesiffror annars lägger vi till avrundningsfel. Men resultatet presenteras enligt avrundningsregler! 26 => Skillnaden mellan Parti X och Parti Y och 1.3 standardavvikelse.

Skillnaden mellan parti X och Y är 1.3 standardavvikelse. Vilken slutsats ska man då dra? ur mätvärdesbehandling 3 normalfördelning 1.3 sigma eller standardavvikelse är relativt vanligt. Man kan bara säga att Parti X och Parti Y är på samma nivå. 27

Akta för falska samband Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Ett klassiskt exempel: En pedagog observerade att i en population av skolbarn i olika åldrar de som hade de största fötterna läste innantill bäst. Orsakar alltså stora fötter god inläsningsförmåga? 28

Akta för falska samband Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Ett klassiskt exempel: En pedagog observerade att i en population av skolbarn i olika åldrar de som hade de största fötterna läste innantill bäst. Orsakar alltså stora fötter god inläsningsförmåga? Svar: Nej, däremot har de äldre barnen i genomsnitt större fötter och bättre läsförmåga. 29

Säg att man observerar ett samband mellan egenskap A och B- Om man utför observationer i en öppen okontrollerad miljö observationella undersökningar är det svårt att skilja mellan följande fallen: A? B? Dold orsak? A B 30 Observationella undersökningar hjälper oss att hitta oanade samband och kopplingar! (se även laboration nr. 2) Experiment i mycket strängt kontrollerad miljö krävs för att skilja mellan olika scenarier.

Exempel dagligen i dagspressen Folk som gör si och så (A) löper dubbel så stor risk för (B) Ser man ett samband mellan A och B i en observationellstudie i en öppen miljö kan man inte dra slutsatsen att A innebär B. Det kan också finnas en gemensam orsak till A och B. Vi antar här att det var inga felaktigheter i undersökningen. Vi kommer senare att titta på hur man utför undersökningen. För att bevisa att en medicin fungerar eller är ofarlig behövs en mycket väl kontrollerad miljö => Nästa föreläsning Lärare 2 31

Att Jämföra Undersökningar i Tid och Rum Statistik från olika länder svåra att jämföra pga brist av enhetliga definitioner. Exempelvis när det gäller arbetslösheten finns det ofta nationella definitioner och sedan internationella definitioner så att man kan jämföra. Jämförelser mellan år i samma land måste också ske med försiktighet. Man måste vara säker på att man jämför samma sak i tiden. Exempel från Gunnar Blom: Ur Sannolikhetsteori och statistikteori med tillämpningar Från år 1938 till 1939 ökade antalet motorcyklar i Sverige från 43551 till 110262. Förklaringen är till största delen att lättviktarna räknades som motorcyklar fr o m 1939. 32

För att jämföra i tid måste mellan Mätning 1 och Mätning 2 måste man också studera felen. 33 En låtsas opinionsundersökning 2 mätserier 95 % konfidens felstaplar Man ska inte glömma att det är inte samma människor som blir tillfrågade i 2 olika undersökningar

Otillåten slutsats En forskare ville pröva den eventuella skadligheten hos en ny ingrediens i ett livsmedel, låt oss kalla den PQR. Han ordnade därför ett fullständigt randomiserat experiment med försöksdjur, gav somliga PQR, somliga ett bevisligen oskadligt preparat och studerade senare avkommans egenskaper. Bearbetningen skedde efter alla konstens regler, och resultatet blev: ingen signifikant sillnad mellan de båda behandlingsgrupperna. Den praktiska slutsatsen blev: ingen genetisk effekt, grönt ljus för PQR! Den praktiska slutsatsen var inte utan vidare berättigad. Av en icke signifikant differens kan man inte utan vidare dra slutsatsen att någon reell skillnad icke existerar. 34

Otillåten slutsats (2) Vad händer om man PQR testar på 10 personer och sannolikheten för att det ska vara farligt för en person är 15%? Det aktuella antalet personer som kommer få uppleva problem i testet kommer att följa en binomial fördelning med n=10 och p=0.15. Sannolikheten för att ingen upplever något är (1-p) n =(1-0.15) 10 =20% Så det är inte särskilt säkertställt att medicinen är ofarlig. I praktiken måste man testa på ett stort antal personer för att säkerställa att det är ofarligt (mer i nästa föreläsning om att testa läkemedel). 35 Man kan endast sätta en övre gräns på ofarligheten

Att Utföra Undersökningar Man måste vara försiktig att tolka undersökningar Ibland kan man ställa fel fråga Den föreslagna statistiken är felaktig eg procentsats som kan vara större än 100 % Störande faktorer Felaktigheter i datainsamling Illusorisk noggranhet Stickprov storkek 36

Övning Är minskningen mellan 2009 och 2010 statistiskt signifikant? 37