1 Lärare 4 Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum Lärare 2 Att utföra undersökningar Sneda statistiska underlag Störande faktorer Hypotestester Placebo effekt Blindtester av läkemedel Lärare 3 Vetenskap och pseudovetenskap Hur man inte ska avfärda Att känna igen pseudovetenskap Poissonfördelning Simulering av vardagliga problem Tillämpnig på trafikflöde Lärare 4 Binomialfördelning: användningsområde Normal fördelning vs binomial Att jämföra två mätningar Signifikans och p-värde Testa medicin / kontroll grupp Övning Lärare 5 Analys av en statisktisk undersökning Bemöta spådomar om världens undergång Analys av protokollet för ett test av rutgängare Analys av en recension och stickprovmetodik
Binomialfördelning - Användningsområde Varje försök har exakt två möjliga utfall t.ex. ja/nej, svart/vitt, framgång/misslyckande Varje försök har exakt samma förutsättningar som föregående t.ex. sannolikhet för framgång är samma vid varje försök Kännetecknas av En sannolikhet p per försök Antalet försök n Antalet framgångar s. sannolikhet för ett antal s framgångar i n försök: B n,p (s) 2
formeln finns med i Physics handbook. sannolikhet för ett antal s framgångar i n försök: B n,p (s) = n p s (1 p) n s s hur många olika sätt som finns att välja s bland n. sannolikhet att få s framgångar sannolikhet att få 1-s misslyckande 3 n = s n(n 1)...(n s +1) 1 2... s = n! s!(n s)!
En fotball spelare har under en match 4 tillfällen att försöka göra mål man vill veta sannoliheten att göra 2 mål bland 4 försök 4 tillfälle 1 tillfälle 2 tillfälle 3 tillfälle 4 utfall 1 mål mål utfall 2 mål mål utfall 3 mål mål utfall 4 mål mål utfall 5 mål mål utfall 6 mål mål Det finns 6 möjliga utfall där spelaren gör mål ut av 4 måltillfällen = n s = 4 2 = 4! 2!(4 2)! = 1 2 3 4 1 2 (2)! = 1 2 3 4 1 2 1 2 = 6 n s = 4 2
Varför p s? Exempel Vi kastar tärning n=10 ggr och man räknar antalet man får 6 Sannolikheten för att få utfallet 6 är p=1/6 i ett kast. Sannolikheten för att få utfallet 6 två ggr är p=(1/6) 2 i 2 kast. Sannolikheten för att få tio är (1/6) 10 =~10-8 Det är mer sannolikt att få 2 sexor om man kastar tärningen mer en två ggr 5
Binomialfördelning - Exempel Antalet elever/människor/väljare / patienter/ försök som tillhör en viss kategori: Tillhör = Ja/Nej begrepp. blir frisk / röstar på parti X / får bäst betyg / osv. Typiskt som följer binomialfördelning är en andel 6
Tentafråga Styrelsen i Lillebyskolan skapar debatt. Styrelsen vill byta arbetsmetodik eftersom så många som 20% (p=0.2) av Lillebyskolans elever får sämre betyg än riksgenomsnittet. Antalet elever är Ntot = 5. Styrelsen räknade med att den statistiska osäkerheten på dessa 20% är 2% (alltså p=0.20±0.02). a) Vilken andel elever borde vara under riksgenomsnittet om skolan var en genomsnittlig skola? Är det logiskt eller ologiskt att vilja byta arbetsmetodik? (2p) b) Vi antar i denna fråga att Lillebyskolan är en genomsnittlig skola. Vad är då sannolikheten för att en statistisk avvikelse skulle leda till p=0.2? Vi antar att andelen elever med sämre betyg än riksgenomsnittet kan modelleras med en normalfördelning vars standardavvikelsen är 0.02. (2p) 7
a) Vilken andel elever borde vara under riksgenomsnittet om skolan var en genomsnittlig skola? Är det logiskt eller ologiskt att vilja byta arbetsmetodik? (2p) Om vi antar att betygen är normalfördelade (eller en annan symmetrisk fördelning), så kommer alltid 50% av eleverna vara under medelbetyget och 50% kommer vara över medelbetyget. Vi säger att i skolan är det 20% av eleverna som får sämre betyg än riksgenomsnittet. 80% får alltså bättre betyg än riksgenomsnittet, trots att man skulle kunna förvänta sig bara 50% över riksgenomsnittet. Det är allstå flera duktiga elever över riksgenomsnittet än vad det är i en annan genomsnittlig skola. Det motsäger styrelsens beslut och tyder på att denna skola är egentligen bättre än riksgenomsnittet. 8
b) Vi antar i denna fråga att Lillebyskolan är en genomsnittlig skola. Vad är då sannolikheten för att en statistisk avvikelse skulle leda till p=0.2? Vi antar att andelen elever med sämre betyg än riksgenomsnittet kan modelleras med en normalfördelning vars standardavvikelsen är 0.02. (2p) OBS1 andelen elever är egentligen binomialfördelad, men under vissa förhållanden kan det approximeras med normalfördelning. 9
Approximation av binomial fördelning med normalfördelning När np(1-p) är ca lika med eller större än 10 kan binomial fördelning approximeras mycket väl med en normal fördelning med medelvärde µ = np och standard avvikelse: σ = np(1 p) 10
Approximera Binomialfördelning med normalfördelning Sannolikhet för s framgångar Antalet frangångar s binomial fördelning med n=6, p=0.5 och approximation med normalfördelning 11
b) Vi antar i denna fråga att Lillebyskolan är en genomsnittlig skola. Vad är då sannolikheten för att en statistisk avvikelse skulle leda till p=0.2? Vi antar att andelen elever med sämre betyg än riksgenomsnittet kan modelleras med en normalfördelning vars standardavvikelsen är 0.02. (2p) b) Vi antar i denna fråga att Lillebyskolan egentligen är en genomsnittlig skola Det betyder att det sanna värdet för p sann är 0.5. så mäter man p i praktiken: p mätt = Antalet elever med bättre betyg Totalla antalet elever men p är också en grundegenskap hos skolan som har ett sant värde p sann som man försöker komma åt med en undersökning. p mätt är bara en uppskattning av p sann. 12 Antalet elever med bättre betyg kan fluktuera från år till år också bara pga av statistiska fluktuationer.
och p sann är 0.5. p mätt = N sämre N tot Vad är sannolikheten för att få det uppmätta p mätt =0.20±0.02 pga av en statistik fluktuation i årets betyg. Alltså hur sannolikt är det att få, dvs mäta : p mätt = N sämre? N tot = 0.2 Antalet elever med sämre betyg = N sämre är binomialfördelad (bättre = framgång, sämre= misslyckande) Resultatet i skolan = Resultatet i skolan eller värre än så: N sämre = 0.2N tot N sämre > 0.2N tot 13
I problemets text står följande: Andelen elever med sämre betyg än riksgenomsnittet kan modelleras med en normalfördelning Då kan vi använda en normalfördelning med: N tot = 5 N sämre < 0.2N tot = 0.2 5 =1 p sann är 0.5 µ = N tot p = 2.5 σ = 0.25 5 =1.1 =2.5 N sämre µ = 0.2N tot µ = 1 2.5 σ 1.1 1.1 = 1.4 14
Att Jämföra två mätningar Ofta vill man jämföra två mätningar och vill dra en slutsats om dessa är olika är konsistenta med varandra. Fråga: Studenter mäte accelerationskonstanten i Uppsala som i Stockholm och undrar om det är den samma. g S = 9.7 ± 0.1m.s -2 g U = 9.9 ± 0.1m.s -2 Utan vidare information antar vi att g är normalfördelad. Visar dessa mätningar att accelerationskonstanten är signifikant olika? 15
g S = 9.7 ± 0.1m.s -2 g U = 9.9 ± 0.1m.s -2 Visar dessa mätningar att accelerationskonstanten är signifikant olika? Vi tittar på skillnaden mellan dessa mätningar: Δ = g S - g U = 0.2 Vad är osäkerheten på? Felpropagering! σ Δ = σ 2 g S +σ 2 gu = 0.1 2 + 0.1 2 = 0.14 Δ är det kompatibelt med noll inom felen? om ja då är det ingen signifikant skillnad om nej, då är det en signifikant skillnad 16
Δ = g S - g U = 0.2 σ Δ = σ 2 g S +σ 2 gu = 0.1 2 + 0.1 2 = 0.14 Skillnaden är 0.2 med ett fel på 0.14 I samma storlek ordning vi kan redan säga att det är inte en mycket signifikant skillnad. För att vara mer kvantitativ vi kan räkna signifikansen t = g S - g U σ Δ = 0.2/0.14 =1.4 17 denna mängd följer en normalfördelning med medelvärde noll och standardavvikelse 1 om gs och gu tillhör samma underliggande fördelning
vi mäte t=1.4, hur signifikant är det? arean mellan -1.4 och +1.4 är 84% alltså det är 16% sannolikhet att få t > 1.4 eller t < -1.4 16% är inte särskilt osannolikt! brukar räknas som osannolikt om mindre än 5% eller mindre än 1% Man kan då tala om 95% konfidens nivå eller 99% konfidens nivå. 18
Att Jämföra två mätningar två mätningar med värden X, Y och fel σ X, σ Y t = X - Y σ X Y = X - Y σ X 2 +σ Y 2 t är normalfördelad med medelvärde noll och standardavvikelse 1 och dess sannolikhet kan därför läsas av standarda tabeller (se förra sidan) 19
Problem 4 (6p) I en skola vill man undersöka om det hjälper eleverna att lyssna på klassisk musik samtidigt som de har självständigt arbete. Man skapar 2 grupper av 100 elever var: grupp 1) som får lyssna på klassisk musik under självständigt arbete och grupp 2) som inte får lyssna på någon musik alls. a) Vilken är kontrollgruppen och vilken är testgruppen? (1p) b) I slutet av terminen observerar man att antalet elever med betyg A är: 8 i grupp 1 och 4 i grupp 2. En av föräldrarna gör följande uttalande: Klassiskmusik leder till en fördubbling av antalet elever med högsta betyg. Kommentera. (1p) c) Hur signifikant är skillnaden mellan grupp 1 och grupp 2? (2p) d) Eleverna fick själva bestämma om de skulle vara med i grupp 1 eller grupp 2. Påverkar detta resultatet? Om det påverkar resultatet, hur? Om det inte påverkar resultatet, varför inte? (2p) 20
Problem 4 (6p) I en skola vill man undersöka om det hjälper eleverna att lyssna på klassisk musik samtidigt som de har självständigt arbete. Man skapar 2 grupper av 100 elever var: grupp 1) som får lyssna på klassisk musik under självständigt arbete och grupp 2) som inte får lyssna på någon musik alls. a) Vilken är kontrollgruppen och vilken är testgruppen? (1p) a) Testgruppen är alltid den man experimenterar på, i det här fallet gruppen som får lyssna på musik. Testgruppen är grupp 2. 21
b) I slutet av terminen observerar man att antalet elever med betyg A är: 8 i grupp 1 och 4 i grupp 2. En av föräldrarna gör följande uttalande: Klassiskmusik leder till en fördubbling av antalet elever med högsta betyg. Kommentera. (1p) b) Antalet elever som får högsta betyget följer en statistisk fördelning. Frågan är då om det följer samma fördelning i grupp 1 och 2. Man måste tänka på att även om betygen i båda grupper följer samma fördelning, det verkliga utfallet kan variera pga normala statistiska fluktuationer. Därför måste man vara försiktig innan man uttalar sig. Så även om den underliggande fördelningen för betygen var samma i grupp 1 och 2 så kan det hända att för ett visst utfall så är det flera A betyg i ena gruppen än i den andra gruppen. Man behöver räkna sannolikheten för den observerade skillnaden innan man dra en slutsats. 22
Betyg A: 8 i grupp 1 och 4 i grupp 2. c) Hur signifikant är skillnaden mellan grupp 1 och grupp 2? (2p) c) Antalet elever med betyg A föjler en binomialfördelning. Vi vill räkna den statistiska osäkerheten på antalet elever med A betyg i gupp 1 och 2. Grupp1: p = 8/ 100 = 0.08 µ = N tot p = 8 σ = N tot p(1 p) = 100 0.08 0.92 = 2.7 Grupp 1: NA1 = 8±2.7 Grupp2: p = 4/ 100 = 0.04 µ = N tot p = 4 σ = N tot p(1 p) = 100 0.04 0.96 = 2.0 Grupp 2: NA2 = 4±2 23
Hur signifikant är skillnaden? Grupp 1: NA1 = 8±2.7 Grupp 2: NA2 = 4±2 t = 8-4 σ Δ = 4 2.71 2 +1.96 2 =1.2 24
vi mäte t=1.2, hur signifikant är det? arean mellan -1.2 och +1.2 är 77% alltså det är 23% sannolikhet att få t > 1.2 eller t < -1.2 23% är inte särskilt osannolikt! 25
d) Eleverna fick själva bestämma om de skulle vara med i grupp 1 eller grupp 2. Påverkar detta resultatet? Om det påverkar resultatet, hur? Om det inte påverkar resultatet, varför inte? (2p) d) Att eleverna fick bestämma själva i vilken grupp de fick ingå betyder att grupperna 1 och 2 är inte representativa urval av hela populationen. Det finns antagligen faktorer som gör att elever grupperar sig som de gör och det går inte att veta hur det påverkar resultatet Det kan då finnas andra grundläggande skillnader mellan grupp 1 och 2 innan ens experimentet med musik har börjat. Detta gör det omöjligt att dra någon slutsats angående effekten av att lyssna på på musik under självständigt arbete. 26 Ett exempel på hur ett litet fel i studiens uppbyggnad omintetgör hela experimentet.
Problem 3 (6p) På ett sjukhus har man problem med patienter som lider av hudallergi mot sängkläder, och man tror att det kan bero på vissa kemikalier som används när dessa tvättas. Flera läkare menar dock att det är omöjligt och att allergin är psykosomatisk (dvs har sin grund i psykiska eller emotionella störningar). a) Vi vill utföra ett första test där lakan genomgår en särskild högtemperatur behandling helt utan kemikalier och därför inte kan orsaka allergiska reaktioner. Studien ska kunna bestämma om de särbehandlade lakanen hjälper mot allergin. Beskriv i detalj hur ett sådant test skulle kunna utformas. Hur skulle patienter och sjukhuspersonalen kunna vara involverade, så att man kan skilja mellan placeboeffekt och verklig effekt. Vad heter metodik använder man sig av? (3p) 27
a) Vi vill bestämma först om de särbehandlade lakanen hjälper mot allergin. Man kan bygga en dubbelblind experimentellstudie. Man behöver bygga en kontrollgrupp och en testgrupp. I kontrollgruppen får patienter vanliga lakan medan patienter i testgruppen får särskilda lakan. 28
a) Vi vill bestämma först om de särbehandlade lakanen hjälper mot allergin. Man kan bygga en dubbelblind experimentellstudie. Man behöver bygga en kontrollgrupp och en testgrupp. I kontrollgruppen får patienter vanliga lakan medan patienter i testgruppen får särskilda lakan. Det ska vara tillräckligt många patienter i varje grupp för att resultaten ska kunna ha tillräckligt statistisk säkerhet. 29
a) Vi vill bestämma först om de särbehandlade lakanen hjälper mot allergin. Man kan bygga en dubbelblind experimentellstudie. Man behöver bygga en kontrollgrupp och en testgrupp. I kontrollgruppen får patienter vanliga lakan medan patienter i testgruppen får särskilda lakan. Det ska vara tillräckligt många patienter i varje grupp för att resultaten ska kunna ha tillräckligt statistisk säkerhet. Patienterna i varje grupp bör veta att de är med i studien men får inte veta vilken typ av lakan de får. Blind 30
a) Vi vill bestämma först om de särbehandlade lakanen hjälper mot allergin. Man kan bygga en dubbelblind experimentellstudie. Man behöver bygga en kontrollgrupp och en testgrupp. I kontrollgruppen får patienter vanliga lakan medan patienter i testgruppen får särskilda lakan. Det ska vara tillräckligt många patienter i varje grupp för att resultaten ska kunna ha tillräckligt statistisk säkerhet. Patienterna i varje grupp bör veta att de är med i studien men får inte veta vilken typ av lakan de får. Blind För att undvika störande psykologiska faktorer som kan störa slutsatsen, får personalen närmast patienterna inte veta vilken typ av lakan de använder. Dubbelblind Genom användning av dubbelblind metoden är dem psykologiska förhållanden samma för både testgruppen och kontrollgruppen och om det finns en placeboeffekt pga att patienter vet att de är med i studien, som bör effekten vara samma i båda grupper. 31
b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) 32
b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) b) I förra frågan ville man se om särskilda lakan hjälper eller inte mot allergin. I denna fråga vill man däremot bestämma om allergin beror på lakanen eller en annan faktor. Nu vi vill testa om den psykologiska faktorn spelar roll här. 33
b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) b) I förra frågan ville man se om särskilda lakan hjälper eller inte mot allergin. I denna fråga vill man däremot bestämma om allergin beror på lakanen eller en annan faktor. Nu vi vill testa om den psykologiska faktorn spelar roll här. Därför behöver kontrollgruppen och testgruppen ha olika psykologiska förhållanden under samma fysiska förhållanden. Man kan ge båda grupper samma typ av lakan, av den vanliga sorten. 34
b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) b) I förra frågan ville man se om särskilda lakan hjälper eller inte mot allergin. I denna fråga vill man däremot bestämma om allergin beror på lakanen eller en annan faktor. Nu vi vill testa om den psykologiska faktorn spelar roll här. Därför behöver kontrollgruppen och testgruppen ha olika psykologiska förhållanden under samma fysiska förhållanden. Man kan ge båda grupper samma typ av lakan, av den vanliga sorten. Testgruppen får höra att de får särskilda antiallergiska lakan. Kontrollgruppen får höra att de får vanliga lakan. Båda grupper måste veta att de ingår i en studie om allergi. 35
b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) b) I förra frågan ville man se om särskilda lakan hjälper eller inte mot allergin. I denna fråga vill man däremot bestämma om allergin beror på lakanen eller en annan faktor. Nu vi vill testa om den psykologiska faktorn spelar roll här. Därför behöver kontrollgruppen och testgruppen ha olika psykologiska förhållanden under samma fysiska förhållanden. Man kan ge båda grupper samma typ av lakan, av den vanliga sorten. Testgruppen får höra att de får särskilda antiallergiska lakan. Kontrollgruppen får höra att de får vanliga lakan. Båda grupper måste veta att de ingår i en studie om allergi. För att undvika störande faktorer svåra att uppskatta som tex psykologin mellan personalen och patienterna, får inte personalen veta att alla patienter får samma typ av lakan. 36
Nästa och sista föreläsning En känd statisktik studie Flera tentalfrågor. 37