HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem Problem 1 (6p) En undersökning utfördes med målet att besvara frågan Hur stor andel av den vuxna befolkningen i Sverige äger ett skjutvapen?. 1012 vuxna personer svarade, av dessa sade 9% ja. Felmarginalen uppskattades till 3%. a) Ange ett intervall i procent som med 99% sannolikhet innehåller det sanna värdet av andelen vuxna som äger ett skjutvapen. (1p) b) Identifiera populationen. Identifiera rådata. (1p) c) Är denna undersökning en observationell eller experimentell studie? (0.5p) d) Är det rapporterade värdet 9% en populationsegenskap eller en egenskap hos stickprovet? (0.5p) e) I undersökningen ingår ett antal frågor om respondenten, som till exempel ålder, inkomster och utbildning. Varför? (1p) f) Du får veta att respondenterna svarade på en artikel i en veckotidning som bad läsarna att meddela sina svar via telefon. Påverkar det undersökningens giltighet? Varför eller varför inte? (1p) g) Beskriv en möjlig metod för att välja ett representativt slumpmässigt stickprov. (1p) Lösning för problem 1 a) Om inget annat anges motsvarar felmarginalen 1 standardavvikelse. Det betyder här att σ=3%. Från normalfördelningstabeller kan vi se att 99% sannolikhet i en normalfördelning motsvarar 2.58σ. Det betyder alltså att ett intervall som innehåller det sanna värdet med 99% måste vara (9±2.58σ). 2.58σ = 2.58 x 3 8%. Ett intervall som innehåller det sanna värdet med 99% sannolikhet är alltså: (9-8)% (9+8)% dvs mellan 1% och 17%. b) Populationen är gruppen vars egenskap ska härledas utifrån ett representativt urval. Populationen är alla vuxna personer i Sverige. Alla samlade svar från alla respondenter tillsammans med antalet personer som inte svarade på undersökningen utgör rådatan i studien. c) I denna undersökning behöver inte respondenterna agera på något särskilt sätt utöver det vanliga (förrutom att svara på frågor). Undersökningen är passiv, man observerar bara vad människorna gör. Det är en observationell studie. 1
d) Som det står i texten ovan: 1012 vuxna personer svarade, av dessa sade 9% ja. Därför är 9% en egenskap hos stickprovet. Hade det stått man härleder att 9% av den vuxna befolkningen då hade det varit en populationsegenskap. e) Oftast ingår socioekonomiska frågor om respondenten i undersökningen (till exempel ålder, inkomster, utbildning ). Detta gör att man kan jämföra socioekonomiska egenskaper hos stickprovet som hos hela befolkningen. Man kan då kontrollera att tex ålder, inkomst och utbildning hos tickprovet är representativa för hela befolkningen. Skulle de skilja sig kan man under vissa förutsättningar korrigera för det (då måste populationsegenskap beräknas från stickprovsegenskap). f) För att kunna härleda populationegenskap utfirån stickprovet måste stickprovet vara tillräckligt representativt för hela populationen och om det uppstår avvikelser mellan stickprovet och hela populationen, måste man kunna uppskatta dessa skillnader. Om undersökningen utförs som beskrivet, då betyder det att stora delar av befolkningen kommer inte alls att vara representerade i undersökningen, eftersom veckotidning kommer oftast att vända sig till en särskild profil i befolkningen. Om vissa grupper inte alls är representerade i stickprovet, då kan man inte korrigera för dem. I en sådan undersökning är det också svårt att veta vad som skiljer populationen och stickprovet. g) Ett robust sätt att bygga ett representativt stickprov är om man har tillgång till en lista på hela befolkningen. Då kan man slumpmässigt dra ett antal personer från hela listan. I så fall har alla personer lika stor chans att vara med i undersöknigen och detta utgör ett representativt urval. Man kan skicka brev till alla, istället för att ringa eftersom en del kanske inte har telefon. Tiden på dygnet då folk är tillgängliga för att besvara telefon kan ocskå utgöra en störande faktor. Problem 2 (6p) Styrelsen i Lillebyskolan skapar debatt. Styrelsen vill byta arbetsmetodik eftersom så många som 20% (p=0.2) av Lillebyskolans elever får sämre betyg än riksgenomsnittet. Styrelsen räknade med att den statistiska osäkerheten på dessa 20% är 2% (alltså p=0.20±0.02). a) Vilken andel elever borde vara under riksgenomsnittet om skolan var en genomsnittlig skola? Är det logiskt eller ologiskt att vilja byta arbetsmetodik? (2p) b) Vi antar i denna fråga att Lillebyskolan är en genomsnittlig skola. Vad är då sannolikheten för att en statistisk avvikelse skulle leda till p=0.2? Vi antar att andelen elever med sämre betyg än riksgenomsnittet kan modelleras med en normalfördelning vars standardavvikelsen är 0.02. (2p) 2
c) Du får höra att Lillebyskolan är en av de minsta skolorna i landet, och har bara 25 elever mellan skolåren 1 6. Vad säger det om styrelsens beräkningar? Förklara. (2p) Lösning för problem 2 a) Om vi antar att betygen är normalfördelade (eller en annan symmetrisk fördelning), så kommer alltid 50% av eleverna vara under medelbetyget och 50% kommer vara över medelbetyget. Vi säger att i skolan är det 20% av eleverna som får sämre betyg än riksgenomsnittet. 80% får alltså bättre betyg än riksgenomsnittet, trots att man skulle kunna förvänta sig bara 50% över riksgenomsnittet. Det är allstå flera duktiga elever över riksgenomsnittet än vad det är för en annan genomsnittlig skola. Det motsätter sig styrelsens beslut och tyder på att denna skola är egentligen bättre än riksgenomsnittet. b) Vi antar i denna fråga att Lillebyskolan egentligen är en genomsnittlig skola, vilket betyder att det sanna värdet för p sann är 0.5. Då undrar man vad är sannolikheten för att få det uppmätta p mätt =0.20±0.02 pga av en statistik fluktuation i årets betyg. Precision i mättningen är σ=0.02 enligt styrelsen. Vi kan konstatera att skillnaden mellan det uppmätta p mätt =0.20 och det sanna p sann skulle i så fall vara p sann -p mätt =0.5-0.2 = 0.30 =15σ. Sannolikheten för en statistisk fluktuation på 15 standardavvikelser är mycket mycket liten och mindre än den minsta tillgängliga sannolikheten i bifogade normalfördelningstabeller, alltså mindre än 0.0001%. c) Styrelsen räknade p=0.20±0.02 för andelen elever med sämre betyg än riksgenomsnittet. Med 25 elever mellan skolåren 1 6 det betyder att 25x0.2=5 elever i skolan har sämre betyg. Nu kan man titta på osäkerheten, nämligen 0.02, vilket motsvarar 25x0.02=0.5 elever. Den angivna osäkerheten i antal elever är alltså mindre än en elev. Men en statistisk fluktuation måste alltid leda till minst en elev. Om antalet elever var till exempel Poisson fördelad skulle det leda till en osäkerhet på 5 2 elever. Styrelsen har alltså underskattat den statistiska osäkerheten som omöjligen kan vara mindre än en elev. Problem 3 (6p) På ett sjukhus har man problem med patienter som lider av allergi mot sänglakan, och man tror att det kan bero på vissa kemikalier som används när dessa tvättas. Flera läkare menar dock att det inte är möjligt och att allergin är psykosomatisk (dvs har sin grund i psykiska eller emotionella störningar). 3
a) Vi vill utföra ett första test där lakan kan genomgå en särskild behandling som behandlar dessa helt utan kemikalier och därför inte kan orsaka allergiska reaktioner. Beskriv i detalj hur ett sådant test skulle kunna utformas. Hur skulle patienter och sjukhuspersonalen kunna vara involverade, så att man kan skilja mellan placeboeffekt och verklig effekt. Vilken metodik använder man sig av? (3p) b) Den skeptiska läkargruppen vill utföra ett nytt test för att bestämma om allergin är psykosomatisk. Beskriv i detalj ett sådant test och hur den skulle involvera personalen och patienterna på sjukhuset. (3p) Lösning för problem 3 a) Vi vill bestämma först om de särbehandlade lakanen hjälper mot allergin. Man kan bygga en dubbelblind experimentellstudie. Man behöver då bygga en kontrollgrupp och en testgrupp. Det ska vara tillräckligt många patienter i varje grupp för att resultaten ska kunna ha tillräckligt statistisk säkerhet. Patienterna i varje grupp bör veta att de är med i studien men får inte veta vilken typ av lakan de får. I kontrollgruppen får patienter vanliga lakan medan patienter i testgruppen får särskilda lakan. För att undvika störande psykologiska faktorer som kan störa slutsatsen, får personalen närmast patienterna inte veta vilken typ av lakan de använder. Genom användning av dubbelblind metoden är dem psykologiska förhållanden samma för både testgruppen och kontrollgruppen och om det finns en placeboeffekt pga att patienter vet att de är med i studien, som bör effekten vara samma i båda grupper. b) I förra frågan ville man se om särskilda lakan hjälper eller inte mot allergin. I denna fråga vill man däremot bestämma om allergin beror på lakanen eller en annan faktor. Nu vi vill testa om den psykologiska faktorn spelar roll här. Därför behöver kontrollgruppen och testgruppen ha olika psykologiska förhållanden under samma fysiska förhållanden. Man kan exempelvis ge båda grupper samma typ av lakan, av den vanliga sorten, men man berätta för ena gruppen att de får särskilda antiallergiska lakan och berättar för den andra gruppen att de får vanliga lakan. Båda grupper måste veta att de ingår i en studie om allergi. För att undvika störande faktorer svåra att uppskatta som tex psykologin mellan personalen och patienterna, får inte personalen heller veta detaljerna om studien. De får inte veta att alla patienter får samma typ av lakan och gärna tro att vissa får särskilda sådana, medan andra får vanliga, men att de inte vet vem får vad. 4
Problem 4 (6p) I en skola vill man undersöka om det hjälper eleverna att lyssna på klassisk musik samtidigt som de har självständigt arbete. Man skapar 2 grupper av 100 elever var: grupp 1) som får lyssna på klassisk musik under självständigt arbete och grupp 2) som inte får lyssna på någon musik alls. a) Vilken är kontrollgruppen och vilken är testgruppen? (1p) b) I slutet av terminen observerar man att antalet elever med betyg A är: 8 i grupp 1 och 4 i grupp 2. En av föräldrarna gör följande uttalande: Klassiskmusik leder till en fördubbling av antalet elever med högsta betyg. Kommentera. (1p) c) Hur signifikant är skillnaden mellan grupp 1 och grupp 2? (2p) d) Eleverna fick själva bestämma om de skulle vara med i grupp 1 eller grupp 2. Påverkar detta resultatet? Om det påverkar resultatet, hur? Om det inte påverkar resultatet, varför inte? (2p) Lösning för problem 4 a) Testgruppen är alltid den man experimenterar på, i det här fallet gruppen som får lyssna på musik. Testgruppen är grupp 2. b) Antalet elever som får högsta betyget följer en statistisk fördelning. Frågan är då om det följer samma fördelning i grupp 1 och 2. Man måste tänka på att även om betygen i båda grupper följer samma fördelning, det verkliga utfallet kan variera pga normala statistiska fluktuationer. Så även om den underliggande fördelningen för betygen var samma i grupp 1 och 2 så kan det hända att för ett visst utfall så är det flera A betyg i ena gruppen än i den andra gruppen. Man behöver räkna sannolikheten för den observerade skillnaden innan man dra en slutsats. c) Här antar vi att antalet elever med betyg A föjler en Poisson fördelning. Vi börjar med att anta att båda grupper följer samma Poisson fördelning och räknar under denna hypotes hur sannolikt det är att få 8 A betyg i grupp 1 och 4 A betyg i grupp 2. Vi har 8 stycken med betyg A i grupp 1 och 4 i grupp 2. (Vi kommer ihåg att grupp 1 och 2 har lika många elever). Dessa antal studenter borde vara samma inom statistiska fluktuationer om de kom från samma fördelning. Med Poissonfel måste vi därför jämföra N1=8± 8 och N2=4± 4, är skillnaden mellan N1 och N2 kompatibel med noll inom felen? N1-N2=4 Den statistiska osäkerheten på N1-N2 är ( 8 2 + 4 2 )= 12=3.5. Då är N1-N2=4±3.5. 5
Vi ser att skillnaden mellan båda grupper är inom en standardavvikelse från noll, och är därför inte tillräckligt stor för att fastställa en skillnad mellan grupp 1 och 2. d) Att eleverna fick bestämma själva i vilken grupp de fick ingå betyder att grupperna 1 och 2 är inte representativa urval av hela populationen. Det finns redan en grundläggande skillnad mellan grupp 1 och 2 innan ens experimentet med musik har börjat. Detta gör det omöjligt att dra någon slutsats angående effekten av att lyssna på på musik under självständigt arbete. 6