0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan variablerna är signifikant. a. För vilket sampel (A, B eller C) är t-värdet som störst? C För vilket sampel är t-värdet som lägst? A b. Enbart för ett av samplen är sambandet signifikant. Vilket? C 5. Spridningsdiagrammet nedan beskriver sambandet mellan sysselsättningsgrad och självmordsfrekvens bland män i 169 länder. Du vill testa om sambandet är signifikant och får ett t-värde på -3,10. Är detta ett signifikant samband? Motivera kortfattat. Ja, t = -3,10 vilket är mindre än -2. 40 50 60 70 80 90 sysselsättning 6. Du vill testa om ungdomar med ADHD har ett sämre genomsnittlig arbetsminne än ungdomar överlag. (Arbetsminnet är en persons korttidsminne och kan mätas som antalet siffror en person kan hålla i minnet samtidigt.) Bland ungdomar överlag ligger det genomsnittliga arbetsminnet på 7 siffror: µ = 7. Bland 50 slumpmässigt utvalda ungdomar med ADHD så är det genomsnittliga arbetsminnet 6,0 siffror.
a. Beskriv noll- och mothypotesen. Nollhypotesen: Ingen skillnad i genomsnittligt arbetsminne mellan personer med ADHD och övriga. Mothypotesen: Skillnad b. T-värdet blir -2,2. Betyder detta att ungdomar med ADHD har signifikant sämre arbetsminne än ungdomar överlag? Motivera kortfattat. Ja, t = -2,2 vilket är mindre än -2. 7. I kapitel 5 (Multipel regression) så såg vi på följande regression hämtad ur artikeln Body mass index as indicator of standard of living in developing countries. Utfallet är BMI. a. Enbart en av de oberoende variablerna har inte en signifikant effekt på BMI. Vilken? Electricity, dummy b. Water, dummy är en variabel som antar värdet 1 om personen har tillgång till rent vatten och annars värdet 0. De som har tillgång till rent vatten har i snitt 0,443 enheter högre bmi än övriga (kontrollerat för de andra x- variablerna); p-värdet är 0,0074. Vilket eller vilka av följande påståenden är korrekta? Den här effekten hör till de 0,74 procent mest extrema som man kan få bara av slumpen. sant Ungefär 0,7 procent av personerna har tillgång till rent vatten. Den här effekten är signifikant på 1-procentsnivån. sant 8. Videolänk. Tabellen nedan är hämtad ur artikeln Rooted in Poverty? Terrorism, Poor Economic Development, and Social Cleavages. Artikelns frågeställning: Vilka faktorer predikterar terrorism? Man använder data för 95 länder och mäter olika egenskaper hos länderna (ekonomiska, demografiska och
politiska) och ser hur dessa relaterar till graden av terrorism. Graden av terrorism mäts som antalet terrorattacker under åren 1986-2002, samt antalet döda i terrorattacker under samma period. I tabellen nedan visas resultatet från två multipla regressionsanalyser (en för respektive utfall). Standardfel ges inom parentes; signifikanta effekter är utmärkta med en stjärna*. a) Visa att arbetslöshet (unemployment) inte har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Beskriv också hur stort t- värdet borde vara för att effekten ska klassas som signifikant (ett ungefärligt svar räcker). t = 1,13. För signifikans borde t-värdet bli större än 2, alternativt mindre än -2. b) Visa att Etnisk-religiös mångfald (Ethno-religious diversity) har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Ungefär hur stort är p-värdet? t = 3,62; p-värdet < 0,01 c) Se fråga b: Är den här effekten signifikant på 10-5- eller 1-procentsnivån? 1- procentsnivån Kommentar: För att besvara fråga b) kan vi kolla i tabellen: Den här tabellen finns inte med i formelsamlingen för deltent 5. Betyder det att man ska kunna denna utantill? Nej, i deltenten räcker det att veta att ett t-värde som (absolut sett) är större än 2 ger ett p-värde på 0,05 eller mindre. På tenten skulle jag också ge rätt för det svaret på fråga b, dvs. att p-värdet är mindre än 0,05.
För övrigt är det jättebra att veta att ett t-värde som absolut sett är 2 eller större betyder signifikans. I statistiska rapporter tar man ofta för givet att läsaren vet detta, dvs. många rapporter ger bara effekten + standardfelet och räknar sen med att läsaren själv ska kunna se om sambandet är signifikant eller ej. 9. Nedan kan du läsa abstraktet till en artikeln The GCP Event Experiment: Design, Analytical Methods, Results. Artikeln beskriver ett högst kontroversiellt experiment. GCP står för The Global Consciousness Project. Projektet går ut på att mäta om mänsklighetens globala medvetande kan påverka utfallet i slumpgeneratorer (dvs. datorer som kastar ur sig siffror slumpmässigt). Hypotesen är att stora världsnyheter ska synas i slumpsiffrorna, dvs. påverka det slumpmässiga mönstret i data. a) Författarna skriver att: The cumulative significance across all events favors the hypothesis by more than 4.5 standard deviation. Notering: Läs som 4,5 standardfel. Är detta, statistiskt sett, ett starkt stöd för deras hypotes? Motivera kortfattat. Ja, detta betyder att t-värdet är 4,5 vilket är klart större än 2. (Det är också möjligt att t-värdet är -4,5 men slutsatsen blir densamma.) b) Beskriv nollhypotesen i den här studien. Inget samband, dvs. världsnyheter har inget samband med mönstret i slumpgenererade siffror 10. Du vill mäta hur stor andel av studerande vid Åbo Akademi som jobbar vid sidan av studierna. Du samplar slumpmässigt 300 studerande varav 25 procent jobbar vid sidan av studierna, med ett standardfel på 2,5 procentenheter. Vilket eller vilka av följande påståenden är korrekta? a. Standardfelet mäter hur andelen som jobbar vid sidan av studierna skulle variera från sampel till sampel om vi gjorde upprepade dragningar, men alltid 300 studerande. sant b. Ju större sampel desto lägre standardfel (allt annat lika). sant
c. Standardfelet är ett slags mått på osäkerheten i uppskattningen av den sanna andelen studerande som jobbar vid sidan av studierna. sant