HYPOTESPRÖVNING sysselsättning

Relevanta dokument
ÖVNINGSUPPGIFTER KAPITEL 8

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

ÖVNINGSUPPGIFTER KAPITEL 12

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

ÖVNINGSUPPGIFTER KAPITEL 4

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 6

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

ÖVNINGSUPPGIFTER KAPITEL 6

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Statistik och epidemiologi T5

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

ÖVNINGSUPPGIFTER KAPITEL 7

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Linjär regressionsanalys. Wieland Wermke

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

import totalt, mkr index 85,23 100,00 107,36 103,76

Medicinsk statistik II

Hur skriver man statistikavsnittet i en ansökan?

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10

Föreläsning G60 Statistiska metoder

Vetenskaplig metod och statistik

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

OBS! Vi har nya rutiner.

Tentamen Metod C vid Uppsala universitet, , kl

Sänkningen av parasitnivåerna i blodet

Föreläsning G60 Statistiska metoder

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning G60 Statistiska metoder

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning G60 Statistiska metoder

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

F3 Introduktion Stickprov

Föreläsningsanteckningar till kapitel 9, del 2

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

F19, (Multipel linjär regression forts) och F20, Chi-två test.

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

732G60 - Statistiska Metoder. Trafikolyckor Statistik

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Uppgift 1. Produktmomentkorrelationskoefficienten

MSG830 Statistisk analys och experimentplanering

InStat Exempel 4 Korrelation och Regression

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Multipel Regressionsmodellen

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

OBS! Vi har nya rutiner.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

F22, Icke-parametriska metoder.

Fråga nr a b c d 2 D

Hur man tolkar statistiska resultat

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

, s a. , s b. personer från Alingsås och n b

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Föreläsning 7: Punktskattningar

Vetenskaplig metod och statistik

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, HT08. Torsdagen 15 januari 2009

Stockholms Universitet Statistiska institutionen Termeh Shafie

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Föreläsning 7: Punktskattningar

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

TENTAMEN I MATEMATISK STATISTIK

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

7.5 Experiment with a single factor having more than two levels

Kapitel 19: NATURLIGA EXPERIMENT OCH INSTRUMENT

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Statistik B Regressions- och tidsserieanalys Föreläsning 1

ÖVNINGSUPPGIFTER KAPITEL 9

Regressions- och Tidsserieanalys - F1

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Översikt. Experimentell metodik. Mer exakt. Människan är en svart låda. Exempel. Vill visa orsakssamband. Sidan 1

Transkript:

0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan variablerna är signifikant. a. För vilket sampel (A, B eller C) är t-värdet som störst? C För vilket sampel är t-värdet som lägst? A b. Enbart för ett av samplen är sambandet signifikant. Vilket? C 5. Spridningsdiagrammet nedan beskriver sambandet mellan sysselsättningsgrad och självmordsfrekvens bland män i 169 länder. Du vill testa om sambandet är signifikant och får ett t-värde på -3,10. Är detta ett signifikant samband? Motivera kortfattat. Ja, t = -3,10 vilket är mindre än -2. 40 50 60 70 80 90 sysselsättning 6. Du vill testa om ungdomar med ADHD har ett sämre genomsnittlig arbetsminne än ungdomar överlag. (Arbetsminnet är en persons korttidsminne och kan mätas som antalet siffror en person kan hålla i minnet samtidigt.) Bland ungdomar överlag ligger det genomsnittliga arbetsminnet på 7 siffror: µ = 7. Bland 50 slumpmässigt utvalda ungdomar med ADHD så är det genomsnittliga arbetsminnet 6,0 siffror.

a. Beskriv noll- och mothypotesen. Nollhypotesen: Ingen skillnad i genomsnittligt arbetsminne mellan personer med ADHD och övriga. Mothypotesen: Skillnad b. T-värdet blir -2,2. Betyder detta att ungdomar med ADHD har signifikant sämre arbetsminne än ungdomar överlag? Motivera kortfattat. Ja, t = -2,2 vilket är mindre än -2. 7. I kapitel 5 (Multipel regression) så såg vi på följande regression hämtad ur artikeln Body mass index as indicator of standard of living in developing countries. Utfallet är BMI. a. Enbart en av de oberoende variablerna har inte en signifikant effekt på BMI. Vilken? Electricity, dummy b. Water, dummy är en variabel som antar värdet 1 om personen har tillgång till rent vatten och annars värdet 0. De som har tillgång till rent vatten har i snitt 0,443 enheter högre bmi än övriga (kontrollerat för de andra x- variablerna); p-värdet är 0,0074. Vilket eller vilka av följande påståenden är korrekta? Den här effekten hör till de 0,74 procent mest extrema som man kan få bara av slumpen. sant Ungefär 0,7 procent av personerna har tillgång till rent vatten. Den här effekten är signifikant på 1-procentsnivån. sant 8. Videolänk. Tabellen nedan är hämtad ur artikeln Rooted in Poverty? Terrorism, Poor Economic Development, and Social Cleavages. Artikelns frågeställning: Vilka faktorer predikterar terrorism? Man använder data för 95 länder och mäter olika egenskaper hos länderna (ekonomiska, demografiska och

politiska) och ser hur dessa relaterar till graden av terrorism. Graden av terrorism mäts som antalet terrorattacker under åren 1986-2002, samt antalet döda i terrorattacker under samma period. I tabellen nedan visas resultatet från två multipla regressionsanalyser (en för respektive utfall). Standardfel ges inom parentes; signifikanta effekter är utmärkta med en stjärna*. a) Visa att arbetslöshet (unemployment) inte har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Beskriv också hur stort t- värdet borde vara för att effekten ska klassas som signifikant (ett ungefärligt svar räcker). t = 1,13. För signifikans borde t-värdet bli större än 2, alternativt mindre än -2. b) Visa att Etnisk-religiös mångfald (Ethno-religious diversity) har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Ungefär hur stort är p-värdet? t = 3,62; p-värdet < 0,01 c) Se fråga b: Är den här effekten signifikant på 10-5- eller 1-procentsnivån? 1- procentsnivån Kommentar: För att besvara fråga b) kan vi kolla i tabellen: Den här tabellen finns inte med i formelsamlingen för deltent 5. Betyder det att man ska kunna denna utantill? Nej, i deltenten räcker det att veta att ett t-värde som (absolut sett) är större än 2 ger ett p-värde på 0,05 eller mindre. På tenten skulle jag också ge rätt för det svaret på fråga b, dvs. att p-värdet är mindre än 0,05.

För övrigt är det jättebra att veta att ett t-värde som absolut sett är 2 eller större betyder signifikans. I statistiska rapporter tar man ofta för givet att läsaren vet detta, dvs. många rapporter ger bara effekten + standardfelet och räknar sen med att läsaren själv ska kunna se om sambandet är signifikant eller ej. 9. Nedan kan du läsa abstraktet till en artikeln The GCP Event Experiment: Design, Analytical Methods, Results. Artikeln beskriver ett högst kontroversiellt experiment. GCP står för The Global Consciousness Project. Projektet går ut på att mäta om mänsklighetens globala medvetande kan påverka utfallet i slumpgeneratorer (dvs. datorer som kastar ur sig siffror slumpmässigt). Hypotesen är att stora världsnyheter ska synas i slumpsiffrorna, dvs. påverka det slumpmässiga mönstret i data. a) Författarna skriver att: The cumulative significance across all events favors the hypothesis by more than 4.5 standard deviation. Notering: Läs som 4,5 standardfel. Är detta, statistiskt sett, ett starkt stöd för deras hypotes? Motivera kortfattat. Ja, detta betyder att t-värdet är 4,5 vilket är klart större än 2. (Det är också möjligt att t-värdet är -4,5 men slutsatsen blir densamma.) b) Beskriv nollhypotesen i den här studien. Inget samband, dvs. världsnyheter har inget samband med mönstret i slumpgenererade siffror 10. Du vill mäta hur stor andel av studerande vid Åbo Akademi som jobbar vid sidan av studierna. Du samplar slumpmässigt 300 studerande varav 25 procent jobbar vid sidan av studierna, med ett standardfel på 2,5 procentenheter. Vilket eller vilka av följande påståenden är korrekta? a. Standardfelet mäter hur andelen som jobbar vid sidan av studierna skulle variera från sampel till sampel om vi gjorde upprepade dragningar, men alltid 300 studerande. sant b. Ju större sampel desto lägre standardfel (allt annat lika). sant

c. Standardfelet är ett slags mått på osäkerheten i uppskattningen av den sanna andelen studerande som jobbar vid sidan av studierna. sant