ÖVNINGSUPPGIFTER KAPITEL 8

Relevanta dokument
HYPOTESPRÖVNING sysselsättning

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

ÖVNINGSUPPGIFTER KAPITEL 6

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

ÖVNINGSUPPGIFTER KAPITEL 6

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 4

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 10

ÖVNINGSUPPGIFTER KAPITEL 12

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

ÖVNINGSUPPGIFTER KAPITEL 9

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

ÖVNINGSUPPGIFTER KAPITEL 3

ÖVNINGSUPPGIFTER KAPITEL 7

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Hur skriver man statistikavsnittet i en ansökan?

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

import totalt, mkr index 85,23 100,00 107,36 103,76

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 13

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Medicinsk statistik II

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistik och epidemiologi T5

Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA

Föreläsning G60 Statistiska metoder

Uppgift 1. Produktmomentkorrelationskoefficienten

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Föreläsning G60 Statistiska metoder

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

Föreläsning 5. Kapitel 6, sid Inferens om en population

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Linjär regressionsanalys. Wieland Wermke

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen Metod C vid Uppsala universitet, , kl

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Föreläsning 7: Punktskattningar

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Sänkningen av parasitnivåerna i blodet

ÖVNINGSUPPGIFTER KAPITEL 2

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Föreläsning 7: Punktskattningar

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning G60 Statistiska metoder

TAMS65 - Föreläsning 6 Hypotesprövning

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

ÖVNINGSUPPGIFTER KAPITEL 2

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Statistik och epidemiologi T5

Repetitionsföreläsning

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

F19, (Multipel linjär regression forts) och F20, Chi-två test.

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Föreläsning G60 Statistiska metoder

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Stockholms Universitet Statistiska institutionen Termeh Shafie

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Att välja statistisk metod

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Stockholms Universitet Statistiska institutionen Termeh Shafie

Föreläsning 7: Punktskattningar

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Inlämningsuppgift-VT lösningar

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

EXAMINATION KVANTITATIV METOD

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

F22, Icke-parametriska metoder.

Uppgift a b c d e Vet inte Poäng

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

MSG830 Statistisk analys och experimentplanering

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

F3 Introduktion Stickprov

Institutionen för beteendevetenskap Tel: / Omtentamen i kvantitativ metod Psykologi 2 HPSB10

Föreläsning G60 Statistiska metoder

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Översikt. Experimentell metodik. Mer exakt. Människan är en svart låda. Exempel. Vill visa orsakssamband. Sidan 1

Fråga nr a b c d 2 D

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

732G60 - Statistiska Metoder. Trafikolyckor Statistik

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Transkript:

ÖVNINGSUPPGIFTER KAPITEL 8 SAMPEL KONTRA POPULATION 1. Nedan beskrivs fyra frågeställningar. Ange om populationen är ändlig eller oändlig i respektive fall. Om ändlig, beskriv också vem eller vad som ingår i populationen. a. Du vill ta reda på om de kvinnliga anställda på ett visst företag tagit ut mer övertid än männen under det senaste året. För att ta reda på detta samlar du in data för ett urval anställda och deras övertidstimmar. b. En företagare ska skicka iväg en beställning bestående av 1000 rosor till en kund. Företagaren vill ta reda på hur god kvalitet dessa rosor håller och samplar slumpmässigt ett antal för testning. c. Du vill ta reda på om den vinnande lottoraden de facto dras slumpmässigt så att alla sifferkombinationer har samma chans att bli dragna. Du samlar in historiska data över vinnande lottorader under de senaste 20 åren. d. Du vill ta reda på om energidrycker höjer pulsen. Du låter hundra försökspersoner dricka en energidryck och uppmäter något förhöjda pulsvärden. 2. Forskare studerar skallstorleken i ett sampel bestående av 28 vuxna neandertalkranier. Syftet är att lära sig om väntevärdet för skallstorleken i populationen av alla neandertalare. Den genomsnittliga skallstorleken i samplet uppmättes till 1500 ml. a. Vad är parametern av intresse i denna studie? b. Vad är estimatet? 3. Politikerna vill ta reda på hur stor andel av finska kvinnor som ställer sig positiva till surrogatmödraskap. De samplar därför slumpmässigt 500 kvinnor och finner att 185 av dessa är positiva. a. Vad är parametern av intresse i denna studie? b. Vad är estimatet? HYPOTESPRÖVNING

0 självmord 20 40 60 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan variablerna är signifikant. a. För vilket sampel (A, B eller C) är t-värdet som störst? För vilket sampel är t- värdet som lägst? b. Enbart för ett av samplen är sambandet signifikant. Vilket? 5. Spridningsdiagrammet nedan beskriver sambandet mellan sysselsättningsgrad och självmordsfrekvens bland män i 169 länder. Du vill testa om sambandet är signifikant och får ett t-värde på -3,10. Är detta ett signifikant samband? Motivera kortfattat. 40 50 60 70 80 90 sysselsättning 6. Du vill testa om ungdomar med ADHD har ett sämre genomsnittlig arbetsminne än ungdomar överlag. (Arbetsminnet är en persons korttidsminne och kan mätas som antalet siffror en person kan hålla i minnet samtidigt.) Bland ungdomar överlag ligger det genomsnittliga arbetsminnet på 7 siffror: µ = 7. Bland 50 slumpmässigt utvalda ungdomar med ADHD så är det genomsnittliga arbetsminnet 6,0 siffror. a. Beskriv noll- och mothypotesen. b. T-värdet blir -2,2. Betyder detta att ungdomar med ADHD har signifikant sämre arbetsminne än ungdomar överlag? Motivera kortfattat.

7. I kapitel 5 (Multipel regression) så såg vi på följande regression hämtad ur artikeln Body mass index as indicator of standard of living in developing countries. Utfallet är BMI. a. Enbart en av de oberoende variablerna har inte en signifikant effekt på BMI. Vilken? b. Water, dummy är en variabel som antar värdet 1 om personen har tillgång till rent vatten och annars värdet 0. De som har tillgång till rent vatten har i snitt 0,443 enheter högre bmi än övriga (kontrollerat för de andra x- variablerna); p-värdet är 0,0074. Vilket eller vilka av följande påståenden är korrekta? Det här sambandet hör till de 0,74 procent mest extrema som man kan få bara av slumpen. Ungefär 0,7 procent av personerna har tillgång till rent vatten. Den här effekten är signifikant på 1-procentsnivån. 8. Tabellen nedan är hämtad ur artikeln Rooted in Poverty? Terrorism, Poor Economic Development, and Social Cleavages. Artikelns frågeställning: Vilka faktorer predikterar terrorism? Man använder data för 95 länder och mäter olika egenskaper hos länderna (ekonomiska, demografiska och politiska) och ser hur dessa relaterar till graden av terrorism. Graden av terrorism mäts som antalet terrorattacker under åren 1986-2002, samt antalet döda i terrorattacker under samma period. I tabellen nedan visas resultatet från två multipla regressionsanalyser (en för respektive utfall). Standardfel ges inom parentes; signifikanta effekter är utmärkta med en stjärna*.

a) Visa att arbetslöshet (unemployment) inte har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Beskriv också hur stort t- värdet borde vara för att effekten ska klassas som signifikant (ett ungefärligt svar räcker). b) Visa att Etnisk-religiös mångfald (Ethno-religious diversity) har en signifikant effekt på antalet döda (casualties) genom att räkna ut t-värdet. Ungefär hur stort är p-värdet? c) Se fråga b: Är den här effekten signifikant på 10-5- eller 1-procentsnivån? 9. Nedan kan du läsa abstraktet till en artikeln The GCP Event Experiment: Design, Analytical Methods, Results. Artikeln beskriver ett högst kontroversiellt experiment: GCP står för The Global Consciousness Project. Projektet går ut på att mäta om mänsklighetens globala medvetande kan påverka utfallet i slumpgeneratorer (dvs. datorer som kastar ur sig siffror slumpmässigt). Hypotesen är att stora världsnyheter ska synas i slumpsiffrorna, dvs. påverka det slumpmässiga mönstret i data.

a) Författarna skriver att: The cumulative significance across all events favors the hypothesis by more than 4.5 standard deviation. Notering: Läs som 4,5 standardfel. Är detta, statistiskt sett, ett starkt stöd för deras hypotes? Motivera kortfattat. b) Beskriv nollhypotesen i den här studien. 10. Du vill mäta hur stor andel av finländska studeranden som jobbar på sidan om studierna. Vilket eller vilka av följande påståenden är sanna? a. Standardfelet för stickprovsandelen mäter hur denna andel varierar från ett sampel till ett annat vid upprepade dragningar (givet sampelstorleken). b. Ju större sampel desto större standardfel (allt annat lika). c. Standardfelet för stickprovsandelen kan ses som ett mått på osäkerheten i uppskattningen av den sanna andelen (dvs. populationens andel). KONFIDENSINTERVALL 11. Nedan visas abstraktet till artikeln Associations with common health symptoms with bullying in primary school children. a) Se meningens om är understruken med blått. Vilket eller vilka av följande påståenden är korrekta? Av barnen i samplet är det 20,9 till 24,0 procent som säger sig ha blivit mobbade. Vissa barn är osäkra, så procenten varierar beroende på hur man klassar de osäkra fallen. Den sanna andelen mobbade barn (eller populationsandelen) ligger någonstans mellan 20,9 och 24,0 procent med 95-procentig säkerhet.

Om de hade gjort upp ett 99-procentigt konfidensintervall så hade detta varit bredare än det 95-procentiga. b) Oddset för att sova dåligt är 3,6 gånger högre bland mobbade barn än bland övriga. Understruket i rött ges också ett 95-procentigt konfidensintervall. Ge en tolkning av detta intervall. 12. Tabellen nedan är klippt ur artikeln Stature and Status: Health, Ability and Labor Market Outcomes. Utfallet är loggad lön (den naturliga logaritmen) och x- variabeln av intresse är längd (height, mätt i tum). Standardfel ges inom parentes. Se specifikationen som inte kontrollerar för testresultat i ung ålder eller övriga kontrollvariabler (extended controls). Gör upp ett ungefärligt 95- procentigt konfidensintervall för den här effekten.

ANTAGANDEN 13. I en studie samplar man slumpmässigt 30 skolor och samlar in data för varje elev i de samplade skolorna. Man mäter därefter sambandet mellan antalet lärare per elev och elevens betyg. I studien har man kört en standard regression (elevens betyg som utfall; antalet lärare per elev som oberoende variabel) och använt de vanliga p-värdena och konfidensintervallen för att analysera resultatet. Ge kritik på denna studie.