FORSKNINGSMETODIK, KVANTITATIV DEL

Relevanta dokument
Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

ÖVNINGSUPPGIFTER KAPITEL 9

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

för att komma fram till resultat och slutsatser

Empiriska problem vid användningen av tvärsnittsdata över arbetslösa 1

Svensk- och tvåspråkiga kommuner. Bakgrundsinformation

Svensk- och tvåspråkiga kommuner. Bakgrundsinformation

Svensk- och tvåspråkiga kommuner. Bakgrundsinformation

Studietyper, inferens och konfidensintervall

Hur skriver man statistikavsnittet i en ansökan?

Modersmål och arbetsmarknadsutfall: finsk- och svenskspråkiga finländare i Sverige

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Kvantitativa metoder och datainsamling

MVE051/MSG Föreläsning 7

Uppgift 1. Produktmomentkorrelationskoefficienten

ÖVNINGSUPPGIFTER KAPITEL 9

Föreläsning 7. Statistikens grunder.

Återvandring och upprepad emigration i ljuset av vår befolkningsstatistik

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Bortfall i longitudinella undersökningar

Lektion 1: Fördelningar och deskriptiv analys

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Svenskspråkiga kan vara både rikare och fattigare än finskspråkiga

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

ÖVNINGSUPPGIFTER KAPITEL 10

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Vad beror benägenheten att återvinna på? Annett Persson

Några begrepp. Vad är statistik? Data. Grundläggande begrepp Olika slag av undersökningar

TMS136. Föreläsning 7

Samplingfördelningar 1

Laboration 3: Urval och skattningar

FACIT (korrekta svar i röd fetstil)

Vuxenutbildningen i Svenskfinland

Konsumenternas tro på ekonomin starkare än på fyra år

Konsumenternas förväntningar på den egna ekonomin stiger

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Konsumenternas förtroende oförändrat i oktober

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

ÖVNINGSUPPGIFTER KAPITEL 10

Föreläsning 11: Mer om jämförelser och inferens

ÖVNINGSUPPGIFTER KAPITEL 10

SOPA62 - Kunskapsproduktion i socialt arbete

Metodologier Forskningsdesign

Statistik vad är det?

Intro studiedesign med kvantitativ metodik

Planeringen av en statistisk undersökning

Konsumenternas förtroende förstärktes något i september

Konsumenternas förväntningar på ekonomin mestadels svaga i augusti

Föreläsning G60 Statistiska metoder

Parade och oparade test

Uppåtgående trend för den ekonomiska stämningen nedåt i juni

F3 Introduktion Stickprov

Institutionen för beteendevetenskap Tel: / Tentamen i kvantitativ metod Psykologi 2 HPSB05

Lektionsanteckningar 11-12: Normalfördelningen

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Statistik Lars Valter

Bilaga 6 till rapport 1 (5)

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

ÖVNINGSUPPGIFTER KAPITEL 9

GERDA-enkäten METODBESKRIVNING. Kjell Herberts, Åbo Akademi, Vasa 1. URVAL

Det finlandssvenska migrationshjulet :

Vem ska undersökas? Vem ska undersökas? Planeringen av en statistisk undersökning. Tre huvudfrågor: Vad ska undersökas? Hur ska undersökningen göras?

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Datorlaboration 2 Konfidensintervall & hypotesprövning

Dagersättning sjukförmåner

Konsumenternas tro på Finlands ekonomi ökade något i juli

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Läroanstalter i hela landet och i Egentliga Finland

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Den svaga uppgången i ekonomiförtroendet fortsatte i januari

Hur går en statistisk undersökning till?

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

ÖVNINGSUPPGIFTER KAPITEL 2

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Handisam. Beräkningsunderlag för undersökningspanel

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Social- och hälsovårdsministeriet Helsingfors,

MVE051/MSG Föreläsning 14

2 Dataanalys och beskrivande statistik

Konsumenternas förtroende förstärktes något i mars

Förtroendet för ekonomin återhämtade sig något i november

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

F22, Icke-parametriska metoder.

Why you should love statistics - Alan Smith. Hur väl känner du till ditt område? Vet eller tror du?

Laboration 3: Urval och skattningar

Konsumenternas förtroende förstärktes något tron på Finlands ekonomi försvagas

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

2. Test av hypotes rörande medianen i en population.

SPRÅKGRUPPS- SKILLNADER I UTKOMST- STÖDSTAGANDE

Analyser och prognoser om utbildning och arbetsmarknad

Transkript:

FORSKNINGSMETODIK, KVANTITATIV DEL Jan Saarela http://www.vasa.abo.fi/users/jsaarela/

ANSATS Hantering av numerisk information Hur förstå, tolka och bearbeta sifferserier i matrisform CENTRALA BEGREPP Observation (undersökningsenhet): de objekt som studeras - Individer, hushåll, tidsperioder, kommuner, husdjur, etc Variabler: egenskaper hos observationerna - Ålder, inkomst, konjunkturläge, befolkningsmängd, pälsfärg, etc HUVUDSAKLIGA INDELNINGAR AV DATA (1) Enligt omfattning: Totaldata mot stickprov (2) Enligt insamlingssätt: Registerdata mot enkäter (3) Enligt struktur: Tvärsnittsdata mot longitudinella data (1), (2) och (3) kan överlappa varandra mot innebär uteslutning Totaldata (total population) inkluderar hela populationen (alla undersökningenheter i en given population) - Behövs för fullständig beskrivning av förhållanden (totalantal) - Exempelvis hela Vasas befolkning vid en given tidpunkt (från Befolkningsregistret) Stickprov (sampel, sample) måste vara representativt för hela populationen 2

- Drar slutsatser om förhållanden i underliggande populationen (statistisk inferens) - Data som en estimator för verkliga fördelningen (detaljer senare) - Exempelvis Finnish Labour Force Survey, Vallokalförfrågningar Registerdata (register data) - Officiell, redan existerande, information (man utgår från befintliga data) - I allmänhet inget bortfall - Vid diverse statistiskförande inträttningar, t.ex. Statistikcentralen Enkäter (surveys) - Frågeformulär riktade per post, telefon, e-post och dylikt - Riktade (önskade) frågor, till skillnad från registerdata - Målsättningar bestämda på förhand, till skillnad från registerdata - Ofta icke-representativt p.g.a. bortfall => bortfallsanalys nödvändig - T.ex. Den finlandssvenska barometern, Hälsa 2000, egna frågeformulär Enkla tvärsnitt (cross section) (Figur 1) - Berör situationen för de undersökningsenheter just då observeras - En person observeras endast en gång - Ofta känner man bara situationen vid mättilfället - Ingen dynamik: Vet inte hur situationen förändras före och efter tvärsnittstillfället - Innebär ett length bias då man analyser durationer: missar livsförloppet för de personer som inte finns med vid den specifika tvärsnittstidpunkten (Figur 2) - Exempelvis alla arbetslösa i Vasa 31 december 2000 (från Vasa Arbetskraftsbyrå) 3

- Ifall enkla tvärsnitt (från olika mättidpunkter) går att koppla ihop så att samma undersökningsenhet kan identifieras vid mer än ett tillfälle => Longitudinella data (panel data) - Samma person observeras mer än en gång (i motsats till ett enkelt tvärsnitt) - Analys över tiden, vid flera givna tidpunkter eller kontinuerligt - Möjliggör mer långtgående analyser: kan beakta tidsvariation, dvs hur situation/egenskaper för undersökningsenheten förändras - Liknande möjligheter med s.k. flernivådata (multilevel data): upprepade händelser inom samma observationsenhet (födslar, barn, bestraffningar, etc) - Exempel på data av longitudinell karaktär: Työssäkäynnin pitkittäistiedosto (årlig information på individnivå, 1987- ) TYPER AV VARIABLER Tidskonstanta - Genomgående samma värde för en individ (under hela observationsperioden) - Alltid i enkla tvärsnitt (eftersom bara en tidpunkt) - Kan också förekomma i longitudinella data - Naturligt såsom kön, eller p.g.a. konstruktion såsom totalinkomst för hel tidsperiod Tidsvarierande - Ändrar värde över observationsperiodens gång - Exempelvis månadsinkomst under en ettårsperiod - I longitudinella data - Ålder är automatiskt tidsvarierande i longitudinella data - Analyserna blir mer djupgåend, både vad gäller reliabilitet (tillförlitlighet) och validitet (mäter vad som skall mätas) 4

NÅGRA DETALJER OM ESTIMATORER Tre typer av inferens (a) (b) (c) Punktestimering: Vilket är värdet på estimatorn? Intervallestimering: Hur brett är intervallet inom vilket estimatorn finns? Hypotesprövning: Har estimatorn en viss effekt? Önskvärda egenskaper hos estimatorer (a) Väntevärdesriktighet (unbiased): Prickar rätt (mitt i) (b) (c) Effektivitet (efficiency): Variansen (spridningen) är så liten som möjligt Konsistens (consistency): Blir bättre och bättre (går mot det riktiga värdet) ju större stickprovet är DATA SOM VI SKA ANVÄNDA Totaldata: Hela Finlands befolrkning Registerdata: Från Statistikcentralen (baserat på Befolkningsregistret) Tvärsnitt: Situationen i slutet av 1990, 1995, respektive 1998 (ej länkade) Variabler: Tidskonstanta Undersökningsnheteter: Individer Vi begränsar oss till - Tvåspråkiga kommuner i Österbotten + Karleby (minst 8% eller 3000 invånare som talar minoritetsspråket) - 20-64-åringar - Finska eller svenska som modersmål Alla variabler kategoriska (klassindelade) Vikt : antalet personer med samma egenskaper (minskar matrisens storlek) 5

Datafilen, och övrigt kursmaterial, fås via ÅA-dator på följande sätt: (1) Högerklicka på musen då du befinner dig på desktopen (2) Välj New - Shortcut (3) Under "Type the location of the item:" skriver du \\homeserver.vasa.abo.fi\home\jsaarela\delad_formetkv 4) Nu har du en mapp som är länkad till kursmaterialet 5) Dubbelklickar du på filen formetkv_data.sav så startar SPSS och den datafil vi ska använda öppnas 6) Filen är av typen "read only". Du bör alltså spara den på eget område för att kunna göra ändringar i den. Arbetsmarknadens tre bestånd (arbetsmarknadsstatus) (Figur 3) TIDIGARE ANVÄNDNING AV SAMMA DATA (1) Saarela, J. & Finnäs, F. (2003). Unemployment and Native Language: The Finnish Case. Journal of Socio-Economics, 32(1), 59-80. (2) Saarela, J. & Finnäs, F. (2006). Can the Low Unemployment Rate of Swedish speakers in Finland be Attributed to Structural Factors? Journal of Socio-Economics, 35(3), 498-513. Jämföra skillnader i arbetslöshet mellan svenskpråkiga och finskspråkiga - Begränsat till tvåspråkiga kommuner i Finland ( Svenskfinland ) Lägre arbetslöshet bland svenskspråkiga - P.g.a. skillnader i humankapitalfaktorer (ålder, utbildning, kön)? - P.g.a. boendeort (bättre förutsättningar att jobba på vissa orter)? - P.g.a. skillnader i graden av deltagande i arbetskraften? - P.g.a. skillnader mellan de tre olika åren (tvärsnittstidpunkterna)? 6

=> NEJ, inte i nämnvärd omfattning Skillnaderna beror av andra, icke-observerade faktorer; - Sannolikt språkkunskaper och sociala nätverk Exempel på deskriptiva tabeller som har använts - Dylika tabeller vi ska ta fram och tolka i denna kurs 7