Föreläsning 1: Introduktion. Vad är statistik?

Föreläsning 1: Introduktion Vad är statistik? 1

Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att skaffa sig sådan kunskap är genom observationer Inom statistikteorin studeras hur observationer samlas in hur observationer analyseras hur slutsatser kan dras från observationer 2

Deskriptiva och analytiska undersökningar Vid en deskriptiv eller beskrivande undersökning försöker man att, med hjälp av ett insamlat datamaterial, beskriva ett förhållande eller ett faktiskt händelseförlopp. 3

Vid en analytisk eller förklarande undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör. 4

Arbetsgång vid statistiska undersökningar Problemformulering, målsättning Definition av målpopulation Utformning av mätinstrument Framställning av urvalsram Urval 5

Mätning Bearbetning av data (Tabeller, diagram och beräkning av deskriptiva mått) Analys Presentation av resultat 6

Planering av en undersökning Vid planering bestämmer man sig bl.a. för: Vilka data som skall samlas in Hur dessa data skall samlas in, dvs. val av datainsamlingsmetod Totalundersökning eller urvalsundersökning Typ av urval vid urvalsundersökning Val av mätmetod och mätinstrument. Hur eventuellt bortfall skall hanteras Hur data skall analyseras Hur resultatet skall redovisas 7

Syfte/Problem V E R K L I G H E T Val av mätinstrument Kunskap (Ämnes-& Statistikteori) Identifiering och definition av variabler Data Teorier om mätinstrumentet Statistiska tekniker Modell Slutsater Ny kunskap Data 8

Experimentella och ickeexperimentella undersökningar Experimentella undersökningar: Behandling. Försöksenheterna utsätts för vissa behandlingar i avsikt att studera effekten av dessa behandlingar Upprepbarhet. Experimentet kan upprepas ett önskat antal gånger Randomisering. Försöksenheterna fördelas slumpmässigt på olika behandlingar 9

Kontroll. Försöksbetingelserna kan i allmänhet kontrolleras och konstanthållas, eller åtminstone löpande registreras. Dubbelblinda försök. Då försöksenheterna är människor vet i regel varken försökspersonen eller den som ger behandlingen vilken behandling försökspersonen får. 10

Ickeexperimentella undersökningar, observationsundersökningar. Undersökningsenheter eller händelseförlopp påverkas ej på något sätt. Behandlingarna i den experimentella studien ersätts av passivt observerande. 11

Experimentella studier I regel att föredra om man vill undersöka effekten av någon förklaringsvariabel på någon responsvariabel, eftersom det med en ickeexperimentell ansats kan vara svårt att särskilja effekten av förklaringsvariabeln från effekter av andra faktorer 12

Randomisering Randomisering innebär att slumpen avgör vilken behandling en undersökningsenhet tilldelas Genom randomisering undviks systematiska fel Randomisering medför att effekten av en eventuell behandling med hög grad av säkerhet och precision kan fastställas med hjälp av statistikteori 13

Generaliserbarhet Ett problem vid experimentella studier är att undersökningsenheterna inte alltid är slumpmässigt utvalda ur någon väldefinierad population och att därför de resultat som erhålls, i strikt mening, endast gäller för de som ingår i försöket I sådana fall måste generaliseringar utöver undersökningsenheterna bygga på icke-statistiska argument 14

Brist på realism Försöken utförs ibland i en miljö som ej är verklig. Detta innebär också ett generaliseringsproblem. Det är inte säkert att en individ reagerar likadant i ett laboratorium som i verkligheten. 15

Urvalsundersökningar Varför urvalsundersökning i stället för totalundersökning? Billigare Snabbare Bättre mätning Praktiskt omöjligt med totalundersökning då populationen är mycket stor eller oändlig Förstörande prov 16

Olika typer av urval Lättåtkomliga element Frivilliga svar Frivilliga försökspersoner Sannolikhetsurval 17

Sannolikhetsurval Urvalsenheterna väljs med hjälp av någon slumpmekanism För varje enhet är sannolikheten för att inkluderas i urvalet känd 18

Med sannolikhetsurval kan man... ge objektiva mått på undersökningsresultatens precision utforma en teori för effektiv undersökningsplanering på förhand göra objektiva jämförelser mellan olika urvalsplaner på förhand uppskatta erforderliga urvalsstorlekar för att uppnå önskad precision 19

Olika typer av sannolikhetsurval Obundet slumpmässigt urval (OSU) Stratifierat urval Klusterurval 20

Obundet slumpmässigt urval Vid varje dragning av en enhet har de i populationen kvarvarande enheterna samma sannolikhet att bli valda Vid OSU av n enheter har alla möjliga kombinationer av n enheter samma chans att bli valda 21

Stratifierat urval Populationen delas in i strata och ett OSU dras ur varje stratum Skäl: Om resultatet skall redovisas för varje stratum kan urvalsstorlekarna för varje stratum avpassas så att vissa precisionskrav uppfylles utan att man erhåller överflödiga observationer från vissa strata 22

Skattningar av populationsparametrar (t.ex. populationsmedelvärdet) kan göras med bättre precision än vid ett OSU, om bara stratifieringsvariabeln är bra (homogent inom strata, heterogent mellan strata) 23

Gruppurval (klusterurval) Populationen delas in i grupper (kluster) av enheter. Ett antal sådan kluster väljs slumpmässigt. Samtliga enheter inom ett kluster undersöks. Skäl: Ramproblem Geografisk spridning Kostnader 24

Mätning En tilldelning av tal till undersökningsenheterna på ett sådant sätt att vissa relationer mellan enheterna, med avseende på någon egenskap, avspeglas i relationer mellan talen 25

(Skal-, Data-) Mätnivåer Nominal Endast klassificering Ordinal Klassificering och rangordning Intervall Klassificering, rangordning och ekvidistans Kvot Klassificering, rangordning, ekvidistans och absolut nollpunkt 26

Observera att mätnivån bestäms av vilken typ av information mätningen ger oss. Mätnivån har bl.a. betydelse för vilken typ av beräkningar som är meningsfulla Notera att i boken Statistics for Management and Economics av Keller är de sistnämda nivåerna sammanslagna till en. Han kallar den intervallskala. 27

Några felkällor Täckningsfel Övertäckning Urvalsramen innehåller individer som ej finns med i målpopulationen Undertäckning Urvalsramen saknar individer som finns med i målpopulationen Kan ge upphov till systematiska fel (bias) 28

Bortfallsfel Individbortfall innebär att man från en eller flera individer ej får något svar på t.ex. en postenkät Partiellt bortfall innebär svarsvägran på vissa frågor Kan ge stora systematiska fel 29

Mätfel Mätfel som beror på respondenten Mätfel som beror på intervjuaren Mätfel som beror på mätmetoden Mätfel som beror på frågeformuläret 30

Bearbetningsfel Kodningsfel Inmatningsfel Datorbearbetningsfel 31

Urvalsfel Uppstår när man studerar ett urval i stället för hela populationen Slumpmässigt och möjligt att uppskatta om urvalet görs korrekt 32