Hur går en statistisk undersökning till? Gången i en statistisk undersökning framgår av bilden och är i stort sett densamma i en verklig undersökning, t ex folk- och bostadsräkningen, som i en miniundersökning. Vi går här igenom de viktigaste momenten och statistiska begreppen. Många statistiska begrepp Sakproblem Statistiskt problem Population Variabler Tabellplan Ram Urval Mätmetod Mätinstrument Datainsamling Databearbetning Granskning Rättning Kodning Tabellframställning Dataregistrering (Stansning) Analys Publicering
Sakproblem Sakproblem är sådana problem som en statistisk undersökning kan bidra till att lösa eller belysa. Sakproblemet är ofta av komplicerad natur. Det kan avse politiska, sociala eller ekonomiska frågor. För att belysa sakproblemet och få beslutsunderlag behövs information från flera olika håll. En statistisk undersökning kan vara ett sätt att skaffa sådan information. Värdet av undersökningen står alltså i proportion till dess användbarhet för att belysa sakproblemet. Statistiskt problem Ett statistiskt problem är ett problem som kan besvaras med utnyttjande av statistisk metodik. Med utgångspunkt i sakproblemet specificerar man ett statistiskt problem. Innan man avgör om en statistisk undersökning ska genomföras måste man noga precisera syftet med den och kartlägga själva undersökningssituationen. Villkor som kvalitet och sluttidpunkt måste vägas mot de ekonomiska, personella och tekniska resurser som står till buds. Det kan då visa sig att villkoren är omöjliga att uppfylla med till gängliga resurser. Då får man välja mellan: att inte göra undersökningen, att utöka resurserna eller att begränsa villkoren. Objekt Objekt är de personer, föremål, händelser eller liknande, vilkas egenskaper eller attityder man vill studera. Population En population är summan av de personer, föremål eller andra objekt som man önskar information om. Ram Ramen är en lista eller förteckning över undersöknings populationens objekt. Ramar kan förekomma t ex som data på magnetband eller disketter, som kartotekskort, förteckningar eller i specialfall som kartor med inprickade gårdar eller dylikt. Urval Ett urval är en delmängd av den aktuella populationen. Urvalet tas ut med hjälp av statistiska metoder från ramen och man undersöker bara de utvalda
objekten. Från urvalet kan man sedan dra slutsatser om hela den population som man drog urvalet ur. Urvalsdragning med statistiska metoder innebär att slumpen avgör vilka objekt som kommer med i urvalet. Men urvalet är statistiskt representativt bara för den population det drogs ur. Variabel En variabel är en storhet som kan anta olika värden hos olika objekt som observeras. En variabel kan vara: - kontinuerlig, d.v.s. den kan anta vilket värde som helst inom ett intervall (t ex ålder, längd) - diskret, d.v.s. den kan anta endast vissa åtskilda värden (T ex barnantal, antal bostadsrum i lägenheten). En variabel kallas: - kvantitativ, då den antar numeriska värden (t ex ålder, inkomst) - kvalitativ, då den antar icke-numeriska värden (t ex kön, civilstånd). Tabellplan En tabellplan är en samling tomma tabeller som undersökningens resultat så småningom ska presenteras i. Man bör göra en tabellplan redan när man diskuterar undersökningens syfte och kartlägger själva undersökningssituationen. Mätmetod Mätmetoden är det sätt på vilket man skaffar information om undersökningsvariablerna. Man kan utnyttja en eller flera av följande metoder: - registerdata, d.v.s. uppgifter som redan finns insamlade - brevenkät - telefonintervju - besöksintervju. Mätinstrument Mätinstrumentet är en blankett med de frågor man formulerat. Vid frågeformuleringen är det viktigt att man funderar över: om frågan verkligen mäter det den avser att mäta om frågan endast mäter det den avser att mäta.
Datainsamling Datainsamlingen ger till resultat ifyllda enkäter eller intervjusvar. En del av enkäterna sänds dock aldrig in och bland de inkomna finns också sådana som är felaktigt ifyllda. Det är därför speciellt viktigt vid brevenkät hur frågeblanketten är beskaffad. Vid intervju är risken mindre för missuppfattningar eftersom intervjuaren då har möjlighet att förtydliga frågorna. Databearbetning Databearbetningen kan delas upp i följande moment: - Granskning i syfte att komplettera ofullständigheter och rätta felen i det insamlade materialet. En väl utförd granskning kan höja undersökningens kvalitet betydligt. - Kodning, som innebär att svaren översätts till ett enhetligt språk. Det betyder ofta att uppgifter om t ex kön, yrke eller bransch får en sifferbeteckning. - Dataregistrering innebär att uppgifterna överförs till magnetband eller skivminne vid en terminal eller genom optisk läsning. Tabellframställning Tabellframställningen görs utifrån den på förhand fastställda tabellplanen och ska resultera i tabeller och diagram samt t ex summor och medelvärden av de undersökta variablerna. Analys och publicering Analys och publicering är de sista stegen i processen. Då sammanställs resultaten i en publikation. Oftast försöker man presentera resultaten på ett lättbegripligt sätt, t ex i form av diagram. Många orsaker till fel i en undersökning Fel är avvikelser från ett sant värde. De uppstår då man i realiteten mäter något annat än det man strävar efter att mäta. Fel kan uppkomma i varje moment i en undersökning. Redan i planeringen ingår därför att tänka igenom möjliga felkällor och försöka minska riskerna för fel.
KVALITET Relevans Noggrannhet - täckning Innehåll Aktualitet - urval - syfte - mätmetod - definitioner - mätinstrument - jämförbarhet - bortfall - bearbetning Det totala felet kan delas upp efter orsak i följande komponenter: täckningsfel, urvalsfel, bortfallsfel, mätfel och bearbetningsfel. Täckningsfel Täckningsfel är fel som uppkommit på grund av fel i ramen: - Undertäckning är de objekt som saknas i ramen men som borde ingå i undersökningspopulationen. Detta händer ofta då det gått lång tid sedan ramen fastställdes (t ex nyfödda och invandrare har inte hunnit registreras) - Övertäckning är de objekt som inte ska vara med i undersökningspopulationen men som inte kunnat sorteras bort ur ramen (t ex döda eller emigranter som inte strukits). Urvalsfel Urvalsfel uppkommer därför att man undersöker bara en del av undersökningspopulationen. Bortfallsfel Bortfallsfel är fel som beror på att mätvärden för vissa objekt saknas. Bortfallet kan utgöras av: - objektsbortfall, d.v.s. vägrare eller ej anträffade - partiellt bortfall, d.v.s. uteblivna svar på någon eller några frågor. Mätfel Mätfel kan bero på fel i: - mätmetoden, t ex fel som beror på att mätsituationen inte kan hållas under kontroll, exempelvis då fel person svarar på frågorna eller fel som beror på att intervjuaren ställer frågorna på ett ledande sätt eller noterar svaren felaktigt
- mätinstrumentet, d.v.s. att en fråga är så konstruerad att den inte mäter det som den avser att mäta eller att den inte mäter enbart det som den avser att mäta. Bearbetningsfel Bearbetningsfel kan delas upp i: - kodningsfel, d.v.s. fel som uppkommer då man granskar och kodar lämnade uppgifter - stansningsfel, d.v.s. fel som uppkommer då man för över lämnade uppgifter till datormedia - tabuleringsfel, d.v.s. fel som uppkommer vid dataprogrammering och - körning.