Förra gången (F4-F5)

Relevanta dokument
Skydd för statistikuppgifter

Statistik 1 för biologer, logopeder och psykologer

Föreläsning G60 Statistiska metoder

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

2 Dataanalys och beskrivande statistik

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Johan Andersson

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

2.1 Minitab-introduktion

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Beskrivande statistik

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

732G01/732G40 Grundläggande statistik (7.5hp)

Beskrivande statistik

Statistik. Statistik som beskriver vem och vilka vi är. Statistik som hjälpmedel i försäljning

13.1 Matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 27 mars 2004, kl

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Bearbetning och Presentation

Föreläsning G70 Statistik A

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Marknadsinformationsmetodik Inlämningsuppgift

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

F2 Beskrivning av ett datamaterial. Tabellering och val av diagram. Summatecknet

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

En typisk medianmorot

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Marknadsinformationsmetodik Inlämningsuppgift

Valresultat Riksdagen 2018

Statistiska begrepp och uttrycksformer

732G70, 732G01 Statistik A 7hp

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Föreläsning 1: Introduktion

MA1S TATISTIK UPPGIFTER

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

EXTRA ÖVNINGSUPPGIFTER MED SVAR

Lektion 1: Fördelningar och deskriptiv analys

Föreläsning 1: Introduktion

LABORATION 1. Syfte: Syftet med laborationen är att

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Kvantitativ strategi Univariat analys 2. Wieland Wermke

11. DESKRIPTION EN VARIABEL

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

MVE051/MSG Föreläsning 7

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Förra gången (F7) Officiell statistik Befolkningsstatistik. Slumpmässiga urval. Icke-slumpmässiga urval

Värdena för en diskret variabel (med få värden) kan redovisas i en tabell över frekvensfördelningen, dvs antalet observationer för de olika värdena.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 1: Introduktion

Uppgift 1. Deskripitiv statistik. Lön

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Finansiell statistik, vt-05. Allmän information. Johan Koskinen. F1(a) Allmän information

ÖVNINGSUPPGIFTER KAPITEL 2

Introduktion till statistik för statsvetare

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Statistik och epidemiologi T5

Datorövning 1 Statistik med Excel (Office 2007, svenska)

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Statistik i Excel en introduktion

MATEMATIK ARBETSOMRÅDET LIKABEHANDLING Kränkande handlingar, nätmobbning, rasism och genus

Statistik för teknologer, 5 poäng Skrivtid:

ÖVNINGSUPPGIFTER KAPITEL 2

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Why you should love statistics - Alan Smith. Hur väl känner du till ditt område? Vet eller tror du?

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Laboration med Minitab

Datorövning 1 Statistik med Excel (Office 2010, svenska)

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Introduktion till statistik för statsvetare

Lite extra material för deltagarna i kursen MAB 5.1

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Medicinsk statistik I

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Vetenskaplig teori och metod Provmoment: Tentamen 1 Ladokkod:

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Transkript:

F6 Standardiseringsmetoder Etiska regler och lagregler Förra gången (F4-F5) Lägesmått: aritmetiskt medelvärde (minst intervall), median (minst ordinal), typvärde (alla nivåer) När vi vill beskriva tyngdpunkten i ett material Observera andel/proportion är ett specialfall av medelvärde Spridningsmått: varians (minst intervall), standardavvikelse (minst intervall), kvartilavstånd/avvikelse (minst ordinal), variationsvidd (minst intervall), variationskoefficient (minst intervall) När vi vill beskriva variationen i ett material Vi ska kunna beräkna alla dessa mått samt veta när de är lämpliga 1

Förra gången (F4-F5), diagram Kvalitativa variabler Stapeldiagram Cirkeldiagram Kvantitativa variabler Diskreta med fåtal värden Stapeldiagram Stolpdiagram Trappstegsdiagram (för kumulativ frekvens) Kontinuerliga eller diskreta med många värden Histogram Frekvenspolygon Summapolygon (för kumulativ frekvens) Stambladdiagram (ingen klassindelning) Lådagram (ingen klassindelning) Vi ska veta hur dessa diagram konstrueras, dvs kunna avläsa diagrammen. Ex. Kan man utifrån diagram X veta hur många observationer som har värdet x? Stambladdiagram Stem-and-Leaf Display: längd Stem-and-leaf of längd N = 27 Leaf Unit = 1,0 1 15 5 3 16 44 12 16 555888999 (11) 17 01112233444 4 17 58 2 18 02 2

Descriptive Statistics: längd Lådagram Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 längd 27 0 170,33 1,06 5,53 155,00 168,00 171,00 174,00 Variable Maximum längd 182,00 Md=171 Q1=168 Q3=174 D=1.5x(174-168)=9 D(min)=168-9=159 D(max)=174+9=183 X(min)=155 X(max)=182 längd 185 180 175 170 165 160 Boxplot of längd 155 Standardiseringsmetoder Jämförelser mellan medelvärden för olika populationer kan vara missvisande De anställda på företag A har högre medellön än de anställda på företag B Företag A har fler med ledande ställning än företag A spelar det någon roll? Stad A har högre dödlighet än stad B Stad A har fler äldre än stad B spelar det någon roll? Standardvägning Vi kan jämföra medelvärden i olika populationer sedan hänsyn tagits till kända faktorer Ex. skillnader i andel med ledande ställning på ett företag, skillnader i åldersfördelning 3

Standardvägning Standardpopulationsmetoden Vad skulle medelvärdet vara om fördelningen (ex. åldersfördelningen) såg ut som i en viss standardpopulation? Kapacitetsmetoden En jämförelse mellan ett faktiskt tal och ett förväntat tal x ABLL x GAB Standarpopulationsmetoden AB LL GAB Personalkategori Antal personer Medellön (tusen kr) Antal personer Medellön (tusen kr) Ledande 5 38,6 13 35,5 Självständigt arbete 46 25,8 67 25,6 Kontorspersonal 75 19,2 31 18,8 Biträdespersonal 84 15,5 24 15,3 Se K & W sid 85 5 38,6 + 46 25,8 + 75 19,2 + 84 15,5 = = 19,628 210 13 35,5 + 67 25,6 + 31 18,8 + 24 15,35 = = 23,161 135 5 35,5 + 46 25,6 + 75 18,8 + 84 15,3 = 210 x GAB =. ABLL 19,287 4

Standardpopulationsmetoden Kvoten mellan medelvärdet för AB LL och det standardiserade medelvärdet för GAB blir: 19628 = 1,02 19287 Lönenivån för AB LL ligger 2% över lönenivån för GAB när man tar hänsyn till att företagen har olika andelar i ledande ställning etc. AB LL har här använts som standardpopulation Kapacitetsmetoden Område A: 1628 födda barn, 26506 fruktsamma kvinnor Fruktsamhet: 1628/26506=0,0614 Område B: 5480 födda barn, 91446 fruktsamma kvinnor Fruktsamhet: 5480/91446=0,0599 Enligt ovan är fruktsamheten högre i A än i B Men det är olika åldersfördelningar i område A och B Dock vet vi inte fruktsamheten per åldersgrupp i A och B 5

Kapacitetsmetoden Vi kan beräkna det förväntade antalet födda barn för båda områdena givet deras åldersfördelningar Förväntade antal födda barn i område A (se K & W sid 87): 3028x0,0118+4976x0,0902+4865x0,1515+7362x0,0529+6275x0,0039=1636 Kapacitetsindex: 1628/1636=99,5% Förväntade antal födda barn i område B: 10389x0,0118+15983x0,0902+17263x0,1515+22470x0,0529+25341x0,0039=5467 Kapacitetsindex: 5480/5467=100,2% Ålder (år) Antal kvinnor område A Antal kvinnor område B Fruktsamhet i riket (promille) 15-19 3028 10389 11,8 20-24 4976 15983 90,2 25-29 4865 17263 151,5 30-39 7362 22470 52,9 40-49 6275 25341 3,9 Kapacitetsmetoden I område A föds 0,5% färre barn än förväntat I område B föds 0,2% fler barn än förväntat. Fruktsamheten är något högre i B än A om man tar hänsyn till åldersfördelning 6

Etiska regler och lagregler: skyddet för statistikuppgifter Statistiksekretessen Ett undantag från offentlighetsprincipen Omfattar uppgifter som samlas in av myndigheter för statistikproduktion Personuppgiftslagen (PuL) Omfattar både myndigheter och privata företag Personuppgifter får behandlas om registrerade lämnat informerat samtycke Undantag för statistiska ändamål Syfte: skydda mot kränkning av personliga integriteten Datainspektionen: www.datainspektionen.se Statistiska undersökningar Informerat samtycke För att minska bortfall: informera om lagligt skydd enligt PuL och SekrL, samt att inga enskilda svar kan identifieras Avidentifiering (efter bortfall påmints) 7

Etiska regler i samhällsforskning Vägning mellan forskningskrav samt individskyddskrav Humanistisk-samhällsvetenskapliga forskningsrådet (Se KD sid 358-359) Ska informeras Lämna samtycke utan påtryckningar Informeras om möjlighet till att avbryta Inget beroendeförhållande mellan forskare/uppgiftslämnare Obehöriga ska inte kunna få tag på uppgifter. Tystnadsplikt Uppgifter får inte användas av myndigheter för påtryckning 8