Om register och imputering av binära variabler. Preliminär version:
|
|
- Ann-Marie Pettersson
- för 7 år sedan
- Visningar:
Transkript
1 Om register och imputering av binära variabler av Thomas Laitila 1,2, Anders Holmberg 1, Emma Snölilja 1 1 Statistisa Centralbrån, SE Örebro 2 Handelshögsolan, Örebro universitet, SE Örebro Preliminär version: Introdution Ett flertal anledningar ligger baom statistibråernas öande intresse för användning av register och administrativa data vid statistiprodution (Wallgren och Wallgren, 2007). Kostnadsbesparingar och minsad uppgiftslämnarbörda är två förväntade effeter av en öad användning av sådana data. En tredje förväntan är minsande produtionstider och öad atualitet i publicerad statisti. Cerroni, Migliardo och Morganti (2010) presenterar en utvärdering av ISTATs företagsregister som bl.a. indierar snabbare publicering av statisti. Fastän insamling av data från register och administrativa ällor siljer sig från insamling av data vid urvalsbaserade undersöningar, så finns ett antal gemensamma problem och felällor. Två gemensamma och väsentliga problem är bortfall och mätfel. Hantering av bortfall och mätfel an göras enligt två strategier. I den första används estimatorer som tar hänsn till bortfall och mätfel. Exempel på sådana estimatorer är alibreringsestimatorn (Särndal och Lundström, 2005) och ML estimation via tillämpning av EM algoritmen (Dempster, Laird och Rubin, 1977). Ett annat exempel är Ilves och Laitila (2009) som föreslår en biasorrigerad estimator vid mätfel. I den andra strategin anpassas data så att ordinare estimationsförfarande an användas, d.v.s. imputering för bortfall och mätfel. Ett stort antal olia imputeringstenier finns föreslagna i litteraturen. De an lassificeras efter dataälla för imputering, om parametris eller ice parametris metod används, och om randomisering används eller inte. Notera att de två strategierna an ombineras vilet bl.a. 1
2 Särndal och Lundström (2005) föreslår, där variabelbortfall hanteras med imputering och objetsbortfall hanteras med alibrering. Ett problem med imputering är dess effet på uppsattningar av estimatorernas varians. Vid deterministis imputering med medelvärdet över tillgängliga observationer undersattas variansen. Ett sätt att försöa återspegla variationen i den studerade variabeln och orrigera för undersattning är att tillämpa randomiserad imputering, d.v.s. att istället för imputering av ett förväntat värde imputeras ett slumptal draget från en sattad fördelning. En ansats för att satta variansen hos estimatorer baserade på imputerade data är Multipel Imputation (MI) (Rubin, 1989). Vid MI genereras flera datamängder med olia randomiserade imputationer av bortfallet. Den extra variationen an mätas via variationen hos sattningarna över datamängderna. En vitig aspet på teorin för MI behandlas av Björnstad (2007) som utveclar MI ansatsen för tillämpning vid officiell statistiprodution. Denna artiel bgger på resultat i Laitila (2010) och behandlar problemet med imputering av binära variabler för bortfall när registerdata används för sattning av populationstotaler. En vitig utgångspunt i analsen är utgångspunterna i teorin för designbaserad inferens, (t.ex. Särndal, Swenson and Wretman, 1992), där populationens objet och deras egensaper ses som fixa enheter. Resultaten visar att randomiserad imputering ger sämre precision i sattningar jämfört med deterministis imputering och, att randomisering i sig ger ingen information om sattningarnas precision. 2. Bortfall av en binär variabel Betrata sattning av en populationstotal av en binär variabel, d.v.s. en variabel som antar värdet ett eller noll. Populationen betecnas med, vilen för enelhets sull antas motsvara registerpopulationen. Den binära variabeln betecnas med och mängden betecnar de individer i registret för vila det finns data på variabeln. 2
3 betecnar omplementmängden till avseende populationen, d.v.s. individer för vila data sanas för variabeln. Antalet enheter i respetive med N and N. innehåller de betecnas Den populationstotal som sattas är t = = +. Imputerade värden betecnas med ŷ och den imputeringsbaserade estimatorn av populationstotalen t är = ˆ (1) Vid randomiserad imputering, antag att imputerade värden genereras från oberoende bernoullifördelninger enligt ˆ ~ Bern( ),. Här an vara en onstant eller en funtion definierad på tillgänglig hjälpinformation. Den randomiserade imputeringsestimatorn betecnas med R och har väntevärdet och variansen = E( R ) (2) t R = 1 ( ) V ( ˆ ) (3) Definiera den deterministisa imputeringsestimatorn enligt D = (4) Via definition av enpuntsfördelningar för imputerade värden erhålls väntevärdet och variansen noll, d.v.s. V ( ˆ ) = 0. t D = E( D ) (5) Estimatorerna R och D har samma väntevärde och bias Notera att bias begränsas till intervallet = ( ) B( ) = B(ˆ t ) (6) R D 3
4 där N ( 1 ) B(ˆ ) = N N. Intervallets längd är t N och med = 0. 5 centreras intervallet ring 0. Eftersom estimatorerna har samma bias följer att D har mindre MSE (Mean Squared Error) än R, d.v.s. MSE ) < MSE(ˆ t ( D R Vid sattningar av populationsparametrar är det bruligt att illustrera sattningarnas osäerhet m.h.a. onfidensintervall. Variansen hos den randomiserade estimatorn R ges av evation (3) och ett onfidensintervall an bildas enligt ) Källan till variation i ( ) R ± (7) R är det slumpmässiga urvalet av värden från fördelningarna ˆ ~ Bern( ). Intervallet (7) illustrerar därför osäerheten hos R som estimator av det ända värdet + D, inte som estimator av E( R) = = t. 3. ppsattning av antal svensa arbetspendlare till Norge Snölilja (2010) studerar egensaper hos personer som arbetspendlar till Norge från svensa gränsommuner i västra Svealand och nord-västra Götaland. Redovisning av inomststatistien problematiseras av att uppgifter om inomster från Norge blir tillgängliga efter publicering av den svensa inomststatistien, vilet inför en undersattning av de totala inomsterna i gränsommunerna. I Snölilja (2010) prövas en ansats där en modell för arbetspendling utveclas baserat på data för tidigare inomstår, varefter modellen används för uppsattning av arbetspendling innevarande år. I hennes arbete används inomststatisti från 2006 för utvecling av modell, varefter modell och sattning utvärderas med inomststatisti för Analsen avgränsas till ommunerna Strömstad, Årjäng och Eda. 4
5 Baserat på data från 2006 sattas en logistis regressionsmodell för variabeln 1 = 0 om individ har inomst från Norge 2006 i annat fall Den sattade modellen appliceras på data från 2007 och sannoliheter = ( ) Pr =1 beränas enligt den sattade modellen. För 2007 beränas två deterministisa imputationssattningar: t ˆ 1 = + 1( 0.5) D D2 = Beränade sattningar presenteras i Tabell 1. Den första imputeringsestimatorn undersattar antalet pendlare raftigt. Om en mindre andel arbetspendlar an fördelningen av Pr ( =1) = över populationen förväntas vara sev mot små värden. En tröselgräns på 0.5 ger därmed en undersattning av antalet pendlare. I extrema fall an en sådan tröselgräns ge uppsattningar på noll arbetspendlare. Ett alternativ är att säna tröselgränsen från 0.5 till ett mindre tal. Ett annat alternativ är att använda den estimator som föreslås i evation (4). I exemplet har den estimatorn en liten bias, -10%, fastän den modell som används för beräning av imputeringsvärden ˆ = är baserad på en cold dec ansats med data från ett föregående år. I tabell 1 inluderas även en sattning baserad på randomiserad imputering. För denna realisering är bias på -11%. Estimatorns bias är doc densamma som för t ˆD 2 enligt (6). Variansen för estimatorn med randomiserad imputering är V ( ) ( 1 ) = ˆ t R =, vilet ger ett litet högre MSE vid randomiserad imputering jämfört med deterministis imputering. I detta exempel domineras MSE av bias. Ett 95% KI enligt (7) ger intervallet 2075 ± 47.9, vilet inluderar t ˆD 2. Däremot inluderas inte populationstotalen t = 2342 i onfidensintervallet.
6 Tabell 1: Registrerat och sattat antal personer med inomst från Norge Estimator/Register Sattning/Värde Relativt Bias MSE t % ˆD1 t % ˆD2 a) (2075) a) -10% b) b) R t 2342 c) Register ( ) a) En realisering av estimatorn med randomiserad imputering. b) Bias och MSE för estimatorn R. c) Värde enligt SCBs inomst och taxeringsregister. Referenser Björnstad, J.F. (2007). Non-Baesian multiple imputation, Journal of Official Statistics, 23:4, Cerroni, F, Migliardo, S. and E. Morganti (2010). Qualit evaluation analsis of the Italian business register on enterprise groups. Paper presented at Q2010, Helsini, 3-6 Ma, Dempster, A.P, Laird, N.M. and D.B. Rubin (1977). Maximum lielihood from incomplete data via the EM algorithm. Journal of the Roal Statistical Societ B, 39, Ilves, M. and T. Laitila (2009). Probabilit-Sampling Approach to Editing, Austrian Journal of Statistics, 38(3), Laitila, T. (2010). On imputation of binar variables in registers, Mimeo, Statistics Sweden. Rubin, D.B. (1987). Multiple Imputation for Nonresponse in Surves. Wile, New Yor. Snölilja, E. (2010). Inomststatisti och pendling Predition av arbetspendlare till Norge. Kandidatuppsats i statisti, Örebro universitet. Särndal, C.-E., Swensson, B. och J. Wretman (1992). Model Assisted Surve Sampling, Springer, New Yor. Särndal, C.-E. and S. Lundström (2005). Estimation in Surves with Nonresponse, Wile, Chichester, England. Wallgren, A. och B. Wallgren (2007). Register-based Statistics, Wile, Chichester. 6
STATISTISKA CENTRALBYRÅN
STATISTISKA CENTRALBYRÅN 2013-04-12 1(7) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras.
Läs merUppföljning av Ky- och Yh-utbildning 2011
Uppföljning av Ky- och Yh-utbildning 2011 Tenis rapport 2011-11-28 1(9) Inledning Enheten för statisti om utbildning och arbete vid Statistisa centralbyrån (SCB) genomförde under hösten 2011 en postenät
Läs merEuropaparlamentsval, valdeltagandeundersökningen
Statistisa centralbyrån SCBDOK 3.2 1 (18) Europaparlamentsval, valdeltagandeundersöningen 2014 ME0110 Inneåll 0 Allmänna uppgifter... 2 0.1 Ämnesområde... 2 0.2 Statistiområde... 2 0.3 SOS-lassificering...
Läs merKalibreringsrapport. Bilaga 1(6)
Bilaga 1(6) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi
Läs merKalibreringsrapport Elevpaneler - enkätundersökning
STATISTISKA CENTRALBYRÅN 014-05-8 1(6) Kalibreringsrapport Elevpaneler - enätunersöning 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval)
Läs merKalibreringsrapport. Bilaga 1(6)
Bilaga 1(6) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiens framställning version 1 1 (13) STATISTIKENS FRAMSTÄLLNING Undersöningarna av barns levnadsförhållanden (Barn-ULF) Ämnesområde Levnadsförhållanden Statistiområde Barns levnadsförhållanden Produtod
Läs merMatematisk statistik
HF, repetitionsblad Mateatis statisti Uppgift Fördelningsfuntionen för en ontinuerlig stoastis variabel X är F ( x) cx x < x x > Bestä värdet på onstanten c, edianen och täthetsfuntionen för X a) Enligt
Läs merSTATISTISKA CENTRALBYRÅN
STATISTISKA CENTRALBYRÅN 2011-11-17 1(6) Kalibreringsrapport 1 Inlening I en totalunersöning uppommer fel om vi inte lycas få svar från alla personer (bortfall) om e avvier från e svarane me avseene på
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiens framställning version 1 1 (14) STATISTIKENS FRAMSTÄLLNING Analyser och statisti om befolningens utbildning Ämnesområde Utbildning och forsning Statistiområde Befolningens utbildning Produtod
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiansvarig myndighet Statistisa centralbyrån Statistiens framställning version 1 1 (9) STATISTIKENS FRAMSTÄLLNING Elevpaneler för longitudinella studier Ämnesområde Utbildning och forsning Statistiområde
Läs merUppgift 2. För två händelser A och B gäller P(A B)=0.5, P ( A ) = 0. 4 och P ( B
TENTAMEN I MATEMATISK STATISTIK Datum: 3 juni 8 Ten i ursen HF3, 6H3, 6L3 MATEMATIK OH MATEMATISK STATISTIK, Ten i ursen HF ( Tidigare n 6H3), KÖTEORI OH MATEMATISK STATISTIK, Ten i ursen HF4, (Tidigare
Läs mer1 Föreläsning IV; Stokastisk variabel
1 FÖRELÄSNING IV; STOKASTISK VARIABEL 1 Föreläsning IV; Stoastis variabel Vi har tidigare srivit P (1, 2, 3, 4, 5) = P (C) för sannoliheten för att få 1, 2, 3, 4 eller 5 vid ett tärningsast. Vi sall använda
Läs merVariansjämförelse av excess-of-loss-kontrakt med och utan aggregerat självbehåll
Matematis statisti Stocholms universitet Variansjämförelse av excess-of-loss-ontrat med och utan aggregerat självbehåll Sabina Jusupovic Examensarbete 003:9 Postadress: Matematis statisti Matematisa institutionen
Läs merCentrala gränsvärdessatsen (CGS). Approximationer
TNG006 F7 25-04-2016 Centrala gränsvärdessatsen (CGS. Approximationer 7.1. Centrala gränsvärdessatsen Vi formulerade i Sats 6.10 i FÖ6 en vitig egensap hos normalfördelningen som säger att en linjär ombination
Läs merEN 1990 Eurokod: Grundläggande dimensioneringsregler för bärande konstruktioner Elisabeth Helsing, Boverket
EN 1990 Eurood: Grundläggande dimensioneringsregler för bärande onstrutioner Elisabeth Helsing, Boveret EN 1990 den innehåller de grundläggande dimensioneringsreglerna för bärande onstrutioner och är uppdelad
Läs merEkonomisk statistik 2 Economic statistics 2. Imputering
Ekonomisk statistik 2 Economic statistics 2 Imputering Masterkurs Daniel Thorburn Höstterminen 2008 Stockholms Universitet Ekonomisk statistik Höstterminen 2008 Stockholms Universitet Saknade värden Totalt
Läs merUppföljningsundersökning. Elever. Teknisk rapport
Uppföljningsundersöning Elever Tenis rapport Inledning Enheten för statisti om utbildning och arbete vid Statistisa centralbyrån (SCB) genomförde under perioden mars - juni 2011 en postenät på uppdrag
Läs merUngdomar utan fullföljd gymnasieutbildning en undersökning med många utmaningar
Bagrundsfata Ungdomar utan fullföljd gymnasieutbildning en undersöning med många utmaningar 2008:1 Arbetsmarnads- och utbildningsstat i s t i I serien Bagrundsfata presenteras bagrundsmaterial till den
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiens framställning version 1 1 (11) STATISTIKENS FRAMSTÄLLNING Undersöningen om vuxnas deltagnde i utbildning Ämnesområde Utbildning oc forsning Statistiområde Befolningens utbildning Produtod UF0538
Läs merINLEDNING TILL. U/ADB / Statistics Sweden. Stockholm : Statistiska centralbyrån, Nr E24- E26
INLEDNING TILL R & D report : researc, metods, development / Statistics Sweden. Stocolm : Statistisa centralbyrån, 1988-2004. Nr. 1988:1-2004:2. Häri ingår Abstracts : sammanfattningar av metodrapporter
Läs merMULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla
Läs merFaktorer som påverkar aktiefondsparandet
Kandidatuppsats vårterminen 2006 Nationaleonomisa institutionen EKONOMIHÖGSKOLAN VID LUNDS UNIVERSITET Fatorer som påverar atiefondsparandet en studie av fem grupper fondsparare på den svensa atiefondsmarnaden
Läs merSamplingfördelningar 1
Samplingfördelningar 1 Parametrar och statistikor En parameter är en konstant som karakteriserar en population eller en modell. Exempel: Populationsmedelvärdet Parametern p i binomialfördelningen 2 Vi
Läs merMVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merFöreläsning 6 (kap 6.1, 6.3, ): Punktskattningar
Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merF3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Läs merKONTROLLSKRIVNING 2 Kurs: HF1012 Matematisk statistik Lärare: Armin Halilovic Datum: 14 apr 2014 Skrivtid: 13:15-15:00
KONTROLLSKRIVNING Kurs: HF atematis statisti Lärare: Armin Halilovic Datum: ar Srivtid: :-: Tillåtna hjälmedel: iniränare av vilen ty som helst. Förbjudna hjälmedel: Telefon lato och alla eletronisa medel
Läs merMULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?
MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.
Läs merKalibreringsrapport. Föräldraundersökningen 2012, 1 5 år
Kalibreringsrapport Förälraunersöningen 2012, 1 5 år Inlening I en urvalsunersöning är allti sattningarna beäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat
Läs merKalibreringsrapport studiecirkeldeltagare 65+
STATISTISKA CENTRALBYRÅN 2014-01-17 1(8) Kalibreringsrapport stuiecireleltagare 65+ 1 Inlening I en urvalsunersöning är allti sattningarna beäftae me urvalsfel beroene på att enast en elmäng (urval) av
Läs mer2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /
Föreläsning 5: Matstat AK för I, HT-8 MATEMATISK STATISTIK AK FÖR I HT-8 FÖRELÄSNING 5: KAPITEL 4.6 7: SUMMOR, MAXIMA OCH ANDRA FUNKTIONER AV S.V. KAPITEL 5. : VÄNTEVÄRDEN, LÄGES- OCH SPRIDNINGSMÅTT EXEMPEL
Läs merAllmänna valen, valdeltagandeundersökningen
Statistisa centralbrån SCBDOK 3.2 1 (22) Allmänna valen, valdeltagandeundersöningen 2014 ME0105 Inneåll 0 Allmänna uppgifter... 2 0.1 Ämnesområde... 2 0.2 Statistiområde... 2 0.3 SOS-lassificering... 2
Läs merInträdet på arbetsmarknaden bland gymnasieavgångna 2006 UF0512
BV/UA 2006-12-05 1(35) Inträdet på arbetsmarnaden bland gymnasieavgångna 2006 UF0512 En besrivning av inträdet på arbetsmarnaden bland högsoleexaminerade återfinns längre ner i detta doument. I denna besrivning
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merVid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Läs merTillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merAllmänna val, valdeltagandeundersökningen
Statistisa centralbyrån SCBDOK 3.2 1 (22) Allmänna val, valdeltagandeundersöningen 2002 ME0105 Innehåll 0 Allmänna uppgifter... 2 0.1 Ämnesområde... 2 0.2 Statistiområde... 2 0.3 SOS-lassificering... 2
Läs merPostadress: Internet: Matematisk statistik Matematiska institutionen Stockholms universitet 106 91 Stockholm Sverige. http://www.math.su.
Å Ø Ñ Ø Ø Ø Ø ËØÓ ÓÐÑ ÙÒ Ú Ö Ø Ø Ê ÔÖÓ Ð Ö Ö Ö Ò ÓÐ Ú Ö Ä Ö ÓÒ Ü Ñ Ò Ö Ø ¾¼½ ostadress: Matematis statisti Matematisa institutionen Stocholms universitet 106 91 Stocholm Sverige Internet: http://www.math.su.se/matstat
Läs merFöreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Läs merHyror i bostadslägenheter (HiB)
Statistiska centralbyrån SCBDOK 3.2 1 (17) Hyror i bostadslägenheter (HiB) 2014 BO0406 Innehåll 0 Allmänna uppgifter... 2 0.1 Ämnesområde... 2 0.2 Statistikområde... 2 0.3 SOS-klassificering... 2 0.4 Statistikansvarig...
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merJörgen Säve-Söderbergh
SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 8 Binomial-, hypergeometrisk- och Poissonfördelning Exakta egenskaper Approximativa egenskaper Jörgen Säve-Söderbergh Binomialfördelningen
Läs merSTATISTISKA CENTRALBYRÅN
STATISTISKA CENTRALBYRÅN 2013-04-03 1(8) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras.
Läs mer2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer
Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiansvarig mndighet Statistisa centralbrån Statistiens framställning version 1 1 (16) STTISTIKENS FRMSTÄLLNING alansstatisti Ämnesområde Näringsversamhet Statistiområde Näringslivets strutur Produtod
Läs mer1 Föreläsning II, Vecka I, 21/1-25/11, 2019, avsnitt
1 Föreläsning II, Veca I, 1/1-5/11, 019, avsnitt.3 1.1 Kombinatori Exempel 1.1 I ett rutnät går man åt höger eller uppåt. Hur många vägar finns det mellan A och B? B A Vi har 8 (del-)sträcor att välja
Läs merFöreläsning 2 (kap 3): Diskreta stokastiska variabler
Föreläsning 2 (kap 3): Diskreta stokastiska variabler Marina Axelson-Fisk 20 april, 2016 Idag: Diskreta stokastiska (random) variabler Frekvensfunktion och fördelningsfunktion Väntevärde Varians Några
Läs merF22, Icke-parametriska metoder.
Icke-parametriska metoder F22, Icke-parametriska metoder. Christian Tallberg Statistiska institutionen Stockholms universitet Tidigare när vi utfört inferens, dvs utifrån stickprov gjort konfidensintervall
Läs merSTATISTIKENS FRAMSTÄLLNING
1 STATISTIKENS FRAMSTÄLLNING Befolkningens it-användning (BITA) Ämnesområde Levnadsförhållanden Statistikområde Levnadsförhållanden Produktkod LE0108 Referenstid 2018 Kontaktuppgifter Statistikansvarig
Läs merInträdet på arbetsmarknaden bland gymnasieavgångna 2012 UF0512. Innehållsförteckning
BV/UA 2012-11-14 1(16) Inträdet på arbetsmarnaden bland gymnasieavgångna 2012 UF0512 I denna besrivning redovisas först allmänna uppgifter om undersöningen samt dess syfte och histori. Därefter redovisas
Läs merBortfallsproblematik ur ett metodperspektiv
Bortfallsproblematik ur ett metodperspektiv Daniel Thorburn Surveyföreningen 2011-05-27 Olika metodaspekter Bortfall versus andra fel Psykologi varför svarar man? (inte?) Åtgärder vid insamling (förebygg!)
Läs merSTATISTISKA CENTRALBYRÅN
STATISTISKA CENTRALBYRÅN 1(18) Hyror i bostadslägenheter (HiB) 2013 BO0406 Innehåll 0 Allmänna uppgifter SCBDOK 3.1 1 Innehållsöversikt 0.1 Ämnesområde 0.2 Statistikområde 0.3 SOS-klassificering 0.4 Statistikansvarig
Läs merHur Keplers lagar för planetrörelser följer av Newtons allmänna fysikaliska lagar.
Hur Keplers lagar för planetrörelser följer av Newtons allmänna fysialisa lagar. 1. Newtons gravitationslag och Newtons andra lag. Vi placerar ett rätvinligt oordinatsystem i solsystemet med solens medelpunt
Läs merPunktskattning 1 Ett exempel
Matematisk statistik för STS vt 004 004-05 - 04 Bengt Rosén Punktskattning Ett exempel Vid utveckling av nannoelektronik vill man väga en mycket liten "pryl", med vikt någonstans mellan 00 och 50 mg. "Prylen"
Läs mer1 Jag själv lärde om detta av en kollega som, kanske, heter Joel Andersson
1 Kryptering 11 Vi sall 1 idag titta lite på ryptering, och mera specifit hur elliptisa urvor används i ryptering, såallad ECDSA Vi sall ocså se ett atuelt exempel på hur detta inte sall användas 12 Problemet
Läs merInstruktioner för rapportering av räntestatistikblankett MIR
1 1(13) Instrutioner för rapportering av räntestatistiblanett MIR NOVEMBER 2014 Rapporteringen av räntestatisti för monetära finansinstitut (MFI) görs i den så allade MIR-blanetten. I RBFS 2014:2 ges generella
Läs mer4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
Läs merTillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1
Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett
Läs merFinansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel
Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merEnvägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Läs merFördjupad dokumentation av statistiken
Jordbrusveret FÖRDJUPAD DOKUMENTATION AV STATISTIKEN 1(30) Fördjupad doumentation av statistien Arrendepriser på jordbrusmar 2008 Referensperiod: 2007-2008 Produtod(er): JO 1002 Senast uppdaterad: 2009-08-24
Läs merTentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Läs merJesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014
Föreläsning 1. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik 1MS026 vt 2014 Varför tillämpad statistik? Användningsområden i medicin, naturvetenskap
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merKapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Läs merRiktlinjer för rapportering av räntestatistikblankett MIR
(5) Ritlinjer för rapportering av räntestatistiblanett MIR (200-09-30) 2 2(5) Innehållsförtecning sida Posternas innehåll... 3. Referensperiod... 3.2 Löptidsfördelning av utlåning... 4.3 Definition av
Läs merKapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin
Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,
Läs merOm användning av potensserier på kombinatorik och rekursionsekvationer
Om användning av potensserier på ombinatori och reursionsevationer Anders Källén MatematiCentrum LTH andersallen@gmailcom Sammanfattning Vid analys av både ombinatorisa problem och för att lösa reursionsevationer
Läs mer, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Läs merSpridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.
Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:
Läs merArbetsutvecklingsrapport
Arbetsutveclingsrapport Vad tycer bruarna? Den andra länsgemensamma bruarundersöningen för personer med insatsen bostad med särsild service enligt LSS Författare: Eva Rönnbäc Rapport: nr 2011:7 ISSN 1653-2414
Läs merPoolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
Läs merKalibreringsrapport. Utländska doktorander
Kalibreringsrapport Utlänska oktoraner Inlening I en urvalsunersökning är allti skattningarna beäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppkommer
Läs merSökaktivitet inom olika arbetsmarknadspolitiska program
Sökaktivitet inom olika arbetsmarknadspolitiska program Petra Nilsson 20 maj 2011 Working Paper 2011:1 Arbetsförmedlingens Working Paper serie presenterar rapporter som rör analys av arbetsmarknadens funktionssätt
Läs merKalibrering som ett sätt att hantera bortfall
Kalibrering som ett sätt att hantera bortfall Vilken korrelation krävs mellan hjälp- och responsvariabler? Anna Andersdotter Persson Student Vt 2010 Magisteruppsats, 15 hp Statistikerprogrammet, 240 hp
Läs merF9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merMissing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21
Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.
Läs merTeknisk Rapport En beskrivning av genomförande och metoder. Lärares tidsanvändning Vt 2012
Tenis Rapport En besrivning av genomförande och metoder Lärares tidsanvändning Vt 2012 Inledning Statistisa centralbyrån (SCB) genomförde under perioden december 2011 och juli 2012 en tidsanvändningsundersöning
Läs merSTATISTIKENS FRAMSTÄLLNING
Statistiens framställning version 1 1 (16) STATISTIKENS FRAMSTÄLLNING Företagens eonomi Ämnesområde Ämnesområde: Näringsversamhet Statistiområde Statistiområde: Näringslivets strutur Produtod NV0109 Referenstid
Läs merBortfallshantering. En illustrerande studie med metoderna viktning och imputation
Örebro universitet Handelshögskolan Statistik C, Uppsats Handledare: Nicklas Petterson Examinator: Niklas Karlsson VT15/2015-06-04 Bortfallshantering En illustrerande studie med metoderna viktning och
Läs merTentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Läs merdt = x 2 + 4y 1 typ(nod, sadelpunkt, spiral, centrum) och avgöra huruvida de är stabila eller instabila. Lösning.
Lösningsförslag till tentamenssrivning i SF633 Differentialevationer I Måndagen den 5 otober 0, l 0800-300 Hjälpmedel: BETA, Mathematics Handboo Redovisa lösningarna på ett sådant sätt att beräningar och
Läs merDigital signalbehandling Kamfilter och frekvenssamplande filter
Institutionen för eletroteni 999--9 Kamfilter och frevenssamplande filter I frevenssamplande filter utgår vi från en filterstrutur som har ett stort antal nollställen i frevensgången och modellerar filtrets
Läs merFORSKNINGSMETODIK, KVANTITATIV DEL
FORSKNINGSMETODIK, KVANTITATIV DEL Jan Saarela http://www.vasa.abo.fi/users/jsaarela/ ANSATS Hantering av numerisk information Hur förstå, tolka och bearbeta sifferserier i matrisform CENTRALA BEGREPP
Läs merFöreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Läs mer2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel
Datorövning 1 Statistikens Grunder 2 Syfte 1. Lära sig göra betingade frekvenstabeller 2. Lära sig beskriva en variabel numeriskt med "proc univariate" 3. Lära sig rita histogram 4. Lära sig rita diagram
Läs merbli bekant med summor av stokastiska variabler.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR E FMSF20 Syfte: Syftet med dagens laborationen är att du skall: få förståelse för diskreta, bivariate
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merÖVNINGSUPPGIFTER KAPITEL 9
ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merDatakvalitet. Hva duger data til? Jonas Ranstam jonas.ranstam@med.lu.se
Hva duger data til? Jonas Ranstam jonas.ranstam@med.lu.se Registercentrum Syd, Skånes Universitetssjukhus och Inst. f. kliniska vetenskaper, Lunds Universitet, Klinikgatan 22, 22185 Lund, Sverige 15 Jan
Läs mer34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
Läs merKap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen
Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1 Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande
Läs mer