De två faena: Datainamling, däpå Etimation Ku SU, del 2 Ku SU 20/04 2015 Pete Lundquit och Cal-Ei Sändal 2015-04-18_PL 1
De två faena: Datainamling, däpå Etimation 1. Datainamlingen om tidbeoende poce Obalan i vamängden Obalanmåttet; epeentativitet 2. Begeppet obalan illuteat med uveydata Obalanen utvecling öve datainamlingpeioden 3. Etimationfaen; väentliga begepp Etimatoe om använde hjälpvaiable; alibeing Avviele fån unbiaed etimation; uppdelning i omponente Valet av hjälpvaiable 4. Etimaten illuteade med uveydata Avvielen utvecling öve peioden 2
Den dynamia (tidbeoende) apeten Dynami yn på datainamlingen En eie vamängde (inaplade), funtione av ett tidbeoende index a (1) (2)... ( a)... a te ontatfööet, elle a te datainamlingdagen Mängden (a) ä de om ha vaat fam t.o.m. tillfälle a. Men fö enla betecninga låte vi i fotättningen betecna vamängden vid vilet tillfälle om helt. 3
Datainamling och målvaiable hänge ihop i ett tidbeoende pepetiv Sattning av andel i % fö växande vamängd Sattning av vaiationoefficient i % fö växande vamängd 4
Balan En pincip om äge att en minde mängd a i medeltal tämma med en töe mängd om innehålle den minde. Till exempel: Minde mängden = uval Stöe mängden = populationen I medeltal ave hjälpvaiable 5
Balaneat uval I föhållande till populationen U ä uvalet balaneat på hjälpvaiabeln x (änd fö ) om x x U Uvalmedeltal = Populationmedeltal Om x och undeöningvaiabeln y ha tat amband an vi då vänta o ba etimation : y y U 6
Hä gälle det ofulltändig vamängd (botfall) U Svamängden ä den delmängd av dä y obevea Ob begeppmäiga illnaden mellan (vamängd) och (uval) = botfallmängden; botfallandel = 1 - P 7
Uvalteget ett annolihetuval ifån U π = inluionannoliheten fö objet Deignvit: d = 1/ Botfallteget Vi vet inte hu vamängden geneeat fån uvalet. Svameanim och vaannolihete ä oända. 8
Balanead vamängd Svamängden av uvalet ä balanead på (den lämpligt valda) hjälpveton x om öveentämmele i medeltal: x x x d x / d ; x d x / d 9
Pefet balanead vamängd elativt veton x äve x x Dv medeltalöveentämmele fö alla de i x ingående x-vaiablena Nä x ha dimenion 20 elle me, inte å lätt att uppnå. Men å anda idan vill vi gäna balanea på ett fletal x-vaiable. 10
Hu mäte vi obalanen? Vanligen ä x x dv vamängden ä i obalan. Som mått på obalan i en vamängd vill vi ha en tohet (en tatitia) beäningba fö vilen vamängd om helt (givet ), och fö (i tot ett) vilen x-veto om helt. 11
Hu mäte vi obalanen? Måttet a vaa ice-negativt noll endat vid pefet balan x = x vaiea gana lite med vaandelen P fö given vamängd bli töe om man utöa x-veton med fle x-vaiable (fö då ä det våae nå pefet balan) Sva: Med en vadati fom i medeltalillnadveton x x 12
P = vaandel; vägningmati: Kotae betecning : IMB ) ) /( ( d d x x Σ ), ( IMB x ) ( ) ( 1 2 P x x Σ x x Obalanen (imbalance) - en vadati fom 13
IMB ä ett deiptivt mått på den uppnådda vamängden,, (på något tadium av datainamlingen). Egenap: 0 IMB P(1 P) 20% botfall : 0 IMB 0.16 50% botfall : 0 IMB 0.25 Öve gän IMB ä inget tot tal, men t.ex IMB = 0.20 pea på to obalan jämföt med IMB = 0 (pefet balan) 14
Simuleing av IMB fö given x-veto, I ~Be(0. 67) 200 000 uval med n = 5 000 Små tal, å i patien bua vi använda 100 x IMB ULF2009 IMB 15
Valet av x-veto fö IMB Om många x-vaiable finn att tillgå fö x-veton: Hu många a man ta? Vila a man ta? Som nämnt tidigae an valet tya av den valda datainamlingtategin elle yftet med måttet. En bedömningfåga utan optimal löning men fötjäna att bätte uteda. (Linande valet av hjälpveto i etimationen) 16
Lihete mellan begeppen vaian och obalan Båda uttyce minde önväda egenape (men fö olia ae); den ena fö en attning, den anda fö ehållen vamängd Båda ä vadatia till in natu Båda ä alltid töe än elle lia med noll Lia med noll ä eftetävanväda mål i båda fallen Motvaighet till tandadavviele ulle vaa IMB Statitia egenape ho IMB ha (liom vaian) amband med Chi-två födelning (fötjäna att nämae uteda). 17
En matemati detalj (men vitig) Att vi an iva IMB om IMB(, x ) P ( xσ x 1) 2 1 beo på att vi jobba med x-vetoe ådana att fö någon ontant veto gälle att μ x = 1 fö alla Lätt att uppfylla; ingen begänning egentligen. Men to matemati födel fö många fomle. 18
Ha IMB ett amband med begeppen MCAR, MAR och NMAR? IMB ä ett deiptivt mått på vamängden på valfi punt i datainamlingen, beäna på hjälpvaiablena enbat, använd fö att följa datainamlingen utvecling, fö att nå liten IMB till lut. MCAR, MAR och NMAR ä (oveifiebaa) pobabilitia antaganden om hu en tänt vameanim påvea y-vaiabeln i undeöningen. 19
Ha obalanmåttet IMB något amband med avtåndet mellan vaande och ice-vaande (fö den valda x-veton)? - Intuitivt bö det ju vaa å. Ditanmått (vägd eulidi ditan): dit {( x x ) Σ ( x x )} 1 1/2 x d x / d dä mängd ice-va (botfall) 20
Ditanen dit {( x x ) Σ ( x x )} 1 1/2 föhålle till IMB å hä : 0 IMB 1 dit P(1 P) P(1 P) dit an alltå vaa betydligt töe än 1 21
En annan funtion av IMB ä Balanindiaton: BI 1 IMB P(1 P) 22
Balan ditan R-indiato R-indiaton (R fö Repeentativity) Famtagen av RISQ-pojetet (lett av J. Bethlehem och B. Schouten, CBS i Holland). Reonemang: Vaianen i vaannolihetena a vaa liten; då ane vi att vamängden ä epeentativ. Men de oända vaannolihetena måte föt atta. 23
Balan ditan R-indiato Oända vaannolihetena θ atta föt. Vaianen i de attade vaannolihetena beäna. θˆ log exp( x βˆ) /[1 exp( x βˆ)] ; 2 med vaianen: S θˆlog, Ge R-indiaton: R 1 2 S θˆlog, BI använde en linjä lin-funtion; R-indiaton en logit lin-funtion 24
Vad ä ambandet mellan balanead och epeentativ? Balaneing ä en ativitet, en pocedu i datainamlingen avedd att föbätta vamängden. Repeentativitet ä en egenap ho vamängden om man till lut få i datainamlingen. Väl balanead epon och epeentativ epon ä (ungefä) ynonyme. 25
Egenape ho IMB Fö en och amma vamängd beo vädet på IMB mycet på valet av x-vaiable om få ingå i x- veton, och på antalet x-vaiable. Fö en vald x-veto tjäna IMB till att jämföa olia vamängde, om de getalta ig unde datainamlingen gång, elle fö att jämföa olia undeöninga (med amma x-veto). 26
Om balanindiaton BI 1 IMB P(1 P) BI ä ofta inte peciellt vägledande. Med de data vi ha analyeat (och ett analyeade av anda) bli måttet BI högt. Väden minde än 0.6 ä mycet ällynta. Fölaingen ä att IMB falle nätan alltid långt unde in öve gän P (1 P). Då omme BI att ligga onomalt högt, nätan alltid i öve halvan av (0,1)-intevallet. 27
Om balanindiaton BI T.ex. med botfall 1 P = 40% an typi ituation vaa IMB = 0,02 ; då ä BI = 1 0,02 0,24 = 0,71. Ett högt väde, fat IMB = 0,02 ä hög obalan (dålig balan). Däfö föeda vi att jobba med begeppet obalan, mätt med IMB. Vi få då omma ihåg att vädet om IMB anta i en uvey påvea mycet av antalet, och valet av, x- vaiable i x-veton. Geneellt: Ju fle x-vaiable, deto höge IMB. 28
BI BI 1 IMB P(1 P) 1,00 0,90 0,80 0,70 0,60 0,50 0,40 IMB=0,04 IMB=0,03 IMB=0,02 IMB=0,01 IMB=0,005 0,30 0,20 0,10 0,00 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 P 29
Jämfö med laia ynen på obevationmängden Klai uveyteoi byggd på inget botfall Obevationmängden (de om y-vädet finn obeveat fö) ä lia med uvalmängden (annolihetuvalet). OSU, tatifieat OSU, ytematit, två- (elle fle-)teg uval o..v. ä olia (lumpmäiga) ätt att apa en obevationmängd. Jämfö ituationen med botfall (ej lumpmäig delmängd): Att få till en vamängd med låg obalan (med metodena vi ha), det ä ocå att apa obevationmängden, givet det dagna amplet. Dea inteventione ingå i en anda fa i datainamlingen. Sannolihetuval ä det nappat länge. 30
Indiatoena illuteade med uveydata I datainamlingteget an vi utinmäigt följa, med pocedata fån datainamlingytemet (t.ex. WinDATI), obalanen IMB och ditanen dit öve tiden (dag 1, dag 2, ov.) elle om funtione av antalet ontatföö fö enhetena i amplet. 31
Vi analyea föt ULF2009 om den fatit gic till (med alla de metadata om finn). Använde följande x-veto fö IMB och ditan: x (( EducOwnOigin) Phone Age Civil Gende) dim (x) = 2 3 + 1 + 3 + 1 + 1 = 14. Målet ä att e hu IMB och ditan utvecla ig unde datainamlingpeioden, om funtion av ontatföönumet (om finn paat fö alla i amplet).. 32
Numeit exempel Data : ULF2009; alla ontatföö egiteade; odinaie datainamling, följd av uppföljning Kontat- Svaand föö 100 P dit n 100 IMB BI 8 odinaie 53,0 0,515 1,64 0,743 Slut odinaie 60,4 0,552 1,75 0,730 3 uppföljning 63,8 0,581 1,80 0,721 Slut 67,4 0,623 1,88 0,708 x (( Educ Owne Oigin ) Phone Age Civil Gende ) Obalan och ditan öa - inte ba! 33
Numeit exempel (fot.) En ice önad öande tenden i IMB och i ditan fö tanen till att unde datainamlingen gång agea å att obalanen mina i tället fö att öa. D.v. e till att det bli en minande illnad x x Dämed minande IMB 34
Ett enelt pecialfall av IMB Speciellt enelt ä fallet då x ä en gupp-veto, d.v.. en om identifiea J ömeidigt utelutande guppe, j = 1,, J t.ex. Utbildning x Äge fatighet x Födeleland W j = gupp j: andel av ticpovet P j P IMB J j1 W = vaandel, gupp j = globala vaandelen j ( P j P) 2 35
Nä X ä en guppveto: IMB J C j1 j dä C W ( P P) j j j 2 Unde datainamlingen gång an vi följa hu vaje gupp bidag C j till den totala obalanen IMB utvecla. 36
x-veto definiead av oade indelninga mellan Utbildning (hög / ej hög), Äge fatighet (ja/nej) och Födeleland (Sveige/ ej Sveige). Education Goup chaacteitic Popety ownehip Odinay fieldwo attempt 100 C j Follow-up attempt Oigin 1 5 12 End 1 4 Final Not high Non-owne Aboad 1.49 1.44 1.26 1.23 1.25 1.16 1.18 Not high Non-owne Sweden 0.00 0.06 0.11 0.11 0.08 0.07 0.07 Not high Owne Aboad 0.06 0.01 0.00 0.00 0.00 0.00 0.00 Not high Owne Sweden 0.72 0.24 0.21 0.19 0.17 0.17 0.18 High Non-owne Aboad 1.28 0.39 0.29 0.26 0.25 0.23 0.22 High Non-owne Sweden 0.11 0.26 0.25 0.24 0.21 0.20 0.23 High Owne Aboad 0.18 0.01 0.03 0.03 0.03 0.02 0.04 High Owne Sweden 0.29 0.58 0.64 0.66 0.62 0.53 0.44 100 IMB / P 2 4.13 2.99 2.78 2.72 2.61 2.37 2.36 ULF2009 C j W j ( P P) j 2 37
Etimationfaen; väentliga begepp Hu påvea attningana av obalanen? Sattningana beo på obeveade y-vädena, inte enbat (om obalanen) på hjälpvaiablena Öveit: De vanliga attningana fö y-totalen Y U y Sattningana om gö i officiell tatiti ä oftat fö totale elle funtione av totale 38
Unbiaed etimation äve antingen (a) FULL epon, elle (b) ända vaannolihete Ingetdea uppfyllt i patien. Hovitz-Thompon etimaton Ŷ FUL d y ulle vaa unbiaed, men gälle inte vid botfall fö y ana fö botfallmängden 39
Om ända vaannolihete voe fallet, å ulle attningen baead på enbat vamängden Yˆ vaa unbiaed. d 1 y θ Men funa inte, fö i patien ä vaannolihetena oända. 40
Näa till hand ligge då att atta de oända vaannolihetena, vilet ulle ge ˆ 1 Y d y ˆθ Denna anat ha tudeat av många, med olia modelle fö att få fam attningana θ Men tot imlig motiveing fö denna anat bli eultatet ändå ofta to bia i Y (Se Eholm & Laaonen 1991) 41
Etimatoe beäningbaa unde botfall Enlat, men ofta to bia: EXPanionetimaton Expandea vaandemedeltalet till populationnivå: Yˆ Nˆ EXP y Nˆ d ; y d y / d 42
Fötå etimatoena EXP ä mycet enel: a uppäning av vaandemedeltalet, bli alltå fel om vaande inte ä epeentativa FUL ä unbiaed (Howitz-Thompon) men hypoteti, fö äve va ifån alla i ticpovet Yˆ Nˆ EXP y Yˆ FUL d y Nˆ y 43
Ett bätte (botfalljuteat) val: Kalibead attning Ŷ CAL dm y Minde bia än expanionetimaton, men bia inte noll. Botfalloigeing ä ett minde ba odval; bia finn alltid va. m = juteingvit, alibead på lämplig hjälpveto x 44
Fö Kalibeingetimaton Ŷ CAL d m y beäna föt alibeingfaton m 1 d x x x ) ( d ) ( adveto x olumn Vitena d m alibeade: dä högeledet ä unbiaed d mx dx 45
Fötå Y CAL CAL ä inteantat, äve met eftetane av de te : an motivea om botfalljuteande vitning ; de om vaat minde ge höge vit, och tväom vitena ä alibeade, de ge en unbiaed attning av det (ända) x-totalvädet. Vitena tämme nä de applicea på hjälpveton an altenativt tola via egeionanpaning av y på veton x; höge fölainggad bö ge minad bia och vaian CAL ä inte baa en attning, utan epeentea mao av attninga, en fö vaje fomuleing av x-veton. Alltå en fåga om val av x-veto. 46
Fötå Y CAL CAL-vitena ä alibeade: Appliceade på hjälpveton beäfta vitena en unbiaed tohet, i högeledet av evationen d m x d x Det ä anledningen till att CAL-vitena educea biaen. Liten övning : Utfö beviet med hjälp av lite matialgeba, utgående fån definitionen m 1 d x x x ) ( d ) ( ad veto x olumn 47
Begeppet (botfalljuteande) vitning - ofta använt innebä att ge objet i de guppe om vaa minde en höge vit i etimationen, och vice vea Ä SCB: officiella ecept fö botfallhanteing. Se debattinlägg i SvD 2015-03-03: ge vaen ifån peone i undeepeenteade guppe en något töe vit än öviga peone va Använd ocå av SCB: onuente (de pivata uveyintituten). Se anda inlägg i DN-debatten nyligen. En del av dem alla det nådning. 48
Kalibead (botfalljuteande) vitning innebä att ge objet viten d m i tället fö baa amplingviten d om ulle äct vid 100% va d = 1 π inluionannoliheten inveteade väde m 1 d x x x ) ( d ) ( adveto x olumn juteingfato Exempel: OSU och x = guppveto: d N m n n m j j 49
Kalibead (botfalljuteande) vitning ge objet viten d m m juteingfato beänad på vald alibeingveto x Med to tillgång till adminitativa egite (om vi ha i Sveige) bli det många tänbaa x-vetoe. Kalibead vitning ä dämed ett mycet flexibelt edap, en mea pofeionell beivning än nådning. 50
Kalibead (botfalljuteande) vitning ge objet viten d m Det bli något av en ont att omponea alibeingveton. Men SCB t.ex. ha god efaenhet. x an vaa guppveto (fulltändigt oade egenape) men ä vanligtvi inte det, t.ex. x (( EducOwne Oigin) Phone Age Civil Gende) dimenion = 14 men 256 egenape 51
Kalibead (botfalljuteande) vitning ge objet viten d m Det ligge i den eiöa tatitipoducenten intee att edovia fö användana vilen x-veton i alibeingen ä, att tala om hu man ommit fam till den, och att i uppepad undeöning bevaa amma x-veto unde ett antal tillfällen (å, månade). 52
Altenativ tolning av Y CAL Vi ha tidigae ivit Y d m y ˆCAL Ett annat ätt att häleda Y CAL, med egeioneonemang: Yˆ Nˆbx CAL dä b ä en oefficientveto fån egeionanpaning Låt o titta på det eonemanget 53
Altenativ tolning av Y CAL Altenativt an etimaton häleda via egeionanpaning av y på veton x; höge fölainggad bö ge minad bia och vaian. Koefficientveto, lineä egeionanpaning på vamängden: b ( 1 d x x ) ( d x y ) Men egeionpediceade y-väden få vi fö alla objet (efteom x änt fö alla); ta edan vitad umma av dea om attning av populationtotalen Y : yˆ xb fö d yˆ d Nˆ Yˆ x b x b CAL 54
Altenativ tolning av Y CAL Kalibeingeonemanget gav Y ˆCAL Yˆ Nˆbx CAL d m y Regeioneonemanget gav: dä b ä egeionoefficientveton. Att de två ä identia olla ni jälva. Vilet eonemang ulle ni använda fö att fölaa fö en användae (inte å tatitit olad)? 55
Fötå Y CAL Vi ha nu ett båda eonemangen utgående fån att x ä änt på ampelnivå, fö alla objet. Nu an vi ju ha (åom ofta i Sveige) att x ä änt ända upp på populationnivå nivå, fö alla objet U. Då ä det baa att anpaa de två eonemangen till detta. Elle att man ha blandad infomation: en del x-vaiable fö, anda fö U. Se vidae i boen av Sändal & Lundtöm (2005). 56
Fötå Y CAL Specialfall av CAL, fö någa enla x-vetoe : x = 1 fö alla. Tivial x-veto; gö ingen åtillnad på elementen Vitigt fall: x ä en guppveto, betående av baa nollo utom en enda etta om via gupptillhöigheten (ömeidigt utelutande och uttömmande guppe) Om J guppe, å ha x peci J möjliga väden Antalet guppe J an vaa tot x (0,0,...,1,...,0,0) 57
Fötå Y CAL Specialfall: x = 1 fö alla m d / d fö alla Vid OSU: m n / m fö alla Y ˆ d m y ( d ) y Y ˆ CAL EXP Kalibea på den tiviala x-veton x = 1 gö (inte oväntat) ingen nytta. 58
Specialfallet x = 0, 0,, 1,, 0, 0 x ä en guppveto, Fötå Y CAL m d / d fö alla gupp j ; m n / m vid OSU j j j j Yˆ J Nˆ y CAL j j1 j Nˆ N n j n j Summa av uppänade guppvaandemedeltal Kalla ibland, lite miviande, pottatifiead attning 59
Fötå Y CAL Specialfallet pefet balan x x m 1/ P fö alla Yˆ CAL Yˆ EXP Pefet balan: Ingen idé jutea den tiviala EXPetimaton ingen effet 60
Sattningana om vi ha att undeöa Yˆ Nˆ EXP y to bia Ŷ CAL d m y minde bia Ŷ FUL d y unbiaed, omöjlig i patien I patien gå YˆFUL inte att beäna. Men i utvädeingyften om vi gö ä y en egitevaiabel (änd fö hela uvalet ) och då an vi beäna alla te. 61
Avviele fån unbiaed etimation: Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) Avviele fö EXP = Juteing av EXP + Avviele fö CAL Evationen an tola: Böja med den (dåliga, tiviala) EXP, jutea den; det ta o till CAL, om jutea bot en del av biaen utan att bli vitt den helt. 62
Avviele fån unbiaed etimation: Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) Avviele fö EXP = Juteing av EXP + Avviele fö CAL Dividea evationen med Nˆ d. 63
Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) få då fomen y y ( x x ) b ( b b ) x b b dä och ä egeionoefficiente, fö vamängden epetive uvalet. Vänteledet ä obalanen i y-vaiabeln, uppdelad i högeledet i två teme y y Vi a titta nämae på den uppdelningen 64
Den gundläggande evationen y y ( x x ) b ( b b ) x Gundläggande genom att den bida till fötåelen av vad om hände med etimaten vid (me elle minde) obalaneade vamängde Gana lätt att fötå : I vänteledet y-medeltalillnaden. Den an vaa to. Två otevliga illnade i högeledet: Sillnaden mellan de två x-medeltalen; betämme IMB Gaden av fel i egeionen, efletead i illnaden mellan egeionvetoena b och b (om vi nu omme till) 65
Regeionoefficiente Vanlig lineä egeion, Fö ticpovet y d d ) ( ) ( 1 x x x b y d d ) ( ) ( 1 x x x b Fö vamängden Välänt i egeionanalyteoin: Sevt uval ge felatig egeionanpaning. Sillnaden an vaa to. 66
Den gundläggande evationen y y ( x x ) b ( b b ) x I datainamlingen an vi påvea föta temen i högeledet men inte den anda. Om vi uppnå en vamängd med liten IMB finn ändå ingen (uppenba) anledning to att b ä näa b å att anda temen ulle bli liten 67
Sammanfattning: Vi ha gundläggande evation i två epnade y y ( x x ) b ( b b ) x Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) Avvielen fö EXP = Botfalljuteing av EXP + Avvielen fö CAL Den unde evationen ä identi med den öve multiplicead med N = d 68
Den gundläggande evationen Nä ni e evationen Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) äge ni ane: Sattningana vaian då, hu omme den in? Sva: Vaian pata vi inte mycet om i denna u. I toa undeöninga ä vaianen liten. Fou ä på bia, det vitigate vid botfall. Avvielena Y EXP Y FUL och Y CAL Y FUL innehålle egentligen både bia och vaian. 69
y y ( x x ) b ( b b ) x Yˆ EXP Yˆ FUL ( Yˆ EXP Yˆ CAL ) ( Yˆ CAL Yˆ FUL ) Att de två uppdelningana uttyce amma a beo på uttycen Yˆ Nˆ y Nˆ bx Yˆ Nˆ y Nˆ bx EXP Yˆ Nˆbx CAL FUL Dea uttyc beo i in tu på villoet (e vidae Sändal&Lundtöm 2005): μ' x 1 70
Låt o titta på någa fall av evationen y y ( x x ) b ( b b ) x Fall 1. ä en lumpmäig delmängd av (aldig ant!) Då ä både ( x x ) b och ( b b ) x noll i medeltal Alltå y y 0 i medeltal Låte ba! Men poblemet ä fötå: ä (patit taget) aldig en lumpmäig delmängd av Vi an i patien inte uppnå Fall 1. 71
y y ( x x ) b ( b b ) x Fall 2. ä inte en lumpmäig delmängd av men vi ha lycat få pefet balan: x x Då ä ( x x ) b Nˆ ( Yˆ Yˆ ) 0 EXP CAL Yˆ EXP Yˆ CAL Om pefet balan, å öveflödigt att botfalljutea EXP Den ä lia ba (elle lia dålig) om CAL Den anda temen i högeledet ä toligen inte noll 72
Hjälpveton valitet En ba (ta) hjälpveto fö CAL-etimaton, mina den botfallbiaen? (i fånvao av peciella inate unde datainamlingen fö att mina obalanen) Fö att vaa få vi titta på temen Yˆ CAL Yˆ FUL Nˆ ( b b ) x dä Nˆ d 73
Vi titta nämae på temen b dä egeionvetoena (y på x) ä fö ticpovet y d d ) ( ) ( 1 x x x b y d d ) ( ) ( 1 x x x b ; fö vamängden ˆ ( ) N b b x ˆ ˆ CAL FUL Y Y 74
Två föhållanden om (va fö ig) ulle ge liten Y CAL -avviele Yˆ CAL Yˆ FUL Nˆ ( b b ) x Målvaiablen y fölaa av x Svaannoliheten fölaa av x Kommenta: Fölaa hö man ofta fol äga nä de pata modelle. Men inget ba od. Fölaa pefet ä det aldig fåga om. 75
Man an via att väntevädet fö temen Yˆ CAL Yˆ FUL Nˆ ( b b ) x ä noll om 1/θ λx En av många MARfomuleinga d.v.. om inveteade vädet av vaannoliheten θ beo lineät an hjälpvetovädet x ; Ett aymptotit eultat e Sändal & Lundtöm(2005) 76
Om vi inte gö peciella inate unde datainamlingen gå det alltå ut på att i etimationfaen hitta en x- b veto å att 1/θ λx ä å näa uppfyllt om möjligt. D.v.. att öa bland de x-vaiable om finn fö att välja ut de om tillamman a utgöa en ba xveto. Metode finn (e t.ex. H3-indiaton i del 1). 77
y y ( x x ) b ( b b ) x En fåga om vi omme till i Del 3 : Om vi lyca ealiea en vamängd med liten IMB, då bli högeledet föta tem liten,. men påvea anda temen åt önvät håll? d.v.. bli minde än om vi inte fööt balanea datainamlingen? 78
SLUT PÅ DEL 2 79