Metoder för att hantera bortfall i en klinisk studie. Methods for handling missingness in a clinical study. Ann Louise Jensen och Rana Abdullah

Storlek: px
Starta visningen från sidan:

Download "Metoder för att hantera bortfall i en klinisk studie. Methods for handling missingness in a clinical study. Ann Louise Jensen och Rana Abdullah"

Transkript

1 Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2015:11 Metoder för att hantera bortfall i en klinisk studie Methods for handling missingness in a clinical study Ann Louise Jensen och Rana Abdullah Självständigt arbete 15 högskolepoäng inom Statistik III, VT2015 Handledare: Daniel Thorburn

2

3 Sammanfattning Med utgångspunkt i en randomiserad prövning av en läkemedelsbehandling för barn som har fötts för tidigt simuleras en population med variabler som anses kunna ha samband med för tidig födsel och barns utveckling. Ur populationen dras 500 urval som det sedan skapas bortfall i med två olika typer av bortfallsmekanismer. Därefter tillämpas två typer av multipel imputering, multivariat normalmodell och fully conditional specification på datamaterialet. Dessutom används medelvärdesimputering samt analys med enbart de kompletta fallen. Skattningar av medelvärden och regressionskoefficienter tas fram. Resultaten visar att det överlag inte blir någon större skillnad i bias för skattningarna metoderna emellan. Däremot finns skillnader vad gäller medelfel och MSE. I många fall ger de båda typerna av multipel imputering lägre medelfel och MSE än när endast de kompletta fallen analyseras. Dessutom testas styrka i att upptäcka behandlingseffekt med tre olika regressionsmodeller. Teststyrkan är hög i samtliga fall, men två av modellerna ger lägre standardavvikelser för multipel imputering och medelvärdesimputering än då endast kompletta fall används. Nyckelord: bortfall, multipel imputering, complete case analysis, fully conditional specification, multivariat normalmodell, simulering. 3

4 Förord Vi vill rikta ett stort tack till vår handledare Daniel Thorburn för hjälp och guidning genom arbetet. Tack också till Frank Miller för introduktion till ämnet. 4

5 Innehållsförteckning 1.Introduktion Inledning Syfte Metod Disposition Bortfall Allmänt om bortfall Bortfallsmönster Bortfallsmekanismer Metoder för Bortfallshantering Kriterier för utvärdering av metoder Äldre metoder Att utesluta inkompletta fall Enkel imputering Multipel imputering Antal imputeringar Imputeringsmodellen Multivariat normalmodell Om avrundning Fully conditional specification METOD OCH MATERIAL Populationen Bortfallsmodell Bortfallsmönster i datasetet Beskrivning av populationen Använda metoder Resultat Skattningar av medelvärden Skattningar av regressionskoefficienter Resultat för teststyrka Diskussion och slutsatser Referenser Bilaga

6 6

7 1 INTRODUKTION 1.1 Inledning Bortfall är ett vanligt förekommande problem vid olika typer av statistiska undersökningar. När saknade data inte hanteras på ett korrekt sätt ökar risken för problem såsom skeva skattningar, minskad statistisk styrka och analyser som inte är tillförlitliga (Schafer och Graham 2002). Ett område där bortfall nästan alltid påträffas är inom medicinska studier, och i värsta fall riskerar det att leda till publicering av felaktiga slutsatser om det ignoreras eller hanteras olämpligt (Fielding, Fayers & Ramsay 2012, Janssen et. al. 2010). I en undersökning av randomiserade studier konstaterades till exempel att 89 procent av de försök som hade publicerats i ledande medicinska tidskrifter under en period om sex månader rapporterade bortfall till någon del. (Wood, White & Thompson 2004). I 13 av 71 försök saknades det resultatdata för mer än 20 procent av patienterna. Användandet av moderna metoder för att hantera bortfall var litet. Ofta har forskare helt enkelt använt sig enbart av de kompletta fallen, vilket också är standard i många statistiska mjukvaruprogram. Andra vanliga tillvägagångssätt inkluderar att ersätta saknade data med medelvärdet för de observerade fallen, eller vid longitudinella studier att istället för det saknade använda sig av det senast observerade värdet (Sterne et. al. 2009). De nämnda metoderna är i många situationer olämpliga, och kan leda till snedvridna resultat och minskad validitet. En modern teknik för bortfallshantering är multipel imputering där rimliga värden fylls i istället för de saknade. Multipel imputering innebär att flera dataset med olika imputerade värden skapas, vilket gör det möjligt att uppskatta imputeringsdelens bidrag till slumpfelet. Den ökade osäkerhet som bortfallet medför bevaras i analysen (Janssen et. al. 2010). År 2007 skedde ungefär hälften av all tillämpning av multipel imputering inom det medicinska området, och det finns exempel på utvärderingar av tekniken inom bland annat epidemiologi, folkhälsa och forskning om livskvalitet (Van Buuren 2007). Vissa forskare menar att samtidigt som metoden har fått tilltagande uppmärksamhet och användning i den medicinska litteraturen, så verkar det fortfarande finnas en hel del omedvetenhet kring den (se t.ex. Fielding, Fayers & Ramsay 2012, Janssen et. al. 2010). 1.2 Syfte Ett syfte med den här uppsatsen kommer att vara att undersöka bortfallets effekter på skattningar vid kliniska studier, samt att jämföra hur väl olika metoder för att hantera saknade data fungerar, med särskild tonvikt på två varianter av multipel imputering. Vidare är syftet att undersöka om styrkan i skattningar av en behandlingseffekt påverkas av val av metod för bortfallshantering. Ytterligare ett syfte är att konstruera en population med realistiska egenskaper och bortfallsmönster. Tanken är att populationen och urval från den kan användas för att studera de undersökta metodernas egenskaper. 1.3 Metod För att uppnå syftet har vi valt att utgå från en kandidatuppsats som skrevs vid Statistiska institutionen hösten 2013, Jämförelse av analysmodeller för effekt av behandling av för tidigt 7

8 födda barn. I uppsatsen beräknades styrka för test av hypotetisk effekt av en läkemedelsbehandling som getts till barn födda innan graviditetsvecka 32 (Sipos & Aydin 2013). Även andra variabler förutom behandlingen som ansågs kunna påverka risken att föda för tidigt eller barns utveckling ingick i undersökningen. För en del av variablerna saknades många värden, vilket innebar att det var svårt att använda dem vid modellanpassning. Av 192 patienter var det endast 82 som inte hade några saknade värden. Anledningen till att vi har valt uppsatsen som utgångspunkt är att den behandlar en klinisk studie med bortfall. De metoder vi tillämpar skulle dock kunna användas även i andra situationer. Eftersom vi inte har haft tillgång till det dataset som användes i Aydin och Sipos uppsats, men däremot en del uppgifter om samband, medelvärden, standardavvikelser m.m. så har vi simulerat fram en population. Förutom de ursprungliga variablerna har ytterligare variabler som anses ha samband med för tidig födsel och barns utveckling lagts till. Därefter har bortfall skapats i populationen med två olika bortfallsmekanismer i syfte att kunna jämföra resultaten mellan dessa. Vi har valt att skapa bortfall för en kategorisk och två kontinuerliga variabler, även här är tanken att kunna göra jämförelser. Två olika metoder för multipel imputering tillämpas. Dessutom görs analyser med hjälp av endast de kompletta fallen, och genom att ersätta saknade värden med medelvärdet för de fall som finns observerade. Som vi har sett ovan har båda dessa tillvägagångssätt varit vanliga inom medicinska undersökningar. Slutligen försöker vi också titta på vilken betydelse det hade kunnat ha i ursprungssituationen (det vill säga i fallet med den tidigare uppsatsen) om någon metod för att hantera bortfall hade använts. Hade det exempelvis varit möjligt att hitta någon mer variabel som var signifikant för att förklara utfallet och att hitta en bättre modell? 1.4 Disposition I kapitel 2 ges en generell genomgång av vad bortfall innebär samt en beskrivning av olika bortfallsmönster och bortfallsmekanismer. Teori kring olika metoder för att hantera saknade värden i en undersökning finns i kapitel 3. I kapitel 4 beskrivs hur populationen har konstruerats och dess egenskaper. Dessutom finns beskrivningar av hur bortfall har skapats i datamaterialet, och vilka metoder som kommer att tillämpas i uppsatsen. Kapitel 5 innehåller en redovisning av resultaten. Slutligen kommer kapitel 6 med diskussion kring resultaten och slutsatser. 8

9 2 BORTFALL 2.1 Allmänt om bortfall Bortfall förekommer i alla slags statistiska undersökningar och kan vara en felkälla som försämrar en undersöknings resultat. Värden för vissa av observationsvariablerna kan saknas av en mängd olika anledningar. I en intervjuundersökning exempelvis kan deltagare avstå från att svara på frågor på grund av att personen inte har förstått frågorna eller inte vill lämna uppgift om sin inkomst (Allison 2002, 1). Vid insamlande av data från administrativa register kan en del av dem ha gått förlorade. Bortfall delas ofta in i totalbortfall och partiellt bortfall (Biemer & Lyberg 2003, 63). Partiellt bortfall kan bero på att en deltagare hoppar över eller bortser från att svara på några frågor i frågeformuläret. Skälet kan vara att de inte vill svara eller har personliga skäl som hindrar dem från att fylla i alla svar i en undersökning. Totalt bortfall, eller objektbortfall, innebär att frågeformuläret inte har besvarats alls eller att respondenten inte deltar i alla moment i undersökningen. Bortfall är ett stort problem i statistiska undersökningar och ju större bortfallet är, desto osäkrare blir skattningen. Därför är det viktigt att försöka minska bortfallet och dessutom att använda metoder som tar hänsyn till det bortfall som ändå uppstår. 2.2 Bortfallsmönster Bortfallsmönstret beskriver vilka värden som är observerade och vilka som saknas i en datamatris (Little & Rubin 2002, 4). Låt YY = (YYiiii) beteckna ett dataset med enbart observerade värden. När det finns saknade data betecknar RR = (RRiiii) en indikatormatris för bortfall. Om det finns bortfall är RRiiii = 0 och när det ej finns bortfall är RRiiii = 1. Matrisen RR definierar då bortfallsmönstret. Några exempel på bortfallsmönster är (Little & Rubin 2002, 4-7): 1. Univariat bortfall innebär att det endast är en variabel som har saknade värden. Denna typ av bortfallsmönster uppstår t.ex. i planerade experiment där målet är att titta på förhållandet mellan en beroende variabel och ett antal faktorer, men där utfallet saknas för vissa fall för en av faktorerna. Figur 2.1: Univariat bortfallsmönster Källa: Schafer & Graham 2002,

10 2. Monotont mönster är i praktiken ovanligt, däremot kan bortfallet i många situationer vara nästan monotont. Ett vanligt exempel på ett monotont bortfallsmönster är när en deltagare hoppar av en longitudinell studie där information om fallen samlas in flera gånger över tid. Det kan exempelvis handla om en klinisk studie där deltagare hoppar av innan den är slutförd och inte återvänder. Metoderna för att hantera monotona bortfallsmönster kan vara lättare att tillämpa än metoderna för generella mönster, och därför kan det ibland vara en idé att försöka organisera data till ett monotont mönster om det är möjligt. Figur 2.2: Monotont bortfallsmönster Källa: Schafer & Graham 2002, Ett generellt, eller slumpmässigt bortfallsmönster betyder att vilka variabler som helst kan saknas för samtliga fall (Schafer & Graham 2002). Figur 2.3: Generellt bortfallsmönster Källa: Schafer & Graham 2002, Bortfallsmekanismer Något annat som har betydelse för hur saknade data bör hanteras är de mekanismer som leder till bortfallet (Little & Rubin 2002, 11). När man undersöker bortfallsmekanismen är det särskilt intressant att titta på om det faktum att observationer saknas beror på värden för variablerna i datasetet. Som ovan låter vi RR= RR iiii vara en indikator för saknad data. När YY är observerad är RR = 1, annars är RR = 0. Låt också YY cccccc vara det kompletta datasetet, YY oooooo de observerade värdena och YY mmmmmm de saknade. Det kompletta datatsetet definieras då som YY cccccc = (YY oooooo, YY mmmmmm ). Bortfallet RR kan ses som en uppsättning slumpvariabler med en gemensam sannolikhetsfördelning (Schafer & Graham 2002). Sannolikhetsfördelningen för RR kan sedan refereras till som sannolikheten för bortfall. Ett vanligt sätt att kategorisera olika typer av sannolikhet för bortfall är med hjälp av bortfallsmekanismerna 10

11 Missing completely at random Missing at random Missing not at random. Missing completely at random (MCAR), kan på svenska benämnas fullständigt slumpmässigt bortfall. Denna typ av bortfall uppstår när fördelningen varken beror på de saknade eller de observerade värdena i datasetet (Schafer & Graham 2002). PP(RR YYYYYYYY) = PP(RR) (2.1) Om vi föreställer oss en undersökning där deltagarna dragits från en population oberoende av varandra, och där observationer för variablerna XX och YY samlas in, så innebär MCAR att sannolikheten för att YY saknas för en deltagare inte beror på dennes värden för XX eller YY. Figur 2.4: Illustration av MCAR, fullständigt slumpmässigt bortfall. I figuren representerar X komplett observerade variabler, Y variabler som delvis har bortfall, Z representerar en komponent som består av orsakerna till bortfallet orelaterat till X och Y, och R är bortfallet. Källa: Schafer & Graham 2002, 152. MCAR är egentligen ett specialfall av bortfallsmekanismen missing at random (MAR). MAR innebär att sannolikheten för bortfallet beror på observerade men inte på saknade data (Little & Rubin 2002, 12). MCAR kan alltså sägas vara en mer restriktiv variant av MAR. Matematiskt kan MAR betecknas som PP(RR YYcccccc) = PP(RR YYoooooo). (2.2) Bortfallsmekanismen MAR kan på svenska benämnas slumpmässigt bortfall. Grafiskt kan den vanligaste situationen när data är MAR representeras som i figuren nedan. Figur 2.5: Illustration av den vanligaste situationen av MAR, slumpmässigt bortfall. I figuren representerar X komplett observerade variabler, Y variabler som delvis har bortfall, Z representerar en komponent som består av orsakerna till bortfallet orelaterat till X och Y, och R är bortfallet. Källa: Schafer & Graham 2002, 152. Den tredje typen av bortfallsmekanismen, missing not at random (MNAR), uppstår när bortfallet beror på saknade data (Schafer & Graham 2002). 11

12 PP(RR ) = PP(RR YYoooooo, YYmmmmmm) (2.3) Den här varianten av bortfallsmekanism är alltså inte slumpmässig utan att anledningen till att en observation för YY saknas beror på själva det saknade värdet. Ett exempel som är aktuellt i vårt fall skulle kunna vara att gravida kvinnor som röker inte vill uppge sin konsumtion av cigaretter, och därför inte besvarar en fråga om detta i en undersökning. Figur 2.6: Illustration av MNAR, icke slumpmässigt bortfall. I figuren representerar X komplett observerade variable, Y variabler som delvis har bortfall, Z representerar en component som består av orsakerna till bortfallet orelaterat till X och Y, och R är bortfallet. Källa: Schafer & Graham 2002, 152. En annan uppdelning av bortfallsmekanismer är i ignorable och nonignorable nonresponse (Allison 2002, 5). När bortfallsmekanismen är ignorable (det vill säga ignorerbar) finns det inget behov av att modellera bortfallsmekanismen som en del i skattningsprocessen. Däremot om bortfallsmekanismen är nonignorable (det vill saga inte kan ignoreras) måste ofta bortfallsmekanismen modelleras för att få bra skattningar av parametrarna av intresse. Bortfallsmekanismen MAR kan sägas vara ignorable och MNAR nonignorable. 12

13 3 METODER FÖR BORTFALLSHANTERING 3.1 Kriterier för utvärdering av metoder Det finns många olika metoder som kan användas för att hantera bortfall, och de kan vara mer eller mindre lämpliga i olika situationer. Målet när metoderna tillämpas är att göra giltiga och effektiva inferenser om den population man är intresserad av, och således inte att återskapa de saknade observationerna eller att få exakt samma resultat som helt komplett data hade medfört (Schafer & Graham 2002). För att utvärdera hur väl metoderna fungerar finns det flera olika aspekter att titta på. Schafer och Graham sammanfattar ett antal kriterier som kan användas (2002). Låt QQ beteckna den parameter som ska skattas, och QQ vara en skattning av QQ baserad på ett urval. När en metod för att hantera bortfall tillämpas är det för det första önskvärt att QQ och QQ ligger nära varandra, det vill säga bias ska vara så liten som möjligt. Den undersökta parametern kan vara exempelvis medelvärde, regressionskoefficient eller korrelation. Enligt Schafer och Graham är en tumregel att bias blir problematisk om dess absolutvärde är större än ungefär hälften av skattningens medelfel. Vid högre värden än så börjar täckningsgraden för 95 procentiga konfidensintervall minska nämnvärt. Det är också önskvärt med liten varians och standardavvikelse för skattningen. Bias och varians kan kombineras till medelkvadratfelet (MSE). MSE motsvarar det genomsnittliga värdet för det kvadrerade avståndet mellan QQ och QQ, och kan beräknas genom att summera bias i kvadrat med variansen. Vidare är det lämpligt med mått på osäkerheten i analysen. Medelfelet (SE) är ett exempel på ett sådant mått, och bör ligga så nära den sanna standardavvikelsen som möjligt. Täckningsgraden visar i hur stor andel av fallen som det sanna värdet ligger inom ett visst konfidensintervall vid upprepade mätningar. När täckningsgraden är korrekt, så är också sannolikheten för typ I-fel korrekt. Med en signifikansnivå som exempelvis är satt till 5 procent, bör ungefär 95 procent av konfidensintervallen inkludera det sanna parametervärdet. Om vi fortsätter använda en konfidensgrad på 5 procent som exempel, så eftersträvas att konfidensintervallen, så länge täckningsgraden är närmare 95 procent, ska vara så snäva som möjligt. Schafer och Graham anser att täckningsgraden är för låg om den faller under 90 procent. Det finns två orsaker till för låg täckningsgrad, bias eller att skattningens sanna spridning är undervärderad. Bias medför att intervallen centreras till höger eller vänster om det sanna värdet, och för lågt värderad spridning ger för smala intervall. (Ibid.) För hög täckningsgrad å andra sidan kan indikera att konfidensintervallen är för breda (Janssen et. al. 2010). Alla dessa mått och kriterier kan alltså användas för utvärdering när en metod för att hantera bortfall tillämpas. Nedan följer en teoretisk genomgång av några av de mest använda metoderna. 13

14 3.2 Äldre metoder Att utesluta inkompletta fall Complete case analysis (CCA) är en metod som har fördelen att den är lätt att förstå och tillämpa. Metoden kallas även listwise deletion och innebär att endast de fall för vilka mätvärden finns för alla variabler av intresse inkluderas i analysen (Graham 2012, 48). Förutom enkelhet är fördelar med CCA att den går att använda vid all slag statistisk analys, och att det inte krävs några särskilda metoder när datoranalys ska göras. (Allison 2002, 6) Om data är MCAR ger CCA giltiga inferenser eftersom de reducerade fallen då är ett slumpmässigt urval av det ursprungliga urvalet. (Ibid. 6-7) Det finns dock nackdelar med CCA som uppstår genom att information går förlorad när de inkompletta fallen tas bort (Little & Rubin 2002, 41). När data inte är MCAR kan den saknade informationen leda till minskad precision och även bias hos de skattade parametrarna eftersom de inkluderade fallen inte säkert representativa för hela urvalet (Graham 2012, 48). Enligt Little och Rubin kan CCA vara en användbar metod på grund av sin enkelhet när förlusten av precision och bias är minimala, vilket är mer troligt när bortfallet inte är så stort. (2002, 41-42). Det finns dock ingen tumregel för hur stort bortfall som är acceptabelt eftersom konsekvenserna av att använda metoden beror på mer än bara andelen bortfall och bortfallsmönstret. I vissa situationer kan det bli så att en väldigt stor del av urvalet uteslutas vid CCA. Molenberghs och Kenward anger som exempel ett dataset med 20 variabler där varje variabel oberoende av de andra har 10 procents sannolikhet att saknas (2007, 43). I en sådan situation blir den förväntade andelen kompletta fall enbart 13 procent, vilket bör medföra en stor påverkan på precision och styrka när analyser genomförs. Schafer och Graham visar i en simuleringsstudie av CCA hur bland annat standardavvikelser, medelvärden och konfidensintervall påverkas när bortfallsmekanismen ändras (2002). I studien skapades ett bortfall på 73 procent, vilket kan tyckas högt, men författarna menar att det inte är ovanligt att se ett så stort bortfall i publicerade studier. Ettusen urval drogs, och parameterskattningarna uppvisade i de flesta fall avsevärd bias när bortfallet var MAR eller MNAR. Dessutom innehöll till exempel konfidensintervallen för det skattade medelvärdet det sanna värdet i enbart 18.8 procent av fallen för MAR, och när data var MNAR var siffran 0 procent Enkel imputering Imputering innebär att de saknade värdena ersätts av nya värden, och därefter genomförs analysen som om datasetet vore komplett (Allison 2002, 11). Vid enkel imputering fylls endast ett värde i istället för det saknade. Ett samlingsnamn för dessa metoder är på engelska single imputation. Vi har valt att översätta detta med enkel imputering i betydelsen att det enbart är ett enskilt värde som ersätter det saknade. Multipel imputering (MI), där bortfallet ersätts med flera värden, diskuteras längre ned. Det finns många olika typer av enkel imputering. Schafer och Graham framhåller flera egenskaper som gör att imputering kan ses som ett bra alternativ för att hantera bortfall (2002). Eftersom inga fall behöver uteslutas minskar inte urvalsstorleken, och därmed inte styrkan i testerna som kan vara fallet när inkompletta fall exkluderas. Det finns också möjlighet att bibehålla en högre grad av precision om observationerna innehåller information som kan användas för att förutse de saknade värdena. Genom imputeringen skapas också ett till synes komplett dataset som sedan kan användas för att göra vanliga statistiska analyser. Ytterligare en fördel är att efter att 14

15 imputeringen har gjorts kan analyser genomföras av flera olika personer eller instanser på samma uppsättning av data, vilket underlättar jämförelser i ett senare skede. (Ibid.) Medelvärdesimputering (MVI) som inte är villkorad (unconditional mean imputation) innebär helt enkelt att de saknade värdena ersätts med medelvärdet för de mätningar som finns registrerade för en viss variabel. Metoden kan fungera för att förutsäga saknad data, men det finns också problem med den. Graham menar att MVI är det sämsta möjliga sättet att hantera saknade data på eftersom variansen reduceras och existerande korrelationer och kovarianser förvrids (2012, 51). Utöver detta är det problematiskt att skatta medelfel. Medelfelet blir mindre än när CCA tillämpas eftersom urvalsstorleken är större när inga fall utesluts, men det reflekterar inte den osäkerhet som finns i datan på grund av bortfallet på ett adekvat sätt (Pigott 2001). Allt detta gäller även om data är MCAR, eftersom värdena som fylls i ligger i fördelningens mitt. Också andra författare såsom Rubin och Little uppger att metoden inte kan rekommenderas (2002, 61-62). Det finns en annan typ av medelvärdesimputering som istället fyller i villkorade medelvärden för bortfallet givet de värden som finns observerade (conditional mean imputation). En variant av metoden är regressionsimputering, som går ut på att dela upp datasetet i två grupper, en där variabeln av intresse (Y) inte har några saknade värden, och en annan där observationer för Y saknas (Graham 2012, 52). Därefter beräknas en regressionsekvation för den första gruppen på sedvanligt vis. yy = ββ 0 + ββ 1XX 1 + ββ 2XX 2 (3.1) Med hjälp av den skattade regressionen kan sedan värden som saknas för Y beräknas. Det som är positivt med denna variant av imputering är att den utnyttjar mycket av den information som finns för att förutse saknade de saknade värdena (Graham 2012, 52). Ju högre korrelationerna är mellan prediktorerna och responsvariabeln, ju bättre fungerar metoden. En nackdel är dock att variansen blir för låg eftersom de imputerade värdena alltid faller precis på regressionslinjen (se figur XX nedan). Metoden överdriver därför sambanden mellan respons och prediktorer, och lämpar sig inte för korrelations- och kovariansanalys (Schafer & Graham 2002). Ett sätt att komma tillrätta med snedvridningen av kovarianser är att istället ersätta saknade värden genom att dra slumpmässiga värden från en villkorad fördelning av troliga utfall (Rubin och Little 2002, 64). På så sätt undviks att imputeringen sker från fördelningens mitt. Ett exempel på denna metod är stokastisk regressionsimputering (även kallad conditional draws på engelska). Ekvationen som används för metoden är som följer: yy iiii = ββ 0 + ββ 1XX 1 + ββ 2XX 2 + zz iiii (3.2) Vi kan se att vi här har lagt till z ik, som är en slumpmässig normalfördelad avvikelseterm som ser till att imputeringen görs från de saknade värdenas villkorade distribution istället för medelvärdet (Rubin & Little 2002, 65). Enligt Schafer och Graham kan det i vissa fall vara svårt att korrekt modellera den villkorade fördelningen (2002). Särskilt med ett slumpmässigt bortfall kan det krävas nästan lika stor arbetsinsats som för att göra multipel imputering. Enklast brukar det enligt författarna vara för univariata bortfallsmönster. Om modellen är korrekt specificerad kan metoden dock ge skattade parametrar som i princip är utan bias om bortfallsmekanismen är MAR (ibid.). Rubin och Little framhåller att imputerade värden som 15

16 dras från en villkorad fördelning generellt kan sägas vara den bästa varianten av enkel imputering, men att metoden medför en förlust av precision (2002, 65, 72). Det finns också ett antal varianter av hot deck-procedurer. I dessa metoder ersätts bortfallet med samma värden som enheter i urvalet med liknande egenskaper har (Rubin & Little 2002, 66). Metoderna är vanliga inom surveyområdet. Alla imputeringsmetoder som beskrivits ovan har ett gemensamt problem, nämligen att det uppstår en systematisk underskattning av medelfelen, p-värdena för statistiska tester blir för små, och konfidensintervallen för snäva (Rubin & Little 2002, 72). Anledningen är att metoderna inte tar hänsyn till att imputering involverar en osäkerhet kring de saknade värdena. I figuren nedan (som har lånats från Schafer & Graham 2002) kan vi på ett enkelt sett se skillnader mellan några av de genomgångna metoderna. Saknade data gällande blodtrycksmätningar har fyllts i med hjälp av medelvärdesimputering, hot deck, regressionsimputering, samt från en villkorad fördelning för Y givet X. Bortfallsmekanismen är MAR. Variablerna är normalfördelade med en korrelation på 0.60, vilket innebär att en plot av datan borde ha en viss lutning och vara formad som ett elliptiskt moln (ibid.). Den enda metoden som uppnår detta någorlunda är imputering från den villkorade fördelningen vilket kan ses i figur XX nedan. Figur 3.1: Illustration av utfall för olika imputeringsmetoder. Källa: Schafer & Graham 2002, 160. Schafer och Graham gör också en simuleringsstudie med olika bortfallsmekanismer liknande den som nämnts ovan och tillämpar metoderna som finns med i figur XX. Resultatet blir bland annat att medelvärdesimputering och hot deck ger snedvridna skattningar för många parametrar, oberoende av bortfallsmekanismen (Schafer och Graham 2002). Regressionsimputering fungerar något bättre, men medför ändå bias för flera parametrar. Vid imputering från villkorad fördelning förekommer bias om bortfallsmekanismen är MNAR. 16

17 När det gäller hur stor andel av konfidensintervallen som innehåller det sanna parametervärdet uppvisar samtliga metoder stora problem oavsett vilken bortfallsmekanism data har. Schafer och Graham menar att det ändå kan finnas situationer när enkel imputering är bättre än att exkludera inkompletta fall, exempelvis om ett dataset med ganska många variabler har ett litet och utspritt bortfall. Ett urval med 25 variabler och tre procents uniformt utspritt bortfall kan till exempel leda till att mer än hälften av fallen utesluts med CC. Om man istället använder imputering från en villkorad fördelning kan hela urvalet användas, med endast en liten inverkan på skattningar och osäkerhetsmått. (Ibid.) 3.3 Multipel imputering Multipel imputering är en metod som till skillnad från enkel imputering inkorporerar osäkerhet i skattningarna av de saknade värdena (se t.ex. Schafer 1999). Idén om multipel imputering introducerades av Donald B. Rubin under 1970-talet och går ut på att varje saknat värde ersätts av två eller fler innan analys (Van Buuren 2012, 26 ). Resultatet blir flera kompletta dataset som ger något olika parameterskattningar varje gång (Allison 2002, 29). Variabiliteten som skapas gör att man tar hänsyn till osäkerheten i skattningarna. Till en början utvecklades förfarandet inom surveyområdet, men det är numera inom många områden accepterat som den generellt bästa metoden för att hantera inkompletta data (Van Buuren 2012, 25-27). Under 1990-talet och början av 2000-talet riktades kritik mot MI. Kritiken gällde bland annat att metoden ansågs underskatta kovarianser systematiskt, samt att Rubins sätt att skatta varians medförde bias. Gällande den sistnämnda kritiken argumenterade Rubin dock att variansskattning endast är ett mellansteg och att den bias som observerades inte verkade påverka täckningsgraden, varför det inte kunde anses utgöra en generell ogiltigförklaring av MI. Enligt Van Buuren skedde en förändring runt 2005, och nuförtiden används MI som måttstock när nya metoder introduceras. Multipel imputering består av tre steg som kort kan sammanfattas som följer (Graham 2012, 57): 1. Saknade data imputeras mm > 1 gånger med troliga värden, vilket genererar mm kompletta dataset. 2. Därefter analyseras alla dataseten med statistiska standardmetoder för att få fram de skattningar som är av intresse. 3. Slutligen kombineras resultaten för de mm dataseten till ett värde för varje parameterskattning som eftersöks. Beskrivningen i punktlistan är en mycket kortfattad beskrivning av proceduren vid MI. Det finns olika typer av MI som påverkar på vilket sätt själva imputeringen sker, vilket beskrivs närmare längre ned. De dataset som skapas med hjälp av multipel imputering kan analyseras med i princip alla metoder som hade kunnat användas på komplett data. Resultaten från de m dataseten kombineras enligt ett antal regler som Rubin (1987, 86-87) etablerade. Tillvägagångssättet finns också beskrivet i bl.a. Schafer och Olsen (1998). Den kombinerade, eller övergripande, skattningen för alla imputeringarna ges av 17

18 QQ = 1 mm QQ mm ii=1 ii. (3.3) Varje QQ ii motsvarar en parameterskattning för ett av de imputerade dataseten, vilket innebär att den övergripande skattningen är genomsnittet av dessa. För att beräkna den totala variansen för parameterskattningen krävs två olika komponenter, variansen inom varje dataset, och variansen mellan dataseten. Den genomsnittliga variansen inom dataseten ges av mm UU = 1 UU mm ii=1 ii, (3.4) där UU ii är variansen för de individuella skattningarna. För att beräkna variansen mellan de imputerade dataseten används BB = 1 mm mm 1 ii=1 (QQ ii QQ) 2, (3.5) vilket motsvarar urvalsvariansen för de individuella skattningarna. Den totala variansen, TT, är slutligen summan av de två varianskomponenterna ovan tillsammans med en korrektionsfaktor som justerar för fel hos BB som uppstår på grund av simulering. Formeln för att beräkna TT är TT = UU BB. (3.6) mm För att få fram medelfelet för QQ tas kvadratroten ur TT. Storleken på variansen mellan dataseten i förhållande till den genomsnittliga variansen inom dataseten är ett mått på hur mycket information som finns i den saknade delen av data i relation till den information som finns i den observerade delen. Konfidensintervall beräknas genom att använda approximationen QQ ± tt dddd TT. (3.7) I formeln tas den kombinerade skattningen plus/minus en kvantil av Students tt-fördelning multiplicerat med det övergripande standardfelet. Frihetsgraderna ges av ekvationen dddd = (mm 1) 1 + mmuu (mm+1)bb 2. (3.8) Enligt Berglund och Heeringa har simuleringsstudier visat att konfidensintervallen som produceras när multipel imputering tillämpas i SAS för stora urval, ger sanna täckningsgrader för populationsvärdet som ligger väldigt nära den konfidensgrad (1 αα) som har valts (2014, 28). Åtminstone gäller detta när bortfallsmekanismen är MAR och modellen rätt specificerad. Utifrån ekvation XX kan vi se att antalet frihetsgrader påverkas både av antal imputeringar och av storleken på BB och UU i förhållande till varandra (Schafer & Olsen 1998). Värden nära det minimala värdet mm 1 fås när BB dominerar över UU. När det är tvärtom kan antalet frihetsgrader närma sig oändligheten. Detta innebär att när antalet frihetsgrader är litet kan större effektivitet i form av mer precisa skattningar och snävare intervall uppnås genom att öka antalet imputeringar. Däremot tyder ett stort antal frihetsgrader på att ett ökat antal imputeringar inte ger någon större vinning. Graham uppger att frihetsgraderna kan anses ge en 18

19 indikation om stabiliteten för parameterskattningarna som skapats genom multipel imputering (2012, 59). Om antalet frihetsgrader är stort i förhållande till mm så är parameterskattningarna stabila och trovärdiga, däremot om frihetsgraderna är få så har skattningarna inte stabiliserats, och fler imputeringar bör göras. Nollhypotesen QQ = 0 kan testas genom att jämföra QQ / TT med tt-fördelningen. Den osäkerhet som medförs av bortfallet återspeglas vid MI i bredden på konfidensintervallen (Van Buuren 2007) Antal imputeringar När det gäller hur många imputeringar som behövs finns det olika uppfattningar. Till en början ansågs ett ganska litet antal vara tillräckligt. Rubin angav till exempel att det räcker med så få som 5 stycken i de flesta fall (1996). Effektiviteten för en skattning baserad på m imputeringar, jämfört med en baserad på ett oändligt antal är (1 + λλ/mm) 1, där λλ är graden av saknad information. Det innebär att vad som är ett lämpligt antal imputeringar beror på hur stor andel av informationen som saknas, men även att en ökning av antalet inte gör så stor skillnad om graden av saknad information inte är ovanligt hög (Schafer 1999, Schafer & Graham 2002). Med saknad information avses här den andel information som har förlorats för en parameteskattning på grund av bortfall (Graham 2012, 59). I enkla situationer är graden av saknad information densamma som graden av saknade data. I fall där det finns variabler som är korrelerade med den variabel som har bortfall så minskar graden av saknad information dock eftersom en del av den återfås genom korrelationerna. Berglund och Heeringa uppger att vid en måttlig grad av saknad information (< 20 procent) så uppnås mer än 96 procents effektivitet med 5-10 upprepningar (2014, 30). Vid en högre grad (30-50 procent) kan 20 eller 30 imputeringar vara lämpliga för att upprätthålla en relativ effektivitet om 95 procent eller mer. Schafer och Graham påpekar att den extra tid och ansträngning som krävs för att hantera 20 upprepningar istället för 10 oftast inte har någon större konsekvens när analysen genomförs (2002). Enligt Allison (2012) så är problemet med tidigare rekommendationer om 3-5 imputeringar att fokus var enbart på effektivitet. Han menar dock att även om krav på effektivitet kan uppnås med få imputeringar, så är ofta så inte fallet när det gäller att ta fram standardfel, konfidensintervall och p-värden. Det kan vara svårt att skatta korrekt varians med så få som 3-10 observationer, vilket riskerar att leda till väldigt instabila medelfel och p-värden. Allison rekommenderar som en tumregel att antalet imputeringar ska vara ungefär lika stort som andelen inkomplett data, det vill säga, om bortfallet är 19 procent är 20 imputeringar lämpligt, om det är 42 procent kan 40 imputeringar vara lämpligt. En svårighet som ett ökat antal imputeringar medför är dock att det tar längre tid att göra datorkörningarna. Graham et. al. undersöker i en simuleringsstudie hur styrkan för att testa effekt påverkades av antalet imputeringar (2007). Resultaten visar att vid en högre andel saknad information (λλ 0.50) så blir förlusten i styrka kännbar. Författarna anser att den förlust av styrka som går att förebygga på detta sätt bör vara mindre än 1 procent. Rekommendationen blir då att för ett sant λ på 0.30 bör mm vara 20, för λ=0.50 ska mm vara 40, samt att mm bör vara 100 om λ är 0.70 eller större. Om en förlust i styrka på 3 procent är acceptabel räcker det med 20 imputeringar om λ är 0.50, och 40 om graden av saknad information är 0.70 eller större. Det är främst för att kunna upptäcka små effekter som det är viktigt med ett större antal imputeringar. 19

20 3.3.2 Imputeringsmodellen En viktig del av processen vid MI är att definiera imputeringsmodellen. En generell regel är att hellre inkludera fler variabler än att riskera att utesluta någon som kan vara av vikt vid analysen. Följande typer av variabler bör tas med i modellen (Berglund & Heeringa, 16): Beroende och oberoende variabler som ska ingå i analysen. Variabler som är korrelerade eller associerade med analysvariablerna. Variabler som förutsäger bortfall för analysvariablerna. Att utesluta analysvariabler kan medföra bias när skattning och inferens ska utföras efter genomförd MI. Genom att ta med variabler som egentligen inte är av intresse för analysen, men som är goda prediktorer för analysvariablerna förbättrar precisionen vid imputeringen. Medtagandet av variabler som förutsäger bortfall kan minska bias sammankopplad med bortfallsmekanismen förutsatt att data är MAR. (Ibid.) Däremot kan inte resultat tillhörande en variabel av intresse snedvridas på grund av att en onödig variabel (som sedan inte inkluderas i analysen) har tagits med vid imputeringen (Schafer & Olsen 1998). Det är därför önskvärt med en bred imputeringsmodell som bevarar en stor mängd av sambanden mellan variablerna. Den kan sedan användas för en stor mängd olika slags analyser efter imputeringen. Enligt Graham (2009) kan inklusion av hjälpvariabler som inte ingår i själva analysmodellen, men som är högt korrelerade med analysvariablerna, även reducera snedvridenhet i skattningarna som beror på en bortfallsmekanism som är MNAR, och till viss del återställa statistisk styrka som har förlorats på grund av bortfall. Genom att använda en mer generell imputeringsmodell så reduceras också risken för att en snävare modell ska användas vid imputeringen än vid analysen när de olika delarna utförs av olika personer, något som ibland framhålls som en risk med MI (Schafer 1999, 2003) Multivariat normalmodell Liksom för enkel imputering finns det flera olika varianter av multipel imputering. Den som har varit mest använd och som Rubin introducerade innebär att slumpmässiga imputeringsvärden dras från en Bayesiansk fördelning för den saknade observationen givet observerade data (Molenberghs & Kenward 2007, ). Inom det Bayesianska perspektivet representeras kännedomen om en parameter av en bakomliggande distribution, som baseras på tidigare kunskaper (Schafer & Graham 2002). Informationen om en parameter summeras med hjälp av en likelihoodfunktion. När urvalsstorleken ökar så minskar influensen av den bakomliggande kunskapen. Enligt Schafer och Graham har denna kännedom om parametern därför oftast inte så stor inverkan vid multipel imputering, eftersom metoden förlitar sig på approximationer för stora urval när det gäller distributionen för komplett data. Det är inte nödvändigt att använda ett Bayesianskt perspektiv vid MI, men det är det vanligast förekommande. Schafer förde i slutet av 1990-talet fram metoder för att imputera kontinuerliga, kategoriska eller mixade variabler med hjälp av joint modeling (JM) (1997). Den mest använda av dessa använder sig av en multivariat normal modell (MVNM), och Schafer utvecklade även ett datorprogram kallat NORM för att tillämpa metoden. Den är numera standardmodell för multipel imputering i SAS om andra inga specifikationer görs. 20

21 JM förutsätter att en gemensam bakomliggande fördelning existerar för samtliga variabler i modellen. I fallet med MVNM är denna fördelning just en multivariat normalfördelning. Om vi som ovan låter QQ beteckna den parameter vi undersöker, så är vi intresserade av att specificera en parametrisk multivariat fördelning PP(YY QQ) för YY givet parametrarna för QQ (Van Buuren et.al, 2006). Låt även YY oooooo = yy 1 oooooo,, yy kk oooooo beteckna den observerade delen av data och YY mmmmmm = yy 1 mmmmmm,, yy kk mmmmmm beteckna den saknade delen. Med hjälp av ett Bayesianskt perspektiv kan imputeringar då genereras genom att slumpmässiga värden dras från den bakomliggande fördelningen eftersom (Schafer, 1999) PP(YY mmmmmm YY oooooo ) = PP(YY mmmmmm YY oooooo, QQ)PP(QQ YY oooooo )dddd. (3.9) Detta görs i två steg. Först dras ett slumpmässigt värde för de okända parametrarna utifrån den bakomliggande informationen för observerade data. QQ ~PP(QQ YY oooooo ) (3.10) Därefter görs ett slumpmässigt drag för de saknade värdena från deras villkorade sannolikhetsfördelning. YY mmmmmm ~PP(YY mmmmmm YY oooooo, QQ ) (3.11) Det första steget kräver ofta att man använder sig av exempelvis en Markov Chain Monte Carlo-metod (MCMC) eftersom data typiskt inte följer någon standardfördelning som är lätt att simulera (Schafer 1999). Det finns olika typer av MCMC, men kortfattat är det en metod som genom iterationer möjliggör simulerade slumpmässiga dragningar från en population, och som så småningom konvergerar till en stabil fördelning (Graham 2012, 57). Informationen som används vid en upprepning kommer från den föregående omgången, vilket gör att skattningar och imputeringar från två på varandra följande steg är mycket mer lika än vad de skulle ha varit vid två oberoende dragningar från populationen. Efter ett visst antal steg så blir dock skillnaden mellan två dataset lika stor som om de vore två oberoende urval. Hur många steg som krävs mellan två imputerade dataset kan variera (ibid.). Antagandet om multivariat normalitet när MVNM tillämpas är egentligen ofta inte särskilt troligt, speciellt när kategoriska variabler är inblandade (Lee & Carlin 2010). Det finns dock studier som tyder på att metoden ofta kan fungera bra även när antagandet om multivariat normalitet inte är uppfyllt och data avviker från imputeringsmodellen (se t.ex. Schafer & Graham 2002; Schafer & Olsen 1998). För variabler med väldigt skeva fördelningar kan logtransformationer göras för att approximera normalitet (Schafer & Olsen 1998). Efter imputering kan variablerna sedan transformeras tillbaka till sin ursprungliga skala. Den största fördelen med MVNM kan sägas vara att det är lätt att specificera imputeringsmodellen, samtidigt som ett orosmoment kan vara det många gånger orealistiska antagandet om multivariat normalitet (Lee & Carlin 2009). Multipel imputering görs ofta under ett antagande om att bortfallsmekanismen kan ignoreras (Van Buuren et.al. 2006). Dock finns det inget i teorin kring MI som säger att det inte kan fungera även när bortfallsmekanismen inte är ignorerbar, så länge som osäkerheten om de saknade värdena reflekteras i imputeringarna (Van Buuren 2007). Enligt Schafer och Graham kan vi ofta förvänta oss avvikelser från MAR, men frågan är om de är tillräckligt stora för att det ska bli problematiskt när metoder som förutsätter MAR tillämpas (2002). 21

22 3.3.4 Om avrundning När det gäller binära kategoriska variabler finns en diskussion gällande huruvida det är acceptabelt eller inte att avrunda dem till närmaste kategori efter att imputering gjorts under ett antagande om normalitet. I lite äldre artiklar och böcker anges att en binär variabel som kan anta värdena 0 eller 1 kan imputeras under multivariat normalitet och sedan avrundas beroende på om det imputerade värdet är mindre eller större än 0,5 (Allison 2002, 40; Schafer & Graham, 2002; Schafer & Olsen 1998). I en artikel från 2009 anger dock Graham att avrundning bör ske i så liten utsträckning som möjligt eftersom det adderar för mycket spridning till de imputerade värdena. Om variabeln ska användas som kovariat i en regressionsanalys så bör de imputerade värdena behållas som de är. Däremot om variabeln måste användas som en binär variabel i en analys så ska den avrundas till närmaste observerade värde. I en studie från 2005 undersöker Allison hur avrundning påverkar resultatet när en dummyvariabel imputeras. Han använder olika sannolikhet för att variabeln ska få utfallet 1 (mellan 0,01 och 0,50), två olika bortfallsmekanismer (MAR och MCAR), och ungefär 50 procents bortfall. I studien studeras både utfall för proportion och regressionskoefficienter efter det att olika metoder för att behandla bortfall har tillämpats. Resultaten visar att alla metoder (CCA, MVNM utan och med avrundning, samt imputering med hjälp av logistisk regression eller en diskriminantmetod) fungerade bra när proportionen var 0,50 och data MCAR. Däremot när proportionen sänktes, och data var MAR, började flera metoder uppvisa problem. För MVNM med avrundning uppstod bias när proportionen var 0,20, och resultaten för punktskattning, täckningsgrad och medelfel började bli riktigt dåliga när den verkliga parameterproportionen var 0,05. När det gäller att skatta regressionskoefficienten fungerar alla metoder förutom den avrundade ungefär lika bra. Enligt Allison fungerar MVNM utan avrundning ganska bra överlag, särskilt för att imputera regressionskoefficienter. Han menar dock att den logistiska eller diskriminantmetoden är att föredra. När undersökningen genomfördes fanns dessa metoder endast tillgängliga för monotona bortfallsmönster, vilket oftast inte är fallet vid regression med många variabler. Numera finns alternativen tillgängliga i SAS även för slumpmässiga bortfallsmönster genom alternativet fully conditional specification (FCS). Berglund och Heeringa rekommenderar i sin bok om multipel imputering i SAS att FCS ska användas för modeller med mixade kovariater, även då den eller de variabler som ska imputeras inte är kategoriska (2014, 83) Fully conditional specification Fully conditional specification (FCS) är ett flexibelt alternativ till MVNM som inte förlitar sig på ett antagande om multivariat normalitet, utan skapar villkorade fördelningar för varje enskild variabel med bortfall (Lee & Carlin 2010). Fördelningarna baseras på alla andra variabler i imputeringsmodellen. Genom att skapa separata villkorade fördelningar PP YY jj YY jj, QQ jj för varje YY jj så definieras den gemensamma fördelningen PP(YY QQ) implicit (Van Buuren et.al., 2006). Fördelningen används sedan för att imputera de saknade värdena, yy jj mmmmmm, givet yy jj. Imputering med FCS är en iterativ process, och vid varje upprepning gås samtliga variabler, YY jj igenom. Antalet iterationer specificeras i koden. I PROC MI i SAS är 10 standard, och målet är att fördelningarna ska konvergera till en stabil gemensam fördelning (Berglund & Heeringa 2014, 25). För varje variabel väljer användaren vilken metod som ska tillämpas vid imputeringen. Exempelvis kan linjär regression användas för kontinuerliga variabler, och för binära variabler logistisk regression. Enligt Van Buuren kan bra resultat ofta 22

23 uppnås med ett litet antal iterationer, även om det alltid är fördelaktigt att lägga till några extra upprepningar (2007). En klar fördel med FCS kan sägas vara just detta, att det är möjligt att skapa mer flexibla multivariata modeller. Om behov finns går det att använda modeller som inte tillhör någon av standardfördelningarna (Van Buuren et.al. 2006). Dessutom är det lätt att inkorporera metoder som bevarar unika särdrag eller interaktioner i datan eller förhållanden mellan olika variabler. Van Buuren et.al. menar också att det kan vara lättare att tillämpa metoden på modeller med bortfallsmekanismer som inte är ignorerbara. Nackdelar som brukar lyftas fram med FCS är bland annat att det krävs mer arbete vid modellskapande eftersom varje fördelning i imputeringsmodellen måste specificeras separat. När antalet variabler är litet behöver detta inte medföra särskilt stora problem, men i stora dataset med många variabler blir det svårare (Lee & Carlin 2009). Dessutom tar ofta själva arbetet vid dator när analyserna ska genomföras mer tid än vid JM (Van Buuren et.al. 2006). Vid användande av FCS finns också en risk att de olika villkorade fördelningarna är inkompatibla, vilket kan medföra osäkra imputeringar. Enligt Lee och Carlin är det dock inte klarlagt hur ofta detta kan leda till problem i praktiken (2009). Det finns en del bevis för att FCS fungerar även när det finns problem med inkompatibilitet (Van Buuren 2007). Slutligen finns det fortfarande vissa frågetecken gällande den bakomliggande teorin och kvaliteten på imputeringarna som FCS resulterar i (Berglund och Heeringa 2014, 25; Van Buuren et.al. 2006). I många situationer verkar dock FCS fungera bra, konvergera till stabila gemensamma fördelningar, och vara lätt att tillämpa. Både Van Buuren och Berglund och Heeringa rekommenderar användande av FCS när en blandning av kontinuerliga och diskreta variabler behöver imputeras, och den gemensamma fördelningen inte lätt kan specificeras (Berglund & Heeringa 2014, 83; Van Buuren 2007). Vid genomgång av litteraturen om multipel imputering har vi inte sett särskilt många studier där FCS och MVNM tillämpas på samma datamaterial. Van Buuren jämför de båda metoderna i en undersökning där kategoriska variabler imputeras och parametrar sedan skattas i olika linjära regressionsmodeller (2007). Resultaten visar på mindre bias överlag när FCS tillämpas, men i studien avrundas de imputerade värdena för MVNM, en metod som vi har sett är ifrågasatt ovan. Lee och Carlin jämför de båda metoderna med CCA i en simuleringsstudie där tre olika bortfallsmekanismer tillämpas i en studie typisk för epidemiologisk forskning (2009). Författarna var särskilt intresserade av att undersöka om MVNM, som förlitar sig på ett orealistiskt antagande om multivariat normalitet, fungerade sämre än den mer flexibla FCS. Resultaten visar att både FCS och MVNM generellt ger mindre snedvridna resultat än CCA, och dessutom liknande resultat även med binära variabler på ordinalskalenivå som uppenbart inte var normalfördelade. Det fanns inget som tydde på att MVNM gav sämre resultat, och dessutom medförde metoden något bättre täckningsgrader än FCS. Enligt Lee och Carlin har tidigare jämförelser mellan metoderna uppvisat mixade resultat, och mer forskning, både med verkliga data där bortfallsmodellen är okänd, och med simuleringsmodeller, skulle behövas (ibid.) 23

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Punktskattning och kondensintervall Innehåll 1 Punktskattning och kondensintervall Population Punktskattning och kondensintervall Vi har en population vars någon mätbar egenskap X vi är intresserade

Läs mer

Vi skall skriva uppsats

Vi skall skriva uppsats Vi skall skriva uppsats E n vacker dag får du höra att du skall skriva uppsats. I den här texten får du veta vad en uppsats är, vad den skall innehålla och hur den bör se ut. En uppsats är en text som

Läs mer

Föreläsning 14: Försöksplanering

Föreläsning 14: Försöksplanering Föreläsning 14: Försöksplanering Matematisk statistik Chalmers University of Technology Oktober 14, 2015 Modellbeskrivning Vi har gjort mätningar av en responsvariabel Y för fixerade värden på förklarande

Läs mer

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem Problem 1 (6p) En undersökning utfördes med målet att besvara frågan Hur stor andel av den vuxna befolkningen i Sverige äger ett skjutvapen?.

Läs mer

Manpower Work Life: 2014:1. Manpower Work Life. Rapport 2014. Mångfald på jobbet

Manpower Work Life: 2014:1. Manpower Work Life. Rapport 2014. Mångfald på jobbet Manpower Work Life: 2014:1 Manpower Work Life Rapport 2014 Mångfald på jobbet MÅNGFALD PÅ JOBBET Mångfald diskuteras ständigt i media, men hur ser det egentligen ut på Sveriges arbetsplatser? Hur ser svenska

Läs mer

Lathund, procent med bråk, åk 8

Lathund, procent med bråk, åk 8 Lathund, procent med bråk, åk 8 Procent betyder hundradel, men man kan också säga en av hundra. Ni ska kunna omvandla mellan bråkform, decimalform och procentform. Nedan kan ni se några omvandlingar. Bråkform

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 2012-01-09 kl 08-13

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 2012-01-09 kl 08-13 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 212-1-9 kl 8-13 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är

Läs mer

Särskilt stöd i grundskolan

Särskilt stöd i grundskolan Enheten för utbildningsstatistik 15-1-8 1 (1) Särskilt stöd i grundskolan I den här promemorian beskrivs Skolverkets statistik om särskilt stöd i grundskolan läsåret 1/15. Sedan hösten 1 publicerar Skolverket

Läs mer

Strukturen i en naturvetenskaplig rapport

Strukturen i en naturvetenskaplig rapport Strukturen i en naturvetenskaplig rapport I detta dokument beskrivs delarna i en rapport av naturvetenskaplig karaktär. På skolor, universitet och högskolor kan den naturvetenskapliga rapportens rubriker

Läs mer

Kvalster. Korrelation och regression: lineära modeller för bivariata samband. Spridningsdiagram. Bivariata samband

Kvalster. Korrelation och regression: lineära modeller för bivariata samband. Spridningsdiagram. Bivariata samband Kvalster och regression: lineära modeller för bivariata samband Matematik och statistik för biologer, 10 hp En viss sorts kvalster (Demodex folliculorum) trivs bra i människors hårsäckar. Enligt en studie

Läs mer

Individuellt Mjukvaruutvecklingsprojekt

Individuellt Mjukvaruutvecklingsprojekt Individuellt Mjukvaruutvecklingsprojekt RPG-spel med JavaScript Författare Robin Bertram Datum 2013 06 10 1 Abstrakt Den här rapporten är en post mortem -rapport som handlar om utvecklandet av ett RPG-spel

Läs mer

Föreläsning 9: Hypotesprövning

Föreläsning 9: Hypotesprövning Föreläsning 9: Hypotesprövning Matematisk statistik David Bolin Chalmers University of Technology Maj 5, 2014 Statistik Stickprov Ett stickprov av storlek n är n oberoende observationer av en slumpvariabel

Läs mer

Nedlagd studietid och olika kurskarakterisika en anspråkslös analys baserad på kursvärderingsdata. Fan Yang Wallentin

Nedlagd studietid och olika kurskarakterisika en anspråkslös analys baserad på kursvärderingsdata. Fan Yang Wallentin Nedlagd studietid och olika kurskarakterisika en anspråkslös analys baserad på kursvärderingsdata. Fan Yang Wallentin Inledning I denna miniundersökning analyseras hur studietiden är relaterad till attityder

Läs mer

Vetenskapliga begrepp. Studieobjekt, metod, resultat, bidrag

Vetenskapliga begrepp. Studieobjekt, metod, resultat, bidrag Vetenskapliga begrepp Studieobjekt, metod, resultat, bidrag Studieobjekt Det man väljer att studera i sin forskning Nära sammankopplat med syftet Kan vara (fysiska) ting och objekt: Datorspel, Affärssystem,

Läs mer

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska) Datorövning 2 Statistik med Excel (Office 2007, svenska) Denna datorövning fokuserar på att upptäcka samband mellan två variabler. Det görs genom att rita spridningsdiagram och beräkna korrelationskoefficienter

Läs mer

Friskoleurval med segregation som resultat

Friskoleurval med segregation som resultat Friskoleurval med segregation som resultat Rapport februari 2016 Sammanfattning och slutsatser Denna undersökning har tagits fram som en del av projektet Ge alla elever samma chans som är ett samarbete

Läs mer

Riktlinjer - Rekryteringsprocesser inom Föreningen Ekonomerna skall vara genomtänkta och välplanerade i syfte att säkerhetsställa professionalism.

Riktlinjer - Rekryteringsprocesser inom Föreningen Ekonomerna skall vara genomtänkta och välplanerade i syfte att säkerhetsställa professionalism. REKRYTERINGSPOLICY Upprättad 2016-06-27 Bakgrund och Syfte Föreningen Ekonomernas verksamhet bygger på ideellt engagemang och innehar flertalet projekt där såväl projektledare som projektgrupp tillsätts

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare

Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare I boken får vi följa hur barn tillsammans med sina lärare gör spännande matematikupptäckter - i rutinsituationer - i leken

Läs mer

Hur utvecklar man användbara system? Utvärdering. Användbarhet handlar om kvalitet. Utvärdering. Empiriska mätningar. Metoder

Hur utvecklar man användbara system? Utvärdering. Användbarhet handlar om kvalitet. Utvärdering. Empiriska mätningar. Metoder Hur utvecklar man användbara system? Utvärdering Lära sig organisationen Förstå användarens situation Förstå användarens språk Involvera användare i processen Utvärdera, testa och vara LYHÖRD! Användbarhet

Läs mer

Sammanfatta era aktiviteter och effekten av dem i rutorna under punkt 1 på arbetsbladet.

Sammanfatta era aktiviteter och effekten av dem i rutorna under punkt 1 på arbetsbladet. Guide till arbetsblad för utvecklingsarbete Arbetsbladet är ett verktyg för dig och dina medarbetare/kollegor när ni analyserar resultatet från medarbetarundersökningen. Längst bak finns en bilaga med

Läs mer

Systematiskt kvalitetsarbete

Systematiskt kvalitetsarbete Systematiskt kvalitetsarbete Rapport År: 2016 Organisationsenhet: NYEFSK/FSK Nye Förskola Fokusområde: Demokrati och värdegrund Övergripande mål: Normer och värden Deluppgift: Klassens kvalitetsrapport

Läs mer

Resultat från nationella prov i årskurs 3, vårterminen 2014

Resultat från nationella prov i årskurs 3, vårterminen 2014 Enheten för utbildningsstatistik 2014-10-21 1 (8) Resultat från nationella prov i årskurs 3, vårterminen 2014 Syftet med de nationella proven är i huvudsak att dels stödja en likvärdig och rättvis bedömning

Läs mer

Nationella prov i årskurs 3 våren 2013

Nationella prov i årskurs 3 våren 2013 Utbildningsstatistik 1 (8) Nationella prov i årskurs 3 våren 2013 Syftet med de nationella proven är i huvudsak att dels stödja en likvärdig och rättvis bedömning och betygsättning i de årskurser där betyg

Läs mer

912 Läsförståelse och matematik behöver man lära sig läsa matematik?

912 Läsförståelse och matematik behöver man lära sig läsa matematik? 912 Läsförståelse och matematik behöver man lära sig läsa matematik? Med utgångspunkt från min egen forskning kring läsförståelse av matematiska texter kommer jag att diskutera olika aspekter av läsning

Läs mer

Skriva B gammalt nationellt prov

Skriva B gammalt nationellt prov Skriva B gammalt nationellt prov Skriva B.wma Då fortsätter vi skrivträningen. Detta avsnitt handlar om att anpassa sin text till en särskild situation, en speciell texttyp och särskilda läsare. Nu ska

Läs mer

Systematiskt kvalitetsarbete

Systematiskt kvalitetsarbete Systematiskt kvalitetsarbete Rapport Läsår: 2015/2016 Organisationsenhet: STENSFSK/FSK Stensåkra Förskola Fokusområde: Samverkan Cecilia Stenemo, Barn- och utbildningsförvaltningen, Stensåkra förskola,

Läs mer

Tränarguide del 1. Mattelek. www.mv-nordic.se

Tränarguide del 1. Mattelek. www.mv-nordic.se Tränarguide del 1 Mattelek www.mv-nordic.se 1 ATT TRÄNA MED MATTELEK Mattelek är ett adaptivt träningsprogram för att träna centrala matematiska färdigheter såsom antalsuppfattning, den inre mentala tallinjen

Läs mer

Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola.

Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola. 111a Geometri med snöre Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola. Areabegreppet När elever får frågan vad area betyder ges mestadels svar som antyder hur man

Läs mer

Invandrarföretagare om att starta, driva och expandera företagande i Sverige

Invandrarföretagare om att starta, driva och expandera företagande i Sverige Invandrarföretagare om att starta, driva och expandera företagande i Sverige 29 november 2001 Arne Modig T22502 Invandrarföretagare om att starta, driva och expandera företag i Sverige Svenskt Näringsliv

Läs mer

Får nyanlända samma chans i den svenska skolan?

Får nyanlända samma chans i den svenska skolan? Får nyanlända samma chans i den svenska skolan? Sammanställning oktober 2015 De nyanlända eleverna (varit här högst fyra år) klarar den svenska skolan sämre än andra elever. Ett tydligt tecken är att för

Läs mer

Uppgift 2 0 0.10 1 0.25 2 0.40 3 0.20 4 0.05

Uppgift 2 0 0.10 1 0.25 2 0.40 3 0.20 4 0.05 Uppgift 1 En grönsaksgrossist har utvecklat ett test för att kontrollera kvaliteten hos tomater. Efter att ha inspekterat ett urval från ett parti tomater, accepteras eller förkastas partiet. Med detta

Läs mer

Kapitel 6. f(x) = sin x. Figur 6.1: Funktionen sin x. 1 Oinas-Kukkonen m.fl. Kurs 6 kapitel 1

Kapitel 6. f(x) = sin x. Figur 6.1: Funktionen sin x. 1 Oinas-Kukkonen m.fl. Kurs 6 kapitel 1 Kapitel 6 Gränsvärde 6. Definition av gränsvärde När vi undersöker gränsvärdet av en funktion undersöker vi vad som händer med funktionsvärdet då variabeln, x, går mot ett visst värde. Frågeställningen

Läs mer

Kohortfruktsamhetens utveckling Första barnet

Kohortfruktsamhetens utveckling Första barnet 14 Kohortfruktsamhetens utveckling Första barnet Det har skett stora förändringar, särskilt i 25-åringarnas förstabarnsfruktsamhet. För kvinnor och män födda från mitten av 19-talet till början av 19-talet

Läs mer

Trygg på arbetsmarknaden?

Trygg på arbetsmarknaden? Trygg på arbetsmarknaden? En jämförelse av svenska och danska ungdomars syn på arbetsmarknaden och framtiden Stefan Persson September 2009 Rapport framtagen av: RHETIKFABRIKEN Stefan Persson Verksamhetsansvarig

Läs mer

Så kan du arbeta med medarbetarenkäten. Guide för chefer i Göteborgs Stad

Så kan du arbeta med medarbetarenkäten. Guide för chefer i Göteborgs Stad Så kan du arbeta med medarbetarenkäten Guide för chefer i Göteborgs Stad Till dig som är chef i Göteborgs Stad Medarbetarenkäten är ett redskap för dig som chef. Resultaten levererar förstås inte hela

Läs mer

Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument

Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument Distributiva lagen a(b + c) = ab + ac 3(x + 4) = 3 x + 3 4 = 3x + 12 3(2x + 4) = 3 2x + 3 4 = 6x + 12

Läs mer

Energi & Miljötema Inrikting So - Kravmärkt

Energi & Miljötema Inrikting So - Kravmärkt Energi & Miljötema Inrikting So - Kravmärkt 21/5 2010 Sofie Roxå 9b Handledare Torgny Roxå Mentor Fredrik Alven 1 Innehållsförteckning Inledning s. 3 Bakgrund s. 3 Syfte s. 3 Hypotes s. 3 Metod s. 4 Resultat

Läs mer

Sammanfattning på lättläst svenska

Sammanfattning på lättläst svenska Sammanfattning på lättläst svenska Utredningen skulle utreda och lämna förslag i vissa frågor som handlar om svenskt medborgarskap. Svenskt medborgarskap i dag Vissa personer blir svenska medborgare när

Läs mer

Enkät om heltid i kommuner och landsting 2015

Enkät om heltid i kommuner och landsting 2015 Enkät om heltid i kommuner och landsting 2015 Enkät om heltid i kommuner och landsting 2015 1 Enkät om heltid i kommuner och landsting 2015 2 Innehåll Heltidsarbetet ökar... 5 Varför ska fler jobba heltid?...

Läs mer

Boll-lek om normer. Nyckelord: likabehandling, hbt, normer/stereotyper, skolmiljö. Innehåll

Boll-lek om normer. Nyckelord: likabehandling, hbt, normer/stereotyper, skolmiljö. Innehåll 1 Boll-lek om normer Nyckelord: likabehandling, hbt, normer/stereotyper, skolmiljö Innehåll Materialet bygger på en övning där eleverna, genom en lek med bollar, får utmana sin förmåga att kommunicera

Läs mer

Varför är det så viktigt hur vi bedömer?! Christian Lundahl!

Varför är det så viktigt hur vi bedömer?! Christian Lundahl! Varför är det så viktigt hur vi bedömer?! Christian Lundahl! Fyra olika aspekter! Rättvisa! Reflektion och utvärdering av vår egen undervisning! Motivation för lärande! Metalärande (kunskapssyn)! 1. Rättvisa!

Läs mer

a n = A2 n + B4 n. { 2 = A + B 6 = 2A + 4B, S(5, 2) = S(4, 1) + 2S(4, 2) = 1 + 2(S(3, 1) + 2S(3, 2)) = 3 + 4(S(2, 1) + 2S(2, 2)) = 7 + 8 = 15.

a n = A2 n + B4 n. { 2 = A + B 6 = 2A + 4B, S(5, 2) = S(4, 1) + 2S(4, 2) = 1 + 2(S(3, 1) + 2S(3, 2)) = 3 + 4(S(2, 1) + 2S(2, 2)) = 7 + 8 = 15. 1 Matematiska Institutionen KTH Lösningar till tentamensskrivning på kursen Diskret Matematik, moment A, för D och F, SF161 och SF160, den juni 008 kl 08.00-1.00. DEL I 1. (p) Lös rekursionsekvationen

Läs mer

Ekvationssystem, Matriser och Eliminationsmetoden

Ekvationssystem, Matriser och Eliminationsmetoden Matematiska institutionen Göteborgs universitet och Chalmers tekniska högskola Version 359 Ekvationssystem, Matriser och Eliminationsmetoden - En inledning Ekvationssystem - matrisformulering Vi såg att

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F12: Tillförlitlighet och säkerhetsindex Cornell Styrka Säkerhetsindex Ett säkerhetsindex, b: Är ett mått på ett systems tillförlitlighet. Är ett grövre mått än felsannolikheten P f. Används när P f inte

Läs mer

Mot ett mer jämställt arbetsliv och privatliv?

Mot ett mer jämställt arbetsliv och privatliv? Manpower Work Life Rapport 2015 Manpower Work Life Rapport 2015 Vad tror svenskarna kommer att definiera framtidens arbete och liv? Hur kommer arbetslivet och privatlivet förändras de kommande 15 åren?

Läs mer

parametriska test Mätning Ordinalskala: Nominalskala:

parametriska test Mätning Ordinalskala: Nominalskala: Icke- parametriska test Icke- parametriska test En avgörande skillnad mellan icke-parametriska och s.k. parametriska test, som t.ex. t-test, är att de icke-parametriska testen kräver färre antaganden Icke-parametriska

Läs mer

Träning i bevisföring

Träning i bevisföring KTHs Matematiska Cirkel Träning i bevisföring Andreas Enblom Institutionen för matematik, 2005 Finansierat av Marianne och Marcus Wallenbergs Stiftelse 1 Mängdlära Här kommer fyra tips på hur man visar

Läs mer

Resultat av enkät till assistansberättigade

Resultat av enkät till assistansberättigade Bilaga 6 Resultat av enkät till assistansberättigade Resultaten i tabellerna i denna bilaga baseras på resultaten från den enkätundersökning Assistanskommittén låtit Statistiska Centralbyrån göra. Frågorna

Läs mer

EN BÄTTRE KREDITAFFÄR

EN BÄTTRE KREDITAFFÄR 3 tre SMARTA RÅD FÖR EN BÄTTRE KREDITAFFÄR UC Affärsoptimering Kreditscoringmodeller Tre metoder för att genomföra bra avslagsanalyser i kreditportföljen Det är idag vanligt att kreditgivare bygger kreditscoringmodeller

Läs mer

Ledamöternas erfarenheter från funktionshinderråden i Stockholms stad en enkätundersökning från mandatperioden 2011-2014

Ledamöternas erfarenheter från funktionshinderråden i Stockholms stad en enkätundersökning från mandatperioden 2011-2014 Ledamöternas erfarenheter från funktionshinderråden i Stockholms stad en enkätundersökning från mandatperioden 2011-2014 HSO Stockholms stad Innehåll Inledning Syfte... 3 Sammanfattande punkter från resultatet.

Läs mer

Lastbilsförares bältesanvändning. - en undersökning genomförd av NTF Väst Sammanställd mars 2013

Lastbilsförares bältesanvändning. - en undersökning genomförd av NTF Väst Sammanställd mars 2013 Lastbilsförares bältesanvändning - en undersökning genomförd av NTF Väst Sammanställd mars 2013 Innehåll Bakgrund och syfte... 3 Metod... 3 Resultat av intervjuer med lastbilsförare... 4 Resultat av bältesobservationer...

Läs mer

En stärkt yrkeshögskola ett lyft för kunskap (Ds 2015:41)

En stärkt yrkeshögskola ett lyft för kunskap (Ds 2015:41) REMISSVAR 1 (5) ERT ER BETECKNING 2015-08-17 U2015/04091/GV Regeringskansliet Utbildningsdepartementet 103 33 Stockholm En stärkt yrkeshögskola ett lyft för kunskap (Ds 2015:41) I promemorian presenterar

Läs mer

Ersättningsperiod vid anmälan om höjd inkomst och beslut om sjukpenninggrundande inkomst (SGI) för förfluten tid

Ersättningsperiod vid anmälan om höjd inkomst och beslut om sjukpenninggrundande inkomst (SGI) för förfluten tid Ersättningsperiod vid anmälan om höjd inkomst och beslut om sjukpenninggrundande inkomst (SGI) för förfluten tid Försäkringskassans ställningstagande 1. När en ersättningsperiod påbörjas En ersättningsperiod

Läs mer

Utveckla arbetsmiljö och verksamhet genom samverkan

Utveckla arbetsmiljö och verksamhet genom samverkan DEL 1: Utveckla arbetsmiljö och verksamhet genom samverkan Modulen inleds med det övergripande målet för modul 6 och en innehållsförteckning över utbildningens olika delar. Börja med att sätta ramarna

Läs mer

De två första korten Tidig position

De två första korten Tidig position De två första korten Tidig position Hold em är ett positionsspel, och förmodligen mer än någon annan form av poker. Det beror på att knappen anger spelarnas turordning under satsningsrundorna. (Enda undantaget

Läs mer

Frågor och svar för föreningar om nya ansökningsregler för aktivitetsbidrag från och med 1 januari 2017

Frågor och svar för föreningar om nya ansökningsregler för aktivitetsbidrag från och med 1 januari 2017 Frågor och svar för föreningar om nya ansökningsregler för aktivitetsbidrag från och med 1 januari 2017 Innehåll Generella frågor... 2 Vad är det som ändras 1 januari 2017?... 2 Vad behöver min förening

Läs mer

DEMOKRATI 3 DEMOKRATINS VILLKOR

DEMOKRATI 3 DEMOKRATINS VILLKOR SIDA 1/8 WORKSHOP I KLASSRUMMET TEMA: DEMOKRATI LÄRARMANUAL I det här dokumentet finns allt du behöver veta för att hålla workshopen. Här ser du också tydligt i vilka moment du använder det arbets- och

Läs mer

Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014

Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014 Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014 Antal elever: 18 Antal svarande: 13 Svarsfrekvens: 72% Klasser: År 2 Skolenkäten Skolenkäten går ut en gång per termin

Läs mer

Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014. Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13

Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014. Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13 Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014 Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13 Skolenkäten Skolenkäten går ut en gång per termin till de skolor

Läs mer

TT091A, TVJ22A, NVJA02 By, Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 By, Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 By, Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-01-11

Läs mer

Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11

Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11 Utbildningsstatistik 2011-12-08 1 (20) Dnr Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11 Skolverket publicerar i SIRIS, Skolverkets internetbaserade resultat-

Läs mer

Anpassning av sjukpenninggrundande inkomst (SGI) efter löneutvecklingen inom yrkesområdet för arbetslösa

Anpassning av sjukpenninggrundande inkomst (SGI) efter löneutvecklingen inom yrkesområdet för arbetslösa Med anledning av socialförsäkringsbalkens införande den 1 januari 2011 har redaktionella ändringar i form av bl.a. nya laghänvisningar beslutats i detta rättsliga ställningstagande (dnr 034638-2010). Anpassning

Läs mer

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Stella Nova förskola

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Stella Nova förskola Sundbybergs stad Skolundersökning 2 Föräldrar förskola Stella Nova förskola Antal svar Stella Nova förskola: 2 ( %) Antal svar samtliga fristående förskolor: (5 %) 1 Innehåll Om undersökningen Förklaring

Läs mer

Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014

Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014 Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014 Antal elever: 47 Antal svarande: 40 Svarsfrekvens: 85% Klasser: 12BAa, 12BAb, 12LL Skolenkäten Skolenkäten går ut en gång per

Läs mer

Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser.

Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser. Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser. Du berättar på ett enkelt sätt om det du tycker är viktigt i texten.

Läs mer

Grundläggande biostatistik. Jenny Selander jenny.selander@ki.se 524 800 29

Grundläggande biostatistik. Jenny Selander jenny.selander@ki.se 524 800 29 Grundläggande biostatistik Jenny Selander jenny.selander@ki.se 524 800 29 Jenny Selander, Kvant. metoder, FHV T1 december 20111 Dagens föreläsning Beskrivande statistik kap 1 Samplingsfördelning kap 3

Läs mer

Statsbidrag för läxhjälp till huvudmän 2016

Statsbidrag för läxhjälp till huvudmän 2016 Statsbidragsenheten 1 (5) Statsbidrag för läxhjälp till huvudmän 2016 Skolverket lämnar statsbidrag enligt förordning (2014:144) om statsbidrag för hjälp med läxor eller annat skolarbete utanför ordinarie

Läs mer

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Fristående förskolor totalt 2015. Antal svar samtliga fristående förskolor: 360 (57 %)

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Fristående förskolor totalt 2015. Antal svar samtliga fristående förskolor: 360 (57 %) Sundbybergs stad Skolundersökning Föräldrar förskola Antal svar samtliga fristående förskolor: ( %) Innehåll Om undersökningen Förklaring av diagram Resultat - Per fråga - NöjdKundIndex (NKI) Frågorna

Läs mer

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla

Läs mer

Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012. Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9

Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012. Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9 Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012 Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9 Skolenkäten Skolenkäten går ut en gång per termin till

Läs mer

BRUKARUNDERSÖKNING EKONOMISKT BISTÅND IFO 2015 SOCIALFÖRVALTNINGEN 2016-01-15

BRUKARUNDERSÖKNING EKONOMISKT BISTÅND IFO 2015 SOCIALFÖRVALTNINGEN 2016-01-15 BRUKARUNDERSÖKNING EKONOMISKT BISTÅND IFO 2015 SOCIALFÖRVALTNINGEN 2016-01-15 INNEHÅLLSFÖRTECKNING 1 INLEDNING... 3 2 AVGRÄNSNINGAR & GENOMFÖRANDE... 3 3 RESULTAT... 3 3.1 AVSER BESÖKET ETT NYBESÖK...4

Läs mer

När jag har arbetat klart med det här området ska jag:

När jag har arbetat klart med det här området ska jag: Kraft och rörelse När jag har arbetat klart med det här området ska jag: kunna ge exempel på olika krafter och kunna använda mina kunskaper om dessa när jag förklarar olika fysikaliska fenomen, veta vad

Läs mer

Frågor och svar TLV:s beslut att begränsa subventionen för Cymbalta

Frågor och svar TLV:s beslut att begränsa subventionen för Cymbalta 1 (5) Tandvårds- och läkemedelsförmånsverket 100421 Frågor och svar TLV:s beslut att begränsa subventionen för Cymbalta 1. Mot vilken sjukdom används läkemedlet Cymbalta? Läkemedelsverket har godkänt det

Läs mer

Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång.

Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång. Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång. Denna gång skall vi titta närmare på en förstärkare med balanserad ingång och obalanserad utgång. Normalt använder

Läs mer

POST & TELESTYRELSEN Postens service-kassatjänst T-22588

POST & TELESTYRELSEN Postens service-kassatjänst T-22588 POST & TELESTYRELSEN Postens service-kassatjänst T-22588 FEBRUARI 2002 T-22588 1 (7) BAKGRUND/SYFTE Post- och Telestyrelsen genomför inom ramen för sin tillsynsverksamhet undersökningar om inverkan på

Läs mer

Höjd arbetsgivaravgift för unga. Konsekvenser för detaljhandeln

Höjd arbetsgivaravgift för unga. Konsekvenser för detaljhandeln Höjd arbetsgivaravgift för unga Konsekvenser för detaljhandeln Om undersökningen 1 Den kvantitativa undersökningen har genomförts i form av digitala enkäter, distribuerade via e-post. Mottagare var butikschefer

Läs mer

Anne Denhov & Guy Karlsson. Tvång i öppenvård Patienter, permissioner och en ny lagstiftning

Anne Denhov & Guy Karlsson. Tvång i öppenvård Patienter, permissioner och en ny lagstiftning Anne Denhov & Guy Karlsson Tvång i öppenvård Patienter, permissioner och en ny lagstiftning FoU-enheten Psykiatri Södra Stockholm 2008 2008 FoU-enheten Psykiatri Södra Stockholm Stockholms Läns Sjukvårdsområde

Läs mer

Vid ett flertal tillfällen ställde individer frågor till Edgar Cayce om

Vid ett flertal tillfällen ställde individer frågor till Edgar Cayce om 8 Är intuition och medial förmåga samma sak? Av Kevin J. Todeschi Vid ett flertal tillfällen ställde individer frågor till Edgar Cayce om hur man kan utveckla sin egen mediala förmåga. Frågorna formulerades

Läs mer

Företagsamhetsmätning Kronobergs län JOHAN KREICBERGS HÖSTEN 2010

Företagsamhetsmätning Kronobergs län JOHAN KREICBERGS HÖSTEN 2010 Företagsamhetsmätning Kronobergs län JOHAN KREICBERGS HÖSTEN 2010 Företagsamheten Kronobergs län Inledning Svenskt Näringslivs företagsamhetsmätning presenteras varje halvår. Syftet är att studera om antalet

Läs mer

Praktisk programmering

Praktisk programmering KUNGLIGA TEKNISKA HÖGSKOLAN Praktisk programmering Daniel Workinn [2012-09-07] workinn@kth.se Introduktionskurs i datateknik, II1310 Sammanfattning Rapporten sammanfattas enklast med ett par substantiv.

Läs mer

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.

Läs mer

Säkert att förvara kärnavfall i berggrunden

Säkert att förvara kärnavfall i berggrunden Sifo Research & Consulting Sid Säkert att förvara kärnavfall i berggrunden Det är ungefär lika många som tror att det är säkert att förvara avfall i berggrunden som tror att det inte är säkert. Skillnaderna

Läs mer

Klassen kom tillsammans fram till vilka punkter som vi skulle ta hänsyn till. Dessa var:

Klassen kom tillsammans fram till vilka punkter som vi skulle ta hänsyn till. Dessa var: Y-bike Alla visioner börjar med en god idé och det är faktiskt precis vad det här projektet handlar om. Att starta något nytt, att väcka kreativa tankar och påbörja en process som kanske någon dag kommer

Läs mer

Tillståndsmaskiner. 1 Konvertering mellan Mealy och Moore. Ola Dahl och Mattias Krysander Linköpings tekniska högskola, ISY, Datorteknik 2014-05-08

Tillståndsmaskiner. 1 Konvertering mellan Mealy och Moore. Ola Dahl och Mattias Krysander Linköpings tekniska högskola, ISY, Datorteknik 2014-05-08 Tillståndsmaskiner Ola Dahl och Mattias Krysander Linköpings tekniska högskola, ISY, Datorteknik 2014-05-08 Figur 2: En tillståndsgraf av Moore-typ för att markera var tredje etta i en insignalsekvens.

Läs mer

Distribuerade Informationssystem VT-04

Distribuerade Informationssystem VT-04 Distribuerade Informationssystem VT-04 2 Projekt Kassasystem DS är ett stort varuhus som består av ett flertal fristående butiker. Varje butik i DS säljer sina egna varor samt varor som är specifika för

Läs mer

Två rapporter om bedömning och betyg

Två rapporter om bedömning och betyg UTBILDNINGSFÖRVALTNINGEN KVALITETSAVDELNINGEN TJÄNSTEUTLÅTANDE DNR 08-400/3803 SID 1 (9) 2008-09-15 Handläggare: Inger Willner Telefon: 508 33 678 Till Utbildningsnämnden 2008-10-23 Två rapporter om bedömning

Läs mer

När du som vårdpersonal vill ta del av information som finns hos en annan vårdgivare krävs det att:

När du som vårdpersonal vill ta del av information som finns hos en annan vårdgivare krävs det att: 1 (6) Sammanhållen journalföring information till dig som möter patienter Detta är ett kunskapsunderlag om sammanhållen journalföring för dig som arbetar i vården. Underlaget innehåller en kort beskrivning

Läs mer

SANNOLIKHET. Sannolikhet är: Hur stor chans (eller risk) att något inträffar.

SANNOLIKHET. Sannolikhet är: Hur stor chans (eller risk) att något inträffar. SANNOLIKHET Sannolikhet är: Hur stor chans (eller risk) att något inträffar. tomas.persson@edu.uu.se SANNOLIKHET Grundpremisser: Ju fler möjliga händelser, desto mindre sannolikhet att en viss händelse

Läs mer

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial? MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.

Läs mer

Rapport 2013. Undersökning -chefer för ambulansstationer. Hjärt- och Lungsjukas Riksförbund 2013-02-06

Rapport 2013. Undersökning -chefer för ambulansstationer. Hjärt- och Lungsjukas Riksförbund 2013-02-06 Rapport 213 Undersökning -chefer för ambulansstationer Hjärt- och Lungsjukas Riksförbund 213-2-6 Bakgrund och syfte Hjärt- och Lungsjukas riksförbund vill göra allmänheten uppmärksam på hur ambulansvården

Läs mer

Statistik 2015 - Äldre hjälpsökande hos Brottsofferjouren

Statistik 2015 - Äldre hjälpsökande hos Brottsofferjouren Statistik 2015 - Äldre hjälpsökande hos Brottsofferjouren En rapport från Brottsofferjouren Sverige Sofia Barlind statistik@boj.se Innehåll Brottsofferjourens statistikföring... 2 Ärendemängd... 2 Äldre

Läs mer

Rapport Agilityverksamhetens framtid

Rapport Agilityverksamhetens framtid Rapport Agilityverksamhetens framtid Sammanfattning Enkäten om agilityverksamhetens framtid genomfördes mellan den 25 januari 2013 och 20 februari 2013 på initiativ av AG agilityns framtid. Populationen

Läs mer

Idag. Hur vet vi att vår databas är tillräckligt bra?

Idag. Hur vet vi att vår databas är tillräckligt bra? Idag Hur vet vi att vår databas är tillräckligt bra? Vad är ett beroende? Vad gör man om det blivit fel? Vad är en normalform? Hur når man de olika normalformerna? DD1370 (Föreläsning 6) Databasteknik

Läs mer

UNGA LÄSARE. Enkätrapportering

UNGA LÄSARE. Enkätrapportering UNGA LÄSARE Enkätrapportering Rapport nummer 8 April 26, 2016 Enkätrapportering - Unga Läsare Under senhösten 2015 genomfördes en enkätstudie med unga vuxna som studerar på Högskolan i Halmstad. Enkäten

Läs mer

729G04 - Hemuppgift, Diskret matematik

729G04 - Hemuppgift, Diskret matematik 79G04 - Hemuppgift, Diskret matematik 5 oktober 015 Dessa uppgifter är en del av examinationen i kursen 79G04 Programmering och diskret matematik. Uppgifterna ska utföras individuellt och självständigt.

Läs mer

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet 732G71 Statistik B Föreläsning 2 Bertil Wegmann IDA, Linköpings universitet November 13, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 13, 2015 1 / 26 Kap. 4.1-4.5, multipel linjär regressionsanalys

Läs mer

ÖVNINGSKÖRNINGSOLYCKOR

ÖVNINGSKÖRNINGSOLYCKOR Svenska trafik- och transport akademien Rapport Nybro 2012-03-30 Willy Jensen ÖVNINGSKÖRNINGSOLYCKOR - Vilken tidpunkt är farligast - Handledare: Lars Lindén SAMMANFATTNING Övningskörning har varit tillåtet

Läs mer

Nedskräpning på trottoarer i centrala staden

Nedskräpning på trottoarer i centrala staden Enheten för miljö- och turismstatistik Datum Beteckning 2009-09-30 8566283 Ert datum Er beteckning 1(5) Nedskräpning på trottoarer i centrala staden Stockholm 2009 Metod- och kvalitetsrapport 2(5) Metoddokumentation

Läs mer

2005-01-31. Hävarmen. Peter Kock

2005-01-31. Hävarmen. Peter Kock 2005-01-31 Hävarmen Kurs: WT0010 Peter Kock Handledare: Jan Sandberg Sammanfattning Om man slår upp ordet hävarm i ett lexikon så kan man läsa att hävarm är avståndet mellan kraften och vridningspunkten.

Läs mer