Skip to main content
. 2019 Jan 8;7:2050312118822912. doi: 10.1177/2050312118822912

Table 2.

The standard deviation of the bias calculated for small (n = 200) and large (n = 1000) samples, for four levels of missing (5%, 10%, 20% and 40%).

n = 200
n = 1000
Gender Medicationa Stimulants Drug usea Gender Medicationa Stimulants Drug usea
Full data Estimate (SE) 0.59 (0.06) 0.31 (0.04) 0.87 (0.05) 1.52 (0.06) 0.59 (0.06) 0.31 (0.04) 0.87 (0.05) 1.52 (0.06)
5% missing Hot deck 0.47 0.32 0.49 0.40 0.19 0.17 0.23 0.20
Random forest 0.47 0.33 0.49 0.45 0.19 0.17 0.23 0.22
Latent class 0.47 0.32 0.49 0.41 0.19 0.17 0.23 0.20
MI EMB 0.47 0.33 0.49 0.49 0.19 0.18 0.23 0.23
MICE LOG 0.48 0.34 0.49 0.57 0.19 0.18 0.23 0.27
MIMCA 0.47 0.34 0.49 0.55 0.19 0.18 0.23 0.25
Complete case 0.49 0.36 0.54 0.78 0.20 0.19 0.25 0.28
10% missing Hot deck 0.47 0.33 0.49 0.36 0.19 0.16 0.23 018
Random forest 0.47 0.33 0.49 0.41 0.19 0.16 0.23 0.22
Latent class 0.47 0.31 0.49 0.35 0.19 0.16 0.23 0.19
MI EMB 0.48 0.35 0.49 0.43 0.20 0.18 0.23 0.23
MICE LOG 0.48 0.36 0.49 0.53 0.20 0.18 0.23 0.31
MIMCA 0.48 0.37 0.49 0.48 0.20 0.18 0.23 0.27
Complete case 0.56 0.44 0.58 1.55 0.25 0.20 0.28 0.33
20% missing Hot deck 0.47 0.33 0.48 0.33 0.19 0.17 0.23 0.15
Random forest 0.47 0.34 0.49 0.41 0.19 0.18 0.23 0.20
Latent class 0.47 0.31 0.49 0.32 0.19 0.16 0.23 016
MI EMB 0.48 0.38 0.50 0.48 0.20 0.20 0.23 0.22
MICE LOG 0.48 041 0.50 0.65 0.20 0.21 0.23 0.33
MIMCA 0.48 0.42 0.50 0.72 0.20 0.22 0.23 0.28
Complete case 0.67 0.54 0.79 3.31 0.26 0.26 0.32 0.38
40% missing Hot deck 0.46 0.29 0.47 0.28 0.19 0.14 0.22 0.13
Random forest 0.47 0.31 0.48 0.37 0.19 0.15 0.23 0.18
Latent class 0.46 0.25 0.47 0.25 0.19 0.11 0.22 0.13
MI EMB 0.47 0.41 0.50 0.46 0.19 0.19 0.24 0.23
MICE LOG 0.48 0.44 0.51 1.67 0.19 0.21 0.25 0.43
MIMCA 0.48 0.51 0.52 0.79 0.19 0.23 0.25 0.33
Complete case 3.17 0.62 6.06 5.37 0.34 0.35 1.78 0.52

SE: standard error; MI EMB: multiple imputation using expectation–maximization with bootstrapping; MICE LOG: multivariate imputation by chained equations–based logistic regression; MIMCA: multiple imputation using multiple correspondence analysis.

a

Covariate with missing values.