. Author manuscript; available in PMC: 2022 Jan 1.

Published in final edited form as: J Biomed Inform. 2020 Dec 5;113:103631. doi: 10.1016/j.jbi.2020.103631

Table A4:

Surrogate Classifier hyperparameters

Parameter	Query function selection in Table A3	Active learning evaluation in Figure 7
batch size	20	100
learning rate	0.001	0.005
maximum gradient L2 norm	1.0	1.0
maximum length	200	200
number of epochs	500	500
LSTM hidden size	100	100
dropout, input to LSTM	0.7	0.4
dropout, output of LSTM	0.0	0.4
dropout, self-attention	0.7	0.4