Skip to main content

View full-text article in PMC

. 2021 Jun 12;21(12):4054. doi: 10.3390/s21124054

Table 1.

The parameter settings of HyAdamC and the compared first-order optimization methods.

Algorithms	Parameter Settings
HyAdamC	$α = 10^{- 3}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$ , $ε = 10^{- 8}$
SGD	$α = 10^{- 3}$
RMSProp	Learning rate = $10^{- 2}$ , $α = 0.99$ , $ε = 10^{- 8}$
Adam	$α = 10^{- 3}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$
AdamW	$α = 10^{- 3}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$
Adagrad	$α = 10^{- 2}$ , $β_{1} = 0.9$ , $ε = 10^{- 10}$
AdaDelta	$α = 1.0$ , $ρ = 0.9$ , $ε = 10^{- 6}$
Rprop	$α = 10^{- 2}$ , $η_{-} = 0.5$ , $η_{+} = 1.2$ , step sizes $= [10^{- 6}, 50]$
Yogi	$α = 10^{- 2}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$ , $ε = 10^{- 3}$
Fromage	$α = 10^{- 2}$
TAdam	$α = 10^{- 3}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$ , $v = d$ , $k_{v} = 1.0$
diffGrad	$α = 10^{- 3}$ , $β_{1} = 0.9$ , $β_{2} = 0.99$