ELAA: An Ensemble-Learning-Based Adversarial Attack Targeting Image-Classification Model

. 2023 Jan 22;25(2):215. doi: 10.3390/e25020215

Algorithm 1: Actor-Critic in the proposed model

Input: Iteration T, time step $α$ , discount factor $γ$ , hypermeter for policy network $θ$

Process:

Initialize observations of states $φ (s_{1}), φ (s_{2}), . . ., φ (s_{n})$

for $i = 1, 2, . . ., T$ :

$R_{i}$ , $φ^{'} (s_{i + 1})$ , $A_{i + 1}$ = Actor( $φ (s_{i})$ , $A_{i}$ )

$V (s_{i})$ , $V^{'} (s_{i})$ = Critic( $φ (s_{i})$ , $φ^{'} (s_{i})$ )

Update TD Error by

$δ \leftarrow R_{i} + V^{'} (s_{i}) - V (s_{i})$

Update Critic by

$ω \leftarrow ω + β δ V (s_{i})$

Update Actor by

$θ \leftarrow θ + α ▿_{θ} log π_{θ} (S_{t}, A_{i}) δ$

Update State by

$φ (s_{i}) = φ^{'} (s_{i + 1})$

end for

Output: $ω, θ$