Skip to main content
. 2022 Jun 23;8(6):4603–4618. doi: 10.1007/s40747-022-00776-9

Table 2.

The structure of Q-table

State Action
a11 a12 a21 aD2
(0,0) Q(s00,a11) Q(s00,a12) Q(s00,a21) Q(s00,) Q(s00,aD1)
(1,0) Q(s10,a11) Q(s10,a12) Q(s10,a21) Q(s10,) Q(s10,aD1)
Q(,a11) Q(,a12) Q(,a21) Q(,) Q(,aD2)
(M,0) Q(sM0,a11) Q(sM0,a12) Q(sM0,a21) Q(sM0,) Q(sM0,aD2)
(M,1) Q(sM0,a11) Q(sM0,a12) Q(sM0,a21) Q(sM0,) Q(sM1,aD2)
Q(,a11) Q(,a12) Q(,a21) Q(,) Q(,aD2)
(M,N) Q(sMN,a11) Q(sMN,a12) Q(sMN,a21) Q(sMN,) Q(sMN,aD2)