A Multi-Agent Framework for Packet Routing in Wireless Sensor Networks

. 2015 Apr 28;15(5):10026–10047. doi: 10.3390/s150510026


Algorithm 1. Learning progress of sensor v_i

1	Initialise Q value for each available action arbitrarily;
2	for k = 0 to a predefined integer do;
3	calculate π;
4	for each available action a ∈ A_i do;
5	Q_k₊₁(a) = Q_k(a) + π (a)α₁(∑_a (a)π(a) − Q_k(a));
6	end for
7	end for
8	a_opti ← argMax(Q);
9	v_i takes the action a_opti;