Generative AI and Blockchain-Integrated Multi-Agent Framework for Resilient and Sustainable Fruit Cold-Chain Logistics

. 2025 Aug 27;14(17):3004. doi: 10.3390/foods14173004

Algorithm 1 Perishable-Aware Route Optimization via Q-Learning with Context-Aware Weights and Conflict Avoidance

1:
Input: Cold-chain graph $G (V, E)$ , perishability profile P, disruption model D, emission matrix C
2:
Initialize: Q-table $Q (s, a) \leftarrow 0$ ; learning rate $α$ ; discount factor $γ$ ; exploration rate $ϵ$
3:
Initialize: Static priority coefficients $α_{1}, α_{2}, α_{3}$

▹ For coordination

5:
for each episode do
6:
Initialize joint global state $S_{0} = {s_{0}^{(1)}, \dots, s_{0}^{(n)}}$ using D
7:
while shipment not delivered do
8:
for each routing agent i do
9:
With probability $ϵ$ , choose random action $a^{(i)}$
10:
Otherwise, choose $a^{(i)} \leftarrow arg {max}_{a^{'}} Q (s^{(i)}, a^{'})$

▹ Declare action intention

12:
end for
13:
Detect conflicts in $B$ (e.g., duplicate vehicle or route allocation)
14:
if conflict detected then
15:
Apply coordination penalty $ρ$ or reassign conflicting agent(s) via tie-breaking
16:
end if
17:
for each agent i do
18:
Execute $a^{(i)}$ , observe $s^{' (i)}$ , travel time $t^{(i)}$ , temp deviation $Δ T^{(i)}$ , emissions $e^{(i)}$
19:
Compute spoilage risk: $σ^{(i)} \leftarrow f (P, Δ T^{(i)})$
20:
Extract context vector: $c t x^{(i)} = [Δ T^{(i)}, traffic, SLA priority]$
21:
Compute dynamic weights:
$ω_{j}^{(i)} = \frac{α_{j} \cdot c t x_{j}^{(i)}}{\sum_{k = 1}^{3} α_{k} \cdot c t x_{k}^{(i)}}, j = 1, 2, 3$
22:
Compute context-aware reward:
$r^{(i)} = - (ω_{1}^{(i)} t^{(i)} + ω_{2}^{(i)} σ^{(i)} + ω_{3}^{(i)} e^{(i)}) - ρ$
23:
Update Q-table:
$Q (s^{(i)}, a^{(i)}) \leftarrow Q (s^{(i)}, a^{(i)}) + α [r^{(i)} + γ max_{a^{'}} Q (s^{' (i)}, a^{'}) - Q (s^{(i)}, a^{(i)})]$
24:
Update state: $s^{(i)} \leftarrow s^{' (i)}$
25:
end for
26:
Clear intention buffer: $B \leftarrow \emptyset$
27:
end while
28:
end for
29:
Output: Learned policies $π_{i}^{*} (s) = arg {max}_{a} Q (s, a)$ for all agents i