環(huán)境感知的自適應深度強化學習路由算法
計算機工程與設計
頁數(shù): 8 2023-11-16
摘要: 針對現(xiàn)有強化學習路由算法未能根據網絡負載變化較好權衡動作探索和利用的問題,提出一種基于環(huán)境感知的自適應深度強化學習路由算法。依據智能體經驗回放時的平均誤差,動態(tài)調整ε-greedy策略以平衡探索和利用,引入啟發(fā)式規(guī)則限制動作探索以積累正向經驗,結合優(yōu)先經驗回放機制加速模型收斂,提升智能體收斂前后的網絡吞吐量和數(shù)據交付率。仿真結果表明,部署了該算法的網絡的吞吐量和數(shù)據交付率均高于... (共8頁)