基于近端策略優(yōu)化的智能抗干擾決策算法
通信學報
頁數(shù): 9 2024-08-20
摘要: 針對現(xiàn)有基于深度強化學習的智能抗干擾方法應用于天地測控通信鏈路時,用于決策的深度神經(jīng)網(wǎng)絡結構復雜,衛(wèi)星等飛行器資源受限,難以在有限的復雜度約束下獨立完成復雜神經(jīng)網(wǎng)絡的及時訓練,抗干擾決策無法收斂的問題,提出了一種基于近端策略優(yōu)化的智能抗干擾決策算法。分別在飛行器和地面站部署決策神經(jīng)網(wǎng)絡和訓練神經(jīng)網(wǎng)絡,地面站根據(jù)飛行器反饋的經(jīng)驗信息進行最優(yōu)化離線訓練,輔助決策神經(jīng)網(wǎng)絡進行參數(shù)更新... (共9頁)