融合三支多屬性決策與SAC的兵棋推演智能決策技術
系統(tǒng)工程與電子技術
頁數(shù): 13 2024-02-05
摘要: 近年來,將深度強化學習技術用于兵棋推演的智能對抗策略生成受到廣泛關注。針對強化學習決策模型采樣率低、訓練收斂慢以及智能體博弈勝率低的問題,提出一種融合三支多屬性決策(three-way multiple attribute decision making, TWMADM)與強化學習的智能決策技術。基于經(jīng)典軟表演者-批評家(soft actor-critic, SAC)算法開發(fā)兵...