作戰(zhàn)方案驅(qū)動的可學(xué)習(xí)兵棋推演智能體研究
系統(tǒng)仿真學(xué)報
頁數(shù): 11 2023-07-20
摘要: 為了使智能體能夠應(yīng)對兵棋推演中的復(fù)雜作戰(zhàn)場景和作戰(zhàn)目的,提出作戰(zhàn)方案驅(qū)動的可學(xué)習(xí)兵棋推演智能體架構(gòu)。剖析智能體對兵棋系統(tǒng)的“依附特性”和“松耦合特性”,得到智能體的可學(xué)習(xí)要求;在智能體框架設(shè)計中,使用作戰(zhàn)方案壓減智能體學(xué)習(xí)范圍。通過有限狀態(tài)機對應(yīng)作戰(zhàn)方案中的作戰(zhàn)階段知識,依據(jù)作戰(zhàn)方案框架確定智能體決策空間,設(shè)計可學(xué)習(xí)的深層神經(jīng)網(wǎng)絡(luò)實施關(guān)鍵決策空間探索,神經(jīng)網(wǎng)絡(luò)采用先驗知識模仿學(xué)...