基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)安全避障與圍捕制導(dǎo)
戰(zhàn)術(shù)導(dǎo)彈技術(shù)
頁(yè)數(shù): 13 2024-04-15
摘要: 針對(duì)無(wú)人機(jī)在受約束環(huán)境下面臨繞飛障礙物與跟蹤目標(biāo)相互掣肘的問(wèn)題,提出了一種基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)安全避障與圍捕制導(dǎo)方法。根據(jù)極坐標(biāo)原理設(shè)計(jì)環(huán)繞跟蹤控制器,驅(qū)使無(wú)人機(jī)在GPS拒止的情況下到達(dá)預(yù)設(shè)的圓形軌道。將環(huán)繞約束和障礙物約束轉(zhuǎn)化為馬爾可夫過(guò)程,以速度、徑向誤差、角速度誤差和碰撞函數(shù)為狀態(tài)空間,以控制器的補(bǔ)償量為動(dòng)作空間,設(shè)計(jì)考慮跟蹤誤差和碰撞概率的獎(jiǎng)勵(lì)函數(shù),利用深度確定性策略梯...