基于距離信息的追逃策略:信念狀態(tài)連續(xù)隨機(jī)博弈
自動化學(xué)報(bào)
頁數(shù): 13 2024-04-15
摘要: 追逃問題的研究在對抗、追蹤以及搜查等領(lǐng)域極具現(xiàn)實(shí)意義.借助連續(xù)隨機(jī)博弈與馬爾科夫決策過程(Markov decision process, MDP),研究使用測量距離求解多對一追逃問題的最優(yōu)策略.在此追逃問題中,追捕群體僅領(lǐng)導(dǎo)者可測量與逃逸者間的相對距離,而逃逸者具有全局視野.追逃策略求解被分為追博弈與馬爾科夫決策兩個過程.在求解追捕策略時,通過分割環(huán)境引入信念區(qū)域狀態(tài)以估計(jì)逃...