基于碰撞預測的強化模仿學習機器人導航方法
計算機工程與應用
頁數: 12 2023-04-11
摘要: 基于學習的機器人導航方法存在對數據的依賴性高和在一些特定環(huán)境下表現(xiàn)不完美的問題,例如在空曠場景下無法走直線,在障礙物密集場景下碰撞率高。為了提高機器人的導航性能,提出了一種基于碰撞預測的強化模仿學習導航方法。在無模型的情況下,根據機器人的性能,建立馬爾科夫決策過程(Markov decision process,MDP)中所需要的狀態(tài)空間、動作空間、獎勵函數。采用深度強化學習(...