基于上下文感知的強(qiáng)化學(xué)習(xí)AUV控制器研究
艦船科學(xué)技術(shù)
頁數(shù): 7 2024-06-08
摘要: 為了提升基于強(qiáng)化學(xué)習(xí)的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在復(fù)雜海況中對環(huán)境干擾的魯棒性,設(shè)計(jì)一種利用上下文信息進(jìn)行環(huán)境感知的強(qiáng)化學(xué)習(xí)控制器。結(jié)合水下機(jī)器人運(yùn)動(dòng)學(xué)及動(dòng)力學(xué)方程對深度跟蹤任務(wù)進(jìn)行建模,構(gòu)建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文變量和域隨機(jī)化方法。在仿真環(huán)境中分別進(jìn)行海流干擾、暗涌干擾以及...