依托多風(fēng)格強(qiáng)化學(xué)習(xí)的車(chē)輛軌跡跟蹤避撞控制
汽車(chē)工程
頁(yè)數(shù): 11 2024-06-24
摘要: 軌跡跟蹤避撞是車(chē)輛智能性的重要體現(xiàn),針對(duì)現(xiàn)有控制方法面對(duì)同一場(chǎng)景的控制風(fēng)格單一問(wèn)題,本文中提出了一種多風(fēng)格型強(qiáng)化學(xué)習(xí)控制方法。為實(shí)現(xiàn)控制風(fēng)格多樣性,首次將風(fēng)格指標(biāo)引入值網(wǎng)絡(luò)和策略網(wǎng)絡(luò),搭建了多風(fēng)格跟蹤避撞策略網(wǎng)絡(luò),并結(jié)合值分布強(qiáng)化學(xué)習(xí)理論構(gòu)建了多風(fēng)格策略迭代框架,依托該框架推導(dǎo)提出了多風(fēng)格值分布強(qiáng)化學(xué)習(xí)算法。仿真和實(shí)車(chē)試驗(yàn)表明:所提出方法可以多種駕駛風(fēng)格(激進(jìn)、中性、保守)完成...