依托多風格強化學習的車輛軌跡跟蹤避撞控制
汽車工程
頁數(shù): 11 2024-06-24
摘要: 軌跡跟蹤避撞是車輛智能性的重要體現(xiàn),針對現(xiàn)有控制方法面對同一場景的控制風格單一問題,本文中提出了一種多風格型強化學習控制方法。為實現(xiàn)控制風格多樣性,首次將風格指標引入值網(wǎng)絡和策略網(wǎng)絡,搭建了多風格跟蹤避撞策略網(wǎng)絡,并結(jié)合值分布強化學習理論構(gòu)建了多風格策略迭代框架,依托該框架推導提出了多風格值分布強化學習算法。仿真和實車試驗表明:所提出方法可以多種駕駛風格(激進、中性、保守)完成... (共11頁)