基于強(qiáng)化學(xué)習(xí)的智能車輛路徑跟蹤變參數(shù)MPC多目標(biāo)控制
中國(guó)公路學(xué)報(bào)
頁(yè)數(shù): 13 2024-01-22
摘要: 為了解決智能車輛在工況變化時(shí)跟蹤精度下降和穩(wěn)定性變差的問(wèn)題,提出基于強(qiáng)化學(xué)習(xí)的變參數(shù)模型預(yù)測(cè)控制(MPC)算法多目標(biāo)控制策略,實(shí)現(xiàn)智能車輛路徑跟蹤控制系統(tǒng)的參數(shù)自適應(yīng)整定?;谲囕v動(dòng)力學(xué)模型設(shè)計(jì)其線性時(shí)變MPC控制器,獲得最優(yōu)前輪轉(zhuǎn)向角和附加橫擺力矩?;贏ctor-Critic強(qiáng)化學(xué)習(xí)架構(gòu),設(shè)計(jì)進(jìn)行控制參數(shù)整定的深度確定性策略梯度(DDPG)智能體和雙延遲深度確定性策略梯度(...