基于深度強(qiáng)化學(xué)習(xí)的鐵路縱斷面智能設(shè)計(jì)模型研究
鐵道學(xué)報(bào)
頁(yè)數(shù): 9 2024-09-15
摘要: 傳統(tǒng)智能算法通常要求變量維度在計(jì)算過(guò)程中不變,而鐵路縱斷面智能設(shè)計(jì)中的變坡點(diǎn)數(shù)量需要根據(jù)地形等變化自適應(yīng)確定。考慮到強(qiáng)化學(xué)習(xí)能從地面高程和已經(jīng)生成的線形等環(huán)境數(shù)據(jù)中獲得最優(yōu)策略的特點(diǎn),將深度強(qiáng)化學(xué)習(xí)方法應(yīng)用于縱斷面智能設(shè)計(jì),研究智能體決策變坡點(diǎn)的方法,提出鐵路縱斷面設(shè)計(jì)的變坡點(diǎn)決策模型,確定模型中的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)等表達(dá)形式。結(jié)合縱斷面設(shè)計(jì)約束多的特點(diǎn),引入動(dòng)作屏蔽機(jī)制處理約束...