基于近似動(dòng)態(tài)規(guī)劃的多級(jí)火箭全程任務(wù)決策
宇航學(xué)報(bào)
頁(yè)數(shù): 10 2024-08-30
摘要: 針對(duì)火箭發(fā)生推力下降故障下的任務(wù)決策問(wèn)題,提出了一種基于近似動(dòng)態(tài)規(guī)劃的多級(jí)火箭全程任務(wù)決策方法。首先,通過(guò)設(shè)置初始狀態(tài)集合、決策選項(xiàng)、獎(jiǎng)勵(lì)函數(shù)、Q函數(shù)迭代方法等,建立了火箭任務(wù)決策分層強(qiáng)化學(xué)習(xí)模型,得到對(duì)火箭后續(xù)飛行進(jìn)行評(píng)價(jià)的“評(píng)價(jià)網(wǎng)絡(luò)”;然后利用基于凸優(yōu)化的在線(xiàn)能力評(píng)估和軌跡規(guī)劃方法,得到近似動(dòng)態(tài)規(guī)劃原理中的“決策生成”模塊;最后,通過(guò)兩者結(jié)合完成對(duì)火箭故障下后續(xù)飛行中連續(xù)軌...