窗口長度自適應(yīng)調(diào)整的策略迭代最優(yōu)控制
控制理論與應(yīng)用
頁數(shù): 6 2023-10-07
摘要: 在系統(tǒng)模型參數(shù)未知的最優(yōu)控制問題中,策略迭代能否快速收斂到最優(yōu)控制策略的關(guān)鍵在于值函數(shù)的估計(jì).為了提升值函數(shù)的估計(jì)精度以及收斂速度,本文提出一種窗口長度自適應(yīng)調(diào)整的策略迭代最優(yōu)控制算法.充分利用一段時(shí)間內(nèi)的歷史樣本數(shù)據(jù),通過影響力函數(shù)構(gòu)建窗口長度與值函數(shù)估計(jì)性能之間的定量關(guān)系,根據(jù)數(shù)據(jù)窗口長度對(duì)估計(jì)性能影響力的不同,實(shí)現(xiàn)窗口長度的自適應(yīng)調(diào)整.最后,將本文所提方法應(yīng)用到連續(xù)發(fā)酵過...