基于近似動態(tài)規(guī)劃的多級火箭全程任務(wù)決策
宇航學(xué)報
頁數(shù): 10 2024-08-30
摘要: 針對火箭發(fā)生推力下降故障下的任務(wù)決策問題,提出了一種基于近似動態(tài)規(guī)劃的多級火箭全程任務(wù)決策方法。首先,通過設(shè)置初始狀態(tài)集合、決策選項(xiàng)、獎勵函數(shù)、Q函數(shù)迭代方法等,建立了火箭任務(wù)決策分層強(qiáng)化學(xué)習(xí)模型,得到對火箭后續(xù)飛行進(jìn)行評價的“評價網(wǎng)絡(luò)”;然后利用基于凸優(yōu)化的在線能力評估和軌跡規(guī)劃方法,得到近似動態(tài)規(guī)劃原理中的“決策生成”模塊;最后,通過兩者結(jié)合完成對火箭故障下后續(xù)飛行中連續(xù)軌...