基于強(qiáng)化學(xué)習(xí)的最優(yōu)控制指令模仿生成方法
系統(tǒng)仿真學(xué)報(bào)
頁(yè)數(shù): 9 2022-08-16
摘要: 以高速機(jī)動(dòng)目標(biāo)攔截為問(wèn)題背景,基于深度強(qiáng)化學(xué)習(xí)提出了一種不依賴目標(biāo)加速度估計(jì)的逆軌攔截最優(yōu)控制指令生成方法,并通過(guò)仿真實(shí)驗(yàn)進(jìn)行了有效性驗(yàn)證。從仿真實(shí)驗(yàn)結(jié)果看,提出的方法實(shí)現(xiàn)了三維空間高速機(jī)動(dòng)目標(biāo)逆軌攔截并大幅削減了對(duì)帶有強(qiáng)不確定性目標(biāo)估計(jì)的要求,相比最優(yōu)控制方法具有更強(qiáng)的適用性。