基于深度強化學(xué)習(xí)的立體投送策略優(yōu)化方法研究
系統(tǒng)仿真學(xué)報
頁數(shù): 11 2022-10-21
摘要: 基于深度強化學(xué)習(xí)算法在策略優(yōu)化問題中的良好表現(xiàn),以立體投送作戰(zhàn)行動為主要研究對象,提出了一種深度強化學(xué)習(xí)框架與仿真推演實驗協(xié)同的作戰(zhàn)行動策略優(yōu)化方法。在分析策略優(yōu)化研究現(xiàn)狀的基礎(chǔ)上,根據(jù)研究問題對深度學(xué)習(xí)框架進行了分析比較,構(gòu)建了基于A3C算法的深度強化學(xué)習(xí)立體投送策略模型,并通過仿真推演和分布式計算,實現(xiàn)深度強化學(xué)習(xí)模型與“人不在回路”仿真推演的交互學(xué)習(xí),獲得優(yōu)化后的立體投送...