基于分層的智能建模方法的多機(jī)空戰(zhàn)行為建模
系統(tǒng)仿真學(xué)報(bào)
頁數(shù): 13 2023-10-18
摘要: 針對(duì)多機(jī)空戰(zhàn)對(duì)抗場(chǎng)景中高維狀態(tài)-行為空間約束下兵力博弈決策困難的問題,采用基于深度強(qiáng)化學(xué)習(xí)的兵力智能體決策生成策略,提出面向兵力智能博弈的態(tài)勢(shì)認(rèn)知和獎(jiǎng)勵(lì)回報(bào)生成算法,構(gòu)建基于混合的智能建模方法的行為建模分層框架。解決了強(qiáng)化學(xué)習(xí)過程中存在的稀疏獎(jiǎng)勵(lì)技術(shù)難點(diǎn),為解決大規(guī)模、多機(jī)型、要素多的空戰(zhàn)問題提供一種可行的強(qiáng)化學(xué)習(xí)訓(xùn)練方法。