多智能體協(xié)同決策仿真平臺(tái)研究與開發(fā)
系統(tǒng)仿真學(xué)報(bào)
頁數(shù): 11 2023-11-22
摘要: 強(qiáng)化學(xué)習(xí)仿真平臺(tái)為強(qiáng)化學(xué)習(xí)提供交互和訓(xùn)練的環(huán)境。為了使仿真平臺(tái)兼容多智能體強(qiáng)化學(xué)習(xí)算法,滿足軍事領(lǐng)域仿真的需求,提煉多智能體強(qiáng)化學(xué)習(xí)算法中的相似流程,設(shè)計(jì)統(tǒng)一接口,將多種不同類型深度強(qiáng)化學(xué)習(xí)算法在仿真平臺(tái)進(jìn)行嵌入驗(yàn)證;優(yōu)化仿真平臺(tái)后端服務(wù)框架以加速算法模型的訓(xùn)練過程。實(shí)驗(yàn)結(jié)果表明:在仿真平臺(tái)中統(tǒng)一接口規(guī)范,能夠兼容多種不同類型的多智能體強(qiáng)化學(xué)習(xí)算法,顯著提升了后端服務(wù)框架重構(gòu)和...