融合三支多屬性決策與SAC的兵棋推演智能決策技術(shù)
系統(tǒng)工程與電子技術(shù)
頁(yè)數(shù): 13 2024-02-05
摘要: 近年來(lái),將深度強(qiáng)化學(xué)習(xí)技術(shù)用于兵棋推演的智能對(duì)抗策略生成受到廣泛關(guān)注。針對(duì)強(qiáng)化學(xué)習(xí)決策模型采樣率低、訓(xùn)練收斂慢以及智能體博弈勝率低的問(wèn)題,提出一種融合三支多屬性決策(three-way multiple attribute decision making, TWMADM)與強(qiáng)化學(xué)習(xí)的智能決策技術(shù)?;诮?jīng)典軟表演者-批評(píng)家(soft actor-critic, SAC)算法開(kāi)發(fā)兵...