基于混合模仿學(xué)習(xí)的多智能體追捕決策方法
計算機(jī)科學(xué)
頁數(shù): 8 2024-10-12
摘要: 針對傳統(tǒng)模仿學(xué)習(xí)方法在處理多樣化專家軌跡時的局限性,尤其是難以有效整合質(zhì)量參差不齊的固定模態(tài)專家數(shù)據(jù)的問題,創(chuàng)新性地融合了多專家軌跡生成對抗模仿學(xué)習(xí)(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法與時序差分誤差行為克隆(Temporal-Difference Error Be... (共8頁)