當(dāng)前位置:首頁 > 科技文檔 > 自動化技術(shù) > 正文

基于混合模仿學(xué)習(xí)的多智能體追捕決策方法

計算機(jī)科學(xué) 頁數(shù): 8 2024-10-12
摘要: 針對傳統(tǒng)模仿學(xué)習(xí)方法在處理多樣化專家軌跡時的局限性,尤其是難以有效整合質(zhì)量參差不齊的固定模態(tài)專家數(shù)據(jù)的問題,創(chuàng)新性地融合了多專家軌跡生成對抗模仿學(xué)習(xí)(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法與時序差分誤差行為克隆(Temporal-Difference Error Be... (共8頁)

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔